[go: up one dir, main page]

JP7639730B2 - How to search - Google Patents

How to search Download PDF

Info

Publication number
JP7639730B2
JP7639730B2 JP2022021746A JP2022021746A JP7639730B2 JP 7639730 B2 JP7639730 B2 JP 7639730B2 JP 2022021746 A JP2022021746 A JP 2022021746A JP 2022021746 A JP2022021746 A JP 2022021746A JP 7639730 B2 JP7639730 B2 JP 7639730B2
Authority
JP
Japan
Prior art keywords
search
sentence
word
information
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022021746A
Other languages
Japanese (ja)
Other versions
JP2023119099A (en
Inventor
晴文 武藤
洋輔 上野
寛泰 山下
和也 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2022021746A priority Critical patent/JP7639730B2/en
Publication of JP2023119099A publication Critical patent/JP2023119099A/en
Application granted granted Critical
Publication of JP7639730B2 publication Critical patent/JP7639730B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、検索方法に関する。 This disclosure relates to a search method.

特許文献1には、各種資料の検索を行うためのワード処理装置が提案されている。具体的に、特許文献1で提案されるワード処理装置は、検索対象文書指定手段、単語抽出手段、未処理語選択手段、ワード作成手段、及び検索手段を備える。検索対象文書指定手段は、検索対象となる文書を指定する。単語抽出手段は、検索対象として指定された文書から所定の手法でそれぞれの単語を抽出する。未処理語選択手段は、単語抽出手段により抽出できなかった語としての未処理語の中から予め定めた語長以上の単語を選択する。ワード作成手段は、選択された未処理語を基にして、これを先頭から1文字ずつ削除した長さの複数のワードを作成する。検索手段は、作成されたワードを前方一致検索のワードとして使用する。 Patent Document 1 proposes a word processing device for searching various materials. Specifically, the word processing device proposed in Patent Document 1 includes a search target document designation means, a word extraction means, an unprocessed word selection means, a word creation means, and a search means. The search target document designation means designates a document to be searched. The word extraction means extracts each word from the document designated as the search target using a predetermined method. The unprocessed word selection means selects a word of a predetermined length or more from among unprocessed words that could not be extracted by the word extraction means. The word creation means creates multiple words based on the selected unprocessed words, each with one character deleted from the beginning. The search means uses the created words as words for a forward match search.

特開2002-351918号公報JP 2002-351918 A

本開示の目的は、文章の検索性を高める技術を提供することである。 The purpose of this disclosure is to provide technology that improves the searchability of text.

本開示の一態様に係る検索方法は、コンピュータにより実行される検索方法であって、検索語を取得すること、階層化された複数の文章であって、検索対象文章を含む複数の文章における階層関係を示す構造情報を取得すること、取得された前記構造情報を参照することで、前記複数の文章の中から、前記検索対象文章の上位階層に位置する上位階層文章を特定すること、特定された前記上位階層文章に付与されたタグ情報を取得すること、前記検索対象文章及び前記上位階層文章のタグ情報において、取得された前記検索語と一致する語が存在するか否かを検索すること、及び検索の結果に関する情報を出力すること、を含む。 A search method according to one aspect of the present disclosure is a search method executed by a computer, and includes acquiring a search term, acquiring structural information indicating a hierarchical relationship among a plurality of hierarchical sentences including a search target sentence, identifying a higher-level sentence that is located in a higher level than the search target sentence from among the plurality of sentences by referring to the acquired structural information, acquiring tag information assigned to the identified higher-level sentence, searching for a word that matches the acquired search term in the tag information of the search target sentence and the higher-level sentence, and outputting information related to the search result.

本開示によれば、文章の検索性を高めることができる。 This disclosure can improve the searchability of text.

図1は、本開示が適用される場面の一例を模式的に示す。FIG. 1 illustrates an example of a situation to which the present disclosure is applied. 図2は、実施の形態に係る情報処理装置のハードウェア構成の一例を模式的に示す。FIG. 2 is a schematic diagram illustrating an example of a hardware configuration of an information processing device according to an embodiment. 図3は、実施の形態に係る情報処理装置のソフトウェア構成の一例を模式的に示す。FIG. 3 is a diagram illustrating an example of a software configuration of the information processing device according to the embodiment. 図4は、実施の形態に係る情報処理装置による文章検索に関する処理手順の一例を示すフローチャートである。FIG. 4 is a flowchart illustrating an example of a processing procedure related to a text search performed by the information processing device according to the embodiment. 図5は、実施の形態に係るメタ情報データベースの一例を模式的に示す。FIG. 5 is a schematic diagram showing an example of a meta-information database according to an embodiment. 図6は、実施の形態に係る構成情報及び階層化された文章の一例を模式的に示す。FIG. 6 is a schematic diagram showing an example of configuration information and hierarchical text according to an embodiment. 図7は、図6で示される各文章に対して上位階層文章のタグ情報を取得する処理を実行した後の照合範囲の一例を模式的に示す。FIG. 7 shows an example of a comparison range after a process of acquiring tag information of a higher-level sentence for each sentence shown in FIG. 6 is executed.

従来の検索方法では、検索対象となる文章(検索対象文章)内において、指定された検索語と一致する語が存在するか否かに応じて、検索対象文章を検索結果として抽出するか否かが決定される。すなわち、検索対象文章内に検索語と一致する語が含まれていなければ、検索対象文章は検索結果として抽出されない。そのため、所望の文章を抽出するためには、所望の文章に含まれている語を予想して検索語を指定することになる。したがって、従来の方法では、文章の検索性が高くない(すなわち、所望の文章を的確に抽出するのが難しい)という問題点があった。 In conventional search methods, whether or not to extract the search target sentence as a search result is determined depending on whether or not a word matching a specified search term is present in the sentence to be searched (search target sentence). In other words, if the search target sentence does not contain a word matching a search term, the search target sentence will not be extracted as a search result. Therefore, in order to extract a desired sentence, search terms are specified by predicting the words contained in the desired sentence. Therefore, conventional methods have the problem that the retrievability of sentences is not high (i.e., it is difficult to accurately extract a desired sentence).

これに対して、本開示の第1の態様に係る検索方法は、コンピュータにより実行される検索方法であって、検索語を取得すること、階層化された複数の文章であって、検索対象文章を含む複数の文章における階層関係を示す構造情報を取得すること、取得された前記構造情報を参照することで、前記複数の文章の中から、前記検索対象文章の上位階層に位置する上位階層文章を特定すること、特定された前記上位階層文章に付与されたタグ情報を取得すること、前記検索対象文章及び前記上位階層文章のタグ情報において、取得された前記検索語と一致する語が存在するか否かを検索すること、及び検索の結果に関する情報を出力すること、を含む。 In contrast, the search method according to the first aspect of the present disclosure is a search method executed by a computer, and includes obtaining a search term, obtaining structural information indicating a hierarchical relationship among a plurality of hierarchical sentences including the search target sentence, identifying a higher-level sentence that is located in a higher level than the search target sentence from among the plurality of sentences by referring to the obtained structural information, obtaining tag information assigned to the identified higher-level sentence, searching for a word that matches the obtained search term in the tag information of the search target sentence and the higher-level sentence, and outputting information related to the search result.

本開示の第1の態様では、検索対象文章及び上位階層文章のタグ情報において、検索語と一致する語が存在するか否かに応じて、検索対象文章を検索結果として抽出するか否かが判定される。すなわち、検索語と一致する語が存在するか否かを検索する範囲(検索語の照合範囲)が、検索対象文章のみではなく、検索対象文章の上位階層に位置する上位階層文章に付与されたタグ情報にまで拡張される。これにより、検索対象文章に検索語と一致する語が含まれていなくても、上位階層文章のタグ情報に検索語と一致する語が含まれていれば、検索対象文章を検索結果として抽出することができる。したがって、本開示の第1の態様によれば、対象の文章が検索条件に該当する可能性を高めることができる(つまり、再現性を高めることができる)。その結果、文章の検索性を高めることができる。 In the first aspect of the present disclosure, whether or not to extract the search target sentence as a search result is determined depending on whether or not there is a word matching the search term in the tag information of the search target sentence and the upper hierarchical sentence. In other words, the range for searching whether or not there is a word matching the search term (search term matching range) is expanded not only to the search target sentence but also to the tag information attached to the upper hierarchical sentence located in the upper hierarchical level of the search target sentence. As a result, even if the search target sentence does not contain a word matching the search term, if the tag information of the upper hierarchical sentence contains a word matching the search term, the search target sentence can be extracted as a search result. Therefore, according to the first aspect of the present disclosure, it is possible to increase the possibility that the target sentence meets the search criteria (i.e., it is possible to increase reproducibility). As a result, it is possible to increase the searchability of the sentence.

なお、本開示の第2の態様に係る検索方法は、上記第1の態様に係る検索方法であって、前記コンピュータが、前記検索対象文章に付与されたタグ情報を取得すること、を更に含んでよい。前記検索することは、前記検索対象文章、前記検索対象文章のタグ情報及び前記上位階層文章のタグ情報において、前記検索語と一致する語が存在するか否かを検索することにより構成されてよい。当該構成によれば、検索語の照合範囲を自身のタグ情報まで更に拡張することができる。そのため、文章の検索性を更に高めることができる。 The search method according to the second aspect of the present disclosure may be the search method according to the first aspect, further including the computer acquiring tag information assigned to the search target sentence. The searching may be performed by searching the search target sentence, the tag information of the search target sentence, and the tag information of the higher-level sentence to determine whether or not there is a word matching the search term. With this configuration, the matching range of the search term can be further expanded to the tag information of the sentence itself. This can further improve the searchability of the sentence.

本開示の第3の態様に係る検索方法は、上記第1又は第2の態様に係る検索方法であって、前記コンピュータが、前記検索語に関連する1つ以上の関連語を取得すること、を更に含んでよい。前記検索することは、取得された前記検索語又は取得された1つ以上の関連語の少なくともいずれかと一致する語が存在するか否かを検索することにより構成されてよい。当該構成では、検索対象文章及びタグ情報に含まれる語と照合する語が、検索語だけでなく、検索語に関連する関連語にまで拡張される。つまり、関連語を追加の検索語として使用するように検索条件を緩和することができる。その結果、検索語と一致する語が含まれていなくても、関連語と一致する語が含まれていれば、検索対象文章を検索結果として抽出することができる。したがって、当該構成によれば、検索語を網羅的に指定しなくても、所望の文章を抽出できる可能性を高めることができる。検索語を指定するのにかかる手間を省くと共に、文章の検索性を更に高めることができる。 The search method according to the third aspect of the present disclosure may further include the computer acquiring one or more related words related to the search term. The searching may be configured by searching for the presence or absence of a word that matches at least one of the acquired search term or the acquired one or more related words. In this configuration, the words to be matched with the words contained in the search target sentence and tag information are expanded to not only the search term but also related words related to the search term. In other words, the search conditions can be relaxed so that related words are used as additional search terms. As a result, even if the search target sentence does not contain a word that matches the search term, if it contains a word that matches the related word, it is possible to extract the search target sentence as a search result. Therefore, according to this configuration, it is possible to increase the possibility of extracting the desired sentence without comprehensively specifying search terms. This saves the effort required to specify search terms and further improves the searchability of sentences.

本開示の第4の態様に係る検索方法は、上記第3の態様に係る検索方法であって、前記
1つ以上の関連語は、前記検索語の同義語、類義語、上位概念語、及び下位概念語の少なくともいずれかを含んでよい。当該構成によれば、検索語に関連する関連語を適切に取得することができる。その結果、文章の検索精度(適合率)の向上を期待することができる。
A search method according to a fourth aspect of the present disclosure is the search method according to the third aspect, wherein the one or more related words may include at least one of a synonym, a similar word, a higher conceptual term, and a lower conceptual term of the search word. With this configuration, related words related to the search word can be appropriately acquired. As a result, an improvement in the search accuracy (match rate) of a sentence can be expected.

本開示の第5の態様に係る検索方法は、上記第3又は第4の態様に係る検索方法であって、前記1つ以上の関連語を取得することは、前記検索語のカテゴリを取得すること、及び取得された前記カテゴリに属する1つ以上の関連語を取得すること、により構成されてよい。当該構成によれば、関連語がカテゴリ分けされていることで、検索対象文章との関係で検索語と関連性の低い関連語が取得され難くすることができる。つまり、検索シーンにおいて、検索語と関連性の高い関連語を適切に取得することができる。その結果、文章の検索精度(適合率)の向上を期待することができる。 A search method according to a fifth aspect of the present disclosure is the search method according to the third or fourth aspect, and may be configured such that acquiring the one or more related words includes acquiring a category of the search term and acquiring one or more related words belonging to the acquired category. According to this configuration, since the related words are categorized, it is possible to make it difficult to acquire related words that are less relevant to the search term in relation to the text to be searched. In other words, in a search scene, it is possible to appropriately acquire related words that are highly relevant to the search term. As a result, it is possible to expect an improvement in the search accuracy (match rate) of texts.

以下、本開示の一側面に係る実施の形態(以下、「本実施形態」とも表記する)を、図面に基づいて説明する。ただし、以下で説明する本実施形態は、あらゆる点において本開示の例示に過ぎない。本開示の範囲を逸脱することなく種々の改良又は変形が行われてよい。本開示の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。 An embodiment according to one aspect of the present disclosure (hereinafter also referred to as "the present embodiment") will be described below with reference to the drawings. However, the present embodiment described below is merely an example of the present disclosure in all respects. Various improvements or modifications may be made without departing from the scope of the present disclosure. In implementing the present disclosure, a specific configuration according to the embodiment may be appropriately adopted. Note that while the data appearing in this embodiment is described in natural language, more specifically, it is specified in pseudo-language, commands, parameters, machine language, etc. that can be recognized by a computer.

[1 適用例]
図1は、本開示を適用した場面の一例を模式的に示す。本実施形態に係る情報処理装置1は、検索条件に該当する文章を抽出するための検索処理を実行するように構成された1台以上のコンピュータである。
[1 Application Examples]
1 is a schematic diagram illustrating an example of a situation in which the present disclosure is applied. An information processing device 1 according to the present embodiment is one or more computers configured to execute a search process for extracting sentences that meet search criteria.

本実施形態では、情報処理装置1は、検索語5を取得する。また、情報処理装置1は、階層化された複数の文章2であって、検索対象文章20を含む複数の文章2における階層関係を示す構造情報200を取得する。情報処理装置1は、取得された構造情報200を参照することで、複数の文章2の中から、検索対象文章20の上位階層に位置する上位階層文章25を特定する。情報処理装置1は、特定された上位階層文章25に付与されたタグ情報35を取得する。情報処理装置1は、検索対象文章20及び上位階層文章25のタグ情報35において、取得された検索語5と一致する語が存在するか否かを検索する。そして、情報処理装置1は、検索の結果に関する情報を出力する。 In this embodiment, the information processing device 1 acquires a search term 5. The information processing device 1 also acquires structural information 200 indicating a hierarchical relationship among a plurality of hierarchically organized sentences 2 including a search target sentence 20. The information processing device 1 identifies, from among the plurality of sentences 2, a higher-level sentence 25 that is located in a higher level than the search target sentence 20, by referring to the acquired structural information 200. The information processing device 1 acquires tag information 35 assigned to the identified higher-level sentence 25. The information processing device 1 searches for a word matching the acquired search term 5 in the tag information 35 of the search target sentence 20 and the higher-level sentence 25. The information processing device 1 then outputs information related to the search results.

以上のとおり、本実施形態では、検索語5の照合範囲が、検索対象文章20のみではなく、検索対象文章20の上位階層に位置する上位階層文章25に付与されたタグ情報35にまで拡張される。すなわち、本実施形態では、照合範囲が、検索対象文章20及びタグ情報35により構成される。これにより、検索対象文章20に検索語5と一致する語が含まれていなくても、上位階層文章25のタグ情報35に検索語5と一致する語が含まれていれば、検索対象文章20を検索結果として抽出することができる。そのため、本実施形態によれば、対象の文章が検索条件に該当する可能性を高めることができる。 As described above, in this embodiment, the matching range of the search term 5 is expanded not only to the search target sentence 20 but also to the tag information 35 attached to the upper level sentence 25 located in a higher level than the search target sentence 20. That is, in this embodiment, the matching range is composed of the search target sentence 20 and the tag information 35. As a result, even if the search target sentence 20 does not contain a word matching the search term 5, if the tag information 35 of the upper level sentence 25 contains a word matching the search term 5, the search target sentence 20 can be extracted as a search result. Therefore, according to this embodiment, it is possible to increase the possibility that the target sentence satisfies the search criteria.

加えて、文章に関連付けられるタグは、一般的に、その文章の属性、特徴等の情報を端的に示していることが多い。また、階層構造を有する文章では、階層の上位に位置する文章は、下位に位置する文章の要点、概要等を示していることが多い。そのため、上位階層文章25のタグ情報35には、階層構造において下位に位置する検索対象文章20と関連性が高く、かつ検索条件として使用されやすい語がタグとして含まれている可能性が高い。上位階層文章25そのものではなく、このタグ情報35を照合範囲に追加するようにすることで、照合範囲を拡張する量を抑えつつ、検索対象文章20が適切に抽出されやすく
することができる。したがって、本実施形態によれば、効率的に文章の検索性を高めることができる。
In addition, tags associated with a sentence generally often succinctly indicate information such as the attributes and characteristics of the sentence. Furthermore, in sentences having a hierarchical structure, sentences located at higher levels of the hierarchy often indicate the main points and summaries of sentences located at lower levels. Therefore, the tag information 35 of the higher-level sentence 25 is likely to include, as tags, words that are highly related to the search target sentence 20 located at lower levels in the hierarchical structure and that are likely to be used as search conditions. By adding this tag information 35 to the matching range instead of the higher-level sentence 25 itself, it is possible to make it easier to appropriately extract the search target sentence 20 while suppressing the amount of expansion of the matching range. Therefore, according to this embodiment, it is possible to efficiently improve the searchability of sentences.

(複数の文章)
なお、複数の文章2は、階層構造を有していれば、その種類は、特に限定されなくてよく、実施の形態に応じて適宜選択されてよい。複数の文章2は、例えば、法規文書、仕様書等であってよい。複数の文章2は、1つ以上の文書の少なくとも一部から取得されてよい。一例では、文章は、検索により抽出される単位に対応してよい。階層構造は、例えば、章立て、箇条書き(条、項、号等)等により与えられてよい。構造情報200は、複数の文章2における階層構造を示すように構成されていれば、そのデータ形式は、特に限定されなくてよく、実施の形態に応じて適宜選択されてよい。
(multiple sentences)
In addition, as long as the multiple documents 2 have a hierarchical structure, the type of the multiple documents 2 need not be particularly limited and may be appropriately selected depending on the embodiment. The multiple documents 2 may be, for example, legal documents, specifications, etc. The multiple documents 2 may be obtained from at least a portion of one or more documents. In one example, the documents may correspond to units extracted by search. The hierarchical structure may be given, for example, by chapters, bullet points (articles, paragraphs, numbers, etc.), etc. As long as the structure information 200 is configured to indicate the hierarchical structure in the multiple documents 2, the data format thereof need not be particularly limited and may be appropriately selected depending on the embodiment.

(検索対象文章)
検索対象文章20は、検索処理の対象となる文章である。検索対象文章20は、複数の文章2の中から任意に選択されてよい。一例では、検索対象文章20は、ユーザにより指定されてよい。検索の対象となる文書、範囲等が指定されることで、複数の検索対象文章20が取得されてもよい。複数の検索対象文章20が取得される場合、情報処理装置1は、検索対象文章20毎に、検索語5と一致する語が存在するか否かを検索する処理を実行してよい。他の一例では、複数の文章2内で、1つ以上の検索対象文章20が予め決定されていてもよい。全ての文章2それぞれが検索対象文章20として取り扱われてもよい。
(Text to search)
The search target sentence 20 is a sentence that is the subject of the search process. The search target sentence 20 may be arbitrarily selected from a plurality of sentences 2. In one example, the search target sentence 20 may be specified by a user. A plurality of search target sentences 20 may be acquired by specifying a document, a range, etc. to be searched. When a plurality of search target sentences 20 are acquired, the information processing device 1 may execute a process of searching for each of the search target sentences 20 to determine whether or not a word matching the search term 5 exists. In another example, one or more search target sentences 20 may be determined in advance within the plurality of sentences 2. Each of all sentences 2 may be treated as a search target sentence 20.

(照合範囲)
本実施形態では、情報処理装置1は、検索対象文章20自身に付与されたタグ情報30まで照合範囲を更に拡張してよい。すなわち、情報処理装置1は、検索対象文章20に付与されたタグ情報30を更に取得してよい。照合範囲は、検索対象文章20、検索対象文章20のタグ情報30、及び上位階層文章25のタグ情報35により構成されてよい。検索処理では、情報処理装置1は、検索対象文章20、検索対象文章20のタグ情報30、及び上位階層文章25のタグ情報35において、検索語5と一致する語が存在するか否かを検索してよい。これにより、文章の検索性を更に高めることができる。
(Matching range)
In this embodiment, the information processing device 1 may further expand the matching range to the tag information 30 assigned to the search target sentence 20 itself. That is, the information processing device 1 may further acquire the tag information 30 assigned to the search target sentence 20. The matching range may be composed of the search target sentence 20, the tag information 30 of the search target sentence 20, and the tag information 35 of the upper hierarchical sentence 25. In the search process, the information processing device 1 may search for a word matching the search term 5 in the search target sentence 20, the tag information 30 of the search target sentence 20, and the tag information 35 of the upper hierarchical sentence 25. This can further improve the searchability of the sentence.

上位階層文章25の数は任意であってよい。検索対象文章20の上位階層には、1つ以上の上位階層文章25が存在してよい。複数の上位階層文章25が存在する場合、一例では、情報処理装置1は、全ての上位階層文章25のタグ情報35を取得するように構成されてよい。他の一例では、情報処理装置1は、複数の上位階層文章25のうちの一部(例えば、階層の近いものから順に所定数)のタグ情報35を取得するように構成されてもよい。 The number of upper-level sentences 25 may be any number. One or more upper-level sentences 25 may exist in the upper level of the sentence 20 to be searched. When multiple upper-level sentences 25 exist, in one example, the information processing device 1 may be configured to acquire tag information 35 of all the upper-level sentences 25. In another example, the information processing device 1 may be configured to acquire tag information 35 of a portion of the multiple upper-level sentences 25 (e.g., a predetermined number in order from the closest hierarchical level).

(タグ情報)
タグ情報(30、35)は、付与される文章(検索対象文章20、上位階層文章25)に関連付けられる1つ以上のタグにより構成される。タグは、関連付けられる文章の属性、特徴等の情報を示す語である。関連付けられる文章に含まれる語(例えば、単語、文字列等)がタグとして使用されてよい。一例では、タグは、人手により生成されてよい。他の一例では、タグは、コンピュータの情報処理により生成されてよい。
(Tag information)
The tag information (30, 35) is composed of one or more tags associated with the sentence to which it is assigned (search target sentence 20, upper-level sentence 25). A tag is a word that indicates information such as attributes and characteristics of the associated sentence. A word (e.g., a word, a character string, etc.) contained in the associated sentence may be used as a tag. In one example, the tag may be generated manually. In another example, the tag may be generated by computer information processing.

(検索処理)
検索処理では、情報処理装置1は、照合範囲に検索語5と一致する語が存在するか否かに応じて、検索対象文章20を抽出するか否かを判定する。照合範囲に検索語5と一致する語が存在している場合、情報処理装置1は、検索対象文章20を検索結果(すなわち、検索条件に該当する文章)として抽出する。他方、照合範囲に検索語5と一致する語が存在していない場合、情報処理装置1は、検索対象文章20を抽出しない。
(Search process)
In the search process, the information processing device 1 determines whether or not to extract the search target sentence 20 depending on whether or not a word matching the search term 5 is present in the collation range. If a word matching the search term 5 is present in the collation range, the information processing device 1 extracts the search target sentence 20 as a search result (i.e., a sentence that meets the search conditions). On the other hand, if a word matching the search term 5 is not present in the collation range, the information processing device 1 does not extract the search target sentence 20.

(検索語)
典型的には、検索語5は、ユーザ入力により指定されてよい。ただし、検索語5を指定する方法は、このような例に限定されなくてよく、実施の形態に応じて適宜決定されてよい。他の一例では、任意の文章中において任意の語が選択されてよく、選択された語が検索語5として使用されてよい。すなわち、任意の文章中の語の選択により検索語5が指定されてよい。
(Search term)
Typically, the search term 5 may be specified by a user input. However, the method of specifying the search term 5 is not limited to this example, and may be determined appropriately depending on the embodiment. In another example, an arbitrary word may be selected in an arbitrary sentence, and the selected word may be used as the search term 5. In other words, the search term 5 may be specified by selecting a word in an arbitrary sentence.

検索語5の数は、任意であってよい。複数の検索語5が取得されてもよい。この場合、各検索語5は、論理和(OR)検索の条件として指定されてもよいし、或いは論理積(AND)検索の条件として指定されてもよい。複数の検索語5のうちの一部が論理和検索の条件として指定され、残りが論理積検索の条件として指定されてもよい。 The number of search terms 5 may be any number. Multiple search terms 5 may be obtained. In this case, each search term 5 may be specified as a condition for a logical sum (OR) search, or may be specified as a condition for a logical product (AND) search. Some of the multiple search terms 5 may be specified as conditions for a logical sum search, and the rest may be specified as conditions for a logical product search.

(検索条件の拡張)
本実施形態では、情報処理装置1は、検索語5に関連する関連語6を追加の検索語として使用するように構成されてよい。すなわち、情報処理装置1は、検索語5に関連する1つ以上の関連語6を更に取得してよい。検索処理では、情報処理装置1は、取得された検索語5又は1つ以上の関連語6の少なくともいずれかと一致する語が照合範囲に存在するか否かを検索してよい。
(Expanding search criteria)
In this embodiment, the information processing device 1 may be configured to use a related word 6 related to the search term 5 as an additional search term. That is, the information processing device 1 may further acquire one or more related words 6 related to the search term 5. In the search process, the information processing device 1 may search for whether or not a word matching at least one of the acquired search term 5 or one or more related words 6 exists in the matching range.

このように、関連語6を追加の検索語として使用することで、検索条件を拡張することができる。その結果、検索語5と一致する語が含まれていなくても、関連語6と一致する語が含まれていれば、検索対象文章20を検索結果として抽出することができる。したがって、検索語5を網羅的に指定しなくても、所望の文章を抽出しやすくすることができる。これにより、検索語5を指定するのにかかる手間を省くと共に、文章の検索性を更に高めることができる。 In this way, by using related words 6 as additional search terms, the search conditions can be expanded. As a result, even if the search target sentence 20 does not contain a word that matches search term 5, it can be extracted as a search result if it contains a word that matches related words 6. Therefore, it is possible to easily extract a desired sentence without comprehensively specifying search terms 5. This saves the effort of specifying search terms 5 and further improves the searchability of sentences.

なお、一例では、関連語6は、論理和検索の条件として使用されてよい。ただし、関連語6の使用形態は、このような例に限定されなくてよい。他の一例では、複数の関連語6が存在する場合、複数の関連語6の少なくとも一部が論理積検索の条件として使用されてもよい。複数の検索語5が指定されている場合、情報処理装置1は、複数の検索語5の少なくとも一部に対して1つ以上の関連語6を取得してよい。 In one example, the related words 6 may be used as a condition for a logical sum search. However, the manner in which the related words 6 are used need not be limited to this example. In another example, when multiple related words 6 exist, at least some of the multiple related words 6 may be used as a condition for a logical product search. When multiple search terms 5 are specified, the information processing device 1 may obtain one or more related words 6 for at least some of the multiple search terms 5.

本実施形態では、各語の関連語は、メタ情報データベース60に蓄積されていてよい。メタ情報データベース60は、指定された語(対象語)の関連語を取得可能に構成されていれば、その形式は、特に限定されなくてよく、実施の形態に応じて適宜決定されてよい。情報処理装置1は、検索語5をクエリとして使用して、メタ情報データベース60にアクセスすることで、検索語5に対する1つ以上の関連語6を取得してよい。 In this embodiment, the related words for each word may be stored in a meta-information database 60. As long as the meta-information database 60 is configured to be able to acquire related words for a specified word (target word), its format need not be particularly limited and may be determined appropriately depending on the embodiment. The information processing device 1 may acquire one or more related words 6 for the search term 5 by accessing the meta-information database 60 using the search term 5 as a query.

(関連語)
1つ以上の関連語6は、検索語5の同義語、類義語、上位概念語(上位語)、及び下位概念語(下位語)の少なくともいずれかを含んでよい。上位概念語は、対象の語を含む総括的な概念(上位概念)を表す語である。例えば、対象の語がCNG(Compressed Natural Gas)である場合、上位概念語は、燃料であってよい。下位概念語は、対象の語に含まれる具体的な概念(下位概念)を表す語である。例えば、対象の語が燃料である場合、下位概念語は、CNGであってよい。
(Related words)
The one or more related words 6 may include at least one of synonyms, similar words, higher-level concepts (hyperwords), and lower-level concepts (hyperwords) of the search term 5. A higher-level concept is a word that represents a general concept (higher concept) that includes the target word. For example, if the target word is CNG (Compressed Natural Gas), the higher-level concept may be fuel. A lower-level concept is a word that represents a specific concept (lower concept) included in the target word. For example, if the target word is fuel, the lower-level concept may be CNG.

これにより、検索語5に関連する関連語6を適切に取得することができる。その結果、文章の検索精度の向上を期待することができる。なお、関連語6は、同義語、類義語、上位概念語、及び下位概念語の少なくともいずれかに限られなくてもよい。他の一例では、
対象の語が検索語5として指定された際に、追加の検索語として使用されることが望まれる任意の語が、対象の語の関連語として設定されてよい。
This makes it possible to appropriately obtain related words 6 related to the search word 5. As a result, it is expected that the accuracy of searching sentences will be improved. Note that the related words 6 do not have to be limited to at least one of synonyms, similar words, higher-level conceptual words, and lower-level conceptual words. In another example,
When a target word is specified as a search term 5, any words desired to be used as additional search terms may be set as related terms of the target word.

(カテゴリ分け)
同一の表記で異なる意味を表す語が存在する(特に、略語)。また、使用する場面によって、対象の語により表現される意味が変わる可能性がある。これらに対応するため、関連語6は、カテゴリ分けされていてよい。1つ以上の関連語6を取得することは、検索語5のカテゴリを取得すること、及び取得されたカテゴリに属する1つ以上の関連語6を取得すること、により構成されてよい。これにより、検索シーンにおいて、検索語5と関連性の高い関連語6を適切に取得することができる。その結果、文章の検索精度の向上を期待することができる。
(Categorization)
There are words (particularly abbreviations) that have the same notation but have different meanings. In addition, the meaning expressed by the target word may change depending on the situation in which it is used. To deal with this, the related words 6 may be categorized. Obtaining one or more related words 6 may consist of obtaining a category of the search word 5 and obtaining one or more related words 6 that belong to the obtained category. This makes it possible to appropriately obtain related words 6 that are highly related to the search word 5 in a search scene. As a result, it is expected that the search accuracy of sentences will be improved.

なお、カテゴリを指定する方法は、特に限定されなくてよく、実施の形態に応じて適宜決定されてよい。一例では、カテゴリは、ユーザにより指定されてよい。他の一例では検索対象となる文書(複数の文章2)にカテゴリが関連付けられていてもよい。この場合、対象の文書が検索対象に指定されることで、指定された文書に関連付けられたカテゴリが検索語5のカテゴリとして取得されてよい。 The method of specifying the category is not particularly limited and may be determined appropriately depending on the embodiment. In one example, the category may be specified by the user. In another example, the category may be associated with the document (plurality of sentences 2) to be searched. In this case, the target document is specified as the search target, and the category associated with the specified document may be obtained as the category of the search term 5.

指定可能なカテゴリには、全てのカテゴリに属することを示す共通カテゴリ(後述する図5の「全カテゴリ共通」)が含まれていてよい。共通カテゴリが存在する場合、取得されたカテゴリに属する1つ以上の関連語6を取得することは、検索語5のカテゴリ及び共通カテゴリの少なくともいずれかに属する1つ以上の関連語6を取得することにより構成されてよい。 The categories that can be specified may include a common category ("Common to all categories" in FIG. 5 described later) indicating that the category belongs to all categories. When a common category exists, obtaining one or more related words 6 that belong to the obtained category may consist of obtaining one or more related words 6 that belong to at least one of the category of the search term 5 and the common category.

本実施形態では、関連語6は、メタ情報データベース60において、カテゴリ分けされた上で蓄積されてよい。メタ情報データベース60は、指定された語及びカテゴリに応じて関連語6を取得可能に適宜構成されてよい。 In this embodiment, the related words 6 may be categorized and stored in the meta-information database 60. The meta-information database 60 may be appropriately configured to be able to acquire the related words 6 according to the specified word and category.

[2 構成例]
[ハードウェア構成例]
図2は、本実施形態に係る情報処理装置1のハードウェア構成の一例を模式的に示す。図2に示されるとおり、本実施形態に係る情報処理装置1は、制御部11、記憶部12、入力装置13、出力装置14、及びドライブ15が電気的に接続されたコンピュータである。
[2 Configuration Example]
[Hardware configuration example]
Fig. 2 is a schematic diagram showing an example of a hardware configuration of the information processing device 1 according to the present embodiment. As shown in Fig. 2, the information processing device 1 according to the present embodiment is a computer in which a control unit 11, a storage unit 12, an input device 13, an output device 14, and a drive 15 are electrically connected.

制御部11は、ハードウェアプロセッサであるCPU(Central Processing Unit)、
RAM(Random Access Memory)、ROM(Read Only Memory)等を含み、プログラム及び各種データに基づいて情報処理を実行するように構成される。制御部11(CPU)は、プロセッサ・リソースの一例である。
The control unit 11 includes a CPU (Central Processing Unit), which is a hardware processor;
The control unit 11 includes a random access memory (RAM), a read only memory (ROM), etc., and is configured to execute information processing based on programs and various data. The control unit 11 (CPU) is an example of a processor resource.

記憶部12は、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。記憶部12は、メモリ・リソースの一例である。本実施形態では、記憶部12は、検索プログラム81、複数の文章2、構造情報200、メタ情報データベース60等の各種情報を記憶する。 The storage unit 12 is configured, for example, with a hard disk drive, a solid state drive, or the like. The storage unit 12 is an example of a memory resource. In this embodiment, the storage unit 12 stores various information such as a search program 81, multiple documents 2, structural information 200, and a meta information database 60.

検索プログラム81は、検索条件に該当する文章を抽出するための検索処理(後述の図4)を情報処理装置1に実行させるためのプログラムである。検索プログラム81は、当該情報処理の一連の命令を含む。 The search program 81 is a program for causing the information processing device 1 to execute a search process (see FIG. 4, described below) for extracting sentences that meet the search criteria. The search program 81 includes a series of instructions for the information processing.

入力装置13は、例えば、マウス、キーボード等の入力を行うための装置である。出力
装置14は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。ユーザは、入力装置13及び出力装置14を利用することで、情報処理装置1を操作することができる。入力装置13及び出力装置14は、例えば、タッチパネルディスプレイ等により一体的に構成されてもよい。
The input device 13 is, for example, a device for inputting information such as a mouse or a keyboard. The output device 14 is, for example, a device for outputting information such as a display or a speaker. A user can operate the information processing device 1 by using the input device 13 and the output device 14. The input device 13 and the output device 14 may be integrally configured as, for example, a touch panel display or the like.

ドライブ15は、記憶媒体91に記憶されたプログラム等の各種情報を読み込むための装置である。上記検索プログラム81、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかは、記憶媒体91に記憶されていてもよい。この場合、情報処理装置1は、検索プログラム81、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかを記憶媒体91から取得してよい。記憶媒体91は、コンピュータその他装置、機械等が、記憶されたプログラム等の各種情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。 The drive 15 is a device for reading various information such as programs stored in the storage medium 91. At least one of the search program 81, the multiple sentences 2, the structural information 200, and the meta-information database 60 may be stored in the storage medium 91. In this case, the information processing device 1 may acquire at least one of the search program 81, the multiple sentences 2, the structural information 200, and the meta-information database 60 from the storage medium 91. The storage medium 91 is a medium that accumulates information such as programs by electrical, magnetic, optical, mechanical, or chemical action so that a computer or other device, machine, etc. can read the various information such as the stored programs.

ここで、図2では、記憶媒体91の一例として、CD、DVD等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体91の種類は、ディスク型に限定される訳ではなく、ディスク型以外であってもよい。ディスク型以外の記憶媒体として、例えば、フラッシュメモリ等の半導体メモリを挙げることができる。ドライブ15の種類は、記憶媒体91の種類に応じて適宜選択されてよい。 In FIG. 2, a disk-type storage medium such as a CD or DVD is illustrated as an example of the storage medium 91. However, the type of the storage medium 91 is not limited to a disk type, and may be other than a disk type. An example of a storage medium other than a disk type is a semiconductor memory such as a flash memory. The type of the drive 15 may be appropriately selected depending on the type of the storage medium 91.

なお、情報処理装置1の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部11は、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、FPGA(field-programmable gate array)、GPU(Graphics Processing Unit)等で構
成されてよい。入力装置13、出力装置14、及びドライブ15の少なくともいずれかは省略されてよい。
In addition, with regard to the specific hardware configuration of the information processing device 1, components can be omitted, replaced, or added as appropriate depending on the embodiment. For example, the control unit 11 may include multiple hardware processors. The hardware processor may be configured with a microprocessor, a field-programmable gate array (FPGA), a graphics processing unit (GPU), or the like. At least one of the input device 13, the output device 14, and the drive 15 may be omitted.

情報処理装置1は、他のコンピュータとデータ通信を行うための通信モジュールを更に備えてよい。通信モジュールは、例えば、有線LAN(Local Area Network)モジュール、無線LANモジュール等である。この場合、情報処理装置1は、通信モジュールを使用して、他のコンピュータとデータ通信を実行してよい。例えば、情報処理装置1は、他のコンピュータから検索語5を含むクエリを受け付け、受け付けたクエリに応じて検索処理を実行し、検索結果を他のコンピュータに返信してもよい。また、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかは、ネットワークサーバ等の他のコンピュータに保存されていてもよい。情報処理装置1は、他のコンピュータにアクセスすることで、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかを取得してよい。 The information processing device 1 may further include a communication module for performing data communication with other computers. The communication module is, for example, a wired LAN (Local Area Network) module, a wireless LAN module, or the like. In this case, the information processing device 1 may use the communication module to perform data communication with other computers. For example, the information processing device 1 may receive a query including a search term 5 from the other computer, perform a search process according to the received query, and return the search results to the other computer. In addition, at least one of the multiple sentences 2, the structural information 200, and the meta-information database 60 may be stored in another computer such as a network server. The information processing device 1 may obtain at least one of the multiple sentences 2, the structural information 200, and the meta-information database 60 by accessing the other computer.

情報処理装置1は、外部装置と接続するための外部インタフェースを更に備えてよい。外部インタフェースは、例えば、USB(Universal Serial Bus)ポート、専用ポート等である。この場合、情報処理装置1は、外部インタフェースを使用して、外部装置と接続されてよい。例えば、検索プログラム81、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかは、外部記憶装置に記憶されていてもよい。情報処理装置1は、外部インタフェースを介して外部記憶装置に接続してよい。情報処理装置1は、検索プログラム81、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかを外部記憶装置から取得してよい。 The information processing device 1 may further include an external interface for connecting to an external device. The external interface is, for example, a USB (Universal Serial Bus) port, a dedicated port, etc. In this case, the information processing device 1 may be connected to the external device using the external interface. For example, at least one of the search program 81, the multiple sentences 2, the structural information 200, and the meta information database 60 may be stored in an external storage device. The information processing device 1 may be connected to the external storage device via the external interface. The information processing device 1 may acquire at least one of the search program 81, the multiple sentences 2, the structural information 200, and the meta information database 60 from the external storage device.

情報処理装置1は、複数台のコンピュータにより構成されてよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、或いは一致していなくてもよい。情報処理装置1は、提供されるサービス専用に設計されたコンピュータの他、汎用のサー
バ装置、汎用のPC(Personal Computer)、スマートフォンを含む携帯電話、タブレッ
トPC等であってよい。
The information processing device 1 may be configured by a plurality of computers. In this case, the hardware configurations of the computers may or may not be the same. The information processing device 1 may be a computer designed specifically for the service provided, a general-purpose server device, a general-purpose PC (Personal Computer), a mobile phone including a smartphone, a tablet PC, or the like.

[ソフトウェア構成例]
図3は、本実施形態に係る情報処理装置1のソフトウェア構成の一例を模式的に示す。情報処理装置1の制御部11は、記憶部12に記憶された検索プログラム81をRAMに展開し、RAMに展開された検索プログラム81に含まれる命令をCPUにより実行する。これにより、本実施形態に係る情報処理装置1は、ワード取得部111、ワード拡張部112、構造取得部113、構造特定部114、範囲拡張部115、検索処理部116及び出力部117をソフトウェアモジュールとして備えるコンピュータとして動作する。すなわち、本実施形態では、情報処理装置1の各ソフトウェアモジュールは、制御部11(CPU)により実現される。
[Software configuration example]
3 is a schematic diagram showing an example of a software configuration of the information processing device 1 according to the present embodiment. The control unit 11 of the information processing device 1 loads the search program 81 stored in the storage unit 12 in the RAM, and executes the instructions included in the search program 81 loaded in the RAM by the CPU. As a result, the information processing device 1 according to the present embodiment operates as a computer including a word acquisition unit 111, a word expansion unit 112, a structure acquisition unit 113, a structure identification unit 114, a range expansion unit 115, a search processing unit 116, and an output unit 117 as software modules. That is, in the present embodiment, each software module of the information processing device 1 is realized by the control unit 11 (CPU).

ワード取得部111は、検索語5を取得するように構成される。ワード拡張部112は、検索語5に関連する1つ以上の関連語6を取得するように構成される。構造取得部113は、階層化された複数の文章2であって、検索対象文章20を含む複数の文章2における階層関係を示す構造情報200を取得するように構成される。構造特定部114は、取得された構造情報200を参照することで、複数の文章2の中から、検索対象文章20の上位階層に位置する上位階層文章25を特定するように構成される。範囲拡張部115は、特定された上位階層文章25に付与されたタグ情報35を取得するように構成される。本実施形態では、範囲拡張部115は、検索対象文章20に付与されたタグ情報30を取得するように更に構成されてよい。検索処理部116は、検索対象文章20及び上位階層文章25のタグ情報35において、取得された検索語5と一致する語が存在するか否かを検索するように構成される。本実施形態では、検索処理部116は、検索対象文章20、検索対象文章20のタグ情報30、及び上位階層文章25のタグ情報35において、検索語5又は1つ以上の関連語6の少なくともいずれかと一致する語が存在するか否かを検索するように構成されてよい。出力部117は、検索の結果に関する情報を出力するように構成される。 The word acquisition unit 111 is configured to acquire a search term 5. The word expansion unit 112 is configured to acquire one or more related words 6 related to the search term 5. The structure acquisition unit 113 is configured to acquire structure information 200 indicating a hierarchical relationship in a plurality of sentences 2 including a search target sentence 20, which are hierarchically organized sentences. The structure identification unit 114 is configured to identify an upper-level sentence 25 located in a higher level than the search target sentence 20 from among the plurality of sentences 2 by referring to the acquired structure information 200. The range expansion unit 115 is configured to acquire tag information 35 assigned to the identified upper-level sentence 25. In this embodiment, the range expansion unit 115 may be further configured to acquire tag information 30 assigned to the search target sentence 20. The search processing unit 116 is configured to search for whether or not a word matching the acquired search term 5 exists in the tag information 35 of the search target sentence 20 and the upper-level sentence 25. In this embodiment, the search processing unit 116 may be configured to search for whether or not there is a word matching at least one of the search term 5 and one or more related words 6 in the search target sentence 20, the tag information 30 of the search target sentence 20, and the tag information 35 of the upper level sentence 25. The output unit 117 is configured to output information related to the search result.

なお、本実施形態では、情報処理装置1の各ソフトウェアモジュールがいずれも汎用のCPUによって実現される例について説明している。しかしながら、上記ソフトウェアモジュールの一部又は全部が、1又は複数の専用のプロセッサにより実現されてもよい。上記各モジュールは、ハードウェアモジュールとして実現されてもよい。また、情報処理装置1のソフトウェア構成に関して、実施形態に応じて、適宜、モジュールの省略、置換及び追加が行われてもよい。 In this embodiment, an example is described in which each software module of the information processing device 1 is realized by a general-purpose CPU. However, some or all of the above software modules may be realized by one or more dedicated processors. Each of the above modules may be realized as a hardware module. Furthermore, with regard to the software configuration of the information processing device 1, modules may be omitted, replaced, or added as appropriate depending on the embodiment.

[3 動作例]
図4は、本実施形態に係る情報処理装置1による文章検索に関する処理手順の一例を示すフローチャートである。以下で説明する処理手順は、本開示の一態様に係る検索方法(情報処理方法)の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。また、以下の処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が行われてよい。
[3 Operation example]
4 is a flowchart showing an example of a processing procedure for text search by the information processing device 1 according to the present embodiment. The processing procedure described below is an example of a search method (information processing method) according to one aspect of the present disclosure. However, the processing procedure described below is merely an example, and each step may be changed as much as possible. In addition, steps may be omitted, replaced, or added to the following processing procedure as appropriate depending on the embodiment.

(ステップS101)
ステップS101では、制御部11は、ワード取得部111として動作し、検索語5を取得する。検索語5を取得する形態は、実施の形態に応じて適宜選択されてよい。一例では、制御部11は、入力装置13を介したユーザの入力に応じて、検索語5を取得してよい。他の一例では、制御部11は、任意の文章中から検索語5を取得してよい。更に他の一例では、制御部11は、他のコンピュータから検索語5を取得してよい。検索語5を取得すると、制御部11は、次のステップS102に処理を進める。
(Step S101)
In step S101, the control unit 11 operates as the word acquisition unit 111 and acquires the search term 5. The manner in which the search term 5 is acquired may be appropriately selected depending on the embodiment. In one example, the control unit 11 may acquire the search term 5 in response to a user's input via the input device 13. In another example, the control unit 11 may acquire the search term 5 from an arbitrary sentence. In yet another example, the control unit 11 may acquire the search term 5 from another computer. After acquiring the search term 5, the control unit 11 proceeds to the next step S102.

(ステップS102)
ステップS102では、制御部11は、ワード拡張部112として動作し、検索語5に関連する1つ以上の関連語6を取得する。
(Step S102)
In step S<b>102 , the control unit 11 operates as the word expansion unit 112 and acquires one or more related words 6 related to the search word 5 .

関連語6を取得する方法は、実施の形態に応じて適宜決定されてよい。本実施形態では、1つ以上の関連語6は、検索語5の同義語、類義語、上位概念語、及び下位概念語の少なくともいずれかを含んでよい。また、関連語6は、カテゴリ分けされていてよい。この場合、制御部11は、検索語5のカテゴリを取得してよい。一例では、制御部11は、入力装置13を介したユーザの入力に応じてカテゴリを取得してよい。他の一例では、制御部11は、対象の文書が検索対象に指定されることで、指定された文書に関連付けられたカテゴリを検索語5のカテゴリとして取得してよい。更に他の一例では、制御部11は、他のコンピュータからカテゴリを取得してよい。カテゴリの取得は、ステップS102の処理を実行する前の任意のタイミングで実行されてよい。例えば、制御部11は、上記ステップS101の処理と並列にカテゴリを取得する処理を実行してよい。そして、制御部11は、取得されたカテゴリに属する1つ以上の関連語6を取得してよい。本実施形態では、制御部11は、検索語5をクエリとして使用することで、メタ情報データベース60から1つ以上の関連語6を取得することができる。 The method of acquiring the related words 6 may be appropriately determined according to the embodiment. In this embodiment, the one or more related words 6 may include at least one of synonyms, synonyms, higher-level conceptual terms, and lower-level conceptual terms of the search term 5. The related words 6 may also be categorized. In this case, the control unit 11 may acquire the category of the search term 5. In one example, the control unit 11 may acquire the category in response to a user's input via the input device 13. In another example, the control unit 11 may acquire a category associated with the specified document as a category of the search term 5 by specifying the target document as a search target. In yet another example, the control unit 11 may acquire a category from another computer. The acquisition of the category may be performed at any timing before the processing of step S102 is performed. For example, the control unit 11 may execute a process of acquiring a category in parallel with the processing of step S101. Then, the control unit 11 may acquire one or more related words 6 belonging to the acquired category. In this embodiment, the control unit 11 can acquire one or more related words 6 from the meta-information database 60 by using the search term 5 as a query.

図5は、本実施形態に係るメタ情報データベース60の一例を模式的に示す。図5に示されるメタ情報データベース60は、テーブル形式のデータ構造を有している。各レコード(行データ)は、対象語、カテゴリ、種類、及び関連語の各値を格納するフィールドを有している。対象語フィールドには、関連語を検索する対象となる語が格納される。カテゴリフィールドには、関連語の属するカテゴリが格納される。図5の一例では、「全カテゴリ共通」が、全てのカテゴリに属することを示す。種類フィールドには、関連語の種類(図5の一例では、同義語、類義語、上位概念語、又は下位概念語)を示す情報が格納される。関連語フィールドには、対象語に関連する関連語が格納される。図5に示されるとおり、対象語には、同一種類の複数の関連語が存在してよい。これに応じて、各レコードには、複数の関連語フィールドが設けられてよい(図5の「第1関連語」「第2関連語」)。 FIG. 5 is a schematic diagram showing an example of a meta-information database 60 according to the present embodiment. The meta-information database 60 shown in FIG. 5 has a data structure in the form of a table. Each record (row data) has fields for storing the values of a target word, a category, a type, and a related word. The target word field stores a word to be searched for related words. The category field stores a category to which the related word belongs. In the example of FIG. 5, "common to all categories" indicates that the related word belongs to all categories. The type field stores information indicating the type of related word (in the example of FIG. 5, synonymous word, similar word, higher-level word, or lower-level word). The related word field stores related words related to the target word. As shown in FIG. 5, a target word may have multiple related words of the same type. Accordingly, each record may have multiple related word fields ("first related word" and "second related word" in FIG. 5).

制御部11は、取得された検索語5及びカテゴリをクエリとして使用して、メタ情報データベース60に対して関連語6の検索処理を実行してよい。検索処理の一例では、制御部11は、各レコードの対象語フィールド及びカテゴリフィールドを参照し、取得された検索語5及びカテゴリと同一の値が対象語フィールド及びカテゴリフィールドに格納されているレコードを抽出してよい。共通カテゴリが存在する場合、制御部11は、取得された検索語5と同一の値が対象語フィールドに格納されており、カテゴリフィールドに共通カテゴリを示す値が格納されているレコードも更に抽出してよい。そして、制御部11は、抽出されたレコードの関連語フィールドから関連語6を取得してよい。 The control unit 11 may use the acquired search term 5 and category as a query to perform a search process for related terms 6 in the meta information database 60. In one example of the search process, the control unit 11 may refer to the target word field and category field of each record, and extract records in which the same values as the acquired search term 5 and category are stored in the target word field and category field. If a common category exists, the control unit 11 may further extract records in which the same value as the acquired search term 5 is stored in the target word field, and a value indicating the common category is stored in the category field. The control unit 11 may then acquire the related terms 6 from the related word field of the extracted records.

関連語6が上位概念語を含む場合、制御部11は、検索語5の上位概念語を再帰的に取得してよい。すなわち、制御部11は、検索語5の上位概念語及びカテゴリをクエリとして使用して、メタ情報データベース60から上位概念語の関連語を検索語5の関連語6として更に取得してよい。制御部11は、最上位の上位概念語の関連語を取得するまで、関連語6の取得処理を再帰的に繰り返すことで、上位概念語及び上位概念語の関連語を検索語5の関連語6として取得してよい。関連語6が下位概念語を含む場合も同様であってよい。すなわち、制御部11は、検索語5の下位概念語及びカテゴリをクエリとして使用して、メタ情報データベース60から下位概念語の関連語を検索語5の関連語6として更に取得してよい。制御部11は、最下位の下位概念語の関連語を取得するまで、関連語6の取得処理を再帰的に繰り返すことで、下位概念語及び下位概念語の関連語を検索語5の関
連語6として取得してよい。
When the related words 6 include a higher-level concept word, the control unit 11 may recursively acquire a higher-level concept word of the search word 5. That is, the control unit 11 may use the higher-level concept word and the category of the search word 5 as a query to further acquire a related word of the higher-level concept word from the meta-information database 60 as a related word 6 of the search word 5. The control unit 11 may acquire a higher-level concept word and a related word of the higher-level concept word as a related word 6 of the search word 5 by recursively repeating the acquisition process of the related words 6 until the related word of the highest-level concept word is acquired. The same may be true when the related words 6 include a lower-level concept word. That is, the control unit 11 may use the lower-level concept word and the category of the search word 5 as a query to further acquire a related word of the lower-level concept word from the meta-information database 60 as a related word 6 of the search word 5. The control unit 11 may acquire a lower-level concept word and a related word of the lower-level concept word as a related word 6 of the search word 5 by recursively repeating the acquisition process of the related words 6 until the related word of the lowest-level concept word is acquired.

なお、指定された検索語5に対応する関連語6を取得可能であれば、メタ情報データベース60のデータ構造は、図5に示される例に限定されなくてよく、実施の形態に応じて適宜決定されてよい。1つ以上の関連語6を取得すると、制御部11は、次のステップS103に処理を進める。 Note that, as long as it is possible to acquire related words 6 corresponding to the specified search term 5, the data structure of the meta information database 60 does not need to be limited to the example shown in FIG. 5, and may be appropriately determined depending on the embodiment. When one or more related words 6 are acquired, the control unit 11 proceeds to the next step S103.

(ステップS103~ステップS105)
図4に戻り、ステップS103では、制御部11は、構造取得部113として動作し、構造情報200を取得する。構造情報200を取得すると、制御部11は、次のステップS104に処理を進める。
(Steps S103 to S105)
4, in step S103, the control unit 11 operates as the structure acquisition unit 113 and acquires the structure information 200. After acquiring the structure information 200, the control unit 11 advances the process to the next step S104.

ステップS104では、制御部11は、構造特定部114として動作し、取得された構造情報200を参照することで、複数の文章2の中から、検索対象文章20の上位階層に位置する上位階層文章25を特定する。複数の上位階層文章25が存在する場合、制御部11は、検索対象文章20から階層を上位の方向に遡り、複数の上位階層文章25のうちの少なくとも一部を特定してよい。 In step S104, the control unit 11 operates as a structure identification unit 114 and identifies, from among the multiple sentences 2, a higher-level sentence 25 that is located in a higher level than the search target sentence 20 by referring to the acquired structure information 200. If multiple higher-level sentences 25 exist, the control unit 11 may trace the hierarchy upward from the search target sentence 20 and identify at least a portion of the multiple higher-level sentences 25.

なお、検索対象文章20は、複数の文章2の中から任意に選択されてよい。一例では、制御部11は、入力装置13を介したユーザの選択に応じて検索対象文章20を取得してよい。他の一例では、制御部11は、検索の対象に指定された複数の文章2の中から任意の方法で検索対象文章20を取得してよい。検索の対象となる複数の文章2は、ステップS103の処理を実行する前までの任意のタイミングで指定されてよい。検索対象文章20は、ステップS104の処理を実行する前までの任意のタイミングで選択されてよい。上位階層文章25を特定すると、制御部11は、次のステップS105に処理を進める。 The search target sentence 20 may be arbitrarily selected from among a plurality of sentences 2. In one example, the control unit 11 may acquire the search target sentence 20 in response to a user selection via the input device 13. In another example, the control unit 11 may acquire the search target sentence 20 in an arbitrary manner from among a plurality of sentences 2 designated as search targets. The plurality of sentences 2 to be searched may be designated at any timing before the process of step S103 is executed. The search target sentence 20 may be selected at any timing before the process of step S104 is executed. When the upper-level sentence 25 is identified, the control unit 11 proceeds to the next step S105.

ステップS105では、制御部11は、範囲拡張部115として動作し、特定された上位階層文章25に付与されたタグ情報35を取得する。本実施形態では、制御部11は、検索対象文章20に付与されたタグ情報30を更に取得してよい。複数の上位階層文章25が存在する場合、制御部11は、複数の上位階層文章25のうちの少なくとも一部のタグ情報35を取得してよい。一例では、制御部11は、検索対象文章20から最上位の上位階層文章25まで1階層ずつ遡り、各階層の上位階層文章25のタグ情報35を取得してよい。これにより、制御部11は、検索対象文章20の照合範囲を拡張する。 In step S105, the control unit 11 operates as the range expansion unit 115 and acquires the tag information 35 assigned to the identified upper-level sentence 25. In this embodiment, the control unit 11 may further acquire the tag information 30 assigned to the search target sentence 20. If there are multiple upper-level sentences 25, the control unit 11 may acquire the tag information 35 of at least a portion of the multiple upper-level sentences 25. In one example, the control unit 11 may go back one layer at a time from the search target sentence 20 to the top upper-level sentence 25 and acquire the tag information 35 of the upper-level sentence 25 of each layer. In this way, the control unit 11 expands the matching range of the search target sentence 20.

図6は、本実施形態に係る構造情報200及び階層化された文章の一例を模式的に示す。図7は、図6で示される各文章に対して上位階層文章のタグ情報を取得する処理を実行した後の各文章の照合範囲の一例を模式的に示す。なお、図6及び図7の一例では、説明の便宜上、構造情報200、各文章、及びタグ情報をテーブル形式で表現している。ただし、構造情報200、各文章、及びタグ情報のデータ形式は、このような例に限定されなくてよく、実施の形態に応じて適宜決定されてよい。 Figure 6 shows a schematic example of structural information 200 and hierarchical sentences according to this embodiment. Figure 7 shows a schematic example of the matching range of each sentence after a process is executed to obtain tag information of a higher-level sentence for each sentence shown in Figure 6. Note that in the examples of Figures 6 and 7, the structural information 200, each sentence, and tag information are expressed in table format for ease of explanation. However, the data format of the structural information 200, each sentence, and tag information is not limited to this example, and may be determined appropriately depending on the embodiment.

図6の一例では、各文章が、章立てにより3階層に分けられている場面を想定している。「別添42」の文章が最上位であり、「別添42 I」が中位であり、「別添42 I
1.」が最下位である。「別添42」の文章には、図6の「第1階層のタグ情報」が付与されている。「別添42 I」の文章には、「第2階層のタグ情報」が付与されている。
「別添42 I 1.」の文章には、「第3階層のタグ情報」が付与されている。「別添42 I」の文章を検索対象文章20とした場合、上位階層文章25は、「別添42」の文
章である。「別添42 I 1.」の文章を検索対象文章20とした場合、上位階層文章25は、「別添42 I」の文章及び「別添42」の文章である。
In the example of FIG. 6, it is assumed that each document is divided into three hierarchical levels by chapter. The document "Attachment 42" is the top level, "Attachment 42 I" is the middle level, and "Attachment 42 I" is the second level.
"1." is at the lowest level. The text of "Attachment 42" is given the "first hierarchical tag information" in FIG. 6. The text of "Attachment 42 I" is given the "second hierarchical tag information."
The sentence "Attachment 42 I 1." is given "third-level tag information." When the sentence "Attachment 42 I" is the search target sentence 20, the higher-level sentence 25 is the sentence "Attachment 42." When the sentence "Attachment 42 I 1." is the search target sentence 20, the higher-level sentences 25 are the sentences "Attachment 42 I" and "Attachment 42."

図7に示されるとおり、制御部11は、「別添42 I」の文章に対して「別添42 I」の文章及び「別添42」の文章のタグ情報を取得してよい。これにより、制御部11は、「別添42 I」の文章の照合範囲を、「別添42 I」の文章、「別添42」のタグ情報、及び「別添42 I」のタグ情報に拡張してよい。また、制御部11は、「別添42 I 1.」の文章に対して「別添42 I 1.」の文章、「別添42 I」の文章、及び「別添42」の文章のタグ情報を取得してよい。これにより、制御部11は、「別添42
I 1.」の文章の照合範囲を、「別添42 I 1.」の文章、「別添42」のタグ情報
、「別添42 I」のタグ情報、及び「別添42 I 1.」のタグ情報に拡張してよい。
図7では、「別添42 I 1.」の文章の照合範囲が太枠線で示されている。タグ情報(30、35)を取得すると、制御部11は、次のステップS106に処理を進める。
As shown in Fig. 7, the control unit 11 may obtain tag information of the sentence "Attachment 42 I" and the sentence "Attachment 42" for the sentence "Attachment 42 I". As a result, the control unit 11 may expand the collation range of the sentence "Attachment 42 I" to the sentence "Attachment 42 I", the tag information of "Attachment 42", and the tag information of "Attachment 42 I". In addition, the control unit 11 may obtain tag information of the sentence "Attachment 42 I 1.", the sentence "Attachment 42 I", and the sentence "Attachment 42" for the sentence "Attachment 42 I 1.". As a result, the control unit 11 may expand the collation range of the sentence "Attachment 42 I" to the sentence "Attachment 42 I", the tag information of "Attachment 42", and the tag information of "Attachment 42 I".
The matching range of the sentence "Attachment 42 I 1." may be expanded to the sentence "Attachment 42 I 1.", the tag information of "Attachment 42", the tag information of "Attachment 42 I", and the tag information of "Attachment 42 I 1.".
7, the range of matching for the text "Attachment 42 I 1." is indicated by a bold frame. After acquiring the tag information (30, 35), the control unit 11 advances the process to the next step S106.

(ステップS106)
ステップS106では、制御部11は、検索対象文章20及び上位階層文章25のタグ情報35において、取得された検索語5と一致する語が存在するか否かを検索する。本実施形態では、制御部11は、検索対象文章20、検索対象文章20のタグ情報30、及び上位階層文章25のタグ情報35において、検索語5又は1つ以上の関連語6の少なくともいずれかと一致する語が存在するか否かを検索してよい。
(Step S106)
In step S106, the control unit 11 searches the tag information 35 of the search target sentence 20 and the upper hierarchical sentence 25 to determine whether or not there is a word matching the acquired search term 5. In this embodiment, the control unit 11 may search the search target sentence 20, the tag information 30 of the search target sentence 20, and the tag information 35 of the upper hierarchical sentence 25 to determine whether or not there is a word matching at least one of the search term 5 and one or more related words 6.

検索語5及び関連語6を論理和検索の条件として使用する場合、検索処理において、制御部11は、検索対象文章20の照合範囲に検索語5又は関連語6と一致する語が存在するか否かを判定する。照合範囲に検索語5又は関連語6と一致する語が存在する場合、制御部11は、検索対象文章20を検索結果として抽出する。他方、照合範囲に検索語5又は関連語6と一致する語が存在しない場合、制御部11は、検索対象文章20を抽出しない。 When the search term 5 and related word 6 are used as conditions for a logical sum search, in the search process, the control unit 11 determines whether or not a word matching the search term 5 or related word 6 exists within the matching range of the search target sentence 20. If a word matching the search term 5 or related word 6 exists within the matching range, the control unit 11 extracts the search target sentence 20 as the search result. On the other hand, if a word matching the search term 5 or related word 6 does not exist within the matching range, the control unit 11 does not extract the search target sentence 20.

複数の検索対象文章20が存在する場合、制御部11は、各検索対象文章20に対して少なくともステップS104~ステップS106の処理を実行してよい。例えば、制御部11は、処理対象となる検索対象文章を複数の検索対象文章20から選択してよい。制御部11は、選択された検索対象文章に対してステップS104~ステップS106の処理を実行してよい。選択方法は任意に設定されてよい(例えば、選択する順序が予め規定されていてよい)。全ての検索対象文章20に対してステップS104~ステップS106の処理が完了するまで、制御部11は、これらの一連の情報処理を繰り返し実行してよい。なお、ステップS103の処理は、適宜実行されてよい。一例では、全ての検索対象文章20に対して一度にステップS103の処理が実行されてもよい。他の一例では、検索対象文章20毎にステップS103の処理が実行されてもよい。 When there are multiple search target sentences 20, the control unit 11 may execute at least the processing of steps S104 to S106 for each search target sentence 20. For example, the control unit 11 may select a search target sentence to be processed from the multiple search target sentences 20. The control unit 11 may execute the processing of steps S104 to S106 for the selected search target sentence. The selection method may be set arbitrarily (for example, the selection order may be specified in advance). The control unit 11 may repeatedly execute this series of information processing until the processing of steps S104 to S106 is completed for all search target sentences 20. The processing of step S103 may be executed appropriately. In one example, the processing of step S103 may be executed for all search target sentences 20 at once. In another example, the processing of step S103 may be executed for each search target sentence 20.

具体例として、図5~図7の各種情報が与えられ、ステップS101の処理において、2つの検索語5「測定方法」及び「燃料」が論理積条件として取得されたと想定する。また、「排ガス法規」がカテゴリとして取得されたと想定する。この場合、ステップS102において、制御部11は、メタ情報データベース60を参照して、「測定方法」及び「燃料」の関連語6を取得してよい。図5の例では、「測定方法」を対象語フィールドに格納するレコードは存在しないため、「測定方法」の関連語6は得られない。一方、「燃料」を対象語フィールドに格納するレコードは存在する。制御部11は、カテゴリとして「排ガス法規」が指定されている条件下で下位概念語を再帰的に取得することで、「CNG」、「圧縮天然ガス」、「天然ガス」、「LPG」及び「液化石油ガス」を「燃料」の関連語6として取得することができる。これらの関連語6は、論理和条件として使用されることを想定する。 As a specific example, assume that various information in Figs. 5 to 7 is given, and that in the process of step S101, two search terms 5 "measurement method" and "fuel" are acquired as logical product conditions. Also assume that "exhaust gas regulations" is acquired as a category. In this case, in step S102, the control unit 11 may refer to the meta information database 60 to acquire related terms 6 for "measurement method" and "fuel". In the example of Fig. 5, since there is no record that stores "measurement method" in the target word field, related terms 6 for "measurement method" are not obtained. On the other hand, there is a record that stores "fuel" in the target word field. The control unit 11 can acquire "CNG", "compressed natural gas", "natural gas", "LPG", and "liquefied petroleum gas" as related terms 6 for "fuel" by recursively acquiring subordinate concepts under the condition that "exhaust gas regulations" is specified as the category. It is assumed that these related terms 6 are used as logical sum conditions.

図7に示されるとおり、検索対象文章20が「別添42 I 1.」の文章である場合、制御部11は、ステップS103~ステップS105の処理により、「別添42」のタグ
情報、「別添42 I」のタグ情報、及び「別添42 I 1.」のタグ情報を取得してよ
い。ステップS106の処理では、制御部11は、「別添42 I 1.」の文章、「別添42」のタグ情報、「別添42 I」のタグ情報、及び「別添42 I 1.」のタグ情報
において、上記検索語5又は関連語6と一致する語が存在するか否かを検索してよい。「別添42」のタグ情報に「測定方法」が存在する。「別添42 I 1.」の文章及びタグ情報に、「燃料」、「CNG」、「圧縮天然ガス」、「天然ガス」、「LPG」及び「液化石油ガス」が存在する。そのため、制御部11は、「測定方法」及び「燃料」の検索条件に該当する文章として、「別添42 I 1.」の文章を抽出することができる。検索処理が完了すると、制御部11は、次のステップS107に処理を進める。
7, when the search target sentence 20 is the sentence of "Attachment 42 I 1.", the control unit 11 may acquire tag information of "Attachment 42", tag information of "Attachment 42 I", and tag information of "Attachment 42 I 1." by the processing of steps S103 to S105. In the processing of step S106, the control unit 11 may search whether or not there is a word matching the above-mentioned search term 5 or related word 6 in the sentence of "Attachment 42 I 1.", tag information of "Attachment 42", tag information of "Attachment 42 I", and tag information of "Attachment 42 I 1.". "Measurement method" is present in the tag information of "Attachment 42". "Fuel", "CNG", "Compressed natural gas", "Natural gas", "LPG", and "Liquefied petroleum gas" are present in the sentence and tag information of "Attachment 42 I 1.". Therefore, the control unit 11 can extract the sentence "Attachment 42 I 1." as a sentence that meets the search conditions of "measurement method" and "fuel". When the search process is completed, the control unit 11 proceeds to the next step S107.

(ステップS107)
ステップS107では、制御部11は、出力部117として動作し、検索の結果に関する情報を出力する。
(Step S107)
In step S107, the control unit 11 operates as the output unit 117 and outputs information related to the search results.

出力先及び出力処理の内容は、実施の形態に応じて適宜決定されてよい。出力先は、例えば、RAM、記憶部12、出力装置14、記憶媒体91、外部記憶装置、他のコンピュータ等から選択されてよい。一例では、制御部11は、検索結果として抽出された文章の一覧を出力装置14(例えば、ディスプレイ)に出力してよい。この場合、制御部11は、抽出された文章と共に、検索条件として使用された検索語5及び関連語6を表示してよい。加えて、制御部11は、抽出された文章中において、使用された検索語5及び関連語6の位置を明示してよい。他の一例では、制御部11は、検索結果を他のコンピュータに送信してよい。他のコンピュータでは、任意の方法(例えば、上記と同様の方法)で検索結果が表示されてよい。 The output destination and the contents of the output process may be appropriately determined according to the embodiment. The output destination may be selected from, for example, RAM, the storage unit 12, the output device 14, the storage medium 91, an external storage device, another computer, etc. In one example, the control unit 11 may output a list of sentences extracted as search results to the output device 14 (for example, a display). In this case, the control unit 11 may display the search term 5 and related words 6 used as search conditions together with the extracted sentences. In addition, the control unit 11 may clearly indicate the positions of the search term 5 and related words 6 used in the extracted sentences. In another example, the control unit 11 may transmit the search results to another computer. The search results may be displayed in any manner (for example, the same manner as described above) in the other computer.

情報の出力が完了すると、制御部11は、本動作例に係る情報処理装置1の処理手順を終了する。なお、制御部11は、ステップS101~ステップS107の処理を繰り返し実行してよい。処理を繰り返すタイミングは、実施の形態に応じて適宜決定されてよい。これにより、情報処理装置1は、検索語5に該当する文章の検索処理を繰り返し実行してよい。 When the output of the information is completed, the control unit 11 ends the processing procedure of the information processing device 1 according to this operation example. The control unit 11 may repeatedly execute the processes of steps S101 to S107. The timing for repeating the processes may be appropriately determined according to the embodiment. As a result, the information processing device 1 may repeatedly execute the search process for sentences matching the search term 5.

(特徴)
本実施形態では、ステップS103~ステップS105の処理により、検索語5の照合範囲が、検索対象文章20のみではなく、検索対象文章20のタグ情報30及び上位階層文章25のタグ情報35まで拡張される。これにより、ステップS106の処理において、検索対象文章20に検索語5と一致する語が含まれていなくても、タグ情報(30、35)に検索語5と一致する語が含まれていれば、検索対象文章20を検索結果として抽出することができる。例えば、上記の具体例において、「測定方法」は、「別添42 I 1.」の文章には含まれていないが、「別添42」のタグ情報に含まれている。そのため、「別添42 I 1.」の文章を検索結果として抽出することができる。加えて、本実施形態では、上位階層文章25そのものではなく、このタグ情報35を照合範囲に追加する。これにより、照合範囲を拡張する量を抑えつつ、検索対象文章20が適切に抽出されやすくすることができる。したがって、本実施形態によれば、効率的に文章の検索性を高めることができる。
(Features)
In this embodiment, the process of steps S103 to S105 expands the matching range of the search term 5 to not only the search target sentence 20 but also the tag information 30 of the search target sentence 20 and the tag information 35 of the upper layer sentence 25. As a result, in the process of step S106, even if the search target sentence 20 does not contain a word matching the search term 5, if the tag information (30, 35) contains a word matching the search term 5, the search target sentence 20 can be extracted as a search result. For example, in the above specific example, "measurement method" is not included in the sentence "Attachment 42 I 1.", but is included in the tag information of "Attachment 42.". Therefore, the sentence "Attachment 42 I 1." can be extracted as a search result. In addition, in this embodiment, this tag information 35 is added to the matching range instead of the upper layer sentence 25 itself. This makes it easier to appropriately extract the search target sentence 20 while suppressing the amount of expansion of the matching range. Therefore, according to this embodiment, the searchability of the sentence can be efficiently improved.

[4 変形例]
以上、本開示の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本開示の例示に過ぎない。本開示の範囲を逸脱することなく種々の改良又は変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。以下の変形例は適宜組み合わせ可能である。
[4 Modifications]
Although the embodiment of the present disclosure has been described in detail above, the above description is merely an example of the present disclosure in every respect. It goes without saying that various improvements or modifications can be made without departing from the scope of the present disclosure. For example, the following modifications are possible. The following modifications can be combined as appropriate.

上記実施形態において、制御部11は、検索対象文章20に付与されたタグ情報30を取得する処理を省略してよい。 In the above embodiment, the control unit 11 may omit the process of acquiring tag information 30 assigned to the search target sentence 20.

上記実施形態において、関連語6は、カテゴリ分けされていなくてよい。この場合、上記処理手順において、カテゴリに関する各処理が省略されてよい。メタ情報データベース60の各レコードからカテゴリのフィールドが省略されてよい。 In the above embodiment, the related words 6 do not need to be categorized. In this case, each process related to categories may be omitted in the above processing procedure. The category field may be omitted from each record in the meta information database 60.

上記実施形態において、関連語6を取得する処理は省略されてよい。この場合、情報処理装置1のソフトウェア構成からワード拡張部112が省略されてよい。上記処理手順において、ステップS102の処理は省略されてよい。メタ情報データベース60は省略されてよい。 In the above embodiment, the process of acquiring related words 6 may be omitted. In this case, the word expansion unit 112 may be omitted from the software configuration of the information processing device 1. In the above processing procedure, the process of step S102 may be omitted. The meta information database 60 may be omitted.

上記実施形態に係る処理手順(図4)において、各ステップの処理順序は適宜変更されてよい。例えば、ステップS101及びステップS102の検索語5に関する処理は、ステップS106の処理を実行する前までの任意のタイミングで実行されてよい。ステップS103~ステップS105の検索対象文章20の拡大に関する処理は、ステップS106の処理を実行する前までの任意のタイミングで実行されてよい。ステップS101及びステップS102の検索語5に関する処理は、ステップS103~ステップS105の検索対象文章20の拡大に関する処理と少なくとも部分的に並列に実行されてもよい。検索対象文章20は、ステップS103又はステップS104の処理を実行する前までの任意のタイミングで指定されてよい。 In the processing procedure (FIG. 4) according to the above embodiment, the order of processing of each step may be changed as appropriate. For example, the processing related to the search term 5 in steps S101 and S102 may be performed at any time before the processing of step S106 is performed. The processing related to the expansion of the search target sentence 20 in steps S103 to S105 may be performed at any time before the processing of step S106 is performed. The processing related to the search term 5 in steps S101 and S102 may be performed at least partially in parallel with the processing related to the expansion of the search target sentence 20 in steps S103 to S105. The search target sentence 20 may be specified at any time before the processing of step S103 or step S104 is performed.

[5 補足]
本開示において説明した処理及び手段は、技術的な矛盾が生じない限りにおいて、自由に組み合わせて実施することができる。
[5 Supplementary Information]
The processes and means described in the present disclosure can be freely combined as long as no technical contradiction occurs.

また、1つの装置が行うものとして説明した処理が、複数の装置によって分担して実行されてもよい。或いは、異なる装置が行うものとして説明した処理が、1つの装置によって実行されても構わない。コンピュータシステムにおいて、各機能をどのようなハードウェア構成によって実現するかは柔軟に変更可能である。 In addition, a process described as being performed by one device may be shared and executed by multiple devices. Or, a process described as being performed by different devices may be executed by a single device. In a computer system, the hardware configuration that realizes each function can be flexibly changed.

本開示は、上記の実施形態で説明した機能を実装したコンピュータプログラムをコンピュータに供給し、当該コンピュータが有する1つ以上のプロセッサがプログラムを読み出して実行することによっても実現可能である。このようなコンピュータプログラムは、コンピュータのシステムバスに接続可能な非一時的なコンピュータ可読記憶媒体によってコンピュータに提供されてもよいし、ネットワークを介してコンピュータに提供されてもよい。非一時的なコンピュータ可読記憶媒体は、例えば、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスクドライブ(HDD)等)、光ディスク(CD-ROM、DVDディスク、ブルーレイディスク等)など任意のタイプのディスク、読み込み専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁気カード、フラッシュメモリ、光学式カード、電子的命令を格納するために適した任意のタイプの媒体を含む。 The present disclosure can also be realized by supplying a computer program that implements the functions described in the above embodiments to a computer, and having one or more processors of the computer read and execute the program. Such a computer program may be provided to the computer by a non-transitory computer-readable storage medium that can be connected to the system bus of the computer, or may be provided to the computer via a network. Non-transitory computer-readable storage media include, for example, any type of disk, such as a magnetic disk (floppy disk, hard disk drive (HDD), etc.), an optical disk (CD-ROM, DVD disk, Blu-ray disk, etc.), a read-only memory (ROM), a random access memory (RAM), an EPROM, an EEPROM, a magnetic card, a flash memory, an optical card, or any type of medium suitable for storing electronic instructions.

1…情報処理装置、
11…制御部、12…記憶部、
13…入力装置、14…出力装置、15…ドライブ、
81…検索プログラム、91…記憶媒体、
111…ワード取得部、112…ワード拡張部、
113…構造取得部、114…構造特定部、
115…範囲拡張部、116…検索処理部、
117…出力部、
2…複数の文章、
20…検索対象文章、25…上位階層文章、
200…構造情報、
30…(検索対象文章に付与された)タグ情報、
35…(上位階層文章に付与された)タグ情報、
5…検索語、6…関連語、
60…メタ情報データベース
1... Information processing device,
11: control unit, 12: storage unit,
13...input device, 14...output device, 15...drive,
81...search program, 91...storage medium,
111...word acquisition unit, 112...word expansion unit,
113...Structure acquisition unit, 114...Structure identification unit,
115: range expansion unit, 116: search processing unit,
117...output unit,
2. Multiple sentences,
20...search target sentence, 25...upper-level sentence,
200...Structural information,
30...tag information (added to the search target text),
35...Tag information (assigned to upper-level documents),
5...search term, 6...related words,
60…Metadata database

Claims (1)

コンピュータにより実行される検索方法であって、
検索語を取得すること、
階層化された複数の文章であって、検索対象文章を含む複数の文章における階層関係を示す構造情報を取得すること、
取得された前記構造情報を参照することで、前記複数の文章の中から、前記検索対象文章の上位階層に位置する上位階層文章を特定すること、
特定された前記上位階層文章に付与されたタグ情報を取得すること、
前記検索対象文章及び前記上位階層文章のタグ情報において、取得された前記検索語と一致する語が存在するか否かを検索すること、及び
検索の結果に関する情報を出力すること、
を含む、
検索方法。
1. A computer-implemented search method, comprising:
Obtaining search terms;
Obtaining structural information indicating a hierarchical relationship among a plurality of hierarchically organized sentences including the search target sentence;
by referring to the acquired structure information, identifying, from among the plurality of sentences, a higher-level sentence that is located in a higher level than the sentence to be searched;
acquiring tag information assigned to the identified higher-level document;
searching for a word that matches the acquired search term in tag information of the search target sentence and the upper level sentence; and outputting information related to the search result.
Including,
How to search.
JP2022021746A 2022-02-16 2022-02-16 How to search Active JP7639730B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022021746A JP7639730B2 (en) 2022-02-16 2022-02-16 How to search

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022021746A JP7639730B2 (en) 2022-02-16 2022-02-16 How to search

Publications (2)

Publication Number Publication Date
JP2023119099A JP2023119099A (en) 2023-08-28
JP7639730B2 true JP7639730B2 (en) 2025-03-05

Family

ID=87763313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022021746A Active JP7639730B2 (en) 2022-02-16 2022-02-16 How to search

Country Status (1)

Country Link
JP (1) JP7639730B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20250041519A (en) * 2023-09-18 2025-03-25 네이버 주식회사 Method, computer device, and computer program to classify text into ad category using language model

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009288870A (en) 2008-05-27 2009-12-10 Nec Corp Document importance calculation system, and document importance calculation method and program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009288870A (en) 2008-05-27 2009-12-10 Nec Corp Document importance calculation system, and document importance calculation method and program

Also Published As

Publication number Publication date
JP2023119099A (en) 2023-08-28

Similar Documents

Publication Publication Date Title
US11853334B2 (en) Systems and methods for generating and using aggregated search indices and non-aggregated value storage
US8316007B2 (en) Automatically finding acronyms and synonyms in a corpus
CN107085583B (en) Electronic document management method and device based on content
US10936667B2 (en) Indication of search result
CN102103500B (en) Operation monitoring device
CN106909609B (en) Method for determining similar character strings, method and system for searching duplicate files
CN107844493B (en) File association method and system
CN109960721B (en) Constructing content based on multiple compression of source content
US10372718B2 (en) Systems and methods for enterprise data search and analysis
KR102682244B1 (en) Method for learning machine-learning model with structured ESG data using ESG auxiliary tool and service server for generating automatically completed ESG documents with the machine-learning model
CN104750776A (en) Accessing information content in a database platform using metadata
JP4237813B2 (en) Structured document management system
JP5324677B2 (en) Similar document search support device and similar document search support program
JP7639730B2 (en) How to search
US20110202535A1 (en) System and method for determining the provenance of a document
KR20230057114A (en) Method and apparatus for deriving keywords based on technical document database
JP7293780B2 (en) Information processing device, document management system and program
US20230326225A1 (en) System and method for machine learning document partitioning
JP5285491B2 (en) Information retrieval system, method and program, index creation system, method and program,
JP7279481B2 (en) Search processing program, search processing method and search processing device
JP6181890B2 (en) Literature analysis apparatus, literature analysis method and program
US20230409620A1 (en) Non-transitory computer-readable recording medium storing information processing program, information processing method, information processing device, and information processing system
JP5399988B2 (en) Important date expression determination method, important date expression determination device, important date expression determination program
JP5505207B2 (en) Information search apparatus, information search method, and information search program
JP2009003731A (en) Patent search system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240320

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250203

R150 Certificate of patent or registration of utility model

Ref document number: 7639730

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150