JP7639730B2 - How to search - Google Patents
How to search Download PDFInfo
- Publication number
- JP7639730B2 JP7639730B2 JP2022021746A JP2022021746A JP7639730B2 JP 7639730 B2 JP7639730 B2 JP 7639730B2 JP 2022021746 A JP2022021746 A JP 2022021746A JP 2022021746 A JP2022021746 A JP 2022021746A JP 7639730 B2 JP7639730 B2 JP 7639730B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- sentence
- word
- information
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本開示は、検索方法に関する。 This disclosure relates to a search method.
特許文献1には、各種資料の検索を行うためのワード処理装置が提案されている。具体的に、特許文献1で提案されるワード処理装置は、検索対象文書指定手段、単語抽出手段、未処理語選択手段、ワード作成手段、及び検索手段を備える。検索対象文書指定手段は、検索対象となる文書を指定する。単語抽出手段は、検索対象として指定された文書から所定の手法でそれぞれの単語を抽出する。未処理語選択手段は、単語抽出手段により抽出できなかった語としての未処理語の中から予め定めた語長以上の単語を選択する。ワード作成手段は、選択された未処理語を基にして、これを先頭から1文字ずつ削除した長さの複数のワードを作成する。検索手段は、作成されたワードを前方一致検索のワードとして使用する。
本開示の目的は、文章の検索性を高める技術を提供することである。 The purpose of this disclosure is to provide technology that improves the searchability of text.
本開示の一態様に係る検索方法は、コンピュータにより実行される検索方法であって、検索語を取得すること、階層化された複数の文章であって、検索対象文章を含む複数の文章における階層関係を示す構造情報を取得すること、取得された前記構造情報を参照することで、前記複数の文章の中から、前記検索対象文章の上位階層に位置する上位階層文章を特定すること、特定された前記上位階層文章に付与されたタグ情報を取得すること、前記検索対象文章及び前記上位階層文章のタグ情報において、取得された前記検索語と一致する語が存在するか否かを検索すること、及び検索の結果に関する情報を出力すること、を含む。 A search method according to one aspect of the present disclosure is a search method executed by a computer, and includes acquiring a search term, acquiring structural information indicating a hierarchical relationship among a plurality of hierarchical sentences including a search target sentence, identifying a higher-level sentence that is located in a higher level than the search target sentence from among the plurality of sentences by referring to the acquired structural information, acquiring tag information assigned to the identified higher-level sentence, searching for a word that matches the acquired search term in the tag information of the search target sentence and the higher-level sentence, and outputting information related to the search result.
本開示によれば、文章の検索性を高めることができる。 This disclosure can improve the searchability of text.
従来の検索方法では、検索対象となる文章(検索対象文章)内において、指定された検索語と一致する語が存在するか否かに応じて、検索対象文章を検索結果として抽出するか否かが決定される。すなわち、検索対象文章内に検索語と一致する語が含まれていなければ、検索対象文章は検索結果として抽出されない。そのため、所望の文章を抽出するためには、所望の文章に含まれている語を予想して検索語を指定することになる。したがって、従来の方法では、文章の検索性が高くない(すなわち、所望の文章を的確に抽出するのが難しい)という問題点があった。 In conventional search methods, whether or not to extract the search target sentence as a search result is determined depending on whether or not a word matching a specified search term is present in the sentence to be searched (search target sentence). In other words, if the search target sentence does not contain a word matching a search term, the search target sentence will not be extracted as a search result. Therefore, in order to extract a desired sentence, search terms are specified by predicting the words contained in the desired sentence. Therefore, conventional methods have the problem that the retrievability of sentences is not high (i.e., it is difficult to accurately extract a desired sentence).
これに対して、本開示の第1の態様に係る検索方法は、コンピュータにより実行される検索方法であって、検索語を取得すること、階層化された複数の文章であって、検索対象文章を含む複数の文章における階層関係を示す構造情報を取得すること、取得された前記構造情報を参照することで、前記複数の文章の中から、前記検索対象文章の上位階層に位置する上位階層文章を特定すること、特定された前記上位階層文章に付与されたタグ情報を取得すること、前記検索対象文章及び前記上位階層文章のタグ情報において、取得された前記検索語と一致する語が存在するか否かを検索すること、及び検索の結果に関する情報を出力すること、を含む。 In contrast, the search method according to the first aspect of the present disclosure is a search method executed by a computer, and includes obtaining a search term, obtaining structural information indicating a hierarchical relationship among a plurality of hierarchical sentences including the search target sentence, identifying a higher-level sentence that is located in a higher level than the search target sentence from among the plurality of sentences by referring to the obtained structural information, obtaining tag information assigned to the identified higher-level sentence, searching for a word that matches the obtained search term in the tag information of the search target sentence and the higher-level sentence, and outputting information related to the search result.
本開示の第1の態様では、検索対象文章及び上位階層文章のタグ情報において、検索語と一致する語が存在するか否かに応じて、検索対象文章を検索結果として抽出するか否かが判定される。すなわち、検索語と一致する語が存在するか否かを検索する範囲(検索語の照合範囲)が、検索対象文章のみではなく、検索対象文章の上位階層に位置する上位階層文章に付与されたタグ情報にまで拡張される。これにより、検索対象文章に検索語と一致する語が含まれていなくても、上位階層文章のタグ情報に検索語と一致する語が含まれていれば、検索対象文章を検索結果として抽出することができる。したがって、本開示の第1の態様によれば、対象の文章が検索条件に該当する可能性を高めることができる(つまり、再現性を高めることができる)。その結果、文章の検索性を高めることができる。 In the first aspect of the present disclosure, whether or not to extract the search target sentence as a search result is determined depending on whether or not there is a word matching the search term in the tag information of the search target sentence and the upper hierarchical sentence. In other words, the range for searching whether or not there is a word matching the search term (search term matching range) is expanded not only to the search target sentence but also to the tag information attached to the upper hierarchical sentence located in the upper hierarchical level of the search target sentence. As a result, even if the search target sentence does not contain a word matching the search term, if the tag information of the upper hierarchical sentence contains a word matching the search term, the search target sentence can be extracted as a search result. Therefore, according to the first aspect of the present disclosure, it is possible to increase the possibility that the target sentence meets the search criteria (i.e., it is possible to increase reproducibility). As a result, it is possible to increase the searchability of the sentence.
なお、本開示の第2の態様に係る検索方法は、上記第1の態様に係る検索方法であって、前記コンピュータが、前記検索対象文章に付与されたタグ情報を取得すること、を更に含んでよい。前記検索することは、前記検索対象文章、前記検索対象文章のタグ情報及び前記上位階層文章のタグ情報において、前記検索語と一致する語が存在するか否かを検索することにより構成されてよい。当該構成によれば、検索語の照合範囲を自身のタグ情報まで更に拡張することができる。そのため、文章の検索性を更に高めることができる。 The search method according to the second aspect of the present disclosure may be the search method according to the first aspect, further including the computer acquiring tag information assigned to the search target sentence. The searching may be performed by searching the search target sentence, the tag information of the search target sentence, and the tag information of the higher-level sentence to determine whether or not there is a word matching the search term. With this configuration, the matching range of the search term can be further expanded to the tag information of the sentence itself. This can further improve the searchability of the sentence.
本開示の第3の態様に係る検索方法は、上記第1又は第2の態様に係る検索方法であって、前記コンピュータが、前記検索語に関連する1つ以上の関連語を取得すること、を更に含んでよい。前記検索することは、取得された前記検索語又は取得された1つ以上の関連語の少なくともいずれかと一致する語が存在するか否かを検索することにより構成されてよい。当該構成では、検索対象文章及びタグ情報に含まれる語と照合する語が、検索語だけでなく、検索語に関連する関連語にまで拡張される。つまり、関連語を追加の検索語として使用するように検索条件を緩和することができる。その結果、検索語と一致する語が含まれていなくても、関連語と一致する語が含まれていれば、検索対象文章を検索結果として抽出することができる。したがって、当該構成によれば、検索語を網羅的に指定しなくても、所望の文章を抽出できる可能性を高めることができる。検索語を指定するのにかかる手間を省くと共に、文章の検索性を更に高めることができる。 The search method according to the third aspect of the present disclosure may further include the computer acquiring one or more related words related to the search term. The searching may be configured by searching for the presence or absence of a word that matches at least one of the acquired search term or the acquired one or more related words. In this configuration, the words to be matched with the words contained in the search target sentence and tag information are expanded to not only the search term but also related words related to the search term. In other words, the search conditions can be relaxed so that related words are used as additional search terms. As a result, even if the search target sentence does not contain a word that matches the search term, if it contains a word that matches the related word, it is possible to extract the search target sentence as a search result. Therefore, according to this configuration, it is possible to increase the possibility of extracting the desired sentence without comprehensively specifying search terms. This saves the effort required to specify search terms and further improves the searchability of sentences.
本開示の第4の態様に係る検索方法は、上記第3の態様に係る検索方法であって、前記
1つ以上の関連語は、前記検索語の同義語、類義語、上位概念語、及び下位概念語の少なくともいずれかを含んでよい。当該構成によれば、検索語に関連する関連語を適切に取得することができる。その結果、文章の検索精度(適合率)の向上を期待することができる。
A search method according to a fourth aspect of the present disclosure is the search method according to the third aspect, wherein the one or more related words may include at least one of a synonym, a similar word, a higher conceptual term, and a lower conceptual term of the search word. With this configuration, related words related to the search word can be appropriately acquired. As a result, an improvement in the search accuracy (match rate) of a sentence can be expected.
本開示の第5の態様に係る検索方法は、上記第3又は第4の態様に係る検索方法であって、前記1つ以上の関連語を取得することは、前記検索語のカテゴリを取得すること、及び取得された前記カテゴリに属する1つ以上の関連語を取得すること、により構成されてよい。当該構成によれば、関連語がカテゴリ分けされていることで、検索対象文章との関係で検索語と関連性の低い関連語が取得され難くすることができる。つまり、検索シーンにおいて、検索語と関連性の高い関連語を適切に取得することができる。その結果、文章の検索精度(適合率)の向上を期待することができる。 A search method according to a fifth aspect of the present disclosure is the search method according to the third or fourth aspect, and may be configured such that acquiring the one or more related words includes acquiring a category of the search term and acquiring one or more related words belonging to the acquired category. According to this configuration, since the related words are categorized, it is possible to make it difficult to acquire related words that are less relevant to the search term in relation to the text to be searched. In other words, in a search scene, it is possible to appropriately acquire related words that are highly relevant to the search term. As a result, it is possible to expect an improvement in the search accuracy (match rate) of texts.
以下、本開示の一側面に係る実施の形態(以下、「本実施形態」とも表記する)を、図面に基づいて説明する。ただし、以下で説明する本実施形態は、あらゆる点において本開示の例示に過ぎない。本開示の範囲を逸脱することなく種々の改良又は変形が行われてよい。本開示の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。 An embodiment according to one aspect of the present disclosure (hereinafter also referred to as "the present embodiment") will be described below with reference to the drawings. However, the present embodiment described below is merely an example of the present disclosure in all respects. Various improvements or modifications may be made without departing from the scope of the present disclosure. In implementing the present disclosure, a specific configuration according to the embodiment may be appropriately adopted. Note that while the data appearing in this embodiment is described in natural language, more specifically, it is specified in pseudo-language, commands, parameters, machine language, etc. that can be recognized by a computer.
[1 適用例]
図1は、本開示を適用した場面の一例を模式的に示す。本実施形態に係る情報処理装置1は、検索条件に該当する文章を抽出するための検索処理を実行するように構成された1台以上のコンピュータである。
[1 Application Examples]
1 is a schematic diagram illustrating an example of a situation in which the present disclosure is applied. An
本実施形態では、情報処理装置1は、検索語5を取得する。また、情報処理装置1は、階層化された複数の文章2であって、検索対象文章20を含む複数の文章2における階層関係を示す構造情報200を取得する。情報処理装置1は、取得された構造情報200を参照することで、複数の文章2の中から、検索対象文章20の上位階層に位置する上位階層文章25を特定する。情報処理装置1は、特定された上位階層文章25に付与されたタグ情報35を取得する。情報処理装置1は、検索対象文章20及び上位階層文章25のタグ情報35において、取得された検索語5と一致する語が存在するか否かを検索する。そして、情報処理装置1は、検索の結果に関する情報を出力する。
In this embodiment, the
以上のとおり、本実施形態では、検索語5の照合範囲が、検索対象文章20のみではなく、検索対象文章20の上位階層に位置する上位階層文章25に付与されたタグ情報35にまで拡張される。すなわち、本実施形態では、照合範囲が、検索対象文章20及びタグ情報35により構成される。これにより、検索対象文章20に検索語5と一致する語が含まれていなくても、上位階層文章25のタグ情報35に検索語5と一致する語が含まれていれば、検索対象文章20を検索結果として抽出することができる。そのため、本実施形態によれば、対象の文章が検索条件に該当する可能性を高めることができる。
As described above, in this embodiment, the matching range of the
加えて、文章に関連付けられるタグは、一般的に、その文章の属性、特徴等の情報を端的に示していることが多い。また、階層構造を有する文章では、階層の上位に位置する文章は、下位に位置する文章の要点、概要等を示していることが多い。そのため、上位階層文章25のタグ情報35には、階層構造において下位に位置する検索対象文章20と関連性が高く、かつ検索条件として使用されやすい語がタグとして含まれている可能性が高い。上位階層文章25そのものではなく、このタグ情報35を照合範囲に追加するようにすることで、照合範囲を拡張する量を抑えつつ、検索対象文章20が適切に抽出されやすく
することができる。したがって、本実施形態によれば、効率的に文章の検索性を高めることができる。
In addition, tags associated with a sentence generally often succinctly indicate information such as the attributes and characteristics of the sentence. Furthermore, in sentences having a hierarchical structure, sentences located at higher levels of the hierarchy often indicate the main points and summaries of sentences located at lower levels. Therefore, the
(複数の文章)
なお、複数の文章2は、階層構造を有していれば、その種類は、特に限定されなくてよく、実施の形態に応じて適宜選択されてよい。複数の文章2は、例えば、法規文書、仕様書等であってよい。複数の文章2は、1つ以上の文書の少なくとも一部から取得されてよい。一例では、文章は、検索により抽出される単位に対応してよい。階層構造は、例えば、章立て、箇条書き(条、項、号等)等により与えられてよい。構造情報200は、複数の文章2における階層構造を示すように構成されていれば、そのデータ形式は、特に限定されなくてよく、実施の形態に応じて適宜選択されてよい。
(multiple sentences)
In addition, as long as the
(検索対象文章)
検索対象文章20は、検索処理の対象となる文章である。検索対象文章20は、複数の文章2の中から任意に選択されてよい。一例では、検索対象文章20は、ユーザにより指定されてよい。検索の対象となる文書、範囲等が指定されることで、複数の検索対象文章20が取得されてもよい。複数の検索対象文章20が取得される場合、情報処理装置1は、検索対象文章20毎に、検索語5と一致する語が存在するか否かを検索する処理を実行してよい。他の一例では、複数の文章2内で、1つ以上の検索対象文章20が予め決定されていてもよい。全ての文章2それぞれが検索対象文章20として取り扱われてもよい。
(Text to search)
The
(照合範囲)
本実施形態では、情報処理装置1は、検索対象文章20自身に付与されたタグ情報30まで照合範囲を更に拡張してよい。すなわち、情報処理装置1は、検索対象文章20に付与されたタグ情報30を更に取得してよい。照合範囲は、検索対象文章20、検索対象文章20のタグ情報30、及び上位階層文章25のタグ情報35により構成されてよい。検索処理では、情報処理装置1は、検索対象文章20、検索対象文章20のタグ情報30、及び上位階層文章25のタグ情報35において、検索語5と一致する語が存在するか否かを検索してよい。これにより、文章の検索性を更に高めることができる。
(Matching range)
In this embodiment, the
上位階層文章25の数は任意であってよい。検索対象文章20の上位階層には、1つ以上の上位階層文章25が存在してよい。複数の上位階層文章25が存在する場合、一例では、情報処理装置1は、全ての上位階層文章25のタグ情報35を取得するように構成されてよい。他の一例では、情報処理装置1は、複数の上位階層文章25のうちの一部(例えば、階層の近いものから順に所定数)のタグ情報35を取得するように構成されてもよい。
The number of upper-
(タグ情報)
タグ情報(30、35)は、付与される文章(検索対象文章20、上位階層文章25)に関連付けられる1つ以上のタグにより構成される。タグは、関連付けられる文章の属性、特徴等の情報を示す語である。関連付けられる文章に含まれる語(例えば、単語、文字列等)がタグとして使用されてよい。一例では、タグは、人手により生成されてよい。他の一例では、タグは、コンピュータの情報処理により生成されてよい。
(Tag information)
The tag information (30, 35) is composed of one or more tags associated with the sentence to which it is assigned (
(検索処理)
検索処理では、情報処理装置1は、照合範囲に検索語5と一致する語が存在するか否かに応じて、検索対象文章20を抽出するか否かを判定する。照合範囲に検索語5と一致する語が存在している場合、情報処理装置1は、検索対象文章20を検索結果(すなわち、検索条件に該当する文章)として抽出する。他方、照合範囲に検索語5と一致する語が存在していない場合、情報処理装置1は、検索対象文章20を抽出しない。
(Search process)
In the search process, the
(検索語)
典型的には、検索語5は、ユーザ入力により指定されてよい。ただし、検索語5を指定する方法は、このような例に限定されなくてよく、実施の形態に応じて適宜決定されてよい。他の一例では、任意の文章中において任意の語が選択されてよく、選択された語が検索語5として使用されてよい。すなわち、任意の文章中の語の選択により検索語5が指定されてよい。
(Search term)
Typically, the
検索語5の数は、任意であってよい。複数の検索語5が取得されてもよい。この場合、各検索語5は、論理和(OR)検索の条件として指定されてもよいし、或いは論理積(AND)検索の条件として指定されてもよい。複数の検索語5のうちの一部が論理和検索の条件として指定され、残りが論理積検索の条件として指定されてもよい。
The number of
(検索条件の拡張)
本実施形態では、情報処理装置1は、検索語5に関連する関連語6を追加の検索語として使用するように構成されてよい。すなわち、情報処理装置1は、検索語5に関連する1つ以上の関連語6を更に取得してよい。検索処理では、情報処理装置1は、取得された検索語5又は1つ以上の関連語6の少なくともいずれかと一致する語が照合範囲に存在するか否かを検索してよい。
(Expanding search criteria)
In this embodiment, the
このように、関連語6を追加の検索語として使用することで、検索条件を拡張することができる。その結果、検索語5と一致する語が含まれていなくても、関連語6と一致する語が含まれていれば、検索対象文章20を検索結果として抽出することができる。したがって、検索語5を網羅的に指定しなくても、所望の文章を抽出しやすくすることができる。これにより、検索語5を指定するのにかかる手間を省くと共に、文章の検索性を更に高めることができる。
In this way, by using
なお、一例では、関連語6は、論理和検索の条件として使用されてよい。ただし、関連語6の使用形態は、このような例に限定されなくてよい。他の一例では、複数の関連語6が存在する場合、複数の関連語6の少なくとも一部が論理積検索の条件として使用されてもよい。複数の検索語5が指定されている場合、情報処理装置1は、複数の検索語5の少なくとも一部に対して1つ以上の関連語6を取得してよい。
In one example, the
本実施形態では、各語の関連語は、メタ情報データベース60に蓄積されていてよい。メタ情報データベース60は、指定された語(対象語)の関連語を取得可能に構成されていれば、その形式は、特に限定されなくてよく、実施の形態に応じて適宜決定されてよい。情報処理装置1は、検索語5をクエリとして使用して、メタ情報データベース60にアクセスすることで、検索語5に対する1つ以上の関連語6を取得してよい。
In this embodiment, the related words for each word may be stored in a meta-
(関連語)
1つ以上の関連語6は、検索語5の同義語、類義語、上位概念語(上位語)、及び下位概念語(下位語)の少なくともいずれかを含んでよい。上位概念語は、対象の語を含む総括的な概念(上位概念)を表す語である。例えば、対象の語がCNG(Compressed Natural Gas)である場合、上位概念語は、燃料であってよい。下位概念語は、対象の語に含まれる具体的な概念(下位概念)を表す語である。例えば、対象の語が燃料である場合、下位概念語は、CNGであってよい。
(Related words)
The one or more
これにより、検索語5に関連する関連語6を適切に取得することができる。その結果、文章の検索精度の向上を期待することができる。なお、関連語6は、同義語、類義語、上位概念語、及び下位概念語の少なくともいずれかに限られなくてもよい。他の一例では、
対象の語が検索語5として指定された際に、追加の検索語として使用されることが望まれる任意の語が、対象の語の関連語として設定されてよい。
This makes it possible to appropriately obtain
When a target word is specified as a
(カテゴリ分け)
同一の表記で異なる意味を表す語が存在する(特に、略語)。また、使用する場面によって、対象の語により表現される意味が変わる可能性がある。これらに対応するため、関連語6は、カテゴリ分けされていてよい。1つ以上の関連語6を取得することは、検索語5のカテゴリを取得すること、及び取得されたカテゴリに属する1つ以上の関連語6を取得すること、により構成されてよい。これにより、検索シーンにおいて、検索語5と関連性の高い関連語6を適切に取得することができる。その結果、文章の検索精度の向上を期待することができる。
(Categorization)
There are words (particularly abbreviations) that have the same notation but have different meanings. In addition, the meaning expressed by the target word may change depending on the situation in which it is used. To deal with this, the
なお、カテゴリを指定する方法は、特に限定されなくてよく、実施の形態に応じて適宜決定されてよい。一例では、カテゴリは、ユーザにより指定されてよい。他の一例では検索対象となる文書(複数の文章2)にカテゴリが関連付けられていてもよい。この場合、対象の文書が検索対象に指定されることで、指定された文書に関連付けられたカテゴリが検索語5のカテゴリとして取得されてよい。
The method of specifying the category is not particularly limited and may be determined appropriately depending on the embodiment. In one example, the category may be specified by the user. In another example, the category may be associated with the document (plurality of sentences 2) to be searched. In this case, the target document is specified as the search target, and the category associated with the specified document may be obtained as the category of the
指定可能なカテゴリには、全てのカテゴリに属することを示す共通カテゴリ(後述する図5の「全カテゴリ共通」)が含まれていてよい。共通カテゴリが存在する場合、取得されたカテゴリに属する1つ以上の関連語6を取得することは、検索語5のカテゴリ及び共通カテゴリの少なくともいずれかに属する1つ以上の関連語6を取得することにより構成されてよい。
The categories that can be specified may include a common category ("Common to all categories" in FIG. 5 described later) indicating that the category belongs to all categories. When a common category exists, obtaining one or more
本実施形態では、関連語6は、メタ情報データベース60において、カテゴリ分けされた上で蓄積されてよい。メタ情報データベース60は、指定された語及びカテゴリに応じて関連語6を取得可能に適宜構成されてよい。
In this embodiment, the
[2 構成例]
[ハードウェア構成例]
図2は、本実施形態に係る情報処理装置1のハードウェア構成の一例を模式的に示す。図2に示されるとおり、本実施形態に係る情報処理装置1は、制御部11、記憶部12、入力装置13、出力装置14、及びドライブ15が電気的に接続されたコンピュータである。
[2 Configuration Example]
[Hardware configuration example]
Fig. 2 is a schematic diagram showing an example of a hardware configuration of the
制御部11は、ハードウェアプロセッサであるCPU(Central Processing Unit)、
RAM(Random Access Memory)、ROM(Read Only Memory)等を含み、プログラム及び各種データに基づいて情報処理を実行するように構成される。制御部11(CPU)は、プロセッサ・リソースの一例である。
The
The
記憶部12は、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。記憶部12は、メモリ・リソースの一例である。本実施形態では、記憶部12は、検索プログラム81、複数の文章2、構造情報200、メタ情報データベース60等の各種情報を記憶する。
The
検索プログラム81は、検索条件に該当する文章を抽出するための検索処理(後述の図4)を情報処理装置1に実行させるためのプログラムである。検索プログラム81は、当該情報処理の一連の命令を含む。
The
入力装置13は、例えば、マウス、キーボード等の入力を行うための装置である。出力
装置14は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。ユーザは、入力装置13及び出力装置14を利用することで、情報処理装置1を操作することができる。入力装置13及び出力装置14は、例えば、タッチパネルディスプレイ等により一体的に構成されてもよい。
The input device 13 is, for example, a device for inputting information such as a mouse or a keyboard. The
ドライブ15は、記憶媒体91に記憶されたプログラム等の各種情報を読み込むための装置である。上記検索プログラム81、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかは、記憶媒体91に記憶されていてもよい。この場合、情報処理装置1は、検索プログラム81、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかを記憶媒体91から取得してよい。記憶媒体91は、コンピュータその他装置、機械等が、記憶されたプログラム等の各種情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。
The
ここで、図2では、記憶媒体91の一例として、CD、DVD等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体91の種類は、ディスク型に限定される訳ではなく、ディスク型以外であってもよい。ディスク型以外の記憶媒体として、例えば、フラッシュメモリ等の半導体メモリを挙げることができる。ドライブ15の種類は、記憶媒体91の種類に応じて適宜選択されてよい。
In FIG. 2, a disk-type storage medium such as a CD or DVD is illustrated as an example of the
なお、情報処理装置1の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部11は、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、FPGA(field-programmable gate array)、GPU(Graphics Processing Unit)等で構
成されてよい。入力装置13、出力装置14、及びドライブ15の少なくともいずれかは省略されてよい。
In addition, with regard to the specific hardware configuration of the
情報処理装置1は、他のコンピュータとデータ通信を行うための通信モジュールを更に備えてよい。通信モジュールは、例えば、有線LAN(Local Area Network)モジュール、無線LANモジュール等である。この場合、情報処理装置1は、通信モジュールを使用して、他のコンピュータとデータ通信を実行してよい。例えば、情報処理装置1は、他のコンピュータから検索語5を含むクエリを受け付け、受け付けたクエリに応じて検索処理を実行し、検索結果を他のコンピュータに返信してもよい。また、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかは、ネットワークサーバ等の他のコンピュータに保存されていてもよい。情報処理装置1は、他のコンピュータにアクセスすることで、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかを取得してよい。
The
情報処理装置1は、外部装置と接続するための外部インタフェースを更に備えてよい。外部インタフェースは、例えば、USB(Universal Serial Bus)ポート、専用ポート等である。この場合、情報処理装置1は、外部インタフェースを使用して、外部装置と接続されてよい。例えば、検索プログラム81、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかは、外部記憶装置に記憶されていてもよい。情報処理装置1は、外部インタフェースを介して外部記憶装置に接続してよい。情報処理装置1は、検索プログラム81、複数の文章2、構造情報200及びメタ情報データベース60の少なくともいずれかを外部記憶装置から取得してよい。
The
情報処理装置1は、複数台のコンピュータにより構成されてよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、或いは一致していなくてもよい。情報処理装置1は、提供されるサービス専用に設計されたコンピュータの他、汎用のサー
バ装置、汎用のPC(Personal Computer)、スマートフォンを含む携帯電話、タブレッ
トPC等であってよい。
The
[ソフトウェア構成例]
図3は、本実施形態に係る情報処理装置1のソフトウェア構成の一例を模式的に示す。情報処理装置1の制御部11は、記憶部12に記憶された検索プログラム81をRAMに展開し、RAMに展開された検索プログラム81に含まれる命令をCPUにより実行する。これにより、本実施形態に係る情報処理装置1は、ワード取得部111、ワード拡張部112、構造取得部113、構造特定部114、範囲拡張部115、検索処理部116及び出力部117をソフトウェアモジュールとして備えるコンピュータとして動作する。すなわち、本実施形態では、情報処理装置1の各ソフトウェアモジュールは、制御部11(CPU)により実現される。
[Software configuration example]
3 is a schematic diagram showing an example of a software configuration of the
ワード取得部111は、検索語5を取得するように構成される。ワード拡張部112は、検索語5に関連する1つ以上の関連語6を取得するように構成される。構造取得部113は、階層化された複数の文章2であって、検索対象文章20を含む複数の文章2における階層関係を示す構造情報200を取得するように構成される。構造特定部114は、取得された構造情報200を参照することで、複数の文章2の中から、検索対象文章20の上位階層に位置する上位階層文章25を特定するように構成される。範囲拡張部115は、特定された上位階層文章25に付与されたタグ情報35を取得するように構成される。本実施形態では、範囲拡張部115は、検索対象文章20に付与されたタグ情報30を取得するように更に構成されてよい。検索処理部116は、検索対象文章20及び上位階層文章25のタグ情報35において、取得された検索語5と一致する語が存在するか否かを検索するように構成される。本実施形態では、検索処理部116は、検索対象文章20、検索対象文章20のタグ情報30、及び上位階層文章25のタグ情報35において、検索語5又は1つ以上の関連語6の少なくともいずれかと一致する語が存在するか否かを検索するように構成されてよい。出力部117は、検索の結果に関する情報を出力するように構成される。
The
なお、本実施形態では、情報処理装置1の各ソフトウェアモジュールがいずれも汎用のCPUによって実現される例について説明している。しかしながら、上記ソフトウェアモジュールの一部又は全部が、1又は複数の専用のプロセッサにより実現されてもよい。上記各モジュールは、ハードウェアモジュールとして実現されてもよい。また、情報処理装置1のソフトウェア構成に関して、実施形態に応じて、適宜、モジュールの省略、置換及び追加が行われてもよい。
In this embodiment, an example is described in which each software module of the
[3 動作例]
図4は、本実施形態に係る情報処理装置1による文章検索に関する処理手順の一例を示すフローチャートである。以下で説明する処理手順は、本開示の一態様に係る検索方法(情報処理方法)の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。また、以下の処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が行われてよい。
[3 Operation example]
4 is a flowchart showing an example of a processing procedure for text search by the
(ステップS101)
ステップS101では、制御部11は、ワード取得部111として動作し、検索語5を取得する。検索語5を取得する形態は、実施の形態に応じて適宜選択されてよい。一例では、制御部11は、入力装置13を介したユーザの入力に応じて、検索語5を取得してよい。他の一例では、制御部11は、任意の文章中から検索語5を取得してよい。更に他の一例では、制御部11は、他のコンピュータから検索語5を取得してよい。検索語5を取得すると、制御部11は、次のステップS102に処理を進める。
(Step S101)
In step S101, the
(ステップS102)
ステップS102では、制御部11は、ワード拡張部112として動作し、検索語5に関連する1つ以上の関連語6を取得する。
(Step S102)
In step S<b>102 , the
関連語6を取得する方法は、実施の形態に応じて適宜決定されてよい。本実施形態では、1つ以上の関連語6は、検索語5の同義語、類義語、上位概念語、及び下位概念語の少なくともいずれかを含んでよい。また、関連語6は、カテゴリ分けされていてよい。この場合、制御部11は、検索語5のカテゴリを取得してよい。一例では、制御部11は、入力装置13を介したユーザの入力に応じてカテゴリを取得してよい。他の一例では、制御部11は、対象の文書が検索対象に指定されることで、指定された文書に関連付けられたカテゴリを検索語5のカテゴリとして取得してよい。更に他の一例では、制御部11は、他のコンピュータからカテゴリを取得してよい。カテゴリの取得は、ステップS102の処理を実行する前の任意のタイミングで実行されてよい。例えば、制御部11は、上記ステップS101の処理と並列にカテゴリを取得する処理を実行してよい。そして、制御部11は、取得されたカテゴリに属する1つ以上の関連語6を取得してよい。本実施形態では、制御部11は、検索語5をクエリとして使用することで、メタ情報データベース60から1つ以上の関連語6を取得することができる。
The method of acquiring the
図5は、本実施形態に係るメタ情報データベース60の一例を模式的に示す。図5に示されるメタ情報データベース60は、テーブル形式のデータ構造を有している。各レコード(行データ)は、対象語、カテゴリ、種類、及び関連語の各値を格納するフィールドを有している。対象語フィールドには、関連語を検索する対象となる語が格納される。カテゴリフィールドには、関連語の属するカテゴリが格納される。図5の一例では、「全カテゴリ共通」が、全てのカテゴリに属することを示す。種類フィールドには、関連語の種類(図5の一例では、同義語、類義語、上位概念語、又は下位概念語)を示す情報が格納される。関連語フィールドには、対象語に関連する関連語が格納される。図5に示されるとおり、対象語には、同一種類の複数の関連語が存在してよい。これに応じて、各レコードには、複数の関連語フィールドが設けられてよい(図5の「第1関連語」「第2関連語」)。
FIG. 5 is a schematic diagram showing an example of a meta-
制御部11は、取得された検索語5及びカテゴリをクエリとして使用して、メタ情報データベース60に対して関連語6の検索処理を実行してよい。検索処理の一例では、制御部11は、各レコードの対象語フィールド及びカテゴリフィールドを参照し、取得された検索語5及びカテゴリと同一の値が対象語フィールド及びカテゴリフィールドに格納されているレコードを抽出してよい。共通カテゴリが存在する場合、制御部11は、取得された検索語5と同一の値が対象語フィールドに格納されており、カテゴリフィールドに共通カテゴリを示す値が格納されているレコードも更に抽出してよい。そして、制御部11は、抽出されたレコードの関連語フィールドから関連語6を取得してよい。
The
関連語6が上位概念語を含む場合、制御部11は、検索語5の上位概念語を再帰的に取得してよい。すなわち、制御部11は、検索語5の上位概念語及びカテゴリをクエリとして使用して、メタ情報データベース60から上位概念語の関連語を検索語5の関連語6として更に取得してよい。制御部11は、最上位の上位概念語の関連語を取得するまで、関連語6の取得処理を再帰的に繰り返すことで、上位概念語及び上位概念語の関連語を検索語5の関連語6として取得してよい。関連語6が下位概念語を含む場合も同様であってよい。すなわち、制御部11は、検索語5の下位概念語及びカテゴリをクエリとして使用して、メタ情報データベース60から下位概念語の関連語を検索語5の関連語6として更に取得してよい。制御部11は、最下位の下位概念語の関連語を取得するまで、関連語6の取得処理を再帰的に繰り返すことで、下位概念語及び下位概念語の関連語を検索語5の関
連語6として取得してよい。
When the
なお、指定された検索語5に対応する関連語6を取得可能であれば、メタ情報データベース60のデータ構造は、図5に示される例に限定されなくてよく、実施の形態に応じて適宜決定されてよい。1つ以上の関連語6を取得すると、制御部11は、次のステップS103に処理を進める。
Note that, as long as it is possible to acquire
(ステップS103~ステップS105)
図4に戻り、ステップS103では、制御部11は、構造取得部113として動作し、構造情報200を取得する。構造情報200を取得すると、制御部11は、次のステップS104に処理を進める。
(Steps S103 to S105)
4, in step S103, the
ステップS104では、制御部11は、構造特定部114として動作し、取得された構造情報200を参照することで、複数の文章2の中から、検索対象文章20の上位階層に位置する上位階層文章25を特定する。複数の上位階層文章25が存在する場合、制御部11は、検索対象文章20から階層を上位の方向に遡り、複数の上位階層文章25のうちの少なくとも一部を特定してよい。
In step S104, the
なお、検索対象文章20は、複数の文章2の中から任意に選択されてよい。一例では、制御部11は、入力装置13を介したユーザの選択に応じて検索対象文章20を取得してよい。他の一例では、制御部11は、検索の対象に指定された複数の文章2の中から任意の方法で検索対象文章20を取得してよい。検索の対象となる複数の文章2は、ステップS103の処理を実行する前までの任意のタイミングで指定されてよい。検索対象文章20は、ステップS104の処理を実行する前までの任意のタイミングで選択されてよい。上位階層文章25を特定すると、制御部11は、次のステップS105に処理を進める。
The
ステップS105では、制御部11は、範囲拡張部115として動作し、特定された上位階層文章25に付与されたタグ情報35を取得する。本実施形態では、制御部11は、検索対象文章20に付与されたタグ情報30を更に取得してよい。複数の上位階層文章25が存在する場合、制御部11は、複数の上位階層文章25のうちの少なくとも一部のタグ情報35を取得してよい。一例では、制御部11は、検索対象文章20から最上位の上位階層文章25まで1階層ずつ遡り、各階層の上位階層文章25のタグ情報35を取得してよい。これにより、制御部11は、検索対象文章20の照合範囲を拡張する。
In step S105, the
図6は、本実施形態に係る構造情報200及び階層化された文章の一例を模式的に示す。図7は、図6で示される各文章に対して上位階層文章のタグ情報を取得する処理を実行した後の各文章の照合範囲の一例を模式的に示す。なお、図6及び図7の一例では、説明の便宜上、構造情報200、各文章、及びタグ情報をテーブル形式で表現している。ただし、構造情報200、各文章、及びタグ情報のデータ形式は、このような例に限定されなくてよく、実施の形態に応じて適宜決定されてよい。
Figure 6 shows a schematic example of
図6の一例では、各文章が、章立てにより3階層に分けられている場面を想定している。「別添42」の文章が最上位であり、「別添42 I」が中位であり、「別添42 I
1.」が最下位である。「別添42」の文章には、図6の「第1階層のタグ情報」が付与されている。「別添42 I」の文章には、「第2階層のタグ情報」が付与されている。
「別添42 I 1.」の文章には、「第3階層のタグ情報」が付与されている。「別添42 I」の文章を検索対象文章20とした場合、上位階層文章25は、「別添42」の文
章である。「別添42 I 1.」の文章を検索対象文章20とした場合、上位階層文章25は、「別添42 I」の文章及び「別添42」の文章である。
In the example of FIG. 6, it is assumed that each document is divided into three hierarchical levels by chapter. The document "Attachment 42" is the top level, "Attachment 42 I" is the middle level, and "Attachment 42 I" is the second level.
"1." is at the lowest level. The text of "Attachment 42" is given the "first hierarchical tag information" in FIG. 6. The text of "Attachment 42 I" is given the "second hierarchical tag information."
The sentence "Attachment 42
図7に示されるとおり、制御部11は、「別添42 I」の文章に対して「別添42 I」の文章及び「別添42」の文章のタグ情報を取得してよい。これにより、制御部11は、「別添42 I」の文章の照合範囲を、「別添42 I」の文章、「別添42」のタグ情報、及び「別添42 I」のタグ情報に拡張してよい。また、制御部11は、「別添42 I 1.」の文章に対して「別添42 I 1.」の文章、「別添42 I」の文章、及び「別添42」の文章のタグ情報を取得してよい。これにより、制御部11は、「別添42
I 1.」の文章の照合範囲を、「別添42 I 1.」の文章、「別添42」のタグ情報
、「別添42 I」のタグ情報、及び「別添42 I 1.」のタグ情報に拡張してよい。
図7では、「別添42 I 1.」の文章の照合範囲が太枠線で示されている。タグ情報(30、35)を取得すると、制御部11は、次のステップS106に処理を進める。
As shown in Fig. 7, the
The matching range of the sentence "Attachment 42
7, the range of matching for the text "Attachment 42
(ステップS106)
ステップS106では、制御部11は、検索対象文章20及び上位階層文章25のタグ情報35において、取得された検索語5と一致する語が存在するか否かを検索する。本実施形態では、制御部11は、検索対象文章20、検索対象文章20のタグ情報30、及び上位階層文章25のタグ情報35において、検索語5又は1つ以上の関連語6の少なくともいずれかと一致する語が存在するか否かを検索してよい。
(Step S106)
In step S106, the
検索語5及び関連語6を論理和検索の条件として使用する場合、検索処理において、制御部11は、検索対象文章20の照合範囲に検索語5又は関連語6と一致する語が存在するか否かを判定する。照合範囲に検索語5又は関連語6と一致する語が存在する場合、制御部11は、検索対象文章20を検索結果として抽出する。他方、照合範囲に検索語5又は関連語6と一致する語が存在しない場合、制御部11は、検索対象文章20を抽出しない。
When the
複数の検索対象文章20が存在する場合、制御部11は、各検索対象文章20に対して少なくともステップS104~ステップS106の処理を実行してよい。例えば、制御部11は、処理対象となる検索対象文章を複数の検索対象文章20から選択してよい。制御部11は、選択された検索対象文章に対してステップS104~ステップS106の処理を実行してよい。選択方法は任意に設定されてよい(例えば、選択する順序が予め規定されていてよい)。全ての検索対象文章20に対してステップS104~ステップS106の処理が完了するまで、制御部11は、これらの一連の情報処理を繰り返し実行してよい。なお、ステップS103の処理は、適宜実行されてよい。一例では、全ての検索対象文章20に対して一度にステップS103の処理が実行されてもよい。他の一例では、検索対象文章20毎にステップS103の処理が実行されてもよい。
When there are multiple
具体例として、図5~図7の各種情報が与えられ、ステップS101の処理において、2つの検索語5「測定方法」及び「燃料」が論理積条件として取得されたと想定する。また、「排ガス法規」がカテゴリとして取得されたと想定する。この場合、ステップS102において、制御部11は、メタ情報データベース60を参照して、「測定方法」及び「燃料」の関連語6を取得してよい。図5の例では、「測定方法」を対象語フィールドに格納するレコードは存在しないため、「測定方法」の関連語6は得られない。一方、「燃料」を対象語フィールドに格納するレコードは存在する。制御部11は、カテゴリとして「排ガス法規」が指定されている条件下で下位概念語を再帰的に取得することで、「CNG」、「圧縮天然ガス」、「天然ガス」、「LPG」及び「液化石油ガス」を「燃料」の関連語6として取得することができる。これらの関連語6は、論理和条件として使用されることを想定する。
As a specific example, assume that various information in Figs. 5 to 7 is given, and that in the process of step S101, two
図7に示されるとおり、検索対象文章20が「別添42 I 1.」の文章である場合、制御部11は、ステップS103~ステップS105の処理により、「別添42」のタグ
情報、「別添42 I」のタグ情報、及び「別添42 I 1.」のタグ情報を取得してよ
い。ステップS106の処理では、制御部11は、「別添42 I 1.」の文章、「別添42」のタグ情報、「別添42 I」のタグ情報、及び「別添42 I 1.」のタグ情報
において、上記検索語5又は関連語6と一致する語が存在するか否かを検索してよい。「別添42」のタグ情報に「測定方法」が存在する。「別添42 I 1.」の文章及びタグ情報に、「燃料」、「CNG」、「圧縮天然ガス」、「天然ガス」、「LPG」及び「液化石油ガス」が存在する。そのため、制御部11は、「測定方法」及び「燃料」の検索条件に該当する文章として、「別添42 I 1.」の文章を抽出することができる。検索処理が完了すると、制御部11は、次のステップS107に処理を進める。
7, when the
(ステップS107)
ステップS107では、制御部11は、出力部117として動作し、検索の結果に関する情報を出力する。
(Step S107)
In step S107, the
出力先及び出力処理の内容は、実施の形態に応じて適宜決定されてよい。出力先は、例えば、RAM、記憶部12、出力装置14、記憶媒体91、外部記憶装置、他のコンピュータ等から選択されてよい。一例では、制御部11は、検索結果として抽出された文章の一覧を出力装置14(例えば、ディスプレイ)に出力してよい。この場合、制御部11は、抽出された文章と共に、検索条件として使用された検索語5及び関連語6を表示してよい。加えて、制御部11は、抽出された文章中において、使用された検索語5及び関連語6の位置を明示してよい。他の一例では、制御部11は、検索結果を他のコンピュータに送信してよい。他のコンピュータでは、任意の方法(例えば、上記と同様の方法)で検索結果が表示されてよい。
The output destination and the contents of the output process may be appropriately determined according to the embodiment. The output destination may be selected from, for example, RAM, the
情報の出力が完了すると、制御部11は、本動作例に係る情報処理装置1の処理手順を終了する。なお、制御部11は、ステップS101~ステップS107の処理を繰り返し実行してよい。処理を繰り返すタイミングは、実施の形態に応じて適宜決定されてよい。これにより、情報処理装置1は、検索語5に該当する文章の検索処理を繰り返し実行してよい。
When the output of the information is completed, the
(特徴)
本実施形態では、ステップS103~ステップS105の処理により、検索語5の照合範囲が、検索対象文章20のみではなく、検索対象文章20のタグ情報30及び上位階層文章25のタグ情報35まで拡張される。これにより、ステップS106の処理において、検索対象文章20に検索語5と一致する語が含まれていなくても、タグ情報(30、35)に検索語5と一致する語が含まれていれば、検索対象文章20を検索結果として抽出することができる。例えば、上記の具体例において、「測定方法」は、「別添42 I 1.」の文章には含まれていないが、「別添42」のタグ情報に含まれている。そのため、「別添42 I 1.」の文章を検索結果として抽出することができる。加えて、本実施形態では、上位階層文章25そのものではなく、このタグ情報35を照合範囲に追加する。これにより、照合範囲を拡張する量を抑えつつ、検索対象文章20が適切に抽出されやすくすることができる。したがって、本実施形態によれば、効率的に文章の検索性を高めることができる。
(Features)
In this embodiment, the process of steps S103 to S105 expands the matching range of the
[4 変形例]
以上、本開示の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本開示の例示に過ぎない。本開示の範囲を逸脱することなく種々の改良又は変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。以下の変形例は適宜組み合わせ可能である。
[4 Modifications]
Although the embodiment of the present disclosure has been described in detail above, the above description is merely an example of the present disclosure in every respect. It goes without saying that various improvements or modifications can be made without departing from the scope of the present disclosure. For example, the following modifications are possible. The following modifications can be combined as appropriate.
上記実施形態において、制御部11は、検索対象文章20に付与されたタグ情報30を取得する処理を省略してよい。
In the above embodiment, the
上記実施形態において、関連語6は、カテゴリ分けされていなくてよい。この場合、上記処理手順において、カテゴリに関する各処理が省略されてよい。メタ情報データベース60の各レコードからカテゴリのフィールドが省略されてよい。
In the above embodiment, the
上記実施形態において、関連語6を取得する処理は省略されてよい。この場合、情報処理装置1のソフトウェア構成からワード拡張部112が省略されてよい。上記処理手順において、ステップS102の処理は省略されてよい。メタ情報データベース60は省略されてよい。
In the above embodiment, the process of acquiring
上記実施形態に係る処理手順(図4)において、各ステップの処理順序は適宜変更されてよい。例えば、ステップS101及びステップS102の検索語5に関する処理は、ステップS106の処理を実行する前までの任意のタイミングで実行されてよい。ステップS103~ステップS105の検索対象文章20の拡大に関する処理は、ステップS106の処理を実行する前までの任意のタイミングで実行されてよい。ステップS101及びステップS102の検索語5に関する処理は、ステップS103~ステップS105の検索対象文章20の拡大に関する処理と少なくとも部分的に並列に実行されてもよい。検索対象文章20は、ステップS103又はステップS104の処理を実行する前までの任意のタイミングで指定されてよい。
In the processing procedure (FIG. 4) according to the above embodiment, the order of processing of each step may be changed as appropriate. For example, the processing related to the
[5 補足]
本開示において説明した処理及び手段は、技術的な矛盾が生じない限りにおいて、自由に組み合わせて実施することができる。
[5 Supplementary Information]
The processes and means described in the present disclosure can be freely combined as long as no technical contradiction occurs.
また、1つの装置が行うものとして説明した処理が、複数の装置によって分担して実行されてもよい。或いは、異なる装置が行うものとして説明した処理が、1つの装置によって実行されても構わない。コンピュータシステムにおいて、各機能をどのようなハードウェア構成によって実現するかは柔軟に変更可能である。 In addition, a process described as being performed by one device may be shared and executed by multiple devices. Or, a process described as being performed by different devices may be executed by a single device. In a computer system, the hardware configuration that realizes each function can be flexibly changed.
本開示は、上記の実施形態で説明した機能を実装したコンピュータプログラムをコンピュータに供給し、当該コンピュータが有する1つ以上のプロセッサがプログラムを読み出して実行することによっても実現可能である。このようなコンピュータプログラムは、コンピュータのシステムバスに接続可能な非一時的なコンピュータ可読記憶媒体によってコンピュータに提供されてもよいし、ネットワークを介してコンピュータに提供されてもよい。非一時的なコンピュータ可読記憶媒体は、例えば、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスクドライブ(HDD)等)、光ディスク(CD-ROM、DVDディスク、ブルーレイディスク等)など任意のタイプのディスク、読み込み専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁気カード、フラッシュメモリ、光学式カード、電子的命令を格納するために適した任意のタイプの媒体を含む。 The present disclosure can also be realized by supplying a computer program that implements the functions described in the above embodiments to a computer, and having one or more processors of the computer read and execute the program. Such a computer program may be provided to the computer by a non-transitory computer-readable storage medium that can be connected to the system bus of the computer, or may be provided to the computer via a network. Non-transitory computer-readable storage media include, for example, any type of disk, such as a magnetic disk (floppy disk, hard disk drive (HDD), etc.), an optical disk (CD-ROM, DVD disk, Blu-ray disk, etc.), a read-only memory (ROM), a random access memory (RAM), an EPROM, an EEPROM, a magnetic card, a flash memory, an optical card, or any type of medium suitable for storing electronic instructions.
1…情報処理装置、
11…制御部、12…記憶部、
13…入力装置、14…出力装置、15…ドライブ、
81…検索プログラム、91…記憶媒体、
111…ワード取得部、112…ワード拡張部、
113…構造取得部、114…構造特定部、
115…範囲拡張部、116…検索処理部、
117…出力部、
2…複数の文章、
20…検索対象文章、25…上位階層文章、
200…構造情報、
30…(検索対象文章に付与された)タグ情報、
35…(上位階層文章に付与された)タグ情報、
5…検索語、6…関連語、
60…メタ情報データベース
1... Information processing device,
11: control unit, 12: storage unit,
13...input device, 14...output device, 15...drive,
81...search program, 91...storage medium,
111...word acquisition unit, 112...word expansion unit,
113...Structure acquisition unit, 114...Structure identification unit,
115: range expansion unit, 116: search processing unit,
117...output unit,
2. Multiple sentences,
20...search target sentence, 25...upper-level sentence,
200...Structural information,
30...tag information (added to the search target text),
35...Tag information (assigned to upper-level documents),
5...search term, 6...related words,
60…Metadata database
Claims (1)
検索語を取得すること、
階層化された複数の文章であって、検索対象文章を含む複数の文章における階層関係を示す構造情報を取得すること、
取得された前記構造情報を参照することで、前記複数の文章の中から、前記検索対象文章の上位階層に位置する上位階層文章を特定すること、
特定された前記上位階層文章に付与されたタグ情報を取得すること、
前記検索対象文章及び前記上位階層文章のタグ情報において、取得された前記検索語と一致する語が存在するか否かを検索すること、及び
検索の結果に関する情報を出力すること、
を含む、
検索方法。 1. A computer-implemented search method, comprising:
Obtaining search terms;
Obtaining structural information indicating a hierarchical relationship among a plurality of hierarchically organized sentences including the search target sentence;
by referring to the acquired structure information, identifying, from among the plurality of sentences, a higher-level sentence that is located in a higher level than the sentence to be searched;
acquiring tag information assigned to the identified higher-level document;
searching for a word that matches the acquired search term in tag information of the search target sentence and the upper level sentence; and outputting information related to the search result.
Including,
How to search.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022021746A JP7639730B2 (en) | 2022-02-16 | 2022-02-16 | How to search |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022021746A JP7639730B2 (en) | 2022-02-16 | 2022-02-16 | How to search |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023119099A JP2023119099A (en) | 2023-08-28 |
| JP7639730B2 true JP7639730B2 (en) | 2025-03-05 |
Family
ID=87763313
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022021746A Active JP7639730B2 (en) | 2022-02-16 | 2022-02-16 | How to search |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7639730B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20250041519A (en) * | 2023-09-18 | 2025-03-25 | 네이버 주식회사 | Method, computer device, and computer program to classify text into ad category using language model |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009288870A (en) | 2008-05-27 | 2009-12-10 | Nec Corp | Document importance calculation system, and document importance calculation method and program |
-
2022
- 2022-02-16 JP JP2022021746A patent/JP7639730B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009288870A (en) | 2008-05-27 | 2009-12-10 | Nec Corp | Document importance calculation system, and document importance calculation method and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023119099A (en) | 2023-08-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11853334B2 (en) | Systems and methods for generating and using aggregated search indices and non-aggregated value storage | |
| US8316007B2 (en) | Automatically finding acronyms and synonyms in a corpus | |
| CN107085583B (en) | Electronic document management method and device based on content | |
| US10936667B2 (en) | Indication of search result | |
| CN102103500B (en) | Operation monitoring device | |
| CN106909609B (en) | Method for determining similar character strings, method and system for searching duplicate files | |
| CN107844493B (en) | File association method and system | |
| CN109960721B (en) | Constructing content based on multiple compression of source content | |
| US10372718B2 (en) | Systems and methods for enterprise data search and analysis | |
| KR102682244B1 (en) | Method for learning machine-learning model with structured ESG data using ESG auxiliary tool and service server for generating automatically completed ESG documents with the machine-learning model | |
| CN104750776A (en) | Accessing information content in a database platform using metadata | |
| JP4237813B2 (en) | Structured document management system | |
| JP5324677B2 (en) | Similar document search support device and similar document search support program | |
| JP7639730B2 (en) | How to search | |
| US20110202535A1 (en) | System and method for determining the provenance of a document | |
| KR20230057114A (en) | Method and apparatus for deriving keywords based on technical document database | |
| JP7293780B2 (en) | Information processing device, document management system and program | |
| US20230326225A1 (en) | System and method for machine learning document partitioning | |
| JP5285491B2 (en) | Information retrieval system, method and program, index creation system, method and program, | |
| JP7279481B2 (en) | Search processing program, search processing method and search processing device | |
| JP6181890B2 (en) | Literature analysis apparatus, literature analysis method and program | |
| US20230409620A1 (en) | Non-transitory computer-readable recording medium storing information processing program, information processing method, information processing device, and information processing system | |
| JP5399988B2 (en) | Important date expression determination method, important date expression determination device, important date expression determination program | |
| JP5505207B2 (en) | Information search apparatus, information search method, and information search program | |
| JP2009003731A (en) | Patent search system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240320 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250121 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250203 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7639730 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |