JP2007025756A - Search formula generation support device, program, and information retrieval system - Google Patents
Search formula generation support device, program, and information retrieval system Download PDFInfo
- Publication number
- JP2007025756A JP2007025756A JP2005202652A JP2005202652A JP2007025756A JP 2007025756 A JP2007025756 A JP 2007025756A JP 2005202652 A JP2005202652 A JP 2005202652A JP 2005202652 A JP2005202652 A JP 2005202652A JP 2007025756 A JP2007025756 A JP 2007025756A
- Authority
- JP
- Japan
- Prior art keywords
- search
- module
- information
- creation support
- formula
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 claims description 139
- 238000000605 extraction Methods 0.000 claims description 80
- 238000000034 method Methods 0.000 claims description 31
- 238000011156 evaluation Methods 0.000 claims description 16
- 238000003860 storage Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 4
- 238000012790 confirmation Methods 0.000 description 53
- 101000581326 Homo sapiens Mediator of DNA damage checkpoint protein 1 Proteins 0.000 description 13
- 102100027643 Mediator of DNA damage checkpoint protein 1 Human genes 0.000 description 13
- 230000008569 process Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 102100022825 Disintegrin and metalloproteinase domain-containing protein 22 Human genes 0.000 description 6
- 101000756722 Homo sapiens Disintegrin and metalloproteinase domain-containing protein 22 Proteins 0.000 description 6
- 238000003825 pressing Methods 0.000 description 6
- 102100022818 Disintegrin and metalloproteinase domain-containing protein 23 Human genes 0.000 description 5
- 101000756727 Homo sapiens Disintegrin and metalloproteinase domain-containing protein 23 Proteins 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000000016 photochemical curing Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000001723 curing Methods 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 102100022440 Battenin Human genes 0.000 description 1
- 101000901683 Homo sapiens Battenin Proteins 0.000 description 1
- 101000984929 Homo sapiens Butyrophilin subfamily 1 member A1 Proteins 0.000 description 1
- 238000012369 In process control Methods 0.000 description 1
- 101100437920 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) BTN2 gene Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 210000004544 dc2 Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000004190 ion pair chromatography Methods 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報の検索のための検索式の作成を支援する検索式作成支援装置に関する。 The present invention relates to a search formula creation support apparatus that supports creation of a search formula for searching for information.
従来より、情報の検索の手法として、キーワードを演算子で結合した検索式を用いて検索を行うブーリアン検索が知られている。 Conventionally, as a method for searching for information, a Boolean search for performing a search using a search expression in which keywords are combined with an operator is known.
このブーリアン検索において適切な検索集合を得るためには、適切な検索式を作成する必要があるが、適切な検索式の作成には高度のスキルが要求されるので、適切な検索式の作成を支援するための技術が検討されている。 In order to obtain an appropriate search set in this Boolean search, it is necessary to create an appropriate search expression, but since a high level of skill is required to create an appropriate search expression, it is necessary to create an appropriate search expression. Technologies to assist are being considered.
例えば、特許文献1は、過去の経験を反映した検索式の資産を格納しておき、必要に応じて再利用する技術を開示している。
For example,
特許文献1に開示された発明では、特許データベースと対を成すような形式でコメントデータベースが備えられており、該コメントデータベースは過去の検索情報として、検索時に使用した検索条件、検索者名、検索者が入力したコメントなどを格納している。特許文献1に記載された発明では、新たに検索を行おうとする者は、コメントデータベースに格納された検索条件や検索者が入力したコメントを参照して、検索式の再利用を行うことが可能になる。
In the invention disclosed in
しかし、検索を行うために使用された検索式は、所望する検索結果を得るために検索条件数が多い巨大な検索式となるのが普通である。過去の検索結果に類似した技術内容に関する検索を行うために格納しておいた検索式を再利用しようとしても、そのままの形では検索式を再利用することはできないため検索式を構成する検索条件の一部を変更しなければならないが、検索式が巨大なため検索条件の変更が困難であったり、あるいは検索条件の一部を変更したことにより最適な検索結果を得ることができなくなったという問題が生じ、結果として検索式の資産を格納していても、再利用されることなく死蔵されてしまうことも多かった。 However, the search formula used for performing the search is usually a huge search formula having a large number of search conditions in order to obtain a desired search result. Search conditions that make up a search expression, even if you try to reuse a stored search expression to search for technical content similar to past search results, the search expression cannot be reused as is However, it is difficult to change the search conditions due to the huge search expression, or the search results cannot be obtained optimally because some of the search conditions are changed. There were problems, and as a result, even if the search-type assets were stored, they were often stored without being reused.
本発明は、この問題を解決するためになされたもので、検索式の資産の再利用を容易にする検索式作成支援装置、検索式作成支援プログラム及び情報検索システムを提供することを目的とする。 The present invention has been made to solve this problem, and an object of the present invention is to provide a search formula creation support device, a search formula creation support program, and an information search system that facilitate the reuse of search formula assets. .
請求項1の発明は、情報の検索のための検索式の作成を支援する検索式作成支援装置であって、検索式資産と前記検索式資産の組み合わせの基礎となる第1情報とを関連付けた、検索式資産の管理の単位であるモジュールを記憶する記憶手段と、前記検索式の生成の基礎となるモジュールを、前記記憶手段に記憶された複数のモジュールの中から抽出する抽出手段と、前記抽出手段により抽出されたモジュールの集合である抽出モジュール群に含まれる前記第1情報に基づいて、前記抽出モジュール群に含まれる前記検索式資産を組み合わせることにより、前記検索式を生成する生成手段とを備える。
The invention of
請求項2の発明は、請求項1に記載の検索式作成支援装置において、前記第1情報に、所定の分類基準によるモジュールの分類情報が含まれており、前記生成手段は、前記分類情報に基づいて前記検索式資産を組み合わせる。 According to a second aspect of the present invention, in the retrieval formula creation support apparatus according to the first aspect, the first information includes module classification information based on a predetermined classification criterion, and the generation means includes the classification information. The searchable assets are combined based on the above.
請求項3の発明は、請求項1又は請求項2に記載の検索式作成支援装置において、前記第1情報に、モジュール間の関係を定義する関係情報が含まれており、前記生成手段は、前記関係情報に基づいて前記検索式資産を組み合わせる。 According to a third aspect of the present invention, in the retrieval formula creation support device according to the first or second aspect, the first information includes relationship information that defines a relationship between modules, and the generation unit includes: The searchable assets are combined based on the relationship information.
請求項4の発明は、請求項3に記載の検索式作成支援装置において、前記関係情報が、前記検索式資産を用いた検索により得られる検索集合の包含関係を反映した、モジュール間の階層関係の情報である。 According to a fourth aspect of the present invention, in the retrieval formula creation support apparatus according to the third aspect, the relationship between the modules reflects the inclusion relationship of the retrieval set obtained by retrieval using the retrieval formula asset. Information.
請求項5の発明は、請求項1ないし請求項4のいずれかに記載の検索式作成支援装置において、前記モジュールにおいては、前記検索式資産と前記検索式資産の抽出の基礎となる第2情報とが関連付けられており、前記抽出手段は、新たに検索を行う際に与えられる入力情報に対応した前記第2情報を有するモジュールを抽出する。 According to a fifth aspect of the present invention, in the retrieval formula creation support apparatus according to any one of the first to fourth aspects, in the module, the second information serving as a basis for extracting the retrieval formula asset and the retrieval formula asset. And the extraction means extracts a module having the second information corresponding to the input information given when a new search is performed.
請求項6の発明は、請求項5に記載の検索式作成支援装置において、前記第2情報に、前記入力情報との比較対象となる比較対象キーワードが含まれており、前記抽出手段は、前記入力情報に含まれるキーワードと前記比較対象キーワードとの比較結果に基づいてモジュールを抽出する。 A sixth aspect of the present invention is the retrieval formula creation support device according to the fifth aspect, wherein the second information includes a comparison target keyword to be compared with the input information, and the extraction unit includes the extraction unit, A module is extracted based on a comparison result between the keyword included in the input information and the comparison target keyword.
請求項7の発明は、請求項6に記載の検索式作成支援装置において、前記入力情報として自然文で入力された文章から前記キーワードを抽出するキーワード抽出手段をさらに備える。 A seventh aspect of the present invention is the retrieval formula creation support apparatus according to the sixth aspect, further comprising a keyword extracting means for extracting the keyword from a sentence input as a natural sentence as the input information.
請求項8の発明は、請求項1ないし請求項7のいずれかに記載の検索式作成支援装置において、操作者による操作入力に応答して前記抽出モジュール群からのモジュールの取捨選択を行う取捨選択手段をさらに備える。
The invention according to
請求項9の発明は、請求項1ないし請求項8のいずれかに記載の検索式作成支援装置において、前記生成手段により生成された検索式の適切性を所定の評価基準に基づいて評価する評価手段をさらに備える。 According to a ninth aspect of the present invention, in the retrieval formula creation support apparatus according to any one of the first to eighth aspects, the evaluation is performed by evaluating the appropriateness of the retrieval formula generated by the generating unit based on a predetermined evaluation criterion. Means are further provided.
請求項10の発明は、コンピュータで実行されることにより、情報の検索のための検索式の作成を支援するプログラムであって、前記プログラムは、前記コンピュータに、検索式資産と前記検索式資産の組み合わせの基礎となる第1情報とを関連付けた、検索式資産の管理の単位であるモジュールを記憶する記憶手順と、前記検索式の生成の基礎となるモジュールを、前記記憶手順で記憶された複数のモジュールの中から抽出する抽出手順と、前記抽出手順で抽出されたモジュールの集合である抽出モジュール群に含まれる前記第1情報に基づいて、前記抽出モジュール群に含まれる前記検索式資産を組み合わせることにより、前記検索式を生成する生成手順とを実行させる。
The invention of
請求項11の発明は、情報検索システムであって、請求項1ないし請求項9のいずれかに記載の検索式作成支援装置と、前記検索式作成支援装置が出力した検索式を用いて情報の検索を行う情報検索装置とを備える。
The invention of claim 11 is an information search system, wherein the search formula creation support device according to any one of
請求項1ないし請求項11の発明によれば、検索式資産が組み合わされて情報検索のための検索式が自動的に生成されるので、検索式資産の再利用が容易になる。 According to the first to eleventh aspects of the present invention, the search formula assets are automatically generated by combining the search formula assets, so that the search formula assets can be easily reused.
請求項2の発明によれば、検索式に分類情報が反映されるので、分類基準を適切に設定しておけば、適切な検索式を得ることができる。 According to the second aspect of the present invention, the classification information is reflected in the search formula, so that an appropriate search formula can be obtained by appropriately setting the classification criteria.
請求項3の発明によれば、検索式に関係情報が反映されるので、関係情報を適切に設定しておけば、適切な検索式を得ることができる。
According to the invention of
請求項5の発明によれば、情報を入力するとモジュールが自動的に抽出されるので、モジュールの抽出が容易になる。 According to the fifth aspect of the present invention, the module is automatically extracted when information is input, so that the module can be easily extracted.
請求項6の発明によれば、キーワードとマッチングキーワードとの比較によりモジュールの抽出を行うことができるので、モジュールの抽出がさらに容易になる。 According to the sixth aspect of the present invention, the module can be extracted by comparing the keyword with the matching keyword, so that the module can be extracted more easily.
請求項7の発明によれば、自然文を入力するとキーワードが自動的に抽出され、キーワードを決定する手間を削減することができる。 According to the seventh aspect of the present invention, when a natural sentence is input, a keyword is automatically extracted, and the labor for determining the keyword can be reduced.
請求項8の発明によれば、抽出モジュール群から不適切なモジュールを捨て、抽出モジュール群へ必要なモジュールを取り入れることができるので、抽出モジュール群を適切なものとすることができる。
According to the invention of
請求項9の発明によれば、適切な検索式のみを出力可能になる。
According to the invention of
<1 検索式作成支援機能の概念>
図1は、本発明の実施形態に係る検索式作成支援装置30の検索式作成支援機能の概念を説明する図である。この検索式作成支援機能は、検索に先立って蓄積された検索式の資産(以下では、単に「検索式資産」とも称する)SFSを利用して、情報の検索のための検索式SFの作成を支援する機能となっている。検索式資産SFSは、過去の検索に実際に利用され、検索者により適切性が検討されたものであることが望ましい。これは、過去の経験が反映された検索式資産SFSを利用すれば、検索式資産SFSを利用して生成した検索式SFにも過去の経験が反映されるからである。ただし、このことは、検索式資産SFSが過去の検索に実際に利用されたものであることを必須とするものではない。
<1 Concept of search expression creation support function>
FIG. 1 is a diagram for explaining the concept of the search expression creation support function of the search expression
図1を参照しながらより具体的に説明すると、検索式作成支援装置30は、検索式資産SFSと第1情報IF1及び第2情報IF2とを関連付けた式資産モジュール(以下では、単に「モジュール」とも称する)MDを利用可能に記憶している。モジュールMDは、検索式作成支援装置30における検索式資産SFSの管理の単位となっているが、モジュールMDの各々が単一のファイルから構成されることは要求されない。したがって、モジュールMDは、検索式作成支援装置30が演算処理を行うにあたってひとまとまりのデータとして管理可能な複数のファイルの集合であってもよい。
More specifically, with reference to FIG. 1, the search formula
検索式作成支援装置30は、入力された情報に応じた第2情報IF2を有するモジュールMDを、記憶している複数のモジュールMDの中から抽出し、抽出したモジュールMDの集合(以下では、「抽出モジュール群」とも称する)EMDに含まれる第1情報IF1に基づいて、抽出モジュール群EMDに含まれる検索式資産SFSを組み合わせることにより、検索式SFを生成している。すなわち、第1情報IF1は、検索式資産SFSの組み合わせの基礎となる情報となっており、第2情報IF2は、検索式資産SFSの抽出の基礎となる情報となっている。この第1情報IF1及び第2情報IF2の具体例については後述する。
The search formula
検索式作成支援装置30においては、検索式資産SFSの組み合わせを決定するのに容易に利用できる第1情報IF1と、検索式資産SFSの選択を決定するのに容易に利用できる第2情報IF2とを、検索式資産SFSに関連付けることにより、再利用が容易なモジュールMDを構築し、単独では再利用が困難な検索式資産SFSの再利用を容易ならしめている。
In the search formula
なお、図1では、抽出モジュール群EMDに含まれるモジュールMDの数が2個である場合を例示しているが、抽出モジュール群EMDに含まれるモジュールMDの数は1個又は3個以上であってもよい。 1 illustrates the case where the number of modules MD included in the extraction module group EMD is two, the number of modules MD included in the extraction module group EMD is one or three or more. May be.
<2 構成>
<2.1 情報検索システムの全体構成>
図2は、本発明の実施形態に係る検索式作成支援装置30を含む情報検索システム1の全体構成を示すブロック図である。
<2 Configuration>
<2.1 Overall configuration of information retrieval system>
FIG. 2 is a block diagram showing the overall configuration of the
図2に示すように、情報検索システム1は、情報の検索を行う情報検索装置10と、検索対象の情報を格納するデータベース20と、情報の検索に用いる検索式の作成を支援する検索式作成支援装置30とを含む。情報検索システム1は、1台のコンピュータにより実現してもよいし、ネットワーク等の通信回線によって通信可能に接続された複数台のコンピュータの協働により実現してもよい。
As shown in FIG. 2, the
情報検索装置10は、検索式を用いてデータベース20に対する検索を行い、検索式に適合する情報を出力する。情報検索装置10は、検索式作成支援装置30が出力した検索式を用いることができる。
The
検索式作成支援装置30は、先述の検索式作成支援機能により、入力された情報に基づく検索式を生成し、生成した検索式の適切性を所定の評価基準に基づいて評価する。検索式の適切性は、適切性の評価対象となる検索式を用いてデータベース20に対する検索を行うことにより得られた検索集合に基づいて評価される。そして、検索式作成支援装置30は、生成した検索式のうち、適切と評価した検索式のみを出力する。
The search formula
データベース20は、例えば、文字列からなる情報の集合を検索対象の情報としてデータ化して格納する。なお、以下では、データベース20が、検索対象の情報として特許文献の集合を格納しているとして説明を進める。
For example, the
<2.2 検索式作成支援装置の構成>
図3は、検索式作成支援装置30の構成を示すブロック図である。
<2.2 Configuration of search formula creation support device>
FIG. 3 is a block diagram illustrating a configuration of the search formula
図3に示すように、検索式作成支援装置30は、本体部31と、本体部31への情報の入力に用いられる入力部32と、本体部31からの情報の出力に用いられる出力部33と、各種の情報の表示に用いられる表示部34とを備える。
As shown in FIG. 3, the retrieval formula
本体部31は、少なくともCPU311とメモリ312とを備えるコンピュータを含んで構成される。本体部31には、当該コンピュータを検索式作成支援装置30の主要部として機能させるための検索式作成支援プログラム319がインストールされる。図3に図示したキーワード抽出部315、モジュール抽出部316、検索式生成部317及び適切性評価部318は、当該コンピュータが検索式作成支援プログラム319を実行することにより実現される機能の一部を示している。
The
メモリ312は、入力データメモリ312a、モジュールメモリ312b、演算ルールメモリ312c、確認済データメモリ312d、出力データメモリ312e及び自動生成作業用メモリ312fの6個の記憶領域に物理的又は論理的に区分される。もちろん、切れらの記憶領域に記憶されるデータを、ハードディスクドライブ等の補助記憶手段に格納するようにしてもよい。
The
入力データメモリ312aは、入力部32から自然文で入力された文章に係る自然文データを格納する。
The
モジュールメモリ312bは、検索式資産と、属性情報(先述の「第1情報IF1」に相当)及びマッチングキーワード(先述の「第2情報IF2」に相当)とを関連付けた複数のモジュールを格納する。
The
演算ルールメモリ312cは、検索式作成支援装置30の演算処理に適用される演算ルールを格納する。
The
確認済データメモリ312dは、モジュール抽出部316が抽出した、入力された情報に応じたマッチングキーワードを有する抽出モジュール群を記憶する。確認済データメモリ312dに記憶される抽出モジュール群は、操作者による削除及び追加が行われた後のものとなっている。
The confirmed
出力データメモリ312eは、生成した検索式や、当該検索式を用いてデータベース20に対する検索を行うことにより得られた検索集合に関する情報を格納する。
The
自動生成作業用メモリ312fには、確認済データメモリ312dに記憶されている抽出モジュール群が転記される。ただし、転記にあたっては、任意のモジュールを転記の対象から除外することができる。
The extraction module group stored in the confirmed
キーワード抽出部315は、入力データメモリ312aに記憶されている自然文データからキーワードを抽出する。キーワード抽出部315におけるキーワードの抽出は、例えば、形態素解析により自然文を単語に分割した後に不要語を除去して得られる内容語を、自然文で入力された情報に係るキーワードとして残すことにより行う。例えば、「流動性を有する光硬化性樹脂に光を照射して形成された造形物の洗浄方法であって、a)注入口から排出口へと連絡する・・・」という自然文からは「流動」「光」「光硬化」「樹脂」「照射」等のキーワードが抽出される。このキーワードは、検索式資産を含むモジュールの抽出のための情報であって、従来の技術と異なり、検索式を直接的に構成する要素として生成されるものではない。
The
モジュール抽出部316は、キーワード抽出部315が抽出したキーワードと、モジュールメモリ312bに記憶されている複数のモジュールのマッチングキーワードとの比較演算を行い、比較結果に基づいて、キーワード抽出部315が抽出したキーワードのいずれかと一致するマッチングキーワードを含むモジュールを抽出する。このように、検索式作成支援装置30では、キーワードとマッチングキーワードとの比較という比較的容易な処理により、検索式資産を含むモジュールの抽出を容易ならしめ、もって、検索式資産の再利用を可能にしている。
The
なお、検索式作成支援装置30においては、抽出モジュール群から不適切なモジュールを捨て、抽出モジュール群へ必要なモジュールを取り入れるため、抽出モジュール群に対するモジュールの取捨選択が必要に応じて行われ、検索式の生成の基礎となる適切なモジュールのみが残される。
The retrieval formula
検索式生成部317は、抽出モジュール群に含まれる属性情報に基づいて抽出モジュール群に含まれる検索式資産を組み合わせることにより、情報の検索のための検索式を生成する。検索式の生成の基礎となる検索式自動生成ルールは、演算ルールメモリ312cに格納されている。
The search
適切性評価部318は、適切な検索式のみを出力可能とするため、検索式生成部317により生成された検索式の適切性を評価する。適切性評価部318は、検索式を用いてデータベース20に対する検索を行うことにより得られた検索集合に含まれる特許文献の数(以下では、「ヒット件数」とも称する)が所定のヒット件数範囲内(例えば、50件以上200件以下)である場合に、当該検索式を適切なものであると判定する。適切性の評価の基礎となるヒット件数範囲の情報は、演算ルールメモリ312cに格納されている。
The
入力部32は、ポインティングデバイスやキーボード等の入力機器を含む。検索式作成支援装置30では、当該入力機器に対する操作により、情報の入力を行うことができる。もちろん、検索式作成支援装置30において、他の方法による情報の入力、例えば、ネットワークを経由した通信による情報の入力や可搬性の記録媒体の読み取りによる情報の入力を行うようにしてもよい。
The
出力部33は、検索式情報の出力を行う。検索式作成支援装置30において、ネットワークを経由した通信による情報の出力や可搬性の記録媒体への書き込みにより、検索式情報の出力を情報検索装置10に対して行う。
The
表示部34は、液晶モニタやCRTモニタ等を含み、各種の情報を視認可能に表示する。検索式作成支援装置30は、ユーザインターフェースとしてGUI(Graphical User Interface)を採用しているので、操作者は、表示部34へ表示されたGUI画面を参照しながら入力部32を用いて所定の操作を行うことにより、検索式作成支援装置30に指示を与えることができる。
The
<2.3 モジュールのデータ形式>
続いて、検索式資産を含むモジュールのデータ形式について、図4を参照しながら説明する。図4は、9個のモジュールMD1〜MD9の各データ項目の内容を一覧表示した図となっており、各行が1個のモジュールに対応し、各列がモジュールの各データ項目に対応している。
<2.3 Module data format>
Next, the data format of the module including the searchable asset will be described with reference to FIG. FIG. 4 shows a list of the contents of the data items of the nine modules MD1 to MD9. Each row corresponds to one module and each column corresponds to each data item of the module. .
モジュールMD1〜MD9に含まれる検索式資産は、キーワードを演算子で結合した式であり、ブーリアン検索に用いることができる。 The search formula assets included in the modules MD1 to MD9 are formulas obtained by combining keywords with operators, and can be used for Boolean search.
検索式資産を構成する演算子としては、典型的には、結合されたキーワードの両方を含む検索集合を得るための「AND演算子(*)」、結合されたキーワードの少なくとも一方を含む検索集合を得るための「OR演算子(+)」、直後のキーワードを含まない検索集合を得るための「NOT演算子」等の周知の演算子を用いることができる。 The operators that make up the search expression asset are typically "AND operator (*)" for obtaining a search set including both of the combined keywords, and a search set including at least one of the combined keywords. A well-known operator such as “OR operator (+)” for obtaining “NO”, and “NOT operator” for obtaining a search set that does not include the immediately following keyword can be used.
検索式生成部317における検索式資産の組み合わせの基礎となる属性情報には、所定の分類基準によるモジュールの分類を示す「タイプ」と、モジュール間の階層関係を定義する「階層データ」と、階層関係が定義されたモジュールの集合における階層関係上の位置を示す「クラス」と、階層関係が定義されたモジュールの集合ごとに付与される「同族管理番号」とが含まれる。これらの属性情報のうち「タイプ」は、操作者が付与する情報(ナリッジ)となっており、「階層データ」「クラス」及び「同族管理番号」は、検索式作成支援装置30が、検索式資産を用いてデータベース20に対する検索を行うことによって特定した、検索集合の包含関係に基づく情報(ナリッジ)となっている。また、「階層データ」は、2個のモジュールの関係に関する情報であるのに対して、「クラス」及び「同族管理番号」は、「階層関係」に基づいて特定される、2個以上のモジュールの集合に関する情報となっている。
The attribute information that is the basis of the combination of search formula assets in the search
先述の第1情報に相当する情報の一例である「タイプ」には、「分野」「製品・装置」「動作・処理」「形状・構造」「部品・材料」「未分類」「新規」及び「非表示」があり、図4においては、それぞれ、「1」から「8」までの自然数のタイプ属性値で表される。 “Type” which is an example of information corresponding to the first information described above includes “field”, “product / equipment”, “operation / processing”, “shape / structure”, “part / material”, “unclassified”, “new”, and There is “non-display”, and in FIG. 4, each is represented by a natural type attribute value from “1” to “8”.
また、先述の第1情報に相当する情報の一例である「階層データ」には、上位の階層のモジュールの管理番号が付与される。例えば、図4では、モジュールMD2は、モジュールMD3の上位の階層のモジュールとなっており、モジュールMD6は、モジュールMD7の上位の階層のモジュールとなっている。「クラス」は、「階層データ」に基づいて決定され、例えば、「1」「2」・・・等の自然数のクラス属性値で表される。 Further, “hierarchical data”, which is an example of information corresponding to the first information described above, is given a management number of a module in a higher hierarchy. For example, in FIG. 4, the module MD2 is a module in a higher hierarchy than the module MD3, and the module MD6 is a module in a higher hierarchy than the module MD7. “Class” is determined based on “hierarchical data”, and is represented by a natural number of class attribute values such as “1”, “2”.
さらに、モジュールMD1〜MD9に含まれる検索式資産には、各モジュールに固有の「管理番号」と、各検索式資産の内容の認識を容易にするために便宜的に付された「見出し語」と、モジュール抽出部316における抽出の基礎となる、すなわち、キーワード抽出部315が抽出したキーワードとの比較演算の対象となり、先述の第2情報に相当する情報の一例となっている「マッチングキーワード」とが関連付けられている。これらのうち、「管理番号」は、検索式作成支援装置30によって自動的に付与され、操作者による編集は許可されないが、「見出し語」及び「マッチングキーワード」は、操作者による編集も許可される。
Further, the search formula assets included in the modules MD1 to MD9 include a “management number” unique to each module and a “entry word” attached for convenience in order to facilitate recognition of the contents of each search formula asset. “Matching keyword”, which is the basis of extraction in the
<2.4 画面構成及び画面遷移>
以下では、表示部34に表示されるGUI画面である文章入力画面41、モジュール確認画面42、検索結果確認画面43、警告画面44、新規モジュール内容書込画面45及び階層関係自動チェック画面46の画面構成(図5〜図10参照)と、これらの画面間の画面遷移(図11参照)とについて説明する。
<2.4 Screen configuration and screen transition>
In the following, a
<2.4.1 文章入力画面>
図5は、操作者による自然文の文章の入力に用いられる文章入力画面41の画面構成を示す図である。
<2.4.1 Text entry screen>
FIG. 5 is a diagram showing a screen configuration of a
図5に示すように、文章入力画面41は、自然文の文章の入力欄となるテキストボックス411と、自然文の文章の入力の完了を検索式作成支援装置30に指示するための操作部材である入力完了ボタン412とを備える。
As shown in FIG. 5, the
文章入力画面41においては、入力完了ボタン412が押下されると、テキストボックス411に入力された自然文の文章が入力データメモリ312aに自然文データとして格納され、表示部34には、文章入力画面41に代えて、モジュール確認画面42が呼び出される(図11参照)。
When the
このような自然文による文章の入力を採用することにより、自然文を入力すると、キーワード抽出部315によりキーワードが当該自然文から自動的に抽出され、モジュール抽出部316によりモジュールが自動的に抽出されるので、キーワードを考察して決定する手間を削減することができるが、このことは、操作者がキーワードを決定して検索式作成支援装置30に直接与えることを妨げるものではない。
By adopting such natural sentence input, when a natural sentence is input, the
<2.4.2 モジュール確認画面>
図6は、操作者によるモジュールの取捨選択に用いられるモジュール確認画面42の画面構成を示す図である。
<2.4.2 Module confirmation screen>
FIG. 6 is a diagram showing a screen configuration of the
図6に示すように、モジュール確認画面42は、先述の8個のタイプのうち、「非表示」を除く「分野」「製品・装置」「動作・処理」「形状・構造」「部品・材料」「未分類」及び「新規」の7個のタイプに対応する欄SC1〜SC7に整理してモジュールの見出し語を一覧表示するように構成されている。
As shown in FIG. 6, the
欄SC1〜SC7の各々は、抽出モジュール群に含まれるモジュールの見出し語を一覧表示する左側のモジュール一覧MTと、モジュールメモリ312bに格納されており、抽出モジュール群に追加可能なモジュールの候補の見出し語を一覧表示する右側のモジュール追加ヘルプMAHとに分けられる。モジュール一覧MT及びモジュール追加ヘルプMAHは、モジュールの見出し語の表示領域となるセルCLが縦横に規則的に配列された体裁を有している。
Each of the columns SC1 to SC7 includes a module list MT on the left side that displays a list of entry words of modules included in the extraction module group, and a module candidate headline that is stored in the
モジュール確認画面42においては、モジュール追加ヘルプMAHに表示されているモジュールの見出し語を選択してボタンBTN1を押下することにより、当該モジュールを抽出モジュール群に追加することができる。逆に、モジュール確認画面42においては、モジュール一覧MTに表示されているモジュールの見出し語を選択してボタンBTN2を押下することにより、当該モジュールを抽出モジュール群から削除することができる。
On the
また、モジュール確認画面42においては、モジュール間の階層関係が整理され、モジュールの階層関係上の位置が、見出し語を表示する列によって表現されている。例えば、図6においては、「硬化」よりも「光硬化」の方が右寄りの列に表示されているが、これは、「硬化」という見出し語を含むモジュールの方が、「光硬化」という見出し語を含むモジュールよりも上位の階層に位置していることを表している。
Further, on the
さらに、モジュール確認画面42においては、モジュール一覧MTの左端部に、見出し語が表示されているモジュールを、検索式の生成の基礎となる抽出モジュール群から除外するか否かを指定するための記号SY1,SY2が表示されている。ここで、記号SY1は、抽出モジュール群からのモジュールの除外を意味しており、記号SY2は、抽出モジュール群からのモジュールの除外の解除を意味している。モジュール一覧MTでは、全てのモジュールについて記号SY2が表示された状態がデフォルトの状態であるが、マウスのクリック操作等の操作者の所定の操作により、記号SY1と記号SY2とを個々のモジュールごとに切り替えることができるようになっている。
Further, on the
モジュール確認画面42には、文章入力画面41を表示部34に呼び出すための操作部材である文章入力画面に戻るボタン(以下では、「戻るボタン」とも称する)421と、次のプロセスへ進む指示を検索式作成支援装置30に与えるための操作部材である次のプロセスに進むボタン(以下では、「進むボタン」とも称する)422とが準備されている。
On the
モジュール確認画面42において、戻るボタン421が押下されると、表示部34には、モジュール確認画面42に代えて、文章入力画面41が再び呼び出され(図11参照)、自然文の文章の再入力(入力のやり直し)が可能な状態となる。
When the
また、モジュール確認画面42において、進むボタン422が押下されると、モジュール一覧MTに表示されている見出し語を含むモジュールが確認済データメモリ312dに格納され、表示部34には、モジュール確認画面42に代えて、検索結果確認画面43が呼び出される(図11参照)。
When the
なお、文章入力画面41において、IPC(国際特許分類)の表示欄を設け、自然文で入力された情報から生成したIPCのリストを表示するようにしてもよい。
The
<2.4.3 検索結果確認画面>
図7は、検索式生成部317が生成し適切性評価部318が適切であると評価した検索式(以下では、単に「適切な検索式」とも称する)の確認に用いられる検索結果確認画面43の画面構成を示す図である。
<2.4.3 Search result confirmation screen>
FIG. 7 shows a search
図7に示すように、適切な検索式が存在する場合、すなわち、ヒット件数が所定のヒット件数範囲内の検索式が存在する場合、検索結果確認画面43には、当該検索式とそのヒット件数とが表示される。
As shown in FIG. 7, when there is an appropriate search formula, that is, when there is a search formula whose hit count is within a predetermined hit count range, the search
検索結果確認画面43における検索式の表記は、望ましくは、簡略表記431及び全表記432の2種類の方法により行われる。ここで、簡略表記431とは、組み合わせの基礎となった検索式資産を見出し語で表記することにより簡略化した検索式の表記である。また、全表記432とは、このような簡略化を行わない、検索に実際に利用された検索式の表記である。
The notation of the search expression on the search
一般的にいって、簡略表記431は、全表記432よりも簡潔で検索式の概略の認識が容易であるが、検索式の詳細な検討には適していない。一方、全表記432は、簡略表記431より複雑で検索式の概略の認識が困難であるが、検索式の詳細な検討に適している。このため、検索結果確認画面43においては、簡略表記431と全表記432との両方を閲覧できるようにすることにより、検索式の概略の認識を容易ならしめるとともに、検索式の詳細な検討も可能にしている。また、図7の検索結果確認画面43では、簡略表記431と全表記432とを同時に閲覧可能な態様を例示したが、所定の切り替え操作により切り替えて閲覧できるようにすることや、操作者の要求に応じて必要なもののみを表示するようにしてもよい。
Generally speaking, the
なお、図7には、検索結果確認画面43に検索式とそのヒット件数とが1件だけ表示された状態を示しているが、適切な検索式が2個以上存在する場合、検索結果確認画面43に検索式とそのヒット件数とが2件以上表示されることもありえる。
FIG. 7 shows a state where only one search expression and the number of hits are displayed on the search
さらに、検索結果確認画面43には、作業の完了を検索式作成支援装置30に指示するための操作部材である作業完了ボタン433と、適切な検索式すなわち検索結果確認画面43に表示された検索式の出力指示を検索式作成支援装置30に与えるための操作部材である出力ボタン434と、表示部34にモジュール確認画面42を再び呼び出すための操作部材であるモジュール確認画面に戻るボタン(以下では、「戻るボタン」とも称する)435とが準備されている。
Further, the search
検索結果確認画面43において、作業完了ボタン433が押下されると、表示部34には、検索結果確認画面43に代えて、新規モジュール内容書込画面45が呼び出される(図11参照)。
When the
また、検索結果確認画面43において、出力ボタン434が押下されると、検索結果確認画面43に表示されている検索式が出力部33を用いて出力される。
When the
さらに、検索結果確認画面43において、戻るボタン435が押下されると、表示部34には、検索結果確認画面43に代えて、モジュール確認画面42が再び呼び出され、モジュールの取捨選択を再び行うことができる状態となる(図11参照)。
Further, when the
<2.4.4 警告画面>
図8は適切な検索式が存在しない場合に表示される警告画面44の画面構成を示す図である。
<2.4.4 Warning screen>
FIG. 8 is a diagram showing a screen configuration of the
図8に示すように、適切な検索式が存在しない場合、すなわち、ヒット件数が所定のヒット件数範囲内の検索式が存在しない場合、例えば、「検索式自動生成及び自動実行が終了しました。規定ヒット件数範囲を満足する検索式はありませんでした。」というメッセージを含む警告画面44が表示部34に表示される。そして、警告画面44の表示後、文章入力画面41又はモジュール確認画面42へ戻る処理が行われる。
As shown in FIG. 8, when there is no appropriate search expression, that is, when there is no search expression whose hit count is within a predetermined hit count range, for example, “Automatic search expression generation and automatic execution has been completed. A
<2.4.5 新規モジュール内容書込画面>
図9は、タイプが「新規」となっている(タイプ属性値が「7」となっている)モジュール(以下では、「新規モジュール」とも称する)MDNの各データ項目の内容の書き込みを行うために用いられる新規モジュール内容書込画面45の画面構成を示す図である。
<2.4.5 New module content writing screen>
FIG. 9 illustrates the writing of the contents of each data item of a module whose type is “new” (type attribute value is “7”) (hereinafter also referred to as “new module”) MDN. It is a figure which shows the screen structure of the new module
図9に示すように、新規モジュール内容書込画面45には、新規モジュールMDNの各データ項目が一覧表示される。なお、図9には、1個の新規モジュールMDNについて各データ項目が一覧表示された状態を示しているが、2個以上の新規モジュールについてデータ項目が一覧表示がされることもありうる。
As shown in FIG. 9, the new module
新規モジュール内容書込画面45では、一覧表示されたデータ項目のうち、「管理番号」を除く「見出し語」「マッチングキーワード」「タイプ」「階層データ」及び「検索式資産」の内容は所定の操作により書き込み編集可能となっている。
In the new module
また、新規モジュール内容書込画面45は、編集操作をモジュールメモリ312bの記憶内容に反映させる対象とする新規モジュールMDNを指定するためのチェックボックス451を備えている。
Further, the new module
さらに、新規モジュール内容書込画面45は、書き込み作業の完了を検索式作成支援装置30に指示するための操作部材である作業完了ボタン452を備える。新規モジュール内容書込画面45において、作業完了ボタン452が押下されると、チェックボックス451へのチェックにより対象に指定された新規モジュールMDNのデータ項目に対して行われた編集操作がモジュールメモリ312bの記憶内容に反映され、表示部34には、新規モジュール内容書込画面45に代えて、階層関係自動チェック画面46が表示される(図11参照)。
Further, the new module
<2.4.6 階層関係自動チェック画面>
図10は、階層関係の自動チェック指示を検索式作成支援装置30に与えるために用いられる階層関係自動チェック画面46の画面構成を示す図である。
<2.4.6 Hierarchy automatic check screen>
FIG. 10 is a diagram showing a screen configuration of a hierarchical relationship
図10に示すように、階層関係自動チェック画面46は、新規モジュールと、新規モジュール以外のモジュール(以下では、「既存モジュール」とも称する)との間の階層関係の自動チェックの実行指示を検索式作成支援装置30に与える操作部材である階層関係自動チェックボタン461を含む。
As shown in FIG. 10, the hierarchical relationship
<3 動作>
<3.1 全体動作>
図12及び図13は、検索式作成支援プログラム319の実行によって実現される、検索式作成支援装置30の検索式作成支援のための全体動作を示すフローチャートである。
<3 operation>
<3.1 Overall operation>
FIG. 12 and FIG. 13 are flowcharts showing the overall operation for search formula creation support of the search formula
図12に示すように、検索式作成支援においては、まず、文章入力画面41が表示部34に表示され、文章入力画面41を用いて操作者が入力した自然文の文章が自然文データとして入力データメモリ312aに格納される(ステップS101)。そして、キーワード抽出部315は、入力データメモリ312aに格納された自然文データを読み出し、キーワードの抽出を行う(ステップS102)。
As shown in FIG. 12, in the search expression creation support, first, a
キーワードの抽出後、モジュール抽出部316は、マッチング処理、すなわち、ステップS102で抽出したキーワード(以下では、「抽出キーワード」とも称する)の各々とモジュールメモリ312bに格納されている複数のモジュールのマッチングキーワードとの比較演算を行い、マッチングキーワードの中に抽出キーワードを含むモジュールを特定する(ステップS103)。
After the keyword extraction, the
さらに、モジュール抽出部316は、モジュールメモリ312bに格納されている複数のモジュールのマッチングキーワードのいずれとも一致しない抽出キーワードを元に新規モジュールを生成する(ステップS104)。新規モジュールにおいては、他のモジュールと重複しない固有の管理番号が付与され、抽出キーワードと一致する見出し語、マッチングキーワード及び検索式が付与され、タイプ属性値が、「新規」に対応する「7」となる。なお、新規モジュールの生成時には、階層データは未定義となっている。
Further, the
続くステップS105及びS106では、モジュール確認画面42の表示準備が行われる。
In subsequent steps S105 and S106, display preparation of the
より具体的には、ステップS103で特定したモジュール及びステップS104で生成した新規モジュールのタイプ及び階層データが読み出され、演算ルールメモリ312cに格納されたモジュール整理ルールにしたがって、ステップS103で特定されたモジュール及びステップS104で生成した新規モジュールをタイプ及び階層データに基づいて整理することにより、モジュール一覧の表示準備が行われる(ステップS105)。
More specifically, the type and hierarchy data of the module identified in step S103 and the new module generated in step S104 are read out and identified in step S103 according to the module arrangement rules stored in the
さらに、モジュールメモリ312bに格納されているモジュールのタイプ及び階層データが読み出され、演算ルールメモリ312cに格納されたモジュール整理ルールにしたがって、モジュールメモリ312bに格納されているモジュールをタイプ及び階層データに基づいて整理することにより、モジュール追加Helpの表示準備が行われる(ステップS106)。ここで、モジュール追加Helpの表示領域の制約等の事情により、モジュールメモリ312bに格納されているモジュールの全部について表示準備を行うのではなく、一部について表示準備を行うようにしてもよい。
Further, the module type and hierarchy data stored in the
モジュール確認画面42の表示準備の完了後、モジュール一覧及びモジュール追加Helpを含むモジュール確認画面42が表示部34に表示され(ステップS107)、モジュール確認画面42における操作者の操作が検出される(ステップS108)。
After completing the preparation for displaying the
ステップS108において、抽出モジュール群へのモジュールの追加、抽出モジュール群からのモジュールの削除、抽出モジュール群からのモジュールの除外又は抽出モジュール群からのモジュールの除外の解除が検出された場合、ステップS107に戻ってモジュール確認画面42にこれらの操作が反映される。
If it is detected in step S108 that a module has been added to the extraction module group, a module has been deleted from the extraction module group, a module has been excluded from the extraction module group, or a module has been excluded from the extraction module group, the process proceeds to step S107. Returning, these operations are reflected on the
また、ステップS108において、戻るボタン421の押下が検出された場合、ステップS101に戻って文章入力画面41が表示部34に再び表示される。つまり、検索式作成支援装置30においては、モジュール確認画面42を参照した操作者が自然文の文章の入力に戻ってやり直しを行う必要があると判断した場合、戻るボタン421の押下を行えばよい。
If it is detected in step S108 that the
また、ステップS108において、進むボタン422の押下が検出された場合、操作者による追加、削除が行われ、モジュール確認画面42における確認が完了した抽出モジュール群、すなわち、進むボタン422の押下の直前にモジュール一覧表示MTに表示されていた見出し語を含むモジュールが、確認済データメモリ312dに格納される(ステップS109)。
In step S108, when the pressing of the
そして、自動生成作業用メモリ312fの初期化すなわち自動生成作業用メモリ312fに格納されているモジュールの削除後に、モジュール確認画面42で除外されたモジュール以外のモジュールが確認済データメモリ312dから自動生成作業用メモリ312fに転記される(ステップS110)。
Then, after initialization of the automatic
検索式の生成の基礎となる抽出モジュール群が自動生成作業用メモリ312fに格納されると、検索式の生成に先立って、検索式の生成のための準備が行われる(ステップS111)。すなわち、自動生成作業用メモリ312fに格納されている抽出モジュール群の各モジュールの階層データが参照され、階層関係に基づくクラスがタイプごとに計算される。より具体的には、同じタイプに属するモジュールの階層関係が特定され、階層関係上の位置が上位のモジュールから順に「1」「2」「3」・・・というクラス属性値が付与される。さらに、階層関係が定義されたモジュールの集合が同族であるとみなされて、同族ごとに固有の同族管理番号が付与される。このステップS111により、ステップS104の段階では付与されていなかったモジュールのクラス及び同族管理番号が付与されたことになる。
When the extraction module group serving as the basis for generating the search expression is stored in the automatic
ここで、自動生成作業用メモリ312fにモジュールが格納されている場合(ステップS112で"YES")、検索式生成部317は、演算ルールメモリ312cに格納されている検索式自動生成ルールにしたがって、自動生成作業用メモリ312fに格納されている抽出モジュール群に基づいて検索式を生成し(ステップS113)、適切性評価のプロセスに移行する。なお、ステップS113の検索式生成の詳細については、後述する。
Here, when the module is stored in the automatic
一方、自動生成作業用メモリ312fにモジュールが格納されていない場合(ステップS112で"NO")、検索式の生成の基礎となる抽出モジュールが存在せず、検索式の生成を行うことができないので、警告画面44が表示部34に表示され(ステップS114)、ステップS101又はS108へ戻る。
On the other hand, if no module is stored in the automatic
適切性評価のプロセスでは、最初に、適切性評価部318が、ステップS113で生成された検索式を用いて、データベース20に対する検索を実行し、得られた検索集合に関する情報を出力データメモリ312eに格納する(ステップS115)。もちろん、適切性評価部318は、ステップS113で生成された検索式が複数個存在する場合は、各検索式を用いて複数回の検索を実行する。
In the appropriateness evaluation process, first, the
さらに、適切性評価部318は、適切な検索式が得られているか否かを判定するため、各検索式についてのヒット件数と、演算ルールメモリ312cに格納されたヒット件数範囲とを比較し、適切な検索式が存在するか否かによって処理を分岐させる(ステップS116)。
Further, the
そして、適切な検索式が存在しない場合、確認済データメモリ312dに格納されているモジュールのうち、最小のタイプ属性値が与えられたタイプに含まれる、最小の同族管理番号が付与されたモジュールが確認済データメモリ312dから削除された後に(ステップS117)、ステップS112への移行が行われる。これにより、検索式作成支援装置30では、適切な検索式が得られない場合、検索式の生成の基礎となる抽出モジュール群に含まれるモジュールの一部を削除して改めて検索式を生成し、適切な検索式が得られているか否かを改めて確認することになる。そして、検索式作成支援は、自動生成作業用メモリ312fに格納されているモジュールが存在しなくなるまでモジュールの削除を繰り返しても適切な検索式が得られない場合は、警告画面44により、適切な検索式が得られなかったことを操作者に警告することになる。
If an appropriate search expression does not exist, a module with the smallest family management number included in the type given the smallest type attribute value among the modules stored in the confirmed
一方、ヒット件数が所定条件を満たす検索式が存在する場合、検索結果確認画面43が表示部34に表示され(ステップS118)、検索結果確認画面43における操作者の操作に応じた処理が実行される(ステップS119)。
On the other hand, if there is a search expression that satisfies the predetermined condition for the number of hits, the search
すなわち、ステップS119において出力ボタン434の押下が検出された場合は、生成した適切な検索式の出力が実行される(ステップS120)。なお、ステップS120の出力の具体的態様としては、例えば、生成した適切な検索式を、テキストファイル等に記述して保存すること、不図示のプリンタを用いてプリントアウトすること、情報検索装置10へ転送すること等をあげることができる。
That is, when pressing of the
また、ステップS119において、戻るボタン435の押下が検出された場合は、ステップS107への移行が行われる。つまり、検索式作成支援装置30では、検索結果確認画面43を参照した操作者がモジュールの取捨選択に戻ってやり直しを行う必要があると判断した場合、モジュール確認画面42に戻るボタンを押下すればよい。
If it is detected in step S119 that the
さらに、ステップS119において作業完了ボタン433の押下が検出された場合は、新規モジュール内容書込画面45が表示部34に表示され(ステップS121)、新規モジュール内容書込画面45で行った操作者の編集操作に応じて、モジュールメモリ312bの記憶内容が上書更新される(ステップS122)。しかる後に、階層関係自動チェック画面46が表示部34に表示され(ステップS123)、階層関係自動チェックボタン461の押下に応答して階層関係自動チェックが実行される(ステップS124)。この階層関係自動チェックの詳細については後述する。
Further, when pressing of the
<3.2 検索式生成>
図14〜図16は、ステップS113の検索式生成を説明する図である。
<3.2 Search expression generation>
14-16 is a figure explaining the search formula production | generation of step S113.
検索式生成は、抽出モジュール群の、「1」「2」又は「3」というクラス属性値が付与されたモジュールに含まれる検索式資産を、タイプ及びクラスに基づいて組み合わせることにより行われる。ここで、検索式生成における組み合わせの対象とするモジュールのクラス属性値の範囲を拡大又は縮小することも妨げられない。 Search expression generation is performed by combining the search expression assets included in the modules to which the class attribute value “1”, “2”, or “3” of the extraction module group is assigned based on the type and class. Here, it is not hindered to expand or reduce the range of the class attribute values of the modules to be combined in the search expression generation.
より具体的には、検索式生成部317は、各タイプに含まれるモジュールの中から、クラスを参照して同族管理番号ごとに1つのモジュールをリストアップしてOR結合(OR演算子による結合)し、OR結合による得られた検索式をさらにAND結合(AND演算子による結合)して情報の検索のための検索式を生成する。
More specifically, the search
以下では、検索式生成部317における検索式生成について、3つの段階に分けて説明する。
Hereinafter, search expression generation in the search
検索式生成の第1の段階では、図14に示すように、クラス属性値が「1」のモジュールMDC1を基礎とした検索式の生成を行い、クラス属性値が「2」のモジュールMDC2やクラス属性値が「3」のモジュールMDC3は検索式の生成に使用しない。 In the first stage of the search expression generation, as shown in FIG. 14, a search expression is generated based on the module MDC1 with the class attribute value “1”, and the module MDC2 with the class attribute value “2” and the class are generated. The module MDC3 having the attribute value “3” is not used for generating a search expression.
すなわち、抽出モジュール群に含まれるモジュールが、タイプ属性値M1,M2,・・・,Mp(M1<M2<・・・<Mp)に分類されるとすると、同じ同族管理番号が付与されたモジュールの集合(同族)G1〜G3の各々からクラス属性値が「1」のモジュールMDC1を1つずつリストアップし、リストアップしたモジュールMDC1に含まれる検索式資産をOR結合して検索式E(Mi)(i=1,2,・・・,p)を生成する処理を、タイプごとに行う。そして、p個の検索式E(Mi)(i=1,2,・・・,p)を様々にAND結合して、式(1)においてn=1,2,・・・,pとした、p個(最大7個)の検索式SFを生成する。 That is, if the modules included in the extracted module group are classified into type attribute values M1, M2,..., Mp (M1 <M2 <... <Mp), modules assigned the same family management number The modules MDC1 having the class attribute value “1” are listed one by one from each of the sets (same family) G1 to G3, and the query expression asset included in the listed module MDC1 is ORed to obtain the query expression E (Mi ) (I = 1, 2,..., P) is generated for each type. Then, p search expressions E (Mi) (i = 1, 2,..., P) are AND-coupled in various ways to obtain n = 1, 2,. , P (up to 7) search expressions SF are generated.
続く検索式生成の第2の段階では、図15に示すように、クラス属性値が「1」のモジュールMDC1及びクラス属性値が「2」のモジュールMDC2を基礎とした検索式の生成を行い、クラス属性値が「3」のモジュールMDC3は検索式の生成に使用しない。 In the second stage of the subsequent search expression generation, as shown in FIG. 15, a search expression is generated based on the module MDC1 whose class attribute value is “1” and the module MDC2 whose class attribute value is “2”. The module MDC3 whose class attribute value is “3” is not used to generate a search expression.
すなわち、タイプ属性値が「M1」のタイプについては、同じ同族管理番号が付与されたモジュールの集合G1〜G3の各々からクラス属性値が「2」のモジュールMDC2(存在しない場合は、同族のクラス属性値が「1」のモジュールMDC1とする)を1つづつリストアップして、リストアップしたモジュールMDC1,MDC2に含まれる検索式資産をOR結合して検索式E(M1)を生成する。 That is, for the type having the type attribute value “M1”, the module MDC2 having the class attribute value “2” from each of the set of modules G1 to G3 to which the same family management number is assigned (if there is no class M The module MDC1 having an attribute value “1”) is listed one by one, and the search formula assets included in the listed modules MDC1 and MDC2 are ORed to generate a search formula E (M1).
また、タイプ属性値が「M1」以外のタイプについては、同じ同族管理番号が付与されたモジュールの集合(同族)G1〜G3の各々からクラス属性値が「1」のモジュールMDC1を1つずつリストアップし、リストアップしたモジュールMDC1に含まれる検索式資産をOR結合して(p−1)個の検索式E(Mi)(i=2,・・・,p)を生成する。 For types other than the type attribute value “M1”, one module MDC1 having a class attribute value “1” is listed one by one from each of a set (family) G1 to G3 of modules having the same family management number. The search formula assets included in the listed module MDC1 are OR-linked to generate (p−1) search formulas E (Mi) (i = 2,..., P).
そして、p個の検索式E(Mi)(i=1,2,・・・,p)を様々にAND結合して、式(1)においてn=1,2,・・・,pとした、p個(最大7個)の検索式SFを生成する。 Then, p search expressions E (Mi) (i = 1, 2,..., P) are AND-coupled in various ways to obtain n = 1, 2,. , P (up to 7) search expressions SF are generated.
なお、上述の説明では、タイプ属性値が「M1」のタイプについてのみ、モジュールのリストアップの方法を変化させたが、実際には、タイプ属性値が「M2」,・・・,「Mp」についてもモジュールのリストアップの方法を同様に順次変化させて、検索式SFを生成する。 In the above description, the module listing method is changed only for the type having the type attribute value “M1”. However, in practice, the type attribute values are “M2”,..., “Mp”. Similarly, the module listing method is sequentially changed to generate the search formula SF.
続く検索式生成の第3の段階では、図16に示すように、クラス属性値が「1」のモジュールMDC1、クラス属性値が「2」のモジュールMDC2及びクラス属性値が「3」のモジュールMDC3を基礎とした検索式の生成を行う。 In the subsequent third stage of the search expression generation, as shown in FIG. 16, the module MDC1 whose class attribute value is “1”, the module MDC2 whose class attribute value is “2”, and the module MDC3 whose class attribute value is “3”. Generate a search expression based on.
すなわち、タイプ属性値が「M1」のタイプについては、同じ同族管理番号が付与されたモジュールの集合G1〜G3の各々からクラス属性値が「3」のモジュールMDC3(存在しない場合は、同族のクラス属性値が「2」のモジュールMDC2とし、それも存在しない場合は、同族のクラス属性値が「1」のモジュールMDC1とする)を1つずつリストアップして、リストアップしたモジュールMDC1〜MDC3に含まれる検索式資産をOR結合して検索式E(M1)を生成する。 That is, for the type with the type attribute value “M1”, the module MDC3 with the class attribute value “3” from each of the set of modules G1 to G3 to which the same family management number is assigned (if there is no class M Module MDC2 with attribute value “2”, and if it does not exist, module MDC1 with class attribute value “1” of the family is listed one by one, and the modules MDC1 to MDC3 listed are listed. The search expression E (M1) is generated by OR-joining the included search expression assets.
また、タイプ属性値が「M1」以外のタイプについては、同じ同族管理番号が付与されたモジュールの集合(同族)G1〜G3の各々からクラス属性値が「1」のモジュールMDC1を1つずつリストアップし、リストアップしたモジュールMDC1に含まれる検索式資産をOR結合して(p−1)個の検索式E(Mi)(i=2,・・・,p)を生成する。 For types other than the type attribute value “M1”, one module MDC1 having a class attribute value “1” is listed one by one from each of a set (family) G1 to G3 of modules having the same family management number. The search formula assets included in the listed module MDC1 are OR-linked to generate (p−1) search formulas E (Mi) (i = 2,..., P).
そして、p個の検索式E(Mi)を様々にAND結合して、式(1)においてn=1,2,・・・,pとした、p個(最大7個)の検索式SFを生成する。 Then, p search expressions E (Mi) are AND-coupled in various ways, and p (up to 7) search expressions SF, where n = 1, 2,..., P in Expression (1), are obtained. Generate.
なお、上述の説明では、タイプ属性値が「M1」のタイプについてのみ、モジュールのリストアップの方法を変化させたが、実際には、タイプ属性値が「M2」,・・・,「Mp」についてもモジュールのリストアップの方法を同様に順次変化させて、順次検索式SFを生成する。 In the above description, the module listing method is changed only for the type having the type attribute value “M1”. However, in practice, the type attribute values are “M2”,..., “Mp”. Similarly, the module listing method is sequentially changed in the same manner, and the search expression SF is sequentially generated.
<3.3 階層関係自動チェック>
以下では、タイプ属性値が「1」の、新規のモジュールAと、既存のモジュールI、モジュールII及びモジュールIIIとの間の階層関係をチェックする場合を例として、ステップS123の階層関係自動チェックについて説明する。ここで、モジュールA、モジュールI、モジュールII及びモジュールIIIの検索集合は、それぞれ、検索集合N(A),O(I),O(II)及びO(III)で表されるとする。
<3.3 Hierarchical relationship automatic check>
Hereinafter, as an example of checking the hierarchical relationship between a new module A whose type attribute value is “1” and the existing modules I, II, and III, the hierarchical relationship automatic check in step S123 will be described. explain. Here, the search sets of module A, module I, module II, and module III are represented by search sets N (A), O (I), O (II), and O (III), respectively.
検索式作成支援装置30は、モジュールA及びモジュールIに含まれる検索式資産を用いた検索により得られる検索集合N(A),O(I)の包含関係に基づいて、モジュールAとモジュールIとの間の階層関係を特定する。すなわち、本実施形態における「階層関係」の情報とは、検索集合の包含関係を反映させた情報であり、概念上の階層関係とはなっていない。したがって、検索式作成支援装置30において、検索式の生成時に組み合わせるモジュールのクラスを様々に変化させることは、検索集合の大きさを様々に変化させることを意味しており、適切な規模の検索集合を得るために行われている。
The search formula
検索集合N(A)が検索集合O(I)よりも大きな集合である場合(N(A)≧O(I))、検索式作成支援装置30は、式(2)で表されるような、包含関係を表現する指標値Cを算出し、指標値Cが式(3)で例示される判断基準を満足する場合、モジュールIはモジュールAの下位の階層に位置すると判断して、モジュールAの階層データにモジュールIの管理番号を転記する。
When the search set N (A) is a larger set than the search set O (I) (N (A) ≧ O (I)), the search formula
ここで、指標値Cは、図17に示すように、検索集合O(I)のうち、検索集合N(A)に含まれない部分(ハッチング部分)Pの割合を示しており、検索式作成支援装置30は、指標値Cがある程度小さければ(例えば、0≦Cmin≦0.1)、検索集合O(I)は検索集合N(A)に実質的に包含されると判断している。
Here, as shown in FIG. 17, the index value C indicates the ratio of the portion (hatched portion) P that is not included in the search set N (A) in the search set O (I). If the index value C is small to some extent (for example, 0 ≦ Cmin ≦ 0.1), the
逆に、検索集合O(I)が検索集合N(A)よりも大きな集合である場合(O(I)≧N(A))、情報検索装置10は、式(4)で表されるような、包含関係を表現する指標値Cを算出し、指標値Cが式(3)で例示される判断基準を満足する場合、モジュールAはモジュールIの下位の階層に位置すると判断して、モジュールIの階層データにモジュールAの管理番号を転記する。
Conversely, when the search set O (I) is a larger set than the search set N (A) (O (I) ≧ N (A)), the
そして、検索式作成支援装置30は、同様の検討を、モジュールAとモジュールII及びモジュールIIIとの間についても実施することにより、階層関係自動チェックを完了する。
Then, the retrieval formula
<4 外国語検索の支援>
上述の説明では、日本語の検索式資産を組み合わせて日本語の検索式を生成する場合を例示したが、検索式生成支援装置は、外国語検索における外国語の検索式の生成の支援にも適用可能である。
<4 Foreign language search support>
In the above description, the case where a Japanese search formula is generated by combining Japanese search formula assets has been exemplified. However, the search formula generation support device also supports generation of a foreign language search formula in a foreign language search. Applicable.
これは、外国語の検索式資産を組み合わせる場合であっても、その呼び出しには必ずしも外国語検索についての知識を必要とせず、日本語検索と同様に行うことができることによるものである。 This is because even when a search expression asset in a foreign language is combined, the call does not necessarily require knowledge about the foreign language search and can be performed in the same manner as a Japanese search.
例えば、図18に示すように、複雑な英語の検索式資産KW((CTP+platesetter+imagesetter+plateimager)*((computer*to)+image+imaging))を含むモジュールMDFに「プレートセッター」というマッチングキーワードが付与されている場合、「プレートセッター」というキーワードを含む文章を入力するだけで、当該検索式資産を呼び出して利用することができる。 For example, as shown in FIG. 18, a module MDF including a complex English-language search expression asset KW ((CTP + platesetter + imagesetter + plateimager) * ((computer * to) + image + imaging)) is called “plate setter”. When the matching keyword is given, the searchable asset can be called and used simply by inputting a sentence including the keyword “plate setter”.
<5 その他>
上述の検索式作成支援装置30を用いれば、検索式資産が組み合わされて情報の検索のための検索式が自動的に生成されるので、検索式資産の再利用が容易になる。また、検索式作成支援装置30では、生成された検索式は、モジュールの「タイプ」や「クラス」が反映されたものとなっているので、「タイプ」や「クラス」を適切に設定しておけば、適切な検索式を得ることが可能である。
<5 Others>
If the above-described search formula
10 情報検索装置
20 データベース
30 検索式作成支援装置
31 本体部
32 出力部
33 表示部
41 文章入力画面
42 モジュール確認画面
43 検索結果確認画面
44 警告画面
45 新規モジュール内容書込画面
46 階層関係自動チェック画面
311 CPU
312 メモリ
315 キーワード抽出部
316 モジュール抽出部
317 検索式生成部
318 適切性評価部
319 検索式作成支援プログラム
SF 検索式
SFS 検索式資産
IF1 第1情報
IF2 第2情報
EMD 抽出モジュール群
DESCRIPTION OF
312
Claims (11)
検索式資産と前記検索式資産の組み合わせの基礎となる第1情報とを関連付けた、検索式資産の管理の単位であるモジュールを記憶する記憶手段と、
前記検索式の生成の基礎となるモジュールを、前記記憶手段に記憶された複数のモジュールの中から抽出する抽出手段と、
前記抽出手段により抽出されたモジュールの集合である抽出モジュール群に含まれる前記第1情報に基づいて、前記抽出モジュール群に含まれる前記検索式資産を組み合わせることにより、前記検索式を生成する生成手段と、
を備えることを特徴とする検索式作成支援装置。 A search formula creation support device that supports creation of a search formula for searching information,
Storage means for storing a module, which is a unit of management of a searchable asset, associated with the searchable asset and first information that is a basis of the combination of the searchable asset;
Extraction means for extracting a module serving as a basis for generating the search expression from a plurality of modules stored in the storage means;
Generation means for generating the search expression by combining the search expression assets included in the extraction module group based on the first information included in the extraction module group which is a set of modules extracted by the extraction means. When,
A search expression creation support apparatus comprising:
前記第1情報に、所定の分類基準によるモジュールの分類情報が含まれており、
前記生成手段は、前記分類情報に基づいて前記検索式資産を組み合わせることを特徴とする検索式作成支援装置。 The search expression creation support device according to claim 1,
The first information includes module classification information according to a predetermined classification criterion,
The search means creation support device, wherein the generation means combines the search expression assets based on the classification information.
前記第1情報に、モジュール間の関係を定義する関係情報が含まれており、
前記生成手段は、前記関係情報に基づいて前記検索式資産を組み合わせることを特徴とする検索式作成支援装置。 In the retrieval formula creation support device according to claim 1 or 2,
The first information includes relationship information that defines a relationship between modules,
The search means creation support device, wherein the generation means combines the search expression assets based on the relation information.
前記関係情報が、前記検索式資産を用いた検索により得られる検索集合の包含関係を反映した、モジュール間の階層関係の情報であることを特徴とする検索式作成支援装置。 In the retrieval formula creation support device according to claim 3,
A retrieval formula creation support apparatus, wherein the relationship information is information on a hierarchical relationship between modules reflecting an inclusion relationship of a retrieval set obtained by retrieval using the retrieval formula asset.
前記モジュールにおいては、前記検索式資産と前記検索式資産の抽出の基礎となる第2情報とが関連付けられており、
前記抽出手段は、新たに検索を行う際に与えられる入力情報に対応した前記第2情報を有するモジュールを抽出することを特徴とする検索式作成支援装置。 The retrieval formula creation support device according to any one of claims 1 to 4,
In the module, the searchable asset is associated with second information that is a basis for extracting the searchable asset,
The extraction formula creation support apparatus, wherein the extraction means extracts a module having the second information corresponding to input information given when a new search is performed.
前記第2情報に、前記入力情報との比較対象となる比較対象キーワードが含まれており、
前記抽出手段は、前記入力情報に含まれるキーワードと前記比較対象キーワードとの比較結果に基づいてモジュールを抽出することを特徴とする検索式作成支援装置。 In the retrieval formula creation support device according to claim 5,
The second information includes a comparison target keyword to be compared with the input information,
The extraction formula creation support apparatus, wherein the extraction unit extracts a module based on a comparison result between a keyword included in the input information and the comparison target keyword.
前記入力情報として自然文で入力された文章から前記キーワードを抽出するキーワード抽出手段、
をさらに備えることを特徴とする検索式作成支援装置。 The retrieval formula creation support device according to claim 6,
Keyword extracting means for extracting the keyword from a sentence input in natural sentences as the input information;
A search expression creation support apparatus, further comprising:
操作者による操作入力に応答して前記抽出モジュール群からのモジュールの取捨選択を行う取捨選択手段、
をさらに備えることを特徴とする検索式作成支援装置。 In the retrieval formula creation support device according to any one of claims 1 to 7,
Sorting selection means for selecting a module from the extraction module group in response to an operation input by an operator,
A search expression creation support apparatus, further comprising:
前記生成手段により生成された検索式の適切性を所定の評価基準に基づいて評価する評価手段、
をさらに備えることを特徴とする検索式作成支援装置。 The retrieval formula creation support device according to any one of claims 1 to 8,
Evaluation means for evaluating the appropriateness of the search expression generated by the generation means based on a predetermined evaluation criterion;
A search expression creation support apparatus, further comprising:
検索式資産と前記検索式資産の組み合わせの基礎となる第1情報とを関連付けた、検索式資産の管理の単位であるモジュールを記憶する記憶手順と、
前記検索式の生成の基礎となるモジュールを、前記記憶手順で記憶された複数のモジュールの中から抽出する抽出手順と、
前記抽出手順で抽出されたモジュールの集合である抽出モジュール群に含まれる前記第1情報に基づいて、前記抽出モジュール群に含まれる前記検索式資産を組み合わせることにより、前記検索式を生成する生成手順と、
を実行させることを特徴とするプログラム。 A program that, when executed on a computer, supports creation of a search expression for searching for information, the program being stored in the computer,
A storage procedure for storing a module, which is a unit of management of a searchable asset, associated with the searchable asset and first information that is a basis of a combination of the searchable asset;
An extraction procedure for extracting a module serving as a basis for generating the search expression from the plurality of modules stored in the storage procedure;
Generating procedure for generating the search formula by combining the search formula assets included in the extraction module group based on the first information included in the extraction module group that is a set of modules extracted in the extraction procedure When,
A program characterized by having executed.
請求項1ないし請求項9のいずれかに記載の検索式作成支援装置と、
前記検索式作成支援装置が出力した検索式を用いて情報の検索を行う情報検索装置と、
を備えることを特徴とする情報検索システム。 An information retrieval system,
The retrieval formula creation support device according to any one of claims 1 to 9,
An information search device that searches for information using the search formula output by the search formula creation support device;
An information retrieval system comprising:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005202652A JP2007025756A (en) | 2005-07-12 | 2005-07-12 | Search formula generation support device, program, and information retrieval system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005202652A JP2007025756A (en) | 2005-07-12 | 2005-07-12 | Search formula generation support device, program, and information retrieval system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2007025756A true JP2007025756A (en) | 2007-02-01 |
Family
ID=37786476
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005202652A Pending JP2007025756A (en) | 2005-07-12 | 2005-07-12 | Search formula generation support device, program, and information retrieval system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2007025756A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011043973A (en) * | 2009-08-20 | 2011-03-03 | Yahoo Japan Corp | Device and method for supporting information access |
| US8666972B2 (en) | 2009-02-12 | 2014-03-04 | International Business Machines Corporation | System and method for content management and determination of search conditions |
| JP2024501501A (en) * | 2020-12-23 | 2024-01-12 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Tuning query generation patterns |
-
2005
- 2005-07-12 JP JP2005202652A patent/JP2007025756A/en active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8666972B2 (en) | 2009-02-12 | 2014-03-04 | International Business Machines Corporation | System and method for content management and determination of search conditions |
| JP2011043973A (en) * | 2009-08-20 | 2011-03-03 | Yahoo Japan Corp | Device and method for supporting information access |
| JP2024501501A (en) * | 2020-12-23 | 2024-01-12 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Tuning query generation patterns |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9519706B2 (en) | Multiple rule development support for text analytics | |
| US7890533B2 (en) | Method and system for information extraction and modeling | |
| US8131779B2 (en) | System and method for interactive multi-dimensional visual representation of information content and properties | |
| Sawyer et al. | Shallow knowledge as an aid to deep understanding in early phase requirements engineering | |
| JP4374014B2 (en) | Index generating apparatus and program thereof | |
| US6353817B1 (en) | Multi-user system for creating and maintaining a medical-decision-making knowledge base | |
| US9922383B2 (en) | Patent claims analysis system and method | |
| US8671101B2 (en) | System for requirement identification and analysis based on capability model structure | |
| WO2021175009A1 (en) | Early warning event graph construction method and apparatus, device, and storage medium | |
| US8296290B2 (en) | System and method for propagating classification decisions | |
| JP4444867B2 (en) | Business process model creation support system and program, and business process model creation processing method | |
| CN107148616A (en) | The efficient annotation system controlled for distributed version | |
| JPH08255172A (en) | Document search system | |
| US20190179839A1 (en) | Methods for evaluating term support in patent-related documents | |
| JP2007219929A (en) | Sensitivity evaluation system and method | |
| CN116756373A (en) | Project review expert screening method, system and medium based on knowledge graph update | |
| WO2008094970A9 (en) | Method and apparatus for creating a tool for generating an index for a document | |
| JP2007188144A (en) | Workflow management system | |
| JP5432941B2 (en) | Emergency response work support apparatus and emergency response work support method | |
| Vanetik et al. | Summarizing financial reports with positional language model | |
| JP2007025756A (en) | Search formula generation support device, program, and information retrieval system | |
| JP2008117066A (en) | Software development support method, software development support device, software development support program, and computer system | |
| JP4389102B2 (en) | Technical literature search system | |
| JP2006190023A (en) | Electronic document management device | |
| JP2012226697A (en) | Wbs creation system and wbs creation method |