[go: up one dir, main page]

JPH03276368A - Document storing/retrieving system - Google Patents

Document storing/retrieving system

Info

Publication number
JPH03276368A
JPH03276368A JP2078023A JP7802390A JPH03276368A JP H03276368 A JPH03276368 A JP H03276368A JP 2078023 A JP2078023 A JP 2078023A JP 7802390 A JP7802390 A JP 7802390A JP H03276368 A JPH03276368 A JP H03276368A
Authority
JP
Japan
Prior art keywords
document
index
information file
file
key word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2078023A
Other languages
Japanese (ja)
Inventor
Kazutaka Tokunaga
徳永 和孝
Katsu Ikeda
池田 克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2078023A priority Critical patent/JPH03276368A/en
Publication of JPH03276368A publication Critical patent/JPH03276368A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To improve the response of a document storing/retrieving system at storage of a document by generating a trigger for an index generating request in order to complete the storage processing and generating a document retrieving index in a delay type and an asynchronous type in a different route from the storage processing based on a trigger. CONSTITUTION:A key word group or a key word group ID group is added to a stored document 1, and the document control information and a document main body are stored in a document control information file 3 by a document store means 2. Then an index generation request of the corresponding document is stacked into a trigger information file 4. Thus the document is stored. An index generation means 5 works when the index generating request is stacked into the file 4. An index key word group ID information file 6 is searched based on a key word group ID and the trigger information of the file 4 for a key word group and a key word group ID group. The keyword group thus obtained and the document are added to the index and the index information is stored in an index information file 7. A document retrieving means 8 searches the file 7 based on a retrieving key word 9 and takes it out as a retrieved document 10.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文書を格納し、また索引により文書を検索す
る文書格納検索システムに関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a document storage and retrieval system that stores documents and searches for documents using an index.

〔従来の技術〕[Conventional technology]

従来、この種の文書格納検索システムは、文書格納手段
と索引生成手段が同期をとって直列に動作しており、ト
リガ情報ファイルに相当する手段間の処理契機の授受の
必要性もなかった。
Conventionally, in this type of document storage and retrieval system, the document storage means and the index generation means operated in series in synchronization, and there was no need for exchange of processing triggers between the means corresponding to the trigger information file.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

上述した従来の文書格納検索システムは、文書の格納と
検索用の索引生成処理の同期がとられているので、格納
時の応答時間内に索引生成処理の時間が含まれることに
なり、応答性が悪し)とり)つ欠点がある。
In the conventional document storage and retrieval system described above, document storage and search index generation processing are synchronized, so the response time for storage includes the index generation processing time, resulting in improved responsiveness. There are some drawbacks.

〔課題を解決するための手段〕[Means to solve the problem]

本発明の文書格納検索システムは、検索用のキーワード
群または事前に設定されているキーワード群を識別する
キーワード群識別ID群が付加された文書管理情報およ
び文書本体を格納するための文書管理情報ファイルと、 索引の生成要求をスタックするためのトリガ情報ファイ
ルと、 前記文書管理情報及びトリガ情報を格納する文書格納手
段と、 前記キーワードまたはキーワード群識別IDで検索した
キーワードに基づいて前記トリガ情報に示された文書の
索引を生成する索引生成手段と、 前記キーワード群識別IDで対応づけられた一連のキー
ワードを取出すための索引生成用キーワード群識別ID
情報ファイルと、 索引情報を格納する索引情報ファイルと、検索要求時に
索引情報ファイル中より該当の文書を見つけ、文書管理
情報ファイル中より該当文書を取出す文書検索手段とを
有してl/入ることを特徴とする。
The document storage and retrieval system of the present invention provides a document management information file for storing document management information and a document body to which a keyword group identification ID group for identifying a keyword group for search or a keyword group set in advance is added. a trigger information file for stacking index generation requests; a document storage means for storing the document management information and the trigger information; an index generation means for generating an index of the document, and an index generation keyword group identification ID for extracting a series of keywords associated with the keyword group identification ID.
An information file, an index information file for storing index information, and a document search means for finding a corresponding document in the index information file at the time of a search request and retrieving the corresponding document from the document management information file. It is characterized by

〔実施例〕〔Example〕

次に、本発明について図面を参照して説明する。 Next, the present invention will be explained with reference to the drawings.

第1図は本発明の一実施例の構成である。FIG. 1 shows the configuration of an embodiment of the present invention.

1は格納文書、2は文書格納手段、3は文書管理情報フ
ァイル、4はトリガ情報ファイルである。格納文書1は
キーワード群またはキーワード群識別ID群が付加され
ており、文書格納手段2によって文書管理情報及び文書
本体が文書管理情報ファイル3に格納され、当該文書の
索引生成要求がトリガ情報ファイル4にスタ・yりされ
、文書格納処理は終了する。
1 is a stored document, 2 is a document storage means, 3 is a document management information file, and 4 is a trigger information file. A keyword group or a keyword group identification ID group is added to the stored document 1, the document storage means 2 stores the document management information and the document body in the document management information file 3, and the index generation request for the document is sent to the trigger information file 4. The document storage process is completed.

5は索引生成手段、6は索引生成用キーワード群識別I
D情報ファイル、7は索引情報ファイルで、トリガ情報
ファイル4に索引生成要求がスタックされた契機で、索
引生成手段5が動作する。
5 is an index generation means; 6 is an index generation keyword group identification I;
The D information file 7 is an index information file, and when an index generation request is stacked in the trigger information file 4, the index generation means 5 operates.

そして、トリガ情報ファイル4のトリガ情報により、該
当する格納文書のキーワード群、及びキーワード群識別
IDの時は、キーワード群識別IDで索引生成用キーワ
ード群識別ID情報ファイル6をサーチして得られたキ
ーワード群と格納文書を索引づけし索引情報を索引情報
ファイル7に格納する。
Then, according to the trigger information in the trigger information file 4, when the keyword group and keyword group identification ID of the corresponding stored document are found, the keyword group identification ID is obtained by searching the index generation keyword group identification ID information file 6 using the keyword group identification ID. The keyword group and the stored document are indexed and the index information is stored in the index information file 7.

8は文書検索手段、9は検索用キーワード、10は検索
文書であり、文書検索手段8は与えられた検索用キーワ
ード9を基に索引情報ファイル7をサーチし、該当文書
を検索文書10として取出す。
8 is a document search means, 9 is a search keyword, and 10 is a search document. The document search means 8 searches the index information file 7 based on the given search keyword 9 and extracts the corresponding document as the search document 10. .

第2図は文書管理情報ファイル3中の文書管理情報及び
文書本体の表現形式を示しており、文書を一意に識別す
る文書識別子a1、文書格納時に指定された、いくつか
のキーワードまたはキーワード群識別IDa2、当該文
書の索引が索引情報ファイル中に登録されたか否かの索
引反映ステータスa3および文書本体a4から構成され
る。
FIG. 2 shows the expression format of the document management information and document body in the document management information file 3, including a document identifier a1 that uniquely identifies the document, and several keywords or keyword group identifiers specified when storing the document. It consists of IDa2, index reflection status a3 indicating whether the index of the document has been registered in the index information file, and document body a4.

第3図はトリガ情報ファイル4中のトリガ情報の表現形
式を示しており、格納文書を一意に識別する文書識別子
b!および文書に対する操作(登録、変更、削除)を示
すアクションb2から構成される。
FIG. 3 shows the expression format of the trigger information in the trigger information file 4, in which a document identifier b! that uniquely identifies a stored document is used. and an action b2 indicating an operation (registration, modification, deletion) on the document.

第4図は索引生成用キーワード群識別ID情報ファイル
6中の索引生成用キーワード群識別ID情報の表現形式
を示しており、格納文書1に付加されたキーワード群識
別IDを基にキーワード群識別IDclがサーチされ、
対応するキーワードc2が取出せ、取出されたキーワー
ドC2に従って索引情報を作成する。
FIG. 4 shows the expression format of the index generation keyword group identification ID information in the index generation keyword group identification ID information file 6, in which the keyword group identification IDcl is created based on the keyword group identification ID added to the stored document 1. is searched,
The corresponding keyword c2 is extracted, and index information is created according to the extracted keyword C2.

第5図は索引情報ファイル7中の索引情報の表現形式を
示しており、索引となるキーワードdlおよびキーワー
ドdlと索引づけられた文書を一意に識別する文書識別
子d2から構成される。
FIG. 5 shows the expression format of the index information in the index information file 7, which is composed of a keyword dl serving as an index and a document identifier d2 that uniquely identifies the keyword dl and the indexed document.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明は、文書の格納時に索引生成
要求というトリガを発生させて格納処理を完了させ、格
納ルートとは別ルートで当該トリガに基づき文書検索用
の索引生成処理を遅延型、非同期型で行うことにより、
文書の格納時の応答性を高速化できる効果がある。
As explained above, the present invention generates a trigger called an index generation request when storing a document, completes the storage process, and performs index generation process for document search based on the trigger in a route different from the storage route. By doing it asynchronously,
This has the effect of speeding up responsiveness when storing documents.

また、格納直後に当該文書を検索するということは現実
には発生しないことから、索引生成処理が少し遅延して
も実用上の問題点は発生しない。
Further, since searching for the document immediately after storage does not actually occur, even if the index generation process is slightly delayed, no practical problem occurs.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の実施例の構成を示すブロック構成図、
第2図は文書管理情報及び文書本体の形式を示す図、第
3図はトリガ情報の形式を示す図、第4図は索引生成用
キーワード群識別ID情報の形式を示す図、第5図は索
引情報の形式を示す図である。 1・・・格納文書、2・・・文書格納手段、3・・・文
書管理情報ファイル、4・・・トリガ情報ファイル、5
・・・索引生成手段、6・・・索引生成用キーワード群
識別ID情報ファイル、7・・・索引情報ファイル、8
・・・文書検索手段、9・・・検索用キーワード、10
・・・検索文書。
FIG. 1 is a block configuration diagram showing the configuration of an embodiment of the present invention;
Figure 2 shows the format of document management information and document body, Figure 3 shows the format of trigger information, Figure 4 shows the format of index generation keyword group identification ID information, and Figure 5 shows the format of the keyword group identification ID information for index generation. It is a figure showing the format of index information. DESCRIPTION OF SYMBOLS 1...Stored document, 2...Document storage means, 3...Document management information file, 4...Trigger information file, 5
. . . Index generation means, 6 . . . Index generation keyword group identification ID information file, 7 . . . Index information file, 8
...Document search means, 9...Search keyword, 10
...Search document.

Claims (1)

【特許請求の範囲】 検索用のキーワード群または事前に設定されているキー
ワード群を識別するキーワード群識別ID群が付加され
た文書管理情報および文書本体を格納するための文書管
理情報ファイルと、索引の生成要求をスタックするため
のトリガ情報ファイルと、 前記文書管理情報及びトリガ情報を格納する文書格納手
段と、 前記キーワードまたはキーワード群識別IDで検索した
キーワードに基づいて前記トリガ情報に示された文書の
索引を生成する索引生成手段と、 前記キーワード群識別IDで対応づけられた一連のキー
ワードを取出すための索引生成用キーワード群識別ID
情報ファイルと、 索引情報を格納する索引情報ファイルと、 検索要求時に索引情報ファイル中より該当の文書を見つ
け、文書管理情報ファイル中より該当文書を取出す文書
検索手段とを有していることを特徴とする文書格納検索
システム。
[Claims] A document management information file for storing document management information and a document body to which a keyword group identification ID group for identifying a keyword group for search or a keyword group set in advance is added, and an index. a trigger information file for stacking generation requests; a document storage means for storing the document management information and the trigger information; and a document storage means for storing the document management information and the trigger information; an index generation means for generating an index; and an index generation keyword group identification ID for extracting a series of keywords associated with the keyword group identification ID.
The present invention is characterized by comprising an information file, an index information file storing index information, and a document search means for finding a corresponding document in the index information file and retrieving the corresponding document from the document management information file at the time of a search request. A document storage and retrieval system.
JP2078023A 1990-03-27 1990-03-27 Document storing/retrieving system Pending JPH03276368A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2078023A JPH03276368A (en) 1990-03-27 1990-03-27 Document storing/retrieving system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2078023A JPH03276368A (en) 1990-03-27 1990-03-27 Document storing/retrieving system

Publications (1)

Publication Number Publication Date
JPH03276368A true JPH03276368A (en) 1991-12-06

Family

ID=13650213

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2078023A Pending JPH03276368A (en) 1990-03-27 1990-03-27 Document storing/retrieving system

Country Status (1)

Country Link
JP (1) JPH03276368A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8005665B2 (en) 1998-09-28 2011-08-23 Schukhaus Group Gmbh, Llc Method and apparatus for generating a language independent document abstract
US8489610B2 (en) 2008-03-28 2013-07-16 Nec Corporation Method, system and program for information re-organization

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8005665B2 (en) 1998-09-28 2011-08-23 Schukhaus Group Gmbh, Llc Method and apparatus for generating a language independent document abstract
US8489610B2 (en) 2008-03-28 2013-07-16 Nec Corporation Method, system and program for information re-organization

Similar Documents

Publication Publication Date Title
CN109726177A (en) A kind of mass file subregion indexing means based on HBase
CN109284273B (en) Massive small file query method and system adopting suffix array index
CN108984626B (en) Data processing method and device and server
JPH03276368A (en) Document storing/retrieving system
CN115543993A (en) Data processing method and device, electronic equipment and storage medium
KR20040039691A (en) Indexing method of information searching system
CN116737666A (en) Efficient large data storage file structure and data storage method
JPH09305622A (en) Database management method and system having document retrieval function
JPH02297670A (en) Data base retrieving system
US8166018B2 (en) Browsing a list of data items
TW448386B (en) Method and apparatus for managing electronic data with variable length
JPH11143749A (en) Relational database management system and data management method
JP3008500B2 (en) Update record reading mechanism
JP2844885B2 (en) Library type file directory extension method
JPH04342070A (en) Method for retrieving repetition data in distributed type relation data base
CN119598024A (en) Unified knowledge base retrieval method and system for multi-scene RAG
JP2861548B2 (en) Multiple host method
JPH0820988B2 (en) File management system
JPH10240744A (en) System for processing retrieval of range division chart and method therefor and recording medium for recording retrieval processing program
JPH05233313A (en) Symbol table processing system
JPH0762850B2 (en) Information retrieval device
JPH02208737A (en) Queue control system
JPH01281527A (en) Index key extracting system
JPH05342257A (en) Natural language interpreter method
JPH01180632A (en) Record retrieving system