JP3298288B2 - Document input device - Google Patents
Document input deviceInfo
- Publication number
- JP3298288B2 JP3298288B2 JP01756594A JP1756594A JP3298288B2 JP 3298288 B2 JP3298288 B2 JP 3298288B2 JP 01756594 A JP01756594 A JP 01756594A JP 1756594 A JP1756594 A JP 1756594A JP 3298288 B2 JP3298288 B2 JP 3298288B2
- Authority
- JP
- Japan
- Prior art keywords
- priority
- dictionary
- word dictionary
- word
- notation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Document Processing Apparatus (AREA)
Description
【0001】[0001]
【産業上の利用分野】本発明は、日本語のかな漢字変換
において、ユーザが選択した候補を優先的に提示するこ
とにより、効率的に日本語の入力を行なうことを可能と
する文書入力装置に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document input device capable of efficiently inputting Japanese by preferentially presenting a candidate selected by a user in Japanese kana-kanji conversion. Things.
【0002】[0002]
【従来の技術】日本語の文書を作成する場合、従来か
ら、かなを入力し、漢字に変換する方法が用いられてき
た。かなに対応する漢字は一般に複数あるため、ユーザ
は、所望の漢字が表示されるまで、再変換を繰り返さな
ければならない。再変換操作の回数を減らすために、最
新に使用された漢字をRAMなどの記憶領域に記録して
おき、同じ読みが入力されたときに、記憶領域に記録し
た漢字を優先的に表示する方法が用いられている。2. Description of the Related Art When a Japanese document is created, a method of inputting a kana and converting it into a kanji has conventionally been used. Since there are generally a plurality of kanji corresponding to the kana, the user has to repeat the re-conversion until the desired kanji is displayed. In order to reduce the number of re-conversion operations, the most recently used kanji is recorded in a storage area such as a RAM, and when the same reading is input, the kanji recorded in the storage area is preferentially displayed. Is used.
【0003】この方法においては、ユーザが選択した語
をどのような基準で記憶領域に登録するか、記憶領域に
同音語が存在する場合、どのように更新するかが問題に
なる。また一般に、使用された漢字を記録する領域には
限りがあるため、新しい語を登録するためには、以前に
登録されていた語を記憶領域から削除する必要があり、
どの語を削除するかも問題となる。[0003] In this method, there is a problem in what criteria the word selected by the user is registered in the storage area, and how the word is updated when the same word exists in the storage area. Also, in general, the area for recording used kanji is limited, so to register a new word, it is necessary to delete the previously registered word from the storage area,
It also matters which words to delete.
【0004】従来このような要求に応えるものとして、
図20に示すような方式が提案されている。図20は特
開昭61−862号公報に示された仮名漢字変換処理方
式における単語辞書および優先順位情報の動作を説明す
る説明図である。Conventionally, in response to such a demand,
A system as shown in FIG. 20 has been proposed. FIG. 20 is an explanatory diagram for explaining the operations of the word dictionary and the priority information in the kana-kanji conversion processing system disclosed in Japanese Patent Application Laid-Open No. 61-862.
【0005】図20(a)において、203は単語の読
み及びこの読みを持つ漢字表記の単語よりなる単語グル
ープが複数個格納されているROMであり、図示のよう
に、「きこう」という読みを持つ漢字表記の単語には
「気候」、「寄港」、「寄稿」、「気孔」などがあり、
これらは1個の単語グループを構成している。204は
優先順位情報を格納するために割り当てられたRAM領
域であり、単語の読み及びこの読みを持つ漢字表記の単
語の優先順位情報よりなる優先順位情報グループが複数
個格納されている。優先順位情報グループ内の3、2な
どの数字は、「きこう」という読みの単語グループに格
納されている漢字表記の順序番号であり、優先順位の1
番は単語グループの3番目に格納されている「寄稿」、
優先順位2番は単語グループの2番目に格納されている
「寄港」であることを示している。RAM領域204の
優先順位情報グループ内には3、2しか登録されてない
ので、以降の優先順位はROM203の単語グループに
格納されている順番で、「気候」、「気孔」となる。し
たがってこの例では、優先順位は「寄稿」、「寄港」、
「気候」、「気孔」となる。In FIG. 20A, reference numeral 203 denotes a ROM which stores a plurality of word readings and word groups composed of kanji notation words having the readings. As shown in FIG. The words in kanji notation include "climate", "calling port", "contribution", "stomata", etc.
These make up one word group. Reference numeral 204 denotes a RAM area allocated to store priority information, in which a plurality of priority information groups each including a reading of a word and priority information of a word in kanji notation having the reading are stored. The numbers such as 3 and 2 in the priority information group are the kanji notation sequence numbers stored in the word group reading “Kikou”,
The number is "Contribution" stored in the third word group,
The second priority indicates that "port of call" is stored second in the word group. Since only 3 and 2 are registered in the priority information group of the RAM area 204, the subsequent priorities are “climate” and “porosity” in the order stored in the word group of the ROM 203. So in this example, the priorities are "Contribution", "Port of Call",
"Climate" and "porosity".
【0006】この状態で「きこう」に対する漢字文字列
として単語グループで4番目の「気孔」が確定される
と、図20(b)のように「きこう 4、3、2」とい
う優先順位情報グループがRAM領域204の先頭に書
き込まれ、優先順位は「気孔」、「寄稿」、「寄港」、
「気候」となる。この際、RAM領域204に既に格納
されている優先順位情報グループは後方にシフトされ、
入りきらない場合は、一番後ろのものが追い出される。In this state, when the fourth "porosity" in the word group is determined as a kanji character string for "Kiko", the priority information group "Kiko 4, 3, 2" as shown in FIG. Is written at the beginning of the RAM area 204, and the priority order is “porosity”, “contribution”, “port”,
"Climate". At this time, the priority information group already stored in the RAM area 204 is shifted backward,
If not, the last one is kicked out.
【0007】[0007]
【発明が解決しようとする課題】従来の文書入力装置は
上記のように構成されているので、以下の問題点があっ
た。Since the conventional document input device is configured as described above, there are the following problems.
【0008】第1に、優先語辞書への登録は、単語毎に
かなの読みとかな漢字混じり(以下、漢字混じりとい
う)の表記との対応で行われており、文節の構造を考慮
していなかった。従来の優先語辞書への登録は、読みの
単位が自立語なため、例えば「きしゃできしゃした」と
いう文を「汽車で帰社した」と変換し、「きしゃ」とい
う読みに対する漢字を優先語辞書に登録する場合、後か
ら登録される「帰社」の方が優先されてしまうので、最
初の「汽車で」を第1候補とすることができない。これ
は、優先語辞書への登録を、「きしゃで」あるいは「き
しゃした」という文節単位で行なっていないためであ
る。First, registration in the priority word dictionary is performed in correspondence with kana reading and kana kanji mixture (hereinafter referred to as kanji mixture) notation for each word, and does not consider the structure of phrases. Was. In the conventional registration in the preferred word dictionary, since the unit of reading is an independent word, for example, the sentence "Kishakushasha" is converted to "Returned by train", and the kanji for the reading "Kisha" is prioritized When registering in the word dictionary, "homecoming" registered later has higher priority, so that the first "by train" cannot be the first candidate. This is because the registration in the preferred word dictionary is not performed for each phrase “Kishade” or “Kishashita”.
【0009】第2に、優先語辞書の記憶領域を有効に利
用するために行なう優先語辞書からの削除は、優先語辞
書への登録の古い語から行われて行き、重要な単語と一
般の単語との区別をしていなかった。使用された漢字を
記録する優先語辞書領域には限りがあるため、新しい語
を登録するためには、以前に登録されていた語を記憶領
域から削除しなければならない場合がある。例えば「き
しゃ」に関しては「汽車」、「帰社」など異なる表記が
同じ文章の中で両方現れる場合も多く、後から登録され
て優先される語が正解にならない確率も高い。しかし、
「たかひろ」という人名に関しては「高広」、「隆
宏」、「孝宏」などの異なる表記が同じ文章内で現れる
場合は少なく、ユーザが選択した表記が同じ文章内に再
び現れる確率が高い。したがって、優先語辞書からの削
除時は、再び現れる確率が高い人名などは重要な単語と
して扱い、再び現れる確率が低い「汽車」や「帰社」を
先に削除した方が良いが、従来は重要な単語と一般の単
語との区別をせずに削除していた。Second, deletion from the priority word dictionary, which is performed to make effective use of the storage area of the priority word dictionary, is performed from old words registered in the priority word dictionary, and important words and general words are deleted. We did not distinguish it from words. Since the preferred word dictionary area for recording used kanji is limited, in order to register a new word, it may be necessary to delete a previously registered word from the storage area. For example, with respect to "kisha", different notations such as "car" and "return" often appear in the same sentence in many cases, and there is a high probability that a word registered later and given priority will not be the correct answer. But,
Regarding the personal name “Takahiro”, there are few cases where different notations such as “Takahiro”, “Takahiro”, and “Takahiro” appear in the same sentence, and the notation selected by the user is likely to appear again in the same sentence. Therefore, when deleting from the priority word dictionary, it is better to treat personal names and the like that have a high probability of reappearing as important words, and delete “train” and “return to home” that have a low probability of reappearing first. Words were deleted without distinguishing them from ordinary words.
【0010】また、再変換キーを何度も押すなど、目的
とする表記を得るための操作量が多かった候補は、忘れ
たときに再び多くの操作を繰り返さなければならないた
め、少ない操作量で得られる候補よりも重要視したほう
が良い語であると言えるが、従来は操作量を考慮してい
なかった。A candidate having a large amount of operation to obtain a target notation, such as pressing the reconversion key many times, has to repeat many operations again when it is forgotten. It can be said that it is better to give importance to the word than the candidate obtained, but conventionally, the operation amount has not been considered.
【0011】第3に、1つの読みに対して優先語辞書に
記録しておく同音語の候補数の最大値は、全ての読みに
対し同じであった。同音語の候補数の多い読みは、再変
換を行う可能性が高いため、候補数の少ない読みよりも
数多くの同音語を覚えておいた方が好ましい。また、得
るための操作量が多い語を、少ない操作量で得られる同
音語のために優先語辞書から削除されないようにした方
がよい場合もある。しかし従来は、優先語辞書への記録
又は削除の際には同音語の候補数を考慮していなかっ
た。Third, the maximum number of homophone candidates to be recorded in the priority word dictionary for one reading is the same for all readings. Since readings with a large number of homophone candidates are likely to be re-converted, it is preferable to memorize a large number of homophones rather than readings with a small number of candidates. In some cases, it may be better not to delete words that require a large amount of operation from the priority word dictionary due to homophones that can be obtained with a small amount of operation. However, conventionally, the number of homophone candidates has not been taken into account when recording or deleting in the priority word dictionary.
【0012】第4に、最新使用の語の優先語辞書への記
録は、語と語のつながりを考慮していなかった。例え
ば、「怪現象」の「怪」は、「現象」という語に隣接し
ているという文脈の中で、他の同音語より優先されるの
であり、他の文脈で現れた「かい」という読みに対して
は、「怪」でない「会」や「解」などの使用頻度が高い
候補が選択される可能性が高い。Fourth, recording of the most recently used word in the preferred word dictionary does not take into account the connection between words. For example, in the context of "mysterious phenomena", "mystery" takes precedence over other homonyms in the context of being adjacent to the word "phenomenon". For, candidates that are frequently used, such as "kai" and "solution" that are not "mysteries", are likely to be selected.
【0013】本発明は、以上のような問題点を解消する
ためになされたもので、かな漢字変換において、ユーザ
の使用傾向にあった語を適切に表示し、さらに、ユーザ
の使用した語を記録する記憶領域を有効に利用する文書
入力装置を得るものである。SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problems. In kana-kanji conversion, words that are used by a user are appropriately displayed, and words used by the user are recorded. To obtain a document input device that effectively uses a storage area to be used.
【0014】[0014]
【課題を解決するための手段】本発明に係る文書入力装
置は、日本語文をかなで入力する入力手段と、かなに対
応する漢字表記とこの表記の属性情報を格納した基本辞
書と、上記入力手段によって入力されたかな文字列の部
分文字列で上記基本辞書を検索する基本辞書検索手段
と、この基本辞書検索手段によって検索した情報から入
力かな文字列を日本語の文節に区切り漢字混じり表記を
生成する文節生成手段と、漢字混じり表記の候補を表示
する表示手段と、この表示手段に表示した候補から上記
入力手段によって選択された候補の自立語が記録される
優先語辞書と、上記文節生成手段によって区切られた文
節中の自立語の読みから上記優先語辞書を検索する優先
語辞書検索手段とを備えた文書入力装置において、上記
入力手段によって選択された候補候補を上記優先語辞書
に記録するとともに、上記候補の品詞によって重要度を
決定し、その重要度に応じて上記優先語辞書に記録され
る期間の基準を変える優先度決定手段を設け、上記優先
語辞書検索手段は、上記文節生成手段によって区切られ
た文節の読みから上記優先語辞書を検索し、上記重要度
に基づく最新使用の候補を優先する構成としたものであ
る。A document input device according to the present invention.
The input means for inputting Japanese sentences in kana, the basic dictionary storing the kanji notation corresponding to kana and the attribute information of this notation, and the basic character string of the kana character string input by the input means described above. A basic dictionary search unit for searching a dictionary, a phrase generation unit for separating an input kana character string into Japanese phrases from information retrieved by the basic dictionary search unit to generate a kanji mixed notation, and displaying candidates of a kanji mixed notation A display means, a priority word dictionary in which independent words of the candidate selected by the input means are recorded from the candidates displayed on the display means, and the priority word dictionary from the reading of the independent words in the phrase divided by the phrase generation means. In a document input device provided with a preferred word dictionary search means for searching a word dictionary, a candidate candidate selected by the input means is recorded in the preferred word dictionary. Determining the severity by the part of speech of the candidate, provided priority determining means for changing the reference time period to be recorded in the priority dictionary in accordance with their importance, the preferred term dictionary search means, by the phrase generating means The preferred word dictionary is searched from the reading of the separated phrases, and the latest use candidate based on the importance is prioritized.
【0015】[0015]
【0016】また本発明に係る文書入力装置は、その優
先度決定手段が、上記基本辞書に登録されているかなに
対する同音語数から上記重要度を決定し、この決定した
重要度にしたがって上記優先語辞書に記録する記録期間
を変える属性優先度決定手段で構成したものである。 Also, the document input device according to the present invention has its advantages.
Whether the previous determination means is registered in the basic dictionary
The priority level is determined from the number of homophones for the attribute words, and the attribute priority level determination means changes the recording period for recording in the priority word dictionary according to the determined importance level.
【0017】また本発明に係る文書入力装置は、上記優
先度決定手段が、上記基本辞書に登録されているかなに
対する同音語数から上記重要度を決定し、この決定した
重要度にしたがって上記優先語辞書に記録する同音語数
を変える変えることで、上記優先語辞書に記録される期
間の基準を変える基本登録同音語数決定手段で構成した
ものである。Further, the document input device according to the present invention has the above advantage.
The priority determining means determines the importance based on the number of homophones for the kana registered in the basic dictionary, and changes the number of homophones recorded in the priority word dictionary according to the determined importance, thereby changing the priority. Period recorded in the word dictionary
This is constituted by a basic registration homonym number determining means for changing the reference between them.
【0018】また本発明に係る文書入力装置は、上記優
先度決定手段が、目的の漢字混じり候補が選択されるま
でに入力された操作量の合計を計る操作量総計手段と、
この操作量の合計から上記重要度を決定し、この決定し
た重要度と上記選択された候補を上記優先語辞書に記録
し、記録した重要度にしたがって上記優先語辞書に記録
する記録期間を変える操作量優先度決定手段とで構成し
たものである。Further, in the document input device according to the present invention, the priority determination means may include an operation amount totalization means for measuring a total of operation amounts input until a target kanji mixture candidate is selected;
The importance is determined from the sum of the operation amounts, the determined importance and the selected candidate are recorded in the priority word dictionary, and a recording period to be recorded in the priority word dictionary is changed according to the recorded importance. And an operation amount priority determining means.
【0019】また本発明に係る文書入力装置は、上記優
先度決定手段が、目的の漢字混じり候補が選択されるま
でに入力された操作量の合計を計る操作量総計手段と、
この操作量の合計から上記重要度を決定し、この決定し
た重要度と上記選択された候補を上記優先語辞書に記録
し、記録した重要度にしたがって上記優先語辞書に記録
する同音語数を変えることで、上記優先語辞書に記録さ
れる期間の基準を変える操作量登録同音語数決定手段と
で構成したものである。Further, in the document input device according to the present invention, the priority determination means may include an operation amount totalization means for measuring a total of operation amounts input until a target kanji mixture candidate is selected;
The importance is determined from the sum of the operation amounts, the determined importance and the selected candidate are recorded in the priority word dictionary, and the number of homophone words to be recorded in the priority word dictionary is changed according to the recorded importance. By doing so, the
And the operation amount registration homonym number determining means for changing the reference of the period of the operation.
【0020】[0020]
【0021】[0021]
【作用】本発明に係る文書入力装置においては、上記入
力手段によってかな文字列が入力され、上記基本辞書検
索手段は入力されたかな文字列の部分文字列で上記基本
辞書を検索し、この検索結果に基づいて上記文節生成手
段は入力かな文字列を日本語の文節に区切り漢字混じり
表記を生成し、上記優先語辞書検索手段は上記文節生成
手段によって区切られた文節の読みから上記優先語辞書
を検索し重要度に基づく最新使用の候補を取りだし、こ
の取り出した候補と上記文節生成手段によって生成され
た漢字混じり表記とを表示した上記表示手段から上記入
力手段によって所望の表記が選択されると、上記優先度
決定手段は、上記入力手段によって選択された候補の品
詞によって重要度を決定し、この決定した重要度にした
がって上記選択された候補を上記優先語辞書に記録し、
また、上記重要度にしたがって上記優先語辞書を更新
し、重要度の高い語を上記優先語辞書に残すようにす
る。In the document input device according to the present invention, a kana character string is input by the input means, and the basic dictionary search means searches the basic dictionary for a partial character string of the input kana character string. On the basis of the result, the phrase generation means separates the input kana character string into Japanese phrases and generates a kanji-mixed notation, and the priority word dictionary search means reads the phrase separated by the phrase generation means from the reading of the priority word dictionary. And retrieves the latest use candidate based on the importance, and when the desired notation is selected by the input means from the display means which displays the extracted candidate and the kanji mixed notation generated by the phrase generation means. , The priority determining means selects the candidate item selected by the input means.
The importance is determined by the lyrics , and the selected candidate is recorded in the preferred word dictionary according to the determined importance,
Further, the priority word dictionary is updated according to the importance, and words having high importance are left in the priority word dictionary.
【0022】[0022]
【0023】また、別な本発明に係る文書入力装置の上
記属性優先度決定手段は、上記基本辞書に登録されてい
るかなに対する同音語数から上記重要度を決定し、この
決定した重要度にしたがって上記優先語辞書に記録する
記録期間を制御し、重要度の高い語は長い間上記優先語
辞書に残すようにする。Further, the attribute priority determining means of the document input device according to the present invention determines the importance from the number of homophones for the kana registered in the basic dictionary, and according to the determined importance. The recording period to be recorded in the priority word dictionary is controlled so that words of high importance are left in the priority word dictionary for a long time.
【0024】また、別な本発明に係る文書入力装置の上
記基本登録同音語数決定手段は、上記基本辞書に登録さ
れているかなに対する同音語数から上記重要度を決定
し、この決定した重要度にしたがって上記優先語辞書に
記録する同音語数を変え、重要度の高い語は数多く上記
優先語辞書に残すようにする。Further , the basic registered homophone number determining means of the document input device according to the present invention determines the importance from the number of homophones for the kana registered in the basic dictionary, and determines the importance based on the determined importance. Therefore, the number of homophones recorded in the priority word dictionary is changed, and many words with high importance are left in the priority word dictionary.
【0025】また、別な本発明に係る文書入力装置にお
いては、上記操作量総計手段は目的の漢字混じり候補が
選択されるまでに入力された操作量の合計を計り、上記
操作量優先度決定手段は、操作量の合計から上記重要度
を決定し、この決定した重要度と上記選択された候補を
上記優先語辞書に記録し、また、記録した重要度にした
がって上記優先語辞書に記録する記録期間を制御し、重
要度の高い語は長い間上記優先語辞書に残すようにす
る。In the document input device according to another aspect of the present invention, the operation amount totaling means measures a total of operation amounts input until a target kanji mixture candidate is selected, and determines the operation amount priority. The means determines the importance from the total of the operation amounts, records the determined importance and the selected candidate in the priority word dictionary, and records the priority in the priority word dictionary according to the recorded importance. The recording period is controlled so that words with high importance are left in the priority word dictionary for a long time.
【0026】また、別な本発明に係る文書入力装置にお
いては、上記操作量総計手段は目的の漢字混じり候補が
選択されるまでに入力された操作量の合計を計り、上記
操作量登録同音語数決定手段は、操作量の合計から上記
重要度を決定し、この決定した重要度と上記選択された
候補を上記優先語辞書に記録し、また、記録した重要度
にしたがって上記優先語辞書に記録する同音語数を変
え、重要度の高い語は数多く上記優先語辞書に残すよう
にする。In the document input device according to another aspect of the present invention, the operation amount totaling means measures the total of the operation amounts input until the target kanji mixture candidate is selected, and obtains the operation amount registration homophone number. The determining means determines the importance from the total operation amount, records the determined importance and the selected candidate in the priority word dictionary, and records the priority in the priority word dictionary according to the recorded importance. The number of homonyms is changed, and many words with high importance are left in the priority word dictionary.
【0027】[0027]
【0028】[0028]
実施例1.図1は、本発明による文書入力装置の実施例
1の全体構成図である。図1において、1は日本語文の
かな文字列を入力するかなキー、変換キー、確定キー等
を備えたキーボードなどの入力手段、3はかなに対応す
る漢字表記と品詞などの語に関する属性情報が格納され
ている基本辞書、4は入力手段1によって入力されたか
な文字列の部分文字列をキーにして基本辞書3を検索す
る基本辞書検索手段、5は基本辞書検索手段4によって
検索された情報から入力かな文字列を日本語の文節に区
切り、漢字混じり表記を生成する文節生成手段、6はユ
ーザが選択した候補を記録する優先語辞書、7はユーザ
が選択した漢字混じり表記から自立語に関する情報と付
属語に関する情報を抽出し、この抽出した自立語及び付
属語と文節の読み、並びに抽出した自立語と自立語の読
みを優先語辞書6に記録する文節情報抽出手段、8は文
節生成手段5によって区切られた文節の読みから優先語
辞書6を検索する優先語辞書検索手段、9は基本辞書3
と優先語辞書6とを検索した結果から作られた漢字混じ
り表記の候補を表示するディスプレイなどの表示手段で
ある。2は基本辞書検索手段4、文節生成手段5、文節
情報抽出手段7及び優先語辞書検索手段8とで構成さ
れ、ROMなどに書き込まれている制御プログラムに従
い、後述する処理を行う制御部である。Embodiment 1 FIG. FIG. 1 is an overall configuration diagram of a first embodiment of a document input device according to the present invention. In FIG. 1, reference numeral 1 denotes input means such as a keyboard provided with a kana key for inputting a kana character string of a Japanese sentence, a conversion key, an enter key, and the like. 3 denotes kanji notation corresponding to kana and attribute information on words such as part of speech. The stored basic dictionary 4 is a basic dictionary search means for searching the basic dictionary 3 by using a partial character string of the kana character string input by the input means 1 as a key, and 5 is information searched by the basic dictionary search means 4. A phrase generation unit that divides the input kana character string into Japanese phrases and generates a kanji-mixed notation, 6 is a priority word dictionary that records candidates selected by the user, and 7 is a kanji-mixed notation selected by the user. Extraction of information and information on adjunct words, and phrase information extraction for recording the extracted independent words, adjunct words and phrases, and recording the extracted independent words and advocacy words in the priority word dictionary 6 Stage, 8 priority dictionary search means for searching the priority dictionary 6 readings clauses separated by clause generating means 5, 9 basic dictionary 3
Display means such as a display for displaying kanji-mixed notation candidates created from the result of searching the keyword and the preferred word dictionary 6. A control unit 2 includes a basic dictionary search unit 4, a phrase generation unit 5, a phrase information extraction unit 7, and a priority word dictionary search unit 8, and performs processing described below according to a control program written in a ROM or the like. .
【0029】図2は、本実施例における優先語辞書6の
説明図である。優先語辞書6には、読みと漢字混じり表
記から抽出した自立部及び付属部の表記が図2のように
格納されている。図3は、本実施例の動作を示すフロー
チャートである。例として、「きしゃできしゃした」と
いう入力に対し、「汽車で帰社した」という文を得る場
合について図3のフローチャートに基づいて説明する。
優先語辞書6には最初の状態として、何も情報が登録さ
れていないものとする。また、基本辞書3には、「きし
ゃ」という読みに対し、「記者」が第1候補、「汽車」
が第2候補、「帰社」が第3候補として登録されている
とする。FIG. 2 is an explanatory diagram of the preferred word dictionary 6 in this embodiment. The preferred word dictionary 6 stores the notations of the independent part and the attached part extracted from the notation mixed with the reading and the kanji as shown in FIG. FIG. 3 is a flowchart illustrating the operation of the present embodiment. As an example, a case will be described with reference to the flowchart of FIG. 3 in which a sentence "returned to the train" is obtained in response to an input of "successfully done".
It is assumed that no information is registered in the priority word dictionary 6 as an initial state. In addition, in the basic dictionary 3, for the reading "kisha", "reporter" is the first candidate, "train"
Is registered as a second candidate, and "return" is registered as a third candidate.
【0030】まず入力手段1によって、「きしゃできし
ゃした」というかなを入力する(ステップ31)。次に
基本辞書検索手段4によって、入力されたかな文字列の
部分文字列をキーにして基本辞書3の検索を行う(ステ
ップ32)。検索された結果から、文節生成手段5によ
って、「きしゃで」と「きしゃした」という2つの文節
に区切られる(ステップ33)。文節生成は、例えばn
文節最長一致法などの方法で行う。結果として、「記者
で」「汽車で」「帰社で」「記者した」「汽車した」
「帰社した」などの文節が生成される。次に、優先語辞
書検索手段8によって、優先語辞書6の検索を行う(ス
テップ34)。現在優先語辞書6には何も情報が登録さ
れていないので、基本辞書3の第1候補の「記者」に対
応する「記者で」「記者した」が表示手段9に表示され
る(ステップ35)。First, the input means 1 is used to input a kana of "you are happy" (step 31). Next, the basic dictionary 3 is searched by the basic dictionary search means 4 using the partial character string of the input kana character string as a key (step 32). From the search result, the phrase generation unit 5 divides the phrase into two phrases, "Kishade" and "Kishashita" (step 33). The phrase generation is, for example, n
This is performed by a method such as the longest phrase matching method. As a result, "at the reporter", "at the train", "at home", "reporter", "trained"
A phrase such as "I've returned" is generated. Next, the priority word dictionary 6 is searched by the priority word dictionary search means 8 (step 34). Since no information is currently registered in the priority word dictionary 6, "in a reporter" and "reporter" corresponding to the first candidate "reporter" in the basic dictionary 3 are displayed on the display means 9 (step 35). ).
【0031】表示された候補がユーザ所望の候補でない
ため、ユーザは、入力手段1によって再変換キーを押
し、次候補の表示を指示する(ステップ36)。ユーザ
は「きしゃで」に対しては「汽車で」が現れるまで、
「きしゃした」に対しては「帰社した」が現れるまで再
変換を行い、所望の文字列が現れたら確定キーを押す。Since the displayed candidate is not the one desired by the user, the user presses the re-conversion key by the input means 1 to instruct the display of the next candidate (step 36). The user responds to “Kishade” until “Train” appears.
Re-conversion is performed for "Kishashita" until "Returned to Home" appears, and when the desired character string appears, the enter key is pressed.
【0032】確定キーが押されると、文節情報抽出手段
7によって、「汽車で」と「帰社した」の両方の文節に
対し自立語に関する情報と付属語に関する情報が抽出さ
れる。抽出された「汽車で」も「帰社した」も付属語付
きの文節であるので(ステップ37)、文節情報抽出手
段7によって、両方の文節とも優先語辞書6に付属語付
きの文節の登録(ステップ38)と付属語なしの文節の
登録(ステップ39)が行われる。When the enter key is depressed, the phrase information extracting means 7 extracts information on independent words and information on attached words for both the phrases "by train" and "returned to work". Since both the extracted "in train" and "returned to home" are phrases with attached words (step 37), the phrase information extraction means 7 registers both of the phrases with attached words in the preferred word dictionary 6 (step 37). Step 38) and registration of a clause without an attached word (step 39) are performed.
【0033】優先語辞書6への登録はまず、「汽車で」
に対して、付属語付きの文節「汽車で」の登録(ステッ
プ38)と、付属語なしの文節「汽車」の登録(ステッ
プ39)が行われ、この時点で優先語辞書6は図2
(a)のようになる。次に「帰社した」に対して、付属
語付きの文節「帰社した」の登録(ステップ38)と、
付属語なしの文節「帰社」の登録(ステップ39)が行
われる。「きしゃ」という読みに対しては、既に「汽
車」が登録されているが、新しい表記の「帰社」を優先
させるため「汽車」を削除し「帰社」を登録する。結果
として、優先語辞書6は図2(b)のようになる。First, registration in the priority word dictionary 6 is "by train"
The phrase “with train” with attached words is registered (step 38), and the phrase “with train” without attached words is registered (step 39).
(A). Next, for "returned to home", registration of the phrase "returned to home" with attached words (step 38),
Registration of the phrase "return to home" without an attached word is performed (step 39). For the reading "kisha", "train" has already been registered, but to prioritize the new notation "return", "train" is deleted and "return" is registered. As a result, the priority word dictionary 6 is as shown in FIG.
【0034】なおこの実施例では、古い登録語の「汽
車」を優先語辞書6から削除したが、「汽車」を第2候
補として優先語辞書6に残すようにしてもよい。In this embodiment, the old registered word "train" is deleted from the priority word dictionary 6, but "train" may be left as the second candidate in the priority word dictionary 6.
【0035】次に、この状態で「きしゃできしゃした」
という読みを入力したとすると、文節生成手段5によっ
て、「きしゃで」に対応する文節と、「きしゃした」に
対応する文節が生成され、それぞれの文節に対応して優
先語辞書検索手段8が、「汽車で」「帰社した」を優先
語辞書6から検索するので、「汽車で帰社した」という
所望の文字列が最初に表示される。Next, in this state, "I was a young lady."
As a result, the phrase generation means 5 generates a phrase corresponding to "Kishade" and a phrase corresponding to "Kishashita". 8 retrieves "by train" and "returned from" from the priority word dictionary 6, so that the desired character string "returned by train" is displayed first.
【0036】また、「きしゃだった」のように付属語が
違う文字列を入力すると、「きしゃだった」の部分文字
列である「きしゃ」という読みに対応する「帰社」が優
先語辞書6から検索され、「帰社だった」と表示され
る。When a character string with a different auxiliary word, such as "Kishada," is entered, "Go home" corresponding to the reading "Kisha," which is a partial character string of "Kishada," has priority. A search is made from the word dictionary 6, and "Returned to home" is displayed.
【0037】なお、付属語なしの「きしゃ」という読み
に対して「汽車」という表記を表示させたときは、ステ
ップ37において文節は付属語なしと判断され、ステッ
プ38の付属語付きの文節の登録は行われず、ステップ
39で「きしゃ」に対応する「汽車」のみが優先語辞書
6に登録される。When the notation "train" is displayed for the reading "kisha" without an attached word, the phrase is determined to have no attached word in step 37, and the phrase with the attached word in step 38 is displayed. Is not registered, and only “train” corresponding to “kisha” is registered in the priority word dictionary 6 in step 39.
【0038】本実施例では、優先語辞書6の自立部表記
には図2に示したように漢字表記を格納する例を示した
が、漢字表記を格納する代わりに例えば基本辞書3中の
漢字表記のアドレスでもよく、基本辞書3に格納されて
いる漢字表記を特定できるものを格納してもよい。In this embodiment, an example is shown in which the kanji notation is stored in the independent word notation of the priority word dictionary 6 as shown in FIG. 2, but instead of storing the kanji notation, for example, the kanji in the basic dictionary 3 is stored. The address of the notation may be stored, and an address that can specify the kanji notation stored in the basic dictionary 3 may be stored.
【0039】実施例2.図4は、本発明による文書入力
装置の実施例2の全体構成図であり、図1に示した実施
例1と同様のものは同一番号を付して説明を省略する。
図4において、6aはユーザが選択した候補を記録する
優先語辞書、8aは文節生成手段5によって区切られた
文節の読みから優先語辞書6aを検索する優先語辞書検
索手段、10はユーザが選択した漢字混じり表記の重要
度を基本辞書3に登録されている品詞などの語に関する
属性情報から決定し、この決定した重要度にしたがって
ユーザが選択した候補を優先語辞書6a中に残す記録期
間を変える属性優先度決定手段である。2aは基本辞書
検索手段4、文節生成手段5、優先語辞書検索手段8a
及び属性優先度決定手段10とで構成され、ROMなど
に書き込まれている制御プログラムに従い、後述する処
理を行う制御部である。Embodiment 2 FIG. FIG. 4 is an overall configuration diagram of a second embodiment of a document input device according to the present invention. Components similar to those of the first embodiment shown in FIG.
In FIG. 4, reference numeral 6a denotes a preferred word dictionary that records candidates selected by the user, 8a denotes a preferred word dictionary search unit that searches the preferred word dictionary 6a from reading of phrases separated by the phrase generation unit 5, and 10 denotes a user-selected dictionary. The importance of the kanji-mixed notation determined is determined from the attribute information on words such as parts of speech registered in the basic dictionary 3, and the recording period in which the candidate selected by the user is left in the priority word dictionary 6a according to the determined importance is determined. This is attribute priority determining means to be changed. 2a is a basic dictionary search means 4, a phrase generation means 5, a priority word dictionary search means 8a
And a control unit configured to perform processing to be described later according to a control program written in a ROM or the like.
【0040】図5は、本実施例における優先語辞書6a
の説明図である。優先語辞書6aには、文節の読み、表
記、重要度を示すランク、登録の古さを示すカウントが
図5のように格納されている。ランクでは、Aは重要
語、Bは一般語を表し、基本辞書3に登録されている属
性である普通名詞は一般語でランクB、人名は重要語で
ランクAに属するものとする。またカウントは、優先語
辞書6a中に登録されている語の古さを表し、値が大き
いものほど優先語辞書6aへの登録が古いことを示す。
例として、「きしゃ」に対して「汽車」(属性は普通名
詞)、「たかひろ」に対して「隆宏」(属性は人名)、
「こじん」に対して「故人」(属性は普通名詞)を続け
て選択することとする。また、優先語辞書6aには最初
の状態として何も情報が登録されていないものとし、3
00個の語が登録できるものとする。FIG. 5 shows a preferred word dictionary 6a in this embodiment.
FIG. The priority word dictionary 6a stores, as shown in FIG. 5, reading of phrases, notation, rank indicating importance, and count indicating oldness of registration, as shown in FIG. In the rank, A represents an important word and B represents a general word. It is assumed that a common noun, which is an attribute registered in the basic dictionary 3, belongs to the general language rank B and a personal name belongs to the important word rank A. The count indicates the age of the words registered in the priority word dictionary 6a, and a larger value indicates that the registration in the priority word dictionary 6a is older.
For example, "Kisha" for "train" (attribute is a common noun), "Takahiro" for "Takahiro" (attribute is a person's name),
For "kojin", "deceased" (attribute is a common noun) is continuously selected. It is assumed that no information is registered in the priority word dictionary 6a as an initial state.
It is assumed that 00 words can be registered.
【0041】図6は、本実施例の動作を示すフローチャ
ートであり、本実施例の動作を図6のフローチャートに
基づいて説明する。最初に「きしゃ」という読みで「汽
車」を選択する場合について説明する。実施例1と同様
に、かなの入力(ステップ61)、基本辞書3の検索
(ステップ62)、文節の生成(ステップ63)、優先
語辞書6aの検索(ステップ64)、候補の表示(ステ
ップ65)、再変換(ステップ66)の処理を行う。以
上の処理で「汽車」が選択されたので、次に「汽車」を
優先語辞書6aに登録する。現在、優先語辞書6aには
何も情報が登録されていないので(ステップ67)、語
の削除(ステップ68)は行わず、優先語辞書6a中の
語のカウントのインクリメント(ステップ69)も行わ
ない。「汽車」は普通名詞であるので、属性優先度決定
手段10によってランクBの一般語と判断され、優先語
辞書6aにランクがB、カウントが初期値の0で登録さ
れる(ステップ70)。この結果、優先語辞書6aの状
態は、図5(a)のようになる。FIG. 6 is a flowchart showing the operation of this embodiment. The operation of this embodiment will be described with reference to the flowchart of FIG. First, a description will be given of a case where “train” is selected by reading “kisha”. As in the first embodiment, input of kana (step 61), retrieval of the basic dictionary 3 (step 62), generation of a phrase (step 63), retrieval of the priority word dictionary 6a (step 64), and display of candidates (step 65) ) And re-conversion (step 66). Since “train” has been selected in the above processing, “train” is registered in the priority word dictionary 6a. Since no information is currently registered in the priority word dictionary 6a (step 67), the word is not deleted (step 68), and the count of the words in the priority word dictionary 6a is incremented (step 69). Absent. Since "car" is a common noun, it is determined by the attribute priority determining means 10 as a general word of rank B, and the rank is B and the count is registered as an initial value of 0 in the priority word dictionary 6a (step 70). As a result, the state of the priority word dictionary 6a is as shown in FIG.
【0042】次に「たかひろ」という読みで「隆宏」を
選択する場合について説明する。優先語辞書6aにはま
だ登録する記憶領域があるので、ステップ67までは上
記の「きしゃ」という読みと同様の処理が行われる。次
にステップ69で優先語辞書6a中の語のカウントのイ
ンクリメントを行う。この場合は優先語辞書6a中にあ
るのは一般語の「汽車」なので、「汽車」のカウントを
2つ増やす。新しく登録する「隆宏」は属性が「人名」
であるので、ランクAの重要語とし、カウントは初期値
の0で優先語辞書6aに登録する(ステップ70)。こ
の結果、優先語辞書6aの状態は図5(b)のようにな
る。Next, the case where "Takahiro" is selected by reading "Takahiro" will be described. Since there is still a storage area to be registered in the priority word dictionary 6a, the same processing as the above-mentioned reading of "Kisha" is performed up to step 67. Next, at step 69, the count of the words in the priority word dictionary 6a is incremented. In this case, since the word in the priority word dictionary 6a is the general word "train", the count of "train" is increased by two. "Takahiro" to be newly registered has the attribute "person name"
Therefore, the keyword is registered as an important word of rank A in the priority word dictionary 6a with an initial value of 0 (step 70). As a result, the state of the priority word dictionary 6a is as shown in FIG.
【0043】さらに「こじん」という読みで「故人」が
選択されると、ステップ67までは上記の「きしゃ」と
いう読みと同様の処理が行われ、ステップ69で、一般
語の「汽車」に対してはカウントを2つ増やし、重要語
の「隆宏」に対してはカウントを1つ増やす。「故人」
は一般語であるので、ランクBの一般語とし、カウント
は初期値の0で優先語辞書6aに登録する(ステップ7
0)。この結果優先語辞書6aの状態は図5(c)のよ
うになる。Further, if "deceased" is selected in the reading of "kojin", the same processing as in the above-mentioned reading of "kisha" is performed up to step 67, and in step 69, the common word "train" is added. The count is increased by two, and the count is increased by one for the key word "Takahiro". "deceased"
Is a general word, it is a general word of rank B, and the count is registered in the priority word dictionary 6a with an initial value of 0 (step 7).
0). As a result, the state of the priority word dictionary 6a is as shown in FIG.
【0044】以上のように、新しい語の登録時に、既に
優先語辞書6aに登録されている一般語はカウントを2
つ増やし、重要語はカウントを1つ増やしていくと、や
がて優先語辞書6aの登録語数が300を超え、登録す
る記憶領域がなくなる。記憶領域がなくなったときは、
ステップ68で、カウントの値が最大の語を削除するの
で、重要語の方が一般語より長い期間優先語辞書6aに
残ることになる。また、カウントの値が最大の語の削除
は、優先語辞書6aの記憶領域を有効利用するために必
要な処理であり、本実施例によれば重要度の低い一般語
を重要語より先に削除できる。As described above, when a new word is registered, the count of general words already registered in the priority word dictionary 6a is 2
As the number of important words is increased by one, the number of registered words in the priority word dictionary 6a eventually exceeds 300, and there is no storage area to be registered. If you run out of storage space,
In step 68, the word having the largest count value is deleted, so that the important word remains in the priority word dictionary 6a for a longer period than the general word. Further, the deletion of the word having the largest count value is a process necessary for effectively using the storage area of the priority word dictionary 6a. According to the present embodiment, a general word having a low importance is placed before an important word. Can be deleted.
【0045】なお、本実施例ではカウントの値によって
重要語の方を一般語より長い期間優先語辞書6aに残す
ようにしたが、カウントを用いる方法の他に、重要度に
よって登録する単語数を分けても重要語を長い期間優先
語辞書6aに残すことができる。この例として、基本辞
書3中には、重要語の数よりも一般語の数の方が10倍
程度多いとする。また、図7に示した優先語辞書6aの
説明図のように登録できる語の数を300語とし、その
うち100語を重要語、200語を一般語の登録に割り
当てるとすれば、基本辞書3に存在する一般語に対する
重要語の数の割合よりも、優先語辞書6aに登録可能な
一般語に対する重要語の数の割合の方が大きいので、重
要語の方を長く優先語辞書6aに登録しておくことがで
きる。In the present embodiment, the important word is left in the priority word dictionary 6a for a longer period than the general word, depending on the value of the count. Even if it is divided, the important words can be left in the priority word dictionary 6a for a long time. As an example, it is assumed that the number of general words is about 10 times greater than the number of important words in the basic dictionary 3. Further, as shown in the explanatory diagram of the priority word dictionary 6a shown in FIG. 7, if the number of words that can be registered is 300 words, of which 100 words are assigned to important words and 200 words are registered to general words, the basic dictionary 3 Is greater than the ratio of the number of important words to the common words existing in the preferred word dictionary 6a, so that the important words are registered in the preferred word dictionary 6a longer. You can keep.
【0046】なお、本実施例では人名を重要語とした
が、地名、その他の固有名詞を重要語としてもよいし、
また専門用語などの他の属性を基準に重要語を決めても
よい。また、本実施例では重要語と一般語の2つに分け
たが、重要度によって3つ以上の分類に分けてもよい。
さらに、本実施例では優先語辞書6aに300個の語が
登録できるものとしたが、最大個数は300個より多く
てもよく優先語辞書6aの記憶領域の大きさで決めるこ
とができる。In this embodiment, personal names are used as important words. However, place names and other proper nouns may be used as important words.
Important words may be determined based on other attributes such as technical terms. Further, in the present embodiment, the words are classified into the important words and the general words. However, the words may be classified into three or more classifications according to the importance.
Further, in this embodiment, 300 words can be registered in the priority word dictionary 6a. However, the maximum number may be more than 300 words, and may be determined by the size of the storage area of the priority word dictionary 6a.
【0047】また、本実施例の優先語辞書6aの表記に
は図5に示したように漢字表記を格納する例を示した
が、漢字表記を格納する代わりに例えば基本辞書3中の
漢字表記のアドレスでもよく、基本辞書3に格納されて
いる漢字表記を特定できるものを格納してもよい。ま
た、本実施例の優先語辞書6aには図5に示したように
重要度を示すランクを格納したが、ランクは優先語辞書
6aに格納しなくてもよい。重要度を示すランクは基本
辞書3に格納されている品詞などの語に関する属性で決
定するため、図6のステップ69で優先語辞書6aのカ
ウントを更新する際に再度基本辞書3を検索し重要度を
求めるようにしてもよい。Although the preferred word dictionary 6a according to the present embodiment stores kanji notation as shown in FIG. 5, the kanji notation is stored in the basic dictionary 3 instead of the kanji notation. Or an address that can specify the kanji notation stored in the basic dictionary 3. Although the priority word dictionary 6a according to the present embodiment stores the rank indicating the importance as shown in FIG. 5, the rank does not have to be stored in the priority word dictionary 6a. Since the rank indicating the degree of importance is determined by an attribute relating to words such as part of speech stored in the basic dictionary 3, when the count of the priority word dictionary 6a is updated in step 69 in FIG. The degree may be obtained.
【0048】実施例3.図8は、本発明による文書入力
装置の実施例3の全体構成図であり、図1に示した実施
例1と同様のものは同一番号を付して説明を省略する。
図8において、6bはユーザが選択した候補を記録する
優先語辞書、8bは文節生成手段5によって区切られた
文節の読みから優先語辞書6bを検索する優先語辞書検
索手段、11はユーザが選択した漢字混じり表記の重要
度を基本辞書3に登録されているかなに対する同音語の
数によって決定し、この決定した重要度にしたがって優
先語辞書6bに登録する同音語数を変える基本登録同音
語数決定手段である。2bは基本辞書検索手段4、文節
生成手段5、優先語辞書検索手段8b及び基本登録同音
語数決定手段11とで構成され、ROMなどに書き込ま
れている制御プログラムに従い、後述する処理を行う制
御部である。Embodiment 3 FIG. FIG. 8 is an overall configuration diagram of a third embodiment of the document input device according to the present invention. Components similar to those of the first embodiment shown in FIG.
In FIG. 8, reference numeral 6b denotes a preferred word dictionary that records candidates selected by the user, 8b denotes a preferred word dictionary search unit that searches the preferred word dictionary 6b from reading of phrases separated by the phrase generation unit 5, and 11 denotes a user-selected dictionary. Basic registration homonym number determining means for determining the importance of the kanji-mixed notation based on the number of homonyms for kana registered in the basic dictionary 3, and changing the number of homonyms registered in the priority word dictionary 6b according to the determined importance It is. A control unit 2b includes a basic dictionary search unit 4, a phrase generation unit 5, a priority word dictionary search unit 8b, and a basic registration homonym number determination unit 11, and performs a process described below in accordance with a control program written in a ROM or the like. It is.
【0049】図9は、本実施例における優先語辞書6b
の説明図である。優先語辞書6bには、文節の読みとこ
の読みに対する表記が表記1、表記2の2つ図9のよう
に格納されている。読みに記されている文字列の入力に
対し、表記1に登録されている語は、表示手段9に第1
候補として表示され、表記2に登録されている語は、表
示手段9に第2候補として表示される。例として基本辞
書3中には「こう」という読みに対し、「功」「項」
「甲」など10個の同音語が存在するものとする。また
「こじん」という読みに対しては「故人」と「個人」の
2個の同音語が存在するものとする。なお、同音語の数
の多い読みは再変換を行なう可能性が高く、同音語の少
ない読みよりも数多くの同音語を優先語辞書6bに覚え
ておいた方が好ましいので、本実施例では、基本辞書3
中に7個以上登録されていれば重要度が高く同音語が多
いと判断し、優先語辞書6bには1つの読みに対して最
大2個まで同音語を登録できるものとする。また、優先
語辞書6bには最初の状態として、何も情報が登録され
ていないものとする。FIG. 9 shows a preferred word dictionary 6b in this embodiment.
FIG. The priority word dictionary 6b stores two phrases, notation 1 and notation 2, as shown in FIG. In response to the input of the character string written in the reading, the word registered in the notation 1 is displayed on the display means 9 as the first word.
The word displayed as a candidate and registered in the notation 2 is displayed on the display means 9 as a second candidate. As an example, in the basic dictionary 3, for the reading "Ko", "Gong" and "Item"
It is assumed that there are ten homonyms such as "A". In addition, it is assumed that there are two homophone words of “deceased” and “individual” for the reading “kojin”. Note that readings with a large number of homonyms are likely to be re-converted, and it is preferable to remember many homonyms in the priority word dictionary 6b rather than readings with a small number of homonyms. Basic dictionary 3
If seven or more words are registered, it is determined that the degree of importance is high and there are many homonyms, and it is assumed that up to two homonyms can be registered for one reading in the priority word dictionary 6b. It is also assumed that no information is registered in the priority word dictionary 6b as an initial state.
【0050】図10は、本実施例の動作を示すフローチ
ャートであり、本実施例の動作を図10のフローチャー
トに基づいて説明する。最初に「こう」という読みで
「功」を選択する場合について説明する。実施例1と同
様に、かなの入力(ステップ101)、基本辞書3の検
索(ステップ102)、文節の生成(ステップ10
3)、優先語辞書6bの検索(ステップ104)、候補
の表示(ステップ105)、再変換(ステップ106)
の処理を行う。ここで、「こう」の同音語の数は10個
であり7個以上なので、基本登録同音語数決定手段11
によって同音語の数が多いと判断され(ステップ10
7)、優先語辞書6bに「功」の登録が行われる(ステ
ップ108)。「こう」という読みに対しては、優先語
辞書6bに表記1と表記2の2個まで語を登録できる
が、このとき「こう」の読みで語が登録されていないの
で、「功」は図9(a)のように表記1に登録される。FIG. 10 is a flowchart showing the operation of this embodiment. The operation of this embodiment will be described with reference to the flowchart of FIG. First, a case in which “Ko” is selected by reading “Ko” will be described. As in the first embodiment, input of kana (step 101), retrieval of the basic dictionary 3 (step 102), generation of a phrase (step 10)
3), retrieval of the priority word dictionary 6b (Step 104), display of candidates (Step 105), reconversion (Step 106)
Is performed. Here, the number of homonyms of “ko” is ten and seven or more, so that the basic registration homonym number determining means 11
It is determined that the number of homonyms is large (step 10).
7), “K” is registered in the priority word dictionary 6b (step 108). For the pronunciation of “Ko”, up to two words, notation 1 and notation 2, can be registered in the preferred word dictionary 6b, but at this time, no word is registered for the reading of “Ko”, As shown in FIG. 9A, it is registered in notation 1.
【0051】次に「こう」に対し「項」が選択される
と、ステップ107までは上記と同様の処理が行われ
る。次にステップ108において「項」の登録が行われ
る。「こう」という読みに対する表記は優先語辞書6b
に最大2個まで登録できるので、基本登録同音語数決定
手段11によって、図9(b)のように新しい「項」が
表記1に登録され、「功」は表記2にシフトされる。さ
らに、「こう」に対し「甲」が選択されると、ステップ
108で「甲」が表記1に登録され、「項」は表記2に
シフトされ、「功」は優先語辞書6bから削除され、図
9(c)のようになる。Next, when "item" is selected for "this", the same processing as described above is performed up to step 107. Next, in step 108, "item" is registered. The notation for the reading "Ko" is the priority word dictionary 6b.
9, a new “item” is registered in the notation 1 by the basic registration homonym number determining means 11 as shown in FIG. Further, when "Ko" is selected for "Kou", "Ko" is registered in the notation 1 in step 108, "Item" is shifted to the notation 2, and "Gong" is deleted from the preferred word dictionary 6b. 9 (c).
【0052】次に「こじん」という読みに対する語を登
録する場合について説明する。「故人」を登録すると
き、ステップ107において「こじん」という読みに対
する同音語の数が2個で7個より少ないので、ステップ
109で登録が行われる。このとき、「こじん」という
読みで語が登録されていないので、「故人」は図9
(d)のように、表記1に登録され、表記2は領域がと
られない。Next, the case of registering a word corresponding to the reading "kojin" will be described. When registering "deceased", the registration is performed in step 109 because the number of homonyms for the reading "kojin" is two and less than seven in step 107. At this time, since no word has been registered for the reading “kojin”, “deceased” is displayed in FIG.
As shown in (d), the area is registered in the notation 1 and the area of the notation 2 is not taken.
【0053】次に「こじん」に対し「個人」が選択され
ると、「こじん」という読みに対する同音語の数は2個
で7個より少いので(ステップ107)、語の登録は1
つとなり(ステップ108)、「個人」が表記1に登録
され、「故人」が優先語辞書6bから削除される。Next, when "individual" is selected for "kojin", the number of homonyms for the reading of "kojin" is two, which is less than seven (step 107).
As a result (step 108), "individual" is registered in the notation 1, and "deceased" is deleted from the priority word dictionary 6b.
【0054】以上のように本実施例によれば、同音語数
の少ない読みの場合は表記1にだけ登録し、同音語数の
多い語の場合は表記1と表記2に登録するので、同音語
数の多い語すなわち候補数が多く再変換を行なう可能性
が高い語を数多く優先語辞書6bに登録できる。また、
同音語数の少ない読みの場合は表記1にだけ登録するの
で、優先語辞書6bの記憶領域を有効に利用できる。な
お、本実施例では優先語辞書6bに登録できる同音語の
数を表記1と表記2の2通りに分けたが、基本辞書3に
ある読みの同音語の数によって、さらに多くの表記数に
分けてもよい。As described above, according to the present embodiment, in the case of a reading having a small number of homophones, it is registered only in the notation 1, and in the case of a word having a large number of homophones, it is registered in the notation 1 and the notation 2. Many words, that is, words having a large number of candidates and a high possibility of performing re-conversion can be registered in the priority word dictionary 6b. Also,
In the case of a reading with a small number of homophone words, only the notation 1 is registered, so that the storage area of the priority word dictionary 6b can be used effectively. In the present embodiment, the number of homonyms that can be registered in the priority word dictionary 6b is divided into two types, notation 1 and notation 2. However, the number of homonyms that are read in the basic dictionary 3 can be increased to a greater number. May be divided.
【0055】また、本実施例の優先語辞書6bの表記1
及び表記2には図9に示したように漢字表記を格納する
例を示したが、漢字表記を格納する代わりに例えば基本
辞書3中の漢字表記のアドレスでもよく、基本辞書3に
格納されている漢字表記を特定できるものを格納しても
よい。The notation 1 of the preferred word dictionary 6b of the present embodiment.
9 shows an example in which the kanji notation is stored as shown in FIG. 9, but instead of storing the kanji notation, for example, the address of the kanji notation in the basic dictionary 3 may be used. A kanji notation that can be specified may be stored.
【0056】実施例4.図11は、本発明による文書入
力装置の実施例4の全体構成図であり、図1に示した実
施例1と同様のものは同一番号を付して説明を省略す
る。図11において、6aは図4に示した実施例2と同
様の優先語辞書、8aは図4に示した実施例2と同様の
優先語辞書検索手段、12はユーザが目的の漢字混じり
候補を選択するまでに入力した操作量の合計を計る操作
量総計手段、13はユーザが選択した漢字混じり表記の
重要度を操作量の合計から決定し、この決定した重要度
にしたがってユーザが選択した候補を優先語辞書6a中
に残す記録期間を変える操作量優先度決定手段である。
2cは基本辞書検索手段4、文節生成手段5、優先語辞
書検索手段8a、操作量総計手段12及び操作量優先度
決定手段13とで構成され、ROMなどに書き込まれて
いる制御プログラムに従い、後述する処理を行う制御部
である。Embodiment 4 FIG. FIG. 11 is an overall configuration diagram of a fourth embodiment of a document input device according to the present invention. Components similar to those of the first embodiment shown in FIG. In FIG. 11, reference numeral 6a denotes a preferred word dictionary similar to that of the second embodiment shown in FIG. 4, 8a denotes a preferred word dictionary search means similar to the second embodiment shown in FIG. The operation amount totaling means 13 for measuring the total of the operation amounts input up to the selection, determines the importance of the kanji-mixed notation selected by the user from the total of the operation amounts, and selects the candidate selected by the user according to the determined importance. Is an operation amount priority determining means for changing the recording period in which is stored in the priority word dictionary 6a.
2c is composed of a basic dictionary search unit 4, a phrase generation unit 5, a priority word dictionary search unit 8a, an operation amount totalization unit 12, and an operation amount priority determination unit 13, and is described later according to a control program written in a ROM or the like. This is a control unit that performs a process to be performed.
【0057】図12は、本実施例における優先語辞書6
aの説明図であり、図5に示した実施例2の優先語辞書
6aと同様の文節の読み、表記、重要度を示すランク、
登録の古さを示すカウントが図12のように格納されて
いる。本実施例では、再変換の数が5回以上を操作量が
多く重要であると判断しランクAの重要語とする。また
再変換の数が5回未満をランクBの一般語とする。「カ
ウント」は実施例2と同様に優先語辞書6a中に登録さ
れている語の古さを表し、値が大きいものほど優先語辞
書6aへの登録が古いことを示す。例として、「こう」
という読みに対して「功」が第2候補で、「項」が第7
候補、「こじん」という読みに対して「故人」が第2候
補、「きしゃ」という読みに対して「汽車」が第2候補
とする。また、優先語辞書6aには最初の状態として登
録されている語はなく、300個の語が登録できるもの
とする。FIG. 12 shows a preferred word dictionary 6 in this embodiment.
FIG. 6 is an explanatory diagram of a, similar to the preferred word dictionary 6a of Embodiment 2 shown in FIG.
The count indicating the age of registration is stored as shown in FIG. In this embodiment, when the number of reconversions is 5 or more, the operation amount is determined to be significant and important, and is regarded as an important word of rank A. In addition, the number of retransformations less than 5 is defined as a rank B general term. "Count" indicates the age of the words registered in the priority word dictionary 6a as in the second embodiment, and the larger the value, the older the registration in the priority word dictionary 6a. For example, "this"
"Gong" is the second candidate, and "Item" is the seventh
For the candidate, reading “Kojin”, “deceased” is the second candidate, and for the reading “Kisha”, “train” is the second candidate. Further, it is assumed that there is no word registered as the initial state in the priority word dictionary 6a, and 300 words can be registered.
【0058】図13は、本実施例の動作を示すフローチ
ャートであり、本実施例の動作を図13のフローチャー
トに基づいて説明する。最初に「こう」という読みに対
し「功」を選択する場合について説明する。実施例1と
同様に、かなの入力(ステップ131)、基本辞書3の
検索(ステップ132)、文節の生成(ステップ13
3)、優先語辞書6aの検索(ステップ134)の処理
を行う。再変換の操作数は操作量総計手段12で検出さ
れる。再変換キーが何回押されたかを計るためにcとい
う変数を用意し(ステップ135)、ステップ137で
再変換キーが押される度にcの値を1ずつ増やす(ステ
ップ138)。現在は最初の登録であるので、優先語辞
書6aに新しい語を登録する記憶領域があり(ステップ
139)、以前に登録された語の削除(ステップ14
0)と、カウントのインクリメント(ステップ141)
は行わない。「功」は第2候補であり、cの値(再変換
の回数)は1であるのでステップ142でN(NO)と
なり、操作量優先度判定手段13によって「功」はラン
クBの一般語と判断され、優先語辞書6aにランクが
B、カウントが初期値の0で登録される(ステップ14
4)。この結果、優先語辞書6aの状態は図12(a)
のようになる。FIG. 13 is a flowchart showing the operation of this embodiment. The operation of this embodiment will be described with reference to the flowchart of FIG. First, a case in which “Gong” is selected for the reading “Kou” will be described. As in the first embodiment, input of kana (step 131), retrieval of the basic dictionary 3 (step 132), generation of a phrase (step 13)
3), a process of searching the priority word dictionary 6a (step 134). The number of reconversion operations is detected by the operation amount totaling means 12. A variable c is prepared to measure how many times the reconversion key has been pressed (step 135), and the value of c is incremented by one each time the reconversion key is pressed in step 137 (step 138). Since this is the first registration, there is a storage area for registering a new word in the priority word dictionary 6a (step 139), and the previously registered word is deleted (step 14).
0) and increment of the count (step 141)
Is not performed. “Gong” is the second candidate, and the value of c (the number of reconversions) is 1, so N is “NO” in step 142. Is determined, the rank is registered in the priority word dictionary 6a, and the count is registered with the initial value of 0 (step 14).
4). As a result, the state of the priority word dictionary 6a is as shown in FIG.
become that way.
【0059】次に「こじん」という読みに対し「故人」
が選択されると、ステップ139までは上記と同様の処
理が行われる。次にステップ141で、優先語辞書6a
に登録されている「功」はランクBの一般語であるの
で、カウントを2つ増やす。これから登録する「故人」
は第2候補であり、cの値(再変換の回数)は1である
のでステップ142でN(NO)となり、操作量優先度
判定手段13によって、「故人」はランクBの一般語と
判断され、優先語辞書6aにランクがB、カウントが初
期値の0で登録される(ステップ144)。この結果、
優先語辞書6aの状態は図12(b)のようになる。Next, in response to the reading "kojin", "deceased"
Is selected, the same processing as described above is performed up to step 139. Next, in step 141, the priority word dictionary 6a
Is a rank B general word, so the count is increased by two. "Dead people" to register
Is a second candidate, and the value of c (the number of re-conversions) is 1, so N (NO) is determined in step 142, and the “deceased” is determined by the operation amount priority determining unit 13 to be a rank B common word. Then, the rank is registered in the priority word dictionary 6a with the rank B and the initial value is 0 (step 144). As a result,
The state of the priority word dictionary 6a is as shown in FIG.
【0060】次に「こう」という読みに対して「項」が
選択されると、ステップ141で、優先語辞書6aに登
録されている「功」と「故人」はランクBの一般語であ
るので、それぞれカウントを2つずつ増やし、これから
登録する「項」は第7候補であり、cの値(再変換の回
数)は6であるのでステップ142でY(YES)とな
り、「項」はランクAの重要語、カウントは初期値の0
で登録される(ステップ143)。登録時には優先語辞
書6a中に、すでに「こう」の読みで「功」が登録され
ているが、新しい表記の「項」を優先させるので、ステ
ップ143の処理で「功」は削除される。この結果、優
先語辞書6aの状態は図12(c)のようになる。な
お、ここでは「功」を削除したが、第2候補として優先
語辞書6a中に残すようにしてもよい。Next, when “item” is selected in response to the reading “ko”, in step 141, “ko” and “deceased” registered in the priority word dictionary 6a are common words of rank B. Therefore, the count is increased by two each time, and the “term” to be registered is the seventh candidate, and the value of c (the number of re-conversions) is 6, so that Y (YES) is obtained in step 142, and the “term” is Key word of rank A, count is initial value 0
(Step 143). At the time of registration, “Ko” has already been registered in the priority word dictionary 6a by reading “Ko”, but “Ko” is deleted by the processing of step 143 because the new item “Item” is prioritized. As a result, the state of the priority word dictionary 6a is as shown in FIG. In this case, “gong” is deleted, but may be left in the priority word dictionary 6a as a second candidate.
【0061】次に「きしゃ」という読みに対して「汽
車」が選択されると、ステップ141で、ランクBであ
る「故人」に対してはカウントを2つ、ランクAである
「項」に対してはカウントを1つインクリメントし、
「汽車」が第2候補であることより、ステップ144
で、ランクがB、カウントが初期値の0で優先語辞書6
aに登録される。この結果、優先語辞書6aの状態は図
12(d)のようになる。Next, when “train” is selected for the reading “kisha”, in step 141, two counts are given to “deceased” of rank B, and “count” is ranked A. Is incremented by one,
Since “train” is the second candidate, step 144
, The rank is B, the count is 0 as the initial value, and the preferred word dictionary 6
a. As a result, the state of the priority word dictionary 6a is as shown in FIG.
【0062】以上のように本実施例は実施例2と同様
に、新しい語の登録時に、既に優先語辞書6aに登録さ
れている一般語はカウントを2つ増やし、重要語はカウ
ントを1つ増やしていくと、やがて優先語辞書6aの登
録語数が300を超え、登録する記憶領域がなくなる。
記憶領域がなくなったときは、ステップ140におい
て、カウントの値が最大の語を削除するので、重要語の
方が、一般語より長いあいだ優先語辞書6aに残る。ま
た、カウントの値が最大の語の削除は、優先語辞書6a
の記憶領域を有効利用するために必要な処理であり、本
実施例によれば重要度の低い一般語を重要語より先に削
除できる。As described above, in this embodiment, as in the second embodiment, when a new word is registered, the count of general words already registered in the priority word dictionary 6a is increased by two, and the count of important words is increased by one. As the number of words increases, the number of words registered in the priority word dictionary 6a eventually exceeds 300, and there is no storage area to be registered.
When the storage area is exhausted, the word having the largest count is deleted in step 140, so that the important word remains in the priority word dictionary 6a for a longer time than the general word. Deletion of the word having the largest count value is performed in the priority word dictionary 6a.
This is a process necessary to effectively use the storage area of the general term. According to the present embodiment, general words with low importance can be deleted before important words.
【0063】なお、カウントを用いる方法の他に、重要
度によって登録する単語数を分けても重要語を長い期間
優先語辞書6aに残すことができる。この例として、変
換キーを5回以上押して出てくる語の数よりも5回未満
で出てくる語の方が10倍程度多いとする。また、図7
に示した優先語辞書6aの説明図のように登録できる語
の数を300語とし、そのうち100語を重要語、20
0語を一般語の登録に割り当てれば、基本辞書3に存在
する一般語に対する重要語の割合よりも、優先語辞書6
aに登録可能な一般語に対する重要語の割合の方が大き
いので、重要語の方を長く優先語辞書6aに登録してお
くことが可能になる。In addition to the method using the count, even if the number of words to be registered is divided according to the degree of importance, the important words can be left in the priority word dictionary 6a for a long time. As an example, it is assumed that the number of words that appear less than five times is about ten times greater than the number of words that appear when the conversion key is pressed five or more times. FIG.
As shown in the explanatory diagram of the preferred word dictionary 6a, the number of words that can be registered is 300 words, of which 100 words are important words and 20 words
If 0 words are assigned to the registration of general words, the priority word dictionary 6
Since the ratio of important words to general words that can be registered in a is larger, it becomes possible to register the important words longer in the priority word dictionary 6a.
【0064】なお、本実施例では再変換の数が5回以上
を操作量が多く重要であると判断したが、判断基準の再
変換回数は5回に限らず、5回より多くても少なくても
よい。また、本実施例では優先語辞書6aに300個の
語が登録できるものとしたが、最大個数は300個より
多くてもよく優先語辞書6aの記憶領域の大きさで決め
ることができる。In this embodiment, when the number of re-conversions is 5 or more, the operation amount is determined to be significant and important. However, the number of re-conversions is not limited to five, and the number of re-conversions is not limited to five. You may. Further, in this embodiment, 300 words can be registered in the priority word dictionary 6a. However, the maximum number may be more than 300 words and may be determined by the size of the storage area of the priority word dictionary 6a.
【0065】また、本実施例の優先語辞書6aの表記に
は図12に示したように漢字表記を格納する例を示した
が、漢字表記を格納する代わりに例えば基本辞書3中の
漢字表記のアドレスでもよく、基本辞書3に格納されて
いる漢字表記を特定できるものを格納してもよい。Although the preferred word dictionary 6a according to the present embodiment has an example in which the kanji notation is stored as shown in FIG. 12, instead of storing the kanji notation, for example, the kanji notation in the basic dictionary 3 is used. Or an address that can specify the kanji notation stored in the basic dictionary 3.
【0066】実施例5.図14は、本発明による文書入
力装置の実施例5の全体構成図であり、図1に示した実
施例1と同様のものは同一番号を付して説明を省略す
る。図14において、6dはユーザが選択した候補を記
録する優先語辞書、8dは文節生成手段5によって区切
られた文節の読みから優先語辞書6dを検索する優先語
辞書検索手段、12は実施例4の操作量総計手段12と
同様の、ユーザが目的の漢字混じり候補を選択するまで
に入力した操作量の合計を計る操作量総計手段、14は
ユーザが選択した漢字混じり表記の重要度を操作量の合
計から決定し、この決定した重要度にしたがって優先語
辞書6dに登録する同音語数を変える操作量登録同音語
数決定手段である。2dは基本辞書検索手段4、文節生
成手段5、優先語辞書検索手段8d、操作量総計手段1
2及び操作量登録同音語数決定手段14とで構成され、
ROMなどに書き込まれている制御プログラムに従い、
後述する処理を行う制御部である。Embodiment 5 FIG. FIG. 14 is an overall configuration diagram of a fifth embodiment of a document input device according to the present invention. Components similar to those of the first embodiment shown in FIG. In FIG. 14, reference numeral 6d denotes a priority word dictionary for recording candidates selected by the user, reference numeral 8d denotes a priority word dictionary search unit for searching the priority word dictionary 6d from the reading of the phrases separated by the phrase generation unit 5, and reference numeral 12 denotes a fourth embodiment. The operation amount totaling means for measuring the total of the operation amounts input by the user until the user selects the target kanji mixture candidate as in the case of the operation amount totalization means 12, and 14 is the operation amount The operation amount registration homonym number determining means for changing the number of homonyms to be registered in the priority word dictionary 6d according to the determined importance. 2d is a basic dictionary search means 4, a phrase generation means 5, a priority word dictionary search means 8d, and an operation amount totaling means 1
2 and an operation amount registration homophone number determination means 14,
According to the control program written in ROM etc.,
This is a control unit that performs processing described below.
【0067】図15は、本実施例における優先語辞書6
dの説明図である。図15に示したように優先語辞書6
dは、文節の読みに対する表記を表記1と表記2の2種
類持ち、それぞれの表記の重要度を示すランクをランク
1とランク2で持っている。本実施例のランクは実施例
4と同様に、再変換の回数が5回以上を重要語のランク
A、5回未満を一般語のランクBとする。表記1とラン
ク1、表記2とランク2がそれぞれ対応し、読みに対し
て表記1が第1候補、表記2が第2候補として表示され
るものとする。例として、「こう」という読みを「項」
「功」「甲」「功」の順番に選択することとする。基本
辞書3では「功」が第2候補、「項」が第7候補、
「甲」が第8候補とする。また、優先語辞書6aには最
初の状態として登録されている語はないものとする。FIG. 15 shows a preferred word dictionary 6 in this embodiment.
It is explanatory drawing of d. As shown in FIG.
“d” has two types of notations for reading a phrase, notations 1 and 2, and ranks 1 and 2 indicating the importance of each notation. As in the case of the fourth embodiment, the rank in this embodiment is defined as a keyword A rank when the number of reconversions is 5 or more and a general word rank B when less than 5 times. The notation 1 corresponds to the rank 1 and the notation 2 corresponds to the rank 2, and the notation 1 is displayed as the first candidate and the notation 2 is displayed as the second candidate for the reading. As an example, the pronunciation "ko" is replaced by
It will be selected in the order of “Gong”, “A” and “Gong”. In the basic dictionary 3, “Gong” is the second candidate, “Item” is the seventh candidate,
“A” is the eighth candidate. It is also assumed that there is no word registered as the initial state in the priority word dictionary 6a.
【0068】図16は本実施例の動作を示すフローチャ
ートであり、本実施例の動作を図16のフローチャート
に基づいて説明する。最初に「こう」という読みに対し
「項」を選択する場合について説明する。実施例4と同
様に、かなの入力(ステップ161)、基本辞書3の検
索(ステップ162)、文節の生成(ステップ16
3)、優先語辞書6dの検索(ステップ164)、候補
の表示(ステップ166)、再変換数のカウント(ステ
ップ168)を行う。「項」は優先語辞書6dへの最初
の登録であり、優先語辞書6d中に「こう」という読み
に対する語が登録されていないので、ステップ169で
N(NO)と判断される。次に操作量同音語数決定手段
14により、「項」は第7候補で5回以上再変換されて
いるのでランクAの重要語と判断され、優先語辞書6d
の表記1に「項」、ランク1にAが登録される(ステッ
プ176)。この結果、優先語辞書6dの状態は図15
(a)のようになる。FIG. 16 is a flowchart showing the operation of this embodiment. The operation of this embodiment will be described with reference to the flowchart of FIG. First, a case where “item” is selected for the reading “ko” will be described. As in the fourth embodiment, input of kana (step 161), retrieval of the basic dictionary 3 (step 162), generation of a phrase (step 16)
3) Search the priority word dictionary 6d (step 164), display candidates (step 166), and count the number of reconversions (step 168). Since "item" is the first entry in the priority word dictionary 6d, and no word corresponding to the reading "ko" is registered in the priority word dictionary 6d, it is determined to be N (NO) in step 169. Next, the manipulated variable homophone number determination means 14 determines that the term is an important word of rank A because the term has been reconverted at least seven times in the seventh candidate, and the priority word dictionary 6d
Is registered in the notation 1 and A is registered in the rank 1 (step 176). As a result, the state of the priority word dictionary 6d is as shown in FIG.
(A).
【0069】次に「こう」という読みに対して「功」が
選択されると、ステップ168までは上記と同様の処理
が行われる。今度は、優先語辞書6d中に「こう」とい
う読みで「項」という語が1つだけ登録されているの
で、ステップ169でY(YES)となり、ステップ1
70でY(YES)となる。次に、優先語辞書6d中の
「項」がランクAの重要語であるのでステップ174で
Y(YES)となり、ステップ176で、「功」が第1
候補として表記1に登録され、「項」が第2候補として
表記2とランク2にシフトされる。なお「功」を得るた
めの再変換の数は1回であり5回未満なので、「功」の
ランクはBとしてランク1に格納される。この結果、優
先語辞書6dは図15(b)のようになる。Next, when "Kou" is selected for the reading "Kou", the same processing as described above is performed up to step 168. This time, since only one word “item” is registered in the priority word dictionary 6d with the reading “ko”, Y (YES) is determined in step 169 and step 1 is performed.
It becomes Y (YES) at 70. Next, since “term” in the priority word dictionary 6d is an important word of rank A, Y (YES) is determined in step 174, and
The item is registered in notation 1 as a candidate, and “item” is shifted to notation 2 and rank 2 as a second candidate. It should be noted that the number of reconversions for obtaining “gong” is one, which is less than five, so that the rank of “gong” is stored in rank 1 as B. As a result, the priority word dictionary 6d is as shown in FIG.
【0070】次に「こう」という読みに対して「甲」が
選択されると、ステップ168までは上記と同様の処理
が行われ、今度は優先語辞書6d中に「こう」という読
みに対する語が「功」と「項」の2つ登録されいるの
で、ステップ169でY(YES)となり、ステップ1
70でN(NO)となる。「功」がランクB、「項」が
ランクAと重要度が異なるのでステップ171でY(Y
ES)となり、重要度の低い表記1の「功」が削除され
(ステップ172)、新しい語である「甲」が表記1に
登録される(ステップ176)。「甲」を得るための再
変換の数は7回であり5回以上なので、「甲」のランク
はAであり、この結果、優先語辞書6dは図15(c)
のようになる。Next, when "Ko" is selected for the reading "Kou", the same processing as described above is performed up to step 168, and the word corresponding to the reading "Kou" is stored in the priority word dictionary 6d. Are registered as “Gong” and “Item”, the result is Y (YES) in Step 169, and Step 1
It becomes N (NO) at 70. Since “Gong” is different in rank from B and “Item” is different in rank from A, Y (Y
ES), and the “gong” of the notation 1 with low importance is deleted (step 172), and the new word “a” is registered in the notation 1 (step 176). Since the number of reconversions to obtain “A” is 7 times and 5 or more, the rank of “A” is A, and as a result, the priority word dictionary 6d is shown in FIG.
become that way.
【0071】次に「こう」という読みに対して「功」が
再び選択される。ステップ168までは同様の処理が進
み、優先語辞書6d中に「こう」という読みに対する語
が、「甲」と「項」の2つ登録されているので、ステッ
プ169でY(YES)となり、ステップ170でN
(NO)となる。「甲」と「項」は同じ重要度であるの
で、ステップ171でN(NO)となり、優先語辞書6
dへの登録の古い語である表記2の「項」が削除され
(ステップ173)、新しく「功」が第1候補として表
記1に登録され、「甲」が第2候補として表記2とラン
ク2にシフトされる(ステップ176)。「功」を得る
ための再変換の回数は1回であり5回未満なので、
「功」のランクはBであり、この結果、優先語辞書6d
は図15(d)のようになる。Next, for the reading "KOU", "KON" is selected again. The same processing proceeds up to step 168, and two words corresponding to the reading “ko” are registered in the priority word dictionary 6d, “Ko” and “item”, so that Y (YES) is obtained in step 169, N at step 170
(NO). Since “A” and “item” have the same importance, N (NO) is obtained in step 171 and the priority word dictionary 6
The "term" of the notation 2, which is an old word registered in d, is deleted (step 173), "gong" is newly registered in the notation 1 as a first candidate, and "A" ranks with the notation 2 as a second candidate. 2 (step 176). Since the number of reconversions to obtain "Gong" is one and less than five,
The rank of “K” is B, and as a result, the priority word dictionary 6d
Is as shown in FIG.
【0072】なお、優先語辞書6dにランクBの一般語
が1つだけ登録されていて、今回登録する語もランクB
の一般語のときは、ステップ169でY(YES)、ス
テップ170でY(YES)、ステップ174でN(N
O)となり、ステップ175で優先語辞書6dの表記1
に登録されている語を削除してから、ステップ176で
新しい語を登録する。Note that only one general word of rank B is registered in the priority word dictionary 6d, and the word registered this time is also rank B
In step 169, Y (YES), in step 170, Y (YES), and in step 174, N (N
O), and at step 175, the notation 1 of the priority word dictionary 6d
Is deleted, and a new word is registered in step 176.
【0073】以上のように本実施例は、優先語辞書6d
に既登録の同音語数が0の場合は、新たな語を表記1に
登録する。同音語数が1の場合は、既登録語が一般語な
ら既登録語を削除してから新たな語を表記1に登録し、
既登録語が重要語なら既登録語を表記2にシフトし新た
な語を表記1に登録する。同音語数が2の場合は、既登
録語がどちらも重要語なら登録の古い語を削除し、かつ
残す語を表記2にシフトしてから新たな語を表記1に登
録し、既登録語の重要度が異なれば重要度の低い一般語
を削除し、かつ残す語を表記2にシフトしてから新たな
語を表記1に登録する。したがって本実施例によれば、
再変換の回数が5回以上の重要語を表記1と表記2の両
方に登録するので、重要語は数多く優先語辞書6dに登
録できる。また、再変換の回数が5回未満の一般語は表
記1にだけ登録し、また、登録の古い語や重要度の低い
語から先に削除するので、優先語辞書6dの記憶領域を
有効に利用できる。As described above, in this embodiment, the preferred word dictionary 6d
If the number of homonyms already registered is 0, a new word is registered in notation 1. If the number of homophones is 1, if the registered word is a general word, delete the registered word and then register a new word in the notation 1,
If the registered word is an important word, the registered word is shifted to notation 2 and a new word is registered in notation 1. If the number of homophones is 2, if both registered words are important words, delete the old registered word, shift the remaining words to notation 2, register the new word in notation 1, and register the new word in notation 1. If the importance is different, a general word having a low importance is deleted, and the remaining word is shifted to the notation 2, and a new word is registered in the notation 1. Therefore, according to the present embodiment,
Since important words whose reconversion times are 5 or more are registered in both the notation 1 and the notation 2, many important words can be registered in the priority word dictionary 6d. In addition, a general word whose reconversion is less than 5 is registered only in the notation 1, and an old registered word or a word of low importance is deleted first, so that the storage area of the priority word dictionary 6d is effectively used. Available.
【0074】なお、本実施例では重要度を再変換の回数
が5回以上と5回未満の2つに分けたが、操作量の多さ
によってさらに細かく重要度を分けてもよい。また、本
実施例では優先語辞書6dに登録できる同音語の数を表
記1と表記2の2通りに分けたが、基本辞書3にある読
みの同音語の数によって、さらに多くの表記数に分けて
もよい。In the present embodiment, the importance is divided into two, ie, the number of times of reconversion is 5 or more and less than 5, but the importance may be further finely divided depending on the amount of operation. Further, in the present embodiment, the number of homonyms that can be registered in the priority word dictionary 6d is divided into two types, notation 1 and notation 2. However, the number of homonyms that are read in the basic dictionary 3 can be further increased. May be divided.
【0075】また、本実施例の優先語辞書6dの表記1
及び表記2には図15に示したように漢字表記を格納す
る例を示したが、漢字表記を格納する代わりに例えば基
本辞書3中の漢字表記のアドレスでもよく、基本辞書3
に格納されている漢字表記を特定できるものを格納して
もよい。In addition, the notation 1 of the preferred word dictionary 6d of this embodiment
15 shows an example in which the kanji notation is stored as shown in FIG. 15, but instead of storing the kanji notation, for example, the address of the kanji notation in the basic dictionary 3 may be used.
May be stored.
【0076】実施例6.図17は、本発明による文書入
力装置の実施例6の全体構成図であり、図1に示した実
施例1と同様のものは同一番号を付して説明を省略す
る。図17において、6eはユーザが選択した候補を記
録する優先語辞書、8eは文節生成手段5によって区切
られた文節の読みから優先語辞書6eを検索する優先語
辞書検索手段、15は選択された候補の語と語の接続関
係の有無を基本辞書3に登録されている漢字表記の属性
情報から判断し、選択された語を接続関係も含め優先語
辞書6eに登録する接続関係判定手段である。2eは基
本辞書検索手段4、文節生成手段5、優先語辞書検索手
段8e及び接続関係判定手段15とで構成され、ROM
などに書き込まれている制御プログラムに従い、後述す
る処理を行う制御部である。Embodiment 6 FIG. FIG. 17 is an overall configuration diagram of a sixth embodiment of the document input device according to the present invention. Components similar to those of the first embodiment shown in FIG. In FIG. 17, 6e is a preferential word dictionary for recording candidates selected by the user, 8e is a preferential word dictionary search means for searching the preferential word dictionary 6e from reading of phrases separated by the clause generating means 5, and 15 is selected. It is a connection relation determining means for determining whether or not there is a connection relation between candidate words from the kanji notation attribute information registered in the basic dictionary 3 and registering the selected word including the connection relation in the priority word dictionary 6e. . 2e is composed of a basic dictionary search means 4, a phrase generation means 5, a priority word dictionary search means 8e, and a connection relation judgment means 15,
It is a control unit that performs processing described below in accordance with a control program written in, for example,.
【0077】図18は、本実施例における優先語辞書6
eの説明図である。優先語辞書6eには、文節の読み、
表記、この表記に対する前単語と後単語が図18のよう
に格納されている。2つの語が接続関係にあると判断さ
れたとき、接続した語を1つの表記で登録する。また、
前単語とは接続した語の前の単語であり、後単語とは接
続した語の後ろの単語である。例として、「かいげんし
ょう」という読みに対して「怪現象」という表記を得る
場合について説明する。なお、基本辞書3には「怪現
象」という単語がなく、「怪」という接頭辞と、「会」
「解」「階」「貝」「下位」などの名詞が「怪」よりも
優先度の高い語として登録されているとし、さらに「現
象」(名詞)という語も登録されているとする。また、
接頭辞と名詞からなる語を接続関係有りとする。また、
優先語辞書6eには最初の状態として登録されている語
はないものとする。FIG. 18 shows the preferred word dictionary 6 in this embodiment.
It is explanatory drawing of e. In the preferred word dictionary 6e, reading of a phrase,
The notation, and the preceding and succeeding words for this notation are stored as shown in FIG. When it is determined that two words have a connection relationship, the connected word is registered in one notation. Also,
The pre-word is the word before the connected word, and the post-word is the word after the connected word. As an example, a case will be described in which the notation "mysterious phenomenon" is obtained for the reading "kaigensho". Note that the basic dictionary 3 does not include the word “mysterious phenomenon”, and the prefix “mystery” and “kai”
It is assumed that nouns such as “solution”, “floor”, “shell”, and “lower” are registered as words having higher priority than “monster”, and that the word “phenomenon” (noun) is also registered. Also,
A word consisting of a prefix and a noun is connected. Also,
It is assumed that there is no word registered as the initial state in the priority word dictionary 6e.
【0078】図19は、本実施例の動作を示すフローチ
ャートであり、本実施例の動作を図19のフローチャー
トに基づいて説明する。「かいげんしょう」というかな
を入力すると(ステップ191)、実施例1と同様に、
基本辞書3の検索(ステップ192)、文節の生成(ス
テップ193)、優先語辞書6eの検索(ステップ19
4)、候補の表示(ステップ195)、再変換(ステッ
プ196)の処理が行われ、文節が「かい」と「げんし
ょう」に区切らる。ここでは「かい」にたいして「会」
が、「げんしょう」に対して「現象」が表示されたとす
る。次に、ステップ196で何度か再変換キーが押さ
れ、「かい」に対して「怪」を表示させ、「げんしょ
う」は「現象」のままで確定する。次に接続関係判断手
段15は、基本辞書3によって「怪」の品詞が接頭辞で
あり、「現象」の品詞が名詞であることを知り、2つの
語に関して接続関係ありと判断し(ステップ197)、
接続語として登録する(ステップ198)。FIG. 19 is a flowchart showing the operation of this embodiment. The operation of this embodiment will be described with reference to the flowchart of FIG. When the user enters “Kaigensho” (step 191), as in the first embodiment,
Retrieval of basic dictionary 3 (step 192), generation of phrase (step 193), retrieval of preferential word dictionary 6e (step 19)
4), candidates are displayed (step 195), and re-conversion (step 196) is performed, and the phrase is divided into "kai" and "gensho". Here, "kai" for "kai"
However, suppose that "phenomenon" is displayed for "gensho". Next, in step 196, the re-conversion key is pressed several times, "kai" is displayed for "kai", and "gensho" is fixed as "phenomenon". Next, the connection relation judging means 15 knows that the part of speech of "monster" is a prefix and the part of speech of "phenomenon" is a noun from the basic dictionary 3, and judges that there is a connection relation between the two words (step 197). ),
Register as a connection word (step 198).
【0079】この結果、優先語辞書6eには図18
(a)のように「かいげんしょう」という読みで表記に
「怪現象」、前単語に「怪」、後単語に「現象」が登録
される。以降「かいげんしょう」が入力された場合は、
「怪現象」が第1候補として表示される。このとき「か
い」という見出しで登録されている語はないので、「か
いげんしょう」以外の「かい」に対しては、「怪」は優
先されず、基本辞書3の優先度順に表示される。As a result, FIG.
As shown in (a), the reading “Kaigensho” is registered with the notation “mysterious phenomenon”, the previous word “mysterious”, and the subsequent word “phenomenon”. After that, if "Kaigensho" is entered,
“Mysterious phenomenon” is displayed as a first candidate. At this time, since there is no word registered under the heading of “kai”, “kai” is not given priority to “kai” other than “kaigensho” and is displayed in the priority order of the basic dictionary 3.
【0080】ステップ197で接続関係なしと判断され
たときは、1語単位で優先語辞書6eに登録される。例
えば「かいげんしょう」に対し、「下位」(名詞)と
「現象」(名詞)が選択された場合、ステップ197
で、名詞と名詞との間には接続関係がないと判断され、
図18(b)のように「かい」という見出しで「下位」
が登録され(ステップ199)、以降「かい」という読
みに対応する候補に関しては、「下位」が優先されるこ
とになる。If it is determined in step 197 that there is no connection, the words are registered in the priority word dictionary 6e in word units. For example, when “lower” (noun) and “phenomenon” (noun) are selected for “kaigensho”, step 197
It is determined that there is no connection between the noun and the noun,
As shown in FIG. 18 (b), the heading “KAI” indicates “lower”.
Is registered (step 199), and with respect to the candidate corresponding to the reading “kai”, “lower” is given priority.
【0081】本実施例では、接続関係を接頭辞と名詞と
したが、名詞と接尾辞、あるいは、付属語をはさまない
名詞と名詞を接続語学習の対象にしてもよい。また、本
実施例の優先語辞書6eの表記には図18に示したよう
に漢字表記を格納する例を示したが、漢字表記を格納す
る代わりに例えば基本辞書3中の漢字表記のアドレスで
もよく、基本辞書3に格納されている漢字表記を特定で
きるものを格納してもよい。In the present embodiment, the connection relation is a prefix and a noun, but a noun and a suffix, or a noun and a noun that do not sandwich an adjunct, may be subjected to the connection word learning. Although the preferred word dictionary 6e according to the present embodiment has an example in which the kanji notation is stored as shown in FIG. 18, instead of storing the kanji notation, for example, the address of the kanji notation in the basic dictionary 3 may be used. It is also possible to store a kanji notation stored in the basic dictionary 3.
【0082】[0082]
【発明の効果】以上のようにこの発明によれば、選択さ
れた漢字混じり表記の基本辞書に登録されている漢字表
記の品詞情報から決定した重要度にしたがって優先語辞
書に記録する記録期間を変えるので、重要度の高い語は
長い間優先語辞書に残すことができる。さらに、重要度
の低い語を先に削除するので、優先語辞書の記憶領域が
有効に利用できる。As described above, according to the present invention, the recording period to be recorded in the priority word dictionary according to the importance determined from the part of speech information of the kanji notation registered in the selected basic kanji mixed notation dictionary. As it changes, words with high importance can be left in the preferred word dictionary for a long time. Furthermore, since words with low importance are deleted first, the storage area of the priority word dictionary can be used effectively.
【0083】[0083]
【0084】また別な発明によれば、基本辞書に登録さ
れている漢字表記の属性情報から決定した重要度にした
がって優先語辞書に記録する記録期間を変えるので、重
要度の高い語は長い間優先語辞書に残すことができる。
さらに、重要度の低い語を先に削除するので、優先語辞
書の記憶領域が有効に利用できる。 According to another aspect of the invention, the recording period for recording in the priority word dictionary is changed according to the importance determined from the attribute information of the kanji notation registered in the basic dictionary. Can be left in the preferred word dictionary.
Furthermore, since words with low importance are deleted first, the storage area of the priority word dictionary can be used effectively.
【0085】また別な発明によれば、基本辞書に登録さ
れているかなに対する同音語数から決定した重要度にし
たがって優先語辞書に記録する同音語数を変えるので、
重要度の高い語は数多く優先語辞書に残すことができ
る。さらに、重要度の低い語を先に削除するので、優先
語辞書の記憶領域が有効に利用できる。 According to another invention, the number of homophones recorded in the priority word dictionary is changed according to the importance determined from the number of homophones for the kana registered in the basic dictionary.
Many words with high importance can be left in the preferred word dictionary. Furthermore, since words with low importance are deleted first, the storage area of the priority word dictionary can be used effectively.
【0086】また別な発明によれば、目的の漢字混じり
候補が選択されるまでに入力された操作量の合計から決
定した重要度と選択された候補を優先語辞書に記録し、
記録した重要度にしたがって優先語辞書に記録する記録
期間を変えるので、重要度の高い語は長い間優先語辞書
に残すことができる。さらに、重要度の低い語を先に削
除するので、優先語辞書の記憶領域が有効に利用でき
る。 According to another aspect of the present invention, the importance determined from the total of the operation amounts input until the target kanji mixture candidate is selected and the selected candidate are recorded in the priority word dictionary,
Since the recording period for recording in the priority word dictionary is changed according to the recorded importance, words having high importance can be left in the priority word dictionary for a long time. Furthermore, since words with low importance are deleted first, the storage area of the priority word dictionary can be used effectively.
【0087】また別な発明によれば、目的の漢字混じり
候補が選択されるまでに入力された操作量の合計から決
定した重要度と選択された候補を優先語辞書に記録し、
記録した重要度にしたがって優先語辞書に記録する同音
語数を変えているので、重要度の高い語は数多く優先語
辞書に残すことができる。さらに、重要度の低い語を先
に削除するので、優先語辞書の記憶領域が有効に利用で
きる。 According to another aspect of the present invention, the importance determined from the total of the operation amounts input until the target kanji mixture candidate is selected and the selected candidate are recorded in the priority word dictionary,
Since the number of homologous words recorded in the priority word dictionary is changed according to the recorded importance, many words having high importance can be left in the priority word dictionary. Furthermore, since words with low importance are deleted first, the storage area of the priority word dictionary can be used effectively.
【0088】[0088]
【図1】本発明の実施例1による文書入力装置の全体構
成図である。FIG. 1 is an overall configuration diagram of a document input device according to a first embodiment of the present invention.
【図2】本発明の実施例1で用いられる優先語辞書の説
明図である。FIG. 2 is an explanatory diagram of a preferred word dictionary used in Embodiment 1 of the present invention.
【図3】本発明の実施例1による文書入力装置の動作を
示すフローチャートである。FIG. 3 is a flowchart illustrating an operation of the document input device according to the first embodiment of the present invention.
【図4】本発明の実施例2による文書入力装置の全体構
成図である。FIG. 4 is an overall configuration diagram of a document input device according to a second embodiment of the present invention.
【図5】本発明の実施例2で用いられる優先語辞書の説
明図である。FIG. 5 is an explanatory diagram of a preferred word dictionary used in Embodiment 2 of the present invention.
【図6】本発明の実施例2による文書入力装置の動作を
示すフローチャートである。FIG. 6 is a flowchart showing an operation of the document input device according to the second embodiment of the present invention.
【図7】本発明の実施例2で用いられる優先語辞書の説
明図である。FIG. 7 is an explanatory diagram of a preferred word dictionary used in Embodiment 2 of the present invention.
【図8】本発明の実施例3による文書入力装置の全体構
成図である。FIG. 8 is an overall configuration diagram of a document input device according to a third embodiment of the present invention.
【図9】本発明の実施例3で用いられる優先語辞書の説
明図である。FIG. 9 is an explanatory diagram of a preferred word dictionary used in Embodiment 3 of the present invention.
【図10】本発明の実施例3による文書入力装置の動作
を示すフローチャートである。FIG. 10 is a flowchart showing an operation of the document input device according to the third embodiment of the present invention.
【図11】本発明の実施例4による文書入力装置の全体
構成図である。FIG. 11 is an overall configuration diagram of a document input device according to a fourth embodiment of the present invention.
【図12】本発明の実施例4で用いられる優先語辞書の
説明図である。FIG. 12 is an explanatory diagram of a preferred word dictionary used in Embodiment 4 of the present invention.
【図13】本発明の実施例4による文書入力装置の動作
を示すフローチャートである。FIG. 13 is a flowchart illustrating an operation of the document input device according to the fourth embodiment of the present invention.
【図14】本発明の実施例5による文書入力装置の全体
構成図である。FIG. 14 is an overall configuration diagram of a document input device according to a fifth embodiment of the present invention.
【図15】本発明の実施例5で用いられる優先語辞書の
説明図である。FIG. 15 is an explanatory diagram of a preferred word dictionary used in Embodiment 5 of the present invention.
【図16】本発明の実施例5による文書入力装置の動作
を示すフローチャートである。FIG. 16 is a flowchart showing an operation of the document input device according to the fifth embodiment of the present invention.
【図17】本発明の実施例6による文書入力装置の全体
構成図である。FIG. 17 is an overall configuration diagram of a document input device according to a sixth embodiment of the present invention.
【図18】本発明の実施例6で用いられる優先語辞書の
説明図である。FIG. 18 is an explanatory diagram of a preferred word dictionary used in Embodiment 6 of the present invention.
【図19】本発明の実施例6による文書入力装置の動作
を示すフローチャートである。FIG. 19 is a flowchart illustrating an operation of the document input device according to the sixth embodiment of the present invention.
【図20】従来の文書入力装置の動作を説明するための
説明図である。FIG. 20 is an explanatory diagram for explaining an operation of a conventional document input device.
1 入力手段 3 基本辞書 4 基本辞書検索手段 5 文節生成手段 6 優先語辞書 7 文節情報抽出手段 8 優先語辞書検索手段 9 表示手段 10 属性優先度決定手段 11 基本登録同音語数決定手段 12 操作量総計手段 13 操作量優先度決定手段 14 操作量登録同音語数決定手段 15 接続関係判定手段 DESCRIPTION OF SYMBOLS 1 Input means 3 Basic dictionary 4 Basic dictionary search means 5 Clause generation means 6 Priority word dictionary 7 Phrase information extraction means 8 Priority word dictionary search means 9 Display means 10 Attribute priority determination means 11 Basic registration homonym number determination means 12 Total operation amount Means 13 Operation amount priority determination means 14 Operation amount registration homophone number determination means 15 Connection relation determination means
───────────────────────────────────────────────────── フロントページの続き (72)発明者 西原 正人 鎌倉市大船五丁目1番1号 三菱電機株 式会社 パーソナル情報機器開発研究所 内 (56)参考文献 特開 平3−167659(JP,A) 特開 昭60−57425(JP,A) 特開 平3−48968(JP,A) 実開 昭60−57425(JP,U) (58)調査した分野(Int.Cl.7,DB名) G06F 17/22 ──────────────────────────────────────────────────続 き Continuation of the front page (72) Inventor Masato Nishihara 5-1-1, Ofuna, Kamakura-shi Mitsubishi Electric Corporation Personal Information Equipment Development Laboratory (56) References JP-A-3-167659 (JP, A JP-A-60-57425 (JP, A) JP-A-3-48968 (JP, A) JP-A-60-57425 (JP, U) (58) Fields investigated (Int. Cl. 7 , DB name) G06F 17/22
Claims (5)
かなに対応する漢字表記とこの表記の属性情報を格納し
た基本辞書と、上記入力手段によって入力されたかな文
字列の部分文字列で上記基本辞書を検索する基本辞書検
索手段と、この基本辞書検索手段によって検索した情報
から入力かな文字列を日本語の文節に区切り漢字混じり
表記を生成する文節生成手段と、漢字混じり表記の候補
を表示する表示手段と、この表示手段に表示した候補か
ら上記入力手段によって選択された候補の自立語が記録
される優先語辞書と、上記文節生成手段によって区切ら
れた文節中の自立語の読みから上記優先語辞書を検索す
る優先語辞書検索手段とを備えた文書入力装置におい
て、上記入力手段によって選択された候補を上記優先語
辞書に記録するとともに、上記候補の品詞によって重要
度を決定し、その重要度に応じて上記優先語辞書に記録
される期間の基準を変える優先度決定手段を設け、上記
優先語辞書検索手段は、上記文節生成手段によって区切
られた文節の読みから上記優先語辞書を検索し、上記重
要度に基づく最新使用の候補を優先する構成としたこと
を特徴とする文書入力装置。1. An input means for inputting a Japanese sentence with a kana,
A basic dictionary storing kanji notation corresponding to kana and attribute information of the notation; a basic dictionary search means for searching the basic dictionary with a partial character string of a kana character string input by the input means; and a basic dictionary search A phrase generating means for separating an input kana character string into Japanese phrases from information retrieved by the means to generate a kanji-mixed notation, a display means for displaying kanji-mixed notation candidates, and inputting from the candidates displayed on the display means. A preferred word dictionary in which the independent word of the candidate selected by the means is recorded; and a preferred word dictionary search means for searching the preferred word dictionary from reading of the independent word in the phrase separated by the clause generating means. the document input device, the candidate selected by said input means as well as recorded in the priority dictionary, to determine the importance of the part of speech of the candidate, its weight Priority term determining means for changing a reference of a period recorded in the priority word dictionary in accordance with the degree of search, wherein the priority word dictionary search means searches the priority word dictionary from reading of phrases separated by the phrase generating means A document input device characterized in that the latest use candidate based on the importance is given priority.
かなに対応する漢字表記とこの表記の属性情報を格納し
た基本辞書と、上記入力手段によって入力されたかな文
字列の部分文字列で上記基本辞書を検索する基本辞書検
索手段と、この基本辞書検索手段によって検索した情報
から入力かな文字列を日本語の文節に区切り漢字混じり
表記を生成する文節生成手段と、漢字混じり表記の候補
を表示する表示手段と、この表示手段に表示した候補か
ら上記入力手段によって選択された候補の自立語が記録
される優先語辞書と、上記文節生成手段によって区切ら
れた文節中の自立語の読みから上記優先語辞書を検索す
る優先語辞書検索手段とを備えた文書入力装置におい
て、上記入力手段によって選択された候補を上記優先語
辞書に記録するとともに、上記候補の基本辞書に登録さ
れているかなに対する同音語数から重要度を決定し、そ
の重要度に応じて上記優先語辞書に記録される期間の基
準を変える優先度決定手段を設け、上記優先語辞書検索
手段は、上記文節生成手段によって区切られた文節の読
みから上記優先語辞書を検索し、上記重要度に基づく最
新使用の候補を優先する構成としたことを特徴とする文
書入力 装置。 2. An input means for inputting a Japanese sentence with a kana,
Kanji notation corresponding to kana and attribute information of this notation are stored.
Basic dictionary and kana sentences input by the input means
Basic dictionary search that searches the above basic dictionary with a substring of a character string
Search means and information searched by the basic dictionary search means
Input kana character string is divided into Japanese phrases and mixed with kanji
Clause generation means for generating notation, and candidates for notation mixed with kanji
And a candidate displayed on the display means.
Records the independent word of the candidate selected by the above input means
And the preferred word dictionary to be separated
Search the preferred word dictionary from the reading of independent words in
Document input device provided with preferred word dictionary search means
The candidate selected by the input means
Record in the dictionary and register it in the above basic dictionary.
Importance is determined from the number of homonyms
Of the period recorded in the above-mentioned preferred word dictionary according to the importance of
A priority determining means for changing the priority is provided, and the priority word dictionary search is performed.
Means for reading the phrase separated by the phrase generating means.
From the priority word dictionary, and
A sentence characterized by giving priority to new use candidates
Input device.
登録されているかなに対する同音語数から上記重要度を
決定し、この決定した重要度にしたがって上記優先語辞
書に記録する同音語数を変えることで、上記優先語辞書
に記録される期間の基準を変える基本登録同音語数決定
手段で構成したことを特徴とする請求項2記載の文書入
力装置。3. The priority determination means determines the importance from the number of homophones for the kana registered in the basic dictionary, and changes the number of homophones recorded in the priority word dictionary according to the determined importance. 3. The document input device according to claim 2, wherein said document input device comprises basic registered homophone number determining means for changing a reference of a period recorded in said priority word dictionary.
かなに対応する漢字表記とこの表記の属性情報を格納し
た基本辞書と、上記入力手段によって入力されたかな文
字列の部分文字列で上記基本辞書を検索する基本辞書検
索手段と、この基本辞書検索手段によって検索した情報
から入力かな文字列を日本語の文節に区切り漢字混じり
表記を生成する文節生成手段と、漢字混じり表記の候補
を表示する表示手段と、この表示手段に表示した候補か
ら上記入力手段によって選択された候補の自立語が記録
される優先語辞書と、上記文節生成手段によって区切ら
れた文節中の自立語の読みから上記優先語辞書を検索す
る優先語辞書検索手段とを備えた文書入力装置におい
て、上記入力手段によって選択された候補を上記優先語
辞書に記録するとともに、上記候補が選択されるまでに
入力された操作量の合計を計測し、この操作量の合計か
ら上記重要度を決定し、この決定した重要度と上記選択
された候補を上記優先語辞書に記録し、記録した重要度
にしたがって上記優先語辞書に記録する記録期間を変更
する優先度決定手段を設け、上記優先語辞書検索手段
は、上記文節生成手段によって区切られた文節の読みか
ら上記優先語辞書を検索し、上記重要度に基づく最新使
用の候補を優先する構成としたことを特徴とする文書入
力装置。 4. An input means for inputting a Japanese sentence with a kana,
Kanji notation corresponding to kana and attribute information of this notation are stored.
Basic dictionary and kana sentences input by the input means
Basic dictionary search that searches the above basic dictionary with a substring of a character string
Search means and information searched by the basic dictionary search means
Input kana character string is divided into Japanese phrases and mixed with kanji
Clause generation means for generating notation, and candidates for notation mixed with kanji
And a candidate displayed on the display means.
Records the independent word of the candidate selected by the above input means
And the preferred word dictionary to be separated
Search the preferred word dictionary from the reading of independent words in
Document input device provided with preferred word dictionary search means
The candidate selected by the input means
In addition to recording in a dictionary, before the above candidate is selected
Measures the total amount of input operation, and checks whether the total
The above-mentioned importance is determined from the
The selected candidates are recorded in the above preferred word dictionary, and the recorded importance is recorded.
Change the recording period to record in the above preferred word dictionary according to
The priority word dictionary search means is provided.
Is the reading of the phrase separated by the above phrase generation means?
Search the above preferred word dictionary, and use the latest
Document input characterized by giving priority to
Power device.
り候補が選択されるまでに入力された操作量の合計を計
る操作量総計手段と、この操作量の合計から上記重要度
を決定し、この決定した重要度と上記選択された候補を
上記優先語辞書に記録し、記録した重要度にしたがって
上記優先語辞書に記録する同音語数を変えることで、上
記優先語辞書に記録される期間の基準を変える操作量登
録同音語数決定手段とで構成したことを特徴とする請求
項4記載の文書入力装置。5. The priority determination means, wherein the operation amount totalization means for measuring the total of the operation amounts inputted until the target kanji mixture candidate is selected, and the priority is determined from the total of the operation amounts. The determined importance and the selected candidate are recorded in the priority word dictionary, and the number of homophone words to be recorded in the priority word dictionary is changed according to the recorded importance. 5. The document input device according to claim 4, wherein said document input device comprises an operation amount registration homophone number determining means for changing a reference of said operation amount.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP01756594A JP3298288B2 (en) | 1994-02-14 | 1994-02-14 | Document input device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP01756594A JP3298288B2 (en) | 1994-02-14 | 1994-02-14 | Document input device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH07225757A JPH07225757A (en) | 1995-08-22 |
| JP3298288B2 true JP3298288B2 (en) | 2002-07-02 |
Family
ID=11947444
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP01756594A Expired - Lifetime JP3298288B2 (en) | 1994-02-14 | 1994-02-14 | Document input device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3298288B2 (en) |
-
1994
- 1994-02-14 JP JP01756594A patent/JP3298288B2/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH07225757A (en) | 1995-08-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6602300B2 (en) | Apparatus and method for retrieving data from a document database | |
| JP2832988B2 (en) | Data retrieval system | |
| JP2742115B2 (en) | Similar document search device | |
| JP2669601B2 (en) | Information retrieval method and system | |
| JP2008059392A (en) | Dictionary search apparatus and dictionary search processing program | |
| JP3298288B2 (en) | Document input device | |
| JP5583230B2 (en) | Information search apparatus and information search method | |
| KR100452024B1 (en) | Searching engine and searching method | |
| JPH0236019B2 (en) | ||
| JPH08339376A (en) | Foreign language search device and information search system | |
| JP3498635B2 (en) | Information retrieval method and apparatus, and computer-readable recording medium | |
| JPH08147289A (en) | System and method for kana/kanji conversion | |
| JPH07129572A (en) | Kanji converter | |
| JPS6246029B2 (en) | ||
| JP2634596B2 (en) | Kana-Kanji conversion device | |
| JP2537991B2 (en) | Character input device and method | |
| JP2002049616A (en) | Device and method for kana-kanji conversion | |
| JPH0746353B2 (en) | Japanese text input device | |
| JP2009265845A (en) | Device and program for retrieving example sentence | |
| JPH05324610A (en) | Address notation chinese character inputting device | |
| JPS59116835A (en) | Japanese input device with input abbreviating function | |
| JPH03208162A (en) | Input device | |
| JPH0512254A (en) | Document creation device | |
| JPH0610804B2 (en) | Kana-Kanji converter | |
| JPS6243769A (en) | Kana-to-kanji converting device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080419 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090419 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100419 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100419 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110419 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120419 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120419 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130419 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130419 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140419 Year of fee payment: 12 |
|
| EXPY | Cancellation because of completion of term |