JP2001175645A - Chinese input conversion processing device, Chinese input conversion processing method, and recording medium - Google Patents
Chinese input conversion processing device, Chinese input conversion processing method, and recording mediumInfo
- Publication number
- JP2001175645A JP2001175645A JP35945999A JP35945999A JP2001175645A JP 2001175645 A JP2001175645 A JP 2001175645A JP 35945999 A JP35945999 A JP 35945999A JP 35945999 A JP35945999 A JP 35945999A JP 2001175645 A JP2001175645 A JP 2001175645A
- Authority
- JP
- Japan
- Prior art keywords
- input
- character string
- conversion
- correction
- pinyin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【課題】キーのタイプミスのような誤入力を自動的に訂
正し、ユーザが意図する中国語漢字を変換結果として得
る。
【解決手段】入力部101を通じて変換対象となる文字
列がピンイン入力された際に、訂正範囲決定部113に
て当該入力文字列の中で訂正が必要な範囲を決定し、訂
正パターン生成部106にてその範囲内の文字列を訂正
してピンインとして有効な訂正文字列の候補を作成す
る。この訂正文字列の候補を用いて漢字変換部109に
よりピンイン漢字変換し、その変換候補を出力する。こ
れにより、タイプミスのような誤入力であっても、それ
を訂正した文字列によりユーザの意図した変換候補が得
られるようになる。
(57) [Summary] [Problem] To automatically correct an erroneous input such as a key typo and obtain a Chinese kanji intended by a user as a conversion result. When a character string to be converted is pin-in input via an input unit, a correction range determining unit determines a range that needs correction in the input character string, and a correction pattern generating unit. Then, a character string within the range is corrected to create a corrected character string candidate effective as a pinyin. Pinyin kanji conversion is performed by the kanji conversion unit 109 using the corrected character string candidates, and the conversion candidates are output. As a result, even if an erroneous input such as a typo is made, a conversion candidate intended by the user can be obtained by the character string corrected.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、中国語の入力を可
能とするワードプロセッサやパーソナルコンピュータ等
の文書作成装置に用いられる中国語入力変換処理装置に
係り、特に誤入力訂正機能を備えた中国語入力変換処理
装置と、同装置に用いられる中国語入力変換処理方法及
び記録媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a Chinese input conversion processing device used for a document creation device such as a word processor or a personal computer capable of inputting Chinese. The present invention relates to an input conversion processing device, a Chinese input conversion processing method used for the device, and a recording medium.
【0002】[0002]
【従来の技術】中国語の入力を可能とする文書作成装置
では、中国語の漢字とその読みを表す表音記号(以下、
ピンインと称す)とを対応付けた辞書を用い、中国語の
読みをピンインで入力し、これを漢字に変換して出力す
る機能を備えている。これをピンイン漢字変換機能(日
本語ワードプロセッサのかな漢字変換機能に相当)と呼
ぶ。2. Description of the Related Art In a document preparation device capable of inputting Chinese characters, phonograms (hereinafter, referred to as Chinese characters) representing Chinese kanji and their readings.
It has a function of inputting Chinese readings in Pinyin, converting them into Chinese characters, and outputting them using a dictionary that associates them with Pinyin). This is called the Pinyin Kanji conversion function (corresponding to the Kana-Kanji conversion function of a Japanese word processor).
【0003】中国語では、1つの漢字の発音は必ず1音
節になっている。1つの音節はさらに「声母」と呼ばれ
る先頭子音(音節の先頭にくる子音)と、「韻母」と呼
ばれる「声母」を除いた部分(母音、二重母音、鼻音化
母音などがある)とで構成されている。ピンイン入力方
式では、このような声母と韻母をアルファベットの文字
列で入力する。In Chinese, the pronunciation of one kanji is always one syllable. One syllable is further composed of a leading consonant called "vowel" (a consonant at the beginning of the syllable) and a portion excluding "vowel" called "final vowel" (including vowels, diphthongs, and nasalized vowels). Have been. In the Pinyin input method, such initials and finals are input as character strings of the alphabet.
【0004】ところで、中国語漢字の読みを入力する場
合において、そのピンイン文字列を誤ることがある。ピ
ンイン文字列を誤ると、意図した中国語漢字を得ること
ができない。従来、このような入力の誤りを訂正する方
法としては、例えば特開平5−108647号公報に記
載されているものがある。これは、発音上の誤りを訂正
するものである。すなわち、例えば、「ting」と
「ding」というように、発音が類似するものを予め
テーブルに登録しておき、ユーザが入力したピンイン文
字列が誤りであると仮定して、上記テーブルから発音の
類似した文字列を訂正候補として出力するものである。When inputting Chinese kanji readings, the Pinyin character string may be mistaken. If the Pinyin string is incorrect, the intended Chinese kanji cannot be obtained. Conventionally, as a method of correcting such an input error, for example, there is a method described in Japanese Patent Application Laid-Open No. Hei 5-108647. This corrects pronunciation errors. That is, for example, similar pronunciations such as “ting” and “ding” are registered in the table in advance, and assuming that the Pinyin character string input by the user is incorrect, A similar character string is output as a correction candidate.
【0005】[0005]
【発明が解決しようとする課題】上述したように、従
来、入力されたピンイン文字列に対して、発音上の誤り
を訂正するものはあった。しかしながら、このような訂
正方法では、発音が似ている誤りについては訂正できて
も、キーのタイプミスのような誤入力については訂正す
ることはできない。ピンインの入力時には、発音の誤り
に限らず、タイプミスも非常に多く見られ、意図する中
国語漢字を得るために何度も入力し直さなければならな
いといった不具合があった。As described above, conventionally, there has been a method for correcting an error in pronunciation of an input Pinyin character string. However, such a correction method cannot correct an erroneous input such as a key typo, even if an error with similar pronunciation can be corrected. At the time of inputting Pinyin, not only pronunciation mistakes but also typographical errors are extremely common, and there is a problem that the user has to re-input many times to obtain the intended Chinese kanji.
【0006】本発明は上記のような点に鑑みなされたも
ので、キーのタイプミスのような誤入力を自動的に訂正
し、ユーザが意図する中国語漢字を変換結果として得る
ことのできる中国語入力変換処理装置、中国語入力変換
処理方法及び記録媒体を提供することを目的とする。SUMMARY OF THE INVENTION The present invention has been made in view of the above points, and provides a method of automatically correcting an erroneous input such as a key typo, thereby obtaining a Chinese kanji intended by a user as a conversion result. It is an object to provide a word input conversion processing device, a Chinese input conversion processing method, and a recording medium.
【0007】[0007]
【課題を解決するための手段】本発明は、中国語の読み
表記であるピンインを入力し、その入力されたピンイン
を中国語漢字に変換する中国語入力変換処理装置におい
て、変換対象となる文字列がピンイン入力された際に、
その入力文字列の中で訂正が必要な範囲を決定し、その
範囲内の文字列を訂正してピンインとして有効な訂正文
字列の候補を作成する入力訂正手段を備え、この入力訂
正手段によって得られた訂正文字列の候補を中国語漢字
に変換し、その変換候補を所定の順で出力することを特
徴とする。According to the present invention, there is provided a Chinese input conversion processing apparatus for inputting a Pinyin which is a Chinese reading notation and for converting the input Pinyin into a Chinese kanji. When the column is pinyin input,
The input character string is provided with input correction means for determining a range requiring correction, and correcting the character string within the range to create a valid correction character string candidate as pinyin. The corrected character string candidates are converted into Chinese kanji, and the conversion candidates are output in a predetermined order.
【0008】このような構成によれば、入力されたピン
イン文字列の一部に誤りがある場合に、その誤入力部分
が訂正範囲として決定され、文字の削除、追加、変更な
どによりピンインとして有効な訂正文字列の候補が作成
される。したがって、タイプミスのような誤入力であっ
ても、それを訂正した文字列の候補を用いてユーザの意
図した変換候補を得ることができる。According to such a configuration, when a part of the input Pinyin character string has an error, the erroneous input part is determined as a correction range, and is valid as Pinyin by deleting, adding, or changing the character. A corrected character string candidate is created. Therefore, even if an erroneous input such as a typo is made, a conversion candidate intended by the user can be obtained by using the character string candidate corrected.
【0009】さらに、上記構成において、訂正文字列の
候補の中で訂正前の文字列と発音が類似するものを検出
する類似発音検出手段を備えることで、発音上の誤りを
訂正した変換候補を優先的に出力することができる。Further, in the above-mentioned configuration, a similar pronunciation detecting means for detecting a pronunciation similar to a character string before correction among candidates of a corrected character string is provided, so that a conversion candidate having a corrected pronunciation error can be detected. Output can be given priority.
【0010】また、上記構成において、訂正文字列の候
補の中で過去に同じ入力訂正が行われたものを検出する
訂正学習検出手段を備えることで、ユーザの意図してい
る変換候補を優先的に出力することができる。Further, in the above-mentioned configuration, the correction learning detecting means for detecting a correction character string candidate in which the same input correction has been performed in the past is provided, so that the conversion candidate intended by the user is given priority. Can be output to
【0011】また、上記構成において、訂正文字列の候
補の中で訂正前の文字列に対応したキーと近接するキー
で入力されたものを検出するタイプミス検出手段を備え
ることで、キーボード上の各キーの配置から誤りやすい
タイプミスを訂正した変換候補を優先的に出力すること
ができる。[0011] In the above-mentioned structure, the typo detecting means for detecting, among the candidates of the corrected character string, a key input with a key adjacent to the key corresponding to the character string before correction, the typo detecting means is provided. A conversion candidate in which an erroneous typo has been corrected can be preferentially output from the arrangement of the keys.
【0012】[0012]
【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態を説明する。Embodiments of the present invention will be described below with reference to the drawings.
【0013】(第1の実施形態)図1は本発明の中国語
入力変換処理装置のシステム構成を示すブロック図であ
る。本装置は、中国語の読み表記であるピンインを入力
し、その入力されたピンインを中国語漢字に変換して出
力する機能を備えたものであり、例えば磁気ディスク等
の記録媒体に記録されたプログラムを読み込み、このプ
ログラムによって動作が制御されるコンピュータによっ
て実現される。(First Embodiment) FIG. 1 is a block diagram showing a system configuration of a Chinese input conversion processing device according to the present invention. This apparatus has a function of inputting Pinyin, which is a Chinese reading notation, converting the input Pinyin into Chinese kanji, and outputting it.For example, it is recorded on a recording medium such as a magnetic disk. It is realized by a computer that reads a program and whose operation is controlled by the program.
【0014】図1に示すように、本実施形態における中
国語入力変換処理装置は、CPU11と、このCPU1
1にシステムバス12を介して接続されるROM13、
RAM14、入力装置15、表示装置16、外部記憶装
置17、印刷装置18、通信装置19などによって構成
される。As shown in FIG. 1, a Chinese input conversion processing device according to this embodiment comprises a CPU 11 and a CPU 1.
A ROM 13 connected to the system 1 via a system bus 12;
It comprises a RAM 14, an input device 15, a display device 16, an external storage device 17, a printing device 18, a communication device 19 and the like.
【0015】CPU11は、本装置の動作全体を制御す
るものであり、ROM13やRAM14などのメモリに
格納されたプログラムの起動で動作する。なお、メモリ
に格納されたプログラムに基づいて実現される機能とし
ては、アプリケーションプログラムによるワードプロセ
ッサ等がある。The CPU 11 controls the entire operation of the present apparatus, and operates by starting a program stored in a memory such as the ROM 13 or the RAM 14. In addition, as a function realized based on the program stored in the memory, there is a word processor or the like by an application program.
【0016】ROM13には、本装置の起動に必要な各
種プログラムやフォント(中国語フォントを含む)等の
データが記憶されている。RAM14には、外部記憶装
置17からダウンロードされたプログラムや、CPU1
1の処理に用いられる各種のデータが格納される。The ROM 13 stores data such as various programs and fonts (including Chinese fonts) necessary for starting the apparatus. The RAM 14 stores programs downloaded from the external storage device 17 and the CPU 1.
Various types of data used for the first process are stored.
【0017】入力装置15は、例えばキーボードからな
り、本装置に対する指示やデータの入力を行うものであ
り、中国語の読み表記であるピンイン文字列の入力や、
その入力されたピンイン文字列に対するピンイン漢字変
換指示(「変換」キーの操作による指示)などを行うた
めのものである。The input device 15 is composed of, for example, a keyboard and is used to input instructions and data to the present device.
This is for performing a Pinyin Kanji conversion instruction (an instruction by operating a “Conversion” key) for the input Pinyin character string, and the like.
【0018】表示装置16は、例えばCRT (Cathode
Ray Tube) やLCD (Liquid Crystal Display) からな
り、入力装置15を通じて入力された文字列や変換結果
等を表示する。The display device 16 is, for example, a CRT (Cathode
It comprises a Ray Tube) and an LCD (Liquid Crystal Display), and displays a character string input through the input device 15, a conversion result, and the like.
【0019】外部記憶装置17は、例えばHDD (Hard
Disk Drive)やCD−ROM(Compact Disc Read Only
Memory)からなり、各種プログラムや文書などのデータ
を保存する。この外部記憶装置17には、ワードプロセ
ッサを実現するためのアプリケーションプログラムの
他、ピンイン漢字変換処理で使用する辞書などのデータ
も含まれる。The external storage device 17 is, for example, an HDD (Hard
Disk Drive) and CD-ROM (Compact Disc Read Only)
Memory), which stores data such as various programs and documents. The external storage device 17 includes data such as a dictionary used in Pinyin kanji conversion processing, in addition to an application program for realizing a word processor.
【0020】印刷装置18は、文書の印刷等を行うため
に用いられる。この印刷装置18としては、本装置に内
蔵されたものでも、外付けにて接続されるものでも良
い。また、通信装置19は、例えば構内LAN (Local
Area Network) や通信ネットワーク等を介して外部装置
とのデータの送受信制御を行うものである。The printing device 18 is used for printing a document or the like. The printing device 18 may be built in the device or connected externally. The communication device 19 is, for example, a local LAN (Local
It controls the transmission and reception of data to and from external devices via an area network) or a communication network.
【0021】次に、図1に示すシステム構成によって実
現される中国語入力変換処理装置の機能構成について説
明する。Next, the functional configuration of the Chinese input conversion processing device realized by the system configuration shown in FIG. 1 will be described.
【0022】図2は第1の実施形態における中国語入力
変換処理装置の機能構成を示すブロック図である。FIG. 2 is a block diagram showing a functional configuration of the Chinese input conversion processing device according to the first embodiment.
【0023】上記図1のCPU11の処理を機能的に示
すと、本装置は、入力部101、制御部102、出力部
103、入力MMI部104、変換文字列バッファ10
5、訂正パターン生成部106、ピンインテーブル10
7、訂正パターンバッファ108、漢字変換部109、
変換辞書110、変換結果バッファ111、候補選択部
112、訂正範囲決定部113によって構成される。Functionally showing the processing of the CPU 11 in FIG. 1, the present apparatus comprises an input unit 101, a control unit 102, an output unit 103, an input MMI unit 104, a converted character string buffer 10
5, correction pattern generation unit 106, pinyin table 10
7, correction pattern buffer 108, kanji conversion unit 109,
It comprises a conversion dictionary 110, a conversion result buffer 111, a candidate selection unit 112, and a correction range determination unit 113.
【0024】入力部101は、文字やファンクションな
どの入力を行う。制御部102は、入力部101、出力
部103、入力MMI部104の各部を制御する。出力
部103は、入力された結果の表示を行う。入力MMI
部104は、ユーザの入力操作を処理する。The input unit 101 inputs characters and functions. The control unit 102 controls each unit of the input unit 101, the output unit 103, and the input MMI unit 104. The output unit 103 displays the input result. Input MMI
The unit 104 processes a user's input operation.
【0025】変換文字列バッファ105は、変換対象と
して入力されたピンイン文字列を記憶する。訂正パター
ン生成部106は、変換対象として入力されたピンイン
文字列に対する訂正パターンの候補を生成する。ピンイ
ンテーブル107には、ピンインとして有効な文字列か
どうかを判定するための情報が格納されている。訂正パ
ターンバッファ108は、訂正パターン生成部106に
て生成された訂正パターンの候補を格納する。The conversion character string buffer 105 stores a Pinyin character string input as a conversion target. The correction pattern generation unit 106 generates correction pattern candidates for the Pinyin character string input as a conversion target. The pinyin table 107 stores information for determining whether the character string is valid as pinyin. The correction pattern buffer 108 stores the correction pattern candidates generated by the correction pattern generation unit 106.
【0026】漢字変換部109は、変換文字列バッファ
105に格納された入力文字列と訂正パターンバッファ
108に格納された訂正パターンの候補を対象として、
変換辞書110を参照して中国語漢字に変換する。変換
辞書110には、各単語毎にピンイン表記の読みとそれ
に対応した中国語漢字など、ピンイン漢字変換処理に必
要な情報が格納されいる。The kanji conversion unit 109 targets the input character string stored in the conversion character string buffer 105 and the correction pattern candidates stored in the correction pattern buffer 108 as targets.
With reference to the conversion dictionary 110, it is converted into Chinese kanji. The conversion dictionary 110 stores information necessary for Pinyin kanji conversion processing, such as reading of Pinyin notation and corresponding Chinese kanji for each word.
【0027】変換結果バッファ111は、漢字変換部1
09によって変換結果として得られた中国語漢字の候補
を保持する。候補選択部112は、ユーザの選択操作に
従って候補選択処理を行う。訂正範囲決定部113は、
変換辞書110またはピンインテーブル107を参照し
て、変換文字列バッファ105に格納された入力文字列
の中で訂正が必要な範囲を決定する。The conversion result buffer 111 stores the kanji conversion unit 1
09 holds the Chinese kanji candidate obtained as the conversion result. The candidate selection unit 112 performs a candidate selection process according to a user's selection operation. The correction range determining unit 113
Referring to the conversion dictionary 110 or the pinyin table 107, a range that needs to be corrected in the input character string stored in the conversion character string buffer 105 is determined.
【0028】次に、第1の実施形態の動作を説明する。Next, the operation of the first embodiment will be described.
【0029】図3は第1の実施形態における変換処理動
作を示すフローチャートである。FIG. 3 is a flow chart showing the conversion processing operation in the first embodiment.
【0030】例えばキーボードからなる入力部101を
通じて何らかのキーが入力されると(ステップA1
1)、制御部102はこのキー入力情報を入力MMI部
104へ送る。なお、入力MMI部104としては、か
な漢字変換を行うフロントエンドプロセッサ(FEP)
等の機能を想定しており、ここでは本発明に直接関係す
る文字入力処理についてのみ説明する(他の実施形態で
も同様)。For example, when any key is input through the input unit 101 composed of a keyboard (step A1)
1) The control unit 102 sends the key input information to the input MMI unit 104. The input MMI unit 104 is a front-end processor (FEP) that performs kana-kanji conversion.
Such functions are assumed, and here, only character input processing directly related to the present invention will be described (the same applies to other embodiments).
【0031】入力MMI部104はキー入力情報を受け
ると、まず、キー入力が文字入力か否かを判定する(ス
テップA12)。キー入力が通常の文字入力の場合、つ
まり、変換対象として入力されたピンイン文字列の場合
には(ステップA12のYes)、入力MMI部104
は当該キー入力情報に対応する文字コードで構成された
文字列を変換文字列バッファ105に格納する(ステッ
プA13)。Upon receiving the key input information, input MMI section 104 first determines whether or not the key input is a character input (step A12). If the key input is a normal character input, that is, if it is a Pinyin character string input as a conversion target (Yes in step A12), the input MMI unit 104
Stores a character string composed of a character code corresponding to the key input information in the converted character string buffer 105 (step A13).
【0032】また、上記ステップA12において、キー
入力が文字入力でなかった場合には、次に入力MMI部
104は変換操作か否かを判定する(ステップA1
4)。変換操作の場合、つまり、入力部101に設けら
れた「変換」キーの押下によりピンイン漢字変換が指示
された場合には(ステップA14のYes)、通常は漢
字変換部109にてピンイン漢字変換処理が実行される
が、本発明ではこれに先立ち入力訂正処理が実行され
る。If the key input is not a character input in step A12, the input MMI unit 104 next determines whether or not a conversion operation has been performed (step A1).
4). In the case of the conversion operation, that is, when Pinyin Kanji conversion is instructed by pressing the “Conversion” key provided in the input unit 101 (Yes in step A14), the Pinyin Kanji conversion processing is usually performed by the Kanji conversion unit 109. Is executed. In the present invention, an input correction process is executed prior to this.
【0033】入力訂正処理は以下のような手順で行われ
る。The input correction process is performed in the following procedure.
【0034】今、変換対象文字列として、“woyeh
nhao”(“woyehenhao”の入力誤り)と
いった文字列がユーザによりピンイン入力された場合を
想定する。Now, as a character string to be converted, "Woyeh
It is assumed that a character string such as "nhao" (input error of "wyohhenhao") is pinyin-input by the user.
【0035】訂正パターン生成部106は、まず、訂正
範囲決定部113に対して訂正範囲決定の要求を行う。
この要求を受けた訂正範囲決定部113は、変換文字列
バッファ105に現在格納されている入力文字列“wo
yehnhao”について、その入力文字列の中で訂正
が必要な範囲を決定する(ステップA15)。文字列全
体を訂正対象とした場合、訂正パターンの候補が膨大な
数になるため、予め訂正を行う必要のある範囲を決定し
ておく必要がある。The correction pattern generator 106 first requests the correction range determiner 113 to determine a correction range.
Upon receiving this request, the correction range determination unit 113 sets the input character string “wo” currently stored in the converted character string buffer 105.
For “ehnnhao”, a range that needs to be corrected in the input character string is determined (step A15). When the entire character string is to be corrected, the number of correction pattern candidates becomes enormous, so correction is performed in advance. It is necessary to determine the necessary range.
【0036】訂正範囲の決定は次のように行う。The correction range is determined as follows.
【0037】入力文字列のすべての範囲をピックアップ
し、これらすべての範囲について、その範囲内の文字列
により変換辞書110を検索する。この結果として検索
できた文字列の部分を除外し、残った文字列の範囲を訂
正範囲とする。なお、変換辞書110を検索する代わり
にピンインテーブル107を検索し、ピンインとして有
効な範囲を除外するようにしても良い。また、検索でき
たとしても、意図した文字列でないこともあるので、上
記変換辞書110またはピンインテーブル107にて検
索できた文字列の範囲についても訂正処理を行うことが
好ましい。The entire range of the input character string is picked up, and the conversion dictionary 110 is searched for the character string in the entire range. As a result, the portion of the character string that can be searched is excluded, and the range of the remaining character string is set as the correction range. Note that instead of searching the conversion dictionary 110, the pinyin table 107 may be searched to exclude a range valid as pinyin. Even if the character string is searched, the character string may not be the intended character string. Therefore, it is preferable to perform the correction process on the character string range searched by the conversion dictionary 110 or the pinyin table 107.
【0038】より具体的に説明すると、図10に示すよ
うな訂正範囲チェック表を作成して訂正範囲を決定す
る。図10の訂正範囲チェック表は、入力文字列“wo
yehnhao”の部分文字列について、辞書検索を行
った結果を示したものであり、“○”が検索結果があっ
たことを表している。当該入力文字列の中で辞書検索で
きた文字列(または有効ピンインであった文字列)は、
“wo”,“o”,“ye”,“e”,“n”,“h
a”,“hao”,“a”,“ao”,“o”である。More specifically, a correction range check table as shown in FIG. 10 is created to determine a correction range. The correction range check table shown in FIG.
This shows the result of a dictionary search performed on the partial character string “yehnhao”, where “○” indicates that there was a search result. Or a valid pinyin)
“Wo”, “o”, “ye”, “e”, “n”, “h”
a "," hao "," a "," ao "," o ".
【0039】入力文字列“woyehnhao”を1文
字目から見ていくと、“wo”までは検索できた文字列
が存在している。2文字目の“o”と次の“y”を含む
文字列で検索できたものはないので、ここで分割する。
同様にして、“ye”の範囲も検索できているが、次の
“h”を含む文字列で検索できたものはないので、この
部分は検索結果なしとなる。“n”,“hao”の範囲
は検索結果ありとなる。Looking at the input character string "wyohnhao" from the first character, there is a character string that could be searched up to "wo". There is no character string that could be searched for using a character string that includes the second character “o” and the next “y”, and is divided here.
Similarly, the range of “ye” can be searched, but there is no search with a character string including the next “h”, so that there is no search result in this part. The range of “n” and “hao” indicates a search result.
【0040】ここで、検索結果なしとなった“h”の部
分を訂正処理を行うべき範囲とする。ただし、この範囲
の前後の部分が誤っている可能性もあるので、その前後
の範囲も含めて1つの訂正範囲として決定する(範囲
2)。また、検索結果ありとされた範囲を訂正範囲とし
て加えても良い(範囲1、範囲3)。Here, the portion "h" for which there is no search result is the range in which the correction processing is to be performed. However, since there is a possibility that the part before and after this range may be incorrect, it is determined as one correction range including the range before and after that (range 2). Further, the range in which the search result is found may be added as the correction range (range 1, range 3).
【0041】訂正範囲決定部113は、決定した訂正範
囲の情報(少なくとも訂正範囲内の文字列と、入力文字
列上での開始位置)を訂正パターン生成部106に送
る。この場合、検索結果なしであった訂正範囲(範囲
2)、または、検索結果ありの範囲も含めたすべての訂
正範囲(範囲1〜3)の文字列が訂正パターン生成部1
06に送られる。The correction range determination unit 113 sends information on the determined correction range (at least the character string within the correction range and the start position on the input character string) to the correction pattern generation unit 106. In this case, the character string in the correction range without the search result (range 2) or in the entire correction range including the range with the search result (range 1 to 3) is the correction pattern generation unit 1.
06.
【0042】次に、訂正パターン生成部106により、
訂正範囲決定部113で決定した訂正範囲について訂正
パターン生成を行う(ステップA16)。上記訂正範囲
の文字列を誤った入力と仮定し、元の文字列に余分な文
字の追加、必要な文字の欠如、異なる文字の入力が存在
すると考える。訂正パターンはこれと逆にそれぞれ各文
字位置について文字の削除、追加、変更を行うことによ
って生成する。ただし、これらの訂正の組み合わせをす
べて考えると天文学的な数の組み合わせになってしまう
ので、ここでは1回の変換の入力文字列に誤りは1箇所
のみと仮定して訂正を行う。この場合、文字列全体での
訂正パターンの最大数は、ピンインをアルファベット2
6文字で表すとすると、「文字の削除」で(文字長)
個、「文字の追加」で26×(文字長+1)個、「文字
の変更」で25×(文字長)個であり、十分処理可能な
個数に収まる。装置の処理能力に余裕があれば、訂正個
所の最大数を増やすことも可能である。Next, the correction pattern generation unit 106
A correction pattern is generated for the correction range determined by the correction range determination unit 113 (step A16). Assuming that the character string in the correction range is an erroneous input, it is assumed that extra characters are added to the original character string, necessary characters are missing, and different characters are input. On the contrary, the correction pattern is generated by deleting, adding, and changing characters at each character position. However, considering all of these correction combinations results in an astronomical number combination, the correction is performed here assuming that there is only one error in the input character string for one conversion. In this case, the maximum number of correction patterns in the entire character string
If it is represented by 6 characters, "delete character" is (character length)
This is 26 × (character length + 1) for “addition of characters” and 25 × (character length) for “change of characters”, which are numbers that can be sufficiently processed. If the processing capacity of the apparatus has room, the maximum number of correction points can be increased.
【0043】このようにして作成された訂正パターン候
補の一例を図11に示す。FIG. 11 shows an example of a correction pattern candidate created in this way.
【0044】図11(a)、(b)、(c)は入力文字
列“woyehnhao” (“woyehenha
o”の入力誤り)の中の“yehn”の部分を訂正範囲
として場合での訂正パターン候補を示した図である。そ
のうち、図11(a)は“yehn”の各文字を1文字
削除して生成した訂正パターン候補、同図(b)は“y
ehn”の各文字の間に1文字追加して生成した訂正パ
ターン候補、同図(c)は“yehn”の各文字をa〜
zに変更して生成した訂正パターン候補を示している。FIGS. 11 (a), 11 (b) and 11 (c) show an input character string "wyehhenhao"("wyehhenha").
FIG. 11 (a) shows a correction pattern candidate in a case where the part of “yehn” in “o” input error) is used as a correction range. In FIG. 11A, one character of “yehn” is deleted. The corrected pattern candidate generated by the above method is shown in FIG.
The correction pattern candidate generated by adding one character between each character of “ehn”, and FIG.
The correction pattern candidates generated by changing to z are shown.
【0045】ここで、このままでは不要な訂正パターン
が多く存在するため、次に訂正パターン生成部106
は、上記作成した訂正パターン候補について有効ピンイ
ンチェックを行う(ステップA17)。この有効ピンイ
ンチェックでは、訂正個所の部分が有効なピンインであ
るかどうかをピンインテーブル107を使用して判定す
る。図12に示すように、ピンインテーブル107に
は、ピンインで表記した音節として有効な文字列が格納
されている。有効なピンインかどうかのチェックを行う
方法は様々なものが考えられるが、一例としては、文字
列の前方から順に文字列全体がピンインとして有効か
(連続するピンインとなっているか)どうか判定する方
法がある。Here, since there are many unnecessary correction patterns as they are, the correction pattern generation unit 106
Performs an effective pinyin check on the created correction pattern candidate (step A17). In this valid pinyin check, it is determined using the pinyin table 107 whether or not the correction portion is valid pinyin. As shown in FIG. 12, the pinyin table 107 stores a character string effective as a syllable represented by pinyin. There are various methods for checking whether the pinyin is valid. One example is a method of determining whether the entire character string is valid as a pinyin (whether continuous pinyin) in order from the front of the character string. There is.
【0046】このようなチェックの結果、有効なピンイ
ンと判定された訂正パターンの候補を図13に示す。図
13(a)は文字削除による訂正パターン候補、同図
(b)は文字追加による訂正パターン候補、同図(c)
は文字変更による訂正パターン候補であり、それぞれ有
効なピンインとして判定されたものだけが示されてい
る。このようなチェックにより訂正パターンの候補数を
絞り込むことができる。有効なピンインと判定された訂
正パターンは訂正パターンバッファ108に格納される
(ステップA18)。FIG. 13 shows correction pattern candidates determined as valid pinyin as a result of such a check. FIG. 13A shows a correction pattern candidate by deleting characters, FIG. 13B shows a correction pattern candidate by adding characters, and FIG.
Are correction pattern candidates due to character change, and only those determined as valid pinyin are shown. Through such a check, the number of correction pattern candidates can be reduced. The correction pattern determined to be valid pinyin is stored in the correction pattern buffer 108 (step A18).
【0047】訂正パターンは、例えば図14のような形
式で訂正パターンバッファ108に格納するものとす
る。ここでは訂正文字数は1つの訂正候補で1文字とし
ているが、複数個所の訂正を行う場合はその文字数分の
情報を格納する。なお、図中の「No」は作成した訂正
パターン候補との対応を表しているだけであるため、実
際には訂正パターンバッファ108に格納してなくも良
い。また、「文字位置」は訂正範囲で分割された後の文
字列ではなく、元の入力文字列(“woyehnha
o”)での位置を示している。The correction pattern is stored in the correction pattern buffer 108 in a format as shown in FIG. 14, for example. Here, the number of corrected characters is one for one correction candidate, but when correcting at a plurality of locations, information corresponding to the number of characters is stored. It should be noted that “No” in the figure only indicates the correspondence with the created correction pattern candidate, and therefore it is not actually necessary to store the correction pattern in the correction pattern buffer 108. Also, the “character position” is not the character string divided in the correction range, but the original input character string (“wyohehna”).
o ").
【0048】このようにして、入力文字列に対する訂正
パターンが訂正パターンバッファ108に格納された
後、漢字変換部109は変換辞書110を参照してピン
イン漢字変換処理を行う(ステップA19)。この場
合、漢字変換部109は変換文字列バッファ105の入
力文字列について変換処理を行うとともに、訂正パター
ンバッファ108を参照して訂正パターンの候補につい
ても変換処理を行って漢字変換候補を作成する。この処
理により訂正後のピンインについても変換候補が得られ
る。After the correction pattern for the input character string is stored in the correction pattern buffer 108 in this way, the kanji conversion unit 109 performs the Pinyin kanji conversion process with reference to the conversion dictionary 110 (step A19). In this case, the kanji conversion unit 109 performs conversion processing on the input character string in the conversion character string buffer 105, and also performs conversion processing on correction pattern candidates with reference to the correction pattern buffer 108 to create kanji conversion candidates. By this process, conversion candidates are obtained for the corrected pinyin.
【0049】図15に漢字変換候補の一例を示す。FIG. 15 shows an example of kanji conversion candidates.
【0050】“woyehnhao”といった文字列の
入力では、“wo/ye/hn/hao”といったよう
に音節単位で区切られてピンイン漢字変換が行われる
(“/”は音節の区切りを示す)。その際、“wo”,
“ye”,“hao”については訂正なしでの文字列を
用いて変換処理が行われるが、“hn”については訂正
後の文字列(“han”,“hen”…)を用いて変換
処理が行われる。When a character string such as "wyehhnhao" is input, Pinyin kanji conversion is performed in units of syllables such as "wo / ye / hn / hao"("/" indicates a syllable delimiter). At that time, "wo",
For “ye” and “hao”, conversion processing is performed using a character string without correction, but for “hn”, conversion processing is performed using a corrected character string (“han”, “hen”...). Is performed.
【0051】なお、図15では、訂正後の文字列を用い
た変換候補が訂正パターンの作成順に出力されている
が、実際には最も妥当な候補が優先的に出力される。こ
れは、例えば前後の単語の関係を見て、文法的に単語間
の結び付きの強いものを優先するといった方法を用い
る。その具体的なルールは変換辞書110に持たせた
り、別のロジックとして持たせることができる。図15
の例では、“我也很好”が第1候補として得られる。作
成された変換候補はその優先順に変換結果バッファ11
1に格納される。In FIG. 15, the conversion candidates using the corrected character strings are output in the order in which the correction patterns are created. However, in practice, the most appropriate candidates are output with priority. For this, for example, a method is used in which the relationship between words before and after is checked, and those with strong grammatical connection between words are prioritized. The specific rule can be stored in the conversion dictionary 110 or as another logic. FIG.
In the example, “Gayaya” is obtained as the first candidate. The created conversion candidates are stored in the conversion result buffer 11 in the order of priority.
1 is stored.
【0052】以上でピンイン漢字変換処理は終了し、再
びキー入力待ちの状態(ステップA11)に戻る。With the above, the Pinyin Kanji conversion process is completed, and the process returns to the state of waiting for key input (step A11).
【0053】また、上記ステップA14において、キー
入力が変換操作でなかった場合には、次に入力MMI部
104は候補選択操作か否かを判定する(ステップA2
0)。候補選択操作の場合には(ステップA20のYe
s)、候補選択部112により候補選択処理を行う(ス
テップA21)。候補選択部112は変換結果バッファ
111を参照して変換候補の表示を行い、ユーザの選択
操作に従って表示候補の変更や確定を行う。If the key input is not a conversion operation in step A14, the input MMI unit 104 next determines whether or not the input operation is a candidate selection operation (step A2).
0). In the case of a candidate selection operation (Yes in step A20)
s) The candidate selection unit 112 performs a candidate selection process (step A21). The candidate selection unit 112 displays the conversion candidates with reference to the conversion result buffer 111, and changes or fixes the display candidates according to the selection operation of the user.
【0054】変換候補の表示方法としては、変換結果バ
ッファ111に格納されている順に表示するのが一般的
であるが、その他にも訂正種類毎に(訂正なし/削除/
追加/変更)に候補表示を切り替えるなどの選択方法も
考えられる。さらに、変換候補が多すぎる場合(所定数
よりも多い場合)には、上位の候補のみ表示することで
も良い。As a method of displaying the conversion candidates, it is general to display the conversion candidates in the order in which they are stored in the conversion result buffer 111.
A selection method such as switching the candidate display to (addition / change) is also conceivable. Furthermore, when there are too many conversion candidates (when there are more than a predetermined number), only the top candidates may be displayed.
【0055】変換候補の表示方法は他にも様々な方法が
考えられるが、候補の表示順位は候補選択のしやすさに
影響するため、表示順位が上の候補ほど選択しやすいも
のとする。Various other methods of displaying the conversion candidates can be considered. However, since the display order of the candidates affects the ease of candidate selection, it is assumed that the candidate with the higher display order is more easily selected.
【0056】変換候補が確定された場合、候補選択部1
12はその確定結果を入力MMI部104に返す。入力
MMI部104は候補選択状態または確定文字列の情報
を制御部102に返す。制御部102はこの情報に従っ
て候補選択状態の表示や確定文字列の処理を行い、その
処理結果を出力部103へ出力する。When a conversion candidate is determined, the candidate selection unit 1
12 returns the determined result to the input MMI unit 104. The input MMI unit 104 returns information on the candidate selection state or the confirmed character string to the control unit 102. The control unit 102 displays a candidate selection state and processes a confirmed character string according to this information, and outputs the processing result to the output unit 103.
【0057】以上のように第1の実施形態によれば、入
力されたピンイン文字列の一部に誤りがある場合に、そ
の誤入力部分が訂正範囲として決定され、文字の削除、
追加、変更などによりピンインとして有効な訂正文字列
の候補が作成される。したがって、タイプミスのような
誤入力であっても、それを訂正した文字列の候補を用い
たピンイン漢字変換により、変換結果の中にユーザの意
図した変換候補を得ることができる。As described above, according to the first embodiment, when there is an error in a part of the input Pinyin character string, the erroneously input part is determined as a correction range, and the character deletion,
Correction character string candidates effective as pinyin are created by addition, change, and the like. Therefore, even if an erroneous input such as a typographical error occurs, the conversion candidate intended by the user can be obtained in the conversion result by the Pinyin kanji conversion using the character string candidate corrected.
【0058】(第2の実施形態)次に、本発明の第2の
実施形態について説明する。(Second Embodiment) Next, a second embodiment of the present invention will be described.
【0059】第2の実施形態では、発音上の誤りを訂正
した変換候補を優先的に出力することを特徴とする。The second embodiment is characterized in that a conversion candidate in which a pronunciation error has been corrected is preferentially output.
【0060】図4は本発明の第2の実施形態における中
国語入力変換処理装置の機能構成を示すブロック図であ
る。なお、図4において、図2(第1の実施形態)と同
一部分には同一符号を付して、その説明は省略するもの
とする。FIG. 4 is a block diagram showing a functional configuration of a Chinese input conversion processing device according to the second embodiment of the present invention. In FIG. 4, the same portions as those in FIG. 2 (first embodiment) are denoted by the same reference numerals, and description thereof will be omitted.
【0061】本装置の基本的な構成は上記第1の実施形
態と同様であり、異なる点は等価発音優先部114と、
発音テーブル115が設けられていることである。等価
発音優先部114は、発音テーブル115を参照して訂
正文字列の候補の中で訂正前の文字列(元の入力文字
列)と発音が類似するものを検出して、その訂正文字列
の候補を元に得られた変換候補を優先する。発音テーブ
ル115には、発音の類似したピンイン文字列が登録さ
れている。The basic configuration of this device is the same as that of the first embodiment, except for the equivalent sounding priority section 114,
That is, a pronunciation table 115 is provided. The equivalent pronunciation priority unit 114 refers to the pronunciation table 115, detects a candidate of a corrected character string that is similar in pronunciation to the character string before correction (the original input character string), and detects the corrected character string. Priority is given to conversion candidates obtained based on the candidates. In the pronunciation table 115, a Pinyin character string having a similar pronunciation is registered.
【0062】図16に発音テーブル115の一例を示
す。FIG. 16 shows an example of the sound generation table 115.
【0063】発音テーブル115には、“tiao”と
“diao”,“ting”と“ding”,“pa
o”と“lao”,“shang”と“sang”…と
いったように、類似した発音を有する単語の組がピンイ
ン表記で登録されている。これらの単語の組は、例えば
日本語では「しぶや」と「ひびや」のように、発音の間
違いやすいもの同士を組み合わせたものであり、同じ発
音コードが付されている。In the sound generation table 115, "tiao" and "diao", "ting" and "ding", and "pa"
A set of words having similar pronunciations, such as “o” and “lao”, “shang” and “sang”, etc., is registered in Pinyin notation. And those that are prone to mispronunciation, such as "crab" and "crack", and are given the same pronunciation code.
【0064】次に、第2の実施形態の動作について説明
する。Next, the operation of the second embodiment will be described.
【0065】図5は第2の実施形態における変換処理動
作を示すフローチャートである。なお、図5において、
ステップB11〜B19までの処理は、図3のステップ
A11〜A19までの処理と同様である。FIG. 5 is a flowchart showing the conversion processing operation in the second embodiment. In FIG. 5,
The processing of steps B11 to B19 is the same as the processing of steps A11 to A19 in FIG.
【0066】すなわち、入力部101から変換対象とな
る文字列(中国語の読み)がピンイン入力されると、制
御部102は入力MMI部104を通じて、その入力文
字列を変換文字列バッファ105に格納し、次の指示を
待つ(ステップB11〜B13)。「変換」キーの押下
によりピンイン漢字変換が指示されると、制御部102
は変換文字列バッファ105に格納された入力文字列に
対する誤入力訂正処理を実行し、その訂正文字列の候補
(訂正パターン候補)を訂正パターンバッファ108に
格納する(ステップB14〜B18)。そして、漢字変
換部109にて、変換文字列バッファ105と訂正パタ
ーンバッファ108を参照してピンイン漢字変換処理を
行い、その変換結果として得られた変換候補を変換結果
バッファ111に格納する(ステップB19)。That is, when a character string to be converted (Chinese reading) is pin-in input from the input unit 101, the control unit 102 stores the input character string in the conversion character string buffer 105 through the input MMI unit 104. Then, it waits for the next instruction (steps B11 to B13). When Pinyin Kanji conversion is instructed by pressing the “Conversion” key, the control unit 102
Executes an erroneous input correction process on the input character string stored in the converted character string buffer 105, and stores the corrected character string candidate (correction pattern candidate) in the correction pattern buffer 108 (steps B14 to B18). Then, the kanji conversion unit 109 performs the Pinyin kanji conversion process with reference to the conversion character string buffer 105 and the correction pattern buffer 108, and stores the conversion candidates obtained as the conversion result in the conversion result buffer 111 (step B19). ).
【0067】ただし、第2の実施形態では、変換辞書1
10またはピンインテーブル107にて検索できた文字
列の範囲についても訂正処理を行うものとする。例え
ば、“woqutiaoyu”(“woqudiaoy
u”の入力誤り)といった入力の場合、ステップB15
の訂正範囲決定処理では、その入力文字列が“wo/q
u/tiao/yu”と分割される。この場合、分割さ
れた全ての文字列それぞれに対して訂正候補作成を行う
ことになるが、ここでは実際に訂正の必要な“tia
o”の部分(正解ピンインは“diao”)についての
み説明する。図17に“tiao”の部分に対する訂正
パターンの候補をピンイン漢字変換した場合の結果を示
す。However, in the second embodiment, the conversion dictionary 1
Correction processing is also performed on the range of character strings that can be searched in 10 or the Pinyin table 107. For example, "woquotiaoyu"("woquotiaoy
u ”), step B15
In the correction range determination process, the input character string is "wo / q
u / tiao / yu ”. In this case, a correction candidate is created for each of the divided character strings.
Only the part of "o" (correct pinyin is "diao") will be described with reference to Fig. 17. Fig. 17 shows the result when the correction pattern candidate for the part of "tiao" is converted into Pinyin kanji.
【0068】ここで、ピンイン漢字変換後、等価発音優
先部114は発音テーブル115を参照して、そのとき
得られた変換候補の出力優先処理を行う(ステップB2
0)。入力訂正ありの変換候補には、図18に示すよう
に、訂正パターンと入力文字列との対応がわかる情報
(訂正パターンNo)が付加されている。なお、図18
において、「読みの先頭」と「読みの長さ」は入力文字
列のどの範囲に対応した候補かを示している。この例で
は、入力文字列“woqutiaoyu”の4+1文字
目(先頭を0として数える)から4文字分の範囲と対応
していることを示している。Here, after the Pinyin kanji conversion, the equivalent sounding priority unit 114 refers to the sounding table 115 and performs output priority processing on the conversion candidates obtained at that time (step B2).
0). As shown in FIG. 18, information (correction pattern No.) indicating the correspondence between the correction pattern and the input character string is added to the conversion candidate with input correction. Note that FIG.
In the table, “head of reading” and “reading length” indicate which range of the input character string corresponds to the candidate. In this example, it is shown that the range corresponds to the range of 4 characters from the (4 + 1) th character of the input character string “woqutiaoyu” (counting the leading character as 0).
【0069】上記等価発音優先部114は、変換文字列
バッファ105、訂正パターンバッファ108を参照し
て、各変換候補に関する訂正前の文字列(元の入力文字
列)と訂正後の文字列を取得し、これらの文字列で発音
テーブル115を検索する。その結果、訂正前の文字列
と訂正後の文字列の発音コードが一致しているもの、つ
まり、発音の類似するものがあれば、その訂正後の文字
列を元に得られた変換候補の順位を上位に移動する。た
だし、ピンインの訂正をしていない候補よりは上位にし
ないものとする。The equivalent sounding priority section 114 refers to the conversion character string buffer 105 and the correction pattern buffer 108 to obtain a character string before correction (original input character string) and a character string after correction for each conversion candidate. Then, the pronunciation table 115 is searched with these character strings. As a result, if the phonetic code of the uncorrected character string matches the phonetic code of the corrected character string, that is, if there is a phoneme with similar pronunciation, the conversion candidate obtained based on the corrected character string is used. Move up the ranking. However, it shall not be ranked higher than the candidate whose pinyin has not been corrected.
【0070】上記の例では、“diao”は“tia
o”と類似の発音のため、それに対応した変換候補は上
位に移動される。“diao”と“tiao”には発音
テーブル115内で同じ発音コードが付加されている。In the above example, “diao” is replaced by “tia”.
Since the pronunciation is similar to “o”, the corresponding conversion candidate is moved to a higher position, and “diao” and “tiao” have the same pronunciation code added in the pronunciation table 115.
【0071】すべての訂正候補について同様の処理を行
った後、その結果を変換結果バッファ111に格納す
る。その結果、変換結果バッファ111には、図19に
示すように、“tiao”といった誤入力に対し、類似
発音の訂正候補を用いた変換候補が上位に格納されるこ
とになる。この例では、“tiao”といった訂正なし
の変換候補があるため、その変換候補の次に類似発音
“diao”の変換候補が格納される。After performing the same processing for all correction candidates, the result is stored in the conversion result buffer 111. As a result, as shown in FIG. 19, the conversion result buffer 111 stores a conversion candidate using a similar sounding correction candidate in response to an erroneous input such as “tiao”. In this example, since there is a conversion candidate without correction such as “tiao”, a conversion candidate of a similar pronunciation “diao” is stored next to the conversion candidate.
【0072】以降の処理は上記第1の実施形態と同様で
ある。The subsequent processing is the same as in the first embodiment.
【0073】すなわち、ステップB14において、キー
入力が変換操作でなかった場合には、次に入力MMI部
104は候補選択操作か否かを判定する(ステップB2
1)。候補選択操作の場合には(ステップB21のYe
s)、候補選択部112により候補選択処理を行う(ス
テップB22)。候補選択部112は変換結果バッファ
111を参照して変換候補の表示を行い、ユーザの選択
操作に従って表示候補の変更や確定を行う。That is, if the key input is not a conversion operation in step B14, the input MMI unit 104 next determines whether or not the input operation is a candidate selection operation (step B2).
1). In the case of a candidate selection operation (Yes in step B21)
s) The candidate selection unit 112 performs a candidate selection process (step B22). The candidate selection unit 112 displays the conversion candidates with reference to the conversion result buffer 111, and changes or fixes the display candidates according to the selection operation of the user.
【0074】なお、変換候補は変換結果バッファ111
に格納されている順に表示するようにしても良いし、訂
正なしの変換候補と訂正ありの変換候補を切り替えて表
示するようにしても良い。The conversion candidates are stored in the conversion result buffer 111.
May be displayed in the order in which they are stored, or conversion candidates without correction and conversion candidates with correction may be switched and displayed.
【0075】以上のように第2の実施形態によれば、訂
正文字列の候補の中で訂正前の文字列と発音が類似する
ものを検出するようにしたため、発音上の誤りを訂正し
た変換候補を優先的に出力することができる。As described above, according to the second embodiment, among the corrected character string candidates, the one whose pronunciation is similar to the character string before correction is detected, so that the conversion in which the pronunciation error is corrected is performed. Candidates can be output with priority.
【0076】(第3の実施形態)次に、本発明の第3の
実施形態について説明する。(Third Embodiment) Next, a third embodiment of the present invention will be described.
【0077】第3の実施形態では、入力文字列の訂正パ
ターンを学習おくことで、同じ訂正のあった文字列によ
る変換候補の出力を優先することを特徴とする。The third embodiment is characterized in that, by learning a correction pattern of an input character string, priority is given to the output of a conversion candidate based on the same corrected character string.
【0078】図6は本発明の第3の実施形態における中
国語入力変換処理装置の機能構成を示すブロック図であ
る。なお、図6において、図2(第1の実施形態)と同
一部分には同一符号を付して、その説明は省略するもの
とする。FIG. 6 is a block diagram showing a functional configuration of a Chinese input conversion processing device according to the third embodiment of the present invention. In FIG. 6, the same portions as those in FIG. 2 (first embodiment) are denoted by the same reference numerals, and description thereof will be omitted.
【0079】本装置の基本的な構成は上記第1の実施形
態と同様であり、異なる点は訂正学習優先部116、訂
正学習登録部117、訂正学習テーブル118が設けら
れていることである。訂正学習優先部116は、訂正学
習テーブル118を参照して、学習された訂正パターン
と同じ訂正がなされた変換候補を優先する処理を行う。
訂正学習登録部117は、変換時に選択された変換候補
の訂正パターンを訂正学習テーブル118に登録する処
理を行う。訂正学習テーブル118には、訂正学習登録
部117によって登録された訂正パターンが格納されて
いる。The basic configuration of this device is the same as that of the first embodiment, except that a correction learning priority unit 116, a correction learning registration unit 117, and a correction learning table 118 are provided. The correction learning priority unit 116 performs a process of referring to the correction learning table 118 to prioritize a conversion candidate having the same correction as the learned correction pattern.
The correction learning registration unit 117 performs a process of registering the correction pattern of the conversion candidate selected at the time of conversion in the correction learning table 118. The correction learning table 118 stores the correction patterns registered by the correction learning registration unit 117.
【0080】次に、第3の実施形態の動作について説明
する。Next, the operation of the third embodiment will be described.
【0081】図7は第3の実施形態における変換処理動
作を示すフローチャートである。なお、図7において、
ステップC11〜C19までの処理は、図3のステップ
A11〜A19までの処理と同様である。FIG. 7 is a flowchart showing the conversion processing operation in the third embodiment. In FIG. 7,
The processing in steps C11 to C19 is the same as the processing in steps A11 to A19 in FIG.
【0082】すなわち、入力部101から変換対象とな
る文字列(中国語の読み)がピンイン入力されると、制
御部102は入力MMI部104を通じて、その入力文
字列を変換文字列バッファ105に格納し、次の指示を
待つ(ステップC11〜C13)。「変換」キーの押下
によりピンイン漢字変換が指示されると、制御部102
は変換文字列バッファ105に格納された入力文字列に
対する誤入力訂正処理を実行し、その訂正文字列の候補
を訂正パターンバッファ108に格納する(ステップC
14〜C18)。そして、漢字変換部109にて、変換
文字列バッファ105と訂正パターンバッファ108を
参照してピンイン漢字変換処理を行い、その変換結果と
して得られた候補を変換結果バッファ111に格納する
(ステップC19)。That is, when a character string to be converted (Chinese reading) is input from the input unit 101, the control unit 102 stores the input character string in the conversion character string buffer 105 through the input MMI unit 104. Then, it waits for the next instruction (steps C11 to C13). When Pinyin Kanji conversion is instructed by pressing the “Conversion” key, the control unit 102
Performs an erroneous input correction process on the input character string stored in the converted character string buffer 105, and stores the corrected character string candidate in the correction pattern buffer 108 (step C).
14-C18). Then, the kanji conversion unit 109 performs the Pinyin kanji conversion process with reference to the conversion character string buffer 105 and the correction pattern buffer 108, and stores the conversion result candidate in the conversion result buffer 111 (step C19). .
【0083】ここで、第3の実施形態では、ピンイン漢
字変換後、訂正学習優先部116にて訂正学習優先処理
が行なわれる(ステップC20)。ここでは訂正学習さ
れた変換候補を優先出力するが、初めは訂正学習テーブ
ル118に訂正パターンが登録されていないので、変換
結果として得られた候補をそのまま変換結果バッファ1
11へ出力する。Here, in the third embodiment, after the Pinyin kanji conversion, the correction learning priority section 116 performs correction learning priority processing (step C20). Here, the conversion candidate that has been subjected to the correction learning is preferentially output, but since the correction pattern is not registered in the correction learning table 118 at first, the candidate obtained as the conversion result is directly used in the conversion result buffer 1.
Output to 11
【0084】その後、候補選択操作があった場合に(ス
テップC21のYes)、候補選択部112により候補
選択処理を行う(ステップC22)。候補選択部112
は変換結果バッファ111を参照して変換候補の表示を
行い、ユーザの選択操作に従って表示候補の変更や確定
を行う。変換候補が確定された場合、候補選択部112
はその確定結果を入力MMI部104に返す。入力MM
I部104は候補選択状態または確定文字列の情報を制
御部102に返す。制御部102はこの情報に従って候
補選択状態の表示や確定文字列の処理を行い、その処理
結果を出力部103へ出力する。Thereafter, when there is a candidate selecting operation (Yes in step C21), the candidate selecting unit 112 performs a candidate selecting process (step C22). Candidate selection unit 112
Displays the conversion candidates with reference to the conversion result buffer 111, and changes or fixes the display candidates according to the user's selection operation. When the conversion candidate is determined, the candidate selection unit 112
Returns the determined result to the input MMI unit 104. Input MM
The I unit 104 returns information on the candidate selection state or the confirmed character string to the control unit 102. The control unit 102 displays a candidate selection state and processes a confirmed character string according to this information, and outputs the processing result to the output unit 103.
【0085】ここで、変換候補が選択(確定)される
と、そのとき選択された変換候補の情報が訂正学習登録
部117に送られて、訂正学習登録処理が行われる(ス
テップC23)。選択された変換候補が入力訂正ありの
候補であった場合、図18のように変換候補に対応する
訂正パターンを作成し、これを学習用として訂正学習テ
ーブル118に格納する。Here, when a conversion candidate is selected (confirmed), information on the conversion candidate selected at that time is sent to the correction learning registration unit 117, and correction learning registration processing is performed (step C23). If the selected conversion candidate is a candidate with input correction, a correction pattern corresponding to the conversion candidate is created as shown in FIG. 18 and stored in the correction learning table 118 for learning.
【0086】図20に訂正学習テーブル118の一例を
示す。FIG. 20 shows an example of the correction learning table 118.
【0087】訂正学習テーブル118では、訂正前の文
字と訂正後の文字とが対応付けられている。図20の例
では、訂正した1文字のみを格納しているが、訂正した
文字の前後の文字を含めて格納するようにしても良い。
その場合、学習優先処理で、それらの文字も含めて比較
するため、学習の効果が直前の文字や直後の文字によっ
て区別されるようになる。また、訂正学習テーブル11
8では、最後に登録された順番に訂正パターンが並んで
いるものとする。In the correction learning table 118, characters before correction and characters after correction are associated with each other. In the example of FIG. 20, only one corrected character is stored, but it may be stored including characters before and after the corrected character.
In such a case, the learning priority processing compares the characters with each other, so that the learning effect is distinguished by the immediately preceding character and the immediately following character. In addition, the correction learning table 11
8, it is assumed that the correction patterns are arranged in the order in which they were registered last.
【0088】このようにして、変換時に選択された変換
候補に対応した訂正パターンが訂正学習テーブル118
に登録された後、再びピンイン入力があり、ピンイン変
換処理が行なわれると(ステップC19)、訂正学習優
先部116は各変換候補に対応した訂正パターンと訂正
学習テーブル118に格納されている訂正パターンとを
比較し、同じものがあった場合に、その変換候補の順位
を上位に移動する(ステップC20)。すべての訂正さ
れた候補について上記同様の処理を行った後、その結果
を変換結果バッファ111に送る。候補選択部112で
は、変換結果バッファ111に格納された順に従って候
補の表示/選択を行う。As described above, the correction pattern corresponding to the conversion candidate selected at the time of conversion is stored in the correction learning table 118.
After the registration, the pinyin input is performed again, and the pinyin conversion process is performed (step C19). When the correction learning priority section 116 corrects the correction pattern corresponding to each conversion candidate and the correction pattern stored in the correction learning table 118, Are compared, and when there is the same one, the order of the conversion candidate is moved to a higher rank (step C20). After performing the same processing as above for all the corrected candidates, the result is sent to the conversion result buffer 111. The candidate selection unit 112 performs display / selection of candidates according to the order stored in the conversion result buffer 111.
【0089】以上のように第3の実施形態によれば、変
換時に選択された変換候補に対応した入力文字列の訂正
パターンを学習しておき、訂正文字列の候補の中で過去
に同じ入力訂正が行われたものを検出するようにしたた
め、ユーザの意図している変換候補を優先的に出力する
ことができる。As described above, according to the third embodiment, the correction pattern of the input character string corresponding to the conversion candidate selected at the time of conversion is learned and the same input character Since the corrected one is detected, the conversion candidate intended by the user can be preferentially output.
【0090】(第4の実施形態)次に、本発明の第4の
実施形態について説明する。(Fourth Embodiment) Next, a fourth embodiment of the present invention will be described.
【0091】第4の実施形態では、キーボード上の各キ
ーの配置を考慮して、訂正された文字列による変換候補
の優先順位を決定することを特徴とする。The fourth embodiment is characterized in that the priority of the conversion candidates based on the corrected character string is determined in consideration of the arrangement of each key on the keyboard.
【0092】図8は本発明の第4の実施形態における中
国語入力変換処理装置の機能構成を示すブロック図であ
る。なお、図8において、図2(第1の実施形態)と同
一部分には同一符号を付して、その説明は省略するもの
とする。FIG. 8 is a block diagram showing a functional configuration of a Chinese input conversion processing device according to the fourth embodiment of the present invention. In FIG. 8, the same portions as those in FIG. 2 (first embodiment) are denoted by the same reference numerals, and description thereof will be omitted.
【0093】本装置の基本的な構成は上記第1の実施形
態と同様であり、異なる点はタイプミス訂正優先部11
9、入力キー配置テーブル120が設けられていること
である。タイプミス訂正優先部119は、入力キー配置
テーブル120を参照して入力キーに隣接するキーを判
断し、そのキーに対応した訂正パターンを優先する処理
を行う。入力キー配置テーブル120は、キーボード上
の各キーに対して隣接しているキーの情報を格納したテ
ーブルである。The basic configuration of the present apparatus is the same as that of the first embodiment, and the difference is that the typo correction priority unit 11
9. An input key arrangement table 120 is provided. The typo correction priority unit 119 determines a key adjacent to the input key with reference to the input key arrangement table 120, and performs a process of giving priority to a correction pattern corresponding to the key. The input key arrangement table 120 is a table storing information on keys adjacent to each key on the keyboard.
【0094】入力部101がキーボードからなり、その
キーボード上の各キーが所定の規格に従って図21のよ
うに配置されている場合において、入力キー配置テーブ
ル120には、図22のように各キーに対する隣接キー
の情報が格納される。例えば、「Q」キーに対しては、
隣接キーとして「W」と「A」といった情報が格納され
る。また、「A」キーに対しては、隣接キーとして
「S」,「Z」,「Q」,「W」といった情報が格納さ
れ、「Z」キーに対しては、隣接キーとして「X」,
「A」,「S」といった情報が格納される。同様にし
て、全てのキーに対する隣接キーの情報が入力キー配置
テーブル120に格納されている。When the input unit 101 is composed of a keyboard and the keys on the keyboard are arranged as shown in FIG. 21 in accordance with a predetermined standard, the input key arrangement table 120 stores information on each key as shown in FIG. Information on the adjacent key is stored. For example, for the "Q" key,
Information such as “W” and “A” is stored as adjacent keys. For the “A” key, information such as “S”, “Z”, “Q”, and “W” is stored as adjacent keys, and for the “Z” key, “X” is stored as an adjacent key. ,
Information such as “A” and “S” is stored. Similarly, information on adjacent keys for all keys is stored in the input key arrangement table 120.
【0095】次に、第4の実施形態の動作について説明
する。Next, the operation of the fourth embodiment will be described.
【0096】図9は第4の実施形態における変換処理動
作を示すフローチャートである。なお、図9において、
ステップD11〜D19までの処理は、図3のステップ
A11〜A19までの処理と同様である。FIG. 9 is a flowchart showing the conversion processing operation in the fourth embodiment. In FIG. 9,
The processing of steps D11 to D19 is the same as the processing of steps A11 to A19 in FIG.
【0097】すなわち、入力部101から変換対象とな
る文字列(中国語の読み)がピンイン入力されると、制
御部102は入力MMI部104を通じて、その入力文
字列を変換文字列バッファ105に格納し、次の指示を
待つ(ステップD11〜D13)。「変換」キーの押下
によりピンイン漢字変換が指示されると、制御部102
は変換文字列バッファ105に格納された入力文字列に
対する誤入力訂正処理を実行し、その訂正文字列の候補
を訂正パターンバッファ108に格納する(ステップD
14〜D18)。そして、漢字変換部109にて、変換
文字列バッファ105と訂正パターンバッファ108を
参照してピンイン漢字変換処理を行い、その変換結果と
して得られた候補を変換結果バッファ111に格納する
(ステップD19)。That is, when a character string (Chinese reading) to be converted is input from the input unit 101, the control unit 102 stores the input character string in the conversion character string buffer 105 through the input MMI unit 104. Then, it waits for the next instruction (steps D11 to D13). When Pinyin Kanji conversion is instructed by pressing the “Conversion” key, the control unit 102
Performs an erroneous input correction process on the input character string stored in the converted character string buffer 105, and stores the corrected character string candidate in the correction pattern buffer 108 (step D).
14-D18). Then, the kanji conversion unit 109 performs the Pinyin kanji conversion process with reference to the conversion character string buffer 105 and the correction pattern buffer 108, and stores the conversion result candidate in the conversion result buffer 111 (step D19). .
【0098】ここで、第4の実施形態では、ピンイン漢
字変換後、変換結果として得られた候補はタイプミス訂
正優先部119に送られる。この時、入力訂正ありの変
換候補には、図18のように訂正パターンとの対応情報
が格納されているものとする。タイプミス訂正優先部1
19は、以下のようなタイプミス訂正優先処理を行う
(ステップD20)。Here, in the fourth embodiment, after the Pinyin Kanji conversion, the candidates obtained as the conversion result are sent to the typo correction priority unit 119. At this time, it is assumed that the conversion candidate with the input correction stores the correspondence information with the correction pattern as shown in FIG. Typo correction priority section 1
19 performs the following type error correction priority processing (step D20).
【0099】まず、各変換候補について、訂正種類が文
字の「変更」である訂正パターンについて、訂正後の文
字で入力キー配置テーブル120を検索する。図21の
ようなキー配置の場合、入力キー配置テーブル120に
は図22のような隣接キーの情報が格納されている。First, for each conversion candidate, for the correction pattern whose correction type is “change” of the character, the input key arrangement table 120 is searched with the corrected character. In the case of the key arrangement as shown in FIG. 21, the input key arrangement table 120 stores information on adjacent keys as shown in FIG.
【0100】訂正後の文字で入力キー配置テーブル12
0を検索すると、その隣接キーが得られる。例えば、訂
正後の文字が“s”であれば、「S」キーに対する隣接
キー「D」,「X」,「Z」,「A」,「W」,「E」
が得られる。これらの隣接キーと訂正前の文字(訂正パ
ターンに格納されている「文字位置」に基づいて変換文
字列バッファ105から得られる)とを比較すること
で、訂正後の文字と訂正前の文字とで、両者のキーが近
接しているか否かを判定する。なお、訂正前の文字で入
力キー配置テーブル120を検索し、訂正後の文字と比
較することでも良い。近接していると判定された場合
は、当該変換候補の順位を上位に移動する。すべての訂
正候補について上記同様の処理を行い、その結果を変換
結果バッファ111に送る。Input key arrangement table 12 with corrected characters
Searching for 0 gives the adjacent key. For example, if the corrected character is “s”, adjacent keys “D”, “X”, “Z”, “A”, “W”, “E” for the “S” key
Is obtained. By comparing these adjacent keys with the character before correction (obtained from the converted character string buffer 105 based on the “character position” stored in the correction pattern), the character after correction and the character before correction can be compared. It is determined whether or not both keys are close to each other. Note that the input key arrangement table 120 may be searched with the character before correction, and may be compared with the character after correction. If it is determined that the conversion candidates are close to each other, the order of the conversion candidates is moved to a higher rank. The same processing as described above is performed for all correction candidates, and the result is sent to the conversion result buffer 111.
【0101】以降の処理は上記第1の実施形態と同様で
ある。The subsequent processing is the same as in the first embodiment.
【0102】すなわち、ステップD14において、キー
入力が変換操作でなかった場合には、次に入力MMI部
104は候補選択操作か否かを判定する(ステップD2
1)。候補選択操作の場合には(ステップD21のYe
s)、候補選択部112により候補選択処理を行う(ス
テップD22)。候補選択部112は変換結果バッファ
111を参照して変換候補の表示を行い、ユーザの選択
操作に従って表示候補の変更や確定を行う。That is, if the key input is not a conversion operation in step D14, input MMI section 104 next determines whether or not the input operation is a candidate selection operation (step D2).
1). In the case of a candidate selection operation (Ye in step D21)
s) The candidate selection unit 112 performs a candidate selection process (step D22). The candidate selection unit 112 displays the conversion candidates with reference to the conversion result buffer 111, and changes or fixes the display candidates according to the selection operation of the user.
【0103】以上のように第4の実施形態によれば、訂
正文字列の候補の中で訂正前の文字列と近接するキーで
入力されたものを検出するようにしたため、キーボード
上の各キーの配置から誤りやすいタイプミスを訂正した
変換候補を優先的に出力することができる。As described above, according to the fourth embodiment, among the candidates for the corrected character string, those input with the keys adjacent to the character string before correction are detected, so that each key on the keyboard is detected. A conversion candidate in which an erroneous typo has been corrected can be preferentially output from the arrangement of.
【0104】なお、上述した各実施形態において記載し
た手法は、コンピュータに実行させることのできるプロ
グラムとして、例えば磁気ディスク(フロッピーディス
ク、ハードディスク等)、光ディスク(CD−ROM、
DVD等)、半導体メモリなどの記録媒体に書き込んで
各種装置に適用したり、通信媒体により伝送して各種装
置に適用することも可能である。本装置を実現するコン
ピュータは、記録媒体に記録されたプログラムを読み込
み、このプログラムによって動作が制御されることによ
り、上述した処理を実行する。The methods described in each of the above-described embodiments include, for example, a magnetic disk (floppy disk, hard disk, etc.), an optical disk (CD-ROM,
It is also possible to write the data on a recording medium such as a DVD or a semiconductor memory and apply it to various devices, or to transmit it via a communication medium and apply it to various devices. A computer that realizes the present apparatus reads the program recorded on the recording medium, and executes the above-described processing by controlling the operation of the program.
【0105】[0105]
【発明の効果】以上詳記したように本発明によれば、入
力文字列の中の誤入力箇所を訂正し、その訂正後の文字
列の候補を用いてピンイン漢字変換するようにしたた
め、タイプミスのような誤入力であっても訂正すること
ができ、再度入力し直すことなく、ユーザの意図した変
換候補を得ることができる。したがって、ピンイン入力
による中国語文書の作成において、ユーザの入力操作の
負担を軽減して効率的な文書作成を実現することができ
る。As described above in detail, according to the present invention, an erroneous input portion in an input character string is corrected, and Pinyin kanji conversion is performed using the corrected character string candidate. Even erroneous inputs such as mistakes can be corrected, and conversion candidates intended by the user can be obtained without re-inputting. Therefore, in creating a Chinese document by pinyin input, it is possible to reduce the burden of the user's input operation and realize efficient document creation.
【図1】本発明の中国語入力変換処理装置のシステム構
成を示すブロック図。FIG. 1 is a block diagram showing a system configuration of a Chinese input conversion processing device of the present invention.
【図2】第1の実施形態における中国語入力変換処理装
置の機能構成を示すブロック図。FIG. 2 is a block diagram illustrating a functional configuration of a Chinese input conversion processing device according to the first embodiment.
【図3】第1の実施形態における変換処理動作を示すフ
ローチャート。FIG. 3 is a flowchart illustrating a conversion processing operation according to the first embodiment.
【図4】本発明の第2の実施形態における中国語入力変
換処理装置の機能構成を示すブロック図。FIG. 4 is a block diagram showing a functional configuration of a Chinese input conversion processing device according to a second embodiment of the present invention.
【図5】第2の実施形態における変換処理動作を示すフ
ローチャート。FIG. 5 is a flowchart illustrating a conversion processing operation according to the second embodiment.
【図6】本発明の第3の実施形態における中国語入力変
換処理装置の機能構成を示すブロック図。FIG. 6 is a block diagram showing a functional configuration of a Chinese input conversion processing device according to a third embodiment of the present invention.
【図7】第3の実施形態における変換処理動作を示すフ
ローチャート。FIG. 7 is a flowchart illustrating a conversion processing operation according to the third embodiment.
【図8】本発明の第4の実施形態における中国語入力変
換処理装置の機能構成を示すブロック図。FIG. 8 is a block diagram showing a functional configuration of a Chinese input conversion processing device according to a fourth embodiment of the present invention.
【図9】第4の実施形態における変換処理動作を示すフ
ローチャート。FIG. 9 is a flowchart illustrating a conversion processing operation according to the fourth embodiment.
【図10】入力文字列の訂正範囲を決定する際に用いら
れる訂正範囲チェック表の一例を示す図。FIG. 10 is a diagram showing an example of a correction range check table used when determining a correction range of an input character string.
【図11】訂正パターン候補の一例を示す図。FIG. 11 is a diagram showing an example of a correction pattern candidate.
【図12】ピンインテーブルの構成を示す図。FIG. 12 is a diagram showing a configuration of a pinyin table.
【図13】有効ピンインチェック後の訂正パターン候補
の一例を示す図。FIG. 13 is a view showing an example of a correction pattern candidate after valid pinyin check;
【図14】訂正パターンの格納例を示す図。FIG. 14 is a diagram showing an example of storing a correction pattern.
【図15】誤入力訂正によって得られた漢字変換候補の
一例(その1)を示す図。FIG. 15 is a diagram showing an example (part 1) of kanji conversion candidates obtained by erroneous input correction.
【図16】発音テーブルの構成を示す図。FIG. 16 is a diagram showing a configuration of a sounding table.
【図17】誤入力訂正によって得られた漢字変換候補の
一例(その2)を示す図。FIG. 17 is a diagram showing an example (part 2) of kanji conversion candidates obtained by erroneous input correction.
【図18】漢字変換候補と訂正パターンとの関係を示す
図。FIG. 18 is a diagram showing a relationship between kanji conversion candidates and correction patterns.
【図19】誤入力訂正によって得られた漢字変換候補の
一例(その3)を示す図。FIG. 19 is a view showing an example (part 3) of kanji conversion candidates obtained by erroneous input correction.
【図20】訂正学習テーブルの構成を示す図。FIG. 20 is a diagram showing a configuration of a correction learning table.
【図21】キーボード上の各キーの配置例を示す図。FIG. 21 is a diagram showing an example of the arrangement of keys on a keyboard.
【図22】キー配置テーブルの構成を示す図。FIG. 22 is a diagram showing a configuration of a key arrangement table.
101…入力部 102…制御部 103…出力部 104…入力MMI部 105…変換文字列バッファ 106…訂正パターン生成部 107…ピンインテーブル 108…訂正パターンバッファ 109…漢字変換部 110…変換辞書 111…変換結果バッファ 112…候補選択部 113…訂正範囲決定部 114…等価発音優先部 115…発音テーブル 116…訂正学習優先部 117…訂正学習登録部 118…訂正学習テーブル 119…タイプミス訂正優先部 120…入力キー配置テーブル 101 input unit 102 control unit 103 output unit 104 input MMI unit 105 conversion character string buffer 106 correction pattern generation unit 107 pinyin table 108 correction pattern buffer 109 kanji conversion unit 110 conversion dictionary 111 conversion Result buffer 112 ... Candidate selection unit 113 ... Correction range determination unit 114 ... Equivalent pronunciation priority unit 115 ... Speech table 116 ... Correction learning priority unit 117 ... Correction learning registration unit 118 ... Correction learning table 119 ... Type error correction priority unit 120 ... Input Key arrangement table
───────────────────────────────────────────────────── フロントページの続き (72)発明者 清水 吟子 東京都青梅市新町3丁目3番地の5 東芝 ソフトウェアエンジニアリング株式会社内 (72)発明者 後藤 浩文 東京都青梅市新町3丁目3番地の5 東芝 ソフトウェアエンジニアリング株式会社内 Fターム(参考) 5B009 KA05 MA03 VB12 ──────────────────────────────────────────────────続 き Continuing from the front page (72) Inventor Ginko Shimizu 3-3-3 Shinmachi, Ome-shi, Tokyo Inside of Toshiba Software Engineering Co., Ltd. (72) Inventor Hirofumi Goto 5-3-3-3 Shinmachi, Ome-shi, Tokyo Toshiba Software Engineering Co., Ltd. F-term (reference) 5B009 KA05 MA03 VB12
Claims (6)
し、その入力されたピンインを中国語漢字に変換する中
国語入力変換処理装置であって、 変換対象となる文字列をピンイン入力する入力手段と、 この入力手段によって入力された文字列の中で訂正が必
要な範囲を決定し、その範囲内の文字列を訂正してピン
インとして有効な訂正文字列の候補を作成する入力訂正
手段と、 この入力訂正手段によって得られた訂正文字列の候補を
中国語漢字に変換する変換手段と、 この変換手段によって得られた変換候補を所定の順で出
力する出力手段とを具備したことを特徴とする中国語入
力変換処理装置。1. A Chinese input conversion processing device for inputting Pinyin, which is a Chinese reading notation, and converting the input Pinyin into Chinese / Kanji characters, wherein the character string to be converted is input by Pinyin. Means for determining a range that needs to be corrected in the character string input by the input means, and correcting the character string in the range to create a valid correction character string candidate as Pinyin; and A conversion means for converting a candidate for a corrected character string obtained by the input correction means into Chinese characters, and an output means for outputting the conversion candidates obtained by the conversion means in a predetermined order. Chinese input conversion processor.
文字列の候補の中で訂正前の文字列と発音が類似するも
のを検出する類似発音検出手段を備え、 上記出力手段は、この類似発音検出手段によって検出さ
れた訂正文字列から得られた変換候補を優先的に出力す
ることを特徴とする請求項1記載の中国語入力変換処理
装置。2. The apparatus according to claim 1, further comprising: a similar pronunciation detecting means for detecting, from among the corrected character string candidates obtained by the input correcting means, a pronunciation similar to the character string before correction. 2. The Chinese input conversion processing device according to claim 1, wherein conversion candidates obtained from the corrected character string detected by the detection means are output with priority.
文字列の候補の中で過去に同じ入力訂正が行われたもの
を検出する訂正学習検出手段を備え、 上記出力手段は、この訂正学習検出手段によって検出さ
れた訂正文字列から得られた変換候補を優先的に出力す
ることを特徴とする請求項1記載の中国語入力変換処理
装置。3. An apparatus according to claim 2, further comprising: a correction learning detecting means for detecting a correction character string candidate obtained by said input correcting means, wherein the same input correction has been performed in the past. 2. The Chinese input conversion processing device according to claim 1, wherein conversion candidates obtained from the corrected character string detected by the means are output with priority.
文字列の候補の中で訂正前の文字列に対応したキーと近
接するキーで入力されたものを検出するタイプミス検出
手段を備え、 上記出力手段は、このタイプミス検出手段によって検出
された訂正文字列から得られた変換候補を優先的に出力
することを特徴とする請求項1記載の中国語入力変換処
理装置。4. A typo detecting means for detecting, from among candidates of a corrected character string obtained by said input correcting means, a character string input by a key close to a key corresponding to a character string before correction, 2. The Chinese input conversion processing device according to claim 1, wherein the output means outputs the conversion candidates obtained from the corrected character string detected by the typo detection means with priority.
し、その入力されたピンインを中国語漢字に変換する中
国語入力変換処理方法であって、 変換対象となる文字列がピンイン入力された際に、その
入力文字列の中で訂正が必要な範囲を決定し、 その範囲内の文字列を訂正してピンインとして有効な訂
正文字列の候補を作成し、 これらの訂正文字列の候補を中国語漢字に変換処理し、 その変換処理によって得られた変換候補を所定の順で出
力することを特徴とする中国語入力変換処理方法。5. A Chinese input conversion method for inputting Pinyin, which is a Chinese reading notation, and converting the input Pinyin into Chinese kanji, wherein a character string to be converted is input in Pinyin. At that time, determine the range of the input character string that needs to be corrected, correct the character string within that range, create a candidate for a corrected character string that is valid as Pinyin, and select these corrected character string candidates. A Chinese input conversion processing method, which performs conversion processing into Chinese kanji and outputs conversion candidates obtained by the conversion processing in a predetermined order.
し、その入力されたピンインを中国語漢字に変換する機
能を備えたコンピュータに、 変換対象となる文字列がピンイン入力された際に、その
入力文字列の中で訂正が必要な範囲を決定する処理と、 その範囲内の文字列を訂正してピンインとして有効な訂
正文字列の候補を作成する処理と、 これらの訂正文字列の候補を中国語漢字に変換する処理
と、 その変換処理によって得られた変換候補を所定の順で出
力する処理とを実行させるプログラムを記録したコンピ
ュータ読取り可能な記録媒体。6. When a character string to be converted is input to a computer having a function of inputting Pinyin, which is a Chinese reading notation, and converting the input Pinyin into Chinese kanji, A process of determining a range in the input character string that requires correction, a process of correcting a character string within the range to create a candidate for a corrected character string that is valid as Pinyin, and a candidate of these corrected character strings. A computer-readable recording medium which stores a program for executing a process of converting a character into a Chinese character and a process of outputting a conversion candidate obtained by the conversion process in a predetermined order.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP35945999A JP2001175645A (en) | 1999-12-17 | 1999-12-17 | Chinese input conversion processing device, Chinese input conversion processing method, and recording medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP35945999A JP2001175645A (en) | 1999-12-17 | 1999-12-17 | Chinese input conversion processing device, Chinese input conversion processing method, and recording medium |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2001175645A true JP2001175645A (en) | 2001-06-29 |
Family
ID=18464613
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP35945999A Pending JP2001175645A (en) | 1999-12-17 | 1999-12-17 | Chinese input conversion processing device, Chinese input conversion processing method, and recording medium |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2001175645A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8976118B2 (en) | 2012-01-20 | 2015-03-10 | International Business Machines Corporation | Method for character correction |
-
1999
- 1999-12-17 JP JP35945999A patent/JP2001175645A/en active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8976118B2 (en) | 2012-01-20 | 2015-03-10 | International Business Machines Corporation | Method for character correction |
| US9218066B2 (en) | 2012-01-20 | 2015-12-22 | International Business Machines Corporation | Method for character correction |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0680035B1 (en) | Erroneous input processing method and apparatus in an information processing system using composite input | |
| US5835924A (en) | Language processing apparatus and method | |
| JPH03224055A (en) | Method and device for input of translation text | |
| JP2002014954A (en) | Chinese language inputting and converting processing device and method, and recording medium | |
| JP2002117026A (en) | Method and system for filtration and selection from candidate list generated by probabilistic input method | |
| JP3476007B2 (en) | Recognition word registration method, speech recognition method, speech recognition device, storage medium storing software product for registration of recognition word, storage medium storing software product for speech recognition | |
| JP3795692B2 (en) | Character processing apparatus and method | |
| US7533014B2 (en) | Method and system for concurrent use of two or more closely coupled communication recognition modalities | |
| JPH08314910A (en) | Different kind of code character string transcribing device and electronic dictionary | |
| JP2001175645A (en) | Chinese input conversion processing device, Chinese input conversion processing method, and recording medium | |
| JP2001014304A (en) | Document creation apparatus, conversion processing method, and recording medium storing conversion processing program | |
| JP3387421B2 (en) | Word input support device and word input support method | |
| JPH1196141A (en) | Chinese input conversion processing device, Chinese input conversion processing method, recording medium recording Chinese input conversion processing program | |
| JP2001109740A (en) | Chinese document creation device and Chinese document creation method | |
| JP2001343995A (en) | Voice input processing device, voice input processing method, and recording medium storing voice input processing program | |
| JP2025110342A (en) | Input support program, input support method and input support device | |
| JP3566873B2 (en) | Kana-kanji conversion apparatus and method, and storage medium storing kana-kanji conversion program | |
| JPH11175511A (en) | Chinese input conversion processor and method therefor and storage medium storing chinese input conversion processing program | |
| JP2001101176A (en) | Document creation device, document creation method, and recording medium on which document creation program is recorded | |
| JP3061855B2 (en) | Kana-kanji conversion device and kana-kanji conversion method | |
| JP2003178263A (en) | Character recognition device and recording medium | |
| JPH06325202A (en) | String correction device | |
| JPS6029823A (en) | Adaptive symbol string conversion method | |
| JPH10301597A (en) | Voice recognition device | |
| JPH06119314A (en) | Document creation device |