JPH07192001A - Natural language processor - Google Patents
Natural language processorInfo
- Publication number
- JPH07192001A JPH07192001A JP5348542A JP34854293A JPH07192001A JP H07192001 A JPH07192001 A JP H07192001A JP 5348542 A JP5348542 A JP 5348542A JP 34854293 A JP34854293 A JP 34854293A JP H07192001 A JPH07192001 A JP H07192001A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- natural language
- data
- language processing
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Computer And Data Communications (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、複数の端末がネットワ
ーク接続され、それ等において効率良く自然言語処理を
行うことのできる自然言語処理装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a natural language processing apparatus in which a plurality of terminals are connected to a network and natural language processing can be efficiently performed in these terminals.
【0002】[0002]
【従来の技術】周知のように、コンピュータネットワー
クの発達により、同一ネットワークに多種の計算機が多
数接続されるようになってきている。また、通信速度も
向上し、計算機間での大量データの送受信も容易に行え
るようになってきている。2. Description of the Related Art As is well known, with the development of computer networks, many computers of various types are connected to the same network. In addition, the communication speed has been improved, and it has become possible to easily send and receive large amounts of data between computers.
【0003】一方、ネットワークに接続される計算機の
全てが能力の高いものとは限らないので、能力の高い計
算機と能力の低い計算機とを接続し、ジョブの分担を行
うサーバ・クライアントモデルも普及してきている。こ
のモデルでは、たとえば機械翻訳、音声認識、要約、か
な漢字変換、文書校正支援などの自然言語処理を例にと
ると、計算機パワーを必要とするジョブを能力の高いサ
ーバマシンが担当し、それにネットワークを介して接続
された能力の低いクライアントマシンから処理要求を行
うことによって自然言語処理を行うようにしている。On the other hand, not all computers connected to the network have high capabilities, so that a server / client model in which a high-performance computer and a low-performance computer are connected and jobs are shared becomes popular. ing. In this model, for example, when using natural language processing such as machine translation, speech recognition, summarization, kana-kanji conversion, and document proofreading support, a highly capable server machine takes charge of jobs that require computer power, and network Natural language processing is performed by issuing a processing request from a client machine with low capability connected via the above.
【0004】自然言語処理としての機械翻訳をサーバ・
クライアントモデルで実現した例としては、特開平4−
127748号公報に開示されている「ネットワーク間
交信処理装置」や特開平5−128144号公報に開示
されている「機械翻訳ネットワークシステム」などを挙
げることができる。A server for machine translation as natural language processing
As an example realized with the client model, Japanese Patent Laid-Open No. 4-
The "inter-network communication processing device" disclosed in Japanese Patent No. 127748 and the "machine translation network system" disclosed in Japanese Patent Laid-Open No. 5-128144 can be mentioned.
【0005】しかし、これらのシステムでは、決定性デ
ータの転送のみを行えるようにし、処理要求を行ったク
ライアント端末に対して翻訳結果を一意に決定してから
転送するようにしている。このため、翻訳要求を行った
クライアント端末では、たとえば翻訳文の他の翻訳結果
候補などを得ることができない問題があった。However, in these systems, only the deterministic data can be transferred, and the translation result is uniquely determined and transferred to the client terminal which issued the processing request. Therefore, there is a problem in that the client terminal that makes the translation request cannot obtain other translation result candidates of the translated sentence, for example.
【0006】また、自然言語処理としてのかな漢字変換
をサーバ・クライアントモデルで実現した例として、Wn
n (Jserver )がある(KABA著「Wnn+GMW 入門」岩波書
店、1990)。Wnn においても基本的には決定性データの
転送のみを行い、サーバがクライアントの状況を把握
し、クライアントからの他のデータ(かな漢字変換の次
候補)要求があったとき、これに応じて他のデータを転
送するようにしている。このため、サーバ・クライアン
ト間で頻繁に通信が行われることになり、たとえば通信
障害などによって、クライアントの実際の状況とサーバ
が把握しているクライアントの状況との間に食い違いが
生じたときには動作不良を起こす虞があった。また、こ
の方法では1回の通信量は小さいが、サーバに対する問
い合わせ回数が増加し、サーバでの処理が多くなるとい
う問題もある。As an example of realizing Kana-Kanji conversion as natural language processing by a server / client model, Wn
n (Jserver) (KABA's "Wnn + GMW Introduction", Iwanami Shoten, 1990). Even in Wnn, basically, only deterministic data is transferred, the server grasps the status of the client, and when other data (next candidate for kana-kanji conversion) is requested by the client, other data is responded accordingly. I am trying to transfer. For this reason, frequent communication is performed between the server and the client, and when there is a discrepancy between the actual situation of the client and the situation of the client known to the server due to, for example, communication failure, malfunction occurs. There was a risk of causing. Further, this method has a problem that although the amount of communication per time is small, the number of inquiries to the server increases, and the number of processes in the server increases.
【0007】[0007]
【発明が解決しようとする課題】上述の如く、従来の自
然言語処理を目的としたサーバ・クライアントモデルで
は、決定性データの転送しか行えないため、たとえば機
械翻訳やかな漢字変換では他の訳文候補や次候補などを
クライアント側で得ることができなかったり、あるいは
サーバとクライアント間の状況認識のずれにより正しい
候補が得られなかったりする問題があった。また、サー
バ・クライアント間の問い合わせ回数が増加し、ネット
ワークにおける負荷の増大を招く問題もあった。As described above, in the conventional server-client model for natural language processing, only deterministic data can be transferred. Therefore, for example, in machine translation or kana-kanji conversion, other translation candidate or There is a problem that a candidate or the like cannot be obtained on the client side, or a correct candidate cannot be obtained due to a difference in situation recognition between the server and the client. There is also a problem that the number of inquiries between the server and the client increases, which causes an increase in load on the network.
【0008】そこで本発明は、非決定性データを含むデ
ータの転送を可能とすることにより、自然言語処理をサ
ーバ・クライアントモデルを用いて効率良く行うことが
できる自然言語処理装置を提供することを目的としてい
る。Therefore, the present invention aims to provide a natural language processing apparatus capable of efficiently performing natural language processing by using a server / client model by enabling transfer of data including non-deterministic data. I am trying.
【0009】[0009]
【課題を解決するための手段】上記課題を解決するため
に、本発明は、自然言語処理要求を行う少なくとも1台
の処理要求端末部と、自然言語処理要求に応じて自然言
語処理を行う少なくとも1台の自然言語処理部と、前記
処理要求端末部と前記自然言語処理部とを電子的に接続
するネットワーク部とを備えた自然言語処理装置におい
て、前記自然言語処理部から前記処理要求端末部へ処理
データを送信する際に、自然言語処理中に発生した一意
に決定できない非決定性データ部分における候補データ
も送信する送信手段を備えている。In order to solve the above-mentioned problems, the present invention provides at least one processing request terminal section for making a natural language processing request and at least a natural language processing in response to the natural language processing request. In a natural language processing device comprising a single natural language processing section and a network section that electronically connects the processing request terminal section and the natural language processing section, in the natural language processing section, the processing request terminal section is provided. When transmitting the processed data to the non-deterministic data portion that cannot be uniquely determined during the natural language processing, the transmitting means also transmits the candidate data.
【0010】なお、前記送信手段は、処理要求端末部に
おいて受理可能なデータ量に応じて送信する非決定性デ
ータの量を変更する手段や、ネットワーク部の状況に応
じて送信する非決定性データの量を変更する手段や、語
の活用展開など自然言語処理を全て終えてから送信する
手段などを備えていることが好ましい。The transmitting means is a means for changing the amount of non-deterministic data to be transmitted according to the amount of data that can be accepted by the processing request terminal unit, and an amount of non-deterministic data to be transmitted according to the situation of the network unit. Is preferably provided, and a means for transmitting after completion of all natural language processing such as word utilization expansion is provided.
【0011】[0011]
【作用】本発明によれば、非決定性データを含むデータ
の転送を可能としているため、自然言語処理をサーバ・
クライアントモデルを利用して効率良く行うことができ
る。According to the present invention, data including non-deterministic data can be transferred.
It can be done efficiently by using the client model.
【0012】[0012]
【実施例】以下、図面を参照しながら実施例を説明す
る。図1には本発明の第1の実施例に係る自然言語処理
装置、ここには機械翻訳処理装置の概略構成が示されて
いる。同図において、1は処理要求端末部を示してい
る。この処理要求端末部1は、制御部2と通信部3とで
構成されている。4は自然言語処理部を示している。こ
の自然言語処理部4は、通信部5と自然言語処理エンジ
ン6とで構成されている。7はこれらを接続するネット
ワーク部を示している。Embodiments will be described below with reference to the drawings. FIG. 1 shows a schematic configuration of a natural language processing apparatus, which is a machine translation processing apparatus according to the first embodiment of the present invention. In the figure, reference numeral 1 indicates a processing request terminal unit. The processing request terminal unit 1 is composed of a control unit 2 and a communication unit 3. Reference numeral 4 denotes a natural language processing unit. The natural language processing unit 4 is composed of a communication unit 5 and a natural language processing engine 6. Reference numeral 7 denotes a network unit connecting these.
【0013】図2には同実施例装置の各部の具体的構成
が示されている。この装置では処理要求端末部と自然言
語処理部とに電子計算機を用いている。同図において、
200は処理要求端末部を示している。この処理要求端
末部200は入力部201を備えている。入力部201
は、処理要求を行う言語や処理要求コマンドを入力した
り、処理結果の修正のための入力を行ったりするための
もので、一般的にはキーボード,マウス,タッチパネ
ル,ペンなどを用いるポインティングデバイスなどで構
成されている。FIG. 2 shows a concrete structure of each part of the apparatus of the embodiment. In this device, an electronic computer is used for the processing request terminal unit and the natural language processing unit. In the figure,
Reference numeral 200 denotes a processing request terminal unit. The processing request terminal unit 200 includes an input unit 201. Input unit 201
Is for inputting a language for requesting processing, a processing request command, and input for correcting processing results. Generally, a pointing device using a keyboard, a mouse, a touch panel, a pen, or the like. It is composed of.
【0014】入力部201からの入力データは制御部2
05に送られる。この制御部205は、表示部202、
記録部203、編集部204、通信部206などと接続
されていて、これらの制御やデータの受け渡しを行う。
表示部202は、入力部201より入力されたコマンド
や文字列を表示したり、翻訳結果を表示したりするもの
で、一般的にはCRTディスプレイやビットマップディ
スプレイなどで構成されている。なお、表示部202と
しては、ゴーグルタイプのものや壁面に投射するように
したものを用いることもできる。The input data from the input unit 201 is the control unit 2
Sent to 05. The control unit 205 includes a display unit 202,
It is connected to the recording unit 203, the editing unit 204, the communication unit 206 and the like, and controls these and transfers data.
The display unit 202 displays a command or a character string input from the input unit 201 or a translation result, and is generally composed of a CRT display or a bitmap display. The display unit 202 may be a goggle type one or one that is projected on a wall surface.
【0015】記録部203は、入力部201より入力さ
れたデータや通信部206を経て得られた翻訳データあ
るいは編集部204によって編集されたデータを記録す
るために用いられる。編集部204は、入力部201よ
り入力されたデータや通信部206を経て得られた翻訳
データなどを編集するために用いられる。The recording unit 203 is used to record the data input from the input unit 201, the translation data obtained via the communication unit 206, or the data edited by the editing unit 204. The editing unit 204 is used for editing the data input from the input unit 201, the translation data obtained via the communication unit 206, and the like.
【0016】通信部206は、入力部201から入力さ
れたデータや記録部203に記録されていたデータを後
述する自然言語処理部207へ送信したり、自然言語処
理部207からの送信データを受信したりするためのも
のである。そして、この通信部206は、自然言語処理
部207から送信されたデータが非決定性データである
場合においてもこれを受信できるようになっている。こ
の具体例は後述する。The communication unit 206 transmits the data input from the input unit 201 or the data recorded in the recording unit 203 to the natural language processing unit 207 described later, or receives the transmission data from the natural language processing unit 207. It is for doing. The communication unit 206 can receive the data transmitted from the natural language processing unit 207 even when the data is non-deterministic data. A specific example of this will be described later.
【0017】一方、自然言語処理部207は次のように
構成されている。すなわち、図中、208は通信部を示
している。この通信部208では、通信部206から送
信されてきた翻訳要求文やコマンドを受信したり、翻訳
を終えたデータを送信したりする役目を担っている。な
お、この通信部208は翻訳結果に曖昧性のある場合、
非決定性データとして処理要求端末部200へ送信する
機能を備えている。この具体例は後述する。On the other hand, the natural language processing section 207 is constructed as follows. That is, in the drawing, 208 indicates a communication unit. The communication unit 208 has a role of receiving the translation request sentence or command transmitted from the communication unit 206 and transmitting the translated data. It should be noted that if the translation result has ambiguity,
It has a function of transmitting it as non-deterministic data to the processing request terminal unit 200. A specific example of this will be described later.
【0018】図中、209は制御部を示している。この
制御部209は、記録部210、翻訳部211などと接
続されていて、これらの制御やデータの受け渡しを行
う。記録部210は、通信部208で受信したデータや
翻訳部211で翻訳したデータを一時的に記録する。翻
訳部211は、翻訳用辞書部212の辞書を参照し、通
信部208を介して受信したデータや記録部210に記
録されたデータを翻訳する。In the figure, reference numeral 209 indicates a control unit. The control unit 209 is connected to the recording unit 210, the translation unit 211, etc., and controls these and transfers data. The recording unit 210 temporarily records the data received by the communication unit 208 and the data translated by the translation unit 211. The translation unit 211 refers to the dictionary of the translation dictionary unit 212 and translates the data received via the communication unit 208 or the data recorded in the recording unit 210.
【0019】そして、これら処理要求端末部200と自
然言語処理部207とが通信路213を介して接続され
ている。次に、上記のように構成された装置の動作を説
明する。なお、以下の説明では処理要求端末部200を
クライアント、自然言語処理部207をサーバと呼ぶこ
とにする。The processing request terminal unit 200 and the natural language processing unit 207 are connected via the communication path 213. Next, the operation of the apparatus configured as described above will be described. In the following description, the processing request terminal unit 200 will be called a client, and the natural language processing unit 207 will be called a server.
【0020】図3には本実施例装置における処理要求端
末部200、すなわちクライアントでの処理手順の一例
が示されている。クライアントでは、入力部201を通
して入力があった場合、まずそれが翻訳要求をする原文
かどうかを判断する(ステップ301)。原文であった
場合はデータを記録部203へ転送し、ここでそれを記
録する。これをデータAとする(ステップ302)。FIG. 3 shows an example of a processing procedure in the processing request terminal unit 200, that is, the client in the apparatus of this embodiment. When there is an input through the input unit 201, the client first determines whether or not it is the original sentence for which a translation request is made (step 301). If it is an original sentence, the data is transferred to the recording unit 203, and is recorded here. This is designated as data A (step 302).
【0021】ステップ301で入力データが翻訳要求の
ための原文ではないと判断された場合には、クライアン
トに対するコマンドであると判断し、それが翻訳開始要
求であるか否かを判断する(ステップ303)。それが
翻訳開始要求ではなかった場合には、入力されたコマン
ドに応じた処理を行う(ステップ304)。翻訳開始要
求であった場合には記録部203に記録されているデー
タAを自然言語処理部207、すなわちサーバへ送信す
る(ステップ305)。When it is determined in step 301 that the input data is not the original sentence for the translation request, it is determined that it is a command to the client, and it is determined whether or not it is a translation start request (step 303). ). If it is not the translation start request, the processing according to the input command is performed (step 304). If the request is a translation start request, the data A recorded in the recording unit 203 is transmitted to the natural language processing unit 207, that is, the server (step 305).
【0022】サーバにおいて、この文書の翻訳が行われ
るので、その翻訳終了までクライアントは待つことにな
る(ステップ306)。サーバにおける翻訳処理につい
ては別途説明する。この間、クライアントは他のコマン
ドや翻訳要求文の入力待ちをしていてもよい。サーバで
の翻訳が終了し、翻訳結果データが転送されてきた場
合、それが曖昧性を含んだ非決定的なデータであるか否
かを判断し(ステップ307)、非決定的なデータであ
る場合にはそれを参照しやすいように展開する(ステッ
プ308)。その後、データを表示部202に表示する
ことにより、オペレータに翻訳結果を呈示する(ステッ
プ309)。Since the server translates this document, the client waits until the translation is completed (step 306). The translation process in the server will be described separately. During this time, the client may be waiting for input of another command or a translation request sentence. When the translation in the server is completed and the translation result data is transferred, it is judged whether or not it is non-deterministic data including ambiguity (step 307), and if it is non-deterministic data. Expands it for easy reference (step 308). After that, the translation result is presented to the operator by displaying the data on the display unit 202 (step 309).
【0023】図4には本実施例装置における自然言語処
理部207、すなわちサーバでの処理手順の一例が示さ
れている。サーバは、クライアントからの翻訳用データ
Cを受信するために待機している(ステップ401)。
翻訳用データCを受信した場合は、データCを翻訳部2
11に転送し翻訳を行う(ステップ402)。翻訳部2
11において翻訳が終了したら、翻訳部211より翻訳
結果Dとその曖昧性を含むデータ(非決定性データ)E
とを全て受信し(ステップ403)、これらをクライア
ントへ転送する(ステップ404)。FIG. 4 shows an example of the processing procedure in the natural language processing unit 207, that is, the server in the apparatus of this embodiment. The server waits to receive the translation data C from the client (step 401).
When the translation data C is received, the data C is translated by the translation unit 2
It is transferred to 11 and translated (step 402). Translation department 2
When the translation is completed in 11, the translation unit 211 causes the translation result D and the data including the ambiguity (nondeterministic data) E to be obtained.
And all are received (step 403), and these are transferred to the client (step 404).
【0024】以下、図5から図9を参照しながら本実施
例装置の具体的な動作を説明する。図5にはクライアン
トにおける表示部202での表示例が示されている。図
5において、画面上部が原文表示部Pであり、翻訳要求
文の入力や編集を行うための画面として用いられる。図
5において、画面下部は訳文表示部Qであり、翻訳結果
やそれに付随する情報などを表示するために用いられ
る。この図5には翻訳要求を行う文を入力し、その結果
が原文表示領域Pに表示されている状況が示されてい
る。The specific operation of the apparatus of this embodiment will be described below with reference to FIGS. FIG. 5 shows a display example on the display unit 202 in the client. In FIG. 5, the upper part of the screen is the original text display portion P, which is used as a screen for inputting and editing a translation request sentence. In FIG. 5, the lower part of the screen is a translated text display portion Q, which is used to display the translation result and the information accompanying it. FIG. 5 shows a situation in which a sentence for which a translation request is made is input and the result is displayed in the original sentence display area P.
【0025】ここで、入力部201より翻訳開始要求を
入力し、図3、図4に示した過程によって翻訳結果が得
られ、それを表示部202の訳文表示部Qに示した状況
の一例が図6に示されている。訳文表示部Qに表示され
ている翻訳結果は第1解を示しているに過ぎないが、た
とえばこの例では訳文の語のうち「あなた」に曖昧性が
ある。つまり、他の訳語が存在する。本実施例装置で
は、“他の訳語”もサーバからクライアントに送られて
きているため、クライアントの画面上で「あなた」を指
定することによって他の訳語を表示でき、第1解に呈示
された語句と置換することができる。Here, an example of the situation in which a translation start request is input from the input unit 201 and a translation result is obtained by the process shown in FIGS. 3 and 4 and which is shown in the translated sentence display unit Q of the display unit 202 is shown below. It is shown in FIG. Although the translation result displayed in the translated sentence display portion Q only shows the first solution, for example, in this example, "you" is ambiguous among the words in the translated sentence. That is, there are other translations. In the apparatus of this embodiment, since the "other translations" are also sent from the server to the client, it is possible to display the other translations by designating "you" on the screen of the client, and presented in the first solution. Can be replaced with a phrase.
【0026】この状態の一例を示したのが図7である。
この図では、「あなた」の他の候補として、「君」,
「貴女」,「おまえ」があることがわかる。このとき、
本実施例装置では、サーバへの問い合わせを行わない。
このため、通信回数を減少させることができる上、サー
バはこの文の翻訳に用いた訳語情報を初めとする様々な
情報を記憶する必要もないので、計算機資源の有効利用
を図ることができる。FIG. 7 shows an example of this state.
In this figure, as another candidate for "you", "you",
You can see that there are "You" and "You". At this time,
The apparatus of this embodiment does not make an inquiry to the server.
Therefore, the number of communications can be reduced, and the server does not need to store various information including the translated word information used for translating this sentence, so that the computer resources can be effectively used.
【0027】翻訳結果における非決定的なデータは訳語
に止どまらない。たとえば、原文における語と語との修
飾関係なども非決定的なデータとして挙げられる。図8
には“I saw a girl with a telescope.”という文を翻
訳した例が示されている。この場合、with が導く句が
girl にかかり、「望遠鏡を持った少女」として解釈す
る場合と、saw にかかり、「望遠鏡で見た」という解釈
する場合とがあり、一意には決定できない。この場合
も、サーバから曖昧性の有るデータ(非決定性データ)
の全てが転送されているため、サーバへの問い合わせな
しに上記の非決定性データをユーザに示すことができ
る。Non-deterministic data in the translation result is not limited to the translated word. For example, the non-deterministic data may include the word-to-word modifier relations in the original sentence. Figure 8
Shows an example of translated sentence "I saw a girl with a telescope." In this case, the phrase with leads
There is a case where it is interpreted as “a girl with a telescope” depending on girl, and a case where it is interpreted as “seen with a telescope” due to saw and cannot be uniquely determined. In this case, too, ambiguous data from the server (non-deterministic data)
Since all of the above have been transferred, the above non-deterministic data can be presented to the user without querying the server.
【0028】図9および図10には、これらの処理を行
うためにクライアント・サーバ間で転送されるデータの
一例が示されている。図9には、図7の状況を発生させ
るために、サーバからクライアントに送信されるデータ
の例が示されている。この図に示すように、訳文1単語
が1行として表現されている。各行の第1カラムは第1
解データである。第2カラムは第1カラムのデータに対
する他の候補のリストである。第3カラムはそれに対応
する原文単語、第4カラムはその品詞である。このよう
に送信されたデータをクライアントでは、第1カラムの
データを集めて図6に示す表示データを作製し、第2カ
ラムのデータを集めて図7に示す表示データを作製して
いる。FIG. 9 and FIG. 10 show an example of data transferred between the client and server to perform these processes. FIG. 9 shows an example of data sent from the server to the client to generate the situation of FIG. As shown in this figure, one word of the translated sentence is expressed as one line. The first column in each row is the first
It is solution data. The second column is a list of other candidates for the data in the first column. The third column is the corresponding original sentence word, and the fourth column is the part of speech. The client collects the data in the first column to prepare the display data shown in FIG. 6 and collects the data in the second column to prepare the display data shown in FIG.
【0029】図10には、図8の状況を発生させるため
に、サーバからクライアントに送信されるデータの例が
示されている。この図に示されるように、データ構造は
図9におけるデータ構造と同じであるが、非決定性デー
タの範囲が単語の範囲を越えて句の単位で1行として表
現されている。各行の第1カラムは句の番号を示し、第
2カラムは句単位の訳文を示し、第3カラムはそれに対
応する原文単語を示し、第4カラムはその品詞を示して
いる。また、これらのデータをどのように構成して訳文
を生成するかを示す補助データもある。このように、ク
ライアントでは送信されきた第2カラムのデータを補助
データにしたがって集めて図8に示す表示データを作製
している。FIG. 10 shows an example of data transmitted from the server to the client to generate the situation of FIG. As shown in this figure, the data structure is the same as the data structure in FIG. 9, but the range of non-deterministic data exceeds the range of words and is expressed as one line in units of phrases. The first column of each line shows the phrase number, the second column shows the translated sentence by phrase, the third column shows the corresponding original sentence word, and the fourth column shows the part of speech. There is also auxiliary data indicating how these data are constructed to generate a translated sentence. In this way, the client collects the transmitted data in the second column according to the auxiliary data to create the display data shown in FIG.
【0030】図11には本発明の第2の実施例に係る自
然言語処理装置、ここにも機械翻訳処理装置の概略構成
が示されている。この実施例装置では通信路の状況によ
り送信データ量を変更する機能を備えている。同図にお
いて、1101は処理要求端末部を示している。この処
理要求端末部1101は、図2における処理要求端末部
200と同様に構成されている。FIG. 11 shows a schematic configuration of a natural language processing apparatus according to the second embodiment of the present invention, which is also a machine translation processing apparatus. The apparatus of this embodiment has a function of changing the amount of transmission data depending on the condition of the communication path. In the figure, reference numeral 1101 indicates a processing request terminal unit. The processing request terminal unit 1101 is configured similarly to the processing request terminal unit 200 in FIG.
【0031】1100は自然言語処理部を示している。
1103は通信部である。ここでは、処理要求端末部1
101の通信部から送信されてきた翻訳要求文やコマン
ドを受信したり、翻訳を終えたデータを送信したりす
る。そして、この通信部1103は、翻訳結果に曖昧性
のある場合に、非決定性データとして処理要求端末部1
101へ送信する機能を備えている。この具体例は後述
する。Reference numeral 1100 denotes a natural language processing section.
1103 is a communication unit. Here, the processing request terminal unit 1
The translation request sentence or command transmitted from the communication unit 101 is received, or the translated data is transmitted. Then, when the translation result has ambiguity, the communication unit 1103 treats the processing request terminal unit 1 as non-deterministic data.
It has a function of transmitting to 101. A specific example of this will be described later.
【0032】記録部1104は、通信部1103で受信
したデータや翻訳部1106で翻訳したデータを一時的
に記録する。1105は制御部であり、記録部110
4、翻訳部1106、非決定性データ作成部1108な
どと接続されていて、これらの制御やデータの受け渡し
を行う。翻訳部1106は翻訳用辞書部1107の辞書
を参照して、通信部1103を介して受信されデータや
記録部1104に記録されたデータを翻訳する。The recording unit 1104 temporarily records the data received by the communication unit 1103 and the data translated by the translation unit 1106. A control unit 1105 includes a recording unit 110.
4, connected to the translation unit 1106, the non-deterministic data creation unit 1108, etc., and controls these and transfers data. The translation unit 1106 refers to the dictionary of the translation dictionary unit 1107 and translates the data received via the communication unit 1103 and the data recorded in the recording unit 1104.
【0033】非決定性データ作成部1108は、本実施
例装置の特徴をなすもので、通信路モニタ1109によ
って得られた通信路1102の状況を基に非決定性デー
タ決定ルール部1110を参照し、要求処理端末部11
01へ転送するデータを後述の如く決定する。次に、上
記のように構成された装置の動作を説明する。なお、以
下の説明では処理要求端末部1101をクライアント、
自然言語処理部1100をサーバと呼ぶことにする。The nondeterministic data creating unit 1108 is a feature of the apparatus of this embodiment, and refers to the nondeterministic data determination rule unit 1110 based on the status of the communication path 1102 obtained by the communication path monitor 1109 to make a request. Processing terminal unit 11
The data to be transferred to 01 is determined as described later. Next, the operation of the apparatus configured as described above will be described. In the following description, the processing request terminal unit 1101 is a client,
The natural language processing unit 1100 will be called a server.
【0034】図12には非決定性データ作成部1108
での処理手順が示されている。まず、通信路の混雑度を
検知するために、通信路の単位時間当たりの通信量を通
信路モニタ1109で測定し、非決定性データ決定ルー
ル部1110で定義されている値N以上であるかどうか
を判定する(ステップ1201)。N以上である場合
は、通信路のトラブルを避けるため通信量を減らすこと
し、ルール記録部に記録されているルールにしたがって
通信量制限を行う(ステップ1205)。N以下である
場合には通信路によって転送可能なデータの速度を測定
し、それが非決定性データ決定ルール部1110で定義
されている値M以下であるかどうかを判定する(ステッ
プ1202)。M以下である場合は大量データを送ると
時間が非常にかかるため通信量を減らすこととし、非決
定性データ決定ルール部1110のルール記録部に記録
されているルールにしたがって通信量制限を行う。M以
上である場合には通信路の単位通信量当たりのコストを
求め、これが非決定性データ決定ルール部1110で定
義されている値L以上であるかどうかを判定する(ステ
ップ1203)。FIG. 12 shows the non-deterministic data creating unit 1108.
The processing procedure in is shown. First, in order to detect the congestion degree of the communication channel, the communication amount per unit time of the communication channel is measured by the communication channel monitor 1109, and whether or not it is equal to or more than the value N defined by the nondeterministic data determination rule unit 1110. Is determined (step 1201). If it is N or more, the communication amount is reduced in order to avoid the trouble of the communication path, and the communication amount is restricted according to the rule recorded in the rule recording unit (step 1205). If it is equal to or less than N, the speed of data that can be transferred by the communication path is measured, and it is determined whether or not it is equal to or less than the value M defined by the nondeterministic data determination rule unit 1110 (step 1202). If it is M or less, it takes a lot of time to send a large amount of data, so the communication amount is reduced, and the communication amount is restricted according to the rule recorded in the rule recording unit of the nondeterministic data determination rule unit 1110. If it is M or more, the cost per unit communication amount of the communication path is obtained, and it is determined whether or not this is the value L or more defined by the nondeterministic data determination rule unit 1110 (step 1203).
【0035】L以上である場合には、大量のデータを送
信するとコストが非常にかかるため通信量を減らすこと
とし、非決定性データ決定ルール部1110のルール記
録部に記録されているルールにしたがって通信量制限を
行う。L以下である場合には通信量制限は行わない(ス
テップ1204)。図13および図14には、本実施例
装置によって行われた通信量制限の一例が示されてい
る。なお、データ制限を行わない場合の全データは図9
に示されるようなものである。If L or more, a large amount of data is very costly to transmit, so the communication amount is reduced, and communication is performed according to the rule recorded in the rule recording unit of the nondeterministic data determination rule unit 1110. Limit the amount. If it is equal to or less than L, the communication amount is not limited (step 1204). FIG. 13 and FIG. 14 show an example of the communication amount restriction performed by the device of this embodiment. In addition, all data without data restriction is shown in FIG.
As shown in.
【0036】図13に示すデータ制限例では、非決定性
データのうち、訳語の第2候補までを送信し、第3候補
以降のデータは送信しないようにしている。また、図1
4示すデータ制限例では、用言の非決定性データのみを
送付し、その他の品詞の非決定性データは送信しないよ
うにしている。図15には、本発明の第3の実施例に係
る自然言語処理装置、ここにも機械翻訳処理装置の概略
構成が示されている。In the data restriction example shown in FIG. 13, of the non-deterministic data, up to the second candidate of the translated word is transmitted, and the data of the third candidate and thereafter are not transmitted. Also, FIG.
In the data restriction example shown in FIG. 4, only the non-deterministic data of the dialect is sent, and the non-deterministic data of other parts of speech are not sent. FIG. 15 shows a schematic configuration of a natural language processing apparatus according to the third embodiment of the present invention, which is also a machine translation processing apparatus.
【0037】この実施例装置においては、処理要求端末
部の能力に応じて送信データ量を変更するようにしてい
る。図15において、1501は処理要求端末部を示し
ている。以後、これをクライアントと呼ぶことにする。
クライアントは、入力部1502と、表示部1503
と、条件判定部1504と、制御部1505と、通信部
1506と、編集部1507と、記録部1508とで構
成されている。In the apparatus of this embodiment, the amount of transmission data is changed according to the capability of the processing request terminal unit. In FIG. 15, reference numeral 1501 denotes a processing request terminal unit. Hereinafter, this will be referred to as a client.
The client includes an input unit 1502 and a display unit 1503.
And a condition determining unit 1504, a control unit 1505, a communication unit 1506, an editing unit 1507, and a recording unit 1508.
【0038】入力部1502、表示部1503、編集部
1507、記録部1508は、図2に示される装置の要
求処理端末部に含まれているものと同じ機能を備えてい
る。条件判定部1504は、表示部1503の大きさ、
記録部1508に記録できる容量などから、一回に受信
できる非決定性データ量を判別するためのものである。
また、通信部1506は、上記制限を自然言語処理部1
509(以後、サーバと呼ぶことにする)に送信する機
能を持つほかは図2における通信部206と同じ機能を
備えている。制御部1505も条件判定部1504の制
御を行うほかは図2における制御部205と同じ機能を
備えている。The input section 1502, the display section 1503, the editing section 1507, and the recording section 1508 have the same functions as those included in the request processing terminal section of the apparatus shown in FIG. The condition determination unit 1504 has a size of the display unit 1503,
This is for determining the amount of non-deterministic data that can be received at one time from the capacity that can be recorded in the recording unit 1508.
In addition, the communication unit 1506 sets the above restrictions to the natural language processing unit 1.
509 (hereinafter, referred to as a server), and has the same function as the communication unit 206 in FIG. The control unit 1505 also has the same function as the control unit 205 in FIG. 2 except that it also controls the condition determination unit 1504.
【0039】一方、自然言語処理部1509、すなわち
サーバは、通信部1510と、記録部1511と、制御
部1512と、翻訳部1513と、翻訳用辞書部151
4と、非決定性データ作成部1515と、非決定性デー
タ決定ルール部1516とで構成されている。通信部1
510はクライアントからの制限条件を受信できるほか
は図11における通信部1103と同様の機能を備えて
いる。記録部1511、翻訳部1513、翻訳用辞書部
1514、制御部1512も図11におけるそれぞれの
各部と同様の機能を備えている。On the other hand, the natural language processing unit 1509, that is, the server, includes a communication unit 1510, a recording unit 1511, a control unit 1512, a translation unit 1513, and a translation dictionary unit 151.
4, a nondeterministic data creation unit 1515, and a nondeterministic data determination rule unit 1516. Communication unit 1
510 has the same function as the communication unit 1103 in FIG. 11 except that it can receive the limiting condition from the client. The recording unit 1511, the translation unit 1513, the translation dictionary unit 1514, and the control unit 1512 also have the same functions as the respective units in FIG.
【0040】非決定性データ作成部1515は、非決定
性データ決定ルール部1516を参照するなど、図11
における非決定性データ作成部と同様に機能するが、図
11に示した実施例では作成のための制限データを通信
路モニタから得ているのに対して、この実施例ではクラ
イアントから受信したデータから得るようにしている点
で相違している。そして、これらのクライアントとサー
バは通信路1517を介して接続されている。The non-deterministic data creating section 1515 refers to the non-deterministic data decision rule section 1516, etc.
Although it functions in the same manner as the non-deterministic data creating unit in FIG. 11, in the embodiment shown in FIG. 11, the limiting data for creation is obtained from the communication channel monitor, whereas in this embodiment, it is obtained from the data received from the client. The difference is that you are trying to get. Then, these client and server are connected via a communication path 1517.
【0041】すなわち、本実施例装置では、クライアン
トにおいて受理可能なデータ量に応じて送信する非決定
性データの量を決定するようにしているのである。な
お、本発明は上記各実施例に限定されるものではない。
すなわち、上記各実施例では、処理要求のためにクライ
アントからサーバへ送信した全てのデータに対する処理
をサーバで終えてからクライアントに送信しているが、
一定単位の処理を終えた時点で送信してもよい。たとえ
ば、クライアントからサーバに対し「I have a pen.You
have a pencil. 」という要求が発せられた場合、この
データ全体の翻訳が終了しなくても、「I have a pen.
」の翻訳が終了した時点でクライアントにデータの送
信を行ってもよい。That is, in the apparatus of this embodiment, the amount of non-deterministic data to be transmitted is determined according to the amount of data that can be accepted by the client. The present invention is not limited to the above embodiments.
That is, in each of the above-described embodiments, the processing for all data transmitted from the client to the server for the processing request is transmitted to the client after the server completes the processing.
It may be transmitted at the time when a certain unit of processing is completed. For example, a client may ask the server, "I have a pen.You.
If a request `` have a pencil. '' is issued, the translation of `` I have a pen.
The data may be transmitted to the client when the translation of “” is completed.
【0042】また、上記各実施例は自然言語処理装置と
しての機械翻訳装置の例であるが、これに限定されるも
のではなく、他の自然言語処理、たとえば音声認識、か
な漢字変換、文書較正支援、文字認識などのように処理
結果として曖昧性データが出力される場合に適用でき
る。たとえば、かな漢字変換を例にとると、非決定性デ
ータとは変換結果の同音語となり、図9に示した非決定
データはたとえば図16に示すようになる。かな漢字変
換に適用した場合には、変換の結果となる各単語毎に第
1候補、他の変換候補、読み、品詞などがサーバからク
ライアントに送られる。また、文字認識を例にとると、
非決定性データとは認識結果における他の文字候補とな
り、図9に示した非決定性データはたとえば図17のよ
うになる。文字認識に適用した場合には、認識結果とな
る各単語毎に他の認識結果候補もサーバからクライアン
トに送られる。The above embodiments are examples of a machine translation device as a natural language processing device, but the invention is not limited to this, and other natural language processes such as voice recognition, kana-kanji conversion, and document calibration support. It can be applied when ambiguity data is output as a processing result such as character recognition. For example, taking the Kana-Kanji conversion as an example, the nondeterministic data is a homophone of the conversion result, and the nondeterministic data shown in FIG. 9 is as shown in FIG. 16, for example. When applied to kana-kanji conversion, the first candidate, other conversion candidates, reading, part-of-speech, etc. are sent from the server to the client for each word resulting from the conversion. Taking character recognition as an example,
The non-deterministic data is another character candidate in the recognition result, and the non-deterministic data shown in FIG. 9 is as shown in FIG. 17, for example. When applied to character recognition, other recognition result candidates are also sent from the server to the client for each word that is a recognition result.
【0043】これらの例で示したように、転送する自然
言語データは、活用展開を終えてから転送される。これ
により、クライアントでは自然言語処理に係わる一切の
機能を持つ必要はなく、クライアントの資源の有効活用
を行うことができる。しかし、クライアントで一部の処
理を請け負うようにしてもよい。その他にも、本発明
は、音声認識、スペルチェック、文章校正、検索などの
処理に適用することができる。また、実施例は英日翻訳
の例であったが、その他の言語対に対しても同様であ
る。また、日本語以外の言語に対する自然言語処理にも
適用することができる。As shown in these examples, the natural language data to be transferred is transferred after the utilization expansion is completed. As a result, the client does not need to have any function related to natural language processing, and the resources of the client can be effectively used. However, some processing may be undertaken by the client. Besides, the present invention can be applied to processes such as voice recognition, spell checking, proofreading, and search. Further, although the embodiment is an example of English-Japanese translation, the same applies to other language pairs. It can also be applied to natural language processing for languages other than Japanese.
【0044】[0044]
【発明の効果】以上説明したように、本発明によれば、
非決定性データを含むデータの転送を可能とすることに
より、自然言語処理をサーバ・クライアントモデルを利
用して効率良く行うことができる。As described above, according to the present invention,
By enabling transfer of data including non-deterministic data, natural language processing can be efficiently performed using the server / client model.
【図1】本発明の第1の実施例に係る自然言語処理装置
の概略構成図FIG. 1 is a schematic configuration diagram of a natural language processing apparatus according to a first embodiment of the present invention.
【図2】同装置の各部を示す具体的なブロック構成図FIG. 2 is a specific block configuration diagram showing each part of the device.
【図3】同装置における処理要求端末部での処理の流れ
を示す図FIG. 3 is a diagram showing a flow of processing in a processing request terminal unit in the same apparatus.
【図4】同装置における自然言語処理部での処理の流れ
を示す図FIG. 4 is a diagram showing a flow of processing in a natural language processing unit in the same apparatus.
【図5】同装置における処理要求端末部の画面表示例を
示す図FIG. 5 is a diagram showing a screen display example of a processing request terminal unit in the same apparatus.
【図6】同装置における処理要求端末部の画面表示例を
示す図FIG. 6 is a diagram showing a screen display example of a processing request terminal unit in the same apparatus.
【図7】同装置における処理要求端末部の画面表示例を
示す図FIG. 7 is a diagram showing a screen display example of a processing request terminal unit in the same apparatus.
【図8】同装置における処理要求端末部の画面表示例を
示す図FIG. 8 is a diagram showing a screen display example of a processing request terminal unit in the same apparatus.
【図9】同装置における処理要求端末部と自然言語処理
部との間の転送データの一例を示す図FIG. 9 is a diagram showing an example of transfer data between a processing request terminal unit and a natural language processing unit in the same device.
【図10】同装置における処理要求端末部と自然言語処
理部との間の転送データの一例を示す図FIG. 10 is a diagram showing an example of transfer data between a processing request terminal unit and a natural language processing unit in the same device.
【図11】本発明の第2の実施例に係る自然言語処理装
置のブロック構成図FIG. 11 is a block configuration diagram of a natural language processing device according to a second embodiment of the present invention.
【図12】同装置において通信路の状況によって送信デ
ータの量を変更する処理の流れを示す図FIG. 12 is a diagram showing a flow of processing for changing the amount of transmission data according to the state of the communication path in the same device.
【図13】同装置において送信データ量の制限を受けた
送信データの一例を示す図FIG. 13 is a diagram showing an example of transmission data in which the transmission data amount is limited in the device.
【図14】同装置において送信データ量の制限を受けた
送信データの一例を示す図FIG. 14 is a diagram showing an example of transmission data in which the transmission data amount is limited in the apparatus.
【図15】本発明の第2の実施例に係る自然言語処理装
置のブロック構成図FIG. 15 is a block configuration diagram of a natural language processing device according to a second embodiment of the present invention.
【図16】本発明をかな漢字変換処理適用したときにお
ける処理要求端末部と自然言語処理部との間の転送デー
タの一例を示す図FIG. 16 is a diagram showing an example of transfer data between a processing request terminal unit and a natural language processing unit when the present invention is applied to a Kana-Kanji conversion process.
【図17】本発明を文字認識処理に適用したときにおけ
る処理要求端末部と自然言語処理部との間の転送データ
の一例を示す図FIG. 17 is a diagram showing an example of transfer data between a processing request terminal unit and a natural language processing unit when the present invention is applied to character recognition processing.
1,200,1101,1501…処理要求端末部(ク
ライアント) 4,207,1100,1509…自然言語処理部(サ
ーバ)1,200,1101,1501 ... Processing request terminal unit (client) 4,207,1100,1509 ... Natural language processing unit (server)
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06K 9/03 Z 9289−5L ─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 6 Identification code Internal reference number FI technical display location G06K 9/03 Z 9289-5L
Claims (5)
処理要求端末部と、この端末部からの自然言語処理要求
に応じて自然言語処理を行う少なくとも1台の自然言語
処理部と、前記処理要求端末部と前記自然言語処理部と
を電子的に接続するネットワーク部とを備えた自然言語
処理装置において、前記自然言語処理部から前記処理要
求端末部へ処理データを送信する際に、自然言語処理中
に発生した一意に決定できない非決定性データも送信す
る送信手段を具備してなることを特徴とする自然言語処
理装置。1. At least one processing request terminal unit for making a natural language processing request, at least one natural language processing unit for carrying out natural language processing in response to a natural language processing request from this terminal unit, and said processing. In a natural language processing device including a requesting terminal unit and a network unit that electronically connects the natural language processing unit, a natural language is used when processing data is transmitted from the natural language processing unit to the processing requesting terminal unit. A natural language processing apparatus comprising: a transmission unit that also transmits non-deterministic data that cannot be uniquely determined during processing.
いて受理可能なデータ量に応じて送信する非決定性デー
タの量を変更する手段を備えてなることを特徴とする請
求項1に記載の自然言語処理装置。2. The transmission means comprises means for changing the amount of non-deterministic data to be transmitted in accordance with the amount of data that can be accepted by the processing request terminal unit. Natural language processor.
況に応じて送信する非決定性データの量を変更する手段
を備えてなること特徴とする請求項1に記載の自然言語
処理装置。3. The natural language processing apparatus according to claim 1, wherein said transmitting means comprises means for changing the amount of non-deterministic data to be transmitted according to the situation of said network unit.
言語処理を全て終えてからデータを送信する手段を備え
てなることを特徴とする請求項1に記載の自然言語処理
装置。4. The natural language processing apparatus according to claim 1, wherein said transmitting means comprises means for transmitting data after completing all natural language processing such as word development.
記処理要求端末部で行わせるために、語の活用展開など
に必要なデータも同時に送付する手段を備えてなること
を特徴とする請求項1に記載の自然言語処理装置。5. The transmitting means comprises means for simultaneously transmitting data necessary for word development and the like so that a part of the natural language processing is performed by the processing request terminal unit. The natural language processing device according to claim 1.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5348542A JPH07192001A (en) | 1993-12-27 | 1993-12-27 | Natural language processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5348542A JPH07192001A (en) | 1993-12-27 | 1993-12-27 | Natural language processor |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07192001A true JPH07192001A (en) | 1995-07-28 |
Family
ID=18397715
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5348542A Pending JPH07192001A (en) | 1993-12-27 | 1993-12-27 | Natural language processor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07192001A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8413041B2 (en) | 2002-06-26 | 2013-04-02 | Samsung Electronics Co., Ltd. | Apparatus and method for parsing XML document by using external XML validator |
-
1993
- 1993-12-27 JP JP5348542A patent/JPH07192001A/en active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8413041B2 (en) | 2002-06-26 | 2013-04-02 | Samsung Electronics Co., Ltd. | Apparatus and method for parsing XML document by using external XML validator |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5091876A (en) | Machine translation system | |
| JP2831647B2 (en) | Machine translation system | |
| JPH0433069B2 (en) | ||
| JPH01259447A (en) | Data processing | |
| JPS62203273A (en) | Mechanical translation system | |
| JP2004252944A (en) | Program, character input editing method, apparatus and recording medium | |
| JPH07222248A (en) | Method of using voice information in portable information terminals | |
| JPH07114558A (en) | Kanji conversion correction processing method | |
| JPH0658676B2 (en) | How to proofread multiple parts of speech | |
| JPH0576067B2 (en) | ||
| JP2003228575A (en) | Interactive system, interactive server, interactive method, and interactive program | |
| JPH07192001A (en) | Natural language processor | |
| JP2003296327A (en) | Translation server, genre-classified online machine translation method, and program therefor | |
| JP2752719B2 (en) | Database operation device | |
| JP3382974B2 (en) | Data analysis apparatus and method | |
| JP7583495B1 (en) | Information processing system, program, and information processing method | |
| JP3347506B2 (en) | Machine translation system | |
| JPH10320394A (en) | Natural language processor | |
| JP3383527B2 (en) | Language processing system | |
| JPH07152748A (en) | Document processing method and apparatus | |
| JPS6320569A (en) | Machine translation device | |
| JPH03100759A (en) | Document composing device | |
| JPH04205059A (en) | Translation device network system | |
| JPH0334060A (en) | Sentence producing device | |
| JPS6142065A (en) | "kana" and "kanji" message converting and outputting system |