[go: up one dir, main page]

JPH0644405A - OCR reading position correction controller - Google Patents

OCR reading position correction controller

Info

Publication number
JPH0644405A
JPH0644405A JP3241134A JP24113491A JPH0644405A JP H0644405 A JPH0644405 A JP H0644405A JP 3241134 A JP3241134 A JP 3241134A JP 24113491 A JP24113491 A JP 24113491A JP H0644405 A JPH0644405 A JP H0644405A
Authority
JP
Japan
Prior art keywords
reading position
character
ocr
reading
position correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3241134A
Other languages
Japanese (ja)
Inventor
Shigeki Ozawa
茂樹 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3241134A priority Critical patent/JPH0644405A/en
Publication of JPH0644405A publication Critical patent/JPH0644405A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 本発明は、文字を光学的に読み取るOCR認
識装置のOCR読み取り位置補正制御装置に関し、手書
き文字の認識率を向上させ得るOCR読み取り位置補正
制御装置を提供することを目的とする。 【構成】 手書き文字の記述状態を検索する読み取り位
置検索部13を具備し、検索情報と登録された読み取り
位置の情報とを比較し、補正されたデータにより文字認
識を行うことを特徴とする。
(57) [Abstract] [Object] The present invention relates to an OCR reading position correction control device for an OCR recognition device that optically reads characters, and provides an OCR reading position correction control device that can improve the recognition rate of handwritten characters. With the goal. It is characterized in that a reading position searching unit 13 for searching a written state of a handwritten character is provided, the search information is compared with registered reading position information, and character recognition is performed by the corrected data.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字を光学的に読み取
るOCR認識装置のOCR読み取り位置補正制御装置に
関し、特に作業を簡易化しつつ文字認識精度を向上せし
めることができるOCR読み取り位置補正制御装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an OCR reading position correction control device for an OCR recognition device for optically reading characters, and more particularly to an OCR reading position correction control device capable of improving character recognition accuracy while simplifying work. Regarding

【0002】本発明で対象とするOCR認識装置は、手
書き文字を認識して対応する電子的文字情報に変換す
る。例えば、利用者が適宜筆記具により手書き入力する
帳票類の文字・数字を読み取って電子情報化し、または
プリンタに印字出力するものである。
The OCR recognition apparatus of the present invention recognizes a handwritten character and converts it into corresponding electronic character information. For example, the characters and numbers of a form manually input by a user with a writing tool are appropriately read and converted into electronic information or printed out on a printer.

【0003】[0003]

【従来の技術】近年、OCR認識装置が普及しつつあ
り、利用分野も拡大の傾向にある。このようなOCR認
識装置において文字認識率を向上させるために多くの対
策が検討されている。しかし、帳票類の紙面の状態や筆
記状態によって、必ずしも満足な結果は得られていな
い。
2. Description of the Related Art In recent years, OCR recognition devices have become widespread, and their fields of use are also expanding. Many measures are being studied to improve the character recognition rate in such an OCR recognition device. However, satisfactory results have not always been obtained depending on the paper condition and writing condition of the forms.

【0004】かかる対策の一つとして、被読み取り媒体
を定型化し、文字記入状態を可能な限り標準化する工夫
がなされている。例えば、記述枠の印刷された帳票を用
意しておき、記述枠内に記載された文字・数字をOCR
認識するものである。
As one of such measures, a device for standardizing the medium to be read and standardizing the character writing state as much as possible has been devised. For example, prepare a form with a description frame printed on it and OCR the letters and numbers described in the description frame.
To recognize.

【0005】このような場合に、認識装置には、帳票の
種類に応じて文字の記述枠の位置を登録しておき、この
記述枠内に記述された文字の読み取りを行うものであ
る。
In such a case, the position of the character description frame is registered in the recognition device in accordance with the type of the form, and the character described in this description frame is read.

【0006】したがって、記述文字が記述枠をはみ出し
ている場合にはそのままで文字を認識することはできな
いため、そのまま光学文字読み取りを行おうとすると、
認識率が大幅に低下する。このような事態は、例えば帳
票類の印刷および裁断が正確に行われていない場合にも
同様に発生する。
Therefore, when the descriptive character is out of the descriptive frame, the character cannot be recognized as it is. Therefore, when the optical character is read as it is,
The recognition rate is significantly reduced. Such a situation also occurs when, for example, printing and cutting of forms are not performed accurately.

【0007】このように不適正位置に記述された帳票の
場合には、操作者が予め認識不能と判断し、あるいは装
置による読み取りが失敗した場合に当該帳票に参照用マ
ークを付してその帳票の登録位置と参照用マークを比較
しながら再度読み取り操作を行うような取扱がなされて
いた。
In the case of the form described in the improper position as described above, when the operator judges in advance that the form cannot be recognized or the reading by the device fails, the form is marked with a reference mark and the form is added. It was handled such that the reading operation was performed again while comparing the registered position and the reference mark.

【0008】このような操作においては、操作者は予め
手書き帳票を目視で点検しておき、必要な参照マークを
付しておく必要がある。そのため多大の労力と時間とを
必要とした。
In such an operation, it is necessary for the operator to visually inspect the handwritten form in advance and attach necessary reference marks. Therefore, much labor and time were required.

【0009】図4は従来技術において記述位置が不適当
な手書き帳票の文字認識の際の原理構成を示すものであ
る。図中破線枠で囲んだ部分は、操作者が行う非自動化
部分である。またOCR読み取り装置には帳票の文字記
述枠の位置が登録されている。
FIG. 4 shows a principle configuration for character recognition of a handwritten form in which the description position is inappropriate in the prior art. The part surrounded by the broken line frame in the figure is a non-automated part performed by the operator. The position of the character description frame of the form is registered in the OCR reading device.

【0010】不適正位置に記述された帳票1には、参照
マークが付され、この参照マークをOCR読み取り制御
部2により読み取りを行う。参照マーク検出部3は予め
付された参照マークを検出する。
A reference mark is attached to the form 1 described in the improper position, and this reference mark is read by the OCR reading control unit 2. The reference mark detection unit 3 detects a reference mark attached in advance.

【0011】読み取り位置補正部4によりこのように検
出した参照マークと、予め登録されている記述枠位置と
を比較して補正状態を決定する。このように決定された
補正状態を踏まえて、文字認識部5により手書き文字の
認識が行われる。
The reading position correction unit 4 compares the reference mark detected in this way with the preliminarily registered description frame position to determine the correction state. Based on the correction state determined in this way, the character recognition unit 5 recognizes the handwritten character.

【0012】このような操作においては、目視により記
述位置の適または不適を判断し、もし不適であることが
判明した場合には追加参照マークを付加する必要があっ
た。認識率を向上させるためには、点検をより正確に行
う必要があり、労力および時間の点で不利は免れなかっ
た。また参照マークが読み取り上悪影響を及ぼすことが
あり、問題視されていた。
In such an operation, it is necessary to visually judge whether the description position is suitable or not, and to add an additional reference mark if it is found to be inappropriate. In order to improve the recognition rate, it was necessary to perform the inspection more accurately, and there was an inevitable disadvantage in terms of labor and time. In addition, the reference mark may adversely affect reading, which has been regarded as a problem.

【0013】[0013]

【発明が解決しようとする課題】本発明は、従来技術の
欠点を解消し、自動的に文字の記述位置を検索し、この
検索結果によって文字認識率を向上せしめることができ
るOCR読み取り位置補正制御装置を提供することを課
題とする。
SUMMARY OF THE INVENTION The present invention solves the drawbacks of the prior art, automatically searches the description position of a character, and can improve the character recognition rate based on the search result, which is an OCR reading position correction control. An object is to provide a device.

【0014】[0014]

【課題を解決するための手段】図1は、本発明にかかる
OCR読み取り位置補正制御方式の原理構成を示すブロ
ック図であり、参照符号11は手書き帳票であり、認識
すべき文字数字等が記述されている。
FIG. 1 is a block diagram showing a principle configuration of an OCR reading position correction control system according to the present invention, in which reference numeral 11 is a handwritten form and character numbers to be recognized are described. Has been done.

【0015】参照符号12はOCR読み取り制御部であ
り、手書き帳票11の記述内容を所定手順にしたがって
読み出す。参照符号13は、読み取り位置検索部であ
り、記述文字の最小行位置および最小桁位置を基準とし
て読み取り位置の検索を行うものである。
Reference numeral 12 is an OCR reading control unit, which reads the description content of the handwritten form 11 according to a predetermined procedure. Reference numeral 13 is a reading position search unit, which searches for a reading position based on the minimum line position and minimum digit position of the descriptive character.

【0016】参照符号14は、読み取り位置補正部であ
り、予め装置内に登録されている位置情報と実際に記述
された文字を検索した情報とから、必要な読み取り位置
補正を行うものである。
Reference numeral 14 is a reading position correction unit, which performs necessary reading position correction based on position information registered in advance in the apparatus and information obtained by searching for characters actually described.

【0017】参照符号15は文字認識部であり、先に得
られた読み取り位置補正用情報に基づいて必要な補正を
加えつつ、文字の認識を行うものである。その結果、高
い認識率で文字の認識が行われる。
Reference numeral 15 is a character recognition unit, which recognizes characters while making necessary corrections based on previously obtained reading position correction information. As a result, characters are recognized with a high recognition rate.

【0018】[0018]

【作用】本発明にかかるOCR読み取り位置補正制御装
置によれば、文字認識に先立って記述文字の行桁の検索
が行われる。この検索結果を基礎として必要な補正を加
えながら文字の認識が行われる。その結果、余分な労力
を要せずに、高い認識率で手書き文字の認識が行われ
る。
According to the OCR reading position correction control device of the present invention, the line digit of the descriptive character is searched prior to character recognition. The characters are recognized while making necessary corrections based on the search results. As a result, the handwritten character can be recognized with a high recognition rate without extra labor.

【0019】その結果、多大の時間および労力を費やし
ていた読み取り前の予備作業が不要となり、省力化が達
成される。
As a result, the preparatory work before reading, which takes a lot of time and labor, becomes unnecessary, and labor saving is achieved.

【0020】[0020]

【実施例】図2は、図1における構成の各部の機能を開
示するものであり、同一要素には同一参照符号を付して
両図間の関連を明らかにしている。図の手書き帳票11
には、「カナガワ」、「フジサワ」の手書き文字列が記
述されているものとする。上段の文字列「カナガワ」は
記述枠内に記述されているが、文字列「フジサワ」は一
部が記述枠から外れている。このまま読み取りを行う
と、記述枠内のみで認識されるため、「フシナノ」のよ
うな不適正読み取り結果となる。
FIG. 2 discloses the function of each part of the configuration in FIG. 1, and the same elements are designated by the same reference numerals to clarify the relationship between the two figures. Handwritten form 11 of figure
It is assumed that the handwritten character strings of "Kanagawa" and "Fujisawa" are described in. The upper character string "Kanagawa" is described in the description frame, but the character string "Fujisawa" is partly outside the description frame. If it is read as it is, it will be recognized only in the description frame, and an incorrect reading result like "Fusinano" will result.

【0021】OCR読み取り制御部12による読み取り
を行うに際し、帳票様式のRが登録されている。その登
録帳票様式に手書き帳票11の文字パターンが重畳され
たパターン16が得られる。
When the OCR reading control unit 12 performs the reading, R of the form format is registered. A pattern 16 in which the character pattern of the handwritten form 11 is superimposed on the registered form is obtained.

【0022】このように文字パターンが重畳された状態
を基礎として、読み取り位置検索部13は文字記述位置
の検索を行う。パターン17の先頭行および先頭桁を基
準として、読み取り位置補正部14により補正を行う。
その結果、パターン18のように、文字列「カナガワ」
はもとより、文字列「フジサワ」も読み取り枠内に位置
するように補正されている。
On the basis of the state in which the character patterns are superposed in this way, the reading position searching unit 13 searches for the character description position. The reading position correction unit 14 performs correction based on the first row and first digit of the pattern 17.
As a result, like the pattern 18, the character string "Kanagawa"
Of course, the character string "Fujisawa" is also corrected so as to be located within the reading frame.

【0023】このように補正されたパターン18を文字
認識部15により認識することにより、参照符号18の
ように期待通りの文字列「カナガワ」、「フジサワ」が
認識される。
By recognizing the pattern 18 corrected in this way by the character recognition unit 15, the expected character strings “Kanagawa” and “Fujisawa” are recognized as indicated by reference numeral 18.

【0024】図3は、読み取り位置検索部の動作概念を
示すものである。手書き帳票11から文字パターンを読
み取り、これを行桁位置判定枠20に重畳させる。この
際の文字パターンおよび行桁位置判定枠はいずれも電子
的データであるが、可視的に図示したものである。
FIG. 3 shows the operation concept of the reading position searching section. A character pattern is read from the handwritten form 11 and is superimposed on the line digit position determination frame 20. Although the character pattern and the line digit position determination frame at this time are both electronic data, they are visually illustrated.

【0025】行桁判定枠20に文字パターンが重畳され
ると、行桁位置判定枠20における文字パターン列の最
小行位置および最小桁位置を検出するように構成されて
いる。したがって、この最小行および最小桁が予め保有
している登録データの記述枠内に収まるように、文字パ
ターン列に電子的補正を加えればよい。
When the character pattern is superimposed on the line digit judgment frame 20, the minimum row position and the minimum digit position of the character pattern string in the line digit position judgment frame 20 are detected. Therefore, electronic correction may be added to the character pattern string so that the minimum row and the minimum digit fit within the description frame of the registered data that is held in advance.

【0026】その結果、図2のパターン18のように、
文字パターンが読み取り可能枠内に入りこみ、容易に文
字列の認識が可能となる。
As a result, as shown in the pattern 18 of FIG.
The character pattern enters the readable frame, and the character string can be easily recognized.

【0027】[0027]

【発明の効果】本発明によれば、筆記者の癖や帳票用紙
の不備等に起因する文字列の不適正な手書き文字を、自
動的にかつ高い認識率で光学的に読み取り、電子情報化
することが可能となる。操作者が予め点検する労力およ
び時間が節減され、事務能率の向上が達成される。
According to the present invention, an inappropriate handwritten character of a character string caused by a writer's habit, a defective form sheet, or the like is optically read automatically and with a high recognition rate, and converted into electronic information. It becomes possible to do. The labor and time for the operator to check in advance are saved, and the improvement of office efficiency is achieved.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明にかかるOCR読み取り位置補正制御装
置の基本原理を示すブロック図である。
FIG. 1 is a block diagram showing the basic principle of an OCR reading position correction control device according to the present invention.

【図2】本発明にかかるOCR読み取り位置補正制御装
置の一実施例の動作を示す説明図である。
FIG. 2 is an explanatory diagram showing an operation of an embodiment of the OCR reading position correction control device according to the present invention.

【図3】本発明にかかるOCR読み取り位置補正制御装
置の読み取り位置検索の概念説明図である。
FIG. 3 is a conceptual explanatory diagram of reading position retrieval of the OCR reading position correction control device according to the present invention.

【図4】従来技術にかかるOCR読み取り位置補正制御
装置の構成を示すブロック図である。
FIG. 4 is a block diagram showing a configuration of an OCR reading position correction control device according to a conventional technique.

【符号の説明】[Explanation of symbols]

11 手書き帳票 12 OCR読み取り制御部 13 読み取り位置検索部 14 読み取り位置補正部 15 文字認識部 20 行桁位置判定枠 11 handwritten form 12 OCR reading control unit 13 reading position search unit 14 reading position correction unit 15 character recognition unit 20 line digit position judgment frame

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 手書き文字を認識する制御装置のOCR
読み取り位置補正制御装置において、光学文字読み取り
装置により手書き文字を認識するOCR読み取り制御部
(12)と、手書き文字の状態を検索する読み取り位置検索
部(13)と、該読み取り位置検索部(13)によって読み出さ
れた文字の状態と読み取り位置の登録情報とを比較して
所要補正を行う読み取り位置補正部(14)と、該読み取り
位置補正制御部(14)により補正された認識データを文字
として判断するための文字認識部(15)とを有することを
特徴とする、OCR読み取り位置補正制御装置。
1. An OCR of a control device for recognizing handwritten characters
In the reading position correction control device, an OCR reading control unit for recognizing handwritten characters by the optical character reading device
(12), a reading position search unit (13) for searching the state of handwritten characters, and a necessary correction by comparing the state of the character read by the reading position search unit (13) with the registration information of the reading position. OCR reading, which comprises a reading position correction unit (14) for performing the above, and a character recognition unit (15) for judging the recognition data corrected by the reading position correction control unit (14) as a character. Position correction control device.
【請求項2】 前記読み取り位置検索部(13)が、予め登
録された行桁位置判定枠と読み出された文字パターンと
の重畳によって読み取り位置の検索を行う、請求項1記
載のOCR読み取り位置補正制御装置。
2. The OCR reading position according to claim 1, wherein the reading position searching unit (13) searches the reading position by superimposing a previously registered line digit position determination frame and a read character pattern. Correction control device.
JP3241134A 1991-09-20 1991-09-20 OCR reading position correction controller Pending JPH0644405A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3241134A JPH0644405A (en) 1991-09-20 1991-09-20 OCR reading position correction controller

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3241134A JPH0644405A (en) 1991-09-20 1991-09-20 OCR reading position correction controller

Publications (1)

Publication Number Publication Date
JPH0644405A true JPH0644405A (en) 1994-02-18

Family

ID=17069789

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3241134A Pending JPH0644405A (en) 1991-09-20 1991-09-20 OCR reading position correction controller

Country Status (1)

Country Link
JP (1) JPH0644405A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9679217B2 (en) 2014-08-26 2017-06-13 Kabushiki Kaisha Toshiba Information processing apparatus, information processing system, information processing method and storage medium
US9819860B2 (en) 2015-03-09 2017-11-14 Kabushiki Kaisha Toshiba Data processor, data processing method and storage medium
US10121086B2 (en) 2015-07-14 2018-11-06 Kabushiki Kaisha Toshiba Information processing apparatus and information processing method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9679217B2 (en) 2014-08-26 2017-06-13 Kabushiki Kaisha Toshiba Information processing apparatus, information processing system, information processing method and storage medium
US9819860B2 (en) 2015-03-09 2017-11-14 Kabushiki Kaisha Toshiba Data processor, data processing method and storage medium
US10121086B2 (en) 2015-07-14 2018-11-06 Kabushiki Kaisha Toshiba Information processing apparatus and information processing method

Similar Documents

Publication Publication Date Title
US20020146170A1 (en) Determining form identification through the spatial relationship of input data
US7920742B2 (en) Image processing apparatus, program and recording medium for document registration
JPH09231291A (en) Form reading method and apparatus
JPH0644405A (en) OCR reading position correction controller
JPH09237312A (en) Optical character reader
JPH07249099A (en) Form identification device
JPH09259222A (en) Format recognition device and character reader
JPH0528302A (en) Character reader
JPH06215206A (en) Mark sheet
JP4009314B2 (en) Form layout identification method and form layout identification system
JP2002024743A (en) Image reading system and image reading method
JP2000210624A (en) Postal address recognition device
JPH03282895A (en) Optical character reader
JP3356819B2 (en) Mark recognition device
JP2003260844A (en) Printing paper determination apparatus, method and printed matter
JP2001326774A (en) Form reading device, form reading method, and storage medium
JP2924356B2 (en) Optical character reader
JP3006294B2 (en) Optical character reader
JP2925270B2 (en) Character reader
JPH08123872A (en) Optical character reader
JPH0477295A (en) Method and apparatus for inspecting gathering
JPH04205076A (en) character recognition device
JPH08221520A (en) Character reader
JPH07306911A (en) Ocr reading result correcting device
JPH1159345A (en) Safety check certificate reading device in vehicle data processing system

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000830