JP2824372B2 - Report recognition device - Google Patents
Report recognition deviceInfo
- Publication number
- JP2824372B2 JP2824372B2 JP4350617A JP35061792A JP2824372B2 JP 2824372 B2 JP2824372 B2 JP 2824372B2 JP 4350617 A JP4350617 A JP 4350617A JP 35061792 A JP35061792 A JP 35061792A JP 2824372 B2 JP2824372 B2 JP 2824372B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- recognition
- cut
- reading direction
- recognition target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【0001】[0001]
【産業上の利用分野】本発明は、イメージスキャナによ
って読取られたイメージデータやファクシミリ装置によ
り伝送されたイメージデータから、所定の箇所に記入さ
れた文字・記号・マーク等の認識対象を切り出し、認識
処理して必要な情報をコンピュータに入力するために使
用される帳票及びその認識装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention cuts out a recognition target such as a character, a symbol, or a mark written in a predetermined portion from image data read by an image scanner or image data transmitted by a facsimile machine. The present invention relates to a form used for processing and inputting necessary information to a computer, and a recognition device for the form.
【0002】[0002]
【従来の技術】従来から、コンピュータに必要なデータ
を入力するための装置としてOCR(光学式文字読取装
置)が知られている。OCRでは、帳票の所定位置に記
入された文字・記号・マーク等の認識対象を、文字認識
処理や位置検出処理によって認識し、コンピュータに入
力し得る所定のデータに変換する。また、最近では、帳
票を直接OCRに入力する他に、ファクシミリ装置等を
使用して遠隔場所から伝送された帳票のイメージデータ
から認識対象を切り出して認識処理するシステムも使用
されるようになってきた。2. Description of the Related Art Conventionally, an OCR (optical character reader) has been known as a device for inputting necessary data to a computer. In OCR, a recognition target such as a character, a symbol, or a mark written in a predetermined position of a form is recognized by character recognition processing or position detection processing, and is converted into predetermined data that can be input to a computer. In recent years, in addition to directly inputting a form to an OCR, a system that uses a facsimile apparatus or the like to cut out a recognition target from image data of a form transmitted from a remote place and perform a recognition process has been used. Was.
【0003】ところで、ファクシミリ装置を使用したO
CRシステムでは、ファクシミリ装置の一般的特性によ
り、伝送された帳票イメージに縦横方向のずれ、傾き及
び歪み等が存在する。このため、従来は図10に示すよ
うに、帳票1の各読取行2の両側に基準マーク3を設
け、伝送されたイメージデータ4中の各基準マーク3の
座標を検出することにより、帳票1の位置ずれを補正し
て、読取行の位置を正しく検出することがなされている
(例えば特開平3-189783号)。[0003] By the way, O using a facsimile machine
In a CR system, a transmitted form image has vertical and horizontal displacements, inclinations, distortions, and the like due to general characteristics of the facsimile machine. Therefore, conventionally, as shown in FIG. 10, fiducial marks 3 are provided on both sides of each read line 2 of the form 1 and the coordinates of each fiducial mark 3 in the transmitted image data 4 are detected. The position of the read line is correctly detected by correcting the positional deviation (for example, JP-A-3-189783).
【0004】[0004]
【発明が解決しようとする課題】しかしながら、上述し
た従来の帳票読取システムでは、帳票をファクシミリ装
置にセットする際の帳票の挿入方向が予定された方向と
異なった場合に、認識対象の位置が正しく検出できない
という問題点がある。特にOCRの普及が進み、取り扱
う帳票の数が増したり、ファクシミリ装置を利用する帳
票送信者が不特定多数となると、予め決められた向きで
帳票が送られてこないケースが益々増大することが予想
される。また、OCR装置で直接帳票を読み取るシステ
ムでも、帳票の取り扱い数が増すと同様の問題が発生す
る。However, in the above-described conventional form reading system, when the form is inserted in a facsimile apparatus and the insertion direction of the form is different from the expected direction, the position of the recognition target is correctly set. There is a problem that it cannot be detected. In particular, as the spread of OCR advances and the number of forms to be handled increases, and the number of form senders using facsimile machines becomes unspecified, the number of cases where forms are not sent in a predetermined direction is expected to increase more and more. Is done. Further, even in a system in which a form is directly read by an OCR device, the same problem occurs when the number of handled forms increases.
【0005】本発明はこのような問題点を解決するため
になされたもので、帳票の読取方向がまちまちであって
も、認識対象を常に正しく切り出すことができ、正しい
認識処理を実行することができる帳票及びその認識装置
を提供することを目的とする。また、本発明の他の目的
は、帳票中の認識対象の位置をリアルタイムで検出して
高速に認識処理を実行することが可能な帳票及びその認
識装置を提供することにある。The present invention has been made in order to solve such a problem, and it is possible to always correctly cut out a recognition target even if the form is read in different directions, and to execute a correct recognition process. It is an object of the present invention to provide a form and a recognition device thereof. Another object of the present invention is to provide a form capable of detecting a position of a recognition target in a form in real time and executing a recognition process at a high speed, and a recognition device therefor.
【0006】[0006]
【0007】[0007]
【0008】[0008]
【課題を解決するための手段】本発明に係る帳票の読取
装置は、帳票をラスタ走査によって読取って得られたイ
メージデータから前記帳票の四隅に設けられた少なくと
も読取り方向を識別できる基準マークのうち前記帳票の
先行して走査される辺の近傍に配置された基準マークの
みを検出して少なくとも前記帳票の読取り方向を識別す
る基準マーク検出手段と、前記帳票のイメージデータか
ら識別された帳票の読取り方向の情報に基づいて前記帳
票のイメージデータから認識対象のイメージデータを切
り出す切出処理手段と、この切出処理手段で切り出され
た前記認識対象のイメージデータから前記認識対象を認
識する認識処理部とを具備し、前記切出処理手段が、前
記帳票のイメージデータを一旦記憶することなく前記帳
票のイメージデータから前記認識対象のイメージデータ
を切り出すものであることを特徴とする。According to the present invention, there is provided a form reading apparatus comprising: a reference mark provided at each of four corners of a form which can identify at least a reading direction from image data obtained by reading the form by raster scanning; Fiducial mark detecting means for detecting only a fiducial mark arranged near a side to be scanned earlier of the form to identify at least a reading direction of the form, and reading a form identified from image data of the form Cut-out processing means for cutting out image data to be recognized from the image data of the form based on direction information, and a recognition processing unit for recognizing the recognition target from the image data to be recognized cut out by the cut-out processing means Wherein the cut-out processing means is
Without storing the image data of the ledger,
From the image data of the vote, the image data of the recognition target
It is characterized by cutting out .
【0009】[0009]
【0010】[0010]
【作用】本発明の帳票によれば、四隅に少なくとも読取
方向を識別できる基準マークを設けているので、この基
準マークに基づいて帳票の向きを検出することができ、
認識対象の位置を正しく切り出すことができる。According to the form of the present invention, since reference marks at least at the four corners for identifying the reading direction are provided, the orientation of the form can be detected based on the reference marks.
The position of the recognition target can be cut out correctly.
【0011】特に、上記帳票の各辺の近傍に位置する2
つの基準マークの組合せパターンが他のいずれの辺の近
傍に位置する2つの基準マークの組合せパターンとは異
なるパターンである場合には、ラスタ走査によって得ら
れるイメージデータから、先行する2つの基準マークを
検出するだけで帳票の読取方向を識別することができ
る。このため、帳票の上端部のイメージデータのみで帳
票の向きが分かり、リアルタイムで認識対象の位置を正
しく識別することができ、認識対象を高速に切り出すこ
とが可能になる。In particular, 2 which is located near each side of the form
If the combination pattern of one reference mark is different from the combination pattern of the two reference marks located near any of the other sides, the preceding two reference marks are extracted from the image data obtained by raster scanning. It is possible to identify the form reading direction only by detecting. For this reason, the orientation of the form can be known only from the image data at the upper end of the form, the position of the recognition target can be correctly identified in real time, and the recognition target can be cut out at high speed.
【0012】また、本発明に係る帳票の読取装置によれ
ば、基準マーク検出手段が前記帳票のイメージデータか
ら基準マークを検出して帳票の読取方向を識別し、切出
処理手段が上記帳票の読取方向の情報に基づいて、帳票
の認識対象を切り出すので、帳票の読取方向、即ち帳票
の向きに拘らず常に正しく認識対象の位置を識別するこ
とができる。Further, according to the form reading apparatus of the present invention, the reference mark detecting means detects the reference mark from the image data of the form and identifies the reading direction of the form, and the cut-out processing means performs the processing of the form. Since the form recognition target is cut out based on the reading direction information, the position of the form recognition target can always be correctly identified regardless of the form reading direction, that is, the form orientation.
【0013】この場合も、上記と同様に帳票の四隅に設
けられた基準マークのうちの先行して入力される2つの
基準マークによって帳票の読取方向を検出することによ
り、入力されるイメージデータからリアルタイムで認識
対象のイメージデータを切り出すことが可能になる。し
たがって、イメージデータの切出処理を高速に行えると
共に、イメージデータ全体を一旦貯えるメモリも不要に
なる。In this case, similarly to the above, the form reading direction is detected by the two previously inputted fiducial marks among the fiducial marks provided at the four corners of the form, so that the input image data is detected. It becomes possible to cut out image data to be recognized in real time. Therefore, the image data can be cut out at high speed, and a memory for temporarily storing the entire image data is not required.
【0014】[0014]
【実施例】以下、添付の図面を参照して本発明の実施例
について説明する。図1は本発明の一実施例に係るOC
R用の帳票を示す図である。帳票11は、四隅に基準マ
ーク12,13,14,15が設けられると共に、これ
ら基準マーク12〜15に対する所定位置に文字、記
号、マーク等の認識対象16を配置したものである。基
準マーク12〜15は、帳票11が傾いて読取られた場
合でも常に一定の幅が検出される例えば黒丸で形成され
ており、基準マーク12〜15のうち、上辺の近傍に位
置する基準マーク12,13は、下辺の近傍に位置する
基準マーク14,15よりも大径となっている。Embodiments of the present invention will be described below with reference to the accompanying drawings. FIG. 1 shows an OC according to an embodiment of the present invention.
It is a figure showing the report for R. The form 11 is provided with fiducial marks 12, 13, 14, and 15 at four corners, and a recognition target 16 such as a character, a symbol, or a mark is arranged at a predetermined position with respect to the fiducial marks 12 to 15. The reference marks 12 to 15 are formed of, for example, black circles whose constant width is always detected even when the form 11 is read with inclination, and among the reference marks 12 to 15, the reference mark 12 located near the upper side is used. , 13 have a larger diameter than the reference marks 14 and 15 located near the lower side.
【0015】このような帳票11を例えばファクシミリ
装置で伝送する際、図中d1 ,d2,d3 ,d4 の4つ
の読取方向でそれぞれ帳票11が読み取られることが予
想される。この場合、先行して伝送される2つの基準マ
ークと読取方向d1 〜d4 との関係は、下記表1のよう
になる。When such a form 11 is transmitted by, for example, a facsimile machine, it is expected that the form 11 will be read in four reading directions d1, d2, d3 and d4 in the figure. In this case, the relationship between the two reference marks transmitted in advance and the reading directions d1 to d4 is as shown in Table 1 below.
【0016】[0016]
【表1】 [Table 1]
【0017】したがって、先行して伝送される2つの基
準マーク12〜15の大小関係を調べることにより、イ
メージデータのうちの比較的初期のデータによって帳票
11の向きを識別することができる。Therefore, by examining the magnitude relationship between the two reference marks 12 to 15 transmitted in advance, the orientation of the form 11 can be identified by relatively early data of the image data.
【0018】図2は、このような帳票11の読取装置の
構成を示す機能ブロック図である。イメージスキャナで
読取られた帳票11のイメージデータD、又はファクシ
ミリ装置を介して伝送された帳票11のイメージデータ
Dは、まず基準マーク検出部21に入力される。基準マ
ーク検出部21は、イメージデータから上述した基準マ
ーク12〜15のうちの先行する2つの基準マークを検
出し、その2つの基準マークの組合せパターンから帳票
11の読取方向di を識別すると共に、2つの基準マー
クの座標から帳票11の位置ずれX1 ,X2 、回転角θ
及び伸縮率Sを検出する。これらの検出情報はイメージ
データDと共に切出処理部22に供給される。切出処理
部22では、検出情報に基づいてイメージデータDから
認識対象16のイメージデータDa を切り出す。切り出
された認識対象16のイメージデータDa は、認識処理
部23に供給されて認識され、認識対象16が文字・記
号の場合は、そのコード情報Dc に変換され、認識対象
16が位置に情報を持つマークの場合には、マークの位
置情報に変換される。FIG. 2 is a functional block diagram showing a configuration of such a form 11 reading device. The image data D of the form 11 read by the image scanner or the image data D of the form 11 transmitted via the facsimile machine is first input to the reference mark detection unit 21. The fiducial mark detecting unit 21 detects two preceding fiducial marks among the fiducial marks 12 to 15 described above from the image data, identifies a reading direction di of the form 11 from a combination pattern of the two fiducial marks, From the coordinates of the two fiducial marks, the positional deviation X1, X2 of the form 11 and the rotation angle θ
And the expansion / contraction ratio S are detected. These pieces of detection information are supplied to the cutout processing unit 22 together with the image data D. The cutout processing section 22 cuts out the image data Da of the recognition target 16 from the image data D based on the detection information. The cut-out image data Da of the recognition target 16 is supplied to the recognition processing unit 23 and recognized. When the recognition target 16 is a character or a symbol, the image data Da is converted into its code information Dc, and the recognition target 16 stores the information in the position. In the case of a possessed mark, it is converted into mark position information.
【0019】図3は、基準マーク検出部21の機能ブロ
ック図である。イメージデータDは、まず右上領域基準
マーク検出部31及び左上領域基準マーク検出部32に
供給される。これらの検出部31,32では、例えば所
定のマスク処理によって右上1/4及び左上1/4のイ
メージデータを切り出して基準マークのパターンを検出
する。検出された基準マークは、大小判別部33,34
にそれぞれ供給されて大小判別される。なお、基準マー
クの大小判別には、伸縮率Sも関係してくるので、伸縮
率Sを大小判別に使用するようにしてもよい。この大小
関係の情報が原稿方向検出部35に与えられ、読取方向
di が識別される。また、検出された基準マークの情報
は、それぞれ座標検出部36,37に供給され、右上と
左上の基準マークの中心座標が求められる。FIG. 3 is a functional block diagram of the reference mark detecting section 21. The image data D is first supplied to the upper right area reference mark detection unit 31 and the upper left area reference mark detection unit 32. The detection units 31 and 32 cut out the image data of the upper right quarter and the upper left quarter by, for example, a predetermined mask process to detect the reference mark pattern. The detected reference marks are sent to the size discriminating units 33 and 34.
Is supplied to each of them to determine the size. Note that the expansion / contraction ratio S is also involved in the size determination of the reference mark, so the expansion / contraction ratio S may be used for the size determination. The information of the magnitude relation is given to the document direction detection unit 35, and the reading direction di is identified. Information on the detected fiducial marks is supplied to the coordinate detectors 36 and 37, respectively, and the center coordinates of the upper right and upper left fiducial marks are obtained.
【0020】いま、図4に示すように、帳票11上での
座標系における任意の点の座標を(x,y)、イメージ
データD上での座標系における任意の点の座標を[X,
Y]とし、帳票11の4つの基準マーク12〜15の座
標をそれぞれ(0,0)、(x1 ,0)、(0,y1
)、(x1 ,y1 )、イメージデータD上の原点を
[0,0]、左上の基準マークのイメージデータD上の
座標を[X1 ,Y1 ]、右上の基準マークのイメージデ
ータD上の座標を[X2 ,Y2 ]とすると、帳票11の
位置ずれは、X1 ,Y1 であり、回転角θ及び伸縮率S
は、下記数1により求められる。As shown in FIG. 4, the coordinates of an arbitrary point in the coordinate system on the form 11 are (x, y), and the coordinates of an arbitrary point in the coordinate system on the image data D are [X,
Y], and the coordinates of the four reference marks 12 to 15 of the form 11 are (0, 0), (x1, 0), (0, y1), respectively.
), (X1, y1), the origin on the image data D is [0, 0], the coordinates of the upper left reference mark on the image data D are [X1, Y1], and the upper right reference mark on the image data D. Is [X2, Y2], the displacement of the form 11 is X1, Y1, the rotation angle θ and the expansion / contraction ratio S
Is determined by the following equation (1).
【0021】[0021]
【数1】 θ= tan-1[(Y1 −Y2 )/(X2 −X1 )] [読取方向d1 ,d3 の場合] S=√[(X1 −X2 )2 +(Y1 −Y2 )2 ]/x1 [読取方向d2 ,d4 の場合] S=√[(X1 −X2 )2 +(Y1 −Y2 )2 ]/y1[Number 1] θ = tan-1 [(Y1 -Y2) / (X2 -X1)] [ For reading direction d1, d3] S = √ [ (X1 -X2) 2 + (Y1 -Y2) 2] / x1 [for reading direction d2, d4] S = √ [ (X1 -X2) 2 + (Y1 -Y2) 2] / y1
【0022】以上の演算によって回転角θと伸縮率Sと
を算出するのが回転角度・伸縮検出部38である。The rotation angle θ and expansion / contraction ratio S are calculated by the above-mentioned operation by the rotation angle / expansion detection unit 38.
【0023】ここで、図5に示すように、帳票11の読
取方向がそれぞれd1 ,d2 ,d3,d4 である場合の
イメージデータD上の座標[X,Y]は、それぞれ下記
数2のように表される。As shown in FIG. 5, when the reading direction of the form 11 is d1, d2, d3, d4, the coordinates [X, Y] on the image data D are expressed by the following equation (2). Is represented by
【0024】[0024]
【数2】 (1)読取方向d1 X=S・x/ cosθ+(Y−Y1 ) tanθ+X1 Y=S・y/ cosθ−(X−X1 ) tanθ+Y1 (2)読取方向d2 X=S・y/ cosθ+(Y−Y1 ) tanθ+X1 Y=S・(x1 −x)/ cosθ−(X−X1 ) tanθ+
Y1 (3)読取方向d3 X=S・(x1 −x)/ cosθ+(Y−Y1 ) tanθ+
X1 Y=S・(y1 −y)/ cosθ−(X−X1 ) tanθ+
Y1 (4)読取方向d4 X=S・(y1 −y)/ cosθ+(Y−Y1 ) tanθ+
X1 Y=S・x/ cosθ−(X−X1 ) tanθ+Y1(1) Reading direction d1 X = Sx / cosθ + (Y−Y1) tanθ + X1 Y = Sy / cosθ− (X−X1) tanθ + Y1 (2) Reading direction d2 X = Sy / cosθ + (Y−Y1) tan θ + X1 Y = S · (x1−x) / cos θ− (X−X1) tanθ +
Y1 (3) Reading direction d3 X = S ・ (x1−x) / cos θ + (Y−Y1) tan θ +
X1 Y = S ・ (y1−y) / cos θ− (X−X1) tan θ +
Y1 (4) reading direction d4 X = S ・ (y1−y) / cos θ + (Y−Y1) tan θ +
X1 Y = S ・ x / cos θ- (X-X1) tan θ + Y1
【0025】したがって、イメージデータD上の座標
[X,Y]は、帳票11上では、下記数3のように求め
られる。Therefore, the coordinates [X, Y] on the image data D are obtained on the form 11 as shown in the following Expression 3.
【0026】[0026]
【数3】 (1)読取方向d1 x=[(X−X1 ) cosθ−(Y−Y1 ) sinθ]/S y=[(Y−Y1 ) cosθ+(X−X1 ) sinθ]/S (2)読取方向d2 x=x1 −[(Y−Y1 ) cosθ+(X−X1 ) sin
θ]/S y=[(X−X1 ) cosθ−(Y−Y1 ) sinθ]/S (3)読取方向d3 x=x1 −[(X−X1 ) cosθ−(Y−Y1 ) sin
θ]/S y=y1 −[(Y−Y1 ) cosθ+(X−X1 ) sin
θ]/S (4)読取方向d4 x=[(Y−Y1 ) cosθ+(X−X1 ) sinθ]/S y=y1 −[(X−X1 ) cosθ−(Y−Y1 ) sin
θ]/S(1) Reading direction d1 x = [(XX1) cosθ- (YY1) sinθ] / Sy = [(Y−Y1) cosθ + (XX1) sinθ] / S (2) Reading direction d2 x = x1 − [(Y−Y1) cos θ + (X−X1) sin
θ] / Sy = [(X−X1) cos θ− (Y−Y1) sin θ] / S (3) Reading direction d3 x = x1 − [(X−X1) cosθ− (Y−Y1) sin
θ] / S y = y 1 − [(Y−Y 1) cos θ + (X−X 1) sin
θ] / S (4) Reading direction d4 x = [(Y−Y1) cos θ + (X−X1) sin θ] / Sy = y1 − [(X−X1) cos θ− (Y−Y1) sin
θ] / S
【0027】これらのことから明らかなことは、 (1)先行する2つの基準マークの座標[X1 ,Y1
],[X2 ,Y2 ]が分かった時点で、帳票11上の
任意の座標(x,y)は、イメージデータD上の座標
[X,Y]に変換できる。 (2)イメージデータD上の座標[X,Y]は、先行す
る2つの基準マークの座標[X1 ,Y1 ],[X2 ,Y
2 ]が分かった時点で、帳票11上の座標(x,y)に
変換できる。 という点である。From these facts, it is clear that: (1) the coordinates [X1, Y1 of the two preceding fiducial marks;
], [X2, Y2], the arbitrary coordinates (x, y) on the form 11 can be converted to the coordinates [X, Y] on the image data D. (2) The coordinates [X, Y] on the image data D are the coordinates [X1, Y1], [X2, Y] of the two preceding reference marks.
2] can be converted to the coordinates (x, y) on the form 11 when [2] is known. That is the point.
【0028】以上の2点に基づき、切出し処理部22で
認識対象の切り出し処理がリアルタイムで実行される。
切出し処理部22は、例えば図6に示すように構成され
ている。切出し領域検出部41は、帳票11上の認識対
象の領域を、検出情報di ,θ,S,X1 ,Y1 に基づ
いて、イメージデータD上における座標軸で表される切
出し領域情報に置き換える。具体的には、図7の斜線で
示す認識対象の領域17を[X,Y]座標系に変換した
情報を生成し記憶する。一方、イメージデータDに同期
したクロック信号CKがアドレスカウンタ42に入力さ
れており、ラスタスキャンによって順次入力されるイメ
ージデータDに同期してそのデータの座標[X,Y]が
生成される。この座標[X,Y]は切出し領域検出部4
1に供給されている。切出し領域検出部41は、座標
[X,Y]が記憶された切出し領域内であるかどうかを
判定し、領域内であれば、書込指令WEを座標変換部4
3及び切出し情報メモリ44に供給する。Based on the above two points, the cut-out processing section 22 executes the cut-out processing of the recognition target in real time.
The cutout processing unit 22 is configured, for example, as shown in FIG. The cutout area detection unit 41 replaces the area to be recognized on the form 11 with cutout area information represented by coordinate axes on the image data D based on the detection information di, θ, S, X1, and Y1. More specifically, information is generated by converting the region 17 to be recognized indicated by oblique lines in FIG. 7 into an [X, Y] coordinate system and stored. On the other hand, the clock signal CK synchronized with the image data D is input to the address counter 42, and the coordinates [X, Y] of the data are generated in synchronization with the image data D sequentially input by the raster scan. The coordinates [X, Y] are determined by the cut-out area detection unit 4.
1 is supplied. The cut-out area detecting unit 41 determines whether or not the coordinates [X, Y] are within the stored cut-out area.
3 and the cut-out information memory 44.
【0029】また、アドレスカウンタ42からの座標
[X,Y]は、座標変換部43にも供給されている。座
標変換部43は、切出し領域検出部41から書込指令W
Eが与えられたら、イメージデータD上の座標[X,
Y]を検出情報di ,θ,S,X1 ,Y1 に基づいて帳
票11上の座標(x,y)に変換する。そして、図7に
示した認識対象の領域17の帳票原点からのオフセット
分xo ,yo を変換座標(x,y)から差し引いて、こ
れを切出し情報メモリ44にアドレスADとして供給す
る。切出し情報メモリ44は、与えられたアドレスにイ
メージデータDを格納する。これを順次繰り返していく
と、図8に示すように、切出し領域のラスタスキャンが
終了した時点で切出し情報メモリ44には認識対象の領
域のイメージデータDが正規の位置及び大きさで格納さ
れることになる。以後、認識処理部23では、帳票11
の読取方向、回転角、位置ずれ及び伸縮度に全く影響さ
れない規格化されたデータの認識を行なうことができ
る。The coordinates [X, Y] from the address counter 42 are also supplied to a coordinate conversion unit 43. The coordinate conversion unit 43 receives the write command W from the cutout area detection unit 41.
When E is given, the coordinates [X,
Y] is converted into coordinates (x, y) on the form 11 based on the detection information di, θ, S, X1, Y1. Then, the offset xo, yo from the form origin of the recognition target area 17 shown in FIG. 7 is subtracted from the transformed coordinates (x, y), and this is supplied to the cutout information memory 44 as the address AD. The extraction information memory 44 stores the image data D at a given address. When this is sequentially repeated, as shown in FIG. 8, when the raster scan of the cutout area is completed, the image data D of the area to be recognized is stored in the cutout information memory 44 at a regular position and size. Will be. Thereafter, in the recognition processing unit 23, the form 11
, Standardized data that is completely unaffected by the reading direction, the rotation angle, the displacement, and the degree of expansion / contraction can be recognized.
【0030】このように、本実施例の装置によれば、ラ
スタスキャンによって順次入力されるイメージデータを
リアルタイムで処理することができるので、全てのイメ
ージデータを切出し処理が完了するまで装置内に蓄えて
おく必要がなく、メモリ容量を節減できると共に、高速
処理が可能になる。As described above, according to the apparatus of this embodiment, image data sequentially input by raster scanning can be processed in real time, and all image data are stored in the apparatus until the cut-out processing is completed. It is not necessary to save the memory capacity, and the memory capacity can be saved and high-speed processing can be performed.
【0031】なお、上記実施例では、基準マークとして
大丸と小丸を使用したが、基準マークの形態は、例えば
図9に示すように、(a)矩形状の基準マーク51、
(b)全ての径が異なる丸型の基準マーク52、(c)
丸と二重丸を用いた基準マーク53等、種々の形態をと
ることができる。これらの基準マーク51〜53は、い
ずれも、先行する2つの基準マークのみで帳票11の読
取方向を識別できる。In the above embodiment, the large and small circles are used as the reference marks. However, the form of the reference marks is, for example, as shown in FIG.
(B) A round reference mark 52 having all different diameters, (c)
Various forms such as a reference mark 53 using a circle and a double circle can be used. In each of these reference marks 51 to 53, the reading direction of the form 11 can be identified only by the preceding two reference marks.
【0032】[0032]
【発明の効果】以上述べたように、本発明によれば、帳
票の四隅に少なくとも読取方向を識別できる基準マーク
を設け、この基準マークに基づいて帳票の向きを検出す
ることができるので、帳票の読取方向がまちまちであっ
ても、認識対象を常に正しく切り出すことができ、正し
い認識処理を実行することが可能になる。As described above, according to the present invention, at least four reference marks which can identify the reading direction are provided at the four corners of a form, and the orientation of the form can be detected based on the reference marks. Even if the reading directions are different, the recognition target can always be cut out correctly, and correct recognition processing can be executed.
【図1】 本発明の実施例に係る帳票を示す図である。FIG. 1 is a diagram showing a form according to an embodiment of the present invention.
【図2】 同帳票を認識処理する認識装置の機能ブロッ
ク図である。FIG. 2 is a functional block diagram of a recognition device that recognizes the form;
【図3】 同装置における基準マーク検出部の機能ブロ
ック図である。FIG. 3 is a functional block diagram of a reference mark detection unit in the device.
【図4】 同装置における基準マーク検出処理を説明す
るための図である。FIG. 4 is a diagram for explaining a reference mark detection process in the apparatus.
【図5】 同装置における座標変換処理を説明するため
の図である。FIG. 5 is a diagram for explaining a coordinate conversion process in the device.
【図6】 同装置における切出し処理部の機能ブロック
図である。FIG. 6 is a functional block diagram of a cut-out processing unit in the same device.
【図7】 同装置における切出し処理を説明するための
図である。FIG. 7 is a diagram for explaining a cut-out process in the apparatus.
【図8】 同装置における切出し処理を説明するための
図である。FIG. 8 is a diagram for explaining a cutout process in the same device.
【図9】 同装置における切出し処理を説明するための
図である。FIG. 9 is a diagram for explaining a cut-out process in the same device.
【図10】 従来の帳票の位置ずれ補正方法を説明する
ための図である。FIG. 10 is a diagram for explaining a conventional form displacement correction method.
【符号の説明】 1,11…帳票、3,12〜15,51〜53…基準マ
ーク、4,D…イメージデータ、16…認識対象、21
…基準マーク検出部、22…切出し処理部、23…認識
処理部、31…右上領域基準マーク検出部、32…左上
領域基準マーク検出部、33,34…大小判別部、35
…原稿方向検出部、36,37…座標検出部、38…回
転角度・伸縮検出部、41…切出し領域検出部、42…
アドレスカウンタ、43…座標変換部、44…切出し情
報メモリ。[Description of Signs] 1,11: Form, 3, 12 to 15, 51 to 53: Reference mark, 4, D: Image data, 16: Recognition target, 21
... Reference mark detector, 22... Cut-out processor, 23... Recognition processor, 31... Upper right area reference mark detector, 32.
... Document direction detectors, 36 and 37 coordinate detectors, 38 rotation angle / expansion detectors, 41 cutout area detectors, 42.
Address counter, 43: coordinate conversion unit, 44: cut-out information memory.
Claims (1)
れたイメージデータから前記帳票の四隅に設けられた少
なくとも読取り方向を識別できる基準マークのうち前記
帳票の先行して走査される辺の近傍に配置された基準マ
ークのみを検出して少なくとも前記帳票の読取り方向を
識別する基準マーク検出手段と、 前記帳票のイメージデータから識別された帳票の読取り
方向の情報に基づいて前記帳票のイメージデータから認
識対象のイメージデータを切り出す切出処理手段と、 この切出処理手段で切り出された前記認識対象のイメー
ジデータから前記認識対象を認識する認識処理部とを具
備し、前記切出処理手段は、前記帳票のイメージデータを一旦
記憶することなく前記帳票のイメージデータから前記認
識対象のイメージデータを切り出すものである ことを特
徴とする帳票の認識装置。1. A reference mark provided at each of four corners of a form, which can be identified at least in a reading direction from image data obtained by reading the form by raster scanning, and is arranged near a previously scanned side of the form. Reference mark detecting means for detecting at least the reference mark identified and identifying at least the reading direction of the form; and a recognition target from the image data of the form based on information on the reading direction of the form identified from the image data of the form. And a recognition processing unit for recognizing the recognition target from the image data of the recognition target cut out by the extraction processing means, wherein the cut-out processing means includes: Image data
The recognition from the image data of the form without storing
A form recognition apparatus for extracting image data to be recognized.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4350617A JP2824372B2 (en) | 1992-12-04 | 1992-12-04 | Report recognition device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4350617A JP2824372B2 (en) | 1992-12-04 | 1992-12-04 | Report recognition device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH06176192A JPH06176192A (en) | 1994-06-24 |
| JP2824372B2 true JP2824372B2 (en) | 1998-11-11 |
Family
ID=18411688
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4350617A Expired - Fee Related JP2824372B2 (en) | 1992-12-04 | 1992-12-04 | Report recognition device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2824372B2 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7298902B2 (en) | 2004-01-20 | 2007-11-20 | Educational Testing Service | Method and system for performing image mark recognition |
| JP4798296B1 (en) * | 2010-04-15 | 2011-10-19 | パナソニック株式会社 | Form |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5667483A (en) * | 1979-11-08 | 1981-06-06 | Toshiba Corp | Detection system for original supply direction |
| JPS63237184A (en) * | 1987-03-25 | 1988-10-03 | Matsushita Electric Ind Co Ltd | Character recognition method |
-
1992
- 1992-12-04 JP JP4350617A patent/JP2824372B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH06176192A (en) | 1994-06-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR20010085741A (en) | Pen type input device with camera | |
| JP4419269B2 (en) | Two-dimensional code extraction method | |
| EP0241259A2 (en) | Optical character recognition by detecting geographical features | |
| JP4594952B2 (en) | Character recognition device and character recognition method | |
| JP2824372B2 (en) | Report recognition device | |
| JP2014026592A (en) | Character recognition device | |
| JP4329226B2 (en) | Reference mark detection method, reference mark detection device, and optical character reader | |
| JPH11250179A (en) | Character reocognition device and its method | |
| JP2000339407A (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
| JPS63158676A (en) | Area extracting device | |
| JP7310151B2 (en) | Mark selection device and image processing device | |
| JPH0557632B2 (en) | ||
| JPH0228785A (en) | optical character reader | |
| JP2000331116A (en) | Form, form identification device and form identification method | |
| JP2001155139A (en) | Storage medium for pen-type input device with camera | |
| JPH0473192B2 (en) | ||
| JP2004013188A (en) | Business form reading device, business form reading method and program therefor | |
| JPH10124610A (en) | Optical character reading device | |
| JPH11120260A (en) | Form image processing method and apparatus, and storage medium storing form image processing program | |
| JPH11161739A (en) | Character recognizing device | |
| JPH1055407A (en) | Correcting method for logical coordinate and table processor | |
| JPH01197890A (en) | Slanted character recognition method | |
| JPH0459669B2 (en) | ||
| JPH0473193B2 (en) | ||
| JPH11224307A (en) | Document recognition apparatus and method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080904 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090904 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100904 Year of fee payment: 12 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100904 Year of fee payment: 12 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110904 Year of fee payment: 13 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120904 Year of fee payment: 14 |
|
| LAPS | Cancellation because of no payment of annual fees |