JP6531738B2 - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP6531738B2 JP6531738B2 JP2016155938A JP2016155938A JP6531738B2 JP 6531738 B2 JP6531738 B2 JP 6531738B2 JP 2016155938 A JP2016155938 A JP 2016155938A JP 2016155938 A JP2016155938 A JP 2016155938A JP 6531738 B2 JP6531738 B2 JP 6531738B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- ocr
- detection range
- image
- ocr processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/235—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/421—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation by analysing segments intersecting the pattern
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Editing Of Facsimile Originals (AREA)
Description
図6は、変形例1にかかる画像形成装置のOCR処理動作の流れを示すフローチャートである。図4に示したフローチャートと同様の処理については、同符号を付して説明を略する。
変形例2にかかる画像処理装置では、OCR処理部106が、文字の一部分以外の他の部分が存在していると想定される方向に検出範囲を予め定められた長さ分広げ、当該予め定められた長さ分広げた検出範囲において再度OCR処理を実行する。そして、当該OCR処理で線画像が示す文字を特定できなかった場合、OCR処理部106は、文字の一部分以外の他の部分が存在していると想定される方向に検出範囲を予め定められた長さ分更に広げてOCR処理を実行する。
変形例3にかかる画像処理装置では、OCR処理部106が、広げた検出範囲においてOCR処理を再度実行した場合において線画像が示す文字を特定できなかったときに、広げる前の検出範囲においてOCR処理を実行する。
変形例4にかかる画像処理装置では、OCR処理部106が、広げた検出範囲においてOCR処理を再度実行した場合において線画像が示す文字を特定できなかったときに、当該広げた検出範囲を予め定められた長さ分狭め、当該狭めた検出範囲においてOCR処理を実行する。そして、当該OCR処理で線画像が示す文字を特定できなかった場合、OCR処理部106は、検出範囲を予め定められた長さ分更に狭めてOCR処理を実行する。
上記の実施形態および変形例では、マーカーペンを用いたマーキングによりOCR処理を施す検出範囲を指定する場合を説明したが、本発明は必ずしもこの場合に限定されない。補足1にかかる画像形成装置では、OCR処理を施す検出範囲が予め定められている。図8(A)は、画像形成装置10による処理対象となる原稿の一例を示す図である。原稿a2には、文字記入欄hlおよびh2が設けられており、当該文字記入欄h1およびh2の内部がOCR処理を施す検出範囲として予め定められている。原稿a2の文字記入欄h1およびh2には、ユーザーが手書きにより文字を記入する。このため、誤って文字記入欄h1およびh2の枠に重なるように文字が記入される場合がある。図8(A)に示す例では、「海」といった文字が文字記入欄h2の枠に重なっている。
上記の実施形態および変形例では、ひらがなおよび漢字で示された文字に対してOCR処理を行う場合を説明したが、本発明は必ずしもこの場合に限定されない。以下では、アルファベットの文字に対して、上記の実施形態および変形例で示した画像処理装置を適用する場合を説明する。
100 制御ユニット
101 制御部
102 動作制御部
103 操作受付部
104 通信制御部
105 マーカー検出部
106 OCR処理部
110 画像読取部
160 記憶部
Claims (9)
- 画像データの指定された範囲を検出範囲として、当該検出範囲に含まれる線画像を検出するとともに、当該検出された線画像を解析して、当該線画像が示す文字を特定するOCR処理を実行するOCR処理部を備え、
前記OCR処理部は、前記OCR処理において前記線画像が示す文字を特定できなかった場合に、前記線画像が文字の一部分を示しているか否かを判定し、前記線画像が文字の一部分を示していると判定した時に、当該文字の一部分以外の他の部分が存在していると想定される方向に前記検出範囲を広げ、当該広げた検出範囲において再度前記OCR処理を実行する、画像処理装置。 - 前記OCR処理部は、前記検出範囲内に前記線画像が示す文字を特定することができた第1の範囲が存在する場合、当該第1の範囲に含まれる文字の並びに沿った方向を、前記文字の一部分以外の他の部分が存在していると想定される方向として決定して前記検出範囲を広げる、請求項1に記載の画像処理装置。
- 複数の文字を構成する線分の軌跡および位置関係を示す文字データベースを記憶した記憶部を更に備え、
前記OCR処理部は、(i)前記文字データベースに含まれる各文字に対して、前記線分の軌跡および位置関係から算出される前記線画像との類似度を算出し、(ii)当該算出された類似度が予め定められた第1の値以上である文字を、前記線画像が示す文字として特定し、(iii)当該算出された類似度が前記第1の値未満であり、かつ、前記第1の値より小さい予め定められた第2の値以上である文字を、前記線画像が一部分を示している文字として特定する、請求項1または請求項2に記載の画像処理装置。 - 漢字を構成する偏、旁、冠、脚、構、垂、または繞を含む部首を構成する線分の軌跡および位置関係を示す部首データベースを記憶した記憶部を更に備え、
前記OCR処理部は、前記部首データベースに含まれる各部首に対して、前記線分の軌跡および位置関係から算出される前記線画像との類似度を算出し、当該算出された類似度が予め定められた第3の値以上である部首を、前記線画像が示す部首として特定するとともに、前記線画像が文字の一部分を示していると判定する、請求項1に記載の画像処理装置。 - 前記OCR処理部は、前記線画像が示す部首を特定した場合、当該特定した部首が偏、旁、冠、脚、構、垂、または繞の何れであるかに基づいて、前記文字の他の部分が存在していると想定される方向を決定して前記検出範囲を広げる、請求項4に記載の画像処理装置。
- 前記OCR処理部は、前記文字の一部分以外の他の部分が存在していると想定される方向に前記検出範囲を予め定められた長さ分広げ、当該予め定められた長さ分広げた検出範囲において再度前記OCR処理を実行し、当該OCR処理で前記線画像が示す文字を特定できなかった場合、前記文字の一部分以外の他の部分が存在していると想定される方向に前記検出範囲を予め定められた長さ分更に広げて前記OCR処理を実行する、請求項1乃至請求項5の何れか1項に記載の画像処理装置。
- 前記OCR処理部は、前記広げた検出範囲において前記OCR処理を再度実行した場合において前記線画像が示す文字を特定できなかったときに、広げる前の検出範囲において前記OCR処理を実行する、請求項1乃至請求項5の何れか1項に記載の画像処理装置。
- 前記OCR処理部は、前記広げた検出範囲において前記OCR処理を再度実行した場合において前記線画像が示す文字を特定できなかったときに、当該広げた検出範囲を予め定められた長さ分狭め、当該狭めた検出範囲において前記OCR処理を実行し、当該OCR処理で前記線画像が示す文字を特定できなかった場合、前記検出範囲を予め定められた長さ分更に狭めて前記OCR処理を実行する、請求項1乃至請求項5の何れか1項に記載の画像処理装置。
- 前記画像データに示されるマーカー箇所を検出するマーカー検出部を更に備え、
前記OCR処理部は、前記マーカー検出部が検出したマーカー箇所により示される範囲を前記検出範囲として特定する、請求項1乃至請求項8の何れか1項に記載の画像処理装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016155938A JP6531738B2 (ja) | 2016-08-08 | 2016-08-08 | 画像処理装置 |
| US15/661,394 US10503993B2 (en) | 2016-08-08 | 2017-07-27 | Image processing apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016155938A JP6531738B2 (ja) | 2016-08-08 | 2016-08-08 | 画像処理装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018025885A JP2018025885A (ja) | 2018-02-15 |
| JP6531738B2 true JP6531738B2 (ja) | 2019-06-19 |
Family
ID=61069308
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016155938A Expired - Fee Related JP6531738B2 (ja) | 2016-08-08 | 2016-08-08 | 画像処理装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US10503993B2 (ja) |
| JP (1) | JP6531738B2 (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2571530B (en) * | 2018-02-28 | 2020-09-23 | Canon Europa Nv | An image processing method and an image processing system |
| US11972197B2 (en) | 2018-08-27 | 2024-04-30 | Kyocera Document Solutions Inc. | OCR system |
| CN110032994B (zh) * | 2019-06-10 | 2019-09-20 | 上海肇观电子科技有限公司 | 文字检测方法、阅读辅助设备、电路及介质 |
| KR102774753B1 (ko) | 2019-06-10 | 2025-03-04 | 넥스트브이피유 (상하이) 코포레이트 리미티드 | 텍스트 검출 방법, 판독 지원 디바이스 및 매체 |
| JP7467928B2 (ja) * | 2020-01-20 | 2024-04-16 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Family Cites Families (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4105998A (en) * | 1976-03-30 | 1978-08-08 | Fujitsu Limited | Pattern recognition processing system |
| JPH06187485A (ja) * | 1992-12-17 | 1994-07-08 | Ricoh Co Ltd | 画像比較装置 |
| JP3504054B2 (ja) * | 1995-07-17 | 2004-03-08 | 株式会社東芝 | 文書処理装置および文書処理方法 |
| EP1818857B1 (en) * | 1995-07-31 | 2010-06-23 | Fujitsu Limited | Document processor and document processing method |
| SG71018A1 (en) * | 1997-03-01 | 2000-03-21 | Inst Of Systems Science Nat Un | Robust identification code recognition system |
| JP2004166062A (ja) | 2002-11-14 | 2004-06-10 | Hitachi Ltd | 書類読取装置 |
| ATE356389T1 (de) * | 2003-08-20 | 2007-03-15 | Oce Tech Bv | Dokumentenscanner |
| JP2006338578A (ja) * | 2005-06-06 | 2006-12-14 | Mitsubishi Electric Corp | 文字認識装置 |
| JP5712487B2 (ja) * | 2009-09-04 | 2015-05-07 | 株式会社リコー | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
| JP2011228792A (ja) * | 2010-04-15 | 2011-11-10 | Murata Mach Ltd | 画像処理装置 |
| JP5280425B2 (ja) * | 2010-11-12 | 2013-09-04 | シャープ株式会社 | 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体 |
| JP5717691B2 (ja) * | 2012-05-28 | 2015-05-13 | 株式会社東芝 | 手書き文字検索装置、方法及びプログラム |
| US9171204B2 (en) * | 2012-12-12 | 2015-10-27 | Qualcomm Incorporated | Method of perspective correction for devanagari text |
| US9317764B2 (en) * | 2012-12-13 | 2016-04-19 | Qualcomm Incorporated | Text image quality based feedback for improving OCR |
| US9213907B2 (en) * | 2013-06-28 | 2015-12-15 | Google Inc. | Hierarchical classification in credit card data extraction |
| JP6463066B2 (ja) * | 2014-07-07 | 2019-01-30 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
| JP6119689B2 (ja) * | 2014-07-11 | 2017-04-26 | コニカミノルタ株式会社 | 電子文書生成システム、電子文書生成装置およびプログラム |
| JP2016181057A (ja) * | 2015-03-23 | 2016-10-13 | 株式会社東芝 | 画像処理装置、画像処理方法及び画像処理プログラム |
| US10474923B2 (en) * | 2016-06-27 | 2019-11-12 | Facebook, Inc. | Systems and methods for incremental character recognition to recognize characters in images |
| US10579868B2 (en) * | 2017-03-30 | 2020-03-03 | Myscript | System and method for recognition of objects from ink elements |
-
2016
- 2016-08-08 JP JP2016155938A patent/JP6531738B2/ja not_active Expired - Fee Related
-
2017
- 2017-07-27 US US15/661,394 patent/US10503993B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2018025885A (ja) | 2018-02-15 |
| US10503993B2 (en) | 2019-12-10 |
| US20180039847A1 (en) | 2018-02-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6531738B2 (ja) | 画像処理装置 | |
| JP6878034B2 (ja) | 情報処理装置、制御方法、およびプログラム | |
| US8340426B2 (en) | Apparatus and method for recognizing characters | |
| US20200026766A1 (en) | Method for translating characters and apparatus therefor | |
| US8225200B2 (en) | Extracting a character string from a document and partitioning the character string into words by inserting space characters where appropriate | |
| US20090226090A1 (en) | Information processing system, information processing apparatus, information processing method, and storage medium | |
| JP5372110B2 (ja) | 情報出力装置、情報出力方法、及びコンピュータプログラム | |
| US20100158375A1 (en) | Signal processing apparatus, signal processing method, computer-readable medium and computer data signal | |
| JP2018055255A (ja) | 情報処理装置、情報処理方法及びプログラム | |
| JP2021043775A (ja) | 情報処理装置及びプログラム | |
| CN118053165A (zh) | 证件类型识别模板的生成方法、证件识别方法及装置 | |
| US20190318190A1 (en) | Information processing apparatus, and non-transitory computer readable medium | |
| US10706581B2 (en) | Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor | |
| US10984277B2 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
| JP7302175B2 (ja) | 情報処理装置、及び情報処理プログラム | |
| CN108062301A (zh) | 文字翻译方法及其装置 | |
| JP6700705B2 (ja) | 振り分けシステム、情報処理方法、及びプログラム | |
| JP2010267083A (ja) | 帳票検索装置、帳票検索プログラムおよび帳票検索方法 | |
| JP6655331B2 (ja) | 電子機器及び方法 | |
| JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
| JP6194781B2 (ja) | 画像処理装置及びプログラム | |
| JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
| JP4697387B2 (ja) | 原稿画像判定装置、原稿画像判定方法及びそのプログラム | |
| US9047535B2 (en) | Image processing apparatus, image processing method, and computer readable medium | |
| US20210271808A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180627 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190409 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190423 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190506 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6531738 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |