[go: up one dir, main page]

JP7739555B2 - Information processing device, control method thereof, and application - Google Patents

Information processing device, control method thereof, and application

Info

Publication number
JP7739555B2
JP7739555B2 JP2024139873A JP2024139873A JP7739555B2 JP 7739555 B2 JP7739555 B2 JP 7739555B2 JP 2024139873 A JP2024139873 A JP 2024139873A JP 2024139873 A JP2024139873 A JP 2024139873A JP 7739555 B2 JP7739555 B2 JP 7739555B2
Authority
JP
Japan
Prior art keywords
area
image
user
file name
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2024139873A
Other languages
Japanese (ja)
Other versions
JP2024161570A5 (en
JP2024161570A (en
Inventor
健太 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2023018221A external-priority patent/JP7358663B2/en
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2024139873A priority Critical patent/JP7739555B2/en
Publication of JP2024161570A publication Critical patent/JP2024161570A/en
Publication of JP2024161570A5 publication Critical patent/JP2024161570A5/en
Application granted granted Critical
Publication of JP7739555B2 publication Critical patent/JP7739555B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Facsimiles In General (AREA)

Description

本発明は、文字を表示する技術に関する。 The present invention relates to a technique for displaying characters.

従来、タッチパネルで入力した文字列の削除には専用の削除ボタンが設けられることが多かった。しかし、一般的な削除ボタンの場合は、一文字ずつしか削除できないことから、例えば自動入力された長すぎるファイル名を短くしたいと考えたユーザは、所望のファイル名にするために繰り返し削除ボタンを操作する必要があった。また、誤って文字列を入力してしまった場合も、ユーザはその都度、削除ボタンにまで指を移動させて操作しなければならなかった。この点、特許文献1には、予測変換で間違って文字列が入力された際に、削除ボタン1回の操作によって変換前の状態まで戻すことで、ボタン操作の繰り返しを不要にする技術が開示されている。また、特許文献2には、タッチ操作を誤って意図しない文字が入力されてしまった際に、同じ文字をタッチしてスライドする操作に応答して、本来入力したかった周囲の文字に置き換える技術が開示されている。 Conventionally, a dedicated delete button has often been provided for deleting character strings entered on a touch panel. However, because typical delete buttons can only delete one character at a time, a user who, for example, wanted to shorten an automatically entered filename that was too long had to repeatedly press the delete button to create the desired filename. Furthermore, if a user accidentally entered a character string, they had to move their finger to the delete button and operate it each time. In this regard, Patent Document 1 discloses a technology that, when an incorrect character string is entered using predictive conversion, returns the text to its pre-conversion state with a single operation of the delete button, eliminating the need for repeated button operations. Furthermore, Patent Document 2 discloses a technology that, when an unintended character is accidentally entered through a touch operation, replaces it with the surrounding characters that were originally intended by touching and sliding the same character.

特開2016-186717号公報Japanese Patent Application Laid-Open No. 2016-186717 特開2012-243229号公報JP 2012-243229 A

上記特許文献1及び特許文献2には、コンピュータを、画像を表示する第1領域と、前記画像についての情報が表示される第2領域と、を含むUI画面を表示するように制御する制御手段と、保存手段、として機能させるためのアプリケーションであって、前記制御手段は、前記第1領域に含まれる前記画像内の所望の領域が選択されるための、前記画像上でのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御し、前記保存手段は、選択された前記領域を示す情報を、ファイル名の生成に用いるために保存し、前記制御手段は、前記領域の前記選択を解除するための、前記画像上でのユーザからの指示を受け付けると、選択された前記領域に対応する前記文字を前記第2領域から削除するように制御することが可能であることを特徴とするアプリケーションは開示されていなかった The above Patent Documents 1 and 2 did not disclose an application that functions as a control means for controlling a computer to display a UI screen including a first area for displaying an image and a second area for displaying information about the image, and a storage means, wherein the control means, upon receiving an instruction from a user on the image to select a desired area within the image included in the first area, controls the second area to display characters corresponding to the area, the storage means stores information indicating the selected area for use in generating a file name, and, upon receiving an instruction from a user on the image to deselect the area, the control means is capable of controlling the second area to delete the characters corresponding to the selected area.

本発明は、上記課題に対応するべくなされたものである。 The present invention was made to address the above issues.

本開示に係るアプリケーションは、コンピュータを、画像を表示する第1領域と、前記画像についての情報が表示される第2領域と、を含むUI画面を表示するように制御する制御手段と、保存手段、として機能させるためのアプリケーションであって、前記制御手段は、前記第1領域に含まれる前記画像内の所望の領域が選択されるための、前記画像上でのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御し、前記保存手段は、選択された前記領域を示す情報を、ファイル名の生成に用いるために保存し、前記制御手段は、前記領域の前記選択を解除するための、前記画像上でのユーザからの指示を受け付けると、選択された前記領域に対応する前記文字を前記第2領域から削除するように制御することが可能であり、前記領域を示す情報は、前記画像の後にスキャンされて得られる別の画像を含むファイルのファイル名の生成に用いられることを特徴とする。

The application of the present disclosure is an application for causing a computer to function as a control means for controlling the computer to display a UI screen including a first area for displaying an image and a second area for displaying information about the image, and a storage means, wherein the control means, upon receiving a user instruction on the image to select a desired area within the image included in the first area, controls the computer to display characters corresponding to the area in the second area, the storage means stores information indicating the selected area for use in generating a file name, and, upon receiving a user instruction on the image to deselect the area, the control means is capable of controlling the computer to delete the characters corresponding to the selected area from the second area , and the information indicating the area is used to generate a file name for a file including another image obtained by scanning after the image .

本開示の技術によれば、領域の選択を解除するための、画像上でのユーザからの指示を受け付けると、選択された前記領域に対応する文字を削除することができる According to the technology of the present disclosure, when an instruction from a user on an image to deselect an area is received, the characters corresponding to the selected area can be deleted .

画像処理システムの全体構成を示す図A diagram showing the overall configuration of an image processing system MFPのハードウェア構成を示すブロック図Block diagram showing the hardware configuration of an MFP MFP連携サーバ及びストレージサーバのハードウェア構成を示すブロック図A block diagram showing the hardware configuration of an MFP collaboration server and a storage server. 画像処理システムのソフトウェア構成を示すブロック図Block diagram showing the software configuration of the image processing system 画像処理システム全体の処理の流れを示すシーケンス図Sequence diagram showing the overall processing flow of the image processing system メイン画面の一例を示す図A diagram showing an example of the main screen ログイン画面の一例を示す図An example of a login screen スキャン設定画面の一例を示す図A diagram showing an example of a scan setting screen (a)はリクエストIDの一例を示す図、(b)及び(c)は処理状況の問合せに対するレスポンスの一例を示す図1A is a diagram showing an example of a request ID, and FIGS. 1B and 1C are diagrams showing examples of responses to an inquiry about a processing status. ファイル名設定画面の一例を示す図A diagram showing an example of a file name setting screen 学習リクエストの一例を示す図A diagram showing an example of a learning request MFPにおける処理の流れを示すフローチャートFlowchart showing the flow of processing in the MFP スキャン画像の一例を示す図A diagram showing an example of a scanned image ファイル名条件設定画面の一例を示す図A diagram showing an example of a file name condition setting screen 文字認識結果の一例を示す図A diagram showing an example of a character recognition result 類似帳票判定結果の一例を示す図A diagram showing an example of a similar document determination result スキャン画像の一例を示す図A diagram showing an example of a scanned image MFPでのファイル名設定処理の流れを示すフローチャートFlowchart showing the flow of file name setting processing in the MFP MFPでのファイル名設定処理の流れを示すフローチャートFlowchart showing the flow of file name setting processing in the MFP プレビュー領域の初期表示部分を示す図A diagram showing the initial display part of the preview area ファイル名設定画面の一例を示す図A diagram showing an example of a file name setting screen ソフトキーボードの一例を示す図A diagram showing an example of a soft keyboard 操作ガイダンスが表示されたファイル名設定画面の一例を示す図FIG. 10 is a diagram showing an example of a file name setting screen on which operation guidance is displayed. 文字領域に対してタッチ操作がなされたときのファイル名設定画面の一例を示す図FIG. 10 is a diagram showing an example of a file name setting screen when a touch operation is performed on a character area; 初期変倍率を調整した場合の、プレビュー領域の初期表示部分を示す図A diagram showing the initial display area of the preview area when the initial magnification is adjusted

以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。 The following describes embodiments of the present invention with reference to the accompanying drawings. Please note that the following embodiments do not limit the scope of the invention as claimed, and not all of the combinations of features described in the embodiments are necessarily essential to the solution of the invention.

[実施形態1]
<システム構成>
図1は、本実施形態に係る、画像処理システムの全体構成を示す図である。画像処理システムは、MFP(Multifunction Peripheral)110と、インターネット上でクラウドサービスを提供するサーバ装置120及び130とを含む。MFP110は、インターネットを介してサーバ装置120及び130と通信可能に接続されている。
[Embodiment 1]
<System Configuration>
1 is a diagram showing the overall configuration of an image processing system according to this embodiment. The image processing system includes an MFP (Multifunction Peripheral) 110 and server devices 120 and 130 that provide cloud services over the Internet. The MFP 110 is connected to the server devices 120 and 130 via the Internet so as to be able to communicate with them.

MFP110は、スキャン機能を有する情報処理装置の一例である。MFP110は、スキャン機能に加え印刷機能やBOX保存機能といった複数の機能を有する複合機である。サーバ装置120及び130は、共にクラウドサービスを提供する情報処理装置の一例である。本実施形態のサーバ装置120は、MFP110から受け取ったスキャン画像に対し画像解析を行ったり、別のサービスを提供するサーバ装置130に対しMFP110からのリクエストを転送したりするクラウドサービスを提供する。以下、サーバ装置120が提供するクラウドサービスを「MFP連携サービス」と呼ぶこととする。サーバ装置130は、インターネットを介して送られてきたファイルを保存したり、モバイル端末(不図示)などのウェブブラウザからの要求に応じて保存ファイルを提供したりするクラウドサービス(以下、「ストレージサービス」と呼ぶ)を提供する。本実施形態では、MFP連携サービスを提供するサーバ装置120を「MFP連携サーバ」と呼び、ストレージサービスを提供するサーバ装置130を「ストレージサーバ」と呼ぶこととする。 The MFP 110 is an example of an information processing device with a scanning function. The MFP 110 is a multifunction peripheral that has multiple functions, such as a printing function and a box storage function, in addition to the scanning function. The server devices 120 and 130 are both examples of information processing devices that provide cloud services. In this embodiment, the server device 120 provides a cloud service that performs image analysis on scanned images received from the MFP 110 and forwards requests from the MFP 110 to the server device 130 that provides another service. Hereinafter, the cloud service provided by the server device 120 will be referred to as an "MFP collaboration service." The server device 130 provides a cloud service (hereinafter referred to as a "storage service") that stores files sent via the Internet and provides saved files in response to requests from a web browser on a mobile device (not shown). In this embodiment, the server device 120 that provides the MFP collaboration service will be referred to as an "MFP collaboration server," and the server device 130 that provides the storage service will be referred to as a "storage server."

図1に示す画像処理システム100の構成は一例であって、これに限定されない。例えば、MFP連携サーバ120の機能をMFP110が兼ね備えていてもよい。また、MFP連携サーバ120はインターネット上ではなくLAN(Local Area Network)経由でMFP110と接続されていてもよい。また、ストレージサーバ130を、メール配信サービスを行うメールサーバに置き換えて、文書のスキャン画像をメールに添付し送信する場面に適用してもよい。 The configuration of image processing system 100 shown in FIG. 1 is an example and is not limited to this. For example, MFP 110 may also have the functions of MFP collaboration server 120. Furthermore, MFP collaboration server 120 may be connected to MFP 110 via a LAN (Local Area Network) rather than over the Internet. Furthermore, storage server 130 may be replaced with a mail server that provides mail distribution services, and the system may be used in situations where scanned images of documents are attached to mail and sent.

<MFPのハードウェア構成>
図2は、MFP110のハードウェア構成を示すブロック図である。MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222、モデム223で構成される。制御部210は、以下の各部211~219で構成され、MFP110全体の動作を制御する。CPU211は、ROM212に記憶された様々な制御プログラム(後述のソフトウェア構成図で示す各種機能に対応するプログラム)を読み出して実行する。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施例では1つのCPU211が1つのメモリ(RAM213またはHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、これに限定されない。例えば、複数のCPUや複数のRAMまたはHDDを協働させて各処理を実行してもよい。HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。操作部I/F215は、操作部220と制御部210とを接続するインタフェースである。操作部220には、タッチパネルやキーボードなどが備えられており、ユーザによる操作/入力/指示を受け付ける。なお、タッチパネルへのタッチ操作には、人の指による操作やタッチペンによる操作が含まれる。プリンタI/F216は、プリンタ部221と制御部210とを接続するインタフェースである。印刷用の画像データはプリンタI/F216を介して制御部210からプリンタ部221へ転送され、紙等の記録媒体上に印刷される。スキャナI/F217は、スキャナ部222と制御部210とを接続するインタフェースである。スキャナ部222は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿を光学的に読み取ってスキャン画像データを生成し、スキャナI/F217を介して制御部210に入力する。スキャナ部222で生成されたスキャン画像データは、プリンタ部221にて印刷したり(コピー出力)、HDD214に保存したり、LANを介してMFP連携サーバ120等の外部装置にファイル送信したりすることができる。モデムI/F218は、モデム223と制御部210とを接続するインタフェースである。モデム223は、PSTN上のファクシミリ装置(不図示)との間で画像データをファクシミリ通信する。ネットワークI/F219は、制御部210(MFP110)をLANに接続するインタフェースである。MFP110は、ネットワークI/F219を用いて、スキャン画像データをMFP連携サーバ120に送信したり、MFP連携サーバ120から各種データを受信したりする。以上説明したMFP110のハードウェア構成は一例であり、必要に応じてその他の構成を備えるものであってもよいし、一部の構成を有していなくてもよい。
<MFP hardware configuration>
FIG. 2 is a block diagram showing the hardware configuration of the MFP 110. The MFP 110 is composed of a control unit 210, an operation unit 220, a printer unit 221, a scanner unit 222, and a modem 223. The control unit 210 is composed of the following units 211 to 219 and controls the overall operation of the MFP 110. The CPU 211 reads and executes various control programs (programs corresponding to various functions shown in the software configuration diagram described below) stored in the ROM 212. The RAM 213 is used as the CPU 211's main memory, work area, and other temporary storage areas. Note that in this embodiment, one CPU 211 uses one memory (RAM 213 or HDD 214) to execute each process shown in the flowcharts described below, but this is not limiting. For example, multiple CPUs and multiple RAMs or HDDs may cooperate to execute each process. The HDD 214 is a large-capacity storage unit that stores image data and various programs. The operation unit I/F 215 is an interface connecting the operation unit 220 and the control unit 210. The operation unit 220 is equipped with a touch panel, a keyboard, and the like, and accepts operations, inputs, and instructions from a user. Note that touch operations on the touch panel include operations with a person's finger and operations with a touch pen. The printer I/F 216 is an interface connecting the printer unit 221 and the control unit 210. Image data to be printed is transferred from the control unit 210 to the printer unit 221 via the printer I/F 216 and printed on a recording medium such as paper. The scanner I/F 217 is an interface connecting the scanner unit 222 and the control unit 210. The scanner unit 222 optically reads an original document set on a document tray or an ADF (Auto Document Feeder), not shown, to generate scanned image data, which is input to the control unit 210 via the scanner I/F 217. The scanned image data generated by the scanner unit 222 can be printed (copied) by the printer unit 221, saved in the HDD 214, or sent as a file to an external device such as the MFP collaboration server 120 via the LAN. The modem I/F 218 is an interface that connects the modem 223 to the control unit 210. The modem 223 transmits image data via facsimile to a facsimile device (not shown) on the PSTN. The network I/F 219 is an interface that connects the control unit 210 (MFP 110) to the LAN. The MFP 110 uses the network I/F 219 to transmit scanned image data to the MFP collaboration server 120 and receive various data from the MFP collaboration server 120. The hardware configuration of the MFP 110 described above is an example, and other components may be included or some components may be omitted as needed.

<サーバ装置のハードウェア構成>
図3は、MFP連携サーバ120/ストレージサーバ130のハードウェア構成を示すブロック図である。MFP連携サーバ120とストレージサーバ130は共通のハードウェア構成を有し、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315で構成される。CPU311は、ROM312に記憶された制御プログラムを読み出して各種処理を実行することで、全体の動作を制御する。RAM313は、CPU311の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。ネットワークI/F315は、制御部310をインターネットに接続するインタフェースである。MFP連携サーバ120及びストレージサーバ130は、ネットワークI/F315を介して他の装置(MFP110など)から様々な処理のリクエストを受け、当該リクエストに応じた処理結果を返す。
<Hardware configuration of server device>
3 is a block diagram showing the hardware configuration of the MFP collaboration server 120/storage server 130. The MFP collaboration server 120 and storage server 130 share a common hardware configuration, including a CPU 311, a ROM 312, a RAM 313, a HDD 314, and a network I/F 315. The CPU 311 controls overall operation by reading control programs stored in the ROM 312 and executing various processes. The RAM 313 is used as a temporary storage area, such as the CPU 311's main memory and work area. The HDD 314 is a large-capacity storage unit that stores image data and various programs. The network I/F 315 is an interface that connects the control unit 310 to the Internet. The MFP collaboration server 120 and storage server 130 receive various processing requests from other devices (such as the MFP 110) via the network I/F 315 and return processing results corresponding to the requests.

<画像処理システムのソフトウェア構成>
図4は、本実施形態に係る、画像処理システム100のソフトウェア構成を示すブロック図である。以下、画像処理システム100を構成するMFP110及び、MFP連携サーバ120及びストレージサーバ130それぞれの役割に対応したソフトウェア構成を、順に説明する。なお、以下では、各装置が有する諸機能のうち、文書をスキャンしてファイル化し、ストレージサーバ130に保存を行うまでの処理に関わる機能に絞って説明を行うものとする。
<Image processing system software configuration>
4 is a block diagram showing the software configuration of image processing system 100 according to this embodiment. Below, the software configurations corresponding to the respective roles of MFP 110, MFP cooperation server 120, and storage server 130 constituting image processing system 100 will be described in order. Note that, of the various functions possessed by each device, the following description will focus on functions related to the process of scanning a document, creating a file, and saving the file on storage server 130.

≪MFPのソフトウェア構成≫
MFP110の機能モジュールは、ネイティブ機能モジュール410とアディショナル機能モジュール420の2つに大別される。ネイティブ機能モジュール410はMFP110に標準的に備えられたアプリケーションであるのに対し、アディショナル機能モジュール420はMFP110に追加的にインストールされたアプリケーションである。アディショナル機能モジュール420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他の追加アプリケーションがインストールされていてもよい。
<MFP software configuration>
The function modules of the MFP 110 are broadly divided into two: a native function module 410 and an additional function module 420. The native function module 410 is an application that is provided as standard in the MFP 110, whereas the additional function module 420 is an application that is additionally installed in the MFP 110. The additional function module 420 is an application based on Java (registered trademark), and makes it easy to add functions to the MFP 110. Note that other additional applications (not shown) may also be installed in the MFP 110.

ネイティブ機能モジュール410は、スキャン実行部411およびスキャン画像管理部412を有する。また、アディショナル機能モジュール420は、表示制御部421、スキャン制御部422、連携サービスリクエスト部423、画像処理部424を有する。 The native function module 410 has a scan execution unit 411 and a scan image management unit 412. The additional function module 420 has a display control unit 421, a scan control unit 422, a collaborative service request unit 423, and an image processing unit 424.

表示制御部421は、操作部220のタッチパネルに、各種のユーザ操作を受け付けるためのユーザインタフェース画面(UI画面)を表示する。各種のユーザ操作には、例えば、MFP連携サーバ120へアクセスするためのログイン認証情報の入力、スキャン設定、スキャンの開始指示、ファイル名設定、ファイルの保存指示などがある。 The display control unit 421 displays a user interface screen (UI screen) on the touch panel of the operation unit 220 to accept various user operations. Examples of various user operations include inputting login authentication information for accessing the MFP linkage server 120, scan settings, instructions to start scanning, file name settings, and instructions to save files.

スキャン制御部422は、UI画面でなされたユーザ操作(例えば「スキャン開始」ボタンの押下)に応じて、スキャン設定の情報と共にスキャン実行部411に対しスキャン処理の実行を指示する。スキャン実行部411は、スキャン制御部422からのスキャン処理の実行指示に従い、スキャナI/F217を介してスキャナ部240に文書の読み取り動作を実行させ、スキャン画像データを生成する。生成したスキャン画像データは、スキャン画像管理部412によってHDD214に保存される。この際、保存されたスキャン画像データを一意に示すスキャン画像識別子の情報が、スキャン制御部422へ通知される。スキャン画像識別子は、MFP110においてスキャンした画像をユニークに識別するための番号や記号、アルファベットなどである。スキャン制御部422は、例えばファイル化する対象のスキャン画像データを上記のスキャン画像識別子を使ってスキャン画像管理部412から取得する。そして、ファイル化のために必要な処理のリクエストをMFP連携サーバ120に対して行うよう、連携サービスリクエスト部423に対して指示する。 In response to a user operation performed on the UI screen (for example, pressing the "Start Scan" button), the scan control unit 422 instructs the scan execution unit 411 to execute a scan process along with scan setting information. In accordance with the scan process execution instruction from the scan control unit 422, the scan execution unit 411 causes the scanner unit 240 to read a document via the scanner I/F 217 and generates scanned image data. The generated scanned image data is saved in the HDD 214 by the scanned image management unit 412. At this time, information about a scanned image identifier that uniquely identifies the saved scanned image data is notified to the scan control unit 422. The scanned image identifier is a number, symbol, alphabet, or the like that uniquely identifies an image scanned by the MFP 110. The scan control unit 422 obtains, for example, scanned image data to be converted into a file from the scanned image management unit 412 using the scanned image identifier. Then, the scan control unit 422 instructs the collaboration service request unit 423 to request the MFP collaboration server 120 for the processing required for the file conversion.

連携サービスリクエスト部423は、MFP連携サーバ120に対して各種処理のリクエストを行ったり、そのレスポンスを受け取ったりする。各種処理には、例えば、ログイン認証、スキャン画像の解析、スキャン画像データの送信などが含まれる。MFP連携サーバ120とのやり取りはRESTやSOAPなどの通信プロトコルを使用される。 The collaboration service request unit 423 requests various processes from the MFP collaboration server 120 and receives their responses. These processes include, for example, login authentication, analysis of scanned images, and transmission of scanned image data. Communication protocols such as REST and SOAP are used for communication with the MFP collaboration server 120.

画像処理部424は、スキャン画像データに対し所定の画像処理を行って、表示制御部421が表示するUI画面で用いられる画像を生成する。所定の画像処理の詳細については後述する。 The image processing unit 424 performs predetermined image processing on the scanned image data to generate an image to be used on the UI screen displayed by the display control unit 421. Details of the predetermined image processing will be described later.

≪サーバ装置のソフトウェア構成≫
まず、MFP連携サーバ120のソフトウェア構成について説明する。MFP連携サーバ120は、リクエスト制御部431、画像処理部432、ストレージサーバアクセス部433、データ管理部434、表示制御部435を有する。リクエスト制御部431は、外部装置からのリクエストを受信できる状態で待機しており、受信したリクエスト内容に応じて、画像処理部432、ストレージサーバアクセス部433、データ管理部434に対し所定の処理の実行を指示する。画像処理部432は、MFP110から送られてくるスキャン画像データに対して、文字領域の検出処理、文字認識処理、類似文書の判定処理といった画像解析処理の他、回転や傾き補正といった画像加工処理を行う。ストレージサーバアクセス部433は、ストレージサーバ130に対する処理のリクエストを行う。クラウドサービスでは、RESTやSOAPなどのプロトコルを用いてストレージサーバにファイルを保存したり、保存したファイルを取得したりするための様々なインタフェースを公開している。ストレージサーバアクセス部433は、公開されたインタフェースを使用して、ストレージサーバ130に対するリクエストを行う。データ管理部434は、MFP連携サーバ120で管理するユーザ情報や各種設定データ等を保持・管理する。表示制御部435は、インターネット経由で接続されたPCやモバイル端末(いずれも不図示)上で動作しているウェブブラウザからのリクエストを受けて、画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザは、ウェブブラウザで表示される画面経由で、登録されているユーザ情報を確認したり、スキャン設定を変更したりできる。
<Server device software configuration>
First, the software configuration of the MFP collaboration server 120 will be described. The MFP collaboration server 120 includes a request control unit 431, an image processing unit 432, a storage server access unit 433, a data management unit 434, and a display control unit 435. The request control unit 431 waits to receive a request from an external device and instructs the image processing unit 432, the storage server access unit 433, and the data management unit 434 to execute predetermined processes according to the content of the received request. The image processing unit 432 performs image analysis processes, such as character region detection, character recognition, and similar document determination, as well as image processing processes, such as rotation and tilt correction, on scanned image data sent from the MFP 110. The storage server access unit 433 makes processing requests to the storage server 130. Cloud services expose various interfaces for saving files to storage servers and retrieving saved files using protocols such as REST and SOAP. The storage server access unit 433 makes requests to the storage server 130 using the exposed interfaces. The data management unit 434 holds and manages user information, various setting data, and the like managed by the MFP cooperation server 120. The display control unit 435 receives requests from a web browser running on a PC or mobile terminal (neither of which are shown) connected via the Internet, and returns screen configuration information (HTML, CSS, etc.) required for screen display. The user can check registered user information and change scan settings via the screen displayed in the web browser.

次に、ストレージサーバ130のソフトウェア構成について説明する。ストレージサーバ130は、リクエスト制御部441、ファイル管理部442、表示制御部443を有する。リクエスト制御部441は、外部装置からのリクエストを受信できる状態で待機しており、本実施形態においてはMFP連携サーバ120からのリクエストに応じて、受信したファイルの保存や保存ファイルの読み出しをファイル管理部442に指示する。そして、リクエストに応じたレスポンスをMFP連携サーバ120に返す。表示制御部443は、インターネット経由で接続されたPCやモバイル端末(いずれも不図示)上で動作しているウェブブラウザからのリクエストを受けて、画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザは、ウェブブラウザで表示される画面経由で、保存ファイルを確認したり取得したりすることができる。 Next, the software configuration of the storage server 130 will be described. The storage server 130 has a request control unit 441, a file management unit 442, and a display control unit 443. The request control unit 441 waits in a state where it can receive requests from external devices, and in this embodiment, instructs the file management unit 442 to save received files or read saved files in response to requests from the MFP-linked server 120. The request control unit 441 then returns a response in response to the request to the MFP-linked server 120. The display control unit 443 receives requests from a web browser running on a PC or mobile device (neither of which are shown) connected via the Internet, and returns screen configuration information (HTML, CSS, etc.) required for screen display. The user can view and obtain saved files via the screen displayed in the web browser.

<画像処理システム全体の処理の流れ>
図5は、MFP110で文書をスキャンし、得られたスキャン画像をファイル化してストレージサーバに保存する際の、装置間の処理の流れを示すシーケンス図である。図6はMFP110の起動時に表示されるメインメニューのUI画面(以下、「メイン画面」と表記)の一例を示す図である。文書をスキャンしてファイル化し、クラウドストレージサービスの利用に必要な専用のアプリケーションをMFP110にインストールすることで、メイン画面600上に「スキャンしてクラウドストレージに保存」ボタン601が表示されるようになる。そして、ユーザがメイン画面600内に表示されたメニューボタンの中から「スキャンしてクラウドストレージに保存」ボタン601を押下すると、図5のシーケンス図で示される一連の処理が開始する。以下、図5のシーケンス図に沿って、装置間のやり取りを時系列に説明する。なお、以下の説明において記号「S」はステップを表す。
<Processing flow of the entire image processing system>
FIG. 5 is a sequence diagram showing the flow of processing between devices when a document is scanned by the MFP 110, the resulting scanned image is converted into a file, and the file is saved on a storage server. FIG. 6 is a diagram showing an example of a main menu UI screen (hereinafter referred to as the "main screen") displayed when the MFP 110 is started. By scanning a document into a file and installing a dedicated application required for using a cloud storage service on the MFP 110, a "Scan and Save to Cloud Storage" button 601 appears on the main screen 600. When a user presses the "Scan and Save to Cloud Storage" button 601 from the menu buttons displayed on the main screen 600, the series of processes shown in the sequence diagram of FIG. 5 begins. Below, the interactions between devices are explained in chronological order according to the sequence diagram of FIG. 5. In the following explanation, the symbol "S" represents a step.

MFP110は、MFP連携サーバ120にアクセスするためのログイン認証の情報を入力するUI画面(以下、「ログイン画面」と表記)を操作部220に表示する(S501)。図7にログイン画面の一例を示す。ユーザが、予め登録されているユーザIDとパスワードを、ログイン画面700上の入力欄702及び703にそれぞれ入力し「ログイン」ボタン701を押下すると、ログイン認証のリクエストがMFP連携サーバ120に送信される(S502)。 The MFP 110 displays on the operation unit 220 a UI screen (hereinafter referred to as the "login screen") for entering login authentication information to access the MFP-linked server 120 (S501). An example of the login screen is shown in Figure 7. When a user enters a pre-registered user ID and password in input fields 702 and 703 on the login screen 700 and presses the "Login" button 701, a login authentication request is sent to the MFP-linked server 120 (S502).

ログイン認証のリクエストを受けたMFP連携サーバ120は、当該リクエストに含まれるユーザIDとパスワードを用いて認証処理を行う(S503)。認証処理の結果、正規のユーザであることが確認されれば、MFP連携サーバ120は、アクセストークンをMFP110に返す。以後、MFP110からMFP連携サーバ120に対して行う各種リクエストの際にこのアクセストークンを一緒に送ることで、ログイン中のユーザが特定される。本実施形態では、MFP連携サーバ120へのログインの完了によって、ストレージサーバ130へのログインも同時に完了するものとする。このためにユーザは、インターネット上のPC(不図示)のウェブブラウザ等を介して、MFP連携サービスを利用するためのユーザIDとストレージサービスを利用するためのユーザIDとの紐づけを予め行っておく。これにより、MFP連携サーバ120へのログイン認証に成功すれば同時にストレージサーバ130へのログイン認証も完了し、ストレージサーバ130にログインするための操作を省略できる。そして、MFP連携サーバ120においては、自装置にログインしたユーザからのストレージサービスに関するリクエストにも対応可能となる。なお、ログイン認証の方法は一般的に公知な手法(Basic認証、Digest認証、OAuthを用いた認可等)を用いて行えばよい。 Upon receiving the login authentication request, the MFP-linked server 120 performs authentication processing using the user ID and password included in the request (S503). If the authentication processing confirms that the user is a legitimate user, the MFP-linked server 120 returns an access token to the MFP 110. Subsequently, the MFP 110 sends this access token along with various requests to the MFP-linked server 120, thereby identifying the currently logged-in user. In this embodiment, completing login to the MFP-linked server 120 also simultaneously completes login to the storage server 130. To achieve this, the user associates in advance, via a web browser on a PC (not shown) on the Internet, the user ID for using the MFP-linked service with the user ID for using the storage service. As a result, if login authentication to the MFP-linked server 120 is successful, login authentication to the storage server 130 is also completed simultaneously, eliminating the need for the user to log in to the storage server 130. The MFP-linked server 120 can then also handle requests for storage services from users who have logged in to its own device. Login authentication can be performed using commonly known methods (Basic authentication, Digest authentication, authorization using OAuth, etc.).

ログインが完了すると、MFP110は、スキャン設定用のUI画面(以下、「スキャン設定画面」と表記)が操作部220に表示される(S507)。図8にスキャン設定画面の一例を示す。スキャン設定画面800には、「スキャン開始」ボタン801、カラー設定欄802、解像度設定欄803が存在する。「スキャン開始」ボタン801は、原稿台にセットした文書(本実施形態では見積書や請求書といった帳票を想定)に対するスキャン処理の開始を指示するためのボタンである。カラー設定欄802では、スキャン時のカラーモードを設定する。例えばフルカラーやモノクロといった選択肢の中から指定できるようになっている。解像度設定欄803では、スキャン時の解像度を設定する。例えば600dpiや1200dpiといった選択肢の中から指定できるようになっている。なお、カラーモードと解像度は設定項目の一例であって、これらすべてが存在しなくてもよいし、これら以外の設定項目が存在してもよい。また、カラーモードや解像度に関する選択肢を、ストレージサービスの要求する設定値のみに限定したりしてもよい。ログインユーザは、このようなスキャン設定画面800を介してスキャン処理についての詳細な条件設定を行なう。スキャン設定を終えたログインユーザが、MFP110の原稿台にスキャン対象の文書をセットし、「スキャン開始」ボタン801を押下するとスキャンが実行される(S505)。これにより、紙文書を電子化した画像データが生成される。スキャンの完了後、MFP110は、スキャンによって得られた画像データを、その解析リクエストと共にMFP連携サーバ120に送信する(S506)。 Once login is complete, the MFP 110 displays a UI screen for scan settings (hereinafter referred to as the "scan settings screen") on the operation unit 220 (S507). Figure 8 shows an example of the scan settings screen. The scan settings screen 800 includes a "Start Scan" button 801, a color settings field 802, and a resolution settings field 803. The "Start Scan" button 801 is used to start scanning a document placed on the platen (assuming a document such as an estimate or invoice in this embodiment). The color settings field 802 sets the color mode used during scanning. For example, full color or monochrome can be selected. The resolution settings field 803 sets the resolution used during scanning. For example, 600 dpi or 1200 dpi can be selected. Note that the color mode and resolution are merely examples of setting items; not all of these settings may be present, and other setting items may also be present. Furthermore, the color mode and resolution options may be limited to only the settings required by the storage service. The logged-in user sets detailed conditions for the scan process via this scan setting screen 800. After completing the scan settings, the logged-in user places the document to be scanned on the platen of the MFP 110 and presses the "Start Scan" button 801 to execute the scan (S505). This generates image data that is a digital version of the paper document. After the scan is complete, the MFP 110 sends the image data obtained by the scan to the MFP collaboration server 120 along with an analysis request for the image data (S506).

スキャン画像の解析リクエストを受けたMFP連携サーバ120では、リクエスト制御部431が画像処理部432に対し、画像解析処理の実行を指示する(S507)。その際、リクエスト制御部431は、受信した解析リクエストを一意に特定可能なリクエストIDをMFP110に返す。図9(a)にリクエストIDの一例を示す。一方、解析処理の実行指示を受けた画像処理部432は、スキャン画像に対する解析処理を実行する(S508)。この画像解析処理では、まずスキャン画像内に存在する文字領域を検出する処理を行う。文字領域の検出は、例えば、ある閾値で2値化を行った画像から文字と推測される矩形領域を抽出する方法等、既知の方法を適用すればよい。次に、文字領域検出処理によって見つかった各文字領域に対して、文字認識処理(OCR:Optical Character Recognition)を行う。そして、今回のスキャン対象の帳票が、過去のスキャン対象の帳票と類似しているかどうかを判定する処理(類似文書判定処理)を行う。この類似帳票の判定では、スキャン画像内に存在する各文字領域が当該スキャン画像のどこに位置するかを示す配置情報を用いる。具体的には、過去のスキャン画像についての配置情報と今回のスキャン画像についての配置情報とを比較し、文字領域の配置が類似しているかどうかを判定する。これは、文字領域の配置が類似していれば、それらは同一のフォーマットを用いて作成された帳票であると推測できることに基づいている。この類似帳票の判定で使用する過去のスキャン画像の配置情報は、後述の「帳票学習処理」によって蓄積される。これら画像解析処理によって得られた結果は、リクエスト制御部431に渡される。なお、本実施形態では、文字領域の配置の類似度合いのみに基づき帳票の類否を判定しているが、例えば、OCR結果から帳票の種別(見積書、請求書など)を特定し、得られた種別の情報を加味して類否を判定してもよい。 In the MFP collaboration server 120, upon receiving the request to analyze the scanned image, the request control unit 431 instructs the image processing unit 432 to perform image analysis (S507). At this time, the request control unit 431 returns a request ID that uniquely identifies the received analysis request to the MFP 110. An example of a request ID is shown in FIG. 9A. Meanwhile, upon receiving the instruction to perform analysis, the image processing unit 432 performs analysis on the scanned image (S508). This image analysis process first detects character regions within the scanned image. Character regions can be detected using known methods, such as extracting rectangular regions presumed to be characters from an image binarized using a certain threshold value. Next, character recognition (OCR: Optical Character Recognition) is performed on each character region found by the character region detection process. Then, a process (similar document determination process) is performed to determine whether the document currently being scanned is similar to documents scanned in the past. This similar document determination uses layout information indicating the location of each character region within the scanned image. Specifically, the layout information for a previously scanned image is compared with the layout information for the current scanned image to determine whether the layout of the character areas is similar. This is based on the fact that if the layout of the character areas is similar, it can be inferred that the forms were created using the same format. The layout information for previously scanned images used to determine similar forms is accumulated by the "form learning process" described below. The results obtained by these image analysis processes are passed to the request control unit 431. Note that in this embodiment, the similarity of forms is determined based solely on the degree of similarity in the layout of the character areas; however, for example, the type of form (quote, invoice, etc.) can be identified from the OCR results, and the obtained type information can also be taken into account to determine similarity.

上記画像解析処理が行われている間、MFP110は、上述のリクエストIDを使用して、MFP連携サーバ120に対して定期的(例えば数百ミリ秒から数ミリ秒程度毎)に処理状況の問合せを行う(S509~S509’)。この問合せは、MFP連携サーバ120からの画像解析処理の完了レスポンス(S510)が取得できるまで繰り返し実行される。MFP連携サーバ120は、処理状況の問合せを受けると、リクエストIDに対応する画像解析処理の進行状況を確認し、完了していない場合は処理中を表すレスポンス(図9(b)を参照)を返す。また、完了していた場合は完了を表すレスポンス(図9(c)を参照)を返す。このレスポンスの“status”には現在の処理状況を示す文字列、具体的には、MFP連携サーバ120で処理が行われている最中である場合には“processing”が入り、処理が完了している場合には“completed”が入る。なお、処理が失敗した場合の“failed”など、他のステータスを表す文字列が入ることもある。図9(c)に示すとおり、処理完了時のレスポンスには、ステータス情報に加え、スキャン画像の解析結果に関する情報などを含む。 While the image analysis process is being performed, the MFP 110 periodically (e.g., every several hundred milliseconds to a few milliseconds) queries the MFP-linked server 120 about the processing status using the request ID (S509-S509'). This query is repeated until an image analysis process completion response (S510) is received from the MFP-linked server 120. When the MFP-linked server 120 receives the query about the processing status, it checks the progress of the image analysis process corresponding to the request ID. If the process is not complete, it returns a response indicating "in progress" (see FIG. 9B). If the process is complete, it returns a response indicating "completed" (see FIG. 9C). The "status" in this response contains a string indicating the current processing status; specifically, if the process is currently being performed by the MFP-linked server 120, it contains "processing," and if the process is complete, it contains "completed." Note that a string indicating another status, such as "failed" if the process failed, may also be included. As shown in Figure 9 (c), the response upon completion of processing includes status information as well as information about the analysis results of the scanned image.

処理完了レスポンスを受信した後、MFP110は、当該レスポンスに含まれる、画像解析結果の格納先を示すURLを用いて、画像解析処理の結果を、MFP連携サーバ120に対してリクエストする(S511)。この場合のURLには、“ocrResultUrl”と“matchingResultUrl”がある。リクエストを受けてMFP連携サーバ120のリクエスト制御部431は、画像解析処理の結果情報を返す。 After receiving the processing completion response, the MFP 110 uses the URL included in the response indicating the storage location of the image analysis results to request the results of the image analysis processing from the MFP-linked server 120 (S511). The URLs in this case include "ocrResultUrl" and "matchingResultUrl." In response to the request, the request control unit 431 of the MFP-linked server 120 returns information about the results of the image analysis processing.

そして、MFP110は、取得した結果情報を使用して、ファイル名を設定するためのUI画面(以下、「ファイル名設定画面」と表記)を表示する(S512)。図10に、ファイル名設定画面の一例を示す。ユーザが、ファイル名を設定して送信ボタン1007を押下すると、MFP110は、まず、当該ファイル名を設定する際にユーザが行った入力操作に関する情報(設定時入力情報)を含んだ学習リクエストをMFP連携サーバ120に送信する(S513)。図11に、学習リクエストの一例を示す。“learningContent”において学習内容が特定され、その中には、ファイル名に使用された文字領域に関する“rectInfoArray”とメタデータに関する“metadataArray”がある。“rectInfoArray”には、ファイル名設定時に使用した文字領域の座標情報が入る。“metadataArray”には、ファイル名に使用した文字列に対応する文字領域の情報と、当該文字列に付随する区切り文字(セパレータ)の情報が入る。図11の例では、先頭が“fileRegion0”の文字領域の文字列、その次が区切り文字、そして末尾が“fileRegion1”の文字領域の文字列、の順に並ぶファイル名構成であることを示している。 The MFP 110 then uses the acquired result information to display a UI screen for setting a file name (hereinafter referred to as the "file name setting screen") (S512). Figure 10 shows an example of the file name setting screen. When the user sets a file name and presses the Send button 1007, the MFP 110 first sends a learning request to the MFP collaboration server 120, including information about the input operations performed by the user when setting the file name (setting input information) (S513). Figure 11 shows an example of a learning request. The learning content is specified in "learningContent," which includes a "rectInfoArray" related to the character area used in the file name and a "metadataArray" related to the metadata. "rectInfoArray" contains coordinate information for the character area used when setting the file name. "metadataArray" contains information about the character area corresponding to the character string used in the file name and information about the delimiter (separator) associated with the character string. The example in Figure 11 shows that the file name consists of a string of characters in the character region "fileRegion0" at the beginning, followed by a delimiter, and finally a string of characters in the character region "fileRegion1".

学習リクエストを受信したMFP連携サーバ120では、リクエスト制御部431が、画像処理部432に対し帳票学習処理の実行を指示する(S514)。この指示を受けて画像処理部432は、スキャン画像に存在する各文字領域の配置情報と、S513で受け取った学習リクエストに含まれるファイル名設定時の入力情報(ファイル名の構成情報)を保存する(S515)。 In the MFP collaboration server 120 that received the learning request, the request control unit 431 instructs the image processing unit 432 to execute form learning processing (S514). In response to this instruction, the image processing unit 432 saves the layout information of each character area present in the scanned image and the input information (file name configuration information) when setting the file name included in the learning request received in S513 (S515).

その後、MFP110は、スキャン画像のデータとそのファイル化の際に設定するファイル名等の情報と共に、当該スキャン画像の保存リクエストをMFP連携サーバ120に送信する(S516)。保存リクエストを受信したMFP連携サーバ120では、リクエスト制御部431が、ファイル生成処理を開始すると共に保存リクエストを正常に受けたことを示すレスポンスをMFP110に返す。そのレスポンスを受け取ったMFP110は、処理を終了し、スキャン設定画面の表示状態(S504)に戻る。一方、MFP連携サーバ120では、事前に登録されたスキャン設定からファイルフォーマットの情報を取得し、当該ファイルフォーマットに従ってスキャン画像をファイル化する(S517)。この際、生成されたファイルには保存リクエストにて指定されたファイル名が付されることになる。こうして生成されたスキャン画像ファイルは、ストレージサーバ130に送信され、保存される(S518)。 The MFP 110 then sends a save request for the scanned image to the MFP-linked server 120, along with information such as the scanned image data and the file name set when the scanned image was created (S516). In the MFP-linked server 120 that received the save request, the request control unit 431 starts the file creation process and returns a response to the MFP 110 indicating that the save request was successfully received. Upon receiving this response, the MFP 110 terminates the process and returns to the scan settings screen display state (S504). Meanwhile, the MFP-linked server 120 obtains file format information from the pre-registered scan settings and creates a file of the scanned image in accordance with that file format (S517). At this time, the created file is given the file name specified in the save request. The scanned image file created in this way is sent to the storage server 130 and saved (S518).

以上が、画像処理システム全体の処理の流れである。 This concludes the processing flow of the entire image processing system.

<MFPの処理詳細>
続いて、MFP110における動作に着目して、上述の画像処理システムでストレージサービスを利用する場合の処理について詳しく説明する。図12は、MFP110における処理の流れを示すフローチャートである。この一連の処理は、制御部210において、CPU211がHDD214に記憶された制御プログラムを実行することにより実現され、前述のメイン画面600での「スキャンしてクラウドストレージに保存」ボタン601の押下に応答して開始される。以下、図12に示すフローチャートに沿って詳しく説明する。なお、各処理の冒頭における記号「S」はステップを意味する。
<MFP processing details>
Next, the processing when using a storage service in the above-mentioned image processing system will be described in detail, focusing on the operation of the MFP 110. Fig. 12 is a flowchart showing the flow of processing in the MFP 110. This series of processing is realized by the CPU 211 in the control unit 210 executing a control program stored in the HDD 214, and is started in response to pressing the "Scan and save to cloud storage" button 601 on the main screen 600 mentioned above. A detailed description will be given below with reference to the flowchart shown in Fig. 12. Note that the symbol "S" at the beginning of each processing step indicates a step.

S1201において、表示制御部421は、前述のログイン画面700を表示する。ログイン画面700上でユーザ名とパスワードが入力欄702及び703にそれぞれ入力され、「ログイン」ボタン701の押下が検知されると、S1202に進む。 In S1201, the display control unit 421 displays the aforementioned login screen 700. When a username and password are entered into the input fields 702 and 703 on the login screen 700, respectively, and pressing of the "Login" button 701 is detected, the process proceeds to S1202.

S1202において、連携サービスリクエスト部423は、ログイン認証リクエストをMFP連携サーバ120に送信する。MFP連携サーバ120でのログイン認証によって正規のユーザであることが確認されると、連携サービスリクエスト部423は、アクセストークンをMFP連携サーバ120から受信する。 In S1202, the collaboration service request unit 423 sends a login authentication request to the MFP collaboration server 120. When the login authentication by the MFP collaboration server 120 confirms that the user is a legitimate user, the collaboration service request unit 423 receives an access token from the MFP collaboration server 120.

S1203において、アクセストークンを受信したMFP110では、表示制御部421が、前述のスキャン設定画面800を操作部220に表示する。ログインユーザによって原稿台に文書がセットされ、「スキャン開始」ボタン801の押下が検知されると、表示制御部421は、スキャン制御部422に対してその旨を通知する。 In S1203, the display control unit 421 of the MFP 110 that received the access token displays the aforementioned scan setting screen 800 on the operation unit 220. When the logged-in user places a document on the platen and detects that the "Start Scan" button 801 has been pressed, the display control unit 421 notifies the scan control unit 422 of this.

S1204において、上記通知を受けたスキャン制御部422は、スキャン実行部411に対してスキャン処理の実行を指示する。当該指示を受けてスキャン実行部411は、原稿台に置かれた文書をスキャンする。本フローの説明においては、スキャン対象として帳票(より具体的には見積書)を例に説明を行うものとする。これにより、図13に示すような見積書のスキャン画像が得られる。スキャンによって生成されたスキャン画像データは、画像データ保存部412に保存され、当該スキャン画像を特定可能な識別子がスキャン制御部421に通知される。この際、スキャンの実行中である旨を示すメッセージ画面(不図示)が操作部220上に表示されるようにしてもよい。 In S1204, upon receiving the above notification, the scan control unit 422 instructs the scan execution unit 411 to execute a scan process. In response to this instruction, the scan execution unit 411 scans the document placed on the platen. In explaining this flow, a document (more specifically, an estimate) will be used as an example to be scanned. As a result, a scanned image of the estimate as shown in FIG. 13 is obtained. The scanned image data generated by the scan is saved in the image data saving unit 412, and an identifier that can identify the scanned image is notified to the scan control unit 421. At this time, a message screen (not shown) indicating that scanning is in progress may be displayed on the operation unit 220.

次に、S1205において、連携サービスリクエスト部423は、スキャン制御部421を介してスキャン画像データを取得し、MFP連携サーバ120にその解析リクエストと共に送信する。当該解析リクエストに基づき、MFP連携サーバ120では、受信したスキャン画像データに対して、前述の画像解析処理が実行される。その際、MFP連携サーバ120のリクエスト制御部431からリクエストIDが返される。 Next, in S1205, the collaboration service request unit 423 obtains the scanned image data via the scan control unit 421 and sends it to the MFP collaboration server 120 along with an analysis request. Based on the analysis request, the MFP collaboration server 120 performs the image analysis process described above on the received scanned image data. At this time, a request ID is returned from the request control unit 431 of the MFP collaboration server 120.

S1206において、リクエストIDを取得した連携サービスリクエスト部423は、処理ステータスの取得リクエストをリクエストIDと共にMFP連携サーバ120に送信する。当該取得リクエストに基づき、MFP連携サーバ120は、リクエストIDで特定される画像解析処理の進行状況に応じたレスポンスをMFP110に返す。 In S1206, the collaboration service request unit 423, which has acquired the request ID, sends a processing status acquisition request together with the request ID to the MFP collaboration server 120. Based on the acquisition request, the MFP collaboration server 120 returns a response to the MFP 110 according to the progress status of the image analysis processing identified by the request ID.

S1207において、連携サービスリクエスト部423は、受け取ったレスポンスにおけるステータスが処理中を示す“processing”であった場合はS1206に戻る。そして、所定時間の経過を待って、再び処理ステータスの取得リクエストをMFP連携サーバ120に送信する。受け取ったレスポンスにおけるステータスが完了を示す“completed”であった場合は、S1208に進む。ここで、本実施形態における処理完了時のレスポンスに含まれる画像解析結果の情報について、前述の図9(c)を参照しつつ説明する。画像解析結果の情報には、“ocrResultUrl”、“matchingResultUrl”、“formKeys”の3種類の情報がある。“ocrResultUrl”は、画像解析処理のうちOCR処理の結果を取得するためのURLの情報である。“matchingResultUrl”は、画像解析処理のうち類似帳票判定処理の結果を取得するためのURLの情報である。“formKeys”は、ファイル名、メタデータ、フォルダパスといったプロパティをスキャン画像に設定するための設定値の情報であり、MFP連携サーバ120において事前設定されている。“formKeys”の中には以下の情報が含まれる。
・key:スキャン画像に設定する設定値を一意に示す値
・keyType:keyの設定値の種別を示す値
・value:設定値の初期値(例えば、スキャン画像であることを示す“scan”)
・type:設定値に入力する値の種類を示す値
(例えば、文字列なら“string”、数値なら“number”、日付なら“date”など)
・displayName:MFPのタッチパネル上に設定画面を表示するときの表示名
・required:その設定値を入力することが必須かどうかを示す値
・multiSelect:ファイル名に複数の文字領域の文字列を使用するかどうかを示す値
・separator:複数の文字領域の文字列を使用する場合の文字列間を繋ぐ区切り文字の内容
・autoInput:初期ファイル名の自動入力を行うかどうかを示す値
In S1207, if the status in the received response is “processing,” indicating that processing is in progress, the linkage service request unit 423 returns to S1206. Then, after waiting for a predetermined time to elapse, the linkage service request unit 423 again sends a processing status acquisition request to the MFP linkage server 120. If the status in the received response is “completed,” indicating that processing is complete, the process proceeds to S1208. Here, the image analysis result information included in the response upon processing completion in this embodiment will be described with reference to the aforementioned FIG. 9C . The image analysis result information includes three types of information: “ocrResultUrl,” “matchingResultUrl,” and “formKeys.” “ocrResultUrl” is URL information for acquiring the results of the OCR processing, which is part of the image analysis processing. “matchingResultUrl” is URL information for acquiring the results of the similar form determination processing, which is part of the image analysis processing. “formKeys” is information on setting values for setting properties such as file name, metadata, and folder path to the scanned image, and is preset in the MFP linkage server 120. “formKeys” includes the following information:
・key: A value that uniquely indicates the setting value to be set on the scanned image ・keyType: A value that indicates the type of the key setting value ・value: The initial value of the setting value (for example, "scan" to indicate that it is a scanned image)
- type: A value indicating the type of value to be entered in the setting
(For example, "string" for strings, "number" for numbers, "date" for dates, etc.)
displayName: Display name when the setting screen is displayed on the touch panel of the MFP required: Value indicating whether it is necessary to input the setting value multiSelect: Value indicating whether to use a character string from multiple character areas in the file name separator: Contents of the delimiter that connects the character strings when using a character string from multiple character areas autoInput: Value indicating whether to automatically input the initial file name

図9(c)には、スキャン画像にファイル名を設定する場合の“formKeys”が示されている。この図9(c)の場合を例に、“value”、“displayName”、“required”、“multiSelect”の各値が、次のS1209で表示されるファイル名設定画面(図10)にどのような影響をあたえるかを説明する。いま、“value”の内容は空である。この場合、ファイル名設定画面1000のファイル名入力欄1001には初期値が表示されないことになる。また、“displayName”は「ファイル名」となっている。この場合、図10のファイル名設定画面1000のように設定のタイトルやラベルを示す「ファイル名」の文字列が画面上部に(この例では白抜き文字で)表示されることになる。また、“required”は「true」となっている。この場合、ファイル名入力欄1001に文字列が入っていない空の状態では送信ボタン1007を押下することができなくなる。また、“multiSelect”が「true」となっている。この場合、スキャン画像から検出された複数の文字領域を選択することが可能になり、これによって各文字領域に対応した文字列を繋げたファイル名を設定できることになる。これら“formKeys”に含まれる上記の内容は、MFP連携サーバ120の表示制御部435が表示するファイル名条件設定画面を介してユーザが設定する。図14にファイル名条件設定画面の一例を示す。ファイル名条件設定画面1400内のチェックボックス1401は、以前にスキャン画像のファイル名設定時に用いた文字領域の情報を使用して自動的にファイル名を入力するか否かをユーザが選択するために用いる。設定欄1402には、ファイル名に複数の文字領域に対応する複数の文字列を使用する場合に、文字列間に挿入する区切り文字に何を使用するかをプルダウン表示される選択肢(アンダースコア、ハイフンなど)の中から設定する。ここでは、アンダースコアが選択されている。設定欄1403には、ファイル名設定画面(図10)の初期表示の際に予め入力状態にしておき、ユーザにファイル名の候補として提示する文字列(初期ファイル名)を設定する。このファイル名条件設定画面1400で設定した内容はデータ管理部434で保持され、処理完了時のレスポンスを作成する際に参照される。 Figure 9(c) shows the "formKeys" when setting a file name for a scanned image. Using the case of Figure 9(c) as an example, we will explain how the values of "value," "displayName," "required," and "multiSelect" affect the file name setting screen (Figure 10) displayed in the next step S1209. Currently, the content of "value" is empty. In this case, the initial value is not displayed in the file name input field 1001 of the file name setting screen 1000. Also, "displayName" is set to "file name." In this case, the string "file name," which indicates the title or label of the setting, is displayed at the top of the screen (in this example, in white text), as in the file name setting screen 1000 of Figure 10. Also, "required" is set to "true." In this case, if the file name input field 1001 is empty and no string is entered, the send button 1007 cannot be pressed. Also, "multiSelect" is set to "true." In this case, it is possible to select multiple character areas detected from the scanned image, thereby allowing a file name to be set by concatenating character strings corresponding to each character area. The above content included in these "formKeys" is set by the user via a file name condition setting screen displayed by the display control unit 435 of the MFP linkage server 120. FIG. 14 shows an example of the file name condition setting screen. A check box 1401 in the file name condition setting screen 1400 allows the user to select whether to automatically enter a file name using information about the character areas previously used when setting a file name for a scanned image. In setting field 1402, when multiple character strings corresponding to multiple character areas are used in a file name, the user sets the delimiter to be inserted between the character strings from a pull-down menu (e.g., underscore, hyphen, etc.). In this example, an underscore is selected. In setting field 1403, a character string (initial file name) is set to an input state when the file name setting screen ( FIG. 10 ) is initially displayed and presented to the user as a file name candidate. The content set in this file name condition setting screen 1400 is retained by the data management unit 434 and referenced when creating a response upon completion of processing.

S1208において、連携サービスリクエスト部423は、処理完了時のレスポンスに含まれるURLにアクセスして、画像解析結果を取得する。図9(c)の例では“ocrResultUrl”と“matchingResultUrl”に情報が格納されているので、この2つのURLにアクセスして画像解析結果を取得する。以下の表1は、図13のスキャン画像から検出された文字領域の座標と、各文字領域についての文字認識結果(認識された文字列)を示している。 In S1208, the collaboration service request unit 423 accesses the URL included in the response upon completion of processing to obtain the image analysis results. In the example of Figure 9 (c), information is stored in "ocrResultUrl" and "matchingResultUrl", so these two URLs are accessed to obtain the image analysis results. Table 1 below shows the coordinates of the character areas detected from the scanned image in Figure 13 and the character recognition results (recognized character strings) for each character area.

そして、図15は、“ocrResultUrl”にアクセスして取得される、図13のスキャン画像についての文字認識結果を示している。“imageWidth”は、解析対象のスキャン画像のX方向(横方向)のピクセル数を示す。“imageHeight”は、解析対象のスキャン画像のY方向(縦方向)のピクセル数を示す。“regions”は、スキャン画像から検出した文字領域の座標情報(“rect”)と、その文字領域に対応する文字列情報(“Text”)が含まれる。“rect”には、検出した文字領域を特定する情報が含まれ、“x”は文字領域の左上隅のX座標、“y”は文字領域の左上隅のY座標、“width”は文字領域のX(幅)方向のピクセル数、“height”は文字領域のY(高さ)方向のピクセル数を示す。“text”は、“rect”で特定される文字領域をOCR処理して得られた文字列の情報を示す。この“rect”と“text”の情報が、解析対象のスキャン画像内で検出された全ての文字領域分だけ含まれる。ただし、図15ではその一部を省略している。 Figure 15 shows the character recognition results for the scanned image in Figure 13, obtained by accessing "ocrResultUrl." "imageWidth" indicates the number of pixels in the X direction (horizontal) of the scanned image being analyzed. "imageHeight" indicates the number of pixels in the Y direction (vertical) of the scanned image being analyzed. "regions" contains coordinate information ("rect") of the character area detected in the scanned image and string information ("Text") corresponding to that character area. "rect" contains information identifying the detected character area, where "x" is the X coordinate of the upper left corner of the character area, "y" is the Y coordinate of the upper left corner of the character area, "width" is the number of pixels in the X (width) direction of the character area, and "height" is the number of pixels in the Y (height) direction of the character area. "text" indicates the string information obtained by OCR processing the character area identified by "rect." This "rect" and "text" information is included for all character areas detected in the scanned image being analyzed. Note that some of this information is omitted in Figure 15.

そして、図16は、“matchingResultUrl”にアクセスして取得される、図13のスキャン画像についての類似帳票判定結果を示している。“matched”には、前述の類似帳票判定処理によって、今回解析対象のスキャン画像と類似しているものが過去のスキャン画像の中から見つかったかどうかを示す値として“true”又は“false”が入る。値が“true”であれば、今回のスキャン対象の帳票が以前にスキャンした帳票と類似していることを示し、“false”であれば類似していないことを表す。“formId”には、類似する帳票が見つかった場合は、過去の類似帳票のスキャン画像を一意に示す値(ID値)が入る。一方、類似する帳票が見つからなかった場合は、今回スキャンを行った帳票のスキャン画像を一意に示す新たに作成されたID値が入る。そして、この新たに作成されたID値は、過去に類似帳票が存在しなかった帳票のスキャン画像についてのファイル名設定時の入力情報(ファイル名の構成情報)を学習させるときに使用される。“matchingScore”には、類似する帳票があった場合に一致度合を示す値が入る。本実施形態の類似度は、過去のスキャン画像における文字領域の配置情報と今回のスキャン画像における文字領域の配置情報との一致度合を0~1までの実数値で表したものであり、その値が大きいほど類似した帳票であることを示す。“rectInfoArray”には、過去の類似帳票のスキャン画像に対するファイル名設定時に使用された文字領域に対応する、今回解析対象のスキャン画像における文字領域を示す情報が入る。 Figure 16 shows the similar form determination results for the scanned image in Figure 13, obtained by accessing "matchingResultUrl." "matched" contains a value of "true" or "false" indicating whether the previously scanned image was found to be similar to the scanned image currently being analyzed through the similar form determination process. A value of "true" indicates that the scanned image currently being scanned is similar to a previously scanned form, while a value of "false" indicates that the scanned image is not similar. If a similar form is found, "formId" contains a value (ID value) that uniquely identifies the scanned image of the previously scanned similar form. On the other hand, if a similar form is not found, a newly created ID value that uniquely identifies the scanned image of the currently scanned form is contained. This newly created ID value is then used to learn the input information (file name configuration information) used when setting the file name for scanned images of forms for which no similar forms previously existed. "matchingScore" contains a value indicating the degree of match if a similar form is found. In this embodiment, similarity is expressed as a real value between 0 and 1 that indicates the degree of match between the layout information of text areas in a previous scanned image and the layout information of text areas in the current scanned image, with larger values indicating more similar forms. "rectInfoArray" contains information indicating the text areas in the scanned image being analyzed currently that correspond to the text areas used when setting the file name for the scanned image of the previous similar form.

図16の例の場合は、以前に、見積書をスキャンして得られた図13のスキャン画像に対して「見積書」と「品川株式会社」の2つの文字列を使用してファイル名を設定し、その入力情報の学習を行っている。その後に、同一フォーマットで作成した見積書をスキャンして図17に示すスキャン画像を生成し、当該スキャン画像について類似帳票判定処理を行った結果、図13のスキャン画像と類似していると判定されている。そして、図13のスキャン画像に対するファイル名の設定時に使用された文字領域の情報が、自動入力の対象となる文字領域の情報として格納された状態を、図16の例は示している。以下、図16に示す類似帳票判定処理の結果が得られるまでの過程を説明する。 In the example of Figure 16, a file name was previously set using the two character strings "Quotation" and "Shinagawa Co., Ltd." for the scanned image of Figure 13 obtained by scanning an estimate, and that input information was learned. After that, a quote created in the same format was scanned to generate the scanned image shown in Figure 17, and the similar form determination process was performed on this scanned image, which was determined to be similar to the scanned image of Figure 13. The example of Figure 16 shows that the information on the character areas used when setting the file name for the scanned image of Figure 13 has been stored as information on the character areas that will be automatically entered. The process leading up to the results of the similar form determination process shown in Figure 16 is explained below.

前提として、前述の図11の学習リクエストに基づく学習結果が、データ管理部434に保存されているものとする。そして、類似帳票判定処理では、以前のファイル名設定時に用いた「見積書」と「品川株式会社」の文字領域の座標情報を用いて、今回のスキャン画像に含まれる文字領域の中の当該座標情報で示された文字領域とその一部が重なる文字領域が特定される。そして、一部が重なると特定された文字領域の座標情報と当該文字領域の文字列を“rectInfoArray”の“text”に格納される。“key”には、ファイル名の自動入力に使用する文字領域を一意に示す値が入る。“region”には“key”が一意に示す文字領域の座標情報と当該文字領域に対するOCR処理によって得られた文字列が格納される。そして、“rect”には、“key”が一意に示す文字領域を特定する情報が含まれる。この場合において、“x”は文字領域の左上隅のX座標、“y”は文字領域の左上隅のY座標、“width”は文字領域のX(幅)方向のピクセル数、“height”は文字領域のY(高さ)方向のピクセル数を示す。そして、“rect”で特定される文字領域をOCR処理して得られた文字列の情報が“text”に入っている。“metadataArray”には、ファイル名を自動入力する際に使用する文字領域の順番と区切り文字がどこに入るかを示す情報が格納される。ファイル名以外にメタデータなどのプロパティ情報が設定されている場合は、“rectInfoArray”や“metadataArray”において、必要な情報が追加される。“key”には、スキャン画像に設定する設定値を一意に示す値が格納される。“keyType”には、“key”の設定値の種別を示す値が格納される。ファイル名に使用する場合は、“key”には“filename”が入り、“keyType”には“filename”が入る。“value”には、“key”の値に使用する文字領域と区切り文字の情報が格納される。図16の例では、“rectInfoArray”の中の“fileRegion0”の“key”を持つ文字領域の文字列が1番目、区切り文字が2番目、“fileRegion1”の“key”を持つ文字領域の文字列が3番目となっている。そして、この順番でファイル名入力欄1001に自動入力され、初期ファイル名として表示されることになる。 As a premise, it is assumed that the learning results based on the learning request in Figure 11 are saved in the data management unit 434. Then, in the similar form determination process, the coordinate information of the character areas of "Quotation" and "Shinagawa Co., Ltd." used when setting the previous file name is used to identify character areas in the character area contained in the current scanned image that partially overlap with the character area indicated by that coordinate information. The coordinate information of the character area identified as partially overlapping and the character string of that character area are then stored in "text" of "rectInfoArray." "key" contains a value that uniquely identifies the character area to be used for automatic file name entry. "region" stores the coordinate information of the character area uniquely indicated by "key" and the character string obtained by OCR processing of that character area. "rect" contains information that uniquely identifies the character area uniquely indicated by "key." In this case, "x" is the X coordinate of the upper left corner of the character area, "y" is the Y coordinate of the upper left corner of the character area, "width" is the number of pixels in the X (width) direction of the character area, and "height" is the number of pixels in the Y (height) direction of the character area. "text" contains information about the character string obtained by OCR processing the character area specified by "rect." "metadataArray" stores information indicating the order of the character areas used when automatically entering a file name and where the delimiters will be placed. If property information such as metadata is set in addition to the file name, the necessary information is added to "rectInfoArray" and "metadataArray." "key" stores a value that uniquely indicates the setting value to be set for the scanned image. "keyType" stores a value indicating the type of the "key" setting value. When used for a file name, "key" stores "filename" and "keyType" stores "filename." "value" stores information about the character area and delimiters used for the "key" value. In the example of Figure 16, the character string from the character area with the "key" of "fileRegion0" in "rectInfoArray" is first, the delimiter is second, and the character string from the character area with the "key" of "fileRegion1" is third. These characters are then automatically entered into the file name input field 1001 in this order and displayed as the initial file name.

S1209において、表示制御部421が、前述のファイル名設定画面1000を操作部220に表示して、ユーザが、スキャン画像に対するファイル名の設定を行えるようにする。このファイル名設定処理の詳細については後述する。 In S1209, the display control unit 421 displays the file name setting screen 1000 described above on the operation unit 220, allowing the user to set a file name for the scanned image. Details of this file name setting process will be described later.

S1210において、連携サービスリクエスト部423が、S1206の処理ステータスのリクエストに対するレスポンスを参照して、ファイル名の自動入力を行う設定となっているか否かを判定し、次の処理を決定する。具体的には、前述の図9(c)で示した処理完了時のレスポンスに含まれる“autoInput”の値を参照し、自動入力を行う設定を意味する“true”の場合はS1211へ進む。一方、自動入力を行わない設定を意味する“false”の場合はS1214へ進む。 In S1210, the collaboration service request unit 423 references the response to the processing status request of S1206, determines whether automatic file name input is enabled, and determines the next step. Specifically, it references the value of "autoInput" included in the response at the time of processing completion shown in Figure 9 (c) above, and if the value is "true", which means that automatic input is enabled, proceeds to S1211. On the other hand, if the value is "false", which means that automatic input is not enabled, proceeds to S1214.

S1211において、連携サービスリクエスト部423は、今回のスキャン画像に類似するスキャン画像が過去に存在していたかどうかを、S1208で取得した画像解析結果に基づき判定する。具体的には、前述の図16で示した類似帳票判定処理の結果に含まれる“matched”の値を参照し、過去のスキャン画像の中に類似したものが存在することを示す“true”の場合はS1212へ進む。一方、類似したものが存在しないことを示す“false”の場合はS1214へ進む。 In S1211, the linked service request unit 423 determines whether a scanned image similar to the current scanned image existed in the past, based on the image analysis results obtained in S1208. Specifically, it references the value of "matched" included in the results of the similar form determination process shown in Figure 16 above, and if the value is "true", indicating that a similar image exists among the past scanned images, it proceeds to S1212. On the other hand, if the value is "false", indicating that a similar image does not exist, it proceeds to S1214.

S1212において、連携サービスリクエスト部423は、S1209のファイル名設定処理において、ファイル名入力欄1001に自動入力されていた初期ファイル名に対して、ユーザが変更を加えたかどうかを判定する。この場合の変更には、例えば今回のファイル名に使用する文字領域を、初期ファイル名で使用されている文字領域と異なるものにしたり、区切り文字を追加したり或いは削除したりすることを含む。そして、この判定は、図16の類似帳票判定処理の結果に含まれる“metadataArray”の“value”の値と、今回のスキャン画像に対するファイル名設定を行った後のファイル名入力欄1001への入力情報との比較により行う。比較の結果、差異があれば初期ファイル名に対して変更がなされたと判断してS1213へ進み、一致していれば初期ファイル名に対して変更がなされていないと判断してS1214へ進む。なお、“formKeys”の“value”によって自動入力されていたファイル名の先頭文字列については、ユーザによって削除されていても入力情報が変わったとみなさずにS1214に進んでもよい。 In S1212, the collaboration service request unit 423 determines whether the user made any changes to the initial file name that was automatically entered into the file name input field 1001 during the file name setting process in S1209. Changes in this case include, for example, changing the character area used in the current file name to a different character area from that used in the initial file name, or adding or deleting delimiters. This determination is made by comparing the value of "value" of "metadataArray" included in the results of the similar form determination process in FIG. 16 with the information entered into the file name input field 1001 after the file name was set for the current scanned image. If the comparison reveals a difference, it is determined that a change has been made to the initial file name, and the process proceeds to S1213. If the comparison reveals a match, it is determined that no change has been made to the initial file name, and the process proceeds to S1214. It should be noted that even if the user has deleted the initial character string of the file name that was automatically entered using the "value" of "formKeys," the input information may not be considered to have changed, and the process may proceed to S1214.

S1213では、連携サービスリクエスト部423が、今回のスキャン画像に対して設定されたファイル名の構成を表す設定時入力情報の学習リクエスト(前述の図11を参照)を、MFP連携サーバ120へ送信する。この場合の学習リクエストに含まれる“formId”には、S1208で取得した画像解析結果の類似判定処理結果に含まれる“formId”の値が使用される。図16の例では、“formId”の値として“aaaaaaaa-ffff-49ab-acf8-55558888eeee”が入っているので、これが学習リクエストに格納されることになる。また、“learningContent”には、ファイル名設定時に使用した入力情報の内容が格納される。まず、“rectInfoArray”には、ファイル名に使用した文字列が属する文字領域の座標情報が、その文字領域の数分だけ格納される。そして、“metadataArray”には、ファイル名の設定に用いた文字領域と区切り文字の情報が格納される。前述の表1を参照して、このときのユーザが行った操作を説明すると、ファイル名設定画面1000のプレビュー領域1002において、最初に番号1の「見積書」をタッチする。その次に、番号8の「品川株式会社」をタッチし、最後に送信ボタン1007を押下している。学習リクエストを受けたMFP連携サーバ120は、このようなユーザ操作に基づく入力情報を蓄積し、当該蓄積した入力情報を次回以降の画像解析処理から使用することになる。学習リクエストを送信後、当該学習リクエストを正常に処理した旨のレスポンスをMFP連携サーバ120から受け取ると、S1214に進む。 In S1213, the collaboration service request unit 423 sends to the MFP collaboration server 120 a learning request (see Figure 11 above) for the input information at the time of setting, which indicates the structure of the file name set for the current scanned image. In this case, the "formId" included in the learning request uses the value of "formId" included in the similarity determination process result of the image analysis results obtained in S1208. In the example of Figure 16, the value of "formId" is "aaaaaaaa-ffff-49ab-acf8-55558888eeee", so this is stored in the learning request. Furthermore, "learningContent" stores the content of the input information used when setting the file name. First, "rectInfoArray" stores the coordinate information of the character area to which the character string used in the file name belongs, for the number of character areas. Then, "metadataArray" stores information on the character area and delimiter used to set the file name. Referring to Table 1 above, the user's operations at this time are explained as follows: In preview area 1002 of file name setting screen 1000, the user first touches number 1, "Quotation." Next, the user touches number 8, "Shinagawa Co., Ltd.", and finally presses send button 1007. Upon receiving the learning request, MFP-linked server 120 stores the input information based on these user operations, and will use the stored input information from the next image analysis process onwards. After sending the learning request, if a response is received from MFP-linked server 120 indicating that the learning request was successfully processed, the process proceeds to S1214.

S1214では、連携サービスリクエスト部423が、処理対象のスキャン画像データとS1209で設定されたファイル名とを対応付けて、MFP連携サーバ120に送信する。この送信完了によって本処理が終了する。なお、本実施形態ではスキャン画像データとそのファイル名の送信を最後に行っているが、スキャン処理が終わり、スキャン画像管理部412によるスキャン画像データの保存の時点で並行して、MFP連携サーバ120に送信しておいてもよい。 In S1214, the collaboration service request unit 423 associates the scanned image data to be processed with the file name set in S1209 and transmits them to the MFP collaboration server 120. This completion of transmission ends the process. Note that in this embodiment, the scanned image data and its file name are transmitted last, but they may also be transmitted to the MFP collaboration server 120 in parallel with the scanning process being completed and the scanned image data being saved by the scanned image management unit 412.

以上が、MFP110における動作に着目したストレージサービスを利用する場合の処理の流れである。なお、上記の説明では、1枚の見積書をスキャンして得られた1つのスキャン画像をファイル化する際のファイル名設定を行う場面を想定していた。しかし、本実施形態はこれに限定されるものではなく、複数の文書をスキャンして得られた複数のスキャン画像をファイル化する際のファイル名設定を行う場面にも同様に適用可能である。この場合、ファイル名設定画面1000内にページめくりをするためのボタンを設け、2ページ目や3ページ目のスキャン画像の文字領域からもファイル名の設定を行えるようにしてもよい。 The above is the processing flow when using a storage service, focusing on the operation of the MFP 110. Note that the above explanation assumes a situation in which a file name is set when a single scanned image obtained by scanning a single estimate is to be filed. However, this embodiment is not limited to this, and can also be applied to a situation in which a file name is set when multiple scanned images obtained by scanning multiple documents are to be filed. In this case, a button for turning pages may be provided within the file name setting screen 1000, allowing file names to be set from the text area of the scanned image on the second or third page.

(ファイル名設定処理)
続いて、前述のS1209にて表示制御部421が実行するファイル名設定処理について、図18及び図19に示すフローチャートに沿って詳しく説明する。
(File name setting process)
Next, the file name setting process executed by the display control unit 421 in S1209 described above will be described in detail with reference to the flowcharts shown in FIGS.

S1801では、前述のファイル名設定画面1000のファイル名入力欄1001に初期状態で表示されるファイル名(初期ファイル名)が生成される。初期ファイル名は、以下の手順で生成される。まず、前述の処理完了時のレスポンスを参照し、“formKeys”の“value”に何らかの値が入っていれば、当該値をファイル名の先頭に設定する。例えば、“formKeys”の“value”として“scan”の文字列が入っていた場合は、初期ファイル名の先頭に“scan”を設定する。次に、“matchingResultUrl”にアクセスして取得した類似帳票判定結果に従って所定の文字列を設定する。すなわち、“matched”の値が“true”であり、かつ、“matchingScore”が一定以上の数値(例えば0.6以上)であると、“metadataArray”の“value”で指定されるファイル名構成に従って文字列を設定する。具体的には、“value”において指定された順番に従って“rectInfoArray”で特定される文字領域の文字列を設定する。図16の類似帳票判定結果の例では、“matched”の値が“true”であり、かつ、“matchingScore”が“0.74・・・”なので一定以上の数値である。そして、“metadataArray”の“value”にて、最初が“fileRegion0”、次が“separator”、最後が“fileRegion1”の並びであることが指定されている。よって、“fileRegion0”の“text”の値である「見積書」、処理完了レスポンスに含まれる“separator”の値である「_(アンダースコア)」、“fileRegion1”の“text”の値である「下丸子株式会社」が順に連結される。こうして「見積書_下丸子株式会社」が、初期ファイル名として生成されることになる。もし、“formKeys”の“value”に何らかの値(例えば“scan_”)が入っていた場合は、その文字を先頭に追加した「scan_見積書_下丸子株式会社」が初期ファイル名となる。類似帳票判定結果において、“matched”の値が“false”で、“matchingScore”が一定未満の数値の場合は、“formKeys”の“value”に文字列が入っていればその文字列がそのまま初期ファイル名となる。また、“formKeys”の“value”に文字列が入っていなければ初期ファイル名なし(空欄)となる。なお、本実施形態では、“matched”の値と“matchingScore”の値の2つを、“metadataArray”の“value”の順番に従って“rectInfoArray”で指定された情報を初期ファイル名生成の条件とした。しかし、これに限定されず、いずれか一方の結果のみを条件としてもよい。例えば、“matched”の値が“true”であることのみを条件に初期ファイル名を生成してもよいし、類似度合いを示す値が閾値以上であることのみを条件にファイル名を生成してもよい。 In S1801, a file name (initial file name) that is initially displayed in the file name input field 1001 of the file name setting screen 1000 described above is generated. The initial file name is generated using the following procedure. First, the response received upon completion of the processing described above is referenced, and if a value is entered in the "value" of "formKeys", that value is set to the beginning of the file name. For example, if the string "scan" is entered as the "value" of "formKeys", "scan" is set to the beginning of the initial file name. Next, a predetermined string is set according to the similar form determination results obtained by accessing "matchingResultUrl". In other words, if the value of "matched" is "true" and the "matchingScore" is a certain number or greater (for example, 0.6 or greater), a string is set according to the file name structure specified in the "value" of "metadataArray". Specifically, the string of the character area specified in "rectInfoArray" is set in the order specified in "value". In the example of the similar forms determination results in Figure 16, the value of "matched" is "true" and the "matchingScore" is "0.74...", which is a numerical value above a certain level. The "value" of "metadataArray" specifies that the first element is "fileRegion0", followed by "separator", and finally by "fileRegion1". Therefore, the "text" value of "fileRegion0" ("quote"), the "separator" value included in the processing completion response ("_ (underscore)"), and the "text" value of "fileRegion1" ("Shimomaruko Co., Ltd.") are concatenated in this order. In this way, "quote_Shimomaruko Co., Ltd." is generated as the initial file name. If the "value" of "formKeys" contains a value (for example, "scan_"), the initial file name will be "scan_quote_Shimomaruko Co., Ltd." with that character prepended. In the similar form determination results, if the value of "matched" is "false" and the "matchingScore" is a numerical value below a certain value, and if the "value" of "formKeys" contains a string, that string will be used as the initial file name. Also, if the "value" of "formKeys" does not contain a string, there will be no initial file name (it will be blank). In this embodiment, the two values of "matched" and "matchingScore" are used as the conditions for generating the initial file name, and the information specified in "rectInfoArray" in accordance with the order of the "value" of "metadataArray". However, this is not limited to this, and only one of the results may be used as the condition. For example, the initial file name may be generated only if the value of "matched" is "true", or the file name may be generated only if the value indicating the degree of similarity is equal to or greater than a threshold.

S1802では、ファイル名設定画面1000のプレビュー領域1002に初期状態で表示する際にスキャン画像をどの程度縮小して表示するか(以下、「初期変倍率」と呼ぶ)が決定される。この初期変倍率の決定には、“ocrResultUrl”にアクセスして取得した文字認識結果を用いる。まず、スキャン画像内で検出された全ての文字領域のうち最も左にある文字領域と最も右にある文字領域をそれぞれ求める。この場合において、最も左の文字領域となるのは、全文字領域の中で、x座標の値が最小値の文字領域である。また、最も右の文字領域となるのは、全文字領域の中で、x座標の値と文字領域幅(width)の値とを足した合計値が最大となる文字領域である。こうして決定した最も左にある文字領域の左辺がプレビュー領域1002の左辺と、最も右にある文字領域の右辺がプレビュー領域1002の右辺とそれぞれ一致するような変倍率を、初期変倍率として決定する。なお、決定した文字領域の端とプレビュー領域の端とを完全に一致させてしまうと、当該文字領域が小さい場合にユーザが選択(押下)しづらくなることがあるため、一定量のマージンを持たせて初期変倍率を決定してもよい。例えば、プレビュー領域1002内で最も左に表示されることになる文字領域の左端と、最も右に表示されることになる文字領域の右端からそれぞれ10ピクセル分の余白が確保されるように初期変倍率を決定するといった具合である。また、プレビュー領域1002上に各種操作ボタン等のUIコンポーネントが重畳表示される場合には、当該UIコンポーネントに文字領域が重ならないように初期変倍率を決定してもよい。具体的には、UIコンポーネントの幅分をプレビュー領域1002の幅から差し引いた上で、最も左の文字領域と最も右の文字領域とが残りの領域の幅内に収まるように初期変倍率を決定してもよい。前述の図10のファイル名設定画面1000の例では、プレビュー領域1002内に3つの操作ボタン(拡大ボタン1004、縮小ボタン1005、復帰ボタン1006)が存在しているので、これらのボタンに文字領域が重ならないように初期変倍率を決定する。また、スキャン対象となる帳票の上下左右の端部付近には印刷処理に関わるヘッダ情報等が印刷されていることがあり、このようなヘッダ情報等に対応する文字領域の文字列がファイル名の一部に採択される可能性は低い。そこで、スキャン画像の上下左右の端から一定量(例えば50ピクセル)以内に存在する文字領域は、上記最も左及び最も右の文字領域を求める際に除外するようにしてもよい。 In S1802, the process determines how much the scanned image should be reduced when initially displayed in the preview area 1002 of the file name setting screen 1000 (hereinafter referred to as the "initial scaling factor"). This initial scaling factor is determined using the character recognition results obtained by accessing "ocrResultUrl." First, the leftmost and rightmost character areas are determined from all character areas detected in the scanned image. In this case, the leftmost character area is the character area with the smallest x-coordinate value among all character areas. The rightmost character area is the character area with the largest sum of the x-coordinate value and the character area width value among all character areas. The initial scaling factor is determined as the scaling factor such that the left side of the leftmost character area thus determined coincides with the left side of the preview area 1002, and the right side of the rightmost character area coincides with the right side of the preview area 1002. Note that if the edges of the determined character area and the preview area are perfectly aligned, it may be difficult for the user to select (press) the character area if the character area is small. Therefore, the initial scaling factor may be determined with a certain margin. For example, the initial scaling factor may be determined so that a 10-pixel margin is secured from the left edge of the character area that will be displayed on the leftmost side of the preview area 1002 and from the right edge of the character area that will be displayed on the rightmost side. Furthermore, if UI components such as various operation buttons are superimposed on the preview area 1002, the initial scaling factor may be determined so that the character area does not overlap the UI components. Specifically, the width of the UI components may be subtracted from the width of the preview area 1002, and the initial scaling factor may be determined so that the leftmost and rightmost character areas fit within the width of the remaining area. In the example of the file name setting screen 1000 in Figure 10 mentioned above, there are three operation buttons (enlarge button 1004, reduce button 1005, and return button 1006) in the preview area 1002, so the initial magnification is determined so that the text area does not overlap these buttons. Also, header information related to the printing process may be printed near the top, bottom, left, and right edges of the document to be scanned, and it is unlikely that the text in the text area corresponding to such header information will be adopted as part of the file name. Therefore, text areas that exist within a certain distance (e.g., 50 pixels) from the top, bottom, left, and right edges of the scanned image may be excluded when determining the leftmost and rightmost text areas.

S1803では、S1802で決定した初期変倍率による拡縮後のスキャン画像のどの部分を、ファイル名設定画面1000のプレビュー領域1002内に初期状態で表示するかが決定される。上記S1802で決定された変倍率にて拡縮した後のスキャン画像においては、最も左の文字領域と最も右の文字領域とが収まる幅が、プレビュー領域1002の幅と略一致する。したがって、まず、左右方向についてはプレビュー領域1002の中にこれら左右の文字領域がちょうど収まるように、例えば最も左の文字領域の左辺がプレビュー領域1002の左辺と一致するように初期状態で表示する部分(以下、「初期表示部分」と呼ぶ。)が決まる。その上で、最も上にある文字領域がプレビュー領域1002の上端付近に位置するように、上下方向の初期表示部分を決定する。このとき、初期変倍率の決定時にマージンを考慮していた場合は、同様にマージン分を考慮して、初期表示部分を決定すればよい。例えば、スキャン画像の上端から一定量(例えば50ピクセル)以内に存在する文字領域は表示対象から除外し、それ以外の文字領域の中で最も上にある文字領域が、プレビュー領域1002の上端に表示されるように決定してもよい。図20は、図13のスキャン画像について決定された初期表示部分を示す図である。図20における線の枠が、プレビュー領域1002に初期状態で表示されるスキャン画像の範囲を示している。なお、上述のようにして初期表示部分を決定した結果、類似帳票が存在して初期ファイル名がファイル名入力欄1001に自動で入力された場合における当該初期ファイル名に使用された文字列の文字領域が、プレビュー領域1002に表示されないケースがある。この場合には、例えば、初期ファイル名に使用した文字列の文字領域がプレビュー領域1002の中央に表示されるように、初期表示部分を決定すればよい。この時、ファイル名入力欄1001に自動入力された初期ファイル名を構成する文字列と当該初期ファイル名に使用された文字列の文字領域とを、それぞれ強調表示(例えば色を変更するなど)してもよい。図21は、図13のスキャン画像において文字列「川崎株式会社」が初期ファイル名に自動入力されている場合のスキャン設定画面1000の例である。ここでは、文字列「川崎株式会社」に対応する文字領域がプレビュー領域1002の中央に位置するように、さらに、当該文字領域とファイル名入力欄1001に入力されている文字列「川崎株式会社」の色を変更して表示している。この時、強調表示する文字領域の文字サイズが小さい場合には、適切な文字サイズとなるように初期変倍率を調整してもよい。この調整後の初期変倍率は、例えば、操作部220のタッチパネルのサイズとプレビュー領域1002に初期状態で表示する範囲とに基づき得ることができる。具体的には、初期ファイル名に使用している文字列の文字領域の高さを基に、文字サイズが何ポイントかを求め、求めたポイントが閾値以上(所定サイズ以上)になるようにプレビューの初期変倍率を調整すればよい。 In S1803, it is determined which portion of the scanned image after scaling using the initial scaling factor determined in S1802 will be initially displayed in the preview area 1002 of the file name setting screen 1000. In the scanned image after scaling using the scaling factor determined in S1802, the width of the leftmost and rightmost character areas approximately matches the width of the preview area 1002. Therefore, first, the portion to be initially displayed (hereinafter referred to as the "initial display portion") is determined so that the left and right character areas exactly fit within the preview area 1002 in the horizontal direction, for example, so that the left edge of the leftmost character area coincides with the left edge of the preview area 1002. Then, the initial display portion in the vertical direction is determined so that the topmost character area is positioned near the top edge of the preview area 1002. If margins were taken into consideration when determining the initial scaling factor, the initial display portion can be determined taking those margins into account as well. For example, character areas within a certain distance (e.g., 50 pixels) from the top of the scanned image may be excluded from the display, and the topmost character area among the remaining character areas may be displayed at the top of the preview area 1002. FIG. 20 is a diagram showing the initial display area determined for the scanned image of FIG. 13. The line frame in FIG. 20 indicates the range of the scanned image initially displayed in the preview area 1002. Note that as a result of determining the initial display area as described above, if a similar form exists and an initial file name is automatically entered in the file name input field 1001, the character area of the character string used in the initial file name may not be displayed in the preview area 1002. In this case, the initial display area may be determined so that the character area of the character string used in the initial file name is displayed in the center of the preview area 1002. At this time, the character string constituting the initial file name automatically entered in the file name input field 1001 and the character area of the character string used in the initial file name may each be highlighted (e.g., by changing the color). FIG. 21 shows an example of the scan settings screen 1000 when the character string "Kawasaki Co., Ltd." is automatically entered as the initial file name for the scanned image of FIG. 13 . Here, the character area corresponding to the character string "Kawasaki Co., Ltd." is positioned in the center of the preview area 1002, and the color of this character area and the character string "Kawasaki Co., Ltd." entered in the file name input field 1001 are displayed in different colors. If the character size of the highlighted character area is small, the initial scaling factor may be adjusted to an appropriate character size. This adjusted initial scaling factor can be obtained, for example, based on the size of the touch panel of the operation unit 220 and the range initially displayed in the preview area 1002. Specifically, the character size is calculated based on the height of the character area of the character string used in the initial file name, and the initial preview scaling factor is adjusted so that the calculated point size is equal to or greater than a threshold (predetermined size).

S1804では、S1801~S1803までの処理結果を用いて、前述のファイル名設定画面1000が操作部220に表示される。ユーザは、図10に例示したファイル名設定画面1000を用いて、ストレージサーバ130に保存するスキャン画像についてのファイル名を設定する。以下、詳しく説明する。 In S1804, the file name setting screen 1000 described above is displayed on the operation unit 220 using the processing results of S1801 to S1803. The user uses the file name setting screen 1000, an example of which is shown in FIG. 10, to set a file name for the scanned image to be saved on the storage server 130. This is explained in detail below.

1)ファイル名入力欄
ユーザが、ファイル名入力欄1001をタッチすると、操作部220のタッチパネルの表示がソフトキーボードに切り替わり、任意の文字を入力したり自動入力された文字列を編集したりすることができる。例えば、前述の図21の例のように「川崎株式会社」が自動入力された状態のファイル名入力欄1001の文字列部分をタッチすると、図22に示すソフトキーボード2200が表示される。この際、図22に示すように、入力エリア2201にタッチされた文字列が入力された状態で表示される。これにより、ユーザは、ソフトキーボード2200を操作して、タッチした「川崎株式会社」の文字列を修正することができる。また、図10に示すような文字列が未入力状態のファイル名入力欄1001がタッチされた場合は、入力エリア2201が未入力状態のソフトキーボード2200が表示され、ユーザはこれを操作して任意の文字列をファイル名入力欄1001に入力することができる。
1) File Name Input Field When the user touches the file name input field 1001, the display on the touch panel of the operation unit 220 switches to a soft keyboard, allowing the user to input any characters or edit the automatically input character string. For example, when the user touches the character string portion of the file name input field 1001 in which "Kawasaki Co., Ltd." has been automatically input, as in the example of FIG. 21 described above, the soft keyboard 2200 shown in FIG. 22 is displayed. At this time, as shown in FIG. 22, the input area 2201 is displayed with the touched character string entered. This allows the user to operate the soft keyboard 2200 to correct the touched character string "Kawasaki Co., Ltd." Furthermore, when the user touches the file name input field 1001 in which no character string has been entered, as shown in FIG. 10, the soft keyboard 2200 is displayed with the input area 2201 empty, allowing the user to operate the soft keyboard 2200 to enter any character string into the file name input field 1001.

2)プレビュー領域
プレビュー領域1002には、前述のとおり、変倍処理が施されたスキャン画像の特定部分が表示される。そして、プレビュー領域1002内の任意の文字領域をタッチして選択すると、当該選択した文字領域の文字列がファイル名入力欄1001に追加される。この際、選択したことが分かるよう、選択に係る文字領域に対して下線を付したり、枠で囲んだり、色を付すなどして強調表示してもよい。また、選択した文字領域が中央になるよう表示部分を変更したり或いは表示倍率を変更したりしてもよい。さらに、複数の文字領域が選択された場合においては、それぞれの文字領域に対して異なる色を付す等、文字領域毎に表示態様を異ならせてもよい。そして、ユーザは、一度選択した文字領域を再度タッチすると、選択状態が解除(すなわち、文字領域に付した線や色を削除し元の状態に戻す。)され、ファイル名入力欄1002内の当該文字領域に対応する文字列も削除される。なお、本実施形態では、文字領域が未選択の状態では、プレビュー領域1002に各文字領域を示す枠等は表示しないこととしている。しかし、ユーザがタッチ可能な部分を認識できるよう各文字領域を示す枠等を予め表示しておき、選択された際にはその色を変える等してもよい。また、各文字領域が分かるようにする表示を行うかどうかをユーザがボタン等で切り替えられるようにしてもよい。そして、ユーザは、プレビュー領域1002においてスワイプ操作を行うことで、表示される画像部分を移動することができる。
2) Preview Area As described above, the preview area 1002 displays a specific portion of the scanned image after scaling. When a user touches and selects a text area in the preview area 1002, the text in the selected text area is added to the file name input field 1001. To indicate that a text area has been selected, the selected text area may be highlighted by underlining, surrounding it with a frame, adding a color, or other means. The display area may also be resized or the display magnification may be changed so that the selected text area is centered. Furthermore, when multiple text areas are selected, the display mode for each text area may be different, such as by adding a different color to each text area. When the user touches a selected text area again, the selection is canceled (i.e., the lines and colors added to the text area are removed and the text in the file name input field 1002 is restored to its original state), and the text corresponding to the selected text area is also deleted. In this embodiment, when a text area is unselected, a frame or the like indicating each text area is not displayed in the preview area 1002. However, a frame or the like indicating each character area may be displayed in advance so that the user can recognize the touchable portion, and the color of the frame or the like may be changed when the character area is selected. Alternatively, the user may use a button or the like to switch whether or not to display the character area so that it can be recognized. The user can then move the displayed image portion by swiping in the preview area 1002.

3)各種操作ボタン
「×」マークのボタン1003は、ファイル名入力欄101に入力中の文字列のうち末尾の文字列を削除するための削除ボタンである。「+」マークのボタン1004は、プレビュー領域1002に表示中の画像を拡大して表示させるための拡大ボタンであり、各文字領域をより大きく表示させたいときなどに用いる。「-」マークのボタン1005は、プレビュー領域1002に表示中の画像を縮小して表示させるための縮小ボタンであり、より広い範囲を表示させたいときなどに用いる。拡大や縮小を行う時には、プレビュー領域1002の中央の座標が拡大や縮小を行う前と同一となるように表示位置の調整がなされる。「Uターン矢印」マークのボタン1006は、スワイプ操作による表示位置の移動や、拡大ボタン1004や縮小ボタン1005の押下による表示倍率の変更を行っていた場合に、プレビュー領域1002を初期表示状態に戻すための復帰ボタンである。「送信」ボタン1007は、ファイル名設定画面1000で設定したファイル名にてスキャン画像をファイル化してストレージサーバ130に保存させるためのボタンである。この「送信」ボタン1007の押下に応答して、設定されたファイル名の情報と共にスキャン画像データがMFP連携サーバ120へ送信される。
3) Various Operation Buttons The button 1003 with an "x" mark is a delete button for deleting the last character string of the character string being input into the file name input field 101. The button 1004 with a "+" mark is a zoom-in button for enlarging the image currently displayed in the preview area 1002 and is used when, for example, wanting to display each character area larger. The button 1005 with a "-" mark is a zoom-out button for reducing the image currently displayed in the preview area 1002 and is used when, for example, wanting to display a wider range. When zooming in or out, the display position is adjusted so that the coordinates of the center of the preview area 1002 remain the same as before zooming in or out. The button 1006 with a "U-turn arrow" mark is a return button for returning the preview area 1002 to its initial display state after moving the display position by a swipe operation or changing the display magnification by pressing the zoom-in button 1004 or the zoom-out button 1005. The "Send" button 1007 is a button for converting the scanned image into a file with the file name set on the file name setting screen 1000 and saving the file in the storage server 130. In response to pressing the "Send" button 1007, the scanned image data is sent to the MFP cooperation server 120 together with information about the set file name.

S1805では、初期表示状態のファイル名設定画面1000内に、操作ガイダンスが表示される。この操作ガイダンスによって、初めて操作するユーザでも、プレビュー領域1002内の文字領域をタッチして選択することでファイル名が設定できるということを容易に理解することができる。図23は、図10に示すファイル名設定画面1000におけるプレビュー領域1002の上部に、操作ガイダンスとしてのメッセージ2301を重畳表示した状態を示している。このような操作ガイダンスは、操作方法を既に知っているユーザにとっては不要となるため、タッチ操作やスワイプ操作など何らかのユーザ操作を検知した時点で、当該操作ガイダンスは非表示にされる。また、一般的な文書の上部には例えば文書タイトル、会社名、帳票番号、日付といった、当該文書にとって重要な意味を持つ文字や数字が存在することが多い。よって、これら重要な意味を持つ文字列の文字領域と操作ガイダンスとが重ならないよう、文字列の属性に応じて、プレビュー領域1002に表示する画像部分を下にずらす等してもよい。また、いずれかの文字領域に操作ガイダンスが重なってしまったり或いは文字領域から一定距離以内に入ってしまうときは、重なったり近づきすぎたりしないように操表示位置を決定すればよい。このように、操作ガイダンスの表示位置を固定せずに柔軟に決定することで、ユーザが文字領域を選択しやすくなる。 In S1805, operation guidance is displayed within the file name setting screen 1000 in its initial display state. This operation guidance allows even first-time users to easily understand that a file name can be set by touching and selecting a text area within the preview area 1002. Figure 23 shows a state in which message 2301 serving as operation guidance is superimposed above the preview area 1002 of the file name setting screen 1000 shown in Figure 10. Because such operation guidance is unnecessary for users who already know how to operate the screen, the operation guidance is hidden upon detection of a user operation, such as a touch operation or swipe operation. Furthermore, the top of a typical document often contains characters or numbers that are important to the document, such as the document title, company name, form number, or date. Therefore, to prevent the operation guidance from overlapping with the text area of these important characters, the image portion displayed in the preview area 1002 may be shifted downward, depending on the attributes of the character string. Furthermore, if the operation guidance overlaps one of the character areas or comes within a certain distance of the character area, the display position can be determined so that it does not overlap or get too close. In this way, by flexibly determining the display position of the operation guidance rather than fixing it, it becomes easier for the user to select a character area.

S1806は、ユーザ操作の有無の監視処理である。所定間隔でユーザ操作の有無をチェックし、何らかのユーザ操作が検知されればS1807に進む。そして、S1807では、前述のとおり、操作ガイダンスが非表示にされる。 S1806 is a process for monitoring whether or not a user operation has occurred. The presence or absence of a user operation is checked at predetermined intervals, and if any user operation is detected, the process proceeds to S1807. Then, in S1807, as described above, the operation guidance is hidden.

S1808~S1815は、検知されたユーザ操作の内容に応じて次の処理を決定する判定処理である。なお、検知されたユーザ操作に対応する処理が完了するとS1806に戻り、次のユーザ操作が検知されるのを待つ。 Steps S1808 to S1815 are determination processes that determine the next process based on the content of the detected user operation. Once the process corresponding to the detected user operation is complete, the process returns to step S1806 and waits for the next user operation to be detected.

S1808では、検知されたユーザ操作が、プレビュー領域1002内のいずれかの文字領域へのタッチ操作であったかどうかが判定される。具体的には、まず、タッチされた位置の座標をスキャン画像の座標に対応付けて変換する。そして、変換後の座標が、前述の文字認識結果(図15を参照)の“regions”で特定される各文字領域のうちいずれかの領域内に含まれれば、文字領域へのタッチであると判定する。判定の結果、文字領域へのタッチであればS1816に進み、文字領域へのタッチでなければS1809に進む。文字領域へのタッチであった場合のS1816では、タッチされた文字領域が、既に選択されているかどうかが判定される。タッチされたのが未選択の文字領域の場合はS1817に進み、タッチされたのが選択済みの文字領域の場合はS1818に進む。 In S1808, it is determined whether the detected user operation was a touch operation on any of the character areas in the preview area 1002. Specifically, the coordinates of the touched position are first converted to correspond to the coordinates of the scanned image. Then, if the converted coordinates are included in any of the character areas identified by "regions" in the character recognition result (see FIG. 15) described above, it is determined that the operation touched a character area. If the determination shows that the operation touched a character area, the process proceeds to S1816; if the operation did not touch a character area, the process proceeds to S1809. In S1816, if the operation touched a character area, it is determined whether the touched character area has already been selected. If the touched character area was an unselected character area, the process proceeds to S1817; if the touched character area was a selected character area, the process proceeds to S1818.

S1817では、タッチされた文字領域の文字列がファイル名入力欄1001に追加され、当該文字領域に対して、選択されたことを示す強調表示処理がなされる。この際、ファイル名入力欄1001に他の文字列が入力されていなければ、そのまま文字列が追加される。そして、当該文字領域をファイル名設定に使用したことが、ファイル名設定時の入力情報として記憶される。一方、ファイル名入力欄1001に既に他の文字領域の文字列が入力されていた場合は、区切り文字が追加された後、タッチされた文字領域の文字列が追加される。この場合、当該文字領域をファイル名設定に使用したこと事実に加え、「第1の文字領域」、「区切り文字」、「第2の文字領域」といったように、文字列間に区切り文字を挿入したことも記憶される。図24は、「見積書」と文字認識された文字領域が最初に選択され、続いて「下丸子株式会社」と文字認識された文字領域が選択された場合のファイル設定画面1000を示した図である。ファイル名入力欄1001には、タッチした文字領域の順に対応する2つの文字列が入力されており、当該2つの文字列の間にセパレータとしてのアンダースコアが入力されている。 In S1817, the character string in the touched character area is added to the file name input field 1001, and the character area is highlighted to indicate that it has been selected. At this time, if no other character string has been entered in the file name input field 1001, the character string is added as is. The fact that the character area was used to set the file name is then stored as input information at the time of file name setting. On the other hand, if another character string has already been entered in the file name input field 1001, a delimiter is added, and then the character string in the touched character area is added. In this case, in addition to the fact that the character area was used to set the file name, the insertion of a delimiter between the character strings, such as "first character area," "delimiter," and "second character area," is also stored. Figure 24 shows the file setting screen 1000 when the character area recognized as "quote" is first selected, followed by the character area recognized as "Shimomaruko Co., Ltd." Two character strings corresponding to the order of the touched character areas are entered in the file name input field 1001, with an underscore inserted between the two character strings as a separator.

S1818では、タッチされた文字領域の文字列がファイル名入力欄1001から削除され、当該文字領域についての選択されたことを示す強調表示が取り消され、選択されていないことを示す通常表示の状態に戻る。また、その文字列に区切り文字が付いていた場合は、当該区切り文字も一緒に削除される。例えば、初期ファイル名の生成に用いたファイル名構成が[「第1の文字領域」、「区切り文字」、「第2の文字領域」]であったとする。この場合において、「第1の文字領域」となっている文字領域をユーザがタッチした場合は、当該第1の文字領域の文字列と一緒に区切り文字も削除され、ファイル名入力欄1001には「第2の文字領域」の文字列のみが残ることになる。 In S1818, the character string in the touched character area is deleted from the file name input field 1001, the highlighting of the character area indicating that it has been selected is canceled, and the display returns to the normal state indicating that it is not selected. Furthermore, if the character string includes a delimiter, the delimiter is also deleted. For example, assume that the file name structure used to generate the initial file name is ["first character area", "delimiter", "second character area"]. In this case, if the user touches the character area that is the "first character area", the delimiter is deleted along with the character string in the first character area, and only the character string in the "second character area" remains in the file name input field 1001.

検知されたユーザ操作が文字領域へのタッチでなかった場合のS1809では、検知されたユーザ操作が、プレビュー領域1002内でのスワイプ操作であったかどうかが判定される。スワイプ操作が検知された場合はS1819に進み、そうでなければS1810に進む。 If the detected user operation was not a touch on the text area, in S1809, it is determined whether the detected user operation was a swipe operation within the preview area 1002. If a swipe operation was detected, the process proceeds to S1819; if not, the process proceeds to S1810.

S1819では、プレビュー領域1002に表示する画像部分をスワイプされた方向に移動させる処理が実行される。具体的には、ユーザがタッチパネル上で指を動かした移動量に応じて、プレビュー領域1002に表示する画像部分を更新する。この処理は、プレビュー領域1002内の文字領域以外の領域でのタッチ操作を検知した場合に限定して行ってもよい。また、文字領域へのタッチ操作であった場合もその後のユーザが指を移動させた量に応じて文字領域へのタッチとして扱わずにスワイプ操作として扱ってもよい。 In S1819, processing is performed to move the image portion displayed in preview area 1002 in the swipe direction. Specifically, the image portion displayed in preview area 1002 is updated depending on the amount of movement of the user's finger on the touch panel. This processing may be performed only when a touch operation is detected in an area other than the text area in preview area 1002. Furthermore, even if the touch operation is on the text area, it may be treated as a swipe operation rather than a touch on the text area depending on the amount the user subsequently moves their finger.

S1810では、検知されたユーザ操作が、拡大ボタン1004又は縮小ボタン1005の押下であったかどうかが判定される。拡大ボタン1004又は縮小ボタン1005の押下であった場合はS1820に進み、そうでなければS1811に進む。 In S1810, it is determined whether the detected user operation was a press of the Zoom In button 1004 or the Zoom Out button 1005. If the operation was a press of the Zoom In button 1004 or the Zoom Out button 1005, the process proceeds to S1820; if not, the process proceeds to S1811.

S1820では、プレビュー領域1002に表示中の画像部分を、拡大又は縮小する処理が実行される。具体的には、拡大ボタン1004が押下されていた場合はスキャン画像の変倍率を一定量増やし、縮小ボタン1005が押下されていた場合はスキャン画像の変倍率を一定量減らす処理がなされる。ここでの一定量は任意であるが、例えば現状の倍率を基準として10%程度である。この際、一定量の拡大又は縮小を行うまでの間に、初期変倍率が存在したり、スキャン画像の幅/高さとプレビュー領域1002の幅/高さとが一致する倍率が存在したときは、その倍率で留めてもよい。なお、プレビュー領域1002内にスキャン画像全体が収まる倍率(最小倍率)未満は縮小されず、最小の文字領域が一定サイズの大きさになる倍率(最大倍率)以上には拡大できないように制御される。 In S1820, a process is executed to enlarge or reduce the image portion displayed in the preview area 1002. Specifically, if the enlarge button 1004 is pressed, the magnification of the scanned image is increased by a fixed amount, and if the reduce button 1005 is pressed, the magnification of the scanned image is decreased by a fixed amount. The fixed amount here is arbitrary, but is, for example, approximately 10% based on the current magnification. In this case, if an initial magnification or magnification at which the width/height of the scanned image matches the width/height of the preview area 1002 exists before the fixed amount of enlargement or reduction is performed, the magnification may be kept at that value. Note that the scanned image will not be reduced below a magnification at which the entire scanned image fits within the preview area 1002 (minimum magnification), and is controlled so that it cannot be enlarged above a magnification at which the smallest character area becomes a fixed size (maximum magnification).

S1811では、検知されたユーザ操作が、復帰ボタン1006の押下であったかどうかが判定される。復帰ボタン1006の押下であった場合はS1821に進み、そうでなければS1812に進む。 In S1811, it is determined whether the detected user operation was a press of the return button 1006. If it was a press of the return button 1006, proceed to S1821; if not, proceed to S1812.

S1821では、プレビュー領域1002を初期表示状態に戻す処理が実行される。具体的には、プレビュー領域1002に表示するスキャン画像の変倍率をS1802で決定した初期変倍率に戻し、さらに、プレビュー領域1002への表示部分をS1803で決定した初期表示部分に戻す処理がなされる。この際、初期変倍率や初期表示部分の調整がなされていた場合には、当該調整後の初期変倍率や初期表示部分に戻すのが望ましい。 In S1821, processing is performed to return the preview area 1002 to its initial display state. Specifically, the magnification of the scanned image displayed in the preview area 1002 is returned to the initial magnification determined in S1802, and the display area in the preview area 1002 is returned to the initial display area determined in S1803. At this time, if the initial magnification or initial display area has been adjusted, it is desirable to return it to the initial magnification and initial display area after the adjustments.

S1812では、検知されたユーザ操作が、ファイル名入力欄1001に入力されている文字列へのタッチ操作であったかどうかが判定される。この際、ファイル名入力欄1001に入力されている文字列の後ろの空白領域に対してのタッチ操作が検知された場合は、最後尾の文字列へのタッチ操作と扱えばよい。ファイル名入力欄1001に入力されている文字列へのタッチ操作であればS1822に進み、そうでなければS1813に進む。 In S1812, it is determined whether the detected user operation was a touch operation on the character string entered in the file name input field 1001. At this time, if a touch operation on the blank area after the character string entered in the file name input field 1001 is detected, it can be treated as a touch operation on the last character string. If it is a touch operation on the character string entered in the file name input field 1001, proceed to S1822; if not, proceed to S1813.

S1822では、タッチ操作がなされた文字列が入力エリア2201に入力された状態の編集用ソフトキーボードが操作部220に表示される。いま、ファイル名設定画面1000が図24に示す状態であったと仮定する。この状態下で、ファイル名入力欄1001の「見積書」の文字列へのタッチ操作が検知された場合は、ソフトキーボードの入力エリア2201に「見積書」の文字列が入力された状態のソフトキーボード2200が表示されることになる。また、「下丸子株式会社」の文字列へのタッチ操作或いはその後ろの空白領域へのタッチ操作が検知された場合は、末尾の文字列である「_下丸子株式会社」の文字が入力エリア2201に入力された状態のソフトキーボード2200が表示されることになる。なお、ソフトキーボード2200の操作は一般的なキーボードの操作と同じであるためその説明を省略する。続くS1823は、ユーザ操作の有無の監視処理である。ソフトキーボード2200におけるOKボタン2202の押下の有無を所定間隔でチェックし、OKボタン2202の押下が検知されればS1824に進む。なお、OKボタン以外のキーが押下された場合は、当該押下されたキーに応じて、入力エリア2201に表示されている文字列の編集が行なわれることになる。例えば、ユーザは、ソフトキーボード2200を用いて、文字認識処理で誤認識していた文字列の修正を行うことができる。 In S1822, the editing soft keyboard is displayed on the operation unit 220 with the touched character string entered in the input area 2201. Assume now that the file name setting screen 1000 is in the state shown in FIG. 24. In this state, if a touch operation on the character string "Estimate" in the file name input field 1001 is detected, the soft keyboard 2200 is displayed with the character string "Estimate" entered in the input area 2201 of the soft keyboard. Furthermore, if a touch operation on the character string "Shimomaruko Co., Ltd." or the blank area following it is detected, the soft keyboard 2200 is displayed with the final character string, "_Shimomaruko Co., Ltd.", entered in the input area 2201. Note that operation of the soft keyboard 2200 is the same as operation of a general keyboard, and therefore a description thereof will be omitted. The following S1823 is a process for monitoring whether or not a user operation has occurred. The system checks at predetermined intervals whether the OK button 2202 on the soft keyboard 2200 has been pressed, and if pressing of the OK button 2202 is detected, the system proceeds to S1824. If a key other than the OK button is pressed, the character string displayed in the input area 2201 is edited according to the pressed key. For example, the user can use the soft keyboard 2200 to correct character strings that have been incorrectly recognized during character recognition processing.

S1824では、区切り文字を削除する変更が行われたかかが判定される。本実施形態ではこの判定は、S1812でタッチされた文字列がS1822で区切り文字とともに表示された場合にのみ行なわれ、区切り文字とともに表示されなかった文字列については、区切り文字の削除が行われなかったものとして扱うものとする。すなわち、S1822で文字列の先頭に区切り文字が付与された状態で表示された場合、OKボタン2202が押下された時点で、文字列の先頭に区切り文字が存在するかどうかに基づいて、区切り文字を削除するような文字列の編集が行われたか判定する。例えば、S1812で「下丸子株式会社」の文字列へのタッチ操作がなされると、上述のとおりソフトキーボード2200の入力エリア2201には区切り文字が先頭に付された「_下丸子株式会社」の状態で表示される。そこで、先頭に区切り文字が残っているかどうかをチェックすることで、区切り文字の削除が行われたかどうかを判定する。また、S1812で「見積書」の文字列へのタッチ操作がなされると、上述のとおり入力エリア2201には「見積書」が表示されるので、この場合は、区切り文字を削除する変更は行われなかったものとして扱う。 In S1824, it is determined whether a change to delete a delimiter has been made. In this embodiment, this determination is made only if the character string touched in S1812 is displayed with a delimiter in S1822; character strings that are not displayed with a delimiter are treated as if the delimiter has not been deleted. That is, if the character string is displayed with a delimiter added to the beginning in S1822, when the OK button 2202 is pressed, it is determined whether the character string has been edited to delete the delimiter based on whether a delimiter is present at the beginning of the character string. For example, if the character string "Shimomaruko Co., Ltd." is touched in S1812, the input area 2201 of the soft keyboard 2200 displays "_Shimomaruko Co., Ltd." with the delimiter added at the beginning, as described above. Therefore, by checking whether a delimiter remains at the beginning, it is determined whether the delimiter has been deleted. Furthermore, when the character string "quote" is touched in S1812, "quote" is displayed in the input area 2201 as described above, so in this case, it is treated as if no change to delete the delimiter was made.

なお、上述した例では、S1812でタッチされた文字列の前に区切り文字が存在する場合に、S1822で、区切り文字が先頭に付された文字列が入力エリア2201に表示されるものとして説明したが、これに限るものではない。例えば、S1812でタッチされた文字列の後ろに区切り文字が存在する場合に、S1822で、当該タッチされた文字列の後ろに区切り文字を付して入力エリア2201に表示するように構成した場合も、S1824で同様の判定を行うことができる。すなわち、図24の例で「見積書」の文字列へのタッチ操作に応じてソフトキーボード2200の入力エリア2201に「見積書_」のように末尾に区切り文字を付して表示するように構成した場合について説明する。この場合は、本ステップS1824において末尾に区切り文字が残っているかどうかをチェックすることで、区切り文字の削除が行われたかどうかを判定すればよい。 In the example described above, if a delimiter character exists before the character string touched in S1812, the character string with the delimiter character added to the beginning is displayed in input area 2201 in S1822. However, this is not limited to this. For example, if a delimiter character exists after the character string touched in S1812 and the touched character string is displayed in input area 2201 with the delimiter character added to the end in S1822, a similar determination can be made in S1824. That is, in the example of Figure 24, a delimiter character is added to the end of input area 2201 of soft keyboard 2200 in response to a touch operation on the character string "quote." In this case, it is possible to determine whether the delimiter character has been deleted by checking whether a delimiter character remains at the end in step S1824.

S1824で区切り文字の削除が行われたと判定された場合はS1825に進む。そして、S1825では、区切り文字がファイル名から削除されたことが記憶される。例えば、初期ファイル名の生成に用いたファイル名構成が[「第1の文字領域」、「区切り文字」、「第2の文字領域」]であったとする。この時に、ファイル名入力欄1001における「第2の文字領域」に対応する文字列をタッチし、ソフトキーボード2200を使用して区切り文字を削除すると、変更後のファイル名構成は[「第1の文字領域」、「第2の文字領域」]となる。そして、この変更後のファイル名構成の情報が保持されることになる。 If it is determined in S1824 that the delimiter has been deleted, the process proceeds to S1825. Then, in S1825, it is stored that the delimiter has been deleted from the file name. For example, suppose the file name structure used to generate the initial file name was ["first character area", "delimiter", "second character area"]. At this time, if the character string corresponding to "second character area" in the file name input field 1001 is touched and the delimiter is deleted using the soft keyboard 2200, the changed file name structure will become ["first character area", "second character area"]. Then, the information about this changed file name structure will be retained.

続くS1826では、ファイル名に区切り文字を追加する変更が行われたかかが判定される。区切り文字の追加が行われたと判定された場合はS1827に進む。そして、S1827では、区切り文字がファイル名に追加されたことが記憶される。例えば、初期ファイル名の生成に用いたファイル名構成が[「第1の文字領域」、「第2の文字領域」]であったとする。この時に、ファイル名入力欄1001における「第2の文字領域」に対応する文字列をタッチし、ソフトキーボード2200を使用して区切り文字を先頭に追加すると、変更後のファイル名構成は[「第1の文字領域」、「区切り文字」、「第2の文字領域」]となる。そして、この変更後のファイル名構成の情報が保持されることになる。 Next, in S1826, it is determined whether a change has been made to add a delimiter to the file name. If it is determined that a delimiter has been added, the process proceeds to S1827. Then, in S1827, it is stored that a delimiter has been added to the file name. For example, suppose the file name structure used to generate the initial file name was ["first character area", "second character area"]. At this time, if the character string corresponding to "second character area" in the file name input field 1001 is touched and a delimiter is added to the beginning using the soft keyboard 2200, the changed file name structure will be ["first character area", "delimiter", "second character area"]. Then, the information about this changed file name structure is retained.

そして、S1828では、操作部220の表示画面が、ソフトキーボード2200からファイル名設定画面1000に戻された上で、変更後の内容にファイル名が修正される。この際、修正を行った文字列に対応する文字領域がプレビュー領域1002の中央にくるようにスキャン画像の表示部分を変更してもよい。なお、ファイル名に使用されている文字列の一部が修正されても、ファイル名構成が変わっていなければ、ファイル名構成の情報が新たに保持されることはない。ただし、ある文字列に含まれる全ての文字を削除する修正を行った場合はファイル名構成も変わる。よってこの場合にも(フローチャートでは省略しているが、)、変更後のファイル名の構成情報が保持されることになる。例えば、初期ファイル名の生成に用いたファイル名構成が[「第1の文字領域」、「区切り文字」、「第2の文字領域」]であったとする。この時に、ファイル名入力欄1001における「第2の文字領域」に対応する文字列をタッチし、ソフトキーボード2200を使用してすべての文字を削除したとする。この場合、不要となった区切り文字も削除されて変更後のファイル名構成は[「第1の文字領域」]に変わるので、当該変更後のファイル名構成の情報が保持されることになる。 In step S1828, the display screen of the operation unit 220 is returned to the file name setting screen 1000 from the soft keyboard 2200, and the file name is revised to reflect the changes. At this time, the display portion of the scanned image may be changed so that the character area corresponding to the revised character string is centered in the preview area 1002. Even if part of the character string used in the file name is revised, if the file name structure remains unchanged, no new information about the file name structure is retained. However, if a revision is made by deleting all characters from a certain character string, the file name structure also changes. Therefore, even in this case (although this is omitted from the flowchart), the structure information of the revised file name is retained. For example, suppose the file name structure used to generate the initial file name was ["first character area," "delimiter," "second character area"]. At this time, suppose the character string corresponding to the "second character area" in the file name input field 1001 is touched and all characters are deleted using the soft keyboard 2200. In this case, the unnecessary delimiter is also deleted, and the revised file name structure changes to ["first character area"], so the information about the revised file name structure is retained.

S1813では、検知されたユーザ操作が、文字列が入力されていない状態の空欄のファイル名入力欄1001へのタッチ操作であったかどうかが判定される。空欄のファイル名入力欄1001へのタッチ操作であればS1829に進み、そうでなければS1814に進む。 In S1813, it is determined whether the detected user operation was a touch operation on the blank file name input field 1001 where no string has been entered. If it was a touch operation on the blank file name input field 1001, the process proceeds to S1829; if not, the process proceeds to S1814.

S1829では、入力エリア2201に何も入力されていない状態の文字列追加用ソフトキーボードが操作部220に表示される。続くS1830は、ユーザ操作の有無の監視処理である。ソフトキーボード2200におけるOKボタン2202の押下の有無を所定間隔でチェックし、OKボタン2202の押下が検知されればS1831に進む。そして、S1831では、操作部220の表示画面が、ソフトキーボード2200からファイル名設定画面1000に戻された上で、入力された文字列がファイル名に追加される。 In S1829, the soft keyboard for adding a character string is displayed on the operation unit 220 with nothing entered in the input area 2201. The following S1830 is a process for monitoring whether or not a user operation has occurred. The process checks at predetermined intervals whether or not the OK button 2202 on the soft keyboard 2200 has been pressed, and if pressing of the OK button 2202 is detected, the process proceeds to S1831. Then, in S1831, the display screen of the operation unit 220 is returned from the soft keyboard 2200 to the file name setting screen 1000, and the entered character string is added to the file name.

S1814では、検知されたユーザ操作が、削除ボタン1003の押下であったかどうかが判定される。削除ボタン1003の押下であった場合はS1832に進み、そうでなければS1815に進む。S1832では、ファイル名入力欄1001に入力されている文字列のうち末尾の文字列が削除される。例えば、初期ファイル名の生成に用いたファイル名構成が[「第1の文字領域」、「区切り文字」、「第2の文字領域」でれば、削除ボタン1003の押下によって「第2の文字領域」に対応する文字列が削除される。この結果、削除後のファイル名構成は[「第1の文字領域1]となり、ファイル名は「第1の文字領域」に対応した文字列のみとなる。この際、削除された文字列に対応する文字領域については、プレビュー領域1002において非選択を示す状態に戻される。そして、変更後のファイル名構成の情報が保持されることになる。 In S1814, it is determined whether the detected user operation was a press of the Delete button 1003. If the Delete button 1003 was pressed, the process proceeds to S1832; if not, the process proceeds to S1815. In S1832, the last character of the string entered in the file name input field 1001 is deleted. For example, if the file name structure used to generate the initial file name is ["First character area", "Delimiter", "Second character area", pressing the Delete button 1003 deletes the character string corresponding to the "Second character area". As a result, the file name structure after deletion becomes ["First character area 1"], and the file name will contain only the character string corresponding to the "First character area". At this time, the character area corresponding to the deleted character string is returned to a state indicating that it is not selected in the preview area 1002. The information about the changed file name structure is then retained.

S1815では、検知されたユーザ操作が、送信ボタン1007の押下であったかどうかが判定される。送信ボタン1007の押下であった場合は、本処理を終了し、図12のフローチャートのS1210に進む。 In S1815, it is determined whether the detected user operation was a press of the Send button 1007. If the Send button 1007 was pressed, this processing ends and the process proceeds to S1210 in the flowchart of Figure 12.

以上が、S1209にて実行されるファイル名設定処理の内容である。 The above is the content of the file name setting process executed in S1209.

<変形例1>
上述のS1802(初期変倍率の決定)において、最も左の文字領域と最も右の文字領域とに基づき決定した初期変倍率に従うと、プレビュー表示される各文字領域の高さ平均が所定の閾値未満となる場合は、所定の閾値以上となるように初期変倍率を変更してもよい。この場合において、「高さの平均」は、全文字領域についての平均でもよいし、一部の文字領域についての平均でもよい。一部の文字領域についての平均の例としては、決定された初期変倍率にてプレビュー領域1002に表示されることになる文字領域の高さの平均や、スキャン画像の特定部分(例えば上半分)の文字領域の高さの平均などが挙げられる。具体例を説明する。いま、最も左の文字領域の左端と最も右の文字領域の右端との間隔(幅)が2000px、プレビュー領域1002の幅が800px、所定の閾値が15pxであったとする。ここで、全文字領域の高さの平均が60pxであった場合に算出される初期変倍率は0.4(=800÷2000)であり、全文字領域の高さの平均は24px(=60×0.4)で所定の閾値未満ではないため0.4がそのまま初期変倍率となる。一方、全文字領域の高さの平均が30pxであった場合には、全文字領域の高さの平均は12px(=30×0.4)となる。この場合、所定の閾値未満となるため、全文字領域の高さの平均が所定の閾値以上(ここでは閾値と同じ値)になるように、初期変倍率を0.5(=0.4×15÷12)に変更する。図25に、文字領域の高さの平均が閾値を満たせずに初期変倍率を調整した場合の、スキャン設定画面1000の初期表示の一例を示す。この例では、初期変倍率の値を大きくする調整を行った後、S1803において最も左の文字領域の左端と最も上の文字領域の上端に合わせて表示部分が決定されている。その結果、帳票の右側に相当する領域が表示部分に含まれなくなるが、プレビュー領域1002内に存在する各文字領域については視認性が確保されることになる。
<Modification 1>
In the above-described step S1802 (determining the initial scaling factor), if the average height of each character area displayed in preview falls below a predetermined threshold value when the initial scaling factor is determined based on the leftmost and rightmost character areas, the initial scaling factor may be changed so that it is equal to or greater than the predetermined threshold value. In this case, the "average height" may be the average for all character areas or the average for a portion of the character areas. Examples of the average for a portion of the character areas include the average height of the character areas displayed in the preview area 1002 at the determined initial scaling factor, or the average height of the character areas in a specific portion of the scanned image (e.g., the upper half). A specific example will be described. Assume that the distance (width) between the left edge of the leftmost character area and the right edge of the rightmost character area is 2000 px, the width of the preview area 1002 is 800 px, and the predetermined threshold value is 15 px. In this example, if the average height of all character areas is 60 px, the calculated initial scaling factor is 0.4 (= 800 ÷ 2000). Since the average height of all character areas is 24 px (= 60 × 0.4), which is not below the predetermined threshold, 0.4 becomes the initial scaling factor. On the other hand, if the average height of all character areas is 30 px, the average height of all character areas is 12 px (= 30 × 0.4). Since this is below the predetermined threshold, the initial scaling factor is changed to 0.5 (= 0.4 × 15 ÷ 12) so that the average height of all character areas is equal to or greater than the predetermined threshold (here, the same value as the threshold). Figure 25 shows an example of the initial display of the scan setting screen 1000 when the initial scaling factor is adjusted because the average height of the character areas does not satisfy the threshold. In this example, after the initial scaling factor is increased, the display area is determined in step S1803 to match the left edge of the leftmost character area and the top edge of the topmost character area. As a result, the area corresponding to the right side of the form is not included in the display portion, but the visibility of each character area present in the preview area 1002 is ensured.

<変形例2>
上述のS1803(初期表示部分の決定)において、初期ファイル名に使用した文字領域が複数ある場合は、使用した文字領域のうち一番上にある文字領域がプレビュー領域1002に表示されるようにしてもよい。また、各文字領域における文字列の意味種別を判断し、ファイル名に使用する可能性の高い文字領域がプレビュー領域1002内に表示されるように表示部分を調整してもよい。また、予め指定した文字領域の数分の文字領域がプレビュー領域1002に表示されるように、表示部分を決定してもよい。さらに、初期ファイル名に使用する文字列の文字領域のうち、一番上にある文字領域と一番下にある文字領域の中間地点が、プレビュー領域1002の中央にくるように表示部分を決定してもよい。
<Modification 2>
In the above-described step S1803 (determining the initial display area), if there are multiple character areas used in the initial file name, the topmost character area among the used character areas may be displayed in the preview area 1002. Alternatively, the semantic type of the character string in each character area may be determined, and the display area may be adjusted so that the character area most likely to be used in the file name is displayed in the preview area 1002. Alternatively, the display area may be determined so that a pre-specified number of character areas are displayed in the preview area 1002. Furthermore, the display area may be determined so that the midpoint between the topmost and bottommost character areas of the character string used in the initial file name is located in the center of the preview area 1002.

<変形例3>
上述のS1805(操作ガイダンスの表示)において、類似帳票のファイル名構成に従った初期ファイル名がファイル名入力欄1001に自動入力されている場合、当該初期ファイル名に使用されている文字列の文字領域に重ならないように表示してもよい。この際、初期ファイル名に使用されている文字列が複数存在し、それらの文字領域に対して重ならないように表示することが困難な場合も考えられる。このような場合には、初期ファイル名の先頭にある文字列の文字領域を優先し、末尾にある文字列の文字領域の一部又は全部に重ねて表示してもよい。また、初期ファイル名以外の文書プロパティ、例えばメタデータなどを設定する場合には、その文書プロパティのタイプに応じて操作ガイダンスの重なりを避ける文字領域を判定し、操作ガイダンスの表示位置を決めてもよい。例えば、タイプが日付型の文書プロパティに値をセットする場合であれば、対象文書における日付の文字領域には重ならないように操作ガイダンスを表示する。このとき、各文字領域に対応する文字列が日付かどうかは、スキャン画像から抽出された文字列が特定の文字配列に当て嵌るかによって判断する。例えば、yy/mm/ddの形式における、「yy」、「mm」、「dd」のそれぞれに数字が入る場合は、日付であると判断することができる。
<Modification 3>
In the above-described step S1805 (display of operation guidance), if an initial file name based on the file name structure of a similar form is automatically entered in the file name input field 1001, the operation guidance may be displayed so as not to overlap the character area of the character string used in the initial file name. In this case, if multiple character strings are used in the initial file name, it may be difficult to display the operation guidance without overlapping the character areas of those character strings. In such cases, the character area of the first character string in the initial file name may be given priority, and the operation guidance may be displayed overlapping part or all of the character area of the last character string. Furthermore, when setting document properties other than the initial file name, such as metadata, the character area where the operation guidance should not overlap may be determined based on the type of the document property, and the display position of the operation guidance may be determined accordingly. For example, when setting a value for a date-type document property, the operation guidance is displayed so as not to overlap the character area of the date in the target document. Whether the character string corresponding to each character area is a date is determined by whether the character string extracted from the scanned image matches a specific character sequence. For example, if numbers are entered in the "yy,""mm," and "dd" fields in the yy/mm/dd format, it can be determined to be a date.

<変形例4>
上述のS1822(編集用ソフトキーボードの表示)において、入力エリア2201内に、タッチされた文字列を入力状態にして表示するのに代えて、ファイル名全体を入力状態にして表示してもよい。この場合、編集対象をユーザが誤認しないよう、他の文字列と区別する強調表示(色を変える、枠を付すなど)を行ったり、カーソルをその末尾に表示するなどし、編集対象の範囲が分かるように表示する。また、ファイル名入力欄1001に入力されている文字列に対するタッチ操作に応答して編集用ソフトキーボードを表示するのに代えて、さらに追加的なユーザ操作(例えば不図示の専用ボタンの押下)を待って編集用ソフトキーボードを表示するようにしてもよい。
<Modification 4>
In the above-described step S1822 (display of the editing soft keyboard), instead of displaying the touched character string in an input state in the input area 2201, the entire file name may be displayed in an input state. In this case, to prevent the user from misidentifying the character string to be edited, the character string may be highlighted (by changing the color, adding a frame, etc.) to distinguish it from other character strings, or the cursor may be displayed at the end of the character string, so that the range of the character string to be edited can be clearly seen. Also, instead of displaying the editing soft keyboard in response to a touch operation on the character string input in the file name input field 1001, the editing soft keyboard may be displayed after waiting for an additional user operation (for example, pressing a dedicated button, not shown).

<変形例5>
また、本実施形態の説明では、ユーザによる文字領域へのタッチ操作が検出された場合には、タッチされた文字領域の文字列をファイル名に追加或いは削除する処理(S1817、S1818)が実行される。しかしながら、システムの応答が遅く、タッチ操作を検知してからその対象文字列の追加や削除がファイル名に反映されるまでに時間が掛かることがある。この場合、ユーザは自身のタッチ操作にシステムが反応していないと勘違いし、何度も同じ文字領域に対してタッチ操作を繰り返すことが考えられる。こうなると、同じ文字領域の文字列の追加と削除が繰り返し行われて、ユーザが所望する状態で止めることができない場合がありうる。例えば、削除対象の文字列を複数回タッチすると、削除対象の文字列が再入力されたりといったことが起こり得る。そこで、追加・削除処理中に同じ文字領域に対するタッチ操作が繰り返し行われないよう、追加・削除処理が完了するまでは同じ文字領域に対する新たな追加・削除のためのタッチ操作を受け付けないようにしてもよい。この際、処理中であることを示すメッセージの表示を併せて行うようにしてもよい。これにより、ファイル名設定時の入力操作において、ユーザが意図しない文字列の追加や削除が実行されてしまうのを防ぐことができる。
<Modification 5>
In addition, in the description of this embodiment, when a user's touch operation on a character area is detected, a process (S1817, S1818) is executed to add or delete the character string in the touched character area to the file name. However, the system response is slow, and it may take some time from the detection of the touch operation until the addition or deletion of the target character string is reflected in the file name. In this case, the user may mistakenly believe that the system is not responding to their touch operation and repeatedly touch the same character area. This may result in repeated addition and deletion of character string in the same character area, making it impossible for the user to stop the process as desired. For example, touching the character string to be deleted multiple times may result in the character string being re-entered. Therefore, to prevent repeated touch operations on the same character area during the addition or deletion process, a new touch operation for addition or deletion on the same character area may not be accepted until the addition or deletion process is completed. At this time, a message indicating that processing is in progress may also be displayed. This prevents the user from unintentionally adding or deleting character strings during input operations when setting a file name.

(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
(Other Examples)
The present invention can also be realized by supplying a program that realizes one or more of the functions of the above-described embodiments to a system or device via a network or a storage medium, and having one or more processors in the computer of the system or device read and execute the program.The present invention can also be realized by a circuit (e.g., an ASIC) that realizes one or more of the functions.

Claims (48)

コンピュータを、
画像を表示する第1領域と、前記画像についての情報が表示される第2領域と、を含むUI画面を表示するように制御する制御手段と、
保存手段、
として機能させるためのアプリケーションであって、
前記制御手段は、前記第1領域に含まれる前記画像内の所望の領域が選択されるための、前記画像上でのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御し、
前記保存手段は、選択された前記領域を示す情報を、ファイル名の生成に用いるために保存し、
前記制御手段は、前記領域の前記選択を解除するための、前記画像上でのユーザからの指示を受け付けると、選択された前記領域に対応する前記文字を前記第2領域から削除するように制御することが可能であり、
前記領域を示す情報は、前記画像の後にスキャンされて得られる別の画像を含むファイルのファイル名の生成に用いられる
ことを特徴とするアプリケーション。
Computer,
a control means for controlling the display of a UI screen including a first area for displaying an image and a second area for displaying information about the image;
storage means,
An application for functioning as
the control means, when receiving an instruction from a user on the image for selecting a desired area in the image included in the first area, controls to display characters corresponding to the selected area in the second area;
the saving means saves information indicating the selected area for use in generating a file name;
the control means is capable of performing control such that, when receiving an instruction from a user on the image to cancel the selection of the area, the character corresponding to the selected area is deleted from the second area;
The information indicating the area is used to generate a file name for a file containing another image obtained by scanning after the image.
An application characterized by:
前記保存手段は、選択された前記領域を示す情報を、同じ種類の画像を含む任意のファイルのファイル名の生成に用いるために保存する
ことを特徴とする請求項1に記載のアプリケーション。
2. The application according to claim 1, wherein the saving means saves information indicating the selected area for use in generating a file name for any file containing an image of the same type.
前記制御手段は、前記第2領域に文字が表示されていない状態で、前記第1領域に含まれる前記画像内の未だ選択されていなかった領域が選択されるためのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御する
ことを特徴とする請求項1又は2に記載のアプリケーション。
The application described in claim 1 or 2, characterized in that when the control means receives an instruction from a user to select an area in the image included in the first area that has not yet been selected while no text is displayed in the second area, the control means controls the display of text corresponding to that area in the second area.
前記領域は、文字が含まれる領域であり、
前記領域の前記選択を解除するための、前記画像上でのユーザからの指示は、前記第1領域に含まれる前記画像内の選択されている前記領域をタッチする指示である
ことを特徴とする請求項1乃至のいずれか1項に記載のアプリケーション。
the region is a region containing characters,
4. The application of claim 1, wherein the user's instruction on the image to deselect the area is an instruction to touch the selected area in the image included in the first area.
前記保存手段は、前記UI画面内の前記画像上で選択された複数の領域を示す情報を保存することが可能であり、
前記複数の領域に対応する文字を用いて、前記ファイル名が生成される
ことを特徴とする請求項1乃至のいずれか1項に記載のアプリケーション。
the saving means is capable of saving information indicating a plurality of areas selected on the image within the UI screen,
The application according to any one of claims 1 to 4 , wherein the file name is generated using characters corresponding to the plurality of areas.
前記複数の領域は、前記UI画面内の前記画像上で前記ユーザにより、それぞれ別の操作で選択される
ことを特徴とする請求項に記載のアプリケーション。
The application according to claim 5 , wherein the plurality of areas are selected by the user through separate operations on the image in the UI screen.
前記UI画面内の前記画像上では、選択された前記複数の領域のそれぞれに、異なる枠が表示される
ことを特徴とする請求項5または6に記載のアプリケーション。
The application according to claim 5 or 6 , wherein a different frame is displayed in each of the selected areas on the image in the UI screen.
選択された前記複数の領域を示す情報は、それぞれ異なるラベルに対応付けて保存される
ことを特徴とする請求項5乃至7のいずれか1項に記載のアプリケーション。
The application according to claim 5 , wherein the information indicating the selected plurality of regions is stored in association with different labels.
コンピュータを、
ユーザからスキャンを実行する指示を受け付ける受付手段と、
前記指示に基づきスキャナでスキャンが実行されることにより得られたスキャン画像を表示する第1領域と、前記スキャン画像についての情報が表示される第2領域と、を含むUI画面を表示するように制御する制御手段と、
保存手段、
として機能させるためのアプリケーションであって、
前記制御手段は、前記第1領域に含まれる前記スキャン画像内の所望の領域が選択されるための、前記スキャン画像上でのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御し、
前記保存手段は、選択された前記領域を示す情報を、ファイル名の生成に用いるために保存し、
前記制御手段は、前記領域の前記選択を解除するための、前記スキャン画像上でのユーザからの指示を受け付けると、選択された前記領域に対応する前記文字を前記第2領域から削除するように制御することが可能であり、
前記領域を示す情報は、前記スキャン画像の後にスキャンされて得られる別のスキャン画像を含むファイルのファイル名の生成に用いられ
ことを特徴とするアプリケーション。
Computer,
a receiving means for receiving an instruction to execute scanning from a user;
a control means for controlling the display of a UI screen including a first area for displaying a scanned image obtained by executing a scan with the scanner based on the instruction, and a second area for displaying information about the scanned image;
storage means,
An application for functioning as
the control means, upon receiving an instruction from a user on the scanned image for selecting a desired area in the scanned image included in the first area, controls to display characters corresponding to the selected area in the second area;
the storage means stores information indicating the selected area for use in generating a file name;
the control means is capable of performing control such that, when receiving an instruction from a user on the scanned image to deselect the area, the character corresponding to the selected area is deleted from the second area;
An application characterized in that the information indicating the area is used to generate a file name of a file including another scanned image obtained by scanning after the scanned image .
前記制御手段は、ユーザから前記スキャンを実行する指示を受け付けると、追加のユーザからの指示を受け付けることなく、前記スキャン画像を表示する
ことを特徴とする請求項に記載のアプリケーション。
The application according to claim 9 , wherein the control means, upon receiving an instruction to execute the scan from a user, displays the scanned image without receiving any additional instructions from the user.
前記保存手段は、選択された前記領域を示す情報を、同じ種類のスキャン画像を含む任意のファイルのファイル名の生成に用いるために保存する
ことを特徴とする請求項9または10に記載のアプリケーション。
11. The application according to claim 9, wherein the storage means stores information indicating the selected area for use in generating file names for any files containing the same type of scanned image.
前記制御手段は、前記第2領域に文字が表示されていない状態で、前記第1領域に含まれる前記スキャン画像内の未だ選択されていなかった領域が選択されるためのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御する
ことを特徴とする請求項9乃至11のいずれか1項に記載のアプリケーション。
The application described in any one of claims 9 to 11, characterized in that when the control means receives an instruction from a user to select an area in the scanned image included in the first area that has not yet been selected while no character is displayed in the second area, the control means controls the display of character corresponding to that area in the second area.
前記領域は、文字が含まれる領域であり、
前記領域の前記選択を解除するための、前記スキャン画像上でのユーザからの指示は、前記第1領域に含まれる前記スキャン画像内の選択されている前記領域をタッチする指示である
ことを特徴とする請求項9乃至12のいずれか1項に記載のアプリケーション。
the region is a region containing characters,
13. The application of claim 9, wherein the user's instruction on the scanned image to deselect the area is an instruction to touch the selected area in the scanned image that is included in the first area.
前記保存手段は、前記UI画面内の前記スキャン画像上で選択された複数の領域を示す情報を保存することが可能であり、
前記複数の領域に対応する文字を用いて、前記ファイル名が生成される
ことを特徴とする請求項9乃至13のいずれか1項に記載のアプリケーション。
the saving means is capable of saving information indicating a plurality of areas selected on the scanned image within the UI screen;
The application according to any one of claims 9 to 13 , wherein the file name is generated using characters corresponding to the plurality of areas.
前記複数の領域は、前記UI画面内の前記スキャン画像上で前記ユーザにより、それぞれ別の操作で選択される
ことを特徴とする請求項14に記載のアプリケーション。
The application according to claim 14 , wherein the plurality of regions are selected by the user on the scanned image in the UI screen through separate operations.
前記UI画面内の前記スキャン画像上では、選択された前記複数の領域のそれぞれに、異なる枠が表示される
ことを特徴とする請求項14または15に記載のアプリケーション。
The application according to claim 14 or 15 , wherein a different frame is displayed on the scanned image in the UI screen for each of the selected areas.
選択された前記複数の領域を示す情報は、それぞれ異なるラベルに対応付けて保存される
ことを特徴とする請求項14乃至16のいずれか1項に記載のアプリケーション。
17. The application according to claim 14 , wherein information indicating the selected plurality of regions is stored in association with different labels.
前記領域を示す情報は、前記領域の位置を示す情報である
ことを特徴とする請求項1乃至17のいずれか1項に記載のアプリケーション。
The application according to claim 1 , wherein the information indicating the area is information indicating a position of the area.
前記領域が選択されるためのユーザからの指示は、前記第1領域上でユーザが位置を指定する指示であり、当該位置に基づいて、前記領域が特定されることを特徴とする請求項1乃至18のいずれか1項に記載のアプリケーション。 The application according to any one of claims 1 to 18, characterized in that the user's instruction for selecting the area is an instruction in which the user specifies a position on the first area, and the area is identified based on that position. 前記領域に対応する文字は、前記領域に対する文字認識処理により認識される文字である
ことを特徴とする請求項1乃至19のいずれか1項に記載のアプリケーション。
The application according to any one of claims 1 to 19 , wherein the character corresponding to the area is a character recognized by character recognition processing for the area.
前記文字認識処理は、前記領域が選択される前に行われる
ことを特徴とする請求項20に記載のアプリケーション。
21. The application of claim 20 , wherein the character recognition process is performed before the region is selected.
前記第1領域と前記第2領域とは重ならないことを特徴とする請求項1乃至21のいずれか1項に記載のアプリケーション。 22. The application of any one of claims 1 to 21 , wherein the first area and the second area do not overlap. 前記第2領域から前記文字が削除された場合は、削除された前記文字に対応する前記領域を示す情報は、前記ファイル名の生成に用いられないことを特徴とする請求項1乃至22のいずれかに記載のアプリケーション。 An application according to any one of claims 1 to 22 , characterized in that when the character is deleted from the second area, information indicating the area corresponding to the deleted character is not used in generating the file name. 画像を表示する第1領域と、前記画像についての情報が表示される第2領域と、を含むUI画面を表示するように制御する制御手段と、
保存手段と、
を有する情報処理装置であって、
前記制御手段は、前記第1領域に含まれる前記画像内の所望の領域が選択されるための、前記画像上でのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御し、
前記保存手段は、選択された前記領域を示す情報を、ファイル名の生成に用いるために保存し、
前記制御手段は、前記領域の前記選択を解除するための、前記画像上でのユーザからの指示を受け付けると、選択された前記領域に対応する前記文字を前記第2領域から削除するように制御することが可能であり、
前記領域を示す情報は、前記画像の後にスキャンされて得られる別の画像を含むファイルのファイル名の生成に用いられ
ことを特徴とする情報処理装置。
a control means for controlling the display of a UI screen including a first area for displaying an image and a second area for displaying information about the image;
A storage means;
An information processing device having:
the control means, when receiving an instruction from a user on the image for selecting a desired area in the image included in the first area, controls to display characters corresponding to the selected area in the second area;
the storage means stores information indicating the selected area for use in generating a file name;
the control means is capable of performing control such that, when receiving an instruction from a user on the image to cancel the selection of the area, the character corresponding to the selected area is deleted from the second area;
10. An information processing apparatus according to claim 9, wherein the information indicating the area is used to generate a file name of a file including another image obtained by scanning after the image .
前記保存手段は、選択された前記領域を示す情報を、同じ種類の画像を含む任意のファイルのファイル名の生成に用いるために保存する
ことを特徴とする請求項24に記載の情報処理装置。
25. The information processing apparatus according to claim 24 , wherein said saving means saves information indicating the selected area for use in generating a file name for any file containing an image of the same type.
前記制御手段は、前記第2領域に文字が表示されていない状態で、前記第1領域に含まれる前記画像内の未だ選択されていなかった領域が選択されるためのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御する
ことを特徴とする請求項24または25に記載の情報処理装置。
The information processing device described in claim 24 or 25, characterized in that when the control means receives an instruction from a user to select an area in the image included in the first area that has not yet been selected while no characters are displayed in the second area, the control means controls the display of characters corresponding to that area in the second area.
前記領域は、文字が含まれる領域であり、
前記領域の前記選択を解除するための、前記画像上でのユーザからの指示は、前記第1領域に含まれる前記画像内の選択されている前記領域をタッチする指示である
ことを特徴とする請求項24乃至26のいずれか1項に記載の情報処理装置。
the region is a region containing characters,
27. The information processing device according to claim 24, wherein the instruction from the user on the image to deselect the area is an instruction to touch the selected area in the image included in the first area.
前記保存手段は、前記UI画面内の前記画像上で選択された複数の領域を示す情報を保存することが可能であり、
前記複数の領域に対応する文字を用いて、前記ファイル名が生成される
ことを特徴とする請求項24乃至27のいずれか1項に記載の情報処理装置。
the saving means is capable of saving information indicating a plurality of areas selected on the image within the UI screen,
28. The information processing apparatus according to claim 24 , wherein the file name is generated using characters corresponding to the plurality of areas.
前記複数の領域は、前記UI画面内の前記画像上で前記ユーザにより、それぞれ別の操作で選択される
ことを特徴とする請求項28に記載の情報処理装置。
The information processing apparatus according to claim 28 , wherein the plurality of regions are selected by the user on the image in the UI screen through separate operations.
前記UI画面内の前記画像上では、選択された前記複数の領域のそれぞれに、異なる枠が表示される
ことを特徴とする請求項28または29に記載の情報処理装置。
30. The information processing apparatus according to claim 28 , wherein a different frame is displayed in each of the selected areas on the image in the UI screen.
選択された前記複数の領域を示す情報は、それぞれ異なるラベルに対応付けて保存される
ことを特徴とする請求項28乃至30のいずれか1項に記載の情報処理装置。
31. The information processing apparatus according to claim 28 , wherein the information indicating the selected plurality of regions is stored in association with different labels.
ユーザからスキャンを実行する指示を受け付ける受付手段と、
前記指示に基づきスキャナでスキャンが実行されることにより得られたスキャン画像を表示する第1領域と、前記スキャン画像についての情報が表示される第2領域と、を含むUI画面を表示するように制御する制御手段と、
保存手段と、
を有する情報処理装置であって、
前記制御手段は、前記第1領域に含まれる前記スキャン画像内の所望の領域が選択されるための、前記スキャン画像上でのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御し、
前記保存手段は、選択された前記領域を示す情報を、ファイル名の生成に用いるために保存し、
前記制御手段は、前記領域の前記選択を解除するための、前記スキャン画像上でのユーザからの指示を受け付けると、選択された前記領域に対応する前記文字を前記第2領域から削除するように制御することが可能であり、
前記領域を示す情報は、前記スキャン画像の後にスキャンされて得られる別のスキャン画像を含むファイルのファイル名の生成に用いられ
ことを特徴とする情報処理装置。
a receiving means for receiving an instruction to execute scanning from a user;
a control means for controlling the display of a UI screen including a first area for displaying a scanned image obtained by executing a scan with the scanner based on the instruction, and a second area for displaying information about the scanned image;
A storage means;
An information processing device having:
the control means, upon receiving an instruction from a user on the scanned image for selecting a desired area in the scanned image included in the first area, controls to display characters corresponding to the selected area in the second area;
the saving means saves information indicating the selected area for use in generating a file name;
the control means is capable of performing control such that, when receiving an instruction from a user on the scanned image to deselect the area, the character corresponding to the selected area is deleted from the second area;
The information processing apparatus according to claim 1, wherein the information indicating the area is used to generate a file name of a file including another scanned image obtained by scanning after the scanned image .
前記制御手段は、ユーザから前記スキャンを実行する指示を受け付けると、追加のユーザからの指示を受け付けることなく、前記スキャン画像を表示する
ことを特徴とする請求項32に記載の情報処理装置。
33. The information processing apparatus according to claim 32 , wherein said control means, upon receiving an instruction to execute said scan from a user, displays said scanned image without receiving any additional instructions from the user.
前記保存手段は、選択された前記領域を示す情報を、同じ種類のスキャン画像を含む任意のファイルのファイル名の生成に用いるために保存する
ことを特徴とする請求項32または33に記載の情報処理装置。
34. The information processing apparatus according to claim 32, wherein the storage means stores information indicating the selected area for use in generating a file name for any file containing the same type of scanned image.
前記制御手段は、前記第2領域に文字が表示されていない状態で、前記第1領域に含まれる前記スキャン画像内の未だ選択されていなかった領域が選択されるためのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御する
ことを特徴とする請求項32乃至34のいずれか1項に記載の情報処理装置。
The information processing device according to any one of claims 32 to 34, characterized in that when the control means receives an instruction from a user to select an area in the scanned image included in the first area that has not yet been selected while no character is displayed in the second area, the control means controls the display of character corresponding to that area in the second area.
前記領域は、文字が含まれる領域であり、
前記領域の前記選択を解除するための、前記スキャン画像上でのユーザからの指示は、前記第1領域に含まれる前記スキャン画像内の選択されている前記領域をタッチする指示である
ことを特徴とする請求項32乃至35のいずれか1項に記載の情報処理装置。
the region is a region containing characters,
36. The information processing device of claim 32, wherein the user's instruction on the scanned image to deselect the area is an instruction to touch the selected area in the scanned image that is included in the first area.
前記保存手段は、前記UI画面内の前記スキャン画像上で選択された複数の領域を示す情報を保存することが可能であり、
前記複数の領域に対応する文字を用いて、前記ファイル名が生成される
ことを特徴とする請求項32乃至36のいずれか1項に記載の情報処理装置。
the saving means is capable of saving information indicating a plurality of areas selected on the scanned image within the UI screen;
37. The information processing apparatus according to claim 32 , wherein the file name is generated using characters corresponding to the plurality of areas.
前記複数の領域は、前記UI画面内の前記スキャン画像上で前記ユーザにより、それぞれ別の操作で選択される
ことを特徴とする請求項37に記載の情報処理装置。
The information processing apparatus according to claim 37 , wherein the plurality of regions are selected by the user on the scanned image in the UI screen through separate operations.
前記UI画面内の前記スキャン画像上では、選択された前記複数の領域のそれぞれに、異なる枠が表示される
ことを特徴とする請求項37または38に記載の情報処理装置。
39. The information processing apparatus according to claim 37 , wherein a different frame is displayed in each of the selected areas on the scanned image in the UI screen.
選択された前記複数の領域を示す情報は、それぞれ異なるラベルに対応付けて保存される
ことを特徴とする請求項37乃至39のいずれか1項に記載の情報処理装置。
40. The information processing apparatus according to claim 37 , wherein the information indicating the selected plurality of regions is stored in association with different labels.
前記領域を示す情報は、前記領域の位置を示す情報である
ことを特徴とする請求項24乃至40のいずれか1項に記載の情報処理装置。
41. The information processing apparatus according to claim 24 , wherein the information indicating the area is information indicating a position of the area.
前記領域が選択されるためのユーザからの指示は、前記第1領域上でユーザが位置を指定する指示であり、当該位置に基づいて、前記領域が特定されることを特徴とする請求項24乃至41のいずれか1項に記載の情報処理装置。 42. The information processing device according to claim 24 , wherein the instruction from the user for selecting the area is an instruction by the user to specify a position on the first area, and the area is identified based on the position. 前記領域に対応する文字は、前記領域に対する文字認識処理により認識される文字である
ことを特徴とする請求項24乃至42のいずれか1項に記載の情報処理装置。
43. The information processing apparatus according to claim 24 , wherein the character corresponding to the area is a character recognized by character recognition processing for the area.
前記文字認識処理は、前記領域が選択される前に行われる
ことを特徴とする請求項43に記載の情報処理装置。
44. The information processing apparatus according to claim 43 , wherein the character recognition process is performed before the region is selected.
前記第1領域と前記第2領域とは重ならないことを特徴とする請求項24乃至44のいずれか1項に記載の情報処理装置。 45. The information processing apparatus according to claim 24 , wherein the first area and the second area do not overlap. 前記第2領域から前記文字が削除された場合は、削除された前記文字に対応する前記領域を示す情報は、前記ファイル名の生成に用いられないことを特徴とする請求項24乃至45のいずれかに記載の情報処理装置。 46. An information processing device according to claim 24, wherein, when the character is deleted from the second area, information indicating the area corresponding to the deleted character is not used in generating the file name. 画像を表示する第1領域と、前記画像についての情報が表示される第2領域と、を含むUI画面を表示するように制御する制御工程と、
保存工程と、
を有する制御方法であって、
前記制御工程においては、前記第1領域に含まれる前記画像内の所望の領域が選択されるための、前記画像上でのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御し、
前記保存工程においては、選択された前記領域を示す情報を、ファイル名の生成に用いるために保存し、
前記制御工程においては、前記領域の前記選択を解除するための、前記画像上でのユーザからの指示を受け付けると、選択された前記領域に対応する前記文字を前記第2領域から削除するように制御することが可能であり、
前記領域を示す情報は、前記画像の後にスキャンされて得られる別の画像を含むファイルのファイル名の生成に用いられ
ことを特徴とする制御方法。
a control step of controlling to display a UI screen including a first area for displaying an image and a second area for displaying information about the image;
The preservation process and
A control method comprising:
In the control step, when an instruction on the image from a user for selecting a desired area in the image included in the first area is received, control is performed so that a character corresponding to the selected area is displayed in the second area;
In the saving step, information indicating the selected area is saved for use in generating a file name;
In the control step, when an instruction on the image from a user to cancel the selection of the area is received, the control can be performed so that the character corresponding to the selected area is deleted from the second area ,
A control method, characterized in that the information indicating the area is used to generate a file name of a file including another image obtained by scanning after the image .
ユーザからスキャンを実行する指示を受け付ける受付工程と、
前記指示に基づきスキャナでスキャンが実行されることにより得られたスキャン画像を表示する第1領域と、前記スキャン画像についての情報が表示される第2領域と、を含むUI画面を表示するように制御する制御工程と、
保存工程と、
を有する制御方法であって、
前記制御工程においては、前記第1領域に含まれる前記スキャン画像内の所望の領域が選択されるための、前記スキャン画像上でのユーザからの指示を受け付けると、当該領域に対応する文字を前記第2領域に表示するように制御し、
前記保存工程においては、選択された前記領域を示す情報を、ファイル名の生成に用いるために保存し、
前記制御工程においては、前記領域の前記選択を解除するための、前記スキャン画像上でのユーザからの指示を受け付けると、選択された前記領域に対応する前記文字を前記第2領域から削除するように制御することが可能であり、
前記領域を示す情報は、前記スキャン画像の後にスキャンされて得られる別のスキャン画像を含むファイルのファイル名の生成に用いられ
ことを特徴とする制御方法。
a receiving step of receiving an instruction to execute scanning from a user;
a control step of controlling to display a UI screen including a first area for displaying a scanned image obtained by executing a scan with the scanner based on the instruction, and a second area for displaying information about the scanned image;
The preservation process and
A control method comprising:
In the control step, when an instruction is received from a user on the scanned image for selecting a desired area in the scanned image included in the first area, control is performed so that a character corresponding to the selected area is displayed in the second area;
In the saving step, information indicating the selected area is saved for use in generating a file name;
In the control step, when an instruction to cancel the selection of the area is received from a user on the scanned image, the control can be performed so that the character corresponding to the selected area is deleted from the second area ;
A control method , characterized in that the information indicating the area is used to generate a file name of a file including another scanned image obtained by scanning after the scanned image .
JP2024139873A 2023-02-09 2024-08-21 Information processing device, control method thereof, and application Active JP7739555B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024139873A JP7739555B2 (en) 2023-02-09 2024-08-21 Information processing device, control method thereof, and application

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2023018221A JP7358663B2 (en) 2019-04-19 2023-02-09 Image processing device for character input using a touch panel, its control method, and program
JP2023096501A JP7543489B2 (en) 2023-02-09 2023-06-12 Information processing device, control method thereof, and program
JP2024139873A JP7739555B2 (en) 2023-02-09 2024-08-21 Information processing device, control method thereof, and application

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2023096501A Division JP7543489B2 (en) 2023-02-09 2023-06-12 Information processing device, control method thereof, and program

Publications (3)

Publication Number Publication Date
JP2024161570A JP2024161570A (en) 2024-11-19
JP2024161570A5 JP2024161570A5 (en) 2024-12-26
JP7739555B2 true JP7739555B2 (en) 2025-09-16

Family

ID=86069095

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2023096501A Active JP7543489B2 (en) 2023-02-09 2023-06-12 Information processing device, control method thereof, and program
JP2024139873A Active JP7739555B2 (en) 2023-02-09 2024-08-21 Information processing device, control method thereof, and application

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2023096501A Active JP7543489B2 (en) 2023-02-09 2023-06-12 Information processing device, control method thereof, and program

Country Status (1)

Country Link
JP (2) JP7543489B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017068355A (en) 2015-09-28 2017-04-06 シャープ株式会社 Image processing device and image processing method
JP2019041150A (en) 2017-08-22 2019-03-14 キヤノン株式会社 Device for setting a file name or the like in a scanned image, its control method and program
JP2019040251A (en) 2017-08-22 2019-03-14 キヤノン株式会社 Device for setting a file name or the like in a scanned image, its control method and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4964080B2 (en) * 2007-01-17 2012-06-27 株式会社東芝 Image processing system, image processing method, and image processing program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017068355A (en) 2015-09-28 2017-04-06 シャープ株式会社 Image processing device and image processing method
JP2019041150A (en) 2017-08-22 2019-03-14 キヤノン株式会社 Device for setting a file name or the like in a scanned image, its control method and program
JP2019040251A (en) 2017-08-22 2019-03-14 キヤノン株式会社 Device for setting a file name or the like in a scanned image, its control method and program

Also Published As

Publication number Publication date
JP2024161570A (en) 2024-11-19
JP7543489B2 (en) 2024-09-02
JP2023120267A (en) 2023-08-29

Similar Documents

Publication Publication Date Title
JP7467737B2 (en) Image processing device that displays guidance for user operations, and control method and program thereof
JP7746497B2 (en) Information processing device, its control method, program, and system
JP7532085B2 (en) Image processing device, image processing method, and program
JP7225017B2 (en) Image processing device for character input using touch panel, its control method and program
JP7330742B2 (en) IMAGE PROCESSING APPARATUS, CONTROL METHOD AND PROGRAM FOR SETTING PROPERTIES ON SCANNED IMAGES
JP7387282B2 (en) Image processing device that displays a preview of a scanned image, its control method, and program
JP7739555B2 (en) Information processing device, control method thereof, and application
JP2024040612A (en) Information processing device, control method for information processing device, and program
JP7358663B2 (en) Image processing device for character input using a touch panel, its control method, and program
JP7508199B2 (en) Image processing device for displaying a preview of a scanned image, and control method and program thereof
JP2020178284A (en) An image processing device that displays a preview of a scanned image, its control method, and a program.
JP2020177526A (en) An image processing device that displays a preview of a scanned image, its control method, and a program.
JP7520563B2 (en) Image processing system for digitizing documents, and control method and program thereof
JP2021076975A (en) Image processing apparatus, image processing method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240918

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250714

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20250801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250805

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250903

R150 Certificate of patent or registration of utility model

Ref document number: 7739555

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150