JP2019114155A - Information processing device, information processing method, and program - Google Patents
Information processing device, information processing method, and program Download PDFInfo
- Publication number
- JP2019114155A JP2019114155A JP2017248689A JP2017248689A JP2019114155A JP 2019114155 A JP2019114155 A JP 2019114155A JP 2017248689 A JP2017248689 A JP 2017248689A JP 2017248689 A JP2017248689 A JP 2017248689A JP 2019114155 A JP2019114155 A JP 2019114155A
- Authority
- JP
- Japan
- Prior art keywords
- name
- organization name
- text
- organization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 24
- 238000003672 processing method Methods 0.000 title claims description 4
- 230000008520 organization Effects 0.000 claims abstract description 88
- 230000005540 biological transmission Effects 0.000 claims abstract description 85
- 238000000605 extraction Methods 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 5
- 230000002265 prevention Effects 0.000 abstract description 6
- 230000007246 mechanism Effects 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 31
- 238000012545 processing Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 18
- 238000012790 confirmation Methods 0.000 description 13
- 238000012550 audit Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 2
- 235000008247 Echinochloa frumentacea Nutrition 0.000 description 1
- 240000004072 Panicum sumatrense Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
本発明は、情報処理装置、情報処理方法、プログラムに関する。 The present invention relates to an information processing apparatus, an information processing method, and a program.
メールの誤送信は、機密情報の漏えい、顧客の信頼喪失の原因となり、企業活動において多大な損害を発生させる恐れがある。特に、異なる組織への誤送信は、情報漏えいの観点から重大な問題になりやすい。 Erroneous transmission of e-mail may cause leakage of confidential information, loss of customer confidence, and may cause considerable damage to business operations. In particular, erroneous transmission to different organizations is likely to be a serious problem in terms of information leakage.
誤送信を防止するために、宛先のメールアドレスと、本文中に記載した宛名(組織名、人名)が正しい組み合わせであるか、アドレス帳やドメインの情報から機械的に検証することが考えられるが、メールの本文中に記載する宛名の記載方法に決まりはないため、メールの本文から宛名を正しく抽出する方法が重要となる。 In order to prevent erroneous transmission, it may be possible to mechanically verify from the information in the address book or the domain whether the destination e-mail address and the address (organization name, personal name) described in the text are a correct combination. Because it is not determined how to write the address in the text of the mail, it is important to extract the address correctly from the text of the mail.
メールの本文から宛名を機械的に抽出する方法として、特許文献1には、あらかじめ決められたフォーマットで宛名の組織名を記載するように、メール送信者に義務付けるか、送信先のメールアドレスに該当する企業名をアドレス帳から取得してメールの文頭に自動挿入する方法が示されている。
As a method of mechanically extracting the address from the text of the e-mail,
特許文献2には、「様」,「さま」,「殿」,「どの」,「さん」,「宛」等の敬称を電子メール本文中から探索し、敬称の直前に記載された語句を宛名として抽出する方法が示されている。
特許文献1に示される方法のうち、メール送信者に所定のフォーマットを義務付ける方法については、宛名の取得方法としては確実であるが、運用を徹底することに困難を伴う。一方、アドレス帳から該当する組織名を取得して、メールの文頭に自動挿入する方法については、メールの本文中に組織名が表示されるため、送信者が宛名を確認する作業自体は行いやすくなるが、送信先のアドレスと本文中の宛名が必ず正しい組み合わせになるため、自動挿入された宛名が正しいか否かの判断自体は送信者に委ねられる。
Among the methods disclosed in
特許文献2に示される方法は、宛名のフォーマットを指定することなく運用可能であるが、主に人名を抽出するための方法であり、組織名の抽出方法については触れられていない。異なる組織に同性の人物が存在する場合などの誤送信を防止することは困難である。
The method disclosed in
本発明は、前述の問題点に鑑みてなされたもので、メールの本文中から宛名の組織名を精度よく抽出することにより、メールの誤送信防止に資する仕組みを提供することを目的とする。 The present invention has been made in view of the above-mentioned problems, and an object of the present invention is to provide a mechanism that contributes to the prevention of erroneous mail transmission by accurately extracting an organization name of an address from the text of the mail.
本発明は、電子メールの本文から取得した組織名と、当該電子メールの送信先ドメインとの対応付けを記憶する記憶手段を備える情報処理装置であって、前記電子メールの本文から所定の書式に適合する組織名を抽出する第1の抽出手段と、前記電子メールの本文から前記記憶手段に記憶された組織名に一致する組織名を抽出する第2の抽出手段と、前記第1の抽出手段により抽出された組織名と、前記第2の抽出手段により抽出された組織名とを比較し、長い方の組織名を取得する取得手段と、前記取得した組織名と、前記電子メールの送信先ドメインとを対応付けて記憶するか否かを受け付ける受付手段とを備えることを特徴とする。 The present invention is an information processing apparatus including storage means for storing an association between an organization name acquired from an e-mail text and a destination domain of the e-mail, wherein the text of the e-mail is converted into a predetermined format. First extraction means for extracting a compatible organization name, second extraction means for extracting an organization name corresponding to the organization name stored in the storage means from the text of the electronic mail, and the first extraction means Acquisition means for comparing the organization name extracted by the second extraction means with the organization name extracted by the second extraction means, acquiring the longer organization name, the acquired organization name, and the destination of the e-mail And receiving means for receiving whether or not to store the domain in association with one another.
本発明によれば、メールの本文中から組織名を精度よく抽出することが可能になり、メールの誤送信防止に役立てることができる。 According to the present invention, it becomes possible to accurately extract an organization name from the text of an e-mail, which can be useful for preventing erroneous transmission of e-mail.
本発明は、送信確認の際に宛先と宛名の組み合わせを学習可能なシステムであり、事前に詳細な制御ルールを作成することなくシステムを利用することができる。以下、図面を参照して、本発明の実施形態を詳細に説明する。 The present invention is a system capable of learning a combination of destination and address upon transmission confirmation, and can use the system without creating detailed control rules in advance. Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明の実施形態におけるメール誤送信防止システムの構成を示す図である。 FIG. 1 is a diagram showing the configuration of a mail erroneous transmission prevention system according to an embodiment of the present invention.
メール誤送信防止システム100は、メール受付部101と、宛先情報抽出部102と、保留判定部103と、メール送信部104と、保留メール操作・システム設定部105と、送信履歴DB110、保留メールDB120とを備える。
The email erroneous
なお、本実施例においては、メール誤送信防止システム100は、図1に示すようにクライアント端末と通信可能に接続されたサーバ装置(情報処理装置)として説明するが、クライアント端末が図1に示す機能を備えていても良い。
In the present embodiment, the erroneous mail
メール受付部101は、システムのユーザが送信したメールを受け付け、宛先情報抽出部102へメールを送る。システムのユーザは、自身が使用しているメールクライアントにおけるメールの送信先を、メール受付部101に設定することでメール誤送信防止システム100の利用が可能となる。
The
宛先情報抽出部102は、メールアドレス、メールの本文から、自然言語処理を用いて宛先情報(ドメイン、組織名、氏名など)を抽出し、メールと併せて保留判定部103に送る。なお、全角・半角の違いや、組織種別の表記方法の違い(株式会社と(株)など)や、組織名の途中に複数の連続する空白が入っている場合等には、事前に正規化処理を実施して、表記方法による差異を除去しておく。宛先情報抽出部102における宛先情報抽出処理については、後に例を用いて詳しく説明する。
The destination
保留判定部103は、送信履歴DB110を参照し、メールの送信先アドレスと送信先組織名の組み合わせからメールの送信を保留するか否かを判定する。メールを保留する場合は、保留メールDB120にメールと保留理由を登録し、保留しない場合は、メール送信部104にメールを送る。送信履歴DB110、保留メールDB120、および、保留判定部103における保留判定処理は、後に例を用いて詳しく説明する。
The
保留メール操作・システム設定部105は、システムのユーザに対して、WEBブラウザなどを通じて、保留メールDB120に登録したメールの送出処理や、送信履歴DB110のメンテナンス処理を提供する。保留メール操作・システム設定部105がシステムのユーザに提供する操作画面は、後に例を用いて詳しく説明する。
The on-hold e-mail operation /
メール送信部104は、保留判定部103が送出可能と判定したメール、および、システムのユーザが保留メール操作・システム設定部105を通じて送出処理を行ったメールを、メールの宛先アドレスに向けて送信する。
The
送信履歴DB110は、ドメインと組織名の組み合わせごとに、過去の送信回数を保持している。なお、送信履歴DB110に存在する組み合わせの送信回数は、メール送信部104におけるメール送信処理の際に自動的に更新され、新しい組み合わせの追加は、システムのユーザによるメール確認処理の際に行われる。送信履歴DB110の詳細は、後の宛先情報抽出処理において詳しく説明する。
The transmission history DB 110 holds the number of past transmissions for each combination of domain and organization name. The number of transmissions of the combination existing in the transmission history DB 110 is automatically updated at the time of mail transmission processing in the
保留メールDB120は、保留判定部103が保留と判定したメールを一時的に保管するDBである。保留メールDB120は、メールのソース(元データ)に加え、宛先情報抽出部102が抽出した宛先情報を併せて保持する。保留メールDB120の詳細は、後の保留判定処理において詳しく説明する。
The
図2は、本発明の実施例におけるメール誤送信防止システム100に適用可能な情報処理装置のハードウェア構成の一例を示すブロック図である。
FIG. 2 is a block diagram showing an example of a hardware configuration of an information processing apparatus applicable to the mail erroneous
図2に示すように、情報処理装置では、システムバス200を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、記憶装置204、入力コントローラ205、音声入力コントローラ206、ビデオコントローラ207、メモリコントローラ208、よび通信I/Fコントローラ209が接続される。
As shown in FIG. 2, in the information processing apparatus, a central processing unit (CPU) 201, a read only memory (ROM) 202, a random access memory (RAM) 203, a
CPU201は、システムバス200に接続される各デバイスやコントローラを統括的に制御する。
The
ROM202あるいは記憶装置204は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。
The
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは記憶装置204からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。
The
入力コントローラ205は、キーボード/タッチパネル210などの入力装置からの入力を制御する。入力装置はこれに限ったものでなく、マウスやマルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。
The input controller 205 controls an input from an input device such as the keyboard /
ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができる。 Various instructions can be given by the user pressing (touching with a finger or the like) according to an icon, a cursor or a button displayed on the touch panel.
この入力装置を用いて各種通信装置で利用可能な通信宛先に対する宛先を入力するようになっている。 This input device is used to input a destination for a communication destination that can be used by various communication devices.
音声入力コントローラ206は、マイク211からの入力を制御する。マイク211から入力された音声を音声認識することが可能となっている。
The
ビデオコントローラ207は、ディスプレイ212などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作により受け付け可能な装置については、キーボード/タッチパネル210からの入力を受け付けることも可能となる。
The
なおビデオコントローラ207は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。
The
本発明では、ユーザが情報処理装置を通常する場合の表示に用いられる第1のビデオメモリ領域と、所定の画面が表示される場合に、第1のビデオメモリ領域の表示内容に重ねての表示に用いられる第2のビデオメモリ領域を有している。ビデオメモリ領域は2つに限ったものではなく、情報処理装置の資源が許す限り複数有することが可能なものとする。 In the present invention, the first video memory area used for display when the user normally operates the information processing apparatus and the display content superimposed on the display content of the first video memory area when the predetermined screen is displayed And a second video memory area used for The video memory area is not limited to two, and can be plural as long as the resource of the information processing apparatus permits.
メモリコントローラ208は、外部メモリ213へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。
The
通信I/Fコントローラ209、ネットワーク214を介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の3G回線を用いた通信が可能である。
The communication I /
なお、記憶装置204は情報を永続的に記憶するための媒体であって、その形態をハードディスク等の記憶装置に限定するものではない。例えば、SSD(Solid State Drive)などの媒体であってもよい。
The
また本実施形態における通信端末で行われる各種処理時の一時的なメモリエリアとしても利用可能である。 Moreover, it can also be used as a temporary memory area at the time of various processes performed by the communication terminal in the present embodiment.
次に図3〜図5に示すフローチャートを用いて、本実施例におけるメール誤送信防止処理について説明する。 Next, the mail erroneous transmission preventing process in the present embodiment will be described using the flowcharts shown in FIGS.
なお、図3〜図5のフローチャートで示す処理は、情報処理装置のCPU201が所定の制御プログラムを読み出して実行する処理である。
The process shown in the flowcharts of FIGS. 3 to 5 is a process in which the
まず、宛先情報抽出部102における宛先情報抽出処理について、図3、図4、図6〜図8を用いて説明する。図3は、宛先情報抽出処理の一例を示すフローチャートである。以下、図3の処理に従って、メール受付部101が受け付けた図6に示すメール600から、図8に示す各種情報を抽出する例を示す。
First, destination information extraction processing in the destination
まず、ステップS101で、送信者のメールアドレスをメールから抽出する。送信者のメールアドレスは、メールヘッダーにおけるFromの値から抽出する。なお、エンベロープ情報が参照可能な環境下においては、エンベロープに記載の送信者アドレスを取得してもよい。メール600における送信者アドレスは、Fromの値「kuramitsu@EXAMPLE.JP」である。 First, at step S101, the sender's email address is extracted from the email. The sender's email address is extracted from the value of From in the email header. In an environment where the envelope information can be referred to, the sender address described in the envelope may be acquired. The sender address in the mail 600 is the value “kuramitsu@EXAMPLE.JP” of From.
ステップS102では、ステップS101で取得した送信者アドレスから、ドメイン部分(”@”以降の文字列)のみを抽出する。本システムでは、送信者のドメインを内部ドメインと呼び、内部ドメイン以外のドメイン(外部ドメイン)と区別して取り扱う。メール600における内部ドメインは「EXAMPLE.JP」である。 In step S102, only the domain part (character string after "@") is extracted from the sender address acquired in step S101. In this system, a sender's domain is called an internal domain, and is treated separately from domains other than the internal domain (external domain). The internal domain in the mail 600 is "EXAMPLE.JP".
なお、送信者のドメインと異なる場合であっても、グループ会社等に付与されたドメインは内部ドメインとして扱うことを可能とするため、予め対応付けられたドメインについては、内部ドメインとして判断しても良い。 In addition, even if it is different from the sender's domain, the domain assigned to the group company etc. can be treated as an internal domain, so even if it is judged as an internal domain, the domain associated beforehand good.
次に、ステップS103で、宛先のメールアドレスの一覧を取得する。宛先アドレスは、メールヘッダーにおけるTo、および、Ccの値から抽出する。送信者アドレスと同様に、エンベロープ情報が参照可能な環境下においては、エンベロープ情報から取得してもよい。メール600における宛先アドレスは、「otani@EXAMPLE1.NW.JP」、「nakamura@EXAMPLE1.JP」、「ito@EXAMPLE3.JP」、「murata@EXAMPLE.JP」の4つである。 Next, in step S103, a list of destination e-mail addresses is acquired. The destination address is extracted from the values of To and Cc in the mail header. Similar to the sender address, in an environment where the envelope information can be referred to, it may be acquired from the envelope information. There are four destination addresses in the e-mail 600: “otani@EXAMPLE1.NW.JP”, “nakamura@EXAMPLE1.JP”, “ito@EXAMPLE3.JP”, and “murata@EXAMPLE.JP”.
ステップS104では、ステップS103で取得した各宛先アドレスから、外部ドメインのみを抽出する。ここで、同じドメインは重複を取り除き、1つの要素として取り扱う。メール600における宛先ドメインは、「EXAMPLE1.NW.JP」、「EXAMPLE1.JP」、「EXAMPLE3.JP」の3つである。 In step S104, only the external domain is extracted from each destination address acquired in step S103. Here, the same domain removes duplication and treats it as one element. Three destination domains in the mail 600 are “EXAMPLE 1. NW. JP”, “EXAMPLE 1. JP”, and “EXAMPLE 3. JP”.
ステップS105では、本文の宛名に含まれる組織名(本文組織名)の一覧を抽出する。 In step S105, a list of organization names (text body organization names) included in the addressee of the text is extracted.
図4は、ステップS105における組織名抽出処理の一例を示すフローチャートである。以下、例を用いて、組織名抽出処理の詳細を説明する。 FIG. 4 is a flowchart showing an example of the organization name extraction process in step S105. Hereinafter, the details of the tissue name extraction process will be described using an example.
まず、ステップS201では、メールの本文に対して、文末が敬称(「様」、「さん」、「殿」など)で終わる段落を取得する。以降、文末が敬称で終わる段落を「宛名ブロック」と呼ぶ。「宛名ブロック」は、メールの本文中に複数存在する可能性があるため、メール本文を文頭から走査して順に取得する。ここで、宛名はメール本文の前半部分に出現するという慣習を考慮し、メール本文の先頭から抽出する行数を制限しても良い。メール600における宛名ブロックは、「XYZC NETWORKS 企画部 尾谷 様」および、「XYZC(改行) 総務本部 中村 様(改行) 経理部 伊藤様」の2つである。宛先情報抽出部102は、各宛名ブロックに対して、ステップS202〜ステップS204の処理をそれぞれ実行する。
First, in step S201, a paragraph in which the end of the sentence ends with a subtitle (such as "", "", "", etc.) is acquired with respect to the text of the mail. From now on, the paragraph that ends with a title is called "address block". Since there are a plurality of "address block" in the text of the mail, the mail text is scanned from the beginning of the sentence and acquired in order. Here, in consideration of the convention that the address appears in the first half of the mail text, the number of lines extracted from the beginning of the mail text may be limited. There are two address blocks in the mail 600: “XYZC NETWORKS Planning Department Mr. Otani” and “XYZC (Line Feed) General Affairs Headquarters Mr. Nakamura (Line Feed) Accounting Department Ito”. The destination
ステップS203では、ステップS201により抽出した宛名ブロックから、パターンマッチにより組織名の候補を抽出する。説明を簡略化するため、本実施形態では、宛名ブロックにおいて、文頭から空白(改行含む)文字の直前までを組織名の候補として抽出する。宛名ブロック「XYZC NETWORKS 企画部 尾谷 様」に対して、ステップS203の処理によって取得される組織名の候補は「XYZC」である。また、宛名ブロック「XYZCマーケティング(改行) 総務本部 中村 様(改行) 経理部 伊藤様」に対して「XYZCマーケティング」が取得される。 In step S203, tissue name candidates are extracted from the address block extracted in step S201 by pattern matching. In order to simplify the description, in the present embodiment, from the beginning of a sentence to immediately before a space (including a line feed) character is extracted as a candidate for an organization name in the address block. For the address block “XYZC NETWORKS Planning Department Mr. Otani,” the candidate of the organization name acquired by the process of step S203 is “XYZC”. Also, "XYZC Marketing" is acquired for the address block "XYZC Marketing (Line feed) NAKAMURA (Line feed) Accounting Department Ito".
ステップS204では、送信履歴DB110を参照し、最長一致検索を用いて、組織名の候補を抽出する。図7は、送信履歴DB110の一例であり、ドメインと組織名の組み合わせごとに、過去の送信回数を保持している。なお、送信履歴DB110に存在する組み合わせの送信回数は、メール送信部104におけるメール送信処理の際に自動的に更新され、新しい組み合わせの追加は、後に説明する、システムのユーザによるメール確認処理の際に行われる。送信履歴DB110に含まれる組織名のうち、宛名ブロック「XYZC NETWORKS 企画部 尾谷 様」において送信履歴と一致する組織名は、「XYZC」、「XYZC NETWORKS」、「XYZ」の3種類である。宛先情報抽出部102は、一致した文字列の長さが最長である(最長一致する)組織名として、「XYZC NETWORKS」を組織名の候補として抽出する。ここで最長一致するものを抽出することにより、誤った「XYZC」や「XYZ」が候補として抽出されることが避けられる。
In step S204, the
一方、宛名ブロック「XYZCマーケティング(改行) 総務本部 中村 様(改行) 経理部 伊藤様」において送信履歴と一致する組織名は、「XYZC」、「XYZ」の2種類であり、最長の「XYZC」を組織名の候補として抽出する。 On the other hand, in the address block “XYZC marketing (line feed) General affairs headquarters Nakamura (line feed) accounting department Ito)”, the organization name that matches the transmission history is two types “XYZC” and “XYZ”, and the longest “XYZC” Are extracted as candidate organization names.
ステップS205では、ステップS203、および、ステップS204において抽出した組織名候補のうち、文字列長がより長いものを本文に含まれる組織名として抽出する。これにより、抽出できる範囲で最も長い組織名が抽出されるため、後続処理の保留判定処理で、部分一致する誤った組織名で判定することが避けられる。 In step S205, among the tissue name candidates extracted in step S203 and step S204, one having a longer character string length is extracted as a tissue name included in the text. As a result, since the longest tissue name in the extractable range is extracted, it is avoided in the hold determination process of the subsequent process that the determination is made based on the partially mismatched tissue name.
宛名ブロック「XYZC NETWORKS 企画部 尾谷 様」における組織名の候補は、「XYZC」(3文字)と「XYZC NETWORKS」(12文字)であるため、「XYZC NETWORKS」を組織名として抽出する。 The candidate organization names in the address block “XYZC NETWORKS Planning Department Mr. Otani” are “XYZC” (3 letters) and “XYZC NETWORKS” (12 letters), so “XYZC NETWORKS” is extracted as an organization name.
同様に、宛名ブロック「XYZCマーケティング(改行) 総務本部 中村 様(改行) 経理部 伊藤様」に対しても、ステップS202〜ステップS205の処理を行い、「XYZCマーケティング」を組織名として抽出する。 Similarly, the processing in steps S202 to S205 is performed on the address block “XYZC marketing (line feed) General affairs headquarters Nakamura (line feed) accounting department Ito), and“ XYZC marketing ”is extracted as an organization name.
以上、宛先情報抽出部102における宛先情報抽出処理について、例を用いて説明した。パターンマッチによる抽出ロジックは、一度も送信履歴に存在しない組織名の抽出が可能であり、後述する保留したメールの監査画面1000において活用することができる。一方、送信履歴を参照した最長一致検索による抽出ロジックは、空白を含む組織名の抽出など、パターンマッチによる抽出方法では抽出が困難な組織名も取り扱うことが可能になる。各手法を組み合わせて使用することにより、宛名の記載方法を厳密に定めることが難しいような場面においても、メールの本文から精度よく宛名の組織名を抽出することが可能になる。
The destination information extraction processing in the destination
なお、説明の簡略化のため、ステップS203では、文頭から空白(改行含む)文字の直前までを組織名の候補として抽出したが、組織種別(「株式会社」、「信用組合」、「学校法人」など)を手掛かりとして、前後の文字列を組織名候補として抽出するなどの方法を組み合わせることで、抽出精度の向上、および、より柔軟な書式への対応を図ることが可能である。 Note that in order to simplify the explanation, in step S203, the head of the sentence to the point immediately before the blank (including line feed) character is extracted as a candidate for an organization name, but the organization type ("Corporation", "credit union", "school corporation It is possible to improve extraction accuracy and cope with a more flexible format by combining methods such as extracting character strings before and after as an organization name candidate, etc.).
次に、保留判定部103における保留判定処理について、図5、図8を用いて説明する。
Next, the hold determination process in the
図5は、保留判定処理の一例を示すフローチャートである。図8は、前述の例で、宛先情報抽出処理により抽出された宛先情報である。 FIG. 5 is a flowchart showing an example of the hold determination process. FIG. 8 shows destination information extracted by destination information extraction processing in the above-described example.
まず、ステップS301で、宛先ドメインのうち、該当する組織名がメールの本文中に含まれないドメインを管理するためのリスト(不整合ドメインリスト)を作成する。 First, in step S301, a list (inconsistent domain list) for managing a domain whose corresponding organization name is not included in the text of the mail is created.
次に、ステップS302〜ステップS304で、各宛先ドメインが、不整合ドメインリストに含まれるか判定し、不整合ドメインリストを完成させる。 Next, in steps S302 to S304, it is determined whether each destination domain is included in the inconsistent domain list, and the inconsistent domain list is completed.
ステップS303で、宛先ドメインと、宛先情報抽出処理により抽出されたいずれかの組織名との組み合わせが、送信履歴DBに存在するかどうかを判定する。宛先ドメイン「EXAMPLE1.NW.JP」に対しては、組織名「XYZC NETWORKS」との組み合わせが送信履歴DBに存在する。一方、宛先ドメイン「EXAMPLE1.JP」に対しては、送信履歴DBに組織名「XYZC」、「XYZ通信」との組み合わせが存在するが、本文から抽出された組織名「XYZC NETWORKS」、「XYZCマーケティング」との組み合わせは存在しないため、ステップS304で不整合ドメインとしてリストに登録する。また、宛先ドメイン「EXAMPLE3.JP」においては、いずれの組織名との組み合わせも送信履歴DBに存在しないため、ステップS304で不整合ドメインとしてリストに登録する。 In step S303, it is determined whether the combination of the destination domain and any of the organization names extracted by the destination information extraction process exists in the transmission history DB. For the destination domain "EXAMPLE1.NW.JP", a combination with the organization name "XYZC NETWORKS" exists in the transmission history DB. On the other hand, for the destination domain "EXAMPLE1.JP", although there is a combination of organization names "XYZC" and "XYZ communication" in the transmission history DB, the organization names "XYZC NETWORKS" and "XYZC" extracted from the text Since there is no combination of “marketing”, it is registered in the list as an inconsistent domain in step S304. Further, in the destination domain “EXAMPLE 3. JP”, since there is no combination with any organization name in the transmission history DB, it is registered in the list as an inconsistent domain in step S 304.
次に、ステップS305で、不整合ドメインが存在するか否かを判定し、存在する場合はステップS306で判定結果を保留にし、存在しない場合は判定結果を送出にする。メール600においては、宛先ドメイン「EXAMPLE1.JP」、「EXAMPLE3.JP」が不整合ドメインであるため、保留判定処理の判定結果は「保留」となる。保留判定部103は、保留メールDB120に「保留」と判定したメール、および、宛先情報、不整合ドメインリストを一時的に保管する。
Next, in step S305, it is determined whether or not there is a mismatched domain. If it exists, the determination result is put on hold in step S306, and if it does not exist, the determination result is sent out. In the mail 600, since the destination domains “EXAMPLE1.JP” and “EXAMPLE3.JP” are inconsistent domains, the determination result of the hold determination process is “hold”. The
以上、保留判定部103における保留判定処理について説明した。前述の例は、「EXAMPLE1.JP、EXAMPLE3.JPに該当する組織名が、本文の宛名に記載されていないため、保留操作を行った」という動作を表している。
The hold determination process in the
次に、保留メール操作・システム設定部105がシステムのユーザに提供する画面、および、メール送信部104における処理について、図9〜図11を用いて説明する。
Next, the screen provided to the user of the system by the on-hold e-mail operation /
図9は、本実施形態における保留メール一覧画面900の一例を示しており、システムのユーザは、WEBブラウザを経由して画面の参照、操作が可能である。保留メール一覧画面900には、保留メールDB120に存在する各メールについて、送信日時、件名、本文組織名、宛先ドメインを提示する。ここで、保留判定部103が不整合ドメインと判定したドメインにおいては、特に確認が必要な項目として、太文字・赤字・下線などで強調して表示する。また、送信履歴DBに未登録の組織名については、同じく強調して表示する。
FIG. 9 shows an example of the pending
システムのユーザは、保留メール一覧画面900において、送信日時の項目を押下することにより、当該メールの保留理由確認画面を参照することができる。
The user of the system can refer to the hold reason confirmation screen of the mail by pressing the transmission date and time item on the hold
図10は、本実施形態における監査画面1000の一例を示している。監査画面1000は、保留理由、メール内容、削除ボタン、送出ボタンから成る。
監査画面1000における保留理由には、不整合ドメインなどの確認すべき項目とチェックボックスを一覧として表示する。保留理由として表示する不整合ドメインは、太文字・赤字・下線などで協調して表示する。なお、監査画面1000に表示するドメインは、クリック操作によって、最も送信回数が多い組織名(送信履歴DB110において、該当するドメインを含むレコードのうち、送信回数が最大のレコードの組織名)をポップアップで表示する機能を備える。
FIG. 10 shows an example of the
In the holding reason on the
監査画面1000におけるメール内容には、送受信者のアドレス、件名、本文などの情報を提示する。各項目の表示にあたり、本文組織名、および、宛先ドメインに関しては、強調して表示する。特に、送信履歴DBに未登録の組織名や、送信履歴DBに宛先ドメインとの組み合わせが存在しない組織名について強調して表示する。ここで表示した組織名、および、ドメインにおいても、クリック操作によって、最も送信回数が多いドメイン、または、組織名をポップアップで表示する機能を備える。また、組織名が送信履歴DBに未登録の場合や、宛先DBとの組み合わせが存在しない場合は、その旨ポップアップで表示する。
In the mail contents on the
監査画面1000における削除ボタンは、一時的に保留しているメールを送信せずに削除するボタンである。システムのユーザが削除ボタンを押下すると、保留メール操作・システム設定部105は、保留メールDBから該当するレコードを削除した上で、ユーザに保留メール一覧画面900を提示する。
The delete button on the
監査画面1000における送出ボタンは、後述する送信確認画面1100へ移行するためのボタンであり、保留理由におけるすべてのチェックボックスがチェック済である場合に押下可能な状態になる。システムのユーザが送信ボタンを押下すると、保留メール操作・システム設定部105は、送信確認画面1100をシステムのユーザに提示する。
The sending button in the
図11は、本実施形態における送信確認画面1100の一例を示している。送信確認画面1100は、新規学習対象一覧、キャンセルボタン、送出ボタンから成る。
FIG. 11 shows an example of the
送信確認画面1100における、新規学習対象一覧は、本文組織名、宛先ドメインの全組合せのうち、送信履歴DB110に存在しない組合せであり、組合せごとに、新しく送信履歴テーブルに登録するか否かを表すチェックボックスを備える。なお、各組織名の表示領域は、編集可能なフォームであり、抽出箇所に誤りがある場合などは編集可能なものである。
The new learning target list in the
送信確認画面1100における、キャンセルボタンは、メールの送出を取りやめるボタンである。システムのユーザがキャンセルボタンを押下すると、保留メール操作・システム設定部105は、当該メールの監査画面1000をシステムのユーザに提示する。
The cancel button in the
送信確認画面1100における、送出ボタンは、当該メールを送出するためのボタンである。システムのユーザが送出ボタンを押下すると、保留メール操作・システム設定部105は、新規学習対象一覧においてチェック済の組合せを送信履歴DB110に追加(送信回数の値は0)し、メール送信部104に当該メールを送った上で、保留メールDBから該当するレコードを削除し、ユーザに保留メール一覧画面900を提示する。
The send button on the
以上、保留メール操作・システム設定部105が提供する画面、および、メール送信部104における処理について説明した。
The screen provided by the on-hold e-mail operation /
なお、上記では、ドメインと組織名との組合せを学習する実施形態を説明したが、メールアドレスと宛名全体の組合せを学習することで、個人向けのメールに対しても同様のアイデアを適用することが可能になる。 In the above, the embodiment in which the combination of the domain and the organization name is learned has been described, but the same idea can be applied to personal mail by learning the combination of the entire email address and the addressee. Becomes possible.
また、本発明におけるプログラムは、図3〜図5の処理をコンピュータに実行させるプログラムである。なお、本発明におけるプログラムは、図3〜図5の各処理ごとのプログラムであってもよい。 Further, a program according to the present invention is a program that causes a computer to execute the processing of FIGS. The program according to the present invention may be a program for each of the processes shown in FIGS.
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。 As described above, the recording medium recording the program for realizing the functions of the above-described embodiments is supplied to the system or apparatus, and the computer (or CPU or MPU) of the system or apparatus stores the program stored in the recording medium. It goes without saying that the object of the present invention can also be achieved by reading and executing.
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。 In this case, the program itself read out from the recording medium realizes the novel function of the present invention, and the recording medium recording the program constitutes the present invention.
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。 As a recording medium for supplying the program, for example, a flexible disk, hard disk, optical disk, magneto-optical disk, CD-ROM, CD-R, DVD-ROM, magnetic tape, non-volatile memory card, ROM, EEPROM, silicon A disk etc. can be used.
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Further, by executing the program read by the computer, not only the functions of the above-described embodiment are realized, but also an operating system (OS) or the like running on the computer is actually executed based on the instructions of the program. It goes without saying that the processing is partially or entirely performed, and the processing realizes the functions of the above-described embodiments.
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Furthermore, after the program read from the recording medium is written to the memory provided to the function expansion board inserted into the computer or the function expansion unit connected to the computer, the function expansion board is read based on the instruction of the program code. It goes without saying that the case where the CPU or the like provided in the function expansion unit performs part or all of the actual processing and the functions of the above-described embodiment are realized by the processing.
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。 Further, the present invention may be applied to a system constituted by a plurality of devices or to an apparatus comprising a single device. It goes without saying that the present invention can also be applied to the case where it is achieved by supplying a program to a system or apparatus. In this case, by reading a recording medium storing a program for achieving the present invention into the system or apparatus, the system or apparatus can receive the effects of the present invention.
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。 Further, by downloading and reading out a program for achieving the present invention from a server on a network, a database or the like by a communication program, the system or apparatus can receive the effects of the present invention. In addition, the structure which combined each embodiment mentioned above and its modification is also contained in this invention altogether.
100 メール誤送信防止システム(情報処理装置)
100 Email Mistake Prevention System (Information Processing Device)
Claims (6)
前記電子メールの本文から所定の書式に適合する組織名を抽出する第1の抽出手段と、
前記電子メールの本文から前記記憶手段に記憶された組織名に一致する組織名を抽出する第2の抽出手段と、
前記第1の抽出手段により抽出された組織名と、前記第2の抽出手段により抽出された組織名とを比較し、長い方の組織名を取得する取得手段と、
前記取得した組織名と、前記電子メールの送信先ドメインとを対応付けて記憶するか否かを受け付ける受付手段と
を備えることを特徴とする情報処理装置。 An information processing apparatus comprising: storage means for storing an association between an organization name acquired from the text of an electronic mail and a transmission destination domain of the electronic mail;
First extracting means for extracting an organization name conforming to a predetermined format from the text of the electronic mail;
Second extraction means for extracting an organization name corresponding to the organization name stored in the storage means from the text of the electronic mail;
Acquisition means for comparing the tissue name extracted by the first extraction means with the tissue name extracted by the second extraction means to acquire the longer tissue name;
An information processing apparatus comprising: reception means for receiving whether or not the acquired organization name and the transmission destination domain of the e-mail are stored in association with each other.
前記電子メールの本文から所定の書式に適合する組織名を抽出する第1の抽出工程と、
前記電子メールの本文から前記記憶手段に記憶された組織名に一致する組織名を抽出する第2の抽出工程と、
前記第1の抽出工程により抽出された組織名と、前記第2の抽出工程により抽出された組織名とを比較し、長い方の組織名を取得する取得工程と、
前記取得した組織名と、前記電子メールの送信先ドメインとを対応付けて記憶するか否かを受け付ける受付工程と
を備えることを特徴とする情報処理方法。 An information processing method in an information processing apparatus, comprising: storage means for storing an association between an organization name acquired from a text of an electronic mail and a transmission destination domain of the electronic mail,
A first extraction step of extracting an organization name conforming to a predetermined format from the text of the electronic mail;
A second extraction step of extracting an organization name corresponding to the organization name stored in the storage means from the text of the electronic mail;
An acquisition step of acquiring a longer tissue name by comparing the tissue name extracted in the first extraction step with the tissue name extracted in the second extraction step;
An accepting step of accepting whether or not to store the acquired organization name and the destination domain of the electronic mail in association with each other.
前記情報処理装置を、
前記電子メールの本文から所定の書式に適合する組織名を抽出する第1の抽出手段と、
前記電子メールの本文から前記記憶手段に記憶された組織名に一致する組織名を抽出する第2の抽出手段と、
前記第1の抽出手段により抽出された組織名と、前記第2の抽出手段により抽出された組織名とを比較し、長い方の組織名を取得する取得手段と、
前記取得した組織名と、前記電子メールの送信先ドメインとを対応付けて記憶するか否かを受け付ける受付手段
として機能させることを特徴とするプログラム。 It is a program that can be executed in an information processing apparatus including storage means for storing an association between an organization name acquired from the text of an electronic mail and a transmission destination domain of the electronic mail,
The information processing apparatus
First extracting means for extracting an organization name conforming to a predetermined format from the text of the electronic mail;
Second extraction means for extracting an organization name corresponding to the organization name stored in the storage means from the text of the electronic mail;
Acquisition means for comparing the tissue name extracted by the first extraction means with the tissue name extracted by the second extraction means to acquire the longer tissue name;
A program characterized in that it functions as an accepting means for accepting whether or not to store the acquired organization name in association with a transmission destination domain of the electronic mail.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017248689A JP2019114155A (en) | 2017-12-26 | 2017-12-26 | Information processing device, information processing method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017248689A JP2019114155A (en) | 2017-12-26 | 2017-12-26 | Information processing device, information processing method, and program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2019114155A true JP2019114155A (en) | 2019-07-11 |
Family
ID=67222722
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017248689A Pending JP2019114155A (en) | 2017-12-26 | 2017-12-26 | Information processing device, information processing method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2019114155A (en) |
-
2017
- 2017-12-26 JP JP2017248689A patent/JP2019114155A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7950064B2 (en) | System and method for controlling comments in a collaborative document | |
| US20130325829A1 (en) | Matching transactions in multi-level records | |
| US8296785B2 (en) | Providing links between application programs | |
| CN100514302C (en) | Multi-source, multi-destination data transfer | |
| JP2018005415A (en) | Information processing device, information processing method, and program | |
| JP5077897B2 (en) | System capable of sending and receiving mail, information processing device, control method, program | |
| JP2007181031A (en) | Information processor, method for controlling the same, program and storage medium | |
| US20140075577A1 (en) | File security control system and method | |
| JP2019114155A (en) | Information processing device, information processing method, and program | |
| JP5402916B2 (en) | File management apparatus, and control method and program thereof. | |
| JP2013057999A (en) | Electronic mail template creation device, electronic mail template creation method, and electronic mail template creation program | |
| JP2018101351A (en) | Information processing device, information processing method, and program | |
| CN111766991B (en) | Method and device for opening document | |
| JP2019012354A (en) | Information processing system, control method of information processing system and program | |
| JP2009199254A (en) | Electronic mail transmission system, information processor, electronic mail transmission method, program, and recording medium | |
| JP6951988B2 (en) | Mail composer, information processing system, its control method and program | |
| JP2021043683A (en) | Antisocial information collation device, antisocial information collation method, and antisocial information collation program | |
| JP6905999B2 (en) | Information processing equipment, information processing methods, programs | |
| JP3672473B2 (en) | Individual name extraction device, extraction method, and recording medium | |
| KR102000543B1 (en) | Apparatus for editing web electric document and operating method thereof | |
| JP2004303050A (en) | Accounting system | |
| JP7181487B2 (en) | Information processing system, control method, and program | |
| JP5510509B2 (en) | Information processing system, control method and program thereof, information processing apparatus, control method and program thereof | |
| JP2018055353A (en) | Information processing device, information processing method and program | |
| JP3734391B2 (en) | Individual name extraction device, extraction method, and recording medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20180703 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20181031 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190115 |