[go: up one dir, main page]

JP6794162B2 - Text mining methods, text mining programs, and text mining equipment - Google Patents

Text mining methods, text mining programs, and text mining equipment Download PDF

Info

Publication number
JP6794162B2
JP6794162B2 JP2016145065A JP2016145065A JP6794162B2 JP 6794162 B2 JP6794162 B2 JP 6794162B2 JP 2016145065 A JP2016145065 A JP 2016145065A JP 2016145065 A JP2016145065 A JP 2016145065A JP 6794162 B2 JP6794162 B2 JP 6794162B2
Authority
JP
Japan
Prior art keywords
screen
analysis
text
group
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016145065A
Other languages
Japanese (ja)
Other versions
JP2018018118A (en
Inventor
正史 秋田
正史 秋田
中村 康則
康則 中村
景龍 周
景龍 周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2016145065A priority Critical patent/JP6794162B2/en
Priority to CN201780043375.8A priority patent/CN109478191B/en
Priority to PCT/JP2017/020922 priority patent/WO2018020842A1/en
Priority to KR1020197000933A priority patent/KR102180487B1/en
Priority to TW106122011A priority patent/TWI686716B/en
Publication of JP2018018118A publication Critical patent/JP2018018118A/en
Application granted granted Critical
Publication of JP6794162B2 publication Critical patent/JP6794162B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/358Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、テキストマイニングに関し、特に、テキストデータの分析結果を画面に表示するテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置に関する。 The present invention relates to text mining, and more particularly to a text mining method for displaying an analysis result of text data on a screen, a text mining program, and a text mining device.

近年、自由に記述された大量のテキストデータを解析し、解析結果から有用な情報を求めるテキストマイニングが注目されている。テキストマイニングでは、例えば、分析対象のテキストデータから単語を抽出し、単語の出現頻度や出現傾向などを解析することにより、情報を求める。 In recent years, text mining, which analyzes a large amount of freely described text data and seeks useful information from the analysis results, has attracted attention. In text mining, for example, words are extracted from the text data to be analyzed, and information is obtained by analyzing the appearance frequency and appearance tendency of the words.

以下、テキストデータから抽出した単語に対して階層的クラスター分析を行い、分析結果を画面に表示するテキストマイニング装置について検討する。階層的クラスター分析では、単語間の類似度に基づき、類似度の高い単語を含むクラスターが階層的に作成される。一般に、階層的クラスター分析の結果は、図15に示す樹形図(デンドログラム)を用いて利用者(分析者)に提供される。 Hereinafter, a text mining device that performs hierarchical cluster analysis on words extracted from text data and displays the analysis results on the screen will be examined. In hierarchical cluster analysis, clusters containing words with high similarity are created hierarchically based on the similarity between words. Generally, the result of the hierarchical cluster analysis is provided to the user (analyst) using the tree diagram (dendrogram) shown in FIG.

本願発明に関連して、特許文献1には、樹形図を構築し、樹形図を探索して下層から上層を特定可能なインデックスを生成して記憶手段に記憶する階層的クラスタリング手段を有するクラスタリング装置が記載されている。特許文献2には、キーワード間の距離を算出し、キーワードからキーワード間の距離を探索可能な距離行列データを生成して記憶手段に記憶する距離行列計算手段と、距離行列を用いてキーワードを階層的クラスタリングし、構築された樹形図を下層から上層に探索可能なボトムアップインデックスとして記憶手段に記憶するクラスタリング手段とを有するクエリ提供装置が記載されている。 In relation to the present invention, Patent Document 1 has a hierarchical clustering means for constructing a tree diagram, searching the tree diagram, generating an index capable of identifying the upper layer from the lower layer, and storing the index in the storage means. A clustering device is described. Patent Document 2 describes a distance matrix calculation means that calculates the distance between keywords, generates distance matrix data capable of searching the distance between keywords from the keywords, and stores the distance matrix data in the storage means, and a hierarchy of keywords using the distance matrix. A query providing device having a clustering means for storing the constructed dendrogram as a bottom-up index that can be searched from the lower layer to the upper layer in the storage means is described.

特開2011−216021号公報Japanese Unexamined Patent Publication No. 2011-216021 特開2012−150539号公報Japanese Unexamined Patent Publication No. 2012-150539

従来のテキストマイニング装置は、階層的クラスター分析の結果を樹形図を用いて画面に表示する。しかしながら、このようなテキストマイニング装置には、利用者が分析結果を直感的に理解できないという問題がある。例えば、利用者は、図15に示す分析結果においてクラスター数を4に設定するときには、図16に示すように、樹形図上に切断線を設定する。しかしながら、利用者は、このような樹形図を見ただけでは、各クラスターに含まれる単語を直感的に認識することができない。また、利用者は、単語数が多いときにクラスター数を変更した場合には、各クラスターに含まれる単語がどのように変化するかを直感的に把握することができない。 The conventional text mining device displays the result of the hierarchical cluster analysis on the screen using a tree diagram. However, such a text mining device has a problem that the user cannot intuitively understand the analysis result. For example, when the number of clusters is set to 4 in the analysis result shown in FIG. 15, the user sets a cutting line on the tree diagram as shown in FIG. However, the user cannot intuitively recognize the words contained in each cluster just by looking at such a tree diagram. In addition, the user cannot intuitively grasp how the words included in each cluster change when the number of clusters is changed when the number of words is large.

また、樹形図には単語の出現頻度が記載されていないので、利用者はどの単語が重要かを知ることができない。また、分析対象のテキストデータが年月日や時刻などの情報を有する時系列データである場合には、利用者は分析結果の時間的な変化を知ることを要望することがある。しかしながら、従来のテキストマイニング装置では、利用者のこのような要望に応えることができない。 Moreover, since the frequency of occurrence of words is not described in the tree diagram, the user cannot know which word is important. Further, when the text data to be analyzed is time-series data having information such as date and time, the user may request to know the temporal change of the analysis result. However, the conventional text mining device cannot meet such a demand of the user.

それ故に、本発明は、階層的クラスター分析の結果を利用者が直感的に理解できるように画面に表示するテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置を提供することを目的とする。 Therefore, it is an object of the present invention to provide a text mining method, a text mining program, and a text mining device that display the results of hierarchical cluster analysis on a screen so that the user can intuitively understand them.

本発明の第1の局面は、テキストデータの分析結果を画面に表示するテキストマイニング方法であって、
入力されたテキストデータから抽出した単語に対して階層的クラスター分析を行うテキスト分析ステップと、
前記テキスト分析ステップによる分析結果に基づき、画面データを生成する画面生成ステップと、
前記画面データに基づき、画面を表示する分析結果表示ステップとを備え、
前記画面生成ステップは、グループ数とグループ内の最大データ数とに基づき、前記分析結果から前記グループ数のクラスターを求め、前記クラスターに含まれる単語を前記最大データ数以下含むグループを画面に表示するための画面データを生成し、
前記グループには、名称として、前記グループに対応するクラスターに含まれる単語のうち出現頻度が最も高い単語が付けられていることを特徴とする。
The first aspect of the present invention is a text mining method for displaying an analysis result of text data on a screen.
A text analysis step that performs a hierarchical cluster analysis on words extracted from the input text data,
A screen generation step that generates screen data based on the analysis result of the text analysis step,
An analysis result display step for displaying a screen based on the screen data is provided.
In the screen generation step, based on the number of groups and the maximum number of data in the group, the cluster of the number of groups is obtained from the analysis result, and the group containing the words included in the cluster is displayed on the screen. It generates the screen data for,
The said group, as the name, frequency of the words included in the cluster corresponding to the group is characterized that you have given the highest word.

本発明の第2の局面は、本発明の第1の局面において、
前記グループに含まれる単語は、前記グループに対応するクラスターに含まれる単語の中から出現頻度が高い順に選択されることを特徴とする。
The second aspect of the present invention is the first aspect of the present invention.
The words included in the group are selected from the words included in the cluster corresponding to the group in descending order of frequency of occurrence.

本発明の第3の局面は、本発明の第2の局面において、
前記グループは、前記画面内で、前記グループに対応するクラスターに含まれる単語の出現頻度の合計に応じたサイズを有することを特徴とする。
The third aspect of the present invention is the second aspect of the present invention.
The group is characterized in that it has a size corresponding to the total frequency of occurrence of words included in the cluster corresponding to the group in the screen.

本発明の第4の局面は、本発明の第3の局面において、
前記グループに含まれる単語は、前記画面内で、前記単語の出現頻度に応じたサイズを有することを特徴とする。
The fourth aspect of the present invention is the third aspect of the present invention.
The words included in the group are characterized in that they have a size corresponding to the frequency of appearance of the words in the screen.

本発明の第5の局面は、本発明の第1の局面において、
利用者からの指示を入力するための指示入力ステップをさらに備え、
前記テキスト分析ステップおよび前記画面生成ステップのいずれかが、前記指示入力ステップで入力された指示に基づき実行されることを特徴とする。
The fifth aspect of the present invention is the first aspect of the present invention.
It also has an instruction input step for inputting instructions from the user.
One of the text analysis step and the screen generation step is executed based on the instruction input in the instruction input step.

本発明の第6の局面は、本発明の第5の局面において、
前記指示入力ステップは前記グループ数の設定指示を受け取り、
前記画面生成ステップは、前記指示入力ステップで設定されたグループ数に基づき、前記画面データを生成することを特徴とする。
The sixth aspect of the present invention is the fifth aspect of the present invention.
The instruction input step receives the setting instruction of the number of groups and receives the instruction.
The screen generation step is characterized in that the screen data is generated based on the number of groups set in the instruction input step.

本発明の第7の局面は、本発明の第5の局面において、
前記指示入力ステップは前記最大データ数の設定指示を受け取り、
前記画面生成ステップは、前記指示入力ステップで設定された最大データ数に基づき、前記画面データを生成することを特徴とする。
The seventh aspect of the present invention is the fifth aspect of the present invention.
The instruction input step receives the setting instruction of the maximum number of data and receives the instruction.
The screen generation step is characterized in that the screen data is generated based on the maximum number of data set in the instruction input step.

本発明の第8の局面は、本発明の第5の局面において、
前記指示入力ステップは分析対象期間の設定指示を受け取り、
前記テキスト分析ステップは、前記テキストデータのうち前記指示入力ステップで設定された分析対象期間内のテキストデータに含まれる単語に対して、前記階層的クラスター分析を行うことを特徴とする。
The eighth aspect of the present invention is the fifth aspect of the present invention.
The instruction input step receives the setting instruction of the analysis target period and receives the instruction.
The text analysis step is characterized in that the hierarchical cluster analysis is performed on the words included in the text data within the analysis target period set in the instruction input step among the text data.

本発明の第9の局面は、本発明の第5の局面において、
前記指示入力ステップは分析目的の設定指示を受け取り、
前記テキスト分析ステップは、前記テキストデータから前記指示入力ステップで設定された分析目的に応じた種類の単語を抽出して、前記階層的クラスター分析を行うことを特徴とする。
The ninth aspect of the present invention is the fifth aspect of the present invention.
The instruction input step receives the setting instruction for analysis purpose and receives the setting instruction.
The text analysis step is characterized in that the hierarchical cluster analysis is performed by extracting a type of word according to the analysis purpose set in the instruction input step from the text data.

本発明の第10の局面は、本発明の第5の局面において、
前記指示入力ステップは単語除外指示を受け取り、
前記テキスト分析ステップは、前記指示入力ステップで指示された単語を除外して、前記階層的クラスター分析を行うことを特徴とする。
The tenth aspect of the present invention is the fifth aspect of the present invention.
The instruction input step receives the word exclusion instruction and receives the word exclusion instruction.
The text analysis step is characterized in that the hierarchical cluster analysis is performed by excluding the words specified in the instruction input step.

本発明の第11の局面は、本発明の第5の局面において、
前記指示入力ステップは類義語登録指示を受け取り、
前記テキスト分析ステップは、前記指示入力ステップで指示された複数の単語を同じ単語とみなして、前記階層的クラスター分析を行うことを特徴とする。
The eleventh aspect of the present invention is the fifth aspect of the present invention.
The instruction input step receives a synonym registration instruction and receives
The text analysis step is characterized in that a plurality of words instructed in the instruction input step are regarded as the same word and the hierarchical cluster analysis is performed.

本発明の第12の局面は、本発明の第5の局面において、
前記指示入力ステップは複合語登録指示を受け取り、
前記テキスト分析ステップは、前記指示入力ステップで指示された複数の単語を1個の単語に併合して、前記階層的クラスター分析を行うことを特徴とする。
The twelfth aspect of the present invention is the fifth aspect of the present invention.
The instruction input step receives the compound word registration instruction and receives the compound word registration instruction.
The text analysis step is characterized in that a plurality of words instructed in the instruction input step are merged into one word to perform the hierarchical cluster analysis.

本発明の第13の局面は、本発明の第1の局面において、
前記画面生成ステップは、前記グループを含む分析結果画面と、前記分析結果画面の表示態様を設定するための分析設定画面とを表示するための画面データを生成することを特徴とする。
The thirteenth aspect of the present invention is the first aspect of the present invention.
The screen generation step is characterized in that screen data for displaying an analysis result screen including the group and an analysis setting screen for setting a display mode of the analysis result screen is generated.

本発明の第14の局面は、テキストデータの分析結果を画面に表示するテキストマイニングプログラムであって、
入力されたテキストデータから抽出した単語に対して階層的クラスター分析を行うテキスト分析ステップと、
前記テキスト分析ステップによる分析結果に基づき、画面データを生成する画面生成ステップと、
前記画面データに基づき、画面を表示する分析結果表示ステップとをコンピュータにCPUがメモリを利用して実行させ、
前記画面生成ステップは、グループ数とグループ内の最大データ数とに基づき、前記分析結果から前記グループ数のクラスターを求め、前記クラスターに含まれる単語を前記最大データ数以下含むグループを画面に表示するための画面データを生成し、
前記グループには、名称として、前記グループに対応するクラスターに含まれる単語のうち出現頻度が最も高い単語が付けられていることを特徴とする。
The fourteenth aspect of the present invention is a text mining program that displays the analysis result of text data on a screen.
A text analysis step that performs a hierarchical cluster analysis on words extracted from the input text data,
A screen generation step that generates screen data based on the analysis result of the text analysis step,
Based on the screen data, the CPU causes the computer to execute the analysis result display step of displaying the screen using the memory.
In the screen generation step, based on the number of groups and the maximum number of data in the group, the cluster of the number of groups is obtained from the analysis result, and the group containing the words included in the cluster is displayed on the screen. It generates the screen data for,
The said group, as the name, frequency of the words included in the cluster corresponding to the group is characterized that you have given the highest word.

本発明の第15の局面は、本発明の第14の局面において、
前記グループに含まれる単語は、前記グループに対応するクラスターに含まれる単語の中から出現頻度が高い順に選択されることを特徴とする。
The fifteenth aspect of the present invention is the fourteenth aspect of the present invention.
The words included in the group are selected from the words included in the cluster corresponding to the group in descending order of frequency of occurrence.

本発明の第16の局面は、本発明の第15の局面において、
前記グループは、前記画面内で、前記グループに対応するクラスターに含まれる単語の出現頻度の合計に応じたサイズを有することを特徴とする。
The sixteenth aspect of the present invention is the fifteenth aspect of the present invention.
The group is characterized in that it has a size corresponding to the total frequency of occurrence of words included in the cluster corresponding to the group in the screen.

本発明の第17の局面は、本発明の第16の局面において、
前記グループに含まれる単語は、前記画面内で、前記単語の出現頻度に応じたサイズを有することを特徴とする。
The seventeenth aspect of the present invention is the sixteenth aspect of the present invention.
The words included in the group are characterized in that they have a size corresponding to the frequency of appearance of the words in the screen.

本発明の第18の局面は、本発明の第14の局面において、
利用者からの指示を入力するための指示入力ステップを前記コンピュータにさらに実行させ、
前記テキスト分析ステップおよび前記画面生成ステップのいずれかが、前記指示入力ステップで入力された指示に基づき実行されることを特徴とする。
The eighteenth aspect of the present invention is the fourteenth aspect of the present invention.
The computer is further executed with an instruction input step for inputting an instruction from the user.
One of the text analysis step and the screen generation step is executed based on the instruction input in the instruction input step.

本発明の第19の局面は、本発明の第14の局面において、
前記画面生成ステップは、前記グループを含む分析結果画面と、前記分析結果画面の表示態様を設定するための分析設定画面とを表示するための画面データを生成することを特徴とする。
The nineteenth aspect of the present invention is the fourteenth aspect of the present invention.
The screen generation step is characterized in that screen data for displaying an analysis result screen including the group and an analysis setting screen for setting a display mode of the analysis result screen is generated.

本発明の第20の局面は、テキストデータの分析結果を画面に表示するテキストマイニング装置であって、
入力されたテキストデータから抽出した単語に対して階層的クラスター分析を行うテキスト分析部と、
前記テキスト分析部による分析結果に基づき、画面データを生成する画面生成部と、
前記画面データに基づき、画面を表示する分析結果表示部とを備え、
前記画面生成部は、グループ数とグループ内の最大データ数とに基づき、前記分析結果から前記グループ数のクラスターを求め、前記クラスターに含まれる単語を前記最大データ数以下含むグループを画面に表示するための画面データを生成し、
前記グループには、名称として、前記グループに対応するクラスターに含まれる単語のうち出現頻度が最も高い単語が付けられていることを特徴とする。
A twentieth aspect of the present invention is a text mining device that displays an analysis result of text data on a screen.
A text analysis unit that performs hierarchical cluster analysis on words extracted from the input text data,
A screen generation unit that generates screen data based on the analysis results of the text analysis unit,
It is equipped with an analysis result display unit that displays the screen based on the screen data.
The screen generation unit obtains a cluster of the number of groups from the analysis result based on the number of groups and the maximum number of data in the group, and displays a group containing words included in the cluster in the maximum number of data or less on the screen. It generates the screen data for,
The said group, as the name, frequency of the words included in the cluster corresponding to the group is characterized that you have given the highest word.

本発明の第21の局面は、本発明の第20の局面において、
前記グループに含まれる単語は、前記グループに対応するクラスターに含まれる単語の中から出現頻度が高い順に選択されることを特徴とする。
The 21st aspect of the present invention is the 20th aspect of the present invention.
The words included in the group are selected from the words included in the cluster corresponding to the group in descending order of frequency of occurrence.

本発明の第22の局面は、本発明の第21の局面において、
前記グループは、前記画面内で、前記グループに対応するクラスターに含まれる単語の出現頻度の合計に応じたサイズを有することを特徴とする。
The 22nd aspect of the present invention is the 21st aspect of the present invention.
The group is characterized in that it has a size corresponding to the total frequency of occurrence of words included in the cluster corresponding to the group in the screen.

本発明の第23の局面は、本発明の第22の局面において、
前記グループに含まれる単語は、前記画面内で、前記単語の出現頻度に応じたサイズを有することを特徴とする。
The 23rd aspect of the present invention is the 22nd aspect of the present invention.
The words included in the group are characterized in that they have a size corresponding to the frequency of appearance of the words in the screen.

本発明の第24の局面は、本発明の第20の局面において、
利用者からの指示を入力するための指示入力部をさらに備え、
前記テキスト分析部および前記画面生成部のいずれかが、前記指示入力部で入力された指示に基づき動作することを特徴とする。
The twenty-fourth aspect of the present invention is the twentieth aspect of the present invention.
Further equipped with an instruction input unit for inputting instructions from the user,
One of the text analysis unit and the screen generation unit operates based on the instruction input by the instruction input unit.

本発明の第25の局面は、本発明の第20の局面において、
前記画面生成部は、前記グループを含む分析結果画面と、前記分析結果画面の表示態様を設定するための分析設定画面とを表示するための画面データを生成することを特徴とする。
The 25th aspect of the present invention is the 20th aspect of the present invention.
The screen generation unit is characterized in that screen data for displaying an analysis result screen including the group and an analysis setting screen for setting a display mode of the analysis result screen is generated.

本発明の第1、第14または第20の局面によれば、テキストデータに含まれる単語に対して階層的クラスター分析を行った結果に基づき、クラスターに含まれる単語を含むグループが画面に表示される。また、グループに含まれる単語の数は、最大データ数以下に制限される。したがって、利用者は、画面を見たときに、階層的クラスター分析の結果を直感的に理解することができる。 According to the first, 14th, or twentieth aspect of the present invention, a group containing the words contained in the cluster is displayed on the screen based on the result of performing a hierarchical cluster analysis on the words contained in the text data. To. In addition, the number of words included in the group is limited to the maximum number of data or less. Therefore, the user can intuitively understand the result of the hierarchical cluster analysis when looking at the screen.

本発明の第2、第15または第21の局面によれば、グループの内部には、クラスターに含まれる単語のうち出現頻度が高い単語が表示される。したがって、利用者は、各クラスターに含まれる出現頻度が高い単語を容易に認識することができる。 According to the second, fifteenth or twenty-first aspect of the present invention, words having a high frequency of occurrence among the words included in the cluster are displayed inside the group. Therefore, the user can easily recognize the frequently occurring words included in each cluster.

本発明の第3、第16または第22の局面によれば、グループは、画面内で、クラスターに含まれる単語の出現頻度の合計に応じたサイズを有する。したがって、利用者は、単語の出現頻度の合計が大きいクラスターを容易に認識することができる。 According to the third, 16th or 22nd aspect of the present invention, the group has a size corresponding to the total frequency of occurrence of words contained in the cluster in the screen. Therefore, the user can easily recognize the cluster in which the total frequency of occurrence of words is large.

本発明の第4、第17または第23の局面によれば、単語は、画面内で、単語の頻度に応じたサイズを有する。したがって、利用者は、出現頻度が高い単語を容易に認識することができる。 According to the fourth, 17th or 23rd aspect of the present invention, the word has a size in the screen according to the frequency of the word. Therefore, the user can easily recognize words that frequently appear.

本発明の第5、第18または第24の局面によれば、利用者からの指示に応じて、階層的クラスター分析の結果の表示態様を切り替えることができる。 According to the fifth, eighteenth or twenty-fourth aspect of the present invention, the display mode of the result of the hierarchical cluster analysis can be switched according to the instruction from the user.

本発明の第6の局面によれば、画面に表示されるグループの個数(クラスターの個数)を利用者からの指示に応じて切り替えることができる。 According to the sixth aspect of the present invention, the number of groups (number of clusters) displayed on the screen can be switched according to an instruction from the user.

本発明の第7の局面によれば、グループに含まれる単語の個数の上限値を利用者からの指示に応じて切り替えることができる。 According to the seventh aspect of the present invention, the upper limit of the number of words included in the group can be switched according to the instruction from the user.

本発明の第8の局面によれば、利用者から指示された分析対象期間内のテキストデータに含まれる単語に対して階層的クラスター分析を行った結果が画面に表示される。したがって、利用者は、階層的クラスター分析の結果の時間的変化を容易に認識することができる。 According to the eighth aspect of the present invention, the result of performing the hierarchical cluster analysis on the words included in the text data within the analysis target period instructed by the user is displayed on the screen. Therefore, the user can easily recognize the temporal change of the result of the hierarchical cluster analysis.

本発明の第9の局面によれば、利用者から指示された分析目的に応じて分析対象の単語の種類を切り替えて階層的クラスター分析を行った結果を画面に表示することができる。 According to the ninth aspect of the present invention, it is possible to display on the screen the result of performing the hierarchical cluster analysis by switching the type of the word to be analyzed according to the analysis purpose instructed by the user.

本発明の第10の局面によれば、利用者から指示された単語を除外して階層的クラスター分析を行った結果を画面に表示することができる。 According to the tenth aspect of the present invention, the result of performing the hierarchical cluster analysis excluding the word instructed by the user can be displayed on the screen.

本発明の第11の局面によれば、利用者から指示された複数の単語を同じ単語とみなして階層的クラスター分析を行った結果を画面に表示することができる。 According to the eleventh aspect of the present invention, it is possible to display on the screen the result of performing the hierarchical cluster analysis by regarding a plurality of words instructed by the user as the same word.

本発明の第12の局面によれば、利用者から指示された複数の単語を1個の単語に併合して階層的クラスター分析を行った結果を画面に表示することができる。 According to the twelfth aspect of the present invention, it is possible to display on the screen the result of performing a hierarchical cluster analysis by merging a plurality of words instructed by the user into one word.

本発明の第13、第19または第25の局面によれば、分析結果画面と分析設定画面が表示される。したがって、利用者は、分析設定画面を用いて、階層的クラスター分析を行った結果の表示態様を容易に切り替えることができる。 According to the thirteenth , nineteenth or twenty-fifth aspect of the present invention, the analysis result screen and the analysis setting screen are displayed. Therefore, the user can easily switch the display mode of the result of the hierarchical cluster analysis by using the analysis setting screen.

本発明の実施形態に係るテキストマイニング装置の構成を示すブロック図である。It is a block diagram which shows the structure of the text mining apparatus which concerns on embodiment of this invention. 図1に示すテキストマイニング装置として機能するコンピュータの構成を示すブロック図である。It is a block diagram which shows the structure of the computer which functions as the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の表示画面を示す図である。It is a figure which shows the display screen of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の動作を示すフローチャートである。It is a flowchart which shows the operation of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の画面データ生成処理のフローチャートである。It is a flowchart of the screen data generation processing of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置のデータ指定画面を示す図である。It is a figure which shows the data designation screen of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置に入力されるテキストデータの例を示す図である。It is a figure which shows the example of the text data input to the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の目的指定画面を示す図である。It is a figure which shows the purpose designation screen of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の類義語リスト選択画面を示す図である。It is a figure which shows the synonym list selection screen of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の複合語リスト選択画面を示す図である。It is a figure which shows the compound word list selection screen of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置において分析対象期間を設定する前後の分析結果画面を示す図である。It is a figure which shows the analysis result screen before and after setting the analysis target period in the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置において単語除外を行う前後の分析結果画面を示す図である。It is a figure which shows the analysis result screen before and after performing word exclusion in the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置において類義語登録を行う前後の分析結果画面を示す図である。It is a figure which shows the analysis result screen before and after the synonym registration in the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置において複合語登録を行う前後の分析結果画面を示す図である。It is a figure which shows the analysis result screen before and after performing compound word registration in the text mining apparatus shown in FIG. 樹形図の例を示す図である。It is a figure which shows the example of the tree diagram. 図15に示す樹形図にクラスター数を設定した様子を示す図である。It is a figure which shows the state which set the cluster number in the tree diagram shown in FIG.

以下、図面を参照して、本発明の実施形態に係るテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置について説明する。本実施形態に係るテキストマイニング方法は、典型的にはコンピュータを用いて実行される。本実施形態に係るテキストマイニングプログラムは、コンピュータを用いてテキストマイニング方法を実施するためのプログラムである。本実施形態に係るテキストマイニング装置は、典型的にはコンピュータを用いて構成される。テキストマイニングプログラムを実行するコンピュータは、テキストマイニング装置として機能する。 Hereinafter, the text mining method, the text mining program, and the text mining apparatus according to the embodiment of the present invention will be described with reference to the drawings. The text mining method according to the present embodiment is typically executed using a computer. The text mining program according to the present embodiment is a program for implementing a text mining method using a computer. The text mining device according to the present embodiment is typically configured by using a computer. The computer that executes the text mining program functions as a text mining device.

図1は、本発明の実施形態に係るテキストマイニング装置の構成を示すブロック図である。図1に示すテキストマイニング装置10は、指示入力部11、テキスト分析部12、画面生成部13、および、分析結果表示部14を備えている。テキストマイニング装置10には、分析対象のテキストデータ5が入力される。テキストマイニング装置10は、入力されたテキストデータ5から抽出した単語に対して階層的クラスター分析を行い、分析結果を画面に表示する。 FIG. 1 is a block diagram showing a configuration of a text mining device according to an embodiment of the present invention. The text mining device 10 shown in FIG. 1 includes an instruction input unit 11, a text analysis unit 12, a screen generation unit 13, and an analysis result display unit 14. The text data 5 to be analyzed is input to the text mining device 10. The text mining device 10 performs a hierarchical cluster analysis on the words extracted from the input text data 5, and displays the analysis result on the screen.

テキストマイニング装置10の動作の概要は、以下のとおりである。指示入力部11には、利用者からの指示が入力される。テキスト分析部12は、入力されたテキストデータ5から単語を抽出し、抽出した単語に対して階層的クラスター分析を行う。画面生成部13は、テキスト分析部12による分析結果に基づき、画面データを生成する。分析結果表示部14は、画面生成部13で生成された画面データに基づき、画面を表示する。 The outline of the operation of the text mining device 10 is as follows. An instruction from the user is input to the instruction input unit 11. The text analysis unit 12 extracts words from the input text data 5, and performs a hierarchical cluster analysis on the extracted words. The screen generation unit 13 generates screen data based on the analysis result by the text analysis unit 12. The analysis result display unit 14 displays a screen based on the screen data generated by the screen generation unit 13.

指示入力部11に入力される利用者からの指示には、グループ数の設定、グループ内の最大データ数の設定、分析対象期間の設定、単語除外、類義語登録、複合語登録などが含まれる。テキストデータ5が年月日や時刻などの情報を有する時系列データである場合には、テキスト分析部12は、入力されたテキストデータ5のうち、指示入力部11で設定された分析対象期間内のテキストデータに含まれる単語に対して階層的クラスター分析を行う。 The instruction from the user input to the instruction input unit 11 includes setting the number of groups, setting the maximum number of data in the group, setting the analysis target period, word exclusion, synonym registration, compound word registration, and the like. When the text data 5 is time-series data having information such as date and time, the text analysis unit 12 within the analysis target period set by the instruction input unit 11 among the input text data 5. Perform a hierarchical cluster analysis on the words contained in the text data of.

画面生成部13は、画面データを生成するときに、グループ数とグループ内の最大データ数とに従う(詳細は後述)。また、利用者が新たな指示を入力したときには、指示された処理が行なわれた後に、画面生成部13は新たな画面データを生成し、分析結果表示部14は新たな画面を表示する。このようにテキストマイニング装置10は、利用者からの指示に応じて、テキストデータ5の分析態様と分析結果の表示態様を切り替える。 The screen generation unit 13 follows the number of groups and the maximum number of data in the group when generating screen data (details will be described later). Further, when the user inputs a new instruction, the screen generation unit 13 generates new screen data and the analysis result display unit 14 displays the new screen after the instructed process is performed. In this way, the text mining device 10 switches between the analysis mode of the text data 5 and the display mode of the analysis result in response to an instruction from the user.

図2は、テキストマイニング装置10として機能するコンピュータの構成を示すブロック図である。図2に示すコンピュータ20は、CPU21、メインメモリ22、記憶部23、入力部24、表示部25、通信部26、および、記憶媒体読み取り部27を備えている。メインメモリ22には、例えば、DRAMが使用される。記憶部23には、例えば、ハードディスクやソリッドステートドライブが使用される。入力部24には、例えば、キーボード28やマウス29が含まれる。表示部25には、例えば、液晶ディスプレイが使用される。通信部26は、有線通信または無線通信のインターフェイス回路である。記憶媒体読み取り部27は、プログラムなどを記憶した記憶媒体30のインターフェイス回路である。記憶媒体30には、例えば、CD−ROM、DVD−ROM、USBメモリなどの非一過性の記憶媒体が使用される。 FIG. 2 is a block diagram showing a configuration of a computer functioning as a text mining device 10. The computer 20 shown in FIG. 2 includes a CPU 21, a main memory 22, a storage unit 23, an input unit 24, a display unit 25, a communication unit 26, and a storage medium reading unit 27. For the main memory 22, for example, DRAM is used. For example, a hard disk or a solid state drive is used for the storage unit 23. The input unit 24 includes, for example, a keyboard 28 and a mouse 29. For the display unit 25, for example, a liquid crystal display is used. The communication unit 26 is an interface circuit for wired communication or wireless communication. The storage medium reading unit 27 is an interface circuit of the storage medium 30 that stores programs and the like. As the storage medium 30, for example, a non-transient storage medium such as a CD-ROM, a DVD-ROM, or a USB memory is used.

コンピュータ20がテキストマイニングプログラム31を実行する場合、記憶部23は、テキストマイニングプログラム31とテキストデータ5を記憶する。テキストマイニングプログラム31とテキストデータ5は、例えば、サーバや他のコンピュータから通信部26を用いて受信したものでもよく、記憶媒体30から記憶媒体読み取り部27を用いて読み出したものでもよい。 When the computer 20 executes the text mining program 31, the storage unit 23 stores the text mining program 31 and the text data 5. The text mining program 31 and the text data 5 may be, for example, those received from a server or another computer using the communication unit 26, or those read from the storage medium 30 using the storage medium reading unit 27.

テキストマイニングプログラム31を実行するときには、テキストマイニングプログラム31とテキストデータ5はメインメモリ22に複写転送される。CPU21は、メインメモリ22を作業用メモリとして利用して、メインメモリ22に記憶されたテキストマイニングプログラム31を実行することにより、メインメモリ22に記憶されたテキストデータ5を処理する。このときコンピュータ20は、テキストマイニング装置10として機能する。なお、以上に述べたコンピュータ20の構成は一例に過ぎず、任意のコンピュータを用いてテキストマイニング装置10を構成することができる。 When the text mining program 31 is executed, the text mining program 31 and the text data 5 are copied and transferred to the main memory 22. The CPU 21 uses the main memory 22 as a working memory and executes the text mining program 31 stored in the main memory 22 to process the text data 5 stored in the main memory 22. At this time, the computer 20 functions as a text mining device 10. The configuration of the computer 20 described above is only an example, and the text mining device 10 can be configured by using any computer.

図3は、テキストマイニング装置10の表示画面を示す図である。図3に示す表示画面40には、分析結果画面41と分析設定画面42が含まれる。分析結果画面41には、テキスト分析部12による分析結果が表示される。分析設定画面42には、テキスト分析部12における分析態様と画面生成部13で生成される画面データの特性を設定するためのグラフィカルユーザインターフェイス部品が表示される。 FIG. 3 is a diagram showing a display screen of the text mining device 10. The display screen 40 shown in FIG. 3 includes an analysis result screen 41 and an analysis setting screen 42. The analysis result screen 41 displays the analysis result by the text analysis unit 12. On the analysis setting screen 42, a graphical user interface component for setting the analysis mode in the text analysis unit 12 and the characteristics of the screen data generated by the screen generation unit 13 is displayed.

階層的クラスター分析の結果に対してクラスター数を設定すると、各クラスターに含まれる単語が決定される。テキストマイニング装置10は、テキストデータ5から抽出した単語に対して階層的クラスター分析を行った結果を画面に表示するときに、樹形図に代えて、クラスターに対応するグループを図3に示す態様で表示する。 Setting the number of clusters for the results of a hierarchical cluster analysis determines the words contained in each cluster. When the text mining device 10 displays the result of hierarchical cluster analysis on the words extracted from the text data 5 on the screen, the group corresponding to the cluster is shown in FIG. 3 instead of the tree diagram. Display with.

以下の説明では、画面に表示されるクラスターをグループともいう。利用者は、指示入力部11を用いて、グループ数(クラスター数)とグループ内の最大データ数(グループに含まれる単語の数の上限値)とを指定する。以下、前者をm、後者をnとする。 In the following description, the cluster displayed on the screen is also referred to as a group. The user uses the instruction input unit 11 to specify the number of groups (number of clusters) and the maximum number of data in the group (upper limit of the number of words included in the group). Hereinafter, the former will be m and the latter will be n.

テキストマイニング装置10では、テキストデータ5に含まれる単語はm個のクラスターに分類され、各クラスターには1個以上の単語が含まれる。分析結果画面41にはm個のグループが表示され、各グループの内部には単語が表示される。グループは雲形図形を用いて表示され、グループに含まれる単語は楕円領域の内部に表示される。各グループに含まれる単語は、n個以下に制限される。例えば、n=5のときにあるクラスターが10個の単語を含む場合、分析結果画面41ではグループの内部に5個の単語が表示される。 In the text mining device 10, the words included in the text data 5 are classified into m clusters, and each cluster contains one or more words. M groups are displayed on the analysis result screen 41, and words are displayed inside each group. The group is displayed using a cloud shape, and the words contained in the group are displayed inside the elliptical area. The number of words included in each group is limited to n or less. For example, when a cluster contains 10 words when n = 5, 5 words are displayed inside the group on the analysis result screen 41.

分析設定画面42には、グループ数mを設定するための第1スライダーと2個の第1ボタン(記号「+」または「−」を付したもの)、グループ内の最大データ数nを設定するための第2スライダーと2個の第2ボタン、および、分析対象期間を設定するための4個のボックスと2個の第3ボタン(左向き矢印または右向き矢印を付したもの)が表示される。 On the analysis setting screen 42, the first slider for setting the number of groups m, the two first buttons (with the symbol "+" or "-"), and the maximum number of data n in the group are set. A second slider and two second buttons for the purpose, and four boxes and two third buttons (with a left-pointing arrow or a right-pointing arrow) for setting the analysis target period are displayed.

利用者は、マウス29を操作して、第1スライダーのつまみを左右に移動させるか、第1ボタンを押すことにより、グループ数mを指示する。グループ数mは、記号「+」を付した第1ボタンが押されたときには増加し、記号「−」を付した第1ボタンが押されたときには減少する。グループ数mの初期値は、例えば、テキスト分析部12による分析結果に含まれる単語の種類の平方根、または、これに近い整数に設定される。例えば、テキスト分析部12による分析結果に16種類の単語が含まれている場合、グループ数mの初期値は4に設定される。 The user operates the mouse 29 to move the knob of the first slider to the left or right, or presses the first button to instruct the number of groups m. The number of groups m increases when the first button with the symbol "+" is pressed, and decreases when the first button with the symbol "-" is pressed. The initial value of the number of groups m is set to, for example, the square root of the word type included in the analysis result by the text analysis unit 12, or an integer close to this. For example, when the analysis result by the text analysis unit 12 includes 16 kinds of words, the initial value of the number of groups m is set to 4.

利用者は、マウス29を操作して、第2スライダーのつまみを左右に移動させるか、第2ボタンを押すことにより、グループ内の最大データ数nを指示する。グループ内の最大データ数nは、第2ボタンが押されたときには増加または減少する。グループ内の最大データ数nの初期値は、例えば、5に設定される。 The user operates the mouse 29 to move the knob of the second slider to the left or right, or presses the second button to instruct the maximum number of data n in the group. The maximum number of data n in the group increases or decreases when the second button is pressed. The initial value of the maximum number of data n in the group is set to 5, for example.

テキストデータ5が時系列データである場合、利用者は、キーボード28またはマウス29を操作して、4個のボックスを用いて年月日と時刻を指定するか、第3ボタンを押すことにより、分析対象期間を指示する。分析対象期間は、左向き矢印を付した第3ボタンが押されたときには所定量だけ(例えば1ヵ月)過去へ移動し、右向き矢印を付した第3ボタンが押されたときには所定量だけ反対方向へ移動する。分析対象期間の初期値は、例えば、テキストデータ5の最も古い時刻から最も新しい時刻までの期間に設定される。なお、テキストデータ5が時系列データでない場合には、利用者は分析対象期間を指定できない。 When the text data 5 is time series data, the user operates the keyboard 28 or the mouse 29 to specify the date and time using the four boxes, or presses the third button. Indicate the analysis period. The analysis target period moves to the past by a predetermined amount (for example, one month) when the third button with a left-pointing arrow is pressed, and moves in the opposite direction by a predetermined amount when the third button with a right-pointing arrow is pressed. Moving. The initial value of the analysis target period is set to, for example, the period from the oldest time to the newest time of the text data 5. If the text data 5 is not time series data, the user cannot specify the analysis target period.

分析結果画面41には1個以上m個以下のグループが表示され、各グループの内部には1個以上n個以下の単語が表示される。各グループは、画面内で、対応するクラスターに含まれる単語の出現頻度の合計が大きいほど大きく表示される。クラスターに含まれる単語の数がn個を超える場合には、グループの内部には出現頻度が高いn個の単語が表示される。グループに含まれる単語とこれを包含する楕円領域は、画面内で、単語の出現頻度が高いほど大きく表示される。各グループには、名称が付けられる。グループの名称には、クラスターに含まれる単語のうち出現頻度が最も高い単語が使用される。グループの名称は、グループの内部に下線を付して表示される。なお、楕円領域の内部に単語を表示できない場合には、単語に代えて記号「…」が表示される。 Groups of 1 or more and m or less are displayed on the analysis result screen 41, and 1 or more and n or less words are displayed inside each group. Each group is displayed larger on the screen as the total frequency of occurrence of words contained in the corresponding cluster increases. When the number of words contained in the cluster exceeds n, n words with a high frequency of occurrence are displayed inside the group. The words included in the group and the elliptical area containing them are displayed larger on the screen as the frequency of occurrence of the words increases. Each group is given a name. For the name of the group, the word that appears most frequently among the words included in the cluster is used. The name of the group is underlined inside the group. If the word cannot be displayed inside the elliptical area, the symbol "..." is displayed instead of the word.

分析結果画面41には、ズーム倍率を指定するための第3スライダーおよび2個の第4ボタン(記号「+」または「−」を付したもの)が表示される。利用者は、マウス29を操作して、第3スライダーのつまみを左右に移動させるか、第4ボタンを押すことにより、ズーム倍率を設定する。分析結果画面41には、単語を含むグループが、設定されたズーム倍率に応じて拡大または縮小して表示される。ズーム倍率の初期値は、100%に設定される。初期状態の分析結果画面41には、すべてのグループが表示される。 On the analysis result screen 41, a third slider for designating the zoom magnification and two fourth buttons (with the symbol “+” or “−”) are displayed. The user operates the mouse 29 to move the knob of the third slider to the left or right, or presses the fourth button to set the zoom magnification. On the analysis result screen 41, a group including a word is displayed in an enlarged or reduced size according to a set zoom magnification. The initial value of the zoom magnification is set to 100%. All groups are displayed on the analysis result screen 41 in the initial state.

利用者が分析設定画面42においてグループ数m、グループ内の最大データ数n、または、分析対象期間を変更したときに、分析結果画面41の内容はこれに応じて変化する。利用者が分析結果画面41において単語除外、類義語登録、または、複合語登録を指示したときにも、分析結果画面41の内容はこれに応じて変化する。 When the user changes the number of groups m, the maximum number of data n in the group, or the analysis target period on the analysis setting screen 42, the content of the analysis result screen 41 changes accordingly. When the user instructs word exclusion, synonym registration, or compound word registration on the analysis result screen 41, the content of the analysis result screen 41 changes accordingly.

テキストマイニング装置10は、テキストデータ5から抽出した単語に対して階層的クラスター分析を行うときに、除外すべき単語を記憶した除外単語リスト、類義語として処理すべき単語を記憶した類義語リスト、および、複合語として処理すべき単語を記憶した複合語リストを参照する。類義語リストには、同じ意味(または、ほぼ同じ意味)を有する複数の単語と、これらの単語を代表する1個の単語とが対応づけて記憶されている。複合語リストには、連結すると1個の複合語になる複数の単語と、これらの単語を連結した複合語とが対応づけて記憶されている。類義語リストには、例えば、「大学生」および「学生」と、両者を代表する「大学生」とが対応づけて記憶されている。複合語リストには、例えば、「忍耐」および「強い」と、両者を連結した「忍耐強い」とが対応づけて記憶されている。テキストマイニング装置10は、複数の類義語リストと複数の複合語リストを有する場合がある。 The text mining device 10 stores an excluded word list that stores words to be excluded, a synonym list that stores words to be processed as synonyms, and a synonym list that stores words to be excluded when performing hierarchical cluster analysis on the words extracted from the text data 5. Refer to the compound word list that stores the words to be processed as compound words. In the synonym list, a plurality of words having the same meaning (or almost the same meaning) are stored in association with one word representing these words. In the compound word list, a plurality of words that are concatenated into one compound word and a compound word in which these words are concatenated are stored in association with each other. In the synonym list, for example, "university student" and "student" and "university student" representing both are stored in association with each other. In the compound word list, for example, "patience" and "strong" and "patience" that connects the two are stored in association with each other. The text mining device 10 may have a plurality of synonym lists and a plurality of compound word lists.

図4は、テキストマイニング装置10の動作を示すフローチャートである。図5は、テキストマイニング装置10の画面データ生成処理(図4に示すステップS111)の詳細を示すフローチャートである。入力部24とステップS113を実行するCPU21は、指示入力部11として機能する。ステップS109〜S110を実行するCPU21は、テキスト分析部12として機能する。ステップS111を実行するCPU21は、画面生成部13として機能する。表示部25とステップS112を実行するCPU21は、分析結果表示部14として機能する。以下、図4および図5を参照して、テキストマイニング装置10の動作を説明する。 FIG. 4 is a flowchart showing the operation of the text mining device 10. FIG. 5 is a flowchart showing details of the screen data generation process (step S111 shown in FIG. 4) of the text mining device 10. The input unit 24 and the CPU 21 that executes step S113 function as the instruction input unit 11. The CPU 21 that executes steps S109 to S110 functions as the text analysis unit 12. The CPU 21 that executes step S111 functions as a screen generation unit 13. The display unit 25 and the CPU 21 that executes step S112 function as the analysis result display unit 14. Hereinafter, the operation of the text mining device 10 will be described with reference to FIGS. 4 and 5.

まず、CPU21は、図6に示すデータ指定画面51を表示部25に表示させる(ステップS101)。データ指定画面51には、ファイル名を指定するためのボックスと、フォルダ名を指定するためのボックスとが表示されている。利用者は、データ指定画面51においてファイル名またはフォルダ名を指定することにより、分析対象のテキストデータ5を指定する。テキストデータ5は、ハードディスクなどの記憶部23に記憶されていてもよく、通信部26を用いて接続されたサーバや他のコンピュータなどに記憶されていてもよい。 First, the CPU 21 causes the display unit 25 to display the data designation screen 51 shown in FIG. 6 (step S101). On the data designation screen 51, a box for specifying a file name and a box for specifying a folder name are displayed. The user specifies the text data 5 to be analyzed by designating the file name or the folder name on the data designation screen 51. The text data 5 may be stored in a storage unit 23 such as a hard disk, or may be stored in a server or another computer connected by using the communication unit 26.

次に、CPU21は、データ指定画面51を用いて指定されたテキストデータ5をメインメモリ22に転送する。これにより、テキストマイニング装置10にテキストデータ5が入力される(ステップS102)。図7は、テキストデータ5の例を示す図である。図7に示すテキストデータは、大学生が作成したレポートのデータであり、年月日の情報を有する時系列データである。なお、テキストマイニング装置10が分析するテキストデータ5の種類は任意である。 Next, the CPU 21 transfers the text data 5 designated using the data designation screen 51 to the main memory 22. As a result, the text data 5 is input to the text mining device 10 (step S102). FIG. 7 is a diagram showing an example of text data 5. The text data shown in FIG. 7 is report data created by a university student, and is time-series data having date information. The type of text data 5 analyzed by the text mining device 10 is arbitrary.

次に、CPU21は、図8に示す目的指定画面52を表示部25に表示させる(ステップS103)。目的指定画面52には、内容、特徴、および、評判に対応した3個のラジオボタンが表示されている。利用者は、マウス29を操作していずれかのラジオボタンを押すことにより、分析目的を内容、特徴、および、評判の中から選択する。次に、CPU21は、目的指定画面52を用いて指定された分析目的を受け取る。これにより、テキストマイニング装置10に分析目的が入力される(ステップS104)。 Next, the CPU 21 causes the display unit 25 to display the purpose designation screen 52 shown in FIG. 8 (step S103). On the purpose designation screen 52, three radio buttons corresponding to the contents, features, and reputation are displayed. By operating the mouse 29 and pressing any radio button, the user selects the analysis purpose from the contents, features, and reputation. Next, the CPU 21 receives the analysis purpose specified by using the purpose designation screen 52. As a result, the analysis purpose is input to the text mining device 10 (step S104).

次に、CPU21は、図9に示す類義語リスト選択画面53を表示部25に表示させる(ステップS105)。類義語リスト選択画面53には、テキストマイニング装置10が有する類義語リストの名称と、各類義語リストに登録された類義語とが表示される。利用者は、マウス29を操作して類義語リスト選択画面53においていずれかの類義語リストを選択することにより、使用する類義語リストを指定する。これにより、テキストマイニング装置10では、類義語リストが選択される(ステップS106)。 Next, the CPU 21 causes the display unit 25 to display the synonym list selection screen 53 shown in FIG. 9 (step S105). On the synonym list selection screen 53, the name of the synonym list included in the text mining device 10 and the synonyms registered in each synonym list are displayed. The user specifies a synonym list to be used by operating the mouse 29 to select one of the synonym lists on the synonym list selection screen 53. As a result, the text mining device 10 selects a synonym list (step S106).

次に、CPU21は、図10に示す複合語リスト選択画面54を表示部25に表示させる(ステップS107)。複合語リスト選択画面54には、テキストマイニング装置10が有する複合語リストの名称と、各複合語リストに登録された複合語とが表示される。利用者は、マウス29を操作して複合語リスト選択画面54においていずれかの複合語リストを選択することにより、使用する複合語リストを指定する。これにより、テキストマイニング装置10では、複合語リストが選択される(ステップS108)。 Next, the CPU 21 causes the display unit 25 to display the compound word list selection screen 54 shown in FIG. 10 (step S107). On the compound word list selection screen 54, the name of the compound word list included in the text mining device 10 and the compound words registered in each compound word list are displayed. The user specifies a compound word list to be used by operating the mouse 29 to select one of the compound word lists on the compound word list selection screen 54. As a result, the text mining device 10 selects the compound word list (step S108).

次に、CPU21は、除外単語リスト、類義語リスト、および、複合語リストを考慮して、ステップS102で入力されたテキストデータ5のうち分析対象期間内にあるテキストデータからステップS104で指定された分析目的に応じた種類の単語を抽出する(ステップS109)。CPU21は、分析目的が「内容」である場合には、テキストデータ5から名詞、固有名詞、地名、および、人名を抽出する。分析目的が「特徴」である場合には、CPU21はテキストデータ5から名詞、固有名詞、サ変名詞、および、動詞を抽出する。分析目的が「評判」である場合には、CPU21はテキストデータ5から形容詞、形容動詞、および、感動詞を抽出する。なお、テキストマイニング装置10は、上記3個以外の分析目的をサポートしてもよい。また、CPU21は、各分析目的に応じて上記とは異なる種類の単語を抽出してもよい。 Next, the CPU 21 considers the excluded word list, the synonym list, and the compound word list, and analyzes the text data 5 input in step S102 from the text data within the analysis target period specified in step S104. A type of word according to the purpose is extracted (step S109). When the purpose of analysis is "content", the CPU 21 extracts nouns, proper nouns, place names, and personal names from the text data 5. When the purpose of analysis is "feature", the CPU 21 extracts nouns, proper nouns, sa-variant nouns, and verbs from the text data 5. When the purpose of analysis is "reputation", the CPU 21 extracts adjectives, adjective verbs, and interjections from the text data 5. The text mining device 10 may support analysis purposes other than the above three. Further, the CPU 21 may extract a word of a type different from the above according to each analysis purpose.

テキストデータ5が時系列データである場合には、CPU21は、ステップS109を実行するときに、テキストデータ5のうち、利用者から指示された分析対象期間に含まれるテキストデータだけから単語を抽出する。また、単語W1が除外単語リストに記憶されている場合には、CPU21は、ステップS109を実行するときに、テキストデータ5に含まれる単語W1をすべて無視する。また、選択された類義語リストに単語W2および単語W3と、両者を代表する単語W2とが対応づけて記憶されている場合には、CPU21は、ステップS109を実行するときに、テキストデータ5に含まれる単語W3をすべて単語W2として処理する。また、選択された複合語リストに単語W4および単語W5と、両者を連結した単語W6とが対応づけて記憶されている場合には、CPU21は、ステップS109を実行するときに、テキストデータ5に含まれる、連続した単語W4と単語W5をすべて単語W6として処理する。 When the text data 5 is time-series data, the CPU 21 extracts a word from only the text data included in the analysis target period instructed by the user among the text data 5 when executing step S109. .. Further, when the word W1 is stored in the excluded word list, the CPU 21 ignores all the words W1 included in the text data 5 when executing step S109. Further, when the words W2 and W3 and the word W2 representing both of them are stored in association with each other in the selected synonym list, the CPU 21 includes the word W2 and the word W3 in the text data 5 when the step S109 is executed. All the words W3 are processed as words W2. Further, when the words W4 and W5 and the word W6 in which both are connected are stored in association with each other in the selected compound word list, the CPU 21 stores the word W4 and the word W5 in the text data 5 when the step S109 is executed. All the consecutive words W4 and W5 included are processed as words W6.

次に、CPU21は、ステップS109で抽出した単語に対して階層的クラスター分析を行う(ステップS110)。CPU21は、ステップS110において、例えば、テキストデータ5における2個の単語間の距離(2個の単語がどの程度離れて現れるか)に基づき、2個の単語間の類似度を求める。CPU21は、求めた単語間の類似度に基づき、所定の方法(例えば、最短距離法、最長距離法、群平均法、十進法、ウォード法など)を用いて階層的クラスター分析を行う。また、CPU21は、ステップS110において、各単語の出現頻度を求める。 Next, the CPU 21 performs a hierarchical cluster analysis on the words extracted in step S109 (step S110). In step S110, the CPU 21 obtains the similarity between the two words based on, for example, the distance between the two words in the text data 5 (how far the two words appear). The CPU 21 performs a hierarchical cluster analysis using a predetermined method (for example, the shortest distance method, the longest distance method, the group average method, the decimal method, the Ward method, etc.) based on the similarity between the obtained words. Further, the CPU 21 obtains the frequency of occurrence of each word in step S110.

次に、CPU21は、ステップS110で求めた階層的クラスター分析の結果に基づき、分析結果を表示するための画面データを生成する(ステップS111)。CPU21は、ステップS111において、図5に示す処理を行う。 Next, the CPU 21 generates screen data for displaying the analysis result based on the result of the hierarchical cluster analysis obtained in step S110 (step S111). The CPU 21 performs the process shown in FIG. 5 in step S111.

CPU21は、グループ数をm、グループ内の最大データ数をnとする(ステップS201)。次に、CPU21は、階層的クラスター分析の結果についてクラスター数をmに設定して、m個のクラスターを求める(ステップS202)。次に、CPU21は、各クラスターについて、クラスターに含まれる単語の出現頻度の合計を求める(ステップS203)。次に、CPU21は、ステップS203で求めた出現頻度の合計に基づき、各グループの表示サイズを決定する(ステップS204)。ステップS204では、クラスターに含まれる単語の出現頻度の合計が大きいほど、グループの表示サイズは大きく決定される。 The CPU 21 has m as the number of groups and n as the maximum number of data in the group (step S201). Next, the CPU 21 sets the number of clusters to m for the result of the hierarchical cluster analysis, and obtains m clusters (step S202). Next, the CPU 21 obtains the total frequency of occurrence of words included in the cluster for each cluster (step S203). Next, the CPU 21 determines the display size of each group based on the total appearance frequency obtained in step S203 (step S204). In step S204, the larger the total frequency of occurrence of words included in the cluster, the larger the display size of the group is determined.

次に、CPU21は、各クラスターについて、クラスターに含まれる単語の中から表示すべき単語を選択する(ステップS205)。ステップS205では、各クラスターに含まれる単語の中から出現頻度が高い順に、n個以下の単語が選択される。次に、CPU21は、ステップS205で選択した各単語について、単語の出現頻度に基づき単語の表示サイズを決定する(ステップS206)。ステップS206では、出現頻度の高い単語ほど、単語の表示サイズは大きく決定される。 Next, the CPU 21 selects a word to be displayed from the words included in the cluster for each cluster (step S205). In step S205, n or less words are selected from the words included in each cluster in descending order of frequency of occurrence. Next, the CPU 21 determines the display size of the word for each word selected in step S205 based on the frequency of occurrence of the word (step S206). In step S206, the more frequently the word appears, the larger the display size of the word is determined.

次に、CPU21は、階層的クラスター分析の結果を表示するための画面データを生成する(ステップS207)。ステップS207で生成される画面データには、ステップS204で決定されたサイズを有するm個のグループ(雲形図形で表現される)が含まれる。各グループの内部には、ステップS206で決定されたサイズを有するn個以下の単語が含まれる。単語は、画面内で、グループの内部に表示される。CPU21は、ステップS207を実行した後に画面データ生成処理を終了する。 Next, the CPU 21 generates screen data for displaying the result of the hierarchical cluster analysis (step S207). The screen data generated in step S207 includes m groups (represented by cloud figures) having the size determined in step S204. Within each group are n or less words having the size determined in step S206. Words are displayed inside the group on the screen. The CPU 21 ends the screen data generation process after executing step S207.

次に、CPU21は、ステップS111で生成した画面データに基づく画面を表示部25に表示させる(ステップS112)。次に、CPU21は、利用者からの指示を受け取る(ステップS113)。次に、CPU21は、ステップS113で受け取った指示の種類に応じて、ステップS115〜S120のいずれかに進む(ステップS114)。 Next, the CPU 21 causes the display unit 25 to display a screen based on the screen data generated in step S111 (step S112). Next, the CPU 21 receives an instruction from the user (step S113). Next, the CPU 21 proceeds to any of steps S115 to S120 according to the type of instruction received in step S113 (step S114).

CPU21は、ステップS113で受け取った指示が「グループ数の設定」である場合には、ステップS115へ進む。この場合、CPU21は、グループ数mを利用者が指示した値に設定し(ステップS115)、ステップS111へ進む。その後、設定されたグループ数mに基づき画面データが生成され、新たな画面が表示される。これにより、指定された個数のグループを含む分析結果画面が表示される。 If the instruction received in step S113 is "setting the number of groups", the CPU 21 proceeds to step S115. In this case, the CPU 21 sets the number of groups m to the value specified by the user (step S115), and proceeds to step S111. After that, screen data is generated based on the set number of groups m, and a new screen is displayed. As a result, the analysis result screen including the specified number of groups is displayed.

CPU21は、ステップS113で受け取った指示が「グループ内の最大データ数の設定」である場合には、ステップS116へ進む。この場合、CPU21は、グループ内の最大データ数nを利用者が指定した値に設定し(ステップS116)、ステップS111へ進む。その後、設定されたグループ内の最大データ数nに基づき画面データが生成され、新たな画面が表示される。これにより、各グループに含まれる単語の個数が指定された値以下に制限された分析結果画面が表示される。 If the instruction received in step S113 is "setting the maximum number of data in the group", the CPU 21 proceeds to step S116. In this case, the CPU 21 sets the maximum number of data n in the group to a value specified by the user (step S116), and proceeds to step S111. After that, screen data is generated based on the maximum number of data n in the set group, and a new screen is displayed. As a result, the analysis result screen in which the number of words included in each group is limited to the specified value or less is displayed.

CPU21は、ステップS113で受け取った指示が「分析対象期間の設定」である場合には、ステップS117へ進む。この場合、CPU21は、分析対象期間を利用者が指定した期間に設定し(ステップS117)、ステップS109へ進む。その後、設定された分析対象期間を参照して階層的クラスター分析が行われ、新たな分析結果を表示するための画面データが生成され、新たな画面が表示される。これにより、指定された分析対象期間内のテキストデータに含まれる単語について階層的クラスター分析を行った結果が画面に表示される。 If the instruction received in step S113 is "setting the analysis target period", the CPU 21 proceeds to step S117. In this case, the CPU 21 sets the analysis target period to the period specified by the user (step S117), and proceeds to step S109. After that, hierarchical cluster analysis is performed with reference to the set analysis target period, screen data for displaying new analysis results is generated, and a new screen is displayed. As a result, the result of hierarchical cluster analysis on the words contained in the text data within the specified analysis target period is displayed on the screen.

図11は、分析対象期間を設定する前後の分析結果画面を示す図である。図11(a)に示す設定前の分析結果画面61には、入力されたテキストデータ5のうち、2014年1月1日0時0分から2015年12月31日24時0分までのテキストデータに含まれる単語について階層的クラスター分析を行った結果が表示される。図11(b)に示す設定後の分析結果画面62には、入力されたテキストデータ5のうち、2014年3月1日0時0分から2014年9月30日24時0分までのテキストデータに含まれる単語について階層的クラスター分析を行った結果が表示される。分析結果画面61の表示内容と分析結果画面62の表示内容は異なる。利用者は、分析対象期間を設定する前後の分析結果画面を見ることにより、階層的クラスター分析の結果の時間的な変化を容易に認識することができる。 FIG. 11 is a diagram showing analysis result screens before and after setting the analysis target period. Of the input text data 5, the text data from 0:00 on January 1, 2014 to 24:00 on December 31, 2015 is displayed on the analysis result screen 61 before setting shown in FIG. 11 (a). The results of a hierarchical cluster analysis of the words contained in are displayed. Of the input text data 5, the text data from 0:00 on March 1, 2014 to 24:00 on September 30, 2014 is displayed on the analysis result screen 62 after the setting shown in FIG. 11 (b). The results of a hierarchical cluster analysis of the words contained in are displayed. The display content of the analysis result screen 61 and the display content of the analysis result screen 62 are different. The user can easily recognize the temporal change of the result of the hierarchical cluster analysis by looking at the analysis result screen before and after setting the analysis target period.

CPU21は、ステップS113で受け取った指示が「単語除外」である場合には、ステップS118へ進む。この場合、CPU21は、指定された単語を除外単語リストに追加し(ステップS118)、ステップS109へ進む。その後、指定された単語を除外して階層的クラスター分析が行われ、新たな分析結果を表示するための画面データが生成され、新たな画面が表示される。これにより、指定された単語を除外して階層的クラスター分析を行った結果が画面に表示される。 If the instruction received in step S113 is "word exclusion", the CPU 21 proceeds to step S118. In this case, the CPU 21 adds the specified word to the excluded word list (step S118), and proceeds to step S109. After that, a hierarchical cluster analysis is performed excluding the specified word, screen data for displaying a new analysis result is generated, and a new screen is displayed. As a result, the result of the hierarchical cluster analysis excluding the specified word is displayed on the screen.

図12は、単語除外を行う前後の分析結果画面を示す図である。利用者は、マウス29を操作して、除外すべき単語を選択した後、単語除外を指示する。図12(a)に示す単語除外前の分析結果画面63では、「社会」が選択され、メニューの中から「単語除外」が選択されている。その後、「社会」を除外して階層的クラスター分析を行った結果が画面に表示される。図12(b)に示す単語除外後の分析結果画面64には、「社会」に代えて「進学」が表示されている。「進学」は、「社会」と同じクラスターに含まれる単語の中で、分析結果画面63に表示された5個の単語の次に出現頻度が高いものである。 FIG. 12 is a diagram showing analysis result screens before and after word exclusion. The user operates the mouse 29 to select a word to be excluded, and then instructs the word exclusion. On the analysis result screen 63 before word exclusion shown in FIG. 12A, “society” is selected, and “word exclusion” is selected from the menu. After that, the result of hierarchical cluster analysis excluding "society" is displayed on the screen. On the analysis result screen 64 after excluding words shown in FIG. 12B, "advancement to school" is displayed instead of "society". Among the words included in the same cluster as "society", "advancement" has the highest frequency of appearance next to the five words displayed on the analysis result screen 63.

CPU21は、ステップS113で受け取った指示が「類義語登録」である場合には、ステップS119へ進む。この場合、CPU21は、指示された単語を使用中の類義語リストに追加し(ステップS119)、ステップS109へ進む。その後、指示された類義語を考慮して階層的クラスター分析が行われ、新たな分析結果を表示するための画面データが生成され、新たな画面が表示される。これにより、指示された単語を類義語として階層的クラスター分析を行った結果が画面に表示される。 If the instruction received in step S113 is "synonym registration", the CPU 21 proceeds to step S119. In this case, the CPU 21 adds the instructed word to the list of synonyms in use (step S119), and proceeds to step S109. After that, a hierarchical cluster analysis is performed in consideration of the indicated synonyms, screen data for displaying a new analysis result is generated, and a new screen is displayed. As a result, the result of hierarchical cluster analysis using the indicated word as a synonym is displayed on the screen.

図13は、類義語登録を行う前後の分析結果画面を示す図である。利用者は、マウス29を操作して、類義語として登録すべき複数の単語を選択した後、類義語登録を指示する。図13(a)に示す類義語登録前の分析結果画面65では、「大学生」と「学生」が選択され、メニューの中から「類義語登録」が選択されている。その後、「大学生」と「学生」を類義語として階層的クラスター分析を行った結果が画面に表示される。図13(b)に示す類義語登録後の分析結果画面66では、「大学生」が分析結果画面65よりも大きいサイズで表示され、「学生」に代えて「進学」が表示されている。「大学生」は、「大学生」の出現頻度と「学生」の出現頻度の合計に応じて、分析結果画面65内の「大学生」よりも大きいサイズで表示される。 FIG. 13 is a diagram showing analysis result screens before and after registration of synonyms. The user operates the mouse 29 to select a plurality of words to be registered as synonyms, and then instructs the synonym registration. On the analysis result screen 65 before registration of synonyms shown in FIG. 13A, "university student" and "student" are selected, and "registration of synonyms" is selected from the menu. After that, the result of hierarchical cluster analysis with "university student" and "student" as synonyms is displayed on the screen. On the analysis result screen 66 after registration of synonyms shown in FIG. 13B, "university student" is displayed in a size larger than that of the analysis result screen 65, and "advancement" is displayed instead of "student". The "university student" is displayed in a size larger than that of the "university student" in the analysis result screen 65 according to the total of the appearance frequency of the "university student" and the appearance frequency of the "student".

CPU21は、ステップS113で受け取った指示が「複合語登録」である場合には、ステップS120へ進む。この場合、CPU21は、指示された単語を使用中の複合語リストに追加し(ステップS120)、ステップS109へ進む。その後、指示された複合語を考慮して階層的クラスター分析が行われ、新たな分析結果を表示するための画面データが生成され、新たな画面が表示される。これにより、指定された単語を複合語として階層的クラスター分析を行った結果が画面に表示される。 If the instruction received in step S113 is "compound word registration", the CPU 21 proceeds to step S120. In this case, the CPU 21 adds the instructed word to the compound word list in use (step S120), and proceeds to step S109. After that, a hierarchical cluster analysis is performed in consideration of the instructed compound word, screen data for displaying a new analysis result is generated, and a new screen is displayed. As a result, the result of hierarchical cluster analysis using the specified word as a compound word is displayed on the screen.

図14は、複合語登録を行う前後の分析結果画面を示す図である。利用者は、マウス29を操作して、複合語として登録すべき複数の単語を選択した後、「類義語登録」を指示する。図14(a)に示す複合語登録前の分析結果画面67では、「忍耐」と「強い」が選択され、メニューの中から「複合語登録」が選択されている。その後、「忍耐」と「強い」を複合語として階層的クラスター分析を行った結果が画面に表示される。図14(b)に示す複合語登録後の分析結果画面68では、「忍耐」および「強い」に代えて、「忍耐強い」が「忍耐」および「強い」以下のサイズで表示される。 FIG. 14 is a diagram showing analysis result screens before and after compound word registration. The user operates the mouse 29 to select a plurality of words to be registered as compound words, and then instructs "synonym registration". On the analysis result screen 67 before compound word registration shown in FIG. 14A, “patience” and “strong” are selected, and “compound word registration” is selected from the menu. After that, the result of hierarchical cluster analysis using "patience" and "strong" as compound words is displayed on the screen. On the analysis result screen 68 after the compound word registration shown in FIG. 14B, "patience" is displayed in a size smaller than "patience" and "strong" instead of "patience" and "strong".

以上に示すように、本実施形態に係るテキストマイニング方法は、入力されたテキストデータから抽出した単語に対して階層的クラスター分析を行うテキスト分析ステップと、テキスト分析ステップによる分析結果に基づき、画面データを生成する画面生成ステップと、画面データに基づき、画面を表示する分析結果表示ステップとを備えている。画面生成ステップは、グループ数mとグループ内の最大データ数nとに基づき、分析結果からm個のクラスターを求め、クラスターに含まれる単語をn個以下含むグループを画面に表示するための画面データを生成する。本実施形態に係るテキストマイニング方法によれば、テキストデータに含まれる単語に対して階層的クラスター分析を行った結果に基づき、クラスターに含まれる単語を含むグループが画面に表示される。また、グループに含まれる単語の数は、n個以下に制限される。したがって、利用者は、画面を見たときに、階層的クラスター分析の結果を直感的に理解することができる。 As described above, in the text mining method according to the present embodiment, screen data is based on a text analysis step in which a hierarchical cluster analysis is performed on words extracted from input text data and an analysis result by the text analysis step. It is provided with a screen generation step for generating a screen and an analysis result display step for displaying a screen based on screen data. In the screen generation step, m clusters are obtained from the analysis result based on the number of groups m and the maximum number of data n in the group, and the screen data for displaying the group containing n or less words contained in the cluster on the screen. To generate. According to the text mining method according to the present embodiment, a group including the words included in the cluster is displayed on the screen based on the result of performing a hierarchical cluster analysis on the words included in the text data. Further, the number of words included in the group is limited to n or less. Therefore, the user can intuitively understand the result of the hierarchical cluster analysis when looking at the screen.

また、グループに含まれる単語は、グループに対応するクラスターに含まれる単語の中から出現頻度が高い順に選択される。このため、グループの内部には、クラスターに含まれる単語のうち出現頻度が高い単語が表示される。したがって、利用者は、各クラスターに含まれる出現頻度が高い単語を容易に認識することができる。また、グループは、画面内で、グループに対応するクラスターに含まれる単語の出現頻度の合計に応じたサイズを有する。したがって、利用者は、単語の出現頻度の合計が大きいクラスターを容易に認識することができる。また、グループに含まれる単語は、画面内で、単語の出現頻度に応じたサイズを有する。したがって、利用者は、出現頻度が高い単語を容易に認識することができる。 In addition, the words included in the group are selected from the words included in the cluster corresponding to the group in descending order of frequency of occurrence. Therefore, the words that frequently appear among the words included in the cluster are displayed inside the group. Therefore, the user can easily recognize the frequently occurring words included in each cluster. In addition, the group has a size corresponding to the total frequency of occurrence of words included in the cluster corresponding to the group in the screen. Therefore, the user can easily recognize the cluster in which the total frequency of occurrence of words is large. In addition, the words included in the group have a size corresponding to the frequency of appearance of the words on the screen. Therefore, the user can easily recognize words that frequently appear.

また、テキストマイニング方法は、利用者からの指示を入力するための指示入力ステップを備え、テキスト分析ステップおよび画面生成ステップのいずれかが、指示入力ステップで入力された指示に基づき実行される。したがって、利用者からの指示に応じて、階層的クラスター分析の結果の表示態様を切り替えることができる。特に、指示入力ステップはグループ数mの設定指示を受け取り、画面生成ステップは、指示入力ステップで指定されたグループ数mに基づき、画面データを生成する。これにより、画面に表示される領域の個数(クラスターの個数)を利用者からの指示に応じて切り替えることができる。また、指示入力ステップはグループ内の最大データ数nを受け取り、画面生成ステップは、指示入力ステップで指定されたグループ内の最大データ数nに基づき、画面データを生成する。これにより、領域内に表示される単語の個数を利用者からの指示に応じて切り替えることができる。 Further, the text mining method includes an instruction input step for inputting an instruction from the user, and either the text analysis step or the screen generation step is executed based on the instruction input in the instruction input step. Therefore, the display mode of the result of the hierarchical cluster analysis can be switched according to the instruction from the user. In particular, the instruction input step receives a setting instruction of the number of groups m, and the screen generation step generates screen data based on the number of groups m specified in the instruction input step. As a result, the number of areas displayed on the screen (the number of clusters) can be switched according to the instruction from the user. Further, the instruction input step receives the maximum number of data n in the group, and the screen generation step generates screen data based on the maximum number of data n in the group specified in the instruction input step. As a result, the number of words displayed in the area can be switched according to the instruction from the user.

また、指示入力ステップは分析対象期間の指示を受け取り、テキスト分析ステップは、テキストデータのうち指示入力ステップで指定された分析対象期間内のテキストデータに含まれる単語に対して、階層的クラスター分析を行う。したがって、利用者から指示された分析対象期間内のテキストデータに含まれる単語に対して階層的クラスター分析を行った結果が画面に表示される。よって、利用者は、階層的クラスター分析の結果の時間的変化を容易に認識することができる。また、指示入力ステップは分析目的の設定指示を受け取り、テキスト分析ステップは、テキストデータ5から指示入力ステップで設定された分析目的に応じた種類の単語を抽出して、階層的クラスター分析を行う。これにより、利用者から指示された分析目的に応じて分析対象の単語の種類を切り替えて階層的クラスター分析を行った結果を画面に表示することができる。 In addition, the instruction input step receives the instruction of the analysis target period, and the text analysis step performs hierarchical cluster analysis on the words contained in the text data within the analysis target period specified in the instruction input step among the text data. Do. Therefore, the result of hierarchical cluster analysis on the words included in the text data within the analysis target period instructed by the user is displayed on the screen. Therefore, the user can easily recognize the temporal change of the result of the hierarchical cluster analysis. Further, the instruction input step receives a setting instruction for the analysis purpose, and the text analysis step extracts a type of word according to the analysis purpose set in the instruction input step from the text data 5 and performs a hierarchical cluster analysis. As a result, it is possible to switch the type of the word to be analyzed according to the analysis purpose instructed by the user and display the result of the hierarchical cluster analysis on the screen.

また、指示入力ステップは単語除外指示を受け取り、テキスト分析ステップは、指示入力ステップで指示された単語を除外して、階層的クラスター分析を行う。これにより、利用者から指示された単語を除外して階層的クラスター分析を行った結果を表示することができる。また、指示入力ステップは類義語登録指示を受け取り、テキスト分析ステップは、指示入力ステップで指示された複数の単語を同じ単語とみなして、階層的クラスター分析を行う。これにより、利用者から指示された複数の単語を同じ単語とみなして階層的クラスター分析を行った結果を画面に表示することができる。また、指示入力ステップは複合語登録指示を受け取り、テキスト分析ステップは、指示入力ステップで指定された複数の単語を1個の単語に併合して、階層的クラスター分析を行う。これにより、利用者から指示された複数の単語を1個の単語に併合して階層的クラスター分析を行った結果を画面に表示することができる。 In addition, the instruction input step receives the word exclusion instruction, and the text analysis step excludes the words instructed in the instruction input step to perform a hierarchical cluster analysis. As a result, it is possible to display the result of performing the hierarchical cluster analysis by excluding the words instructed by the user. In addition, the instruction input step receives a synonym registration instruction, and the text analysis step considers a plurality of words instructed in the instruction input step as the same word and performs a hierarchical cluster analysis. As a result, it is possible to display the result of the hierarchical cluster analysis on the screen by regarding a plurality of words instructed by the user as the same word. Further, the instruction input step receives the compound word registration instruction, and the text analysis step merges a plurality of words specified in the instruction input step into one word to perform a hierarchical cluster analysis. As a result, it is possible to display on the screen the result of performing the hierarchical cluster analysis by merging a plurality of words instructed by the user into one word.

また、画面生成ステップは、グループを含む分析結果画面と、分析結果画面の表示態様を設定するための分析設定画面とを表示するための画面データを生成する。したがって、分析結果画面と分析設定画面が表示される。よって、利用者は、分析設定画面を用いて、階層的クラスター分析を行った結果の表示態様を容易に切り替えることができる。 In addition, the screen generation step generates screen data for displaying the analysis result screen including the group and the analysis setting screen for setting the display mode of the analysis result screen. Therefore, the analysis result screen and the analysis setting screen are displayed. Therefore, the user can easily switch the display mode of the result of the hierarchical cluster analysis by using the analysis setting screen.

本実施形態に係るテキストマイニングプログラム31、および、本実施形態に係るテキストマイニング装置10は、本実施形態に係るテキストマイニング処理方法と同様の構成を有し、同様の効果を奏する。 The text mining program 31 according to the present embodiment and the text mining device 10 according to the present embodiment have the same configuration as the text mining processing method according to the present embodiment, and have the same effects.

本実施形態に係るテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置によれば、テキストデータに含まれる単語に対して階層的クラスター分析を行った結果に基づき、クラスターに含まれる単語を最大データ数以下含むグループが画面に表示される。したがって、利用者は、画面を見たときに、階層的クラスター分析の結果を直感的に理解することができる。 According to the text mining method, the text mining program, and the text mining device according to the present embodiment, the maximum data of the words contained in the cluster is obtained based on the result of performing the hierarchical cluster analysis on the words contained in the text data. Groups containing less than a few are displayed on the screen. Therefore, the user can intuitively understand the result of the hierarchical cluster analysis when looking at the screen.

5…テキストデータ
10…テキストマイニング装置
11…指示入力部
12…テキスト分析部
13…画面生成部
14…分析結果表示部
20…コンピュータ
21…CPU
22…メインメモリ
24…入力部
25…表示部
30…記憶媒体
31…テキストマイニングプログラム
40…表示画面
41、61〜68…分析結果画面
42…分析設定画面
51…データ指定画面
52…目的指定画面
53…類義語リスト選択画面
54…複合語リスト選択画面
5 ... Text data 10 ... Text mining device 11 ... Instruction input unit 12 ... Text analysis unit 13 ... Screen generation unit 14 ... Analysis result display unit 20 ... Computer 21 ... CPU
22 ... Main memory 24 ... Input unit 25 ... Display unit 30 ... Storage medium 31 ... Text mining program 40 ... Display screen 41, 61-68 ... Analysis result screen 42 ... Analysis setting screen 51 ... Data specification screen 52 ... Purpose specification screen 53 … Synonym list selection screen 54… Compound word list selection screen

Claims (25)

テキストデータの分析結果を画面に表示するテキストマイニング方法であって、
入力されたテキストデータから抽出した単語に対して階層的クラスター分析を行うテキスト分析ステップと、
前記テキスト分析ステップによる分析結果に基づき、画面データを生成する画面生成ステップと、
前記画面データに基づき、画面を表示する分析結果表示ステップとを備え、
前記画面生成ステップは、グループ数とグループ内の最大データ数とに基づき、前記分析結果から前記グループ数のクラスターを求め、前記クラスターに含まれる単語を前記最大データ数以下含むグループを画面に表示するための画面データを生成し、
前記グループには、名称として、前記グループに対応するクラスターに含まれる単語のうち出現頻度が最も高い単語が付けられていることを特徴とする、テキストマイニング方法。
It is a text mining method that displays the analysis result of text data on the screen.
A text analysis step that performs a hierarchical cluster analysis on words extracted from the input text data,
A screen generation step that generates screen data based on the analysis result of the text analysis step,
An analysis result display step for displaying a screen based on the screen data is provided.
In the screen generation step, based on the number of groups and the maximum number of data in the group, the cluster of the number of groups is obtained from the analysis result, and the group containing the words included in the cluster is displayed on the screen. It generates the screen data for,
The said group, as the name, and wherein the Rukoto frequency among the words included in a cluster corresponding to the group is marked with the highest word, text mining methods.
前記グループに含まれる単語は、前記グループに対応するクラスターに含まれる単語の中から出現頻度が高い順に選択されることを特徴とする、請求項1に記載のテキストマイニング方法。 The text mining method according to claim 1, wherein the words included in the group are selected from the words included in the cluster corresponding to the group in descending order of frequency of appearance. 前記グループは、前記画面内で、前記グループに対応するクラスターに含まれる単語の出現頻度の合計に応じたサイズを有することを特徴とする、請求項2に記載のテキストマイニング方法。 The text mining method according to claim 2, wherein the group has a size corresponding to the total frequency of occurrence of words included in the cluster corresponding to the group in the screen. 前記グループに含まれる単語は、前記画面内で、前記単語の出現頻度に応じたサイズを有することを特徴とする、請求項3に記載のテキストマイニング方法。 The text mining method according to claim 3, wherein the words included in the group have a size corresponding to the frequency of appearance of the words in the screen. 利用者からの指示を入力するための指示入力ステップをさらに備え、
前記テキスト分析ステップおよび前記画面生成ステップのいずれかが、前記指示入力ステップで入力された指示に基づき実行されることを特徴とする、請求項1に記載のテキストマイニング方法。
It also has an instruction input step for inputting instructions from the user.
The text mining method according to claim 1, wherein any of the text analysis step and the screen generation step is executed based on the instruction input in the instruction input step.
前記指示入力ステップは前記グループ数の設定指示を受け取り、
前記画面生成ステップは、前記指示入力ステップで設定されたグループ数に基づき、前記画面データを生成することを特徴とする、請求項5に記載のテキストマイニング方法。
The instruction input step receives the setting instruction of the number of groups and receives the instruction.
The text mining method according to claim 5, wherein the screen generation step generates the screen data based on the number of groups set in the instruction input step.
前記指示入力ステップは前記最大データ数の設定指示を受け取り、
前記画面生成ステップは、前記指示入力ステップで設定された最大データ数に基づき、前記画面データを生成することを特徴とする、請求項5に記載のテキストマイニング方法。
The instruction input step receives the setting instruction of the maximum number of data and receives the instruction.
The text mining method according to claim 5, wherein the screen generation step generates the screen data based on the maximum number of data set in the instruction input step.
前記指示入力ステップは分析対象期間の設定指示を受け取り、
前記テキスト分析ステップは、前記テキストデータのうち前記指示入力ステップで設定された分析対象期間内のテキストデータに含まれる単語に対して、前記階層的クラスター分析を行うことを特徴とする、請求項5に記載のテキストマイニング方法。
The instruction input step receives the setting instruction of the analysis target period and receives the instruction.
5. The text analysis step is characterized in that the hierarchical cluster analysis is performed on the words included in the text data within the analysis target period set in the instruction input step among the text data. The text mining method described in.
前記指示入力ステップは分析目的の設定指示を受け取り、
前記テキスト分析ステップは、前記テキストデータから前記指示入力ステップで設定された分析目的に応じた種類の単語を抽出して、前記階層的クラスター分析を行うことを特徴とする、請求項5に記載のテキストマイニング方法。
The instruction input step receives the setting instruction for analysis purpose and receives the setting instruction.
The text analysis step according to claim 5, wherein the text analysis step extracts words of a type corresponding to the analysis purpose set in the instruction input step from the text data and performs the hierarchical cluster analysis. Text mining method.
前記指示入力ステップは単語除外指示を受け取り、
前記テキスト分析ステップは、前記指示入力ステップで指示された単語を除外して、前記階層的クラスター分析を行うことを特徴とする、請求項5に記載のテキストマイニング方法。
The instruction input step receives the word exclusion instruction and receives the word exclusion instruction.
The text mining method according to claim 5, wherein the text analysis step excludes words instructed in the instruction input step and performs the hierarchical cluster analysis.
前記指示入力ステップは類義語登録指示を受け取り、
前記テキスト分析ステップは、前記指示入力ステップで指示された複数の単語を同じ単語とみなして、前記階層的クラスター分析を行うことを特徴とする、請求項5に記載のテキストマイニング方法。
The instruction input step receives a synonym registration instruction and receives
The text mining method according to claim 5, wherein the text analysis step considers a plurality of words instructed in the instruction input step as the same word and performs the hierarchical cluster analysis.
前記指示入力ステップは複合語登録指示を受け取り、
前記テキスト分析ステップは、前記指示入力ステップで指示された複数の単語を1個の単語に併合して、前記階層的クラスター分析を行うことを特徴とする、請求項5に記載のテキストマイニング方法。
The instruction input step receives the compound word registration instruction and receives the compound word registration instruction.
The text mining method according to claim 5, wherein the text analysis step merges a plurality of words instructed in the instruction input step into one word to perform the hierarchical cluster analysis.
前記画面生成ステップは、前記グループを含む分析結果画面と、前記分析結果画面の表示態様を設定するための分析設定画面とを表示するための画面データを生成することを特徴とする、請求項1に記載のテキストマイニング方法。 The screen generation step is characterized in that screen data for displaying an analysis result screen including the group and an analysis setting screen for setting a display mode of the analysis result screen is generated. The text mining method described in. テキストデータの分析結果を画面に表示するテキストマイニングプログラムであって、
入力されたテキストデータから抽出した単語に対して階層的クラスター分析を行うテキスト分析ステップと、
前記テキスト分析ステップによる分析結果に基づき、画面データを生成する画面生成ステップと、
前記画面データに基づき、画面を表示する分析結果表示ステップとをコンピュータにCPUがメモリを利用して実行させ、
前記画面生成ステップは、グループ数とグループ内の最大データ数とに基づき、前記分析結果から前記グループ数のクラスターを求め、前記クラスターに含まれる単語を前記最大データ数以下含むグループを画面に表示するための画面データを生成し、
前記グループには、名称として、前記グループに対応するクラスターに含まれる単語のうち出現頻度が最も高い単語が付けられていることを特徴とする、テキストマイニングプログラム。
A text mining program that displays the analysis results of text data on the screen.
A text analysis step that performs a hierarchical cluster analysis on words extracted from the input text data,
A screen generation step that generates screen data based on the analysis result of the text analysis step,
Based on the screen data, the CPU causes the computer to execute the analysis result display step of displaying the screen using the memory.
In the screen generation step, a cluster of the number of groups is obtained from the analysis result based on the number of groups and the maximum number of data in the group, and the group containing words included in the cluster is displayed on the screen. It generates the screen data for,
The said group, as the name, and wherein the Rukoto frequency among the words included in a cluster corresponding to the group is marked with the highest word, text mining program.
前記グループに含まれる単語は、前記グループに対応するクラスターに含まれる単語の中から出現頻度が高い順に選択されることを特徴とする、請求項14に記載のテキストマイニングプログラム。 The text mining program according to claim 14, wherein the words included in the group are selected from the words included in the cluster corresponding to the group in descending order of frequency of occurrence. 前記グループは、前記画面内で、前記グループに対応するクラスターに含まれる単語の出現頻度の合計に応じたサイズを有することを特徴とする、請求項15に記載のテキストマイニングプログラム。 The text mining program according to claim 15, wherein the group has a size corresponding to the total frequency of occurrence of words included in the cluster corresponding to the group in the screen. 前記グループに含まれる単語は、前記画面内で、前記単語の出現頻度に応じたサイズを有することを特徴とする、請求項16に記載のテキストマイニングプログラム。 The text mining program according to claim 16, wherein the words included in the group have a size corresponding to the frequency of appearance of the words in the screen. 利用者からの指示を入力するための指示入力ステップを前記コンピュータにさらに実行させ、
前記テキスト分析ステップおよび前記画面生成ステップのいずれかが、前記指示入力ステップで入力された指示に基づき実行されることを特徴とする、請求項14に記載のテキストマイニングプログラム。
The computer is further executed with an instruction input step for inputting an instruction from the user.
The text mining program according to claim 14, wherein any of the text analysis step and the screen generation step is executed based on the instruction input in the instruction input step.
前記画面生成ステップは、前記グループを含む分析結果画面と、前記分析結果画面の表示態様を設定するための分析設定画面とを表示するための画面データを生成することを特徴とする、請求項14に記載のテキストマイニングプログラム。 14. The screen generation step is characterized in that screen data for displaying an analysis result screen including the group and an analysis setting screen for setting a display mode of the analysis result screen is generated. The text mining program described in. テキストデータの分析結果を画面に表示するテキストマイニング装置であって、
入力されたテキストデータから抽出した単語に対して階層的クラスター分析を行うテキスト分析部と、
前記テキスト分析部による分析結果に基づき、画面データを生成する画面生成部と、
前記画面データに基づき、画面を表示する分析結果表示部とを備え、
前記画面生成部は、グループ数とグループ内の最大データ数とに基づき、前記分析結果から前記グループ数のクラスターを求め、前記クラスターに含まれる単語を前記最大データ数以下含むグループを画面に表示するための画面データを生成し、
前記グループには、名称として、前記グループに対応するクラスターに含まれる単語のうち出現頻度が最も高い単語が付けられていることを特徴とする、テキストマイニング装置。
A text mining device that displays the analysis results of text data on the screen.
A text analysis unit that performs hierarchical cluster analysis on words extracted from the input text data,
A screen generation unit that generates screen data based on the analysis results of the text analysis unit,
It is equipped with an analysis result display unit that displays the screen based on the screen data.
The screen generation unit obtains a cluster of the number of groups from the analysis result based on the number of groups and the maximum number of data in the group, and displays a group containing words included in the cluster in the maximum number of data or less on the screen. It generates the screen data for,
The said group, as the name, and wherein the Rukoto frequency among the words included in a cluster corresponding to the group is marked with the highest word, text mining device.
前記グループに含まれる単語は、前記グループに対応するクラスターに含まれる単語の中から出現頻度が高い順に選択されることを特徴とする、請求項20に記載のテキストマイニング装置。 The text mining apparatus according to claim 20, wherein the words included in the group are selected from the words included in the cluster corresponding to the group in descending order of frequency of appearance. 前記グループは、前記画面内で、前記グループに対応するクラスターに含まれる単語の出現頻度の合計に応じたサイズを有することを特徴とする、請求項21に記載のテキストマイニング装置。 The text mining apparatus according to claim 21, wherein the group has a size corresponding to the total frequency of occurrence of words included in the cluster corresponding to the group in the screen. 前記グループに含まれる単語は、前記画面内で、前記単語の出現頻度に応じたサイズを有することを特徴とする、請求項22に記載のテキストマイニング装置。 The text mining apparatus according to claim 22, wherein the words included in the group have a size corresponding to the frequency of appearance of the words in the screen. 利用者からの指示を入力するための指示入力部をさらに備え、
前記テキスト分析部および前記画面生成部のいずれかが、前記指示入力部で入力された指示に基づき動作することを特徴とする、請求項20に記載のテキストマイニング装置。
Further equipped with an instruction input unit for inputting instructions from the user,
The text mining apparatus according to claim 20, wherein either the text analysis unit or the screen generation unit operates based on an instruction input by the instruction input unit.
前記画面生成部は、前記グループを含む分析結果画面と、前記分析結果画面の表示態様を設定するための分析設定画面とを表示するための画面データを生成することを特徴とする、請求項20に記載のテキストマイニング装置。 The screen generation unit is characterized in that it generates screen data for displaying an analysis result screen including the group and an analysis setting screen for setting a display mode of the analysis result screen. The text mining device described in.
JP2016145065A 2016-07-25 2016-07-25 Text mining methods, text mining programs, and text mining equipment Active JP6794162B2 (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2016145065A JP6794162B2 (en) 2016-07-25 2016-07-25 Text mining methods, text mining programs, and text mining equipment
CN201780043375.8A CN109478191B (en) 2016-07-25 2017-06-06 Text mining method, recording medium and text mining device
PCT/JP2017/020922 WO2018020842A1 (en) 2016-07-25 2017-06-06 Text mining method, text mining program, and text mining apparatus
KR1020197000933A KR102180487B1 (en) 2016-07-25 2017-06-06 Text mining method, text mining program, and text mining device
TW106122011A TWI686716B (en) 2016-07-25 2017-06-30 Text exploration method, computer-readable recording medium and text exploration device recorded with text exploration program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016145065A JP6794162B2 (en) 2016-07-25 2016-07-25 Text mining methods, text mining programs, and text mining equipment

Publications (2)

Publication Number Publication Date
JP2018018118A JP2018018118A (en) 2018-02-01
JP6794162B2 true JP6794162B2 (en) 2020-12-02

Family

ID=61015910

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016145065A Active JP6794162B2 (en) 2016-07-25 2016-07-25 Text mining methods, text mining programs, and text mining equipment

Country Status (5)

Country Link
JP (1) JP6794162B2 (en)
KR (1) KR102180487B1 (en)
CN (1) CN109478191B (en)
TW (1) TWI686716B (en)
WO (1) WO2018020842A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7078429B2 (en) * 2018-03-20 2022-05-31 株式会社Screenホールディングス Text mining methods, text mining programs, and text mining equipment
EP3882786A4 (en) 2019-05-17 2022-03-23 Aixs, Inc. Cluster analysis method, cluster analysis system, and cluster analysis program
WO2021171373A1 (en) * 2020-02-25 2021-09-02 日本電気株式会社 Item classification assistance system, method, and program
CN116569160A (en) * 2020-12-16 2023-08-08 富士通株式会社 Information processing program, information processing method, and information processing apparatus

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3577819B2 (en) * 1995-07-14 2004-10-20 富士ゼロックス株式会社 Information search apparatus and information search method
JP4404323B2 (en) * 1999-02-05 2010-01-27 経済産業大臣 Thesaurus browsing system and method
US6611825B1 (en) * 1999-06-09 2003-08-26 The Boeing Company Method and system for text mining using multidimensional subspaces
JP2003044491A (en) * 2001-07-30 2003-02-14 Toshiba Corp Knowledge analysis system, analysis condition setting method, analysis condition storage method, and re-analysis processing method in the system
JP2005107688A (en) * 2003-09-29 2005-04-21 Nippon Telegr & Teleph Corp <Ntt> Information display method and system, and information display program
CN1934570B (en) * 2004-03-18 2012-05-16 日本电气株式会社 Text mining device, and method thereof
KR20090069874A (en) * 2007-12-26 2009-07-01 한국과학기술정보연구원 A method of selecting keywords and similarity coefficients for knowledge map analysis, and a recording medium storing computer programs for the system
JP5022319B2 (en) * 2008-08-04 2012-09-12 日本電信電話株式会社 Text mining apparatus, method, program, and recording medium thereof
JP5439261B2 (en) 2010-04-01 2014-03-12 日本電信電話株式会社 Clustering apparatus, clustering method, and clustering program
JP5545876B2 (en) 2011-01-17 2014-07-09 日本電信電話株式会社 Query providing apparatus, query providing method, and query providing program
US9477704B1 (en) * 2012-12-31 2016-10-25 Teradata Us, Inc. Sentiment expression analysis based on keyword hierarchy
TW201516713A (en) * 2013-10-16 2015-05-01 Chunghwa Telecom Co Ltd File classification method based on group characteristic values
CN104142918B (en) * 2014-07-31 2017-04-05 天津大学 Short text clustering and focus subject distillation method based on TF IDF features
CN104504024B (en) * 2014-12-11 2018-09-07 中国科学院计算技术研究所 Keyword method for digging based on content of microblog and system
CN105550365A (en) * 2016-01-15 2016-05-04 中国科学院自动化研究所 Visualization analysis system based on text topic model

Also Published As

Publication number Publication date
JP2018018118A (en) 2018-02-01
TWI686716B (en) 2020-03-01
KR102180487B1 (en) 2020-11-18
TW201807597A (en) 2018-03-01
CN109478191B (en) 2022-04-08
CN109478191A (en) 2019-03-15
KR20190018480A (en) 2019-02-22
WO2018020842A1 (en) 2018-02-01

Similar Documents

Publication Publication Date Title
JP6794162B2 (en) Text mining methods, text mining programs, and text mining equipment
US20120221553A1 (en) Methods for electronic document searching and graphically representing electronic document searches
EP2793147A2 (en) Computer-implemented system and method for visual search construction, document triage, and coverage tracking
CN106708484B (en) Method and device for establishing page
CN106293694B (en) Ladder program editing device capable of displaying network comments
CN108171267A (en) User group partitioning method and device, information push method and device
JP7281024B1 (en) Job applicant search system, information processing method and program
US20150205860A1 (en) Information retrieval device, information retrieval method, and information retrieval program
CN104571811B (en) Information processing method and electronic equipment
JP5268508B2 (en) Information processing apparatus and search method
JP6667452B2 (en) Method and apparatus for inputting text information
CN107577388B (en) Input interface control method and device
JP2005128872A (en) Document retrieving system and document retrieving program
JP5574775B2 (en) Idea organization support device and idea organization support program
JP5127553B2 (en) Information processing apparatus, information processing method, program, and recording medium
JP2009129185A (en) Document management apparatus, document management method and program
JP6987003B2 (en) Text mining methods, text mining programs, and text mining equipment
JP5302529B2 (en) Information processing apparatus, information processing method, program, and recording medium
JP2017208047A (en) Information search method, information search apparatus, and program
JP2004185343A (en) File browsing apparatus, file browsing method, file browsing program, and storage medium
CN110764669A (en) Method for realizing sidebar based on OpenStack Horizon type accordion style
Nizamee et al. Visualizing the web search results with web search visualization using scatter plot
Marcy User Study Summary 2023
JP2024139028A (en) Information processing device, information processing system, and program
JP2014021916A (en) Information display program and information display device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201111

R150 Certificate of patent or registration of utility model

Ref document number: 6794162

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250