[go: up one dir, main page]

JPH1115897A - 対話型データ分析支援装置及び対話型データ分析支援プログラムを記録した媒体 - Google Patents

対話型データ分析支援装置及び対話型データ分析支援プログラムを記録した媒体

Info

Publication number
JPH1115897A
JPH1115897A JP16369297A JP16369297A JPH1115897A JP H1115897 A JPH1115897 A JP H1115897A JP 16369297 A JP16369297 A JP 16369297A JP 16369297 A JP16369297 A JP 16369297A JP H1115897 A JPH1115897 A JP H1115897A
Authority
JP
Japan
Prior art keywords
data
graph
cross
function
data analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP16369297A
Other languages
English (en)
Inventor
Masaki Iwamoto
昌己 岩本
Masato Honda
正人 本多
Toshihiko Fushimi
俊彦 伏見
Teruyuki Suzuki
輝幸 鈴木
Masao Inoue
征男 井上
Koichi Tsuzuki
康一 都築
Hiromi Kato
博己 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP16369297A priority Critical patent/JPH1115897A/ja
Priority to US09/014,422 priority patent/US7082568B2/en
Publication of JPH1115897A publication Critical patent/JPH1115897A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Digital Computer Display Output (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 エンドユーザがデータの分析を効率的かつ容
易に行えるようにする。 【解決手段】 情報モデルがデータと独立したメタデー
タとして定義された方式で動作するOLAP21aをベ
ースとして、集計されたデータの意味と原因探索の方向
付けを、平行座標をベースにしたビジュアライザ22a
によって行えるようにする。即ち、OLAP21aとビ
ジュアライザ22aとが連係動作するようにし、分析者
たるユーザが、OLAP21a或いはビジュアライザ2
2bの一方を操作すると、この操作が他方に反映される
ようにすることで、直感的にデータの分析作業が行える
ようにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、プログラムされた
コンピュータによってデータの分析を支援する技術に関
する。
【0002】
【従来の技術】近年、データウェアハウスに格納された
大量のデータを、より戦略的に活用しようというブーム
がある。このため、エンドユーザ向けツールとして、O
LAP(オンライン分析処理)が認知され始めている。
現状のOLAPは、クロス集計表を基本構成とし、ユー
ザ自身が、集計表の形でデータを整理しながらヒューリ
スティックに問題点を見つけ、問題点の原因を突き止め
ようとするものである。具体的には、OLAPは、明確
に定義された種々の切り口を自在に用い、各切り口毎に
集計という手段で要約を行い、データを整理していくも
のである。
【0003】ここで、切り口を自在に用いる手段とし
て、ドリリング、スライシング及びダイシング等が用い
られる。ドリリング、スライシング及びダイシング等に
よりデータを整理或いは分析する場合には、分析者は、
問題点を認識した上で、クロス集計表のセルの値を理解
し、問題点の原因となるものを洞察して、これを検証す
るための切り口で再度整理し直すというプロセスを繰り
返す。
【0004】
【発明が解決しようとする課題】しかしながら、クロス
集計表のセルの値を理解し、問題点の原因となるものを
洞察するというプロセスは、分析者の経験やスキルに大
きく影響される。また、データの捉えかたや切り口の定
義方法などは、分析者毎に異なる。さらに、分析者があ
る発想を行った場合には、新しいデータを用意しなけれ
ばならず、データの分析を煩雑にする原因ともなってい
る。
【0005】このため、これらの問題を解決する手段と
して、本願出願人は、切り口を示すデータモデルをメタ
データとして外付けで管理する方式、及び、個人毎に異
なる情報の切り口を柔軟に定義する“管理ポイント”と
いう概念を適用する方式を提案した(特開平8−180
072号公報参照)。しかし、このような工夫をしても
解決できない問題点が依然としてある。
【0006】即ち、集計という手段で要約する場合に
は、問題点を覆い隠してしまう傾向があり、問題点の発
見すらできず、OLAPの利点を活かしきれない。ま
た、クロス集計を単純化するしくみは、切り口を単純に
増やし、問題点の原因を突き止めるための切り口の探索
が極めて困難になってしまう。さらに、近年の市場やビ
ジネスは常に変動するため、この変動に対応して切り口
も変化させる必要がある。このため、データの分析には
より深い洞察が要求され、事前に用意された切り口によ
る検証的なアプローチだけでは、かかる変動に対応する
ことができない。
【0007】そこで、このような問題点を発見的アプロ
ーチで解決しようとするデータマイニングが開発され
た。データマイニングは、データウェアハウスに格納さ
れた大量のデータを有効に活用する技術であり、有益な
データの自動抽出を行うものである。しかし、データマ
イニングは、データウェアハウスに格納されたデータを
有効に活用する反面、次のような問題点がある。
【0008】即ち、データマイニングの処理内容がブラ
ックボックスであり、ユーザはどのような処理が行われ
ているか全く不明である。また、データマイニングを使
用するためには、数学的及びビジネス的な高度のスキル
が要求され、エンドユーザが容易に使用できるものでは
ない。さらに、問題点の原因らしきものが探索できたと
しても、その検証が難しい。
【0009】そこで、本発明は以上のような従来の問題
点に鑑み、データウェアハウスに格納された大量のデー
タを、簡単な操作で自由に扱いうるGUI(Graphic Us
er Interface)を提供することで、エンドユーザがデー
タの分析を効率的かつ容易に行えるようにすることを目
的とする。
【0010】
【課題を解決するための手段】このため、請求項1記載
の発明は、データの分析を支援する対話型データ分析支
援装置を、指定された集計条件に従って、分析対象のデ
ータをクロス集計したクロス集計表を表示するクロス集
計表表示手段と、前記クロス集計表を構成する複数のセ
ルから少なくとも1つのセルを指定するセル指定手段
と、前記セル指定手段により指定されたセルの範囲内
で、分析対象のデータをグラフとして表示するグラフ表
示手段と、を含んで構成した。
【0011】ここで、「クロス集計」とは、少なくとも
1行及び1列からなる2次元配列において、特定行或い
は特定列に対して合計,標準偏差等の数学的,統計的な
処理を行うことをいう。また、「セル」とは、クロス集
計表の特定行及び特定列によって定義される最小単位の
構成要素をいう。かかる構成によれば、分析対象のデー
タをクロス集計したクロス集計表を構成する複数のセル
から少なくとも1つのセルを指定した後、指定したセル
の範囲内で、必要に応じて分析対象のデータがグラフと
して表示される。従って、問題点の発生原因の探索を進
めようとする条件を満たすデータだけがグラフとして表
示されるので、分析者は、データの分析を視覚的に行う
ことが可能となる。
【0012】請求項2記載の発明は、前記グラフ表示手
段は、表示されるデータの範囲を限定する表示限定手段
を備えた構成とした。かかる構成によれば、表示限定手
段によって、表示されるデータの範囲が限定されるの
で、問題点の原因であると思える範囲内のデータのみを
表示することができ、問題点の原因の探索においてその
範囲を徐々に限定していくことで、最終的な原因を容易
に見出すことが可能となる。
【0013】請求項3記載の発明は、前記グラフ表示手
段は、所定の条件に従って、表示されるデータを自動的
に並べ替える並べ替え手段を備えた構成とした。かかる
構成によれば、並べ替え手段によって、グラフに表示さ
れるデータが色々な順序で並べ替えられるので、データ
の表示順序により問題点の原因が明確になる場合があ
る。
【0014】請求項4記載の発明は、前記グラフ表示手
段は、前記分析対象のデータの特徴を抽出して新たな表
示項目を見出す自動分析手段と、見出された新たな表示
項目をグラフに追加する表示項目追加手段と、を含んで
構成した。かかる構成によれば、自動分析手段によって
見出された表示項目を、表示項目追加手段によってグラ
フに追加することで、問題点の原因が明確になる場合が
ある。
【0015】請求項5記載の発明は、前記グラフ表示手
段は、該グラフ表示手段上で行われた操作の結果を、前
記クロス集計表表示手段で使用される集計条件として保
存する保存手段を備え、前記クロス集計表表示手段は、
保存された集計条件に従って、分析対象のデータをクロ
ス集計したクロス集計表を表示可能な構成とした。かか
る構成によれば、保存手段によって、グラフ表示手段上
で行われた操作の結果が集計条件として保存され、この
集計条件を利用して分析対象のデータをクロス集計した
クロス集計表が表示可能となる。従って、問題点の原因
探索において行った操作が、次回の原因探索でも利用す
ることができるようになり、分析処理効率を飛躍的に向
上することが可能となる。
【0016】請求項6記載の発明は、前記分析対象のデ
ータは、複数のデータ項目から構成されるレコードの集
合である構成とした。かかる構成によれば、分析対象の
データは、同一のデータ項目から構成されるレコードの
集合として取り扱うことができるので、関連性のあるレ
コードを簡単な操作で一括して取り扱うことが可能とな
る。
【0017】請求項7記載の発明は、前記グラフ表示手
段は、前記分析対象のデータの中から所定数のレコード
をランダムに抽出するランダム抽出手段を備え、抽出さ
れたレコードに基づいてグラフを表示する構成とした。
かかる構成によれば、ランダム抽出手段によって所定数
のレコードのみがランダムに抽出され、抽出されたレコ
ードに基づいてグラフが表示されるので、グラフの表示
のために使用されるレコード数が減少する。従って、デ
ータベース等からレコードを読み取る時間が短縮し、グ
ラフ表示手段において高速に表示を行うことが可能とな
る。
【0018】請求項8記載の発明は、前記グラフ表示手
段は、前記データ項目を軸としてグラフを表示する構成
とした。かかる構成によれば、データ項目の値が軸上に
表わされるので、その値の大小を直感的に把握すること
ができ、データの傾向の把握を容易に行うことが可能と
なる。
【0019】請求項9記載の発明は、前記グラフ表示手
段は、前記レコードを構成するデータ項目と同数の軸か
らなり、前記レコードの各々について、各データ項目の
値に対応する点をプロットし、隣接する軸にプロットし
た点を線分で結んだグラフを表示する構成とした。かか
る構成によれば、各レコードのデータ項目間の相関関
係、及び、レコード間の相関関係が視覚的に表示される
ので、問題点の原因の探索を容易に行うことが可能とな
る。
【0020】請求項10記載の発明は、データの分析を
支援する対話型データ分析支援プログラムを記録した媒
体を、指定された集計条件に従って、分析対象のデータ
をクロス集計したクロス集計表を表示するクロス集計表
表示機能と、前記クロス集計表を構成する複数のセルか
ら少なくとも1つのセルを指定するセル指定機能と、前
記セル指定機能により指定されたセルの範囲内で、分析
対象のデータをグラフとして表示するグラフ表示機能
と、を含んで構成した。
【0021】ここで、「媒体」とは、各種情報を確実に
記録でき、かつ、必要に応じて確実に取り出すことが可
能なものをいい、具体的には、紙カード(パンチカー
ド),紙テープ,磁気テープ,磁気ディスク、磁気ドラ
ム,ICカード,CD−ROM等が該当する。かかる構
成によれば、請求項1記載の発明と同様な作用に加え
て、分析対象のデータをクロス集計したクロス集計表を
表示するクロス集計表表示機能、クロス集計表を構成す
る複数のセルから少なくとも1つのセルを指定するセル
指定機能、及び、指定されたセルの範囲内で分析対象の
データをグラフとして表示するグラフ表示機能を実現す
るためのプログラムを媒体に記録したので、これらのプ
ログラムを記録した媒体があれば、多数の計算機に対し
て前記各機能を持たせることが可能となる。
【0022】請求項11記載の発明は、前記グラフ表示
機能は、表示されるデータの範囲を限定する表示限定機
能を備えるようにした。かかる構成によれば、表示限定
機能によって、表示されるデータの範囲が限定されるの
で、問題点の原因であると思える範囲内のデータのみを
表示することができ、問題点の原因の探索においてその
範囲を徐々に限定していくことで、最終的な原因を容易
に見出すことが可能となる。
【0023】請求項12記載の発明は、前記グラフ表示
機能は、所定の条件に従って、表示されるデータを自動
的に並べ替える並べ替え機能を備えるようにした。かか
る構成によれば、並べ替え機能によって、グラフに表示
されるデータが色々な順序で並べ替えられるので、デー
タの表示順序により問題点の原因が明確になる場合があ
る。
【0024】請求項13記載の発明は、前記グラフ表示
機能は、前記分析対象のデータの特徴を抽出して新たな
表示項目を見出す自動分析機能と、見出された新たな表
示項目をグラフに追加する表示項目追加機能と、を含ん
で構成した。かかる構成によれば、自動分析機能によっ
て見出された表示項目を、表示項目追加機能によってグ
ラフに追加することで、問題点の原因が明確になる場合
がある。
【0025】請求項14記載の発明は、前記グラフ表示
機能は、前記グラフ上で行われた操作の結果を、前記ク
ロス集計表表示機能で使用される集計条件として保存す
る保存機能を備え、前記クロス集計表表示機能は、保存
された集計条件に従って、分析対象のデータをクロス集
計したクロス集計表を表示可能である構成とした。かか
る構成によれば、保存機能によって、グラフ表示手段上
で行われた操作の結果が集計条件として保存され、この
集計条件を利用して分析対象のデータをクロス集計した
クロス集計表が表示可能となる。従って、問題点の原因
探索において行った操作が、次回の原因探索でも利用す
ることができるようになり、分析処理効率を飛躍的に向
上することが可能となる。
【0026】請求項15記載の発明は、前記分析対象の
データは、複数のデータ項目から構成されるレコードの
集合とした。かかる構成によれば、分析対象のデータ
は、同一のデータ項目から構成されるレコードの集合と
して取り扱うことができるので、関連性のあるレコード
を簡単な操作で一括して取り扱うことが可能となる。
【0027】請求項16記載の発明は、前記グラフ表示
機能は、前記分析対象のデータの中から所定数のレコー
ドをランダムに抽出するランダム抽出機能を備え、抽出
されたレコードに基づいてグラフを表示するようにし
た。かかる構成によれば、ランダム抽出機能によって、
所定数のレコードのみがランダムに抽出され、抽出され
たレコードに基づいてグラフが表示されるので、グラフ
の表示のために使用されるレコード数が減少する。従っ
て、グラフを表示する際に、データベース等からレコー
ドを読み取る時間が短縮し、グラフ表示機能において高
速に表示を行うことが可能となる。
【0028】請求項17記載の発明は、前記グラフ表示
機能は、前記データ項目を軸としてグラフを表示するよ
うにした。かかる構成によれば、データ項目の値が軸上
に表わされるので、その値の大小を直感的に把握するこ
とができ、データの傾向の把握を容易に行うことが可能
となる。
【0029】請求項18記載の発明は、前記グラフ表示
機能は、前記レコードを構成するデータ項目と同数の軸
からなり、前記レコードの各々について、各データ項目
の値に対応する点をプロットし、隣接する軸にプロット
した点を線分で結んだグラフを表示するようにした。か
かる構成によれば、各レコードのデータ項目間の相関関
係、及び、レコード間の相関関係が視覚的に表示される
ので、問題点の原因の探索を容易に行うことが可能とな
る。
【0030】
【発明の実施の形態】以下、添付された図面を参照して
本発明を詳述する。先ず、本発明の概要を説明すると、
情報モデルがデータと独立したメタデータとして定義さ
れた方式で動作するOLAP等のクロス集計表作成機能
をベースとして、集計されたデータの意味と原因探索の
方向付けを、平行座標をベースにしたビジュアライザ
(詳細は後述する)等のグラフ表示機能によって行える
ようにする。即ち、クロス集計表作成機能とグラフ表示
機能とが連係動作するようにし、分析者たるユーザが、
クロス集計表作成機能或いはグラフ表示機能の一方を操
作すると、この操作が他方に反映されるようにすること
で、直感的にデータの分析作業が行えるようにする。な
お、以下で説明する実施形態では、データウェアハウス
に格納された大量のデータを有効に活用するため、デー
タマイニング手法を利用している。
【0031】図1及び図2は、本発明に係る対話型デー
タ分析支援装置を、汎用的な計算機システムの上で実現
した一実施形態のシステム構成を示す。ここで、汎用的
な計算機システムとしては、パーソナルコンピュータや
ワークステーション等の計算機が該当する。即ち、計算
機システム10は、図2に示すように、命令の解釈と実
行とを制御する中央処理装置(以下「CPU」という)
11と、CPU11で処理された処理結果データやプロ
グラム等を記憶している主記憶装置12と、計算機シス
テム10の外部からデータを取り込み、主記憶装置12
にデータを送り込むキーボード等の入力装置13と、主
記憶装置12に記憶されている処理結果データを、計算
機システム10外に取り出すCRT等の出力装置14
と、プログラムやデータを長期間に亘って保存する磁気
ディスク等の補助記憶装置15と、主記憶装置12と周
辺機器(入力装置13、出力装置14及び補助記憶装置
15)との間でデータの授受を行う入出力チャネル16
と、を含んで構成される。
【0032】そして、CD−ROM等の可搬型の記憶媒
体に格納された対話型データ分析支援プログラムを、例
えば、CD−ROMドライブから補助記憶装置15とし
ての磁気ディスクにインストールした上で、対話型デー
タ分析支援プログラムが実行される。図1は、データウ
ェアハウスをサーバに、OLAPをクライアントにした
クライアント/サーバ分散方式のシステム構成を示す。
即ち、サーバは、ディスク上のデータを管理し、クライ
アントからの処理要求を処理する。このようにすれば、
異なるアーキテクチャ上でクライアントが生成したデー
タウェアハウスにもアクセスが可能となる。
【0033】クライアント20は、OLAPクライアン
ト部21と、ビジュアライザ部22と、データマイニン
グ部23と、概観情報要約部24と、を含んで構成され
る。OLAPクライアント部21は、図3に示すよう
に、ユーザが設定した管理ポイントとしての表側項目及
び表頭項目からなるクロス集計表を作成するOLAP2
1aから構成される。OLAP21aは、所定の表側項
目及び表頭項目に対応するセルに数値を入力して、その
集計を行うものである。なお、管理ポイントとしては、
表側項目及び表頭項目だけではなく、他の項目も設定で
きるようになっている。
【0034】ここで、OLAP21aにおいてデータを
整理していく際に、「切り口の定義」, 「軸の定義」及
び「切り口の階層定義」という手法が利用される。即
ち、「切り口の定義」とは、文字データやカテゴリデー
タを任意のくくりでグループ化したり、或いは、数値デ
ータを任意の範囲で括ることをいう。例えば、東京都,
神奈川県,千葉県等を“関東地区”という切り口にする
ことが該当する。「軸の定義」とは、所定のデータ項目
で任意の切り口の定義を行った結果、意味的に新しい軸
を定義することをいう。例えば、“年齢”という軸を、
10歳毎に区切って“世代”という新しい軸を定義する
ことが該当する。「切り口の階層定義」とは、所定の切
り口で定義した切り口を基に、さらに新しい切り口を定
義して上位概念とすることをいう。例えば、渋谷,新
宿,東京を“東京”とすると共に、横浜,川崎を“神奈
川”という切り口で定義した上で、“東京”,“神奈
川”を“関東地区”という切り口で定義することが該当
する。そして、OLAP21aでは、かかる切り口を自
在に用い、各切り口毎に集計という手段で要約を行い、
データを整理して問題点の原因を突き止めていく。
【0035】ビジュアライザ部22は、図4に示すよう
に、OLAPクライアント部21で作成されたクロス集
計表のデータを、平行座標からなるグラフ上にプロット
して、レコード毎の線分を重ねて表示する機能を有して
いる。具体的には、平行座標からなるグラフを表示する
と共に、ユーザに対してフィルタリング(詳細は後述す
る)等の操作を行わせるビジュアライザ22aと、ビジ
ュアライザ22aで使用するデータを保持するビジュア
ライザ用データバッファ22bと、を含んで構成され
る。また、ビジュアライザ用データバッファ22bは、
OLAPクライアント部21で定義された管理ポイント
の個数に応じて、少なくとも1つの2次元配列から構成
される。
【0036】ビジュアライザ22aは、平行座標からな
るグラフを表示する際に、ユーザがマクロな傾向や特
徴、及び、問題点の原因が類推できるように、少なくと
も、以下の情報を表示する機能を有している。 (1) クロス集計表の管理ポイントとしての表側項目及び
表頭項目 (2) 他の管理ポイント (3) ランダムサンプリングされた全項目の詳細値 (4) 全管理ポイントの組み合わせにおける、件数或いは
合計等の概集計値 (5) 異常データ(特異なデータを含む) ここで、全管理ポイントの組み合わせにおける集計値を
含む理由としては、例えば、クロス集計表のあるセルの
値が大きくなっている原因を調べる場合、クロス集計表
上の集計値が異常値となっている原因として、次の原因
が考えられる。即ち、異常な値の詳細データが混入して
いて、その値に起因してあるセルの値が大きくなってい
るか、或いは、対象データ件数が大きいため集計値が大
きくなっている。このような状態をユーザが容易に認識
できるように、異常詳細データと対象データ件数等の統
計量を同時に表示している。
【0037】この場合、統計量は概略の統計量でよい。
即ち、後述するデータウェアハウス32に格納される大
量のデータの全レコードにアクセスする必要はなく、ラ
ンダムサンプリングされたビジュアライザ用データバッ
ファ22bに含まれるデータの統計量で足りる。なぜな
らば、ユーザは、表示されるデータの相対的な傾向或い
は特徴を把握できれば、データ分析を充分遂行できるか
らである。また、どういう条件のデータを異常値として
扱うかも、ランダムサンプリングされたデータに基づい
て判断し、判断された条件の元でデータウェアハウス3
2から抽出するようにする。
【0038】ビジュアライザ22a上では、表示限定手
段又は機能として、マウス等のポインティングデバイス
によるドラッグ操作によって、各軸毎にフィルタリング
をすることができる。即ち、軸の上端部或いは下端部を
クリックして、表示したいと所望する範囲までドラッグ
すると、指定した範囲内に含まれるデータを表わす線分
のみが、色や輝度等により強調表示される。従って、ユ
ーザは強調表示された線分を検討することで、問題点の
原因探索が直感的に行えることとなる。
【0039】また、ビジュアライザ22aには以下の機
能が要求される。 (1) クロス集計表自体を条件選択ビュー、即ち、クロス
集計表の複数セルから少なくとも1つのセルを指定して
(セル指定手段又は機能)、選択された条件下で詳細デ
ータをビジュアルに表示できること。 (2) 高速に表示及びフィルタリング操作が行えること。
【0040】(3) 情報全体の傾向(トレンド)と異常値
とを容易に把握できること。 (4) 傾向を把握する際に、意味のない情報は自動的に非
表示となり、ノイズのない情報が提示されること。ま
た、階層的に関連性を持った情報は、ドリリング操作に
より階層的に詳細化できること。 ここで、重要度の低いデータを非表示にする機構につい
て説明すると、管理ポイントの中で階層的に定義されて
いる項目については、第l階層のみを初期表示し、ユー
ザからの指示によって、下位の階層を順次表示する。上
位階層で範囲が限定されている場合には、下位の階層で
は、選択された上位階層の範囲内のデータだけを表示す
る(ドリリング)。また、データ項目間の相関をとり、
非常に高い相関を持つものを非表示にする。或いは、主
成分を新しい軸として表示し、下位階層に元の項目を展
開する。さらに、名義尺度のデータについては、各デー
タの出現頻度やエントロビー(情報量)によって、価値
を判断する。
【0041】(5) 線分の類似性から自動的に新たな分類
ができること(自動分析手段又は機能)。そして、分類
した結果として新しい分類軸が追加され(表示項目追加
手段又は機能)、簡単なフィルタリング操作により各分
類の選択表示ができること。即ち、データマイニング手
法を活用することによって、分析対象のデータの特徴を
自動抽出した後、新たな管理ポイントである分類軸を見
出し、これをビジュアライザ22a上に追加できるこ
と。
【0042】(6) 特定のグループに関連性の強い各軸の
項目を、所定の条件に従って、自動的に近くに再配置し
て表示ができること(並べ替え手段又は機能)。 (7) ビジュアライザ22a上で整理した情報を、メタデ
ータとして即座に格納できること(保存手段又は機
能)。そして、その情報は、OLAP21aにより切り
口として利用できること。
【0043】(8) ビジュアライザ22a上でフィルタリ
ングした結果をOLAP21aに通知して、ビジュアラ
イザ22a上の検証だけではなく、OLAP21aと連
動した精度の高い検証作業ができること。 データマイニング部23は、ビジュアライザ用データバ
ッファ22bから有益なデータのみを自動抽出する機能
を有している。具体的には、データマイニング処理の各
種制御を行うマイニング制御部23aと、実際にデータ
マイニング処理を行うマイニングエンジン23bと、デ
ータマイニング処理を行うときに使用するデータを一時
的に保持するマイニング用データバッファ23cと、マ
イニング用データバッファ23cとビジュアライザ用デ
ータバッファ22b等との間のデータ変換を行うデータ
変換部23dと、を含んで構成される。
【0044】概観情報要約部24は、主に、ビジュアラ
イザ部22でグラフを表示する際に、サーバ30側のデ
ータウェアハウス32からデータをランダムサンプリン
グすることで、検索件数の減少による処理速度の向上を
図るものである。即ち、ランダム抽出手段又は機能とし
て作用する。このようにランダムサンプリングした結果
は、統計的にマクロな傾向や特徴を保持しているため、
ユーザは、ビジュアライザ部22で表示されたデータ
を、ユーザが認識している全情報を表わしていると考え
ても何ら問題がない。
【0045】また、概観情報要約部24は、ランダムサ
ンプリングされたデータを、全ての管理ポイント毎に集
計する機能を有している。さらに、概観情報要約部24
は、ランダムサンプリングされたデータから、各軸毎に
ヒンジとフェンスの値を計算して外挿値境界の条件を算
出する機能を有している。そして、外挿値境界の条件を
後述する概観情報収集部34に通知して、異常詳細デー
タのみを抽出することもできる。
【0046】一方、サーバ30は、OLAPサーバ部3
1と、データウェアハウス32と、データマイニング部
33と、概観情報収集部34と、を含んで構成される。
OLAPサーバ部31は、クライアント20側のOLA
Pクライアント部21からの処理要求に対応する機能を
有している。具体的には、各種処理の制御を行うサーバ
ソフト31aと、データの構成,内容,キー及びインデ
ックス等を定義したメタデータが格納されるメタデータ
ファイル31bと、データウェアハウス32からデータ
を抽出する際に作業用データベースとなる集計結果ファ
イル31cと、メタデータファイル31bに格納された
メタデータを加味しながら集計処理を行う集計エンジン
31dと、を含んで構成される。
【0047】データウェアハウス32は、意思決定支援
システム機能をサポートするために設計されたもので、
統合化されたサブジェクト(主題)を指向したデータベ
ースの集合である。そして、データベースには、複数の
データ項目から構成されるレコードが複数集められ、1
つの分析対象データが構成されている。データマイニン
グ部33は、データウェアハウス32から有益なデータ
のみを自動抽出する機能を有している。具体的には、デ
ータマイニング処理の制御を行うマイニング制御部33
aと、実際にデータマイニング処理を行うマイニングエ
ンジン33bと、データマイニング処理を行うときに使
用するデータを一時的に保持するマイニング用データバ
ッファ33cと、マイニング用データバッファ33cと
データウェアハウス32等との間のデータ変換を行うデ
ータ変換部33dと、を含んで構成される。
【0048】概観情報収集部34は、データウェアハウ
ス32からデータをランダムサンプリングして、クライ
アント20側の概観情報要約部24に引き渡す機能を有
している。なお、OLAPクライアント部21及びOL
APサーバ部31を含んでクロス集計表表示手段又は機
能が実現され、また、クライアント20側のビジュアラ
イザ部22,データマイニング部23,概観情報要約部
24、及び、サーバ30側のデータマイニング部33,
概観情報収集部34を含んでグラフ表示手段又は機能が
実現される。
【0049】次に、対話型データ分析支援装置の処理内
容について、図5〜図14の処理流れ図及びフローチャ
ートを参照しつつ説明する。図5〜図7は、OLAP2
1a上にクロス集計の集計結果を表示するまでの処理流
れ、及び、処理内容を説明するフローチャートを示して
いる。即ち、OLAP21aを操作中のユーザが、切り
口を指定してクロス集計表の作成指示を行ったときの処
理内容を示すものである。
【0050】図6は、OLAP21a上に集計結果を表
示するまでのクライアント20側における処理内容の詳
細を示したフローチャートである。このルーチンは、ユ
ーザがクロス集計表作成指示を行ったときに実行され
る。ステップ1(図では「S1」と略記する。以下同
様)では、OLAPクライアント部21が、サーバ30
側のサーバソフト31aにクロス集計表作成指示を送付
する(処理A)。
【0051】ステップ2では、サーバ30側のOLAP
サーバ部31から集計結果が返送されたか否かが判断さ
れ、集計結果が返送されるまで待機する。ステップ3で
は、返送された集計結果がOLAP21a上に表示され
る。図7は、OLAP21a上に集計結果を表示するま
でのサーバ30側における処理内容の詳細を示したフロ
ーチャートである。このルーチンは、クライアント20
側からクロス集計表作成指示を受け取ったときに実行さ
れる。
【0052】ステップ10では、クロス集計表作成指示
を受け取ったサーバソフト31aが、集計エンジン31
dを起動する(処理B)。ステップ11では、集計エン
ジン31dが、データウェアハウス32から対象となる
データを読み込む(処理C)。ステップ12では、集計
エンジン31dが、メタデータファイル31bからメタ
データを読み込み、メタデータを加味しながら集計処理
を行う(処理D)。
【0053】ステップ13では、集計エンジン31d
が、メタデータを加味した集計結果を作業用の集計結果
ファイル31cに格納する(処理E)。ステップ14で
は、集計結果ファイル31cに格納された集計結果が、
クライアント20側のOLAPクライアント部21に返
送される(処理F)。図8及び図9は、OLAP21a
のクロス集計表上に集計結果が表示されている状態にお
いて、ユーザが指定した範囲内のクロス集計表のデータ
をグラフ表示するまでの処理流れ、及び、処理内容を説
明するフローチャートを示している。即ち、ユーザがク
ロス集計表の一部のセルの結果の意味付けを知るため
に、その部分をマウス等のポインティングデバイスで指
定して、グラフ表示を指定したときに実行されるもので
ある。
【0054】ステップ20では、検索情報として、クロ
ス集計表を作成するために使用したデータベース名,管
理ポイント及び検索条件が、OLAPクライアント部2
1から概観情報要約部24に送付される(処理A)。ス
テップ21では、概観情報要約部24が、送付された検
索情報に基づいて、サーバ30側の概観情報収集部34
を介して、データウェアハウス32から詳細情報,要約
情報及び異常詳細情報をランダムサンプリングして取得
する(処理B)。このとき、ランダムサンプリングを行
う個数を、ユーザが設定できるようにしてもよい。
【0055】ステップ22では、概観情報要約部24
が、メタデータファイル31bに格納されているメタデ
ータを取得して付加情報を作成し、取得した詳細情報,
要約情報及び異常詳細情報に付加情報を付加する(処理
C)。ステップ23では、概観情報要約部24が、付加
情報が付加された詳細情報,要約情報及び異常詳細情報
に基づき、ビジュアライザ用データバッファ22bを作
成する(処理D)。
【0056】ステップ24では、ビジュアライザ22a
を起動し、ビジュアライザ用データバッファ22bに展
開されているデータを、平行座標からなるグラフにレコ
ード毎の線分として表示する(処理E)。図10〜図1
4は、ユーザが、ビジュアライザ22a上で表示内容を
更新する処理、例えば、データの自動分類や軸項目の並
べ換えの指示を行った場合に、実行される処理流れ、及
び、処理内容を説明するフローチャートを示している。
表示内容を更新する処理は、対象データ量が所定量より
少ない場合にはクライアント20側で行われ、対象デー
タ量が所定量以上の場合にはサーバ30側で行われる。
【0057】図10及び図11は、クライアント20側
でビジュアライザ22aの表示内容の更新処理が行われ
るときの処理内容を示す。ステップ30では、表示内容
を更新する指示内容が、データマイニング部23のマイ
ニング制御部23aに送付される(処理A)。ステップ
31では、マイニング制御部23aが、クライアント2
0側のマイニングエンジン23bを起動する(処理
B)。
【0058】ステップ32では、マイニングエンジン2
3bが、データ変換部23dを介して、ビジュアライザ
用データバッファ22bのデータを変換し、マイニング
エンジン入力用のマイニング用データバッファ23cを
作成する(処理C)。ステップ33では、マイニングエ
ンジン23bが、マイニング用データバッファ23cか
らデータを入力し、データマイニング処理を行う(処理
D)。
【0059】ステップ34では、マイニング制御部23
aが、マイニングエンジン23bにより行われたデータ
マイニング処理の結果を、データ変換部23dを介し
て、ビジュアライザ用データに変換し、変換した処理結
果に基づいてビジュアライザ用データバッファ22bの
内容を更新する(処理E)。ステップ35では、ビジュ
アライザ22aが、ビジュアライザ用データバッファ2
2bのデータに基づいて表示内容を更新する(処理
F)。この結果、データの自動分類或いは軸項目の並べ
換え結果が、ビジュアライザ22a上に表示されること
となる。
【0060】ステップ36は、ユーザが、ビジュアライ
ザ22a上の結果を新しい情報の切り口として、メタデ
ータとして保管するか否かの選択処理が行われる。そし
て、保管する場合にはステップ37へと進み、保管しな
い場合には本ルーチンを終了する。ステップ37では、
概観情報要約部24が、ビジュアライザ用データバッフ
ァ22bのデータを、メタデータ形式に変換し、サーバ
30側のサーバソフト31aを介して、メタデータファ
イル31bにこれを格納する(処理G)。
【0061】図12〜図14は、サーバ30側でビジュ
アライザ22aの表示内容の更新処理が行われるときの
処理内容を示す。具体的には、図12は、全体の処理流
れ図、図13は、クライアント20側の処理内容を説明
するフローチャート、図14は、サーバ30側の処理内
容を示すフローチャートである。先ず、クライアント2
0側の処理内容について説明する。
【0062】ステップ40では、表示内容を更新する指
示内容が、データマイニング部23のマイニング制御部
23aに送付される(処理A)。ステップ41では、マ
イニング制御部23aが、検索情報としてのクロス集計
表を作成するために使用したデータベース名,管理ポイ
ント及び検索条件を、サーバ30側のマイニング制御部
33aに送付する(処理B)。
【0063】ステップ42では、サーバ30側のマイニ
ング制御部33aから、データマイニング処理の結果が
格納されたデータベース名及び管理ポイントが返送され
たか否かが判断され、返送されるまで待機する。ステッ
プ43では、マイニング制御部23aが、返送されたデ
ータベース名及び管理ポイントを、概観情報要約部24
に送付する(処理H)。
【0064】ステップ44では、概観情報要約部24
が、サーバ30側のメタデータファイル31bに格納さ
れているメタデータを取得して付加情報を作成し、返送
されたデータベース名及び管理ポイントに基づき、デー
タウェアハウス32から取得した詳細情報,要約情報及
び異常詳細情報に付加情報を付加する(処理I)。ステ
ップ45では、概観情報要約部24が、付加情報が付加
された詳細情報,要約情報及び異常詳細情報に基づい
て、ビジュアライザ用データバッファ22bの内容を更
新する(処理J)。
【0065】ステップ46では、ビジュアライザ22a
が、ビジュアライザ用データバッファ22bのデータに
基づいて表示内容を更新する(処理K)。この結果、デ
ータの自動分類或いは軸項目の並べ換え結果が、ビジュ
アライザ22a上に表示されることとなる。次に、サー
バ30側の処理内容について説明する。
【0066】ステップ50では、マイニング制御部33
aが、クライアント20側から送付された検索情報とし
てのデータベース名,管理ポイント及び検索条件に基づ
いて、データ変換部33dを介して、データウェアハウ
ス32から対象データを読み込み、マイニング用データ
バッファ33cを作成する(処理C)。ステップ51で
は、マイニング制御部33aが、マイニングエンジン3
3bを起動する(処理D)。
【0067】ステップ52では、マイニングエンジン3
3bが、マイニング用データバッファ33cのデータを
入力し、データマイニング処理を行う(処理E)。ステ
ップ53では、マイニング制御部33aが、マイニング
エンジン33bで行われたデータマイニング処理の結果
を、データ変換部33dを介してデータベース形式に変
換し、変換されたデータマイニング処理の結果を、デー
タウェアハウス32に格納する(処理F)。
【0068】ステップ54では、マイニング制御部33
aが、データマイニング処理の結果が格納されたデータ
ベース名及び管理ポイントを、クライアント20側のマ
イニング制御部23aに返送する(処理G)。このよう
にすれば、エンドユーザ向けのOLAPにおいて、問題
点の原因を探索しようとする範囲を指定した後で、かか
る範囲内における分析対象データを、平行座標からなる
グラフ上に表示することができるようになる。そして、
表示されたグラフ上において、フィルタリングや自動分
類等の操作を行うことで、問題点の原因を次第に明らか
にすることができる。従って、高度な経験やスキルを持
っていなくとも、新しい発想や高い確度をもったクロス
集計表の分析が可能となる。
【0069】また、グラフ表示を行う際に、分析対象と
なるデータの全レコードを取り扱わず、所定数のレコー
ドをランダムにサンプリングして使用するため、例え
ば、データベースへのアクセス件数の減少により処理時
間が短縮し、グラフの表示が高速で行われるようにな
る。このように、レコードをランダムサンプリングして
取り扱うデータ量を減らしても、グラフは、マクロなデ
ータの傾向及び特徴を表わしているので、データの分析
処理に対して何ら影響を及ぼさず、高速表示による思考
の中断が防止され、極めて効果的な分析作業が可能とな
る。
【0070】要するに、エンドユーザがデータマイニン
グに関して高度な知識を持たなくとも、もともとその分
野で深い洞察力を有する業務担当者が、問題点の原因探
索においてデータマイニング手法を全く意識せずに利用
することができるようになる。
【0071】
【発明の効果】以上説明したように、請求項1又は請求
項10に記載の発明によれば、分析対象のデータをクロ
ス集計したクロス集計表において、問題点の発生原因の
探索を進めようとする範囲を指定してグラフ上に表示す
ることができるので、データの分析が視覚的に行なわ
れ、データの分析を効率的かつ容易に行うことができ
る。
【0072】特に、請求項10記載の発明によれば、請
求項1記載の発明の効果に加え、媒体にはクロス集計表
表示機能,セル指定機能及びグラフ表示機能を実現する
プログラムが記録されているので、本発明に係る対話型
データ分析支援プログラムを流通させることができ、か
かる媒体を取得した者は対話型データ分析支援装置を容
易に構築することができる。
【0073】請求項2又は請求項11に記載の発明によ
れば、問題点の原因の探索過程において、分析対象のデ
ータの範囲を徐々に限定していくことで、最終的な原因
を容易に見出すことができ、データ分析効率を向上する
ことができる。請求項3又は請求項12に記載の発明に
よれば、データの表示順序により問題点の原因が明確に
なる場合があるので、データ分析効率を向上することが
できる。
【0074】請求項4又は請求項13に記載の発明によ
れば、自動分析により見出された表示項目がグラフに追
加されることで、問題点の原因が明確になる場合がある
ので、データ分析効率を向上することができる。請求項
5又は請求項14に記載の発明によれば、問題点の原因
探索において行った操作が、次回の原因探索でも利用す
ることができるようになり、分析処理効率を飛躍的に向
上することができる。
【0075】請求項6又は請求項15に記載の発明によ
れば、関連性のあるレコードを簡単な操作で一括して取
り扱うことが可能となり、操作性を向上することができ
る。請求項7又は請求項16に記載の発明によれば、使
用レコードの減少により処理時間が短縮し、グラフの表
示が高速に行われるようになるので、システムに高速な
処理能力がなくとも、データ分析処理にあたり充分な動
作速度が確保でき、コスト上昇を抑制することができ
る。
【0076】請求項8又は請求項17に記載の発明によ
れば、データの傾向の把握を容易に行うことが可能とな
り、データ分析において、分析者の誤認等の発生が低減
し、分析結果の精度を向上することができる。請求項9
又は請求項18に記載の発明によれば、問題点の原因の
探索を容易に行うことが可能となり、データ分析効率を
向上することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態を示すシステム構成図であ
る。
【図2】同上の計算機システムの詳細構成図である。
【図3】OLAPに表示されるクロス集計表の一例を示
す図である。
【図4】ビジュアライザに表示されるグラフの一例を示
す図である。
【図5】クロス集計表の表示処理を示す処理流れ図であ
る。
【図6】クライアント側におけるクロス集計表の表示処
理を示すフローチャートである。
【図7】サーバ側におけるクロス集計表の表示処理を示
すフローチャートである。
【図8】グラフの表示処理を示す処理流れ図である。
【図9】グラフの表示処理を示すフローチャートであ
る。
【図10】クライアント側でグラフの表示更新処理を行
う場合の処理流れ図である。
【図11】クライアント側でグラフの表示更新処理を行
う場合のフローチャートである。
【図12】サーバ側でグラフの表示更新処理を行う場合
の処理流れ図である。
【図13】クライアント側におけるグラフの表示更新処
理を示すフローチャートである。
【図14】サーバ側におけるグラフの表示更新処理を示
すフローチャートである。
【符号の説明】
21・・・OLAPクライアント部 22・・・ビジュアライザ部 23・・・データマイニング部 24・・・概観情報要約部 31・・・OLAPサーバ部 33・・・データマイニング部 34・・・概観情報収集部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 伏見 俊彦 神奈川県小田原市栄町一丁目6番地4 株 式会社富士通ソフトウェア生産技術研究所 内 (72)発明者 鈴木 輝幸 神奈川県小田原市栄町一丁目6番地4 株 式会社富士通ソフトウェア生産技術研究所 内 (72)発明者 井上 征男 神奈川県小田原市栄町一丁目6番地4 株 式会社富士通ソフトウェア生産技術研究所 内 (72)発明者 都築 康一 神奈川県小田原市栄町一丁目6番地4 株 式会社富士通ソフトウェア生産技術研究所 内 (72)発明者 加藤 博己 神奈川県小田原市栄町一丁目6番地4 株 式会社富士通ソフトウェア生産技術研究所 内

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】データの分析を支援する対話型データ分析
    支援装置であって、 指定された集計条件に従って、分析対象のデータをクロ
    ス集計したクロス集計表を表示するクロス集計表表示手
    段と、 前記クロス集計表を構成する複数のセルから少なくとも
    1つのセルを指定するセル指定手段と、 前記セル指定手段により指定されたセルの範囲内で、分
    析対象のデータをグラフとして表示するグラフ表示手段
    と、 を含んで構成されることを特徴とする対話型データ分析
    支援装置。
  2. 【請求項2】前記グラフ表示手段は、表示されるデータ
    の範囲を限定する表示限定手段を備えたことを特徴とす
    る請求項1記載の対話型データ分析支援装置。
  3. 【請求項3】前記グラフ表示手段は、所定の条件に従っ
    て、表示されるデータを自動的に並べ替える並べ替え手
    段を備えたことを特徴とする請求項1又は2に記載の対
    話型データ分析支援装置。
  4. 【請求項4】前記グラフ表示手段は、前記分析対象のデ
    ータの特徴を抽出して新たな表示項目を見出す自動分析
    手段と、見出された新たな表示項目をグラフに追加する
    表示項目追加手段と、を含んで構成されることを特徴と
    する請求項1〜3のいずれか1つに記載の対話型データ
    分析装置。
  5. 【請求項5】前記グラフ表示手段は、該グラフ表示手段
    上で行われた操作の結果を、前記クロス集計表表示手段
    で使用される集計条件として保存する保存手段を備え、
    前記クロス集計表表示手段は、保存された集計条件に従
    って、分析対象のデータをクロス集計したクロス集計表
    を表示可能な構成であることを特徴とする請求項2〜4
    のいずれか1つに記載の対話型データ分析装置。
  6. 【請求項6】前記分析対象のデータは、複数のデータ項
    目から構成されるレコードの集合であることを特徴とす
    る請求項1〜5のいずれか1つに記載の対話型データ分
    析支援装置。
  7. 【請求項7】前記グラフ表示手段は、前記分析対象のデ
    ータの中から所定数のレコードをランダムに抽出するラ
    ンダム抽出手段を備え、抽出されたレコードに基づいて
    グラフを表示する構成であることを特徴とする請求項6
    記載の対話型データ分析支援装置。
  8. 【請求項8】前記グラフ表示手段は、前記データ項目を
    軸としてグラフを表示する構成であることを特徴とする
    請求項6又は7に記載の対話型データ分析支援装置。
  9. 【請求項9】前記グラフ表示手段は、前記レコードを構
    成するデータ項目と同数の軸からなり、前記レコードの
    各々について、各データ項目の値に対応する点をプロッ
    トし、隣接する軸にプロットした点を線分で結んだグラ
    フを表示する構成であることを特徴とする請求項8記載
    の対話型データ分析支援装置。
  10. 【請求項10】データの分析を支援する対話型データ分
    析支援プログラムを記録した媒体であって、 指定された集計条件に従って、分析対象のデータをクロ
    ス集計したクロス集計表を表示するクロス集計表表示機
    能と、 前記クロス集計表を構成する複数のセルから少なくとも
    1つのセルを指定するセル指定機能と、 前記セル指定機能により指定されたセルの範囲内で、分
    析対象のデータをグラフとして表示するグラフ表示機能
    と、 を実現するプログラムを少なくとも記録したことを特徴
    とする対話型データ分析支援プログラムを記憶した媒
    体。
  11. 【請求項11】前記グラフ表示機能は、表示されるデー
    タの範囲を限定する表示限定機能を備えたことを特徴と
    する請求項10記載の対話型データ分析支援プログラム
    を記録した媒体。
  12. 【請求項12】前記グラフ表示機能は、所定の条件に従
    って、表示されるデータを自動的に並べ替える並べ替え
    機能を備えたことを特徴とする請求項10又は11に記
    載の対話型データ分析支援プログラムを記録した媒体。
  13. 【請求項13】前記グラフ表示機能は、前記分析対象の
    データの特徴を抽出して新たな表示項目を見出す自動分
    析機能と、見出された新たな表示項目をグラフに追加す
    る表示項目追加機能と、を含んで構成されることを特徴
    とする請求項10〜12のいずれか1つに記載の対話型
    データ分析装置。
  14. 【請求項14】前記グラフ表示機能は、前記グラフ上で
    行われた操作の結果を、前記クロス集計表表示機能で使
    用される集計条件として保存する保存機能を備え、前記
    クロス集計表表示機能は、保存された集計条件に従っ
    て、分析対象のデータをクロス集計したクロス集計表を
    表示可能であることを特徴とする請求項11〜13のい
    ずれか1つに記載の対話型データ分析プログラムを記録
    した媒体。
  15. 【請求項15】前記分析対象のデータは、複数のデータ
    項目から構成されるレコードの集合であることを特徴と
    する請求項10〜14のいずれか1つに記載の対話型デ
    ータ分析支援プログラムを記録した媒体。
  16. 【請求項16】前記グラフ表示機能は、前記分析対象の
    データの中から所定数のレコードをランダムに抽出する
    ランダム抽出機能を備え、抽出されたレコードに基づい
    てグラフを表示することを特徴とする請求項15記載の
    対話型データ分析支援プログラムを記録した媒体。
  17. 【請求項17】前記グラフ表示機能は、前記データ項目
    を軸としてグラフを表示することを特徴とする請求項1
    5又は16に記載の対話型データ分析支援プログラムを
    記録した媒体。
  18. 【請求項18】前記グラフ表示機能は、前記レコードを
    構成するデータ項目と同数の軸からなり、前記レコード
    の各々について、各データ項目の値に対応する点をプロ
    ットし、隣接する軸にプロットした点を線分で結んだグ
    ラフを表示することを特徴とする請求項17記載の対話
    型データ分析支援プログラムを記録した媒体。
JP16369297A 1997-06-20 1997-06-20 対話型データ分析支援装置及び対話型データ分析支援プログラムを記録した媒体 Pending JPH1115897A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP16369297A JPH1115897A (ja) 1997-06-20 1997-06-20 対話型データ分析支援装置及び対話型データ分析支援プログラムを記録した媒体
US09/014,422 US7082568B2 (en) 1997-06-20 1998-01-27 Interactive data analysis support apparatus and media on which is recorded an interactive data analysis support program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16369297A JPH1115897A (ja) 1997-06-20 1997-06-20 対話型データ分析支援装置及び対話型データ分析支援プログラムを記録した媒体

Publications (1)

Publication Number Publication Date
JPH1115897A true JPH1115897A (ja) 1999-01-22

Family

ID=15778799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16369297A Pending JPH1115897A (ja) 1997-06-20 1997-06-20 対話型データ分析支援装置及び対話型データ分析支援プログラムを記録した媒体

Country Status (2)

Country Link
US (1) US7082568B2 (ja)
JP (1) JPH1115897A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671680B1 (en) 2000-01-28 2003-12-30 Fujitsu Limited Data mining apparatus and storage medium storing therein data mining processing program
US7730059B2 (en) 2007-03-30 2010-06-01 International Business Machines Corporation Cube faceted data analysis
US7788269B2 (en) 2007-03-30 2010-08-31 International Business Machines Corporation Integration of predefined multi-dimensional and flexibly-ordered dynamic search interfaces
US8024656B2 (en) 2007-03-30 2011-09-20 International Business Machines Corporation Data analysis using facet attributes
WO2015193983A1 (ja) * 2014-06-18 2015-12-23 株式会社日立製作所 画像表示システム及び画像表示方法

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9262383B2 (en) 1999-05-21 2016-02-16 E-Numerate Solutions, Inc. System, method, and computer program product for processing a markup document
US7249328B1 (en) * 1999-05-21 2007-07-24 E-Numerate Solutions, Inc. Tree view for reusable data markup language
US9268748B2 (en) 1999-05-21 2016-02-23 E-Numerate Solutions, Inc. System, method, and computer program product for outputting markup language documents
US7421648B1 (en) * 1999-05-21 2008-09-02 E-Numerate Solutions, Inc. Reusable data markup language
US9262384B2 (en) 1999-05-21 2016-02-16 E-Numerate Solutions, Inc. Markup language system, method, and computer program product
US7185279B2 (en) * 2000-01-07 2007-02-27 Master Mine Software, Inc. Data mining and reporting
US7231596B2 (en) * 2000-11-29 2007-06-12 Dov Koren Collaborative, fault-tolerant, scaleable, flexible, interactive real-time display and processing method and apparatus
US8255791B2 (en) 2000-11-29 2012-08-28 Dov Koren Collaborative, flexible, interactive real-time displays
US9600842B2 (en) 2001-01-24 2017-03-21 E-Numerate Solutions, Inc. RDX enhancement of system and method for implementing reusable data markup language (RDL)
US8660869B2 (en) * 2001-10-11 2014-02-25 Adobe Systems Incorporated System, method, and computer program product for processing and visualization of information
JP2003178085A (ja) * 2001-12-07 2003-06-27 Fujitsu Ltd 情報収集装置及び方法並びに情報収集プログラム
US20060167911A1 (en) * 2005-01-24 2006-07-27 Stephane Le Cam Automatic data pattern recognition and extraction
US7831539B2 (en) * 2005-06-21 2010-11-09 Microsoft Corporation Dynamically filtering aggregate reports based on values resulting from one or more previously applied filters
JP4337841B2 (ja) * 2006-06-07 2009-09-30 オムロン株式会社 データ表示装置およびその制御方法、データ表示装置制御プログラム、ならびに該プログラムを記録した記録媒体
US8838623B2 (en) * 2006-06-22 2014-09-16 International Business Machines Corporation System and method for locking context of sets of members in crosstabs
US8217944B1 (en) * 2006-08-22 2012-07-10 Morgan Stanley Systems and methods for selecting variable transformations
US7966560B2 (en) * 2006-10-24 2011-06-21 International Business Machines Corporation Laying out web components using mounting and pooling functions
US8812957B2 (en) * 2007-01-31 2014-08-19 Adobe Systems Incorporated Relevance slider in a site analysis report
US8099491B2 (en) * 2007-01-31 2012-01-17 Adobe Systems Incorporated Intelligent node positioning in a site analysis report
US8862980B2 (en) * 2007-06-29 2014-10-14 Business Objects Software Limited Guided graphical navigation through multidimensional databases
US8874502B2 (en) * 2008-08-29 2014-10-28 Red Hat, Inc. Real time datamining
US10102262B2 (en) 2008-08-29 2018-10-16 Red Hat, Inc. Creating reports using dimension trees
US8990686B2 (en) * 2011-11-02 2015-03-24 Microsoft Technology Licensing, Llc Visual navigation of documents by object
US9646072B2 (en) * 2013-03-03 2017-05-09 Panorama Software Inc. Multidimensional dataset query processing
US11023826B2 (en) * 2017-09-29 2021-06-01 Oracle International Corporation System and method for data visualization using machine learning and automatic insight of facts associated with a set of data

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5418942A (en) * 1989-07-06 1995-05-23 Krawchuk; Kenneth V. System and method for storing and managing information
US5416895A (en) * 1992-04-08 1995-05-16 Borland International, Inc. System and methods for improved spreadsheet interface with user-familiar objects
US5915257A (en) * 1994-10-11 1999-06-22 Brio Technology, Inc. Cross tab analysis and reporting method
US5675637A (en) * 1995-05-16 1997-10-07 Inventions, Inc. Method for automatically obtaining and presenting data from multiple data sources
US6246410B1 (en) * 1996-01-19 2001-06-12 International Business Machines Corp. Method and system for database access
US6055550A (en) * 1996-03-21 2000-04-25 Oracle Corporation Auto sizing of fields for displaying computer forms
US6421670B1 (en) * 1996-04-15 2002-07-16 Clive M Fourman Computer network
US5819293A (en) * 1996-06-06 1998-10-06 Microsoft Corporation Automatic Spreadsheet forms
US5848425A (en) * 1996-07-01 1998-12-08 Electronic Data Systems Corporation System and method for displaying alphanumeric data in a three dimensional grid
JPH1055367A (ja) * 1996-08-09 1998-02-24 Hitachi Ltd データ利用システム
US5926822A (en) * 1996-09-06 1999-07-20 Financial Engineering Associates, Inc. Transformation of real time data into times series and filtered real time data within a spreadsheet application
US5970476A (en) * 1996-09-19 1999-10-19 Manufacturing Management Systems, Inc. Method and apparatus for industrial data acquisition and product costing
US5974187A (en) * 1996-10-21 1999-10-26 Samsung Electronics Co., Ltd. Baseline-based contour coding and decoding method and apparatus therefor
US5950189A (en) * 1997-01-02 1999-09-07 At&T Corp Retrieval system and method
US5970506A (en) * 1997-01-20 1999-10-19 Justsystem Corporation Spreadsheet-calculating system and method
US5890150A (en) * 1997-01-24 1999-03-30 Hitachi, Ltd. Random sampling method for use in a database processing system and a database processing system based thereon
US5995957A (en) * 1997-02-28 1999-11-30 International Business Machines Corporation Query optimization through the use of multi-column statistics to avoid the problems of column correlation
US5978788A (en) * 1997-04-14 1999-11-02 International Business Machines Corporation System and method for generating multi-representations of a data cube
US5890151A (en) * 1997-05-09 1999-03-30 International Business Machines Corporation Method and system for performing partial-sum queries on a data cube
US5870752A (en) * 1997-08-21 1999-02-09 Lucent Technologies Inc. Incremental maintenance of an approximate histogram in a database system
US6389380B1 (en) * 1997-09-16 2002-05-14 Evolving Logic Associates System and method for performing compound computational experiments
US6035306A (en) * 1997-11-24 2000-03-07 Terascape Software Inc. Method for improving performance of large databases
US6263337B1 (en) * 1998-03-17 2001-07-17 Microsoft Corporation Scalable system for expectation maximization clustering of large databases
US6049797A (en) * 1998-04-07 2000-04-11 Lucent Technologies, Inc. Method, apparatus and programmed medium for clustering databases with categorical attributes
US6205431B1 (en) * 1998-10-29 2001-03-20 Smart Software, Inc. System and method for forecasting intermittent demand

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671680B1 (en) 2000-01-28 2003-12-30 Fujitsu Limited Data mining apparatus and storage medium storing therein data mining processing program
US7730059B2 (en) 2007-03-30 2010-06-01 International Business Machines Corporation Cube faceted data analysis
US7788269B2 (en) 2007-03-30 2010-08-31 International Business Machines Corporation Integration of predefined multi-dimensional and flexibly-ordered dynamic search interfaces
US8024656B2 (en) 2007-03-30 2011-09-20 International Business Machines Corporation Data analysis using facet attributes
WO2015193983A1 (ja) * 2014-06-18 2015-12-23 株式会社日立製作所 画像表示システム及び画像表示方法
JPWO2015193983A1 (ja) * 2014-06-18 2017-04-20 株式会社日立製作所 画像表示システム及び画像表示方法

Also Published As

Publication number Publication date
US20010018694A1 (en) 2001-08-30
US7082568B2 (en) 2006-07-25

Similar Documents

Publication Publication Date Title
JPH1115897A (ja) 対話型データ分析支援装置及び対話型データ分析支援プログラムを記録した媒体
US6826724B1 (en) Document processor, document classification device, document processing method, document classification method, and computer-readable recording medium for recording programs for executing the methods on a computer
US8131779B2 (en) System and method for interactive multi-dimensional visual representation of information content and properties
KR101083519B1 (ko) 데이터 퍼스펙티브들에서의 변칙 검출
US6915297B2 (en) Automatic knowledge management system
US6725217B2 (en) Method and system for knowledge repository exploration and visualization
US7949674B2 (en) Integration of documents with OLAP using search
US20050081146A1 (en) Relation chart-creating program, relation chart-creating method, and relation chart-creating apparatus
US20090043714A1 (en) Interactive data mining system
US20110295856A1 (en) Identifying related objects using quantum clustering
EP2503477B1 (en) A system and method for contextual resume search and retrieval based on information derived from the resume repository
US9418145B2 (en) Method and system for visualizing documents
EP2228737A2 (en) Improving search effectiveness
CN102067124A (zh) 文档搜索系统
Nagaiah et al. Software for Data Analysis in SPSS On over view
JP2004021445A (ja) テキストデータ分析システム、テキストデータ分析方法およびコンピュータプログラム
JP2010250439A (ja) 検索システム、データ生成方法、プログラムおよびプログラムを記録した記録媒体
Nazemi et al. A visual analytics approach for analyzing technological trends in technology and innovation management
KR20110010664A (ko) 문서 분석 시스템
JP2001216311A (ja) イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置
Campos et al. Time-matters: Temporal unfolding of texts
KR100931772B1 (ko) 웹사이트 검색 서비스 제공 방법 및 그 시스템
JP2003141132A (ja) 情報処理装置およびその方法
KR101078966B1 (ko) 문서 분석 시스템
KR20040098890A (ko) 웹사이트 검색 서비스 제공 방법 및 그 시스템

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030610