JP4202287B2 - 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア - Google Patents
注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア Download PDFInfo
- Publication number
- JP4202287B2 JP4202287B2 JP2004073614A JP2004073614A JP4202287B2 JP 4202287 B2 JP4202287 B2 JP 4202287B2 JP 2004073614 A JP2004073614 A JP 2004073614A JP 2004073614 A JP2004073614 A JP 2004073614A JP 4202287 B2 JP4202287 B2 JP 4202287B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- book
- knowledge
- term
- textbook
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
遺伝子ID(遺伝子オブジェクト):NM_002597
遺伝子定義:Homo sapiens phosducin(PDC),transcript variant 1,mRNA.
遺伝子を解説したテキスト:
Summary:This gene encodes a phosphoprotein,which is located in the outer and inner segments of the rod cells in the retina.This protein may participate in the regulation of visual phototransduction or in the integration of photoreceptor metabolism.It modulates the phototransduction cascade by interacting with the beta and gamma subunits of the retinal G−protein transducin.This gene is a potential candidate gene for retinitis pigmentosa and Usher syndrome type II.Alternatively spliced transcript variants encoding different isoforms have been identified.」
Claims (11)
- 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステムであって、
知識に関して記述された複数の文章が、それらの知識を体系化するための所定の構成で集積的に収納されてなる教科書・書籍の電子データであって、知識を体系化する構成(目次)の情報と各構成に属する知識情報テキストとからなる電子データ、を格納する知識集積物格納部と、
ユーザから当該ユーザが注目する情報オブジェクトを受け取る注目情報受取部と、
前記情報オブジェクトの文章テキストと前記教科書・書籍の電子データの各構成に属する知識情報テキストとをそれらに含まれるタームに基づいて比較し、テキスト同士の相関性を定量化して定量化値として出力する定量化処理部と、
上記定量化処理部によって出力された定量化値を前記教科書・書籍の電子データの構成の情報に関連付けて前記教科書・書籍全体として表示することで、前記情報オブジェクトが前記教科書・書籍中のどの知識に関連しているかを上記定量化値で可視的に表示する定量化値表示処理部と
を有することを特徴とするシステム。 - 請求項1記載のシステムにおいて、
前記教科書・書籍の電子データの各構成とこの各構成に属する知識情報テキストに含まれるタームの頻度を示す頻度マトリックスを生成する頻度マトリックス生成部と、
前記頻度マトリックスに基づき、前記各構成と前記タームの特異値座標系を求める特異値分解部と、
をさらに有し、
前記定量化処理部は、前記注目する情報オブジェクトに含まれるタームを、前記特異値座標系にマッピングすることで、前記注目する情報オブジェクトと前記教科書・書籍の電子データの各構成に属する知識情報テキストとの関係を定量化するものである
ことを特徴とするシステム。 - 請求項2記載のシステムにおいて、
前記定量化処理部は、前記注目する情報オブジェクトに含まれるタームをその重要度に応じて集計する注目ターム集計部を有するものである
ことを特徴とするシステム。 - 請求項3記載のシステムにおいて、
前記注目ターム集計部は、前記注目する情報オブジェクトが含まれる母データでの前記タームの使用頻度・要度に応じて前記タームを集計するものである
ことを特徴とするシステム。 - 請求項3記載のシステムにおいて、
前記定量化処理部は、前記タームを、前記特異値座標系中で前記重要度に応じた位置にマッピングするものである
ことを特徴とするシステム。 - 請求項2記載のシステムにおいて、
ターム辞書を保持する辞書保持部をさらに有し、
前記頻度マトリックス生成部は、前記各構成中に属する知識情報テキスト中前記ターム辞書に含まれるタームのみを抽出して前記頻度マトリックスを生成するものである
ことを特徴とするシステム。 - 請求項1記載のシステムにおいて、
前記知識を体系化する構成の情報は、各ページ、節、章等の書籍の目次情報であり、前記構成に属する知識情報テキストは前記各目次に含まれる知識コンテンツである
ことを特徴とするシステム。 - 請求項7記載のシステムにおいて、
定量化値表示処理部は、上記定量化処理部によって定量化された値を、前記教科書・書籍の電子データの目次情報のうち任意の目次に関連付けて表示するものであることを特徴とするシステム。 - 請求項1記載のシステムにおいて、
さらに、前記定量化値に基づき、注目する情報オブジェクトと最も関連する前記教科書・書籍の電子データの構成位置を検索する位置検索部を有することを特徴とするシステム。 - 請求項1記載のシステムにおいて、
さらに、注目する情報オブジェクトと複数の教科書・書籍の電子データとの関係を処理し、
注目する情報オブジェクトと最も関連する教科書・書籍の電子データとその構成位置を検索する知識集積物・位置検索部を有することを特徴とするシステム。 - 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのコンピュータソフトウエアであって、コンピュータ上で実行される以下の構成:
前記コンピュータに、知識に関して記述された複数の文章がそれらの知識を体系化するための所定の構成で集積的に収納されてなる教科書・書籍の電子データであって知識を体系化する構成の情報と各構成に属する知識情報テキストとからなる電子データ、を格納させる知識集積物格納部と、
前記コンピュータに、ユーザから当該ユーザが注目する情報オブジェクトを受け取らせる注目情報受取部と、
前記コンピュータに、前記情報オブジェクトの文章テキストと前記教科書・書籍の電子データの各構成に属する知識情報テキストとをそれらに含まれるタームに基づいて比較し、テキスト同士の相関性を定量化して定量化値として出力させる定量化処理部と、
前記コンピュータに、上記定量化処理部によって出力された定量化値を前記教科書・書籍の電子データの構成の情報に関連付けて前記教科書・書籍全体として表示させることで、前記情報オブジェクトが前記教科書・書籍中のどの知識に関連しているかを上記定量化値で可視的に表示させる定量化値表示処理部と
を有する
ことを特徴とするコンピュータソフトウエア。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004073614A JP4202287B2 (ja) | 2004-03-15 | 2004-03-15 | 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア |
| US11/039,176 US7903884B2 (en) | 2004-03-15 | 2005-01-20 | System and computer software program for visibly processing an observed information's relationship with knowledge accumulations |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004073614A JP4202287B2 (ja) | 2004-03-15 | 2004-03-15 | 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2005259088A JP2005259088A (ja) | 2005-09-22 |
| JP4202287B2 true JP4202287B2 (ja) | 2008-12-24 |
Family
ID=34918666
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004073614A Expired - Lifetime JP4202287B2 (ja) | 2004-03-15 | 2004-03-15 | 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US7903884B2 (ja) |
| JP (1) | JP4202287B2 (ja) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7461073B2 (en) * | 2006-02-14 | 2008-12-02 | Microsoft Corporation | Co-clustering objects of heterogeneous types |
| US7743058B2 (en) * | 2007-01-10 | 2010-06-22 | Microsoft Corporation | Co-clustering objects of heterogeneous types |
| WO2008143116A1 (ja) * | 2007-05-17 | 2008-11-27 | So-Ti, Inc. | 文書検索装置及び文書検索方法 |
| US20110145714A1 (en) * | 2009-12-15 | 2011-06-16 | At&T Intellectual Property I, L.P. | System and method for web-integrated statistical analysis |
| US20230153347A1 (en) * | 2011-07-05 | 2023-05-18 | Michael Stewart Shunock | System and method for annotating images |
| US9639518B1 (en) | 2011-09-23 | 2017-05-02 | Amazon Technologies, Inc. | Identifying entities in a digital work |
| US9449526B1 (en) | 2011-09-23 | 2016-09-20 | Amazon Technologies, Inc. | Generating a game related to a digital work |
| US9613003B1 (en) | 2011-09-23 | 2017-04-04 | Amazon Technologies, Inc. | Identifying topics in a digital work |
| US10108706B2 (en) | 2011-09-23 | 2018-10-23 | Amazon Technologies, Inc. | Visual representation of supplemental information for a digital work |
| US9304584B2 (en) | 2012-05-31 | 2016-04-05 | Ca, Inc. | System, apparatus, and method for identifying related content based on eye movements |
Family Cites Families (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03246764A (ja) * | 1990-02-26 | 1991-11-05 | Nippon Telegr & Teleph Corp <Ntt> | データベース検索システム |
| US5301109A (en) * | 1990-06-11 | 1994-04-05 | Bell Communications Research, Inc. | Computerized cross-language document retrieval using latent semantic indexing |
| JPH11134363A (ja) * | 1997-10-29 | 1999-05-21 | Ip Support:Kk | 特許情報処理方法及び特許情報処理システム |
| JP3829506B2 (ja) * | 1998-11-27 | 2006-10-04 | セイコーエプソン株式会社 | 文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体 |
| JP3463010B2 (ja) * | 1999-09-17 | 2003-11-05 | Necエレクトロニクス株式会社 | 情報処理装置および情報処理方法 |
| US7225180B2 (en) * | 2000-08-08 | 2007-05-29 | Aol Llc | Filtering search results |
| JP2002358309A (ja) * | 2001-06-04 | 2002-12-13 | Hitachi Software Eng Co Ltd | プロファイルデータベース及びプロファイル作成方法 |
| JP2002366557A (ja) * | 2001-06-11 | 2002-12-20 | Japan China Industrial Communications Co Ltd | 検索装置、コンピュータプログラム及び記録媒体 |
| JP4495886B2 (ja) * | 2001-08-09 | 2010-07-07 | 株式会社日立製作所 | 音声入力認識文例集の管理方法 |
| US20030130994A1 (en) * | 2001-09-26 | 2003-07-10 | Contentscan, Inc. | Method, system, and software for retrieving information based on front and back matter data |
| JP2003203091A (ja) * | 2002-01-09 | 2003-07-18 | Seiko Epson Corp | 文書速読支援装置、文書速読支援方法、文書速読支援プログラムおよび記録媒体 |
| US6907431B2 (en) * | 2002-05-03 | 2005-06-14 | Hewlett-Packard Development Company, L.P. | Method for determining a logical structure of a document |
| JP2003330966A (ja) * | 2002-05-13 | 2003-11-21 | Nippon Telegr & Teleph Corp <Ntt> | 文書分析方法及び装置及び文書分析プログラム及び文書分析プログラムを格納した記憶媒体 |
| JP4116329B2 (ja) * | 2002-05-27 | 2008-07-09 | 株式会社日立製作所 | 文書情報表示システム、文書情報表示方法及び文書検索方法 |
| JP2004021445A (ja) * | 2002-06-14 | 2004-01-22 | Nri & Ncc Co Ltd | テキストデータ分析システム、テキストデータ分析方法およびコンピュータプログラム |
| JP2004220111A (ja) * | 2003-01-09 | 2004-08-05 | Canon Inc | 文書要約装置 |
-
2004
- 2004-03-15 JP JP2004073614A patent/JP4202287B2/ja not_active Expired - Lifetime
-
2005
- 2005-01-20 US US11/039,176 patent/US7903884B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US20050203889A1 (en) | 2005-09-15 |
| JP2005259088A (ja) | 2005-09-22 |
| US7903884B2 (en) | 2011-03-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Rousseau | Journal evaluation: Technical and practical issues | |
| Shah et al. | Information extraction from full text scientific articles: where are the keywords? | |
| Bache et al. | Text-based measures of document diversity | |
| US7451124B2 (en) | Method of analyzing documents | |
| Chuang et al. | Termite: Visualization techniques for assessing textual topic models | |
| JP4066600B2 (ja) | 多言語文書検索システム | |
| Naidu et al. | Text summarization with automatic keyword extraction in telugu e-newspapers | |
| Trappey et al. | An R&D knowledge management method for patent document summarization | |
| Weisser et al. | Pseudo-document simulation for comparing LDA, GSDMM and GPM topic models on short and sparse text using Twitter data | |
| JP2012160201A (ja) | レビュー処理方法およびシステム | |
| KR20130056207A (ko) | 관계 정보 확장 장치, 관계 정보 확장 방법, 및 프로그램 | |
| JP4202287B2 (ja) | 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア | |
| KR101377447B1 (ko) | 태그간 의미 분석을 이용한 다중 문서 요약 방법 및 시스템 | |
| CN111373386A (zh) | 相似度指标值计算装置、相似检索装置及相似度指标值计算用程序 | |
| Alokaili et al. | Re-ranking words to improve interpretability of automatically generated topics | |
| CN116308758B (zh) | 一种基于大数据的金融风险分析方法及系统 | |
| Alimova et al. | Russia and post-Soviet countries compared: coverage of papers by Scopus and Web of Science, languages, and productivity of researchers | |
| Bartol et al. | Nano language and distribution of article title terms according to power laws | |
| Khan et al. | Metadata for efficient management of digital news articles in multilingual news archives | |
| Zhang et al. | Mutual-reinforcement document summarization using embedded graph based sentence clustering for storytelling | |
| Alhoshan et al. | AUSS: An Arabic query-based update-summarization system | |
| JP2001084256A (ja) | データベース処理装置、データベース処理方法、及びデータベース処理プログラムを記録したコンピュータ読み取り可能な記憶媒体 | |
| Ikeda et al. | Automatically Linking News Articles to Blog Entries. | |
| Kaptein et al. | Word clouds of multiple search results | |
| JP5284761B2 (ja) | 文書検索装置及び方法及びプログラム及びプログラムを記録した記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070116 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070319 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070626 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070827 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080408 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080609 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081007 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081008 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4202287 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111017 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121017 Year of fee payment: 4 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131017 Year of fee payment: 5 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| EXPY | Cancellation because of completion of term |