[go: up one dir, main page]

JP2007133761A - Content processing apparatus, content processing program, and content processing method - Google Patents

Content processing apparatus, content processing program, and content processing method Download PDF

Info

Publication number
JP2007133761A
JP2007133761A JP2005327675A JP2005327675A JP2007133761A JP 2007133761 A JP2007133761 A JP 2007133761A JP 2005327675 A JP2005327675 A JP 2005327675A JP 2005327675 A JP2005327675 A JP 2005327675A JP 2007133761 A JP2007133761 A JP 2007133761A
Authority
JP
Japan
Prior art keywords
web page
unit
content processing
user
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005327675A
Other languages
Japanese (ja)
Other versions
JP4836069B2 (en
Inventor
Stejic Zoran
ゾラン ステイチ
Sadafumi Araki
禎史 荒木
Hisashi Miyamori
恒 宮森
Mitsuru Mizuguchi
充 水口
Tsutomu Ba
強 馬
Katsumi Tanaka
克己 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Ricoh Co Ltd
Original Assignee
National Institute of Information and Communications Technology
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology, Ricoh Co Ltd filed Critical National Institute of Information and Communications Technology
Priority to JP2005327675A priority Critical patent/JP4836069B2/en
Publication of JP2007133761A publication Critical patent/JP2007133761A/en
Application granted granted Critical
Publication of JP4836069B2 publication Critical patent/JP4836069B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】閲覧の文脈を保持しつつ、何度も検索する手間を省いて効率的に情報検索を実行することができるとともに、特に複数の異なるクラスタに属する項目が混在した場合に、所望のクラスタに属する項目を見つけやすくする。
【解決手段】検索結果のウェブページ群をクラスタリングするクラスタリング部と、クラスタリングされたウェブページの検索結果について、同一画面内での詳細度変化や表示メディア遷移を属するクラスタ単位で連続的に実現するズーミングの操作/挙動を記述するズーミング記述生成部と、ユーザからの所定のウェブページに対するズームイン/アウト操作を受け付ける操作受付部と、受け付けたズームイン/アウト操作に応じ、生成された記述に従って、クラスタリングされたウェブページの検索結果を操作されたウェブページが属するクラスタ単位で詳細度変化や表示メディア遷移させて表示するクラスタリング表示部と、を備える。
【選択図】 図20
An object of the present invention is to efficiently perform an information search while maintaining the browsing context while eliminating the trouble of searching many times, and in particular when a plurality of items belonging to different clusters are mixed. Make it easier to find items belonging to.
A clustering unit for clustering a web page group of search results, and a zooming for continuously realizing a change in level of detail and a transition of display media in the same screen with respect to a search result of clustered web pages. A zooming description generation unit that describes the operation / behavior of the user, an operation reception unit that receives a zoom-in / out operation on a predetermined web page from a user, and clustering according to a description generated according to the received zoom-in / out operation A clustering display unit that displays the search result of the web page by changing the level of detail or changing the display medium in units of clusters to which the operated web page belongs.
[Selection] FIG.

Description

本発明は、コンテンツ処理装置、コンテンツ処理プログラムおよびコンテンツ処理方法に関する。   The present invention relates to a content processing apparatus, a content processing program, and a content processing method.

ネットワークのWeb環境は日々進展しており、そこに含まれる情報量が増大しつつある。一方、情報の形態もテキストだけでなく、静止画像、動画像、音声等のマルチメディア化がさらに進んでいる。このようなネットワーク上の膨大な情報をWebの閲覧者が有効活用するためには、自らの利用目的に沿った情報を効率的に検索できることが何よりも望まれる。そこで、近年においては、各種の検索エンジンを用いることにより、情報を効率的に検索できるようになっている。   The network Web environment is evolving day by day, and the amount of information contained therein is increasing. On the other hand, the form of information is not only text, but multimedia such as still images, moving images, and voices is further advanced. In order for Web viewers to make effective use of such a large amount of information on the network, it is most desirable that the information according to the purpose of use can be efficiently searched. Therefore, in recent years, information can be efficiently searched by using various search engines.

ところで、このような検索エンジンでは、図21に示すように、基本的に検索結果の一部(キーワードを含む数行のテキスト、もしくは、キーワード近傍の画像サムネイル)の一覧を提示するのみであり、それ以上の情報を得るためにはリンク先のWebページを1つ1つ開けてはその内容を確認し、所望の情報が得られない場合は再び検索結果一覧画面に戻るという作業を繰り返すことになる。   By the way, as shown in FIG. 21, such a search engine basically only presents a list of a part of search results (several lines of text including keywords or image thumbnails near the keywords) To obtain more information, open each linked Web page one by one and check the contents. If you cannot obtain the desired information, return to the search result list screen again. Become.

一方、なじみの薄い分野についてキーワードによる情報検索を行う場合、適切なキーワードを思いつくことは必ずしも容易でなく、検索結果の中に閲覧者が期待しない(不要な)情報が含まれることがしばしば発生する。そのような場合、キーワードを試行錯誤的に追加しつつ検索対象を絞り込んでいく方法があるが、何度も検索を繰り返す手間がかかる。そこで、検索結果をカテゴライズして表示すると、閲覧者は対象分野の全容を把握しやすくなるため、希望するカテゴリの情報のみを見つけ出すことが容易となる。このような検索結果のカテゴライズ表示については、例えば非特許文献1に記載されている。   On the other hand, when searching for information using a keyword in a field that is not familiar, it is not always easy to come up with an appropriate keyword, and search results often contain information that the viewer does not expect (unnecessary). . In such a case, there is a method of narrowing down the search target while adding keywords by trial and error, but it takes time and effort to repeat the search many times. Therefore, when the search results are categorized and displayed, the viewer can easily grasp the entire contents of the target field, so that it is easy to find out only the information of the desired category. Such categorized display of search results is described in Non-Patent Document 1, for example.

Bill Kules and Ben Shneiderman, "Categorized graphical overviews for web search results: An exploratory study using U. S. government agencies as a meaningful and stable structure," Proceedings of the Third Annual Workshop on HCI Research in MIS, Washington, D.C., December 10-11, 2004Bill Kules and Ben Shneiderman, "Categorized graphical overviews for web search results: An exploratory study using US government agencies as a meaningful and stable structure," Proceedings of the Third Annual Workshop on HCI Research in MIS, Washington, DC, December 10-11 , 2004

しかしながら、検索結果一覧からリンク先を1つ1つ開けるという作業を繰り返すことは非常に面倒であり、このように検索結果とリンク先を何度も往復すると、情報閲覧の文脈が失われて検索効率が低下するという問題がある。逆に、各検索結果Webページに関して多くの情報を提示すると、全体の一覧性が悪くなり、やはり検索効率が低下する。なお、近年においては、リンク先のWebページを一覧画面内に縮小表示する方法も現れてきているが、これらはリンク先全体の雰囲気を掴むことはできても、テキストの内容や画像の詳細はわからないという問題がある。   However, it is very cumbersome to repeat the process of opening each link destination from the search result list, and if the search result and the link destination are reciprocated many times in this way, the information browsing context is lost and the search is performed. There is a problem that efficiency decreases. On the other hand, when a lot of information is presented for each search result Web page, the overall listability is deteriorated, and the search efficiency is also lowered. In recent years, methods for reducing the display of linked Web pages in the list screen have also appeared. However, these can grasp the atmosphere of the entire link destination, but the details of text and images are detailed. There is a problem of not knowing.

また、非特許文献1に記載されている検索結果をカテゴライズして表示する技術によれば、カテゴリを選択した後の一覧画面は、検索エンジンの通常のキーワード検索結果画面と同様の抜粋されたテキストから構成されており、それ以上の情報を得るには、やはり、リンク先ページを開けねばならない。   In addition, according to the technique for categorizing and displaying the search results described in Non-Patent Document 1, the list screen after selecting a category is an extracted text similar to the normal keyword search result screen of the search engine To get more information, you must open the linked page.

加えて、検索結果の表示には次のような問題も知られている。即ち、あるキーワードで検索した結果が複数のクラスタに分類される場合に、それらが混在してランキングされるために所望の項目を発見しにくいことがある。例えば、「Japan」というキーワードで検索をした結果、「Honshu」、「Tokyo」、「Kyushu」、「Osaka」、「Kyoto」に関係する項目が得られたとする。ここには、島(island)と都市(city)という2つの異なるクラスタに関する項目が混在している(「島」に関連するのが「Honshu」、「Kyushu」で、「都市」に関連するのが「Tokyo」、「Osaka」、「Kyoto」)。「島」に関する情報を知りたいユーザにとっては「Tokyo」、「Osaka」、「Kyoto」は不要であるし、「都市」に関する情報を知りたいユーザにとっては「Honshu」、「Kyushu」は不要である。このように、異なるクラスタに関する項目が混在する結果として、不要な情報が検索結果に含まれるため、所望のクラスタに属する項目が見つけにくいということがある。   In addition, the following problems are known for displaying search results. That is, when a result of searching with a certain keyword is classified into a plurality of clusters, it may be difficult to find a desired item because they are ranked together. For example, as a result of searching with the keyword “Japan”, items related to “Honshu”, “Tokyo”, “Kyushu”, “Osaka”, “Kyoto” are obtained. Here, items related to two different clusters, “island” and “city” are mixed (“Honshu” and “Kyushu” are related to “Island”, and “City” is related to “Island”. "Tokyo", "Osaka", "Kyoto"). “Tokyo”, “Osaka” and “Kyoto” are not necessary for users who want to know information about “islands”, and “Honshu” and “Kyushu” are not necessary for users who want to know information about “city”. . As described above, as a result of a mixture of items related to different clusters, unnecessary information may be included in the search results, and it may be difficult to find items belonging to a desired cluster.

本発明は、上記に鑑みてなされたものであって、閲覧の文脈を保持しつつ、何度も検索する手間を省いて効率的に情報検索を実行することができるとともに、特に複数の異なるクラスタに属する項目が混在した場合に、所望のクラスタに属する項目を見つけやすくすることができるコンテンツ処理装置、コンテンツ処理プログラムおよびコンテンツ処理方法を提供することを目的とする。   The present invention has been made in view of the above, and is capable of efficiently performing an information search while maintaining the browsing context, eliminating the need to search many times, and in particular a plurality of different clusters. It is an object of the present invention to provide a content processing apparatus, a content processing program, and a content processing method that can make it easier to find an item that belongs to a desired cluster when items belonging to are mixed.

上述した課題を解決し、目的を達成するために、請求項1にかかる発明のコンテンツ処理装置は、検索要求に従って検索されて順位付けされた結果であるウェブページ群を受け付けるウェブページ検索結果受付部と、このウェブページ検索結果受付部により受け付けた検索結果の前記ウェブページ群をクラスタリングするクラスタリング部と、このクラスタリング部によりクラスタリングされたウェブページの検索結果について、同一画面内での詳細度変化や表示メディア遷移を属するクラスタ単位で連続的に実現するズーミングの操作/挙動を記述するズーミング記述生成部と、ユーザからの所定のウェブページに対するズームイン/アウト操作を受け付ける操作受付部と、この操作受付部により受け付けたズームイン/アウト操作に応じ、前記ズーミング記述生成部により生成された記述に従って、クラスタリングされたウェブページの検索結果を操作されたウェブページが属するクラスタ単位で詳細度変化や表示メディア遷移させて表示するクラスタリング表示部と、を備える。   In order to solve the above-described problems and achieve the object, the content processing apparatus of the invention according to claim 1 is a web page search result receiving unit that receives a group of web pages that are searched and ranked according to a search request. And a clustering unit that clusters the web page group of the search results received by the web page search result receiving unit, and a search result of the web pages clustered by the clustering unit, and a change in detail level and display within the same screen A zooming description generation unit that describes a zooming operation / behavior that continuously realizes media transitions in units of clusters, an operation reception unit that receives a zoom-in / out operation on a predetermined web page from a user, and the operation reception unit Depending on the zoom in / out operation accepted Wherein according to the generated described by zooming description generator unit includes a clustering display unit for display by the operation of the search results web pages web page details of change or display media transition in clusters belonging clustering, the.

ここで、ウェブページとは、ウェブブラウザに一度に表示されるデータのまとまりで、テキストデータやHTML(あるいは、CSS(Cascading Style Sheet),XMLなど)によるレイアウト情報、文書中に埋め込まれた画像や音声、動画などから構成されるものである。   Here, a web page is a collection of data displayed at a time on a web browser. Text data, HTML (or CSS (Cascading Style Sheet), XML, etc.) layout information, images embedded in a document, It consists of audio, video, etc.

また、請求項2にかかる発明は、請求項1記載のコンテンツ処理装置において、ウェブページのテキストに対し、ウェブページのインデックスを生成してインデックスデータベースに格納するインデックシング部と、前記インデックスデータベースに格納されたインデックスを用い、ユーザのクエリーに対するウェブページの検索結果を生成するランキング部と、を更に備え、前記ウェブページ検索結果受付部は、前記ランキング部による検索結果の前記ウェブページ群を受け付ける。   According to a second aspect of the present invention, in the content processing device according to the first aspect, an indexing unit that generates a web page index for the text of the web page and stores it in the index database, and stores the index in the index database. A ranking unit that generates a web page search result for the user's query using the index, and the web page search result receiving unit receives the web page group of the search result by the ranking unit.

また、請求項3にかかる発明は、請求項2記載のコンテンツ処理装置において、前記インデックシング部は、ウェブページのテキストから代表的なキーワードを抽出するキーワード抽出部と、このキーワード抽出部で抽出したキーワードに基づいて、ウェブページのインデックスを生成するインデックス生成部と、を備えている。   According to a third aspect of the present invention, in the content processing apparatus according to the second aspect, the indexing unit extracts a representative keyword from a text of a web page, and the keyword extracting unit extracts the representative keyword. An index generation unit that generates an index of the web page based on the keyword.

また、請求項4にかかる発明は、請求項3記載のコンテンツ処理装置において、前記キーワード抽出部は、自然言語処理技術を用い、ウェブページのテキストから代表的なキーワードを抽出する。   According to a fourth aspect of the present invention, in the content processing apparatus according to the third aspect, the keyword extraction unit extracts a representative keyword from the text of the web page using a natural language processing technique.

また、請求項5にかかる発明は、請求項3記載のコンテンツ処理装置において、前記インデックス生成部は、抽出した代表キーワードを用い、ウェブページの内容を同じ形式に変換し、互いの相対類似度を計算できるようにする。   According to a fifth aspect of the present invention, in the content processing device according to the third aspect, the index generation unit converts the content of the web page into the same format using the extracted representative keyword, and calculates the relative similarity between them. Allow calculation.

また、請求項6にかかる発明は、請求項2記載のコンテンツ処理装置において、前記ランキング部は、抽出した代表的なキーワードの中から、ユーザが一つ又は複数のキーワードを選択できるようにするクエリー入力部と、ユーザが選択したキーワードであるクエリーをインデックスと同じ形式に変換するクエリー変換部と、前記インデックスデータベースに格納されたインデックスを用い、それぞれのウェブページのクエリーに対する類似度を計算する第1の類似度計算部と、この第1の類似度計算部で計算した類似度に基づいて、ユーザのクエリーに対するウェブページの検索結果を生成するランキング生成部と、を備えている。   The invention according to claim 6 is the content processing apparatus according to claim 2, wherein the ranking unit allows the user to select one or a plurality of keywords from the extracted representative keywords. First, a query conversion unit that converts a query that is a keyword selected by a user into the same format as an index, and an index stored in the index database are used to calculate a similarity to a query of each web page. And a ranking generation unit that generates a web page search result for the user query based on the similarity calculated by the first similarity calculation unit.

また、請求項7にかかる発明は、請求項6記載のコンテンツ処理装置において、前記クエリー入力部は、一次元のキーワードのリスト又は二次元のキーワードのマップからユーザがキーワードを選択できるようにする。   According to a seventh aspect of the present invention, in the content processing apparatus according to the sixth aspect, the query input unit allows a user to select a keyword from a one-dimensional keyword list or a two-dimensional keyword map.

また、請求項8にかかる発明は、請求項6記載のコンテンツ処理装置において、前記クエリー変換部は、抽出した代表キーワードを用い、ユーザが選択したキーワードであるクエリーを、前記インデックスデータベースに格納されたインデックスで扱われている形式に変換し、ユーザのクエリーとウェブページの間の類似度を計算できるようにする。   The invention according to claim 8 is the content processing apparatus according to claim 6, wherein the query conversion unit uses the extracted representative keyword to store a query that is a keyword selected by a user in the index database. Convert to the format handled by the index so that the similarity between the user's query and the web page can be calculated.

また、請求項9にかかる発明は、請求項6記載のコンテンツ処理装置において、前記第1の類似度計算部は、インデックスで扱われているクエリー又はウェブページの表現形式を用い、ユーザのクエリーに対し、それぞれのウェブページの類似度を計算する。   The invention according to claim 9 is the content processing apparatus according to claim 6, wherein the first similarity calculation unit uses a query or a Web page expression format that is handled by an index to a user query. On the other hand, the similarity of each web page is calculated.

また、請求項10にかかる発明は、請求項6記載のコンテンツ処理装置において、前記ランキング生成部は、計算した類似度に基づいて、ユーザのクエリーに対し、類似度が高いものから順にウェブページをランキングする。   According to a tenth aspect of the present invention, in the content processing device according to the sixth aspect, the ranking generation unit generates web pages in descending order of similarity with respect to a user query based on the calculated similarity. Ranking.

また、請求項11にかかる発明は、請求項1記載のコンテンツ処理装置において、前記クラスタリング部は、前記インデックスデータベースに格納されたインデックスを用い、それぞれのウェブページ間の相対類似度を計算する第2の類似度計算部と、この第2の類似度計算部で計算した相対類似度を用い、それぞれのウェブページの検索結果に対するクラスタリングされた検索結果を生成するクラスタ生成部と、を備えている。   According to an eleventh aspect of the present invention, there is provided the content processing apparatus according to the first aspect, wherein the clustering unit calculates the relative similarity between the respective web pages using an index stored in the index database. And a cluster generation unit that generates a clustered search result for each web page search result using the relative similarity calculated by the second similarity calculation unit.

また、請求項12にかかる発明は、請求項11記載のコンテンツ処理装置において、前記第2の類似度計算部は、インデックスで扱われているウェブページの表現形式を用い、それぞれのウェブページのペアの相対類似度を計算する。   According to a twelfth aspect of the present invention, in the content processing device according to the eleventh aspect, the second similarity calculation unit uses a web page expression format handled by the index, and each web page pair. Calculate the relative similarity of.

また、請求項13にかかる発明は、請求項1記載のコンテンツ処理装置において、前記クラスタリング表示部は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して拡大表示させる。   The invention according to claim 13 is the content processing apparatus according to claim 1, wherein when the user selects a web page and zooms in, the clustering display unit belongs to the same cluster as the web page selected by the user. Is enlarged and displayed in conjunction with the selected web page.

また、請求項14にかかる発明は、請求項1記載のコンテンツ処理装置において、前記クラスタリング表示部は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して縮小表示させる。   The invention according to claim 14 is the content processing apparatus according to claim 1, wherein when the user selects a web page and zooms in, the clustering display unit belongs to the same cluster as the web page selected by the user. Is reduced and displayed in conjunction with the selected web page.

また、請求項15にかかる発明は、請求項1記載のコンテンツ処理装置において、前記クラスタリング表示部は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して拡大表示させ、かつ、異なるクラスタに属するウェブページを連動して縮小表示させる。   The invention according to claim 15 is the content processing apparatus according to claim 1, wherein when the user selects a web page and zooms in, the clustering display unit belongs to the same cluster as the web page selected by the user. Are enlarged and displayed in conjunction with the selected web page, and web pages belonging to different clusters are reduced and displayed in conjunction with each other.

また、請求項16にかかる発明のコンテンツ処理プログラムは、検索要求に従って検索されて順位付けされた結果であるウェブページ群を受け付けるウェブページ検索結果受付機能と、このウェブページ検索結果受付機能により受け付けた検索結果の前記ウェブページ群をクラスタリングするクラスタリング機能と、このクラスタリング機能によりクラスタリングされたウェブページの検索結果について、同一画面内での詳細度変化や表示メディア遷移を属するクラスタ単位で連続的に実現するズーミングの操作/挙動を記述するズーミング記述生成機能と、ユーザからの所定のウェブページに対するズームイン/アウト操作を受け付ける操作受付機能と、この操作受付機能により受け付けたズームイン/アウト操作に応じ、前記ズーミング記述生成機能により生成された記述に従って、クラスタリングされたウェブページの検索結果を操作されたウェブページが属するクラスタ単位で詳細度変化や表示メディア遷移させて表示するクラスタリング表示機能と、をコンピュータに実行させる。   The content processing program according to the sixteenth aspect of the invention is received by a web page search result receiving function for receiving a web page group as a result of being searched and ranked according to a search request, and the web page search result receiving function. A clustering function for clustering the web page group of search results and a search result of web pages clustered by the clustering function are continuously realized in units of clusters belonging to the same screen in detail level changes and display media transitions. A zooming description generation function for describing a zooming operation / behavior, an operation reception function for receiving a zoom-in / out operation for a predetermined web page from a user, and the zooming according to the zoom-in / out operation received by the operation reception function In accordance with the description generated by the description generation function, the computer executes a clustering display function for displaying the search result of the clustered web page by changing the detail level or changing the display medium in units of clusters to which the operated web page belongs. .

また、請求項17にかかる発明は、請求項16記載のコンテンツ処理プログラムにおいて、ウェブページのテキストに対し、ウェブページのインデックスを生成してインデックスデータベースに格納するインデックシング機能と、前記インデックスデータベースに格納されたインデックスを用い、ユーザのクエリーに対するウェブページの検索結果を生成するランキング機能と、を更にコンピュータに実行させ、前記ウェブページ検索結果受付機能は、前記ランキング機能による検索結果の前記ウェブページ群を受け付ける。   Further, the invention according to claim 17 is the content processing program according to claim 16, wherein an indexing function for generating an index of the web page for the text of the web page and storing it in the index database, and storing in the index database A ranking function for generating a web page search result for the user's query using the index, and the web page search result reception function is configured to determine the web page group of the search result by the ranking function. Accept.

また、請求項18にかかる発明は、請求項17記載のコンテンツ処理プログラムにおいて、前記インデックシング機能は、ウェブページのテキストから代表的なキーワードを抽出するキーワード抽出機能と、このキーワード抽出機能で抽出したキーワードに基づいて、ウェブページのインデックスを生成するインデックス生成機能と、をコンピュータに実行させる。   According to an eighteenth aspect of the present invention, in the content processing program according to the seventeenth aspect, the indexing function is extracted by a keyword extracting function for extracting a representative keyword from a text of a web page and the keyword extracting function. An index generation function for generating an index of a web page based on a keyword is executed by a computer.

また、請求項19にかかる発明は、請求項17記載のコンテンツ処理プログラムにおいて、前記ランキング機能は、抽出した代表的なキーワードの中から、ユーザが一つ又は複数のキーワードを選択できるようにするクエリー入力機能と、ユーザが選択したキーワードであるクエリーをインデックスと同じ形式に変換するクエリー変換機能と、前記インデックスデータベースに格納されたインデックスを用い、それぞれのウェブページのクエリーに対する類似度を計算する第1の類似度計算機能と、この第1の類似度計算機能で計算した類似度に基づいて、ユーザのクエリーに対するウェブページの検索結果を生成するランキング生成機能と、をコンピュータに実行させる。   The invention according to claim 19 is the content processing program according to claim 17, wherein the ranking function allows the user to select one or more keywords from the extracted representative keywords. First, a query conversion function for converting a query, which is a keyword selected by the user, into the same format as the index, and an index stored in the index database are used to calculate a similarity to the query of each web page. And a ranking generation function for generating a web page search result for the user's query based on the similarity calculated by the first similarity calculation function.

また、請求項20にかかる発明は、請求項16記載のコンテンツ処理プログラムにおいて、前記クラスタリング機能は、前記インデックスデータベースに格納されたインデックスを用い、それぞれのウェブページ間の相対類似度を計算する第2の類似度計算機能と、この第2の類似度計算機能で計算した相対類似度を用い、それぞれのウェブページの検索結果に対するクラスタリングされた検索結果を生成するクラスタ生成機能と、をコンピュータに実行させる。   The invention according to claim 20 is the content processing program according to claim 16, wherein the clustering function uses an index stored in the index database to calculate a relative similarity between the respective web pages. And a cluster generation function for generating a clustered search result for each web page search result using the relative similarity calculated by the second similarity calculation function. .

また、請求項21にかかる発明は、請求項16記載のコンテンツ処理プログラムにおいて、前記クラスタリング表示機能は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して拡大表示させる。   The invention according to claim 21 is the content processing program according to claim 16, wherein when the user selects a web page and zooms in, the cluster page display function belongs to the same cluster as the web page selected by the user. Is enlarged and displayed in conjunction with the selected web page.

また、請求項22にかかる発明は、請求項16記載のコンテンツ処理プログラムにおいて、前記クラスタリング表示機能は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して縮小表示させる。   According to a twenty-second aspect of the present invention, in the content processing program according to the sixteenth aspect, when the user selects a web page and zooms in, the cluster page display function belongs to the same cluster as the web page selected by the user. Is reduced and displayed in conjunction with the selected web page.

また、請求項23にかかる発明は、請求項16記載のコンテンツ処理プログラムにおいて、前記クラスタリング表示機能は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して拡大表示させ、かつ、異なるクラスタに属するウェブページを連動して縮小表示させる。   The invention according to claim 23 is the content processing program according to claim 16, wherein when the user selects a web page and zooms in, the cluster page display function belongs to the same cluster as the web page selected by the user. Are enlarged and displayed in conjunction with the selected web page, and web pages belonging to different clusters are reduced and displayed in conjunction with each other.

また、請求項24にかかる発明のコンテンツ処理方法は、ウェブページの検索結果を生成して出力するコンテンツ処理装置におけるコンテンツ処理方法であって、検索要求に従って検索されて順位付けされた結果であるウェブページ群を受け付けるウェブページ検索結果受付工程と、このウェブページ検索結果受付工程により受け付けた検索結果の前記ウェブページ群をクラスタリングするクラスタリング工程と、このクラスタリング工程によりクラスタリングされたウェブページの検索結果について、同一画面内での詳細度変化や表示メディア遷移を属するクラスタ単位で連続的に実現するズーミングの操作/挙動を記述するズーミング記述生成工程と、ユーザからの所定のウェブページに対するズームイン/アウト操作を受け付ける操作受付工程と、この操作受付工程により受け付けたズームイン/アウト操作に応じ、前記ズーミング記述生成工程により生成された記述に従って、クラスタリングされたウェブページの検索結果を操作されたウェブページが属するクラスタ単位で詳細度変化や表示メディア遷移させて表示するクラスタリング表示工程と、を含む。   A content processing method according to a twenty-fourth aspect of the present invention is a content processing method in a content processing apparatus that generates and outputs a search result of a web page, and is a result of searching and ranking according to a search request. Web page search result reception process for receiving a page group, a clustering process for clustering the web page group of search results received by the web page search result reception process, and a search result for the web pages clustered by the clustering process, A zooming description generation process that describes a zooming operation / behavior that continuously realizes a change in level of detail and display media transition within the same screen in units of clusters, and a zoom-in / out operation for a predetermined web page from a user is accepted. operation In accordance with the description generated by the zooming description generation step according to the appending step and the zoom-in / out operation received by the operation reception step, the search results of the clustered web pages are detailed in cluster units to which the operated web page belongs. And a clustering display step of displaying by changing the degree of change and display media.

本発明によれば、閲覧の文脈を保持しつつ、何度も検索する手間を省いて効率的に情報検索を実行することができるとともに、特に複数の異なるクラスタに属する項目が混在した場合に、所望のクラスタに属する項目を見つけやすくすることができるという効果を奏する。   According to the present invention, while maintaining the browsing context, it is possible to efficiently perform an information search without the need to search many times, and particularly when items belonging to a plurality of different clusters are mixed, There is an effect that an item belonging to a desired cluster can be easily found.

以下に添付図面を参照して、この発明にかかるコンテンツ処理装置、コンテンツ処理プログラムおよびコンテンツ処理方法の最良な実施の形態を詳細に説明する。   Exemplary embodiments of a content processing apparatus, a content processing program, and a content processing method according to the present invention are explained in detail below with reference to the accompanying drawings.

本発明の実施の一形態を図1ないし図20に基づいて説明する。   An embodiment of the present invention will be described with reference to FIGS.

[1.Web環境でのコンテンツ閲覧における画面遷移の概要]
最初に、本発明の前提となるWeb環境でのコンテンツ閲覧における画面遷移の概要について説明する。
[1. Overview of screen transitions when browsing content in the Web environment]
First, an outline of screen transition in content browsing in a Web environment that is a premise of the present invention will be described.

本実施の形態においては、Web環境でのコンテンツ閲覧効果を高めることを目的に、Web環境におけるコンテンツに対し、ズーミングを利用して詳細度の変化だけでなく、表示メディアの遷移を実現できる「ズーミング・クロスメディア」を適用するようにしたものである。   In the present embodiment, for the purpose of enhancing the content browsing effect in the Web environment, “zooming” that can realize not only the change in the detail level but also the transition of the display media using the zooming for the content in the Web environment.・ Cross media ”is applied.

「ズーミング・クロスメディア」は、ズーム操作を、スクロール、アンカークリックに対する第3の操作と位置づけることにある。スクロールは同一画面内で注視点を連続的に移動させ、アンカークリックは異なる画面に飛ぶのに対し、ズーミング・クロスメディアは同一画面内で詳細度変化や表示メディア遷移を連続的に実現する。表示メディア遷移とは、相互に関連づけられた互いに異なるメディアオブジェクトに関し、ズーム操作に従って、一方から他方へ表示を連続的に変化させたり、一方を表示した状態に加えてもう一方を連続的に拡大しつつ追加表示させたり(もしくはその逆)することである。動画像に関連付けられた字幕テキストを表示するに際し、動画像のみの表示から、ズーミング操作と共に次第に字幕テキストに移り変わっていく、というようなものがその一例である。   “Zooming cross media” is to position the zoom operation as a third operation for scrolling and anchor clicking. While scrolling moves the point of interest continuously within the same screen and anchor clicks fly to different screens, zooming / cross media continuously realizes changes in detail and display media transitions within the same screen. Display media transition refers to media objects that are related to each other, and according to the zoom operation, the display is continuously changed from one to the other, or the other is continuously displayed and the other is continuously enlarged. It is to make additional display while vice versa (or vice versa). For example, when subtitle text associated with a moving image is displayed, it is gradually changed from subtitle text display to subtitle text with a zooming operation.

このようなズーミング操作/挙動は、ズーム対象、ズーム率、ズーム伝播の3つの基本概念を基にモデル化されている。
1.ズーム対象
「ズーム対象」はズーム操作の対象となる単位で、コンテンツを構成するテキスト、静止画像、動画像、音声の各「メディアオブジェクト」から構成される。閲覧者は所望のズーム対象を指定してズーム操作を行う。
2.ズーム率
「ズーム率」はズーム対象に対して一意的に定まる値で、ズームの程度を表す0.0以上1.0以下の連続値である。ズーム率が大きくなる方向にズーミングすることをズームイン、小さくなる方向にズーミングすることをズームアウトという。各メディアオブジェクトに対し、ズーム率は具体的な属性(フォントサイズ、画像サイズ、動画像や音声の再生区間等)に対応付けられる。
3.ズーム伝播
「ズーム伝播」はあるズーム対象をズーミングすると他のズーム対象も連動してズーミングすることである。ズーム伝播では、伝播元ズーム対象のズーム率から、予め定められた「ズーム率関係」を基に伝播先のズーム率を計算し、伝播先ズーム対象の表示の状態を制御する。ズーム率関係は伝播元と伝播先のズーム率の変化の比率である。
Such zooming operation / behavior is modeled on the basis of three basic concepts of zoom target, zoom rate, and zoom propagation.
1. Zoom Target “Zoom Target” is a unit that is a target of zoom operation, and is composed of “media objects” of text, still images, moving images, and audio that constitute the content. A viewer designates a desired zoom target and performs a zoom operation.
2. Zoom rate “Zoom rate” is a value uniquely determined for a zoom target, and is a continuous value between 0.0 and 1.0 that represents the degree of zoom. Zooming in the direction of increasing the zoom rate is called zooming in and zooming out in the direction of decreasing the zoom rate. For each media object, the zoom rate is associated with specific attributes (font size, image size, moving image or audio playback section, etc.).
3. Zoom Propagation “Zoom Propagation” means that when a zoom target is zoomed, other zoom targets are also zoomed together. In zoom propagation, the zoom ratio of the propagation destination is calculated from the zoom ratio of the propagation source zoom object based on a predetermined “zoom ratio relationship”, and the display state of the propagation destination zoom object is controlled. The zoom rate relationship is the ratio of change in the zoom rate between the propagation source and the propagation destination.

ここで、ズーム率関係がプラスの値の場合のズームの伝播の例について説明する。図1ないし図3は、Web環境でのコンテンツ閲覧における画面遷移例を示す説明図である。図1は、ディスプレイに表示されるWeb環境でのコンテンツの一例を示す正面図である。図1に示す例は、Web環境でのコンテンツとして「出張報告」を適用した例である。図1に示すWeb環境でのコンテンツは、オブジェクトとしてテキストを主体に構成されている。   Here, an example of zoom propagation when the zoom ratio relationship is a positive value will be described. 1 to 3 are explanatory diagrams showing examples of screen transition in content browsing in a Web environment. FIG. 1 is a front view showing an example of content in a Web environment displayed on a display. The example shown in FIG. 1 is an example in which “business trip report” is applied as content in the Web environment. The content in the Web environment shown in FIG. 1 is mainly composed of text as an object.

図1に示すWeb環境でのコンテンツのオブジェクトAに対してズームイン操作を行った結果を図2に示す。図2に示すように、Web環境でのコンテンツのオブジェクトAに対してズームイン操作を行った場合、オブジェクトAの下位のオブジェクトBが新たに表示されるとともに、新たなオブジェクトCがオブジェクトBの下部分に表示される。ここで、新たなオブジェクトCは、オブジェクトAに関連する討議がなされていた時点での討議風景を撮影した動画像の静止状態の画像である。   FIG. 2 shows the result of zooming in on the content object A in the Web environment shown in FIG. As shown in FIG. 2, when the zoom-in operation is performed on the object A of the content in the Web environment, the object B below the object A is newly displayed, and the new object C is the lower part of the object B. Is displayed. Here, the new object C is a still image of a moving image in which the discussion scene at the time when the discussion related to the object A was made.

さらに、図2に示すWeb環境でのコンテンツのオブジェクトAに対してズームイン操作を行った結果を図3に示す。図3に示すように、Web環境でのコンテンツのオブジェクトAに対してズームイン操作を行った場合、オブジェクトA,Bのフォントサイズが拡大される。加えて、図3に示すように、Web環境でのコンテンツのオブジェクトAに対してズームイン操作を行った場合、オブジェクトCである静止画像の詳細度が高くなる(画像サイズが拡大する)。さらに、オブジェクトCは、あるサイズにまで拡大すると、動画像(と音声)の再生を開始する。   Further, FIG. 3 shows the result of performing a zoom-in operation on the content object A in the Web environment shown in FIG. As shown in FIG. 3, when the zoom-in operation is performed on the object A of the content in the Web environment, the font sizes of the objects A and B are enlarged. In addition, as shown in FIG. 3, when the zoom-in operation is performed on the object A of the content in the Web environment, the detail level of the still image that is the object C is increased (the image size is increased). Furthermore, when the object C is enlarged to a certain size, reproduction of a moving image (and sound) is started.

このようなWeb環境でのコンテンツ閲覧における画面遷移は、以下に示すような表示記述(構造記述及びズーミング記述)で記述されている。なお、構造記述及びズーミング記述は、XML(Extensible Markup Language)ベースのズーミング記述言語(ZDL:Zooming Description Language )で記述されている。   The screen transition in content browsing in such a Web environment is described in the following display description (structure description and zooming description). The structure description and the zooming description are described in an XML (Extensible Markup Language) based zooming description language (ZDL).

ここで、ズーミング記述について、以下に簡単な例を挙げて説明する。   Here, the zooming description will be described below with a simple example.

1.メディアオブジェクトの指定
テキスト、静止画像、動画像、音声のそれぞれについて、<text/>,<img/>,<video/>,<audio/>のタグで表す。このタグにより、具体的なテキストの内容やソースファイルを指定する。
(例1)
<text id=text1>これはテキストです。</text>
<img id=img1 src="img1.jpg"/>
<video id=video1 src="video1.mpg"/>
<audio id=audio1 src="audio1.wav"/>
1. Designation of media object Each of text, still image, moving image, and audio is represented by tags of <text />, <img />, <video />, and <audio />. This tag specifies the specific text content or source file.
(Example 1)
<text id = text1> This is text. </ text>
<img id = img1 src = "img1.jpg"/>
<video id = video1 src = "video1.mpg"/>
<audio id = audio1 src = "audio1.wav"/>

2.ズーム率の範囲
<div/>タグ内のzoomFactor属性にて、ズーム率の最大値、最小値を指定し、連続パラメータとしてのズーム率の範囲を表す。
(例2)
<div zoomFactor="0.0 0.5"/>
2. Zoom rate range
In zoomFactor attribute in the <div /> tag, specify the maximum and minimum values of the zoom factor and represent the range of the zoom factor as a continuous parameter.
(Example 2)
<div zoomFactor = "0.0 0.5"/>

3.メディアオブジェクトの表示
テキスト、静止画像、動画像、音声のそれぞれについて、<dispText>,<dispImg>,<dispVideo>,<dispAudio>タグで表す。常に<div/>タグに内包され、<div/>タグで指定された範囲のズーム率における各メディアオブジェクトの表示の状態を表す。
(例3−1)
<div zoomFactor="0.0 0.5">
<dispText id="disptext1" textId="text1" fontSize="10pt 14pt"/>
</div>
上記の意味は、<text/>タグにてtext1で指定されたテキストを、ズーム率が0.0のときは10ptで、ズーム率が0.5のときは14ptでそれぞれ表示し、その間はなるべくなめらかにフォントサイズを変化させるというものである。
(例3−2)
<div zoomFactor="0.0 0.5">
<dispImg id="dispimg1" imgId="img1" imgSize="10% 50%"/>
</div>
上記の意味は、<img/>タグにてimg1で指定された静止画像を、ズーム率が0.0のときは最大サイズの10%で、ズーム率が0.5のときは50%でそれぞれ表示し、その間はなるべくなめらかにサイズを変化させるというものである。
(例3−3)
<div zoomFactor="0.0 0.5">
<dispVideo id="dispvideo1" videoId="video1" start="0" end="300" videoSize="10% 50%"/>
</div>
上記の意味は、<video/>タグにてvideo1で指定された動画像の第0フレームから300フレームまでを、ズーム率が0.0のときは最大サイズの10%で,ズーム率が0.5のときは50%でそれぞれ表示し、その間はなるべくなめらかにサイズを変化させるというものである。
(例3−4)
<div zoomFactor="0.0 0.5">
<dispAudio id="dispaudio1"audioId="audio1"start="0s"end="30s"/>
</div>
上記の意味は、<audio/>タグにてaudio1で指定された音声の最初から30秒までを、ズーム率が0.0から0.5の間再生するというものである。
3. Display of media object Each text, still image, moving image, and audio is represented by <dispText>, <dispImg>, <dispVideo>, and <dispAudio> tags. It is always included in the <div /> tag, and represents the display state of each media object at the zoom ratio in the range specified by the <div /> tag.
(Example 3-1)
<div zoomFactor = "0.0 0.5">
<dispText id = "disptext1" textId = "text1" fontSize = "10pt 14pt"/>
</ div>
The above means that the text specified by text1 in the <text /> tag is displayed as 10pt when the zoom factor is 0.0 and 14pt when the zoom factor is 0.5, and the font size is as smooth as possible during that time. Is to change.
(Example 3-2)
<div zoomFactor = "0.0 0.5">
<dispImg id = "dispimg1" imgId = "img1" imgSize = "10% 50%"/>
</ div>
The above means that the still image specified by img1 in the <img /> tag is displayed at 10% of the maximum size when the zoom factor is 0.0, and 50% when the zoom factor is 0.5. Is to change the size as smoothly as possible.
(Example 3-3)
<div zoomFactor = "0.0 0.5">
<dispVideo id = "dispvideo1" videoId = "video1" start = "0" end = "300" videoSize = "10% 50%"/>
</ div>
The above means that the 0th to 300th frame of the video specified by video1 in the <video /> tag is 10% of the maximum size when the zoom ratio is 0.0, and when the zoom ratio is 0.5 Each is displayed at 50%, and the size is changed as smoothly as possible.
(Example 3-4)
<div zoomFactor = "0.0 0.5">
<dispAudio id = "dispaudio1" audioId = "audio1" start = "0s" end = "30s"/>
</ div>
The above meaning is that the first 30 seconds of the audio specified by audio1 in the <audio /> tag is reproduced during the zoom ratio of 0.0 to 0.5.

4.ズーム対象
ズーム対象を<zoomObject/>タグで記述する。初期ズーム率やズーム伝播先のズーム対象、ズーム率関係もタグ内の属性で記述する。<div/>もしくは他の<zoomObject/>のいずれかを必ず内包する。
4). Zoom target Describe the zoom target with the <zoomObject /> tag. The initial zoom rate, the zoom target of the zoom propagation destination, and the zoom rate relationship are also described with attributes in the tag. Be sure to include either <div /> or other <zoomObject />.

以下に、図1ないし図3に示す画面遷移例についての構造記述及びズーミング記述を示す。なお、以下においては、コンテンツの構造記述とズーミングの操作/挙動に関するズーミング記述を分けて記述している(>
(コンテンツの構造記述)
<zoomObject id="zoom1"> <text id="text1">1. 新教材の改善点について</text>
<text id="text2">参加者から教材の中身について意見を出してもらう。</text>
<zoomObject id="zoom2" > <text id="text3">新しいものを次々に出していくにはどうすればよいか、
何度も使ってもらえるようにするにはどうすればよいか(問題提起)</text>
<zoomObject id="zoom3" > <text id="text4">開発はもう少し短いスパンで作っていく必要がある。</text>
<text id="text5">3ヶ月毎にアップデートしていくつもり。</text>
.......
</zoomObject>
<zoomObject id="zoom4" > <video id="video1" src="会議11.mpg"/>
</zoomObject>
</zoomObject>
<zoomObject id="zoom5" > <text id="text10">ステップ6の通訳者メモについて初めて.….</text>
.......
</zoomObject>
.......
</zoomObject>

(ズーミングの操作/挙動に関するズーミング記述)
<zoomObject id="zoom1" initZoomFactor="0.0" relatedTo="children:0.8">
<div zoomFactor="0.0 1.0">
<dispText id="disptext1" textId="text1" textSize="12pt 14pt"/>
<dispText id="disptext2" textId="text2" textSize="12pt 14pt"/>
</div>
</zoomObject>

<zoomObject id="zoom2" initZoomFactor="0.0" relatedTo="children:0.8">
<div zoomFactor="0.0 1.0">
<dispText id="disptext5" textId="text3" textSize="11pt"/>
</div>
</zoomObject>

<zoomObject id="zoom3" initZoomFactor="0.0" relatedTo="brother:-0.5">
<div zoomFactor="0.1 1.0">
<dispText id="disptext6" textId="text4" textSize="8pt 10pt"/>
<dispText id="disptext7" textId="text5" textSize="8pt 10pt"/>
.......
</div>
</zoomObject>

<zoomObject id="zoom4" initZoomFactor="0.0" relatedTo="brother:-0.5">
<div zoomFactor="0.1 0.4">
<dispVideo id="dispvideo1" videoId="video1" start="0" end="0" videoSize="20% 50%"/>
</div>
<div zoomFactor="0.4 1.0">
<dispVideo id="dispvideo2" videoId="video1" start="0" end="900" videoSize="50% 100%"/>
</div>
</zoomObject>
The structure description and zooming description for the screen transition examples shown in FIGS. 1 to 3 are shown below. In the following description, the structure description of the content and the zooming description regarding the zooming operation / behavior are described separately ( indicates that the description is only for the structure).

(Content structure description)
<zoomObject id = "zoom1"
<text id = "text1"> 1. Improvements of new teaching materials </ text>
<text id = "text2"> Ask participants to give feedback on the content of the material. </ text>
<zoomObject id = "zoom2"
<text id = "text3"> How can I get new things out one after another,
How can I get it used over and over again (problem) </ text>
<zoomObject id = "zoom3"
<text id = "text4"> Development needs to be made in a slightly shorter span. </ text>
<text id = "text5"> I will update every 3 months. </ text>
.......
</ zoomObject>
<zoomObject id = "zoom4"
<video id = "video1" src = "meeting 11.mpg"/>
</ zoomObject>
</ zoomObject>
<zoomObject id = "zoom5"
<text id = "text10"> First time with interpreter memo in step 6 .... </ text>
.......
</ zoomObject>
.......
</ zoomObject>

(Zooming description for zooming operation / behavior)
<zoomObject id = "zoom1" initZoomFactor = "0.0" relatedTo = "children: 0.8">
<div zoomFactor = "0.0 1.0">
<dispText id = "disptext1" textId = "text1" textSize = "12pt 14pt"/>
<dispText id = "disptext2" textId = "text2" textSize = "12pt 14pt"/>
</ div>
</ zoomObject>

<zoomObject id = "zoom2" initZoomFactor = "0.0" relatedTo = "children: 0.8">
<div zoomFactor = "0.0 1.0">
<dispText id = "disptext5" textId = "text3" textSize = "11pt"/>
</ div>
</ zoomObject>

<zoomObject id = "zoom3" initZoomFactor = "0.0" relatedTo = "brother: -0.5">
<div zoomFactor = "0.1 1.0">
<dispText id = "disptext6" textId = "text4" textSize = "8pt 10pt"/>
<dispText id = "disptext7" textId = "text5" textSize = "8pt 10pt"/>
.......
</ div>
</ zoomObject>

<zoomObject id = "zoom4" initZoomFactor = "0.0" relatedTo = "brother: -0.5">
<div zoomFactor = "0.1 0.4">
<dispVideo id = "dispvideo1" videoId = "video1" start = "0" end = "0" videoSize = "20% 50%"/>
</ div>
<div zoomFactor = "0.4 1.0">
<dispVideo id = "dispvideo2" videoId = "video1" start = "0" end = "900" videoSize = "50% 100%"/>
</ div>
</ zoomObject>

このコンテンツの構造記述によれば、最上位にzoom1があり、その下位にzoom2、zoom5他が、さらにzoom2の下位にzoom3、zoom4がある。そして、zoom3は複数のテキスト(text4、text5他)から、zoom4は1つの動画像(video1)からそれぞれ構成されている。   According to the structure description of this content, zoom1 is at the top, zoom2, zoom5, etc. are below it, and zoom3, zoom4 are further below zoom2. Zoom3 is composed of a plurality of texts (text4, text5, etc.), and zoom4 is composed of one moving image (video1).

また、ズーミングの操作/挙動に関するズーミング記述によれば、zoom1、zoom2、zoom3、zoom4いずれも初期ズーム率が0.0であるが、前2者は最初からテキスト(text1、text2、text3)が表示されるのに対し、後2者は何も表示されない(これは、図1の初期状態に対応している)。   Also, according to the zooming description regarding zooming operation / behavior, zoom1, zoom2, zoom3, and zoom4 all have an initial zoom ratio of 0.0, but the first two display text (text1, text2, text3) from the beginning. On the other hand, nothing is displayed for the latter two (this corresponds to the initial state of FIG. 1).

ここで、zoom2をズームインすると、それが子階層のズーム対象に伝播する(relatedTo="children: 0.8"はズーム率関係0.8で子階層全てにズーム伝播することを表す)。zoom2のズーム率の増加に対してzoom3、zoom4のズーム率がその0.8の変化率で増加し(zoom2のズーム率が+0.5変化するとzoom3、zoom4はそれぞれ+0.4変化する)、0.1に達した時点でtext4、text5他とvideo1がそれぞれ表示される(図2参照)。これは、テキスト情報に加えて動画像情報が加わっているので、メディア拡張の例である。ただし、video1についてはここではまだフレーム0のみが静止状態で表示される。   Here, when zoom2 is zoomed in, it propagates to the zoom target of the child hierarchy (relatedTo = "children: 0.8" indicates that the zoom propagates to all the child hierarchies with a zoom ratio of 0.8). When zoom2 zoom ratio increases, zoom3 and zoom4 zoom ratios increase by 0.8 (when zoom2 zoom ratio changes +0.5, zoom3 and zoom4 change +0.4, respectively) and reach 0.1 Then, text4, text5, etc. and video1 are displayed (see FIG. 2). This is an example of media expansion because moving image information is added to text information. However, for video1, only frame 0 is still displayed here.

この状態からさらにzoom2をズームインしていくと、zoom3、zoom4のズーム率もさらに増加し、text4、text5他のフォントサイズは拡大する。同時にvideo1の表示サイズも拡大し、zoom4のズーム率が0.4に達した時点でvideo1のフレーム0から900までが再生される(図3、詳細度変化の例)。   If zoom2 is zoomed in further from this state, the zoom rate of zoom3 and zoom4 will also increase, and the font size of text4, text5 and other will increase. At the same time, the display size of video1 is enlarged, and when zoom4 of zoom4 reaches 0.4, frames 0 to 900 of video1 are reproduced (FIG. 3, example of change in detail).

なお、図3の状態でzoom2をズームアウトすると、ズームインの場合とは逆にzoom3、zoom4も一緒にズームアウトして図2の状態になり、それぞれのズーム率が0.1以下になるとtext4、text5他とvideo1が画面から消えて図1の状態に戻る。あるいは、強制的に初期状態に戻す操作をすると、いかなる表示状態からであっても、図1の状態に戻る。   If zoom2 is zoomed out in the state shown in FIG. 3, zoom3 and zoom4 are zoomed out together to the state shown in FIG. 2 contrary to the case of zooming in. When each zoom ratio becomes 0.1 or less, text4, text5, etc. And video1 disappear from the screen and return to the state of FIG. Alternatively, if the operation is forcibly returned to the initial state, the state shown in FIG. 1 is restored from any display state.

次に、ズーム率関係がマイナスの値の場合のズームの伝播の例について説明する。   Next, an example of zoom propagation when the zoom ratio relationship is a negative value will be described.

図4は、Web環境でのコンテンツ閲覧における画面遷移例を示す説明図である。図3に示すWeb環境でのコンテンツのオブジェクトBに対してズームイン操作を行った結果を図4に示す。図4に示すように、Web環境でのコンテンツのオブジェクトBに対してズームイン操作を行った場合、オブジェクトBのフォントサイズが拡大されているが、オブジェクトCの表示サイズは縮小する。   FIG. 4 is an explanatory diagram showing an example of screen transition in content browsing in the Web environment. FIG. 4 shows the result of zooming in on the content object B in the Web environment shown in FIG. As shown in FIG. 4, when the zoom-in operation is performed on the object B of the content in the Web environment, the font size of the object B is enlarged, but the display size of the object C is reduced.

前述したズーミングの操作/挙動に関するズーミング記述においては、zoom3、zoom4にはいずれも
relatedTo="brother: -0.5"
という記述がある。これは、共通の親を持つズーム対象間でズーム伝播が起こることを表している。ズーム率関係がマイナスの値であるのは、一方をズームインすると他方がズームアウトすることを示す。よって、図3の状態からzoom3のみを選択してズームインすると、zoom4がズームアウトする(text4、text5他はさらに拡大し、video1は逆に縮小することになる(図4参照))。
In the zooming description regarding the zooming operation / behavior described above, both zoom3 and zoom4
relatedTo = "brother: -0.5"
There is a description. This indicates that zoom propagation occurs between zoom targets having a common parent. A negative zoom ratio relationship indicates that zooming in on one zooms out the other. Therefore, if only zoom3 is selected from the state of FIG. 3 and zoomed in, zoom4 is zoomed out (text4, text5, etc. are further enlarged, and video1 is conversely reduced (see FIG. 4)).

以上が、Web環境でのコンテンツ閲覧における画面遷移の概要である。このような関係を簡単な具体例で表現したものが図5である。図5の例では、A,B,Cがズーム対象で括弧内は初期状態のズーム率を表す。矢印はズームの伝播関係を表し、そのそばに付された値はズーム率関係である。ABのズーム率関係は0.5なので、A→Bとズーム伝播する際、Aをズームインしてズーム率が0.0→0.8と変化すると、Bのズーム率が0.0→0.4と変化する。BとCは相互にズーム伝播するが変化の比率がマイナス(-1.0)なので、一方をズームインすると他方はズームアウトする。例えば、初期状態はC(動画像)のみ表示で、B(テキスト+音声)をズームインして拡大していくと、C(動画像)は次第に縮小する。この例のように、ズーム伝播を導入することで、表示メディアの遷移が容易に実現できるのが本モデリングの特徴である。   The above is the outline of the screen transition in content browsing in the Web environment. FIG. 5 shows such a relationship in a simple specific example. In the example of FIG. 5, A, B, and C are zoom targets, and the parentheses indicate the zoom ratio in the initial state. An arrow represents a zoom propagation relationship, and a value attached to the arrow indicates a zoom rate relationship. Since the zoom ratio relationship of AB is 0.5, when zooming in from A to B and zooming in A and changing the zoom ratio from 0.0 to 0.8, the zoom ratio of B changes from 0.0 to 0.4. B and C propagate in zoom with each other but the rate of change is negative (-1.0), so zooming in on one zooms out on the other. For example, in the initial state, only C (moving image) is displayed, and when B (text + sound) is zoomed in and enlarged, C (moving image) is gradually reduced. As in this example, the feature of this modeling is that transition of display media can be easily realized by introducing zoom propagation.

上述したようなズーミング記述によれば、一のメディアオブジェクト(テキスト、静止画像、動画像、音声等)をズーミングするとそれに連動して他のメディアオブジェクト(テキスト、静止画像、動画像、音声等)がズーミングするズーム対象間のズームの伝播を記述可能であることにより、一のズーム対象から他のズーム対象へ向けての自然なズーミングを行なうことができる。   According to the zooming description as described above, when one media object (text, still image, moving image, audio, etc.) is zoomed, other media objects (text, still image, moving image, audio, etc.) are linked with it. Since it is possible to describe zoom propagation between zooming objects to be zoomed, natural zooming from one zoom object to another zoom object can be performed.

[2.コンテンツ処理装置の説明]
本実施の形態は、Web環境におけるコンテンツとして検索エンジン(例えば、ロボット検索エンジン)によるWebページの検索結果一覧を適用し、このWebページの検索結果一覧をズーミング記述言語(ZDL)の形式で出力することができるコンテンツ処理装置に適用したものである。
[2. Description of content processing apparatus]
In this embodiment, a search result list of a Web page by a search engine (for example, a robot search engine) is applied as content in the Web environment, and the search result list of the Web page is output in a zooming description language (ZDL) format. The present invention is applied to a content processing apparatus that can

ここで、Webページとは、Webブラウザに一度に表示されるデータのまとまりで、テキストデータやHTML(あるいは、CSS(Cascading Style Sheet),XMLなど)によるレイアウト情報、文書中に埋め込まれた画像や音声、動画などから構成されるものである。   Here, a web page is a collection of data displayed at once in a web browser, text data, layout information by HTML (or CSS (Cascading Style Sheet), XML, etc.), images embedded in a document, It consists of audio, video, etc.

このようにズーミング・クロスメディアを情報検索に適用したのは、ズーミング・クロスメディアの大きな効用はコンテンツ閲覧の自由度を高めることができることであることから、固定的な表示内容や表示メディアではなくユーザの好みに応じて内容の詳細度の変化や表示メディアの遷移を制御することができる点にある。すなわち、Webページの検索結果一覧画面において、リンク先のWebページを開くことなくそれが所望の情報か否かを判断するのに必要な情報の詳細度や表示メディアは、検索対象の分野に関する閲覧者の知識、閲覧時の状況、検索対象の情報の形態等によって様々に変化すると考えられるからである。例えば、検索対象の分野になじみの深い閲覧者はタイトルだけでも判断可能だが、不案内な閲覧者の場合はより詳細なテキスト記述に加えて画像データも欲しいなどということはあり得る。時間をかけて1つ1つのリンク先を開く余裕がある場合もあれば、逆に全体的な傾向をざっと一覧したい場合もある。リンク先がテキスト主体であればその抜粋(または要約)が結果一覧画面に提示されるのが適当だが、画像を多く含むリンク先の場合は主要な画像を2,3枚表示するほうが都合良いこともある。このような様々な状況を予め想定して、複数の固定的な検索結果一覧画面を生成するのは現実的ではない。ここにおいて、複数メディアを混在/遷移させて表示でき、かつ、閲覧者の状況や好みに応じて柔軟に詳細度や表示メディアを制御できるズーミング・クロスメディアの特徴が生きてくることになる。   The reason why zooming / cross-media is applied to information retrieval in this way is that the big utility of zooming / cross-media is to increase the degree of freedom of content browsing. The change in the level of detail and the transition of display media can be controlled according to the user's preference. That is, on the search result list screen of the Web page, the detailed level of information and the display medium necessary for determining whether the link destination Web page is the desired information without opening the link destination Web page This is because it is considered to vary depending on the knowledge of the person, the situation at the time of browsing, the form of information to be searched, and the like. For example, a viewer who is familiar with the field to be searched can be determined by the title alone, but an uninformed viewer may want image data in addition to a more detailed text description. There are cases where there is room to open each link destination over time, and conversely, there is a case where it is desired to briefly list the overall trends. If the link destination is text-based, it is appropriate that the excerpt (or summary) is displayed on the result list screen, but if the link destination contains a lot of images, it is more convenient to display a few main images. There is also. It is not realistic to generate a plurality of fixed search result list screens assuming such various situations in advance. Here, the features of zooming / cross-media that can display a plurality of media in a mixed / transition manner and can flexibly control the level of detail and the display media according to the situation and preference of the viewer will come into play.

[2−1.コンテンツ処理装置を含むシステム構築例]
図6は、コンテンツ処理装置を含むシステム構築例を示す模式図である。本システムは、図6に示すように、コンテンツ処理装置であるサーバコンピュータ(以下、サーバという)1にインターネットであるネットワークNを介して端末装置であるクライアントコンピュータ(以下、クライアント端末という)Cが複数台接続されたシステムを想定する。なお、このようなネットワーク通信を伴うクライアント・サーバ方式のみに本発明は限定されないことはいうまでもない。
[2-1. Example of system construction including content processing apparatus]
FIG. 6 is a schematic diagram illustrating a system configuration example including a content processing apparatus. As shown in FIG. 6, the system includes a server computer (hereinafter referred to as a server) 1 as a content processing apparatus 1 and a plurality of client computers (hereinafter referred to as client terminals) C as terminal devices via a network N as the Internet. A system connected to a stand is assumed. Needless to say, the present invention is not limited to the client-server system involving such network communication.

コンテンツ処理装置であるサーバ1は、概略的には、インターネットであるネットワークN上の一般的なWebページを対象にキーワードに基づくWebページ検索を行い、ズーミング記述言語(ZDL)の形式でWebページの検索結果一覧を出力するものである。   The server 1 that is a content processing apparatus generally performs a Web page search based on a keyword for a general Web page on the network N that is the Internet, and stores the Web page in a zooming description language (ZDL) format. A list of search results is output.

クライアント端末Cは、一般的なパーソナルコンピュータ等であり、Webブラウザを用いることによりサーバ1とのデータ送受信が可能になっている。このクライアント端末Cは、閲覧者からのWebページのキーワード検索要求を受け付けてサーバ1に出力するとともに、サーバ1においてズーミング記述言語(ZDL)の形式で出力された閲覧者に対するWebページの検索結果一覧を解釈して表示する。すなわち、クライアント端末Cは、コンテンツ処理装置であるサーバ1に対する入出力デバイスである。   The client terminal C is a general personal computer or the like, and can transmit and receive data to and from the server 1 by using a Web browser. This client terminal C accepts a Web page keyword search request from a viewer and outputs it to the server 1, and at the same time, a search result list of Web pages for the viewer output in the zooming description language (ZDL) format on the server 1. Is interpreted and displayed. That is, the client terminal C is an input / output device for the server 1 that is a content processing apparatus.

図7は、サーバ1の構成を示すブロック図である。本実施の形態のコンテンツ処理装置であるサーバ1は、パーソナルコンピュータを主体に構成されており、情報処理を行うCPU(Central Processing Unit)2と、BIOS(Basic Input Output System)等を格納するROM(Read Only Memory)3と、情報を処理中に一時的に格納するRAM(Random Access Memory)4と、アプリケーションプログラムや処理結果等を保存する記憶部であるHDD(Hard Disk Drive)5と、情報を外部に保管又は配布し若しくは情報(アプリケーションプログラム等)を外部から入手するための記憶媒体であるリムーバブルメディア6のドライブ6aと、外部の他の電子機器と通信するためのネットワークNに接続するためのネットワークインタフェース8と、処理経過や処理結果等をユーザに表示する表示部であるディスプレイ9と、操作者がコンテンツ処理装置であるサーバ1に命令や情報等を入力するためのキーボード10やマウス11等の入力部とから構成され、これらの間のデータ通信をバスコントローラ12が調停して動作している。   FIG. 7 is a block diagram showing the configuration of the server 1. A server 1 which is a content processing apparatus according to the present embodiment is mainly composed of a personal computer, and a CPU (Central Processing Unit) 2 for performing information processing, a ROM (Basic Input Output System) for storing a BIOS (Basic Input Output System) and the like. Read Only Memory (3), RAM (Random Access Memory) 4 that temporarily stores information during processing, HDD (Hard Disk Drive) 5 that is a storage unit that stores application programs, processing results, and the like. For connecting to a drive 6a of a removable medium 6 which is a storage medium for storing or distributing outside or obtaining information (application program etc.) from the outside, and a network N for communicating with other external electronic devices A network interface 8; a display 9 that is a display unit for displaying a process progress, a process result, and the like; It consists of an input unit such as a keyboard 10 and a mouse 11 for the author to input commands, information, etc. to the server 1 which is a content processing device. The bus controller 12 arbitrates the data communication between them and operates. Yes.

なお、リムーバブルメディア6としては、フレキシブルディスク、ハードディスク、磁気テープ等のような磁気的な記憶媒体、MOのような光磁気的な記憶媒体、CD、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−R、DVD−RAM、DVD−RW、DVD+RW等のような光学的な記憶媒体、半導体メモリ等、各種の記憶媒体が適用できる。   The removable medium 6 includes a magnetic storage medium such as a flexible disk, a hard disk, and a magnetic tape, a magneto-optical storage medium such as an MO, a CD, a CD-ROM, a CD-R, a CD-RW, Various storage media such as optical storage media such as DVD-ROM, DVD-R, DVD-RAM, DVD-RW, DVD + RW, and semiconductor memory can be applied.

データ送信は、コンテンツ処理装置であるサーバ1のネットワークインタフェース8へとデータを送ることにより、ネットワークインタフェース8がネットワークNへと信号を出力する。また、ネットワークインタフェース8が受け取った信号については、ネットワークインタフェース8において必要かどうかの判断がなされ、必要なデータであれば取り込み、不必要であれば破棄する、というような処理が行われる。すなわち、あらゆるデータの送受信は、すべてネットワークインタフェース8を経由して行われることになる。   In data transmission, the network interface 8 outputs a signal to the network N by sending data to the network interface 8 of the server 1 which is a content processing apparatus. Further, regarding the signal received by the network interface 8, it is determined whether or not it is necessary in the network interface 8, and processing such as fetching if necessary data and discarding if unnecessary is performed. That is, all data transmission / reception is performed via the network interface 8.

一般的には、ユーザがコンテンツ処理装置であるサーバ1の電源を投入すると、CPU2はROM3内のBIOSに含まれるローダーというプログラムを起動させ、HDD5からオペレーティングシステム(OS)という当該サーバ1のハードウェアとソフトウェアとを管理するプログラムをRAM4に読み込む。OSは起動すると、ユーザの操作に応じてアプリケーションプログラムの起動、情報の読み込み、保存等をサポートする。代表的なOSとしては、Windows(Microsoft Corporationの登録商標)、UNIX(X/Open, Inc.の登録商標)等が知られている。これらのOS上で走るプログラムをアプリケーションプログラムと呼んでいる。なお、アプリケーションプログラムは、所定のOS上で動作するものに限らず、後述の各種処理の一部の実行をOSに肩代わりさせるものであってもよいし、所定のアプリケーションソフトやOSなどを構成する一群のプログラムファイルの一部として含まれているものであってもよい。   In general, when the user turns on the power of the server 1 which is a content processing apparatus, the CPU 2 activates a program called a loader included in the BIOS in the ROM 3 and the hardware of the server 1 called the operating system (OS) from the HDD 5. And a program for managing software are read into the RAM 4. When the OS is activated, it supports activation of application programs, reading of information, storage, and the like according to user operations. As typical OS, Windows (registered trademark of Microsoft Corporation), UNIX (registered trademark of X / Open, Inc.) and the like are known. Programs that run on these OSs are called application programs. The application program is not limited to one that runs on a predetermined OS, and may be one that causes the OS to execute some of the various processes described below, or constitutes predetermined application software, an OS, or the like. It may be included as part of a group of program files.

また、一般的には、コンテンツ処理装置であるサーバ1のHDD5にインストールされるアプリケーションプログラムは、リムーバブルメディア6に記録され、このリムーバブルメディア6に記録されたアプリケーションプログラムがHDD5にインストールされる。このため、リムーバブルメディア6も、アプリケーションプログラムを記憶する記憶媒体となり得る。さらには、アプリケーションプログラムは、例えばネットワークインタフェース8を介して外部から取り込まれ、HDD5にインストールされても良い。   In general, an application program installed in the HDD 5 of the server 1 that is a content processing apparatus is recorded in the removable medium 6, and the application program recorded in the removable medium 6 is installed in the HDD 5. For this reason, the removable medium 6 can also be a storage medium for storing application programs. Furthermore, the application program may be taken in from the outside via, for example, the network interface 8 and installed in the HDD 5.

コンテンツ処理装置であるサーバ1は、OS上で動作するアプリケーションプログラムが起動すると、このアプリケーションプログラムに従い、CPU2が各種の演算処理を実行して各部を集中的に制御する。   When an application program that runs on the OS is activated, the server 1 that is a content processing apparatus performs various arithmetic processes according to the application program, and centrally controls each unit.

[2−2.コンテンツ処理装置における処理]
次に、コンテンツ処理装置であるサーバ1のCPU2が実行する各種の演算処理のうち、アプリケーションプログラムの1つであるコンテンツ処理プログラムに従って実行する本実施の形態の特長的な処理について以下に説明する。
[2-2. Processing in content processing apparatus]
Next, characteristic processing of the present embodiment that is executed according to a content processing program that is one of application programs among various arithmetic processing executed by the CPU 2 of the server 1 that is a content processing apparatus will be described below.

図8は、サーバ1を含むシステムの概略構成を示すブロック図である。図8に示すように、コンテンツ処理装置であるサーバ1は、CPU2がコンテンツ処理プログラムに従って各部を制御することにより、Web環境における第1のコンテンツであるウェブページを保持するデータベース(ウェブページDB)21を管理し、クライアント端末Cから出力されたユーザのクエリーを受け付け、このクエリーに基づいてウェブページDB21に保持されているウェブページをランキングし、ランキングされたウェブページのクラスタリングを行うランキング・クラスタリング部22と、クラスタリングされたウェブページのランキング(検索結果)を、ズーミング記述言語(ZDL)の形式であるズーミング・クロスメディアを用いて連続的に表示させる表示部23と、を実現する。   FIG. 8 is a block diagram illustrating a schematic configuration of a system including the server 1. As shown in FIG. 8, the server 1 that is a content processing apparatus has a database (web page DB) 21 that holds a web page that is the first content in the web environment by the CPU 2 controlling each unit according to the content processing program. The ranking / clustering unit 22 that receives a user query output from the client terminal C, ranks the web pages held in the web page DB 21 based on the query, and clusters the ranked web pages. And the display unit 23 that continuously displays the ranking (search result) of the clustered web pages using the zooming cross media in the zooming description language (ZDL) format.

すなわち、このような構成により、クライアント端末C側においては、閲覧者がWebブラウザ上でキーワード検索を開始すると、同時にズーミング記述言語(ZDL)を解釈・表示するZDLビューワが起動される。そして、クライアント端末Cで入力された検索要求(クエリー)はサーバ1に送信される。コンテンツ処理装置であるサーバ1側では、クライアント端末Cで入力された検索要求(クエリー)を受け付けると、キーワードに基づくデータベース検索が実行される。サーバ1は、検索結果一覧をズーミング記述言語(ZDL)形式で生成する。生成されたズーミング記述言語(ZDL)形式の検索結果一覧はコンテンツ処理装置であるサーバ1からクライアント端末Cに送信され、ZDLビューワ上に表示される。閲覧者は表示された検索結果一覧に対して、適宜ズーミング操作を行うことになる。   That is, with such a configuration, on the client terminal C side, when a viewer starts a keyword search on a Web browser, a ZDL viewer that interprets and displays a zoom description language (ZDL) is activated at the same time. Then, the search request (query) input at the client terminal C is transmitted to the server 1. On the server 1 side, which is a content processing apparatus, when a search request (query) input at the client terminal C is received, a database search based on the keyword is executed. The server 1 generates a search result list in a zooming description language (ZDL) format. The generated search result list in the zooming description language (ZDL) format is transmitted from the server 1 which is a content processing apparatus to the client terminal C and displayed on the ZDL viewer. The viewer appropriately performs a zooming operation on the displayed search result list.

まず、ランキング・クラスタリング部22の構成について詳述する。ここで、図9はランキング・クラスタリング部22の構成を示すブロック図である。ランキング・クラスタリング部22は、ウェブページのテキストに対し、ウェブページのキーワードに基づいたインデックスを生成してデータベース(インデックスDB)30に格納するインデックシング部31と、インデックシング部31により生成されてインデックスDB30に格納されたインデックスを用い、ユーザのクエリーに対し、ウェブページをランキングするランキング部32と、インデックシング部31により生成されてインデックスDB30に格納されたインデックスを用い、ウェブページをクラスタリングするクラスタリング部33と、を備えている。   First, the configuration of the ranking / clustering unit 22 will be described in detail. FIG. 9 is a block diagram showing the configuration of the ranking / clustering unit 22. The ranking / clustering unit 22 generates an index based on the keyword of the web page for the text of the web page and stores it in the database (index DB) 30, and the index generated by the indexing unit 31 A ranking unit 32 that ranks web pages in response to a user query using an index stored in the DB 30 and a clustering unit that clusters web pages using an index generated by the indexing unit 31 and stored in the index DB 30 33.

インデックシング部31は、図10に示すように、既存の自然言語処理技術(例えば、形態素解析)を用い、ウェブページのテキストから代表的なキーワードを抽出するキーワード抽出部41と、キーワード抽出部41で抽出したキーワードに基づいて、既存のテキスト検索技術(例えば、ベクトル空間モデル)を用い、ウェブページのインデックスを生成するインデックス生成部42と、を備えている。キーワード抽出部41では、代表的なキーワードを抽出する際に、自動的な方法(自然言語処理技術)以外に、手動的な方法、又は、半自動的な手法も使用できる。インデックス生成部42は、抽出した代表キーワードを用い、ウェブページの内容を同じ形式(例えば、ドキュメント・ベクトル)に変換し、お互いの相対類似度を計算できるようにする。   As shown in FIG. 10, the indexing unit 31 uses an existing natural language processing technique (for example, morphological analysis) to extract a representative keyword from the text of a web page, and a keyword extracting unit 41. And an index generation unit 42 that generates an index of a web page using an existing text search technique (for example, a vector space model) based on the keyword extracted in (1). The keyword extraction unit 41 can use a manual method or a semi-automatic method in addition to an automatic method (natural language processing technology) when extracting a representative keyword. The index generation unit 42 uses the extracted representative keyword to convert the contents of the web page into the same format (for example, a document vector) so that the relative similarity between them can be calculated.

ランキング部32は、図11に示すように、抽出した代表的なキーワードの中から、ユーザが一つ又は複数のキーワードを選択できるようにするクエリー入力部51と、ユーザが選択したキーワード(ユーザのクエリー)をインデックスと同じ形式に変換するクエリー変換部52と、インデックスDB30に格納されたインデックスを用い、それぞれのウェブページの、ユーザのクエリーに対する類似度を計算する第1の類似度計算部である類似度計算部53と、類似度計算部53で計算した類似度に基づいて、ユーザのクエリーに対し、ウェブページをランキングするランキング生成部54と、を備えている。クエリー入力部51は、ユーザが、一次元のキーワードのリスト、又は二次元のキーワードのマップから(又は別の方法で)キーワードを選択できるようにする。クエリー変換部52は、抽出した代表キーワードを用い、ユーザが選択したキーワード(ユーザのクエリー)を、インデックスDB30に格納されたインデックスで扱われている形式(例えば、クエリー・ベクトル)に変換し、ユーザのクエリーとウェブページの間の類似度を計算できるようにする。類似度計算部53は、インデックスで扱われているクエリー又はウェブページの表現形式(例えば、クエリー・ベクトルやドキュメント・ベクトル)を用い、ユーザのクエリーに対し、それぞれのウェブページの類似度(0と100%の間の値)を計算する。ランキング生成部54は、計算した類似度に基づいて、ユーザのクエリーに対し、類似度が高いものから順にウェブページをランキングする。   As shown in FIG. 11, the ranking unit 32 includes a query input unit 51 that allows the user to select one or more keywords from the extracted representative keywords, and a keyword selected by the user (user's A query conversion unit 52 that converts (query) into the same format as the index, and a first similarity calculation unit that calculates the similarity of each web page to the user's query using the index stored in the index DB 30. A similarity calculation unit 53 and a ranking generation unit 54 for ranking web pages with respect to user queries based on the similarity calculated by the similarity calculation unit 53 are provided. The query input unit 51 allows the user to select keywords from a one-dimensional keyword list or a two-dimensional keyword map (or otherwise). The query conversion unit 52 uses the extracted representative keyword, converts the keyword (user query) selected by the user into a format (for example, a query vector) handled by the index stored in the index DB 30, and To calculate the similarity between a query and a web page. The similarity calculation unit 53 uses a query or web page expression format (for example, a query vector or a document vector) handled by the index, and uses the similarity (0 and A value between 100%) is calculated. Based on the calculated similarity, the ranking generation unit 54 ranks web pages in descending order of similarity with respect to the user's query.

クラスタリング部33は、図12に示すように、インデックシング部31の出力であるインデックスDB30に格納されたインデックスを用い、それぞれのウェブページ間の相対類似度を計算する第2の類似度計算部である類似度計算部61と、類似度計算部61で計算した類似度を用い、それぞれのウェブページのランキング(検索結果)に対し、クラスタリングを行うクラスタ生成部62と、を備えている。類似度計算部61は、インデックスで扱われているウェブページの表現形式を用い、それぞれのウェブページのペアの相対類似度を計算する。クラスタ生成部62は、類似度計算部61で計算した相対類似度に基づいて、既存のクラスタリング技術(例:「階層的クラスタリング手法」)を使い、ウェブページをクラスタリングする(結果として、相対類似度の高いウェブページは同じクラスタに属し、相対類似度の低いウェブページが異なるクラスタに属する)。   As shown in FIG. 12, the clustering unit 33 is a second similarity calculation unit that calculates the relative similarity between web pages using the index stored in the index DB 30 that is the output of the indexing unit 31. A similarity calculation unit 61 and a cluster generation unit 62 that performs clustering on the ranking (search result) of each web page using the similarity calculated by the similarity calculation unit 61 are provided. The similarity calculation unit 61 calculates the relative similarity of each web page pair using the web page expression format handled by the index. Based on the relative similarity calculated by the similarity calculation unit 61, the cluster generation unit 62 clusters existing web pages using the existing clustering technology (eg, “hierarchical clustering method”) (as a result, the relative similarity is calculated). Web pages with high relatives belong to the same cluster, and web pages with low relative similarity belong to different clusters).

ここで、図13〜図17はランキング・クラスタリング部22におけるインデックスの生成と類似度の計算に関する計算式を示す。この計算式は既存のテキスト検索技術における「ベクトル空間モデル」で扱われている、標準の計算式である。   13 to 17 show calculation formulas relating to index generation and similarity calculation in the ranking and clustering unit 22. This calculation formula is a standard calculation formula used in the “vector space model” in the existing text search technology.

次いで、表示部23について詳述する、ここで、図18は表示部24の構成を示すブロック図である。表示部23は、図18に示すように、初期検索結果として、ウェブページのリストを表示するランキング表示部71と、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して拡大表示させ、かつ、異なるクラスタに属するウェブページを連動して縮小表示させるクラスタリング表示部72と、を備えている。   Next, the display unit 23 will be described in detail. Here, FIG. 18 is a block diagram showing the configuration of the display unit 24. As shown in FIG. 18, the display unit 23 includes a ranking display unit 71 that displays a list of web pages as an initial search result, and the same cluster as the web page selected by the user when the user selects a web page and zooms in. And a clustering display unit 72 that enlarges and displays the web pages belonging to the selected web page and displays the web pages belonging to different clusters in a reduced manner.

ここで、ランキング部32とクラスタリング部33における「クラスタリングされた検索結果(ウェブページのランキング)」について図19を参照して説明する。   Here, “clustered search results (web page ranking)” in the ranking unit 32 and the clustering unit 33 will be described with reference to FIG.

ランキング部32は、ユーザのクエリー("Japan")に対し、ウェブページを類似度の高いものから順に並べる(この例では、ウェブページを1つのキーワードで表現する:"Honshu", "Tokyo", "Kyushu", "Osaka", "Kyoto")。それに対し、クラスタリング部33は、順に並べたウェブページの中から、「意味」が近い(類似度が高い)ウェブページを集めて、それぞれの異なる「意味」に対し、その「意味」を代表するクラスタを作る。結果として、"Honshu"と "Kyushu"のページを含む"island"を代表するクラスタと、"Tokyo", "Osaka", "Kyoto"のページを含む、"city"を代表するクラスタが生成された。このクラスタリング結果を元に、以下の記述を生成する(ズーミング記述生成部)。

(コンテンツの構造記述)
<zoomObject id="zoom1" > <zoomObject id="zoom2" > <text id="title2">「Honshu」に関連する項目</text>
…………
</zoomObject>
<zoomObject id="zoom3" > <text id="title3">「Tokyo」に関連する項目</text>
…………
</zoomObject>
<zoomObject id="zoom4" > <text id="title4">「Kyushu」に関連する項目</text>
…………
</zoomObject>
<zoomObject id="zoom5" > <text id="title5">「Osaka」に関連する項目</text>
…………
</zoomObject>
<zoomObject id="zoom6" > <text id="title6">「Kyoto」に関連する項目</text>
…………
</zoomObject>
…………
</zoomObject>

(ズーミングの操作/挙動記述)
<zoomObject id="zoom1" initZoomFactor="0.0" relatedTo="children:1.0">
</zoomObject>
<zoomObject id="zoom2" initZoomFactor="0.0"relatedTo="brother:-1.0, zoom4:1.0">
<div zoomFactor="0.0 1.0">
<dispText id="disptext2" textId="title2" textSize="8pt 14pt"/>
…………
</div>
</zoomObject>
<zoomObject id="zoom3" initZoomFactor="0.0"relatedTo="brother:-1.0, zoom5:1.0, zoom6:1.0">
<div zoomFactor="0.0 1.0">
<dispText id="disptext3" textId="title3" textSize="8pt 14pt"/>
…………
</div>
</zoomObject>
<zoomObject id="zoom4" initZoomFactor="0.0"relatedTo="brother:-1.0, zoom2:1.0">
<div zoomFactor="0.0 1.0">
<dispText id="disptext4" textId="title4" textSize="8pt 14pt"/>
…………
</div>
</zoomObject>
<zoomObject id="zoom5" initZoomFactor="0.0"relatedTo="brother:-1.0, zoom3:1.0, zoom6:1.0">
<div zoomFactor="0.0 1.0">
<dispText id="disptext5" textId="title5" textSize="8pt 14pt"/>
…………
</div>
</zoomObject>
<zoomObject id="zoom6" initZoomFactor="0.0"relatedTo="brother:-1.0, zoom3:1.0, zoom5:1.0">
<div zoomFactor="0.0 1.0">
<dispText id="disptext6" textId="title6" textSize="8pt 14pt"/>
…………
</div>
</zoomObject>
…………
The ranking unit 32 arranges the web pages in descending order of similarity to the user query ("Japan") (in this example, the web pages are expressed by one keyword: "Honshu", "Tokyo", "Kyushu", "Osaka", "Kyoto"). On the other hand, the clustering unit 33 collects web pages having similar “meanings” (high similarity) from the web pages arranged in order, and represents the “meanings” for the different “meanings”. Create a cluster. As a result, a cluster representing "island" containing pages "Honshu" and "Kyushu" and a cluster representing "city" containing pages "Tokyo", "Osaka", and "Kyoto" were created. . Based on the clustering result, the following description is generated (zooming description generation unit).

(Content structure description)
<zoomObject id = "zoom1"
<zoomObject id = "zoom2"
<text id = "title2"> Items related to "Honshu"</text>
…………
</ zoomObject>
<zoomObject id = "zoom3"
<text id = "title3"> Items related to “Tokyo” </ text>
…………
</ zoomObject>
<zoomObject id = "zoom4"
<text id = "title4"> Items related to "Kyushu"</text>
…………
</ zoomObject>
<zoomObject id = "zoom5"
<text id = "title5"> Items related to "Osaka"</text>
…………
</ zoomObject>
<zoomObject id = "zoom6"
<text id = "title6"> Items related to “Kyoto” </ text>
…………
</ zoomObject>
…………
</ zoomObject>

(Zooming operation / behavior description)
<zoomObject id = "zoom1" initZoomFactor = "0.0" relatedTo = "children: 1.0">
</ zoomObject>
<zoomObject id = "zoom2" initZoomFactor = "0.0" relatedTo = "brother: -1.0, zoom4: 1.0">
<div zoomFactor = "0.0 1.0">
<dispText id = "disptext2" textId = "title2" textSize = "8pt 14pt"/>
…………
</ div>
</ zoomObject>
<zoomObject id = "zoom3" initZoomFactor = "0.0" relatedTo = "brother: -1.0, zoom5: 1.0, zoom6: 1.0">
<div zoomFactor = "0.0 1.0">
<dispText id = "disptext3" textId = "title3" textSize = "8pt 14pt"/>
…………
</ div>
</ zoomObject>
<zoomObject id = "zoom4" initZoomFactor = "0.0" relatedTo = "brother: -1.0, zoom2: 1.0">
<div zoomFactor = "0.0 1.0">
<dispText id = "disptext4" textId = "title4" textSize = "8pt 14pt"/>
…………
</ div>
</ zoomObject>
<zoomObject id = "zoom5" initZoomFactor = "0.0" relatedTo = "brother: -1.0, zoom3: 1.0, zoom6: 1.0">
<div zoomFactor = "0.0 1.0">
<dispText id = "disptext5" textId = "title5" textSize = "8pt 14pt"/>
…………
</ div>
</ zoomObject>
<zoomObject id = "zoom6" initZoomFactor = "0.0" relatedTo = "brother: -1.0, zoom3: 1.0, zoom5: 1.0">
<div zoomFactor = "0.0 1.0">
<dispText id = "disptext6" textId = "title6" textSize = "8pt 14pt"/>
…………
</ div>
</ zoomObject>
…………

以上の記述によれば、zoom2(「Honshu」に関連する項目)をズームイン/アウトすると(操作受付部)、それと連動してzoom4(「Kyushu」に関連する項目)もズームイン/アウトする。一方、それ以外のzoom3(「Tokyo」に関連する項目)、zoom5(「Osaka」に関連する項目)、zoom6(「Kyoto」に関連する項目)は反対にズームアウト/インする。これは、
<zoomObject id="zoom2" initZoomFactor="0.0"relatedTo="brother:-1.0, zoom4:1.0">
という記述の中の「relatedTo="brother:-1.0, zoom4:1.0"」による。
According to the above description, when zoom2 (item related to “Honshu”) is zoomed in / out (operation receiving unit), zoom4 (item related to “Kyushu”) is also zoomed in / out in conjunction with it. On the other hand, zoom3 (items related to “Tokyo”), zoom5 (items related to “Osaka”), and zoom6 (items related to “Kyoto”) are zoomed out / in on the contrary. this is,
<zoomObject id = "zoom2" initZoomFactor = "0.0" relatedTo = "brother: -1.0, zoom4: 1.0">
"RelatedTo =" brother: -1.0, zoom4: 1.0 "" in the description.

同様に、zoom4をズーミングすると(操作受付部)、zoom2が連動してそれ以外が反対の挙動をする。一方、zoom3をズーミングすると(操作受付部)、zoom5, zoom6が連動してそれ以外が反対に動く。zoom5, zoom6についても同様である。このように、「島」に関する項目と「都市」に関する項目が混在していても、それらをクラスタリングして、同じクラスタに属する項目同士にプラスのズーム伝播を施し、かつ、異なるクラスタに属する項目にマイナスのズーム伝播を施すことにより、クラスタごとに分類された検索結果を閲覧するのと同等の効果を得ることができる。   Similarly, when zoom4 is zoomed (operation reception unit), zoom2 is linked and the other parts perform the opposite behavior. On the other hand, when zoom3 is zoomed (operation reception unit), zoom5 and zoom6 are linked and the other moves in the opposite direction. The same applies to zoom5 and zoom6. In this way, even if items related to “island” and items related to “city” are mixed, they are clustered, plus zoom propagation is applied to items belonging to the same cluster, and items belonging to different clusters are By performing negative zoom propagation, it is possible to obtain the same effect as browsing the search results classified for each cluster.

図20は、クラスタリングされたウェブページの検索結果一覧に対するズーミング操作例を示す説明図である。ここでは、「クラスタリングされた検索結果のズーミングを使った連続的な表示」について説明する。図20に示すように、ユーザがウェブページのリストの中からウェブページ(「3.ウェブページC」)を選択し、ズームインすると(操作受付部)、ユーザが選択したウェブページと同じクラスタに属するウェブページ(「1.ウェブページG」)が、選択されたウェブページと連動して拡大表示され、かつ、異なるクラスタに属するウェブページ(「2.ウェブページE」、「4.ウェブページF」、「5.ウェブページB」)が連動して縮小表示される。   FIG. 20 is an explanatory diagram illustrating an example of a zooming operation on a search result list of clustered web pages. Here, “continuous display using zooming of clustered search results” will be described. As shown in FIG. 20, when a user selects a web page (“3. web page C”) from the list of web pages and zooms in (operation reception unit), the user belongs to the same cluster as the web page selected by the user. A web page (“1. web page G”) is enlarged and displayed in conjunction with the selected web page and belongs to a different cluster (“2. web page E”, “4. web page F”). , “5. Web page B”) is reduced and displayed in conjunction.

このように本実施の形態によれば、ウェブページのキーワードに基づいて生成されたインデックスデータベースに格納されたインデックスを用い、ユーザのクエリーに対するウェブページの検索結果を生成し、検索されたウェブページをクラスタリングし、クラスタリングされたウェブページの検索結果を、属するクラスタ単位で、同一画面内で詳細度変化や表示メディア遷移を連続的に実現するズーミングの操作/挙動に関するズーミング記述を用いて連続的に表示させる。これにより、閲覧の文脈を保持しつつ、何度も検索する手間を省いて効率的に情報検索を実行することができるとともに、特に複数の異なるクラスタに属する項目が混在した場合に、所望のクラスタに属する項目を見つけやすくすることができる。   As described above, according to the present embodiment, the index stored in the index database generated based on the keyword of the web page is used to generate the search result of the web page for the user query, and the searched web page is Clustering and displaying the search results of clustered web pages continuously using the zooming description for zooming operation / behavior that continuously realizes change in detail and display media transition within the same screen in the cluster unit to which it belongs Let As a result, while maintaining the browsing context, it is possible to efficiently perform an information search without having to search many times, and in particular when a plurality of items belonging to different clusters are mixed, the desired cluster This makes it easier to find items belonging to.

また、本実施の形態によれば、検索結果に複数のクラスタに属する項目が混在した場合に、ユーザが選択したある項目をズームイン/アウトすると、それと同じクラスタに属する項目が連動してズームイン/アウトし、異なるクラスタに属する項目が反対にズームアウト/インするので、所望の項目を見つけやすくなる。   Further, according to the present embodiment, when items belonging to a plurality of clusters are mixed in the search result, if an item selected by the user is zoomed in / out, the items belonging to the same cluster are linked and zoomed in / out. In addition, since items belonging to different clusters are zoomed out / in on the contrary, it is easy to find a desired item.

なお、本実施の形態においては、クラスタリング表示部72において、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して拡大表示させ、かつ、異なるクラスタに属するウェブページを連動して縮小表示させるようにしたが、これに限るものではない。例えば、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して拡大表示させるだけのものであっても良いし、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して縮小表示させるだけのものであっても良い。   In the present embodiment, when the user selects a web page and zooms in on the clustering display unit 72, the web page belonging to the same cluster as the web page selected by the user is enlarged in conjunction with the selected web page. The web pages belonging to different clusters are displayed in a reduced scale in conjunction with each other, but the present invention is not limited to this. For example, when the user selects a web page and zooms in, the web page belonging to the same cluster as the web page selected by the user may be simply enlarged and displayed in conjunction with the selected web page. When the user selects a web page and zooms in, the web page belonging to the same cluster as the web page selected by the user may be displayed in a reduced scale in conjunction with the selected web page.

なお、本実施の形態においては、コンテンツ処理装置であるサーバ1に、ウェブページのテキストに対し、ウェブページのインデックスを生成してインデックスデータベースに格納するインデックシング部31と、インデックスデータベースに格納されたインデックスを用い、ユーザのクエリーに対するウェブページの検索結果を生成するランキング部32と、を備え、ランキング部32による検索結果のウェブページ群を受け付けるようにしたがこれに限るものではない。例えば、コンテンツ処理装置であるサーバ1にインデックシング部31とランキング部32とを備えずに、検索の部分については別の装置が行ったり、または、汎用検索エンジンを使い、その検索結果を受け付けるものであっても良い。   In the present embodiment, the server 1 which is the content processing apparatus generates an index of the web page for the text of the web page and stores it in the index database, and the indexing unit 31 stores the index in the index database. A ranking unit 32 that generates a search result of a web page for a user query using an index, and accepts a web page group of search results by the ranking unit 32, but is not limited thereto. For example, the server 1 which is a content processing apparatus does not include the indexing unit 31 and the ranking unit 32, and the search part is performed by another device, or the search result is received using a general-purpose search engine. It may be.

また、本実施の形態においては、インターネットであるネットワークN上の一般的なWebページを対象にキーワードに基づくWebページ検索を行い、ズーミング記述言語(ZDL)の形式でWebページの検索結果一覧を出力するようにしたが、ネットワーク上の一般のWebページに限るものではなく、サーバ内のローカルデータベースに存在する定型的な構造を持つWebページを対象に検索を行うようにしても良い。   In this embodiment, a Web page search based on a keyword is performed for a general Web page on the network N which is the Internet, and a search result list of the Web page is output in a zooming description language (ZDL) format. However, the search is not limited to a general Web page on the network, and a search may be performed for a Web page having a fixed structure existing in a local database in the server.

本発明の前提となるWeb環境でのコンテンツ閲覧における画面遷移の概要を説明するためのディスプレイに表示されるマルチメディアコンテンツの一例を示す正面図である。It is a front view which shows an example of the multimedia content displayed on the display for demonstrating the outline | summary of the screen transition in the content browsing in the web environment used as the premise of this invention. 図1に示すマルチメディアコンテンツのオブジェクトAに対してズームイン操作を行った結果を示す正面図である。It is a front view which shows the result of having performed zoom-in operation with respect to the object A of the multimedia content shown in FIG. 図2に示すマルチメディアコンテンツのオブジェクトAに対してズームイン操作を行った結果を示す正面図である。It is a front view which shows the result of having performed zoom-in operation with respect to the object A of the multimedia content shown in FIG. 図3に示すマルチメディアコンテンツのオブジェクトBに対してズームイン操作を行った結果を示す正面図である。It is a front view which shows the result of having performed zoom-in operation with respect to the object B of the multimedia content shown in FIG. Web環境でのコンテンツ閲覧における画面遷移の概要を簡単な具体例で表現した説明図である。It is explanatory drawing which expressed the outline | summary of the screen transition in the content browsing in a Web environment by a simple specific example. 本発明の実施の一形態にかかるコンテンツ処理装置を含むシステム構築例を示す模式図である。It is a schematic diagram which shows the system construction example containing the content processing apparatus concerning one Embodiment of this invention. コンテンツ処理装置であるサーバの構成を示すブロック図である。It is a block diagram which shows the structure of the server which is a content processing apparatus. コンテンツ処理装置であるサーバを含むシステムの概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the system containing the server which is a content processing apparatus. ランキング・クラスタリング部の構成を示すブロック図である。It is a block diagram which shows the structure of a ranking clustering part. インデックシング部の構成を示すブロック図である。It is a block diagram which shows the structure of an indexing part. ランキング部の構成を示すブロック図である。It is a block diagram which shows the structure of a ranking part. クラスタリング部の構成を示すブロック図である。It is a block diagram which shows the structure of a clustering part. インデックスの生成と類似度の計算に関する計算式を示す説明図である。It is explanatory drawing which shows the calculation formula regarding the production | generation of an index, and the calculation of a similarity degree. インデックスの生成と類似度の計算に関する計算式を示す説明図である。It is explanatory drawing which shows the calculation formula regarding the production | generation of an index, and the calculation of a similarity degree. インデックスの生成と類似度の計算に関する計算式を示す説明図である。It is explanatory drawing which shows the calculation formula regarding the production | generation of an index, and the calculation of a similarity degree. インデックスの生成と類似度の計算に関する計算式を示す説明図である。It is explanatory drawing which shows the calculation formula regarding the production | generation of an index, and the calculation of a similarity degree. インデックスの生成と類似度の計算に関する計算式を示す説明図である。It is explanatory drawing which shows the calculation formula regarding the production | generation of an index, and the calculation of a similarity degree. 表示部の構成を示すブロック図である。It is a block diagram which shows the structure of a display part. クラスタリングされた検索結果について示す説明図である。It is explanatory drawing shown about the search result clustered. クラスタリングされたウェブページの検索結果一覧に対するズーミング操作例を示す説明図である。It is explanatory drawing which shows the example of zooming operation with respect to the search result list of the clustered web page. 従来のウェブページの検索結果一覧に対する操作例を示す説明図である。It is explanatory drawing which shows the example of operation with respect to the search result list of the conventional web page.

符号の説明Explanation of symbols

1 コンテンツ処理装置
23 表示部
31 インデックシング部
32 ランキング部
33 クラスタリング部
41 キーワード抽出部
42 インデックス生成部
51 クエリー入力部
52 クエリー変換部
53 第1の類似度計算部
54 ランキング生成部
61 第2の類似度計算部
62 クラスタ生成部
71 ランキング表示部
72 クラスタリング表示部
DESCRIPTION OF SYMBOLS 1 Content processing apparatus 23 Display part 31 Indexing part 32 Ranking part 33 Clustering part 41 Keyword extraction part 42 Index generation part 51 Query input part 52 Query conversion part 53 1st similarity calculation part 54 Ranking generation part 61 2nd similarity Degree calculation unit 62 Cluster generation unit 71 Ranking display unit 72 Clustering display unit

Claims (24)

検索要求に従って検索されて順位付けされた結果であるウェブページ群を受け付けるウェブページ検索結果受付部と、
このウェブページ検索結果受付部により受け付けた検索結果の前記ウェブページ群をクラスタリングするクラスタリング部と、
このクラスタリング部によりクラスタリングされたウェブページの検索結果について、同一画面内での詳細度変化や表示メディア遷移を属するクラスタ単位で連続的に実現するズーミングの操作/挙動を記述するズーミング記述生成部と、
ユーザからの所定のウェブページに対するズームイン/アウト操作を受け付ける操作受付部と、
この操作受付部により受け付けたズームイン/アウト操作に応じ、前記ズーミング記述生成部により生成された記述に従って、クラスタリングされたウェブページの検索結果を操作されたウェブページが属するクラスタ単位で詳細度変化や表示メディア遷移させて表示するクラスタリング表示部と、
を備えることを特徴とするコンテンツ処理装置。
A web page search result receiving unit for receiving a web page group that is a result of being searched and ranked according to a search request;
A clustering unit that clusters the web page group of search results received by the web page search result receiving unit;
A search description of web pages clustered by the clustering unit, a zooming description generation unit that describes a zooming operation / behavior that continuously realizes a change in detail and display media transition in the same screen in units of clusters,
An operation receiving unit that receives a zoom-in / out operation on a predetermined web page from a user;
In accordance with the zoom-in / out operation accepted by the operation accepting unit, according to the description generated by the zooming description generating unit, the search result of the clustered web page is changed or displayed in units of clusters to which the operated web page belongs. A clustering display for displaying media transitions;
A content processing apparatus comprising:
ウェブページのテキストに対し、ウェブページのインデックスを生成してインデックスデータベースに格納するインデックシング部と、
前記インデックスデータベースに格納されたインデックスを用い、ユーザのクエリーに対するウェブページの検索結果を生成するランキング部と、
を更に備え、
前記ウェブページ検索結果受付部は、前記ランキング部による検索結果の前記ウェブページ群を受け付ける、
ことを特徴とする請求項1記載のコンテンツ処理装置。
An indexing unit that generates a web page index for the text of the web page and stores it in the index database;
A ranking unit that generates a search result of a web page for a user query using an index stored in the index database;
Further comprising
The web page search result receiving unit receives the web page group of search results by the ranking unit,
The content processing apparatus according to claim 1.
前記インデックシング部は、ウェブページのテキストから代表的なキーワードを抽出するキーワード抽出部と、このキーワード抽出部で抽出したキーワードに基づいて、ウェブページのインデックスを生成するインデックス生成部と、を備えている、
ことを特徴とする請求項2記載のコンテンツ処理装置。
The indexing unit includes a keyword extraction unit that extracts a representative keyword from the text of the web page, and an index generation unit that generates an index of the web page based on the keyword extracted by the keyword extraction unit. Yes,
The content processing apparatus according to claim 2.
前記キーワード抽出部は、自然言語処理技術を用い、ウェブページのテキストから代表的なキーワードを抽出する、
ことを特徴とする請求項3記載のコンテンツ処理装置。
The keyword extraction unit extracts a representative keyword from the text of a web page using natural language processing technology.
The content processing apparatus according to claim 3.
前記インデックス生成部は、抽出した代表キーワードを用い、ウェブページの内容を同じ形式に変換し、互いの相対類似度を計算できるようにする、
ことを特徴とする請求項3記載のコンテンツ処理装置。
The index generation unit uses the extracted representative keyword, converts the content of the web page into the same format, and calculates the relative similarity between each other.
The content processing apparatus according to claim 3.
前記ランキング部は、抽出した代表的なキーワードの中から、ユーザが一つ又は複数のキーワードを選択できるようにするクエリー入力部と、ユーザが選択したキーワードであるクエリーをインデックスと同じ形式に変換するクエリー変換部と、前記インデックスデータベースに格納されたインデックスを用い、それぞれのウェブページのクエリーに対する類似度を計算する第1の類似度計算部と、この第1の類似度計算部で計算した類似度に基づいて、ユーザのクエリーに対するウェブページの検索結果を生成するランキング生成部と、を備えている、
ことを特徴とする請求項2記載のコンテンツ処理装置。
The ranking unit converts a query input unit that allows a user to select one or a plurality of keywords from the extracted representative keywords, and a query that is a keyword selected by the user into the same format as an index. A query conversion unit, a first similarity calculation unit that calculates a similarity to a query of each web page using an index stored in the index database, and a similarity calculated by the first similarity calculation unit A ranking generation unit that generates a search result of a web page for a user query based on
The content processing apparatus according to claim 2.
前記クエリー入力部は、一次元のキーワードのリスト又は二次元のキーワードのマップからユーザがキーワードを選択できるようにする、
ことを特徴とする請求項6記載のコンテンツ処理装置。
The query input unit allows a user to select a keyword from a one-dimensional keyword list or a two-dimensional keyword map.
The content processing apparatus according to claim 6.
前記クエリー変換部は、抽出した代表キーワードを用い、ユーザが選択したキーワードであるクエリーを、前記インデックスデータベースに格納されたインデックスで扱われている形式に変換し、ユーザのクエリーとウェブページの間の類似度を計算できるようにする、
ことを特徴とする請求項6記載のコンテンツ処理装置。
The query conversion unit converts the query, which is a keyword selected by the user, into a format handled by the index stored in the index database using the extracted representative keyword, and between the user query and the web page. Allow similarity to be calculated,
The content processing apparatus according to claim 6.
前記第1の類似度計算部は、インデックスで扱われているクエリー又はウェブページの表現形式を用い、ユーザのクエリーに対し、それぞれのウェブページの類似度を計算する、
ことを特徴とする請求項6記載のコンテンツ処理装置。
The first similarity calculation unit calculates the similarity of each web page with respect to the user's query using the query or web page expression format handled in the index.
The content processing apparatus according to claim 6.
前記ランキング生成部は、計算した類似度に基づいて、ユーザのクエリーに対し、類似度が高いものから順にウェブページをランキングする、
ことを特徴とする請求項6記載のコンテンツ処理装置。
The ranking generation unit ranks web pages in descending order of similarity for user queries based on the calculated similarity.
The content processing apparatus according to claim 6.
前記クラスタリング部は、前記インデックスデータベースに格納されたインデックスを用い、それぞれのウェブページ間の相対類似度を計算する第2の類似度計算部と、この第2の類似度計算部で計算した相対類似度を用い、それぞれのウェブページの検索結果に対するクラスタリングされた検索結果を生成するクラスタ生成部と、を備えている、
ことを特徴とする請求項1記載のコンテンツ処理装置。
The clustering unit uses an index stored in the index database, and calculates a relative similarity between each web page, and a relative similarity calculated by the second similarity calculation unit. A cluster generation unit that generates a clustered search result for each web page search result using a degree,
The content processing apparatus according to claim 1.
前記第2の類似度計算部は、インデックスで扱われているウェブページの表現形式を用い、それぞれのウェブページのペアの相対類似度を計算する、
ことを特徴とする請求項11記載のコンテンツ処理装置。
The second similarity calculation unit calculates the relative similarity of each web page pair using the web page representation format handled by the index.
The content processing apparatus according to claim 11.
前記クラスタリング表示部は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して拡大表示させる、
ことを特徴とする請求項1記載のコンテンツ処理装置。
When the user selects a web page and zooms in, the clustering display unit enlarges and displays a web page belonging to the same cluster as the web page selected by the user in conjunction with the selected web page.
The content processing apparatus according to claim 1.
前記クラスタリング表示部は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して縮小表示させる、
ことを特徴とする請求項1記載のコンテンツ処理装置。
When the user selects a web page and zooms in the clustering display unit, the web page belonging to the same cluster as the web page selected by the user is reduced and displayed in conjunction with the selected web page.
The content processing apparatus according to claim 1.
前記クラスタリング表示部は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して拡大表示させ、かつ、異なるクラスタに属するウェブページを連動して縮小表示させる、
ことを特徴とする請求項1記載のコンテンツ処理装置。
When the user selects a web page and zooms in, the clustering display unit enlarges and displays a web page belonging to the same cluster as the web page selected by the user in conjunction with the selected web page, and belongs to a different cluster. Display web pages in a reduced scale,
The content processing apparatus according to claim 1.
検索要求に従って検索されて順位付けされた結果であるウェブページ群を受け付けるウェブページ検索結果受付機能と、
このウェブページ検索結果受付機能により受け付けた検索結果の前記ウェブページ群をクラスタリングするクラスタリング機能と、
このクラスタリング機能によりクラスタリングされたウェブページの検索結果について、同一画面内での詳細度変化や表示メディア遷移を属するクラスタ単位で連続的に実現するズーミングの操作/挙動を記述するズーミング記述生成機能と、
ユーザからの所定のウェブページに対するズームイン/アウト操作を受け付ける操作受付機能と、
この操作受付機能により受け付けたズームイン/アウト操作に応じ、前記ズーミング記述生成機能により生成された記述に従って、クラスタリングされたウェブページの検索結果を操作されたウェブページが属するクラスタ単位で詳細度変化や表示メディア遷移させて表示するクラスタリング表示機能と、
をコンピュータに実行させることを特徴とするコンテンツ処理プログラム。
A web page search result reception function for receiving a web page group that is a result of being searched and ranked according to a search request;
A clustering function for clustering the web page group of search results received by the web page search result reception function;
For the search results of web pages clustered by this clustering function, a zooming description generation function that describes a zooming operation / behavior that continuously realizes a change in level of detail and display media transition within the same screen in units of clusters,
An operation reception function for accepting a zoom-in / out operation on a predetermined web page from a user;
In accordance with the zoom-in / out operation accepted by the operation accepting function, according to the description generated by the zooming description generating function, the search result of the clustered web page is changed or displayed in the cluster unit to which the operated web page belongs. Clustering display function to display media transitions,
A content processing program for causing a computer to execute.
ウェブページのテキストに対し、ウェブページのインデックスを生成してインデックスデータベースに格納するインデックシング機能と、
前記インデックスデータベースに格納されたインデックスを用い、ユーザのクエリーに対するウェブページの検索結果を生成するランキング機能と、
を更にコンピュータに実行させ、
前記ウェブページ検索結果受付機能は、前記ランキング機能による検索結果の前記ウェブページ群を受け付ける、
ことを特徴とする請求項16記載のコンテンツ処理プログラム。
An indexing function that generates a web page index for web page text and stores it in an index database;
A ranking function for generating web page search results for a user query using an index stored in the index database;
Is further executed on the computer,
The web page search result acceptance function accepts the web page group of search results by the ranking function.
The content processing program according to claim 16.
前記インデックシング機能は、ウェブページのテキストから代表的なキーワードを抽出するキーワード抽出機能と、このキーワード抽出機能で抽出したキーワードに基づいて、ウェブページのインデックスを生成するインデックス生成機能と、をコンピュータに実行させる、
ことを特徴とする請求項17記載のコンテンツ処理プログラム。
The indexing function includes a keyword extraction function for extracting a representative keyword from the text of the web page, and an index generation function for generating an index of the web page based on the keyword extracted by the keyword extraction function. To execute,
The content processing program according to claim 17, wherein:
前記ランキング機能は、抽出した代表的なキーワードの中から、ユーザが一つ又は複数のキーワードを選択できるようにするクエリー入力機能と、ユーザが選択したキーワードであるクエリーをインデックスと同じ形式に変換するクエリー変換機能と、前記インデックスデータベースに格納されたインデックスを用い、それぞれのウェブページのクエリーに対する類似度を計算する第1の類似度計算機能と、この第1の類似度計算機能で計算した類似度に基づいて、ユーザのクエリーに対するウェブページの検索結果を生成するランキング生成機能と、をコンピュータに実行させる、
ことを特徴とする請求項17記載のコンテンツ処理プログラム。
The ranking function is a query input function that allows the user to select one or more keywords from the extracted representative keywords, and converts a query that is the keyword selected by the user into the same format as the index. A query conversion function, a first similarity calculation function for calculating a similarity to a query of each web page using an index stored in the index database, and a similarity calculated by the first similarity calculation function A ranking generation function for generating a web page search result for a user query based on
The content processing program according to claim 17, wherein:
前記クラスタリング機能は、前記インデックスデータベースに格納されたインデックスを用い、それぞれのウェブページ間の相対類似度を計算する第2の類似度計算機能と、この第2の類似度計算機能で計算した相対類似度を用い、それぞれのウェブページの検索結果に対するクラスタリングされた検索結果を生成するクラスタ生成機能と、をコンピュータに実行させる、
ことを特徴とする請求項16記載のコンテンツ処理プログラム。
The clustering function uses an index stored in the index database to calculate a relative similarity between web pages, and a relative similarity calculated by the second similarity calculation function. A cluster generation function for generating a clustered search result for each web page search result using a degree;
The content processing program according to claim 16.
前記クラスタリング表示機能は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して拡大表示させる、
ことを特徴とする請求項16記載のコンテンツ処理プログラム。
When the user selects a web page and zooms in the clustering display function, the web page belonging to the same cluster as the web page selected by the user is enlarged and displayed in conjunction with the selected web page.
The content processing program according to claim 16.
前記クラスタリング表示機能は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して縮小表示させる、
ことを特徴とする請求項16記載のコンテンツ処理プログラム。
When the user selects a web page and zooms in the clustering display function, the web page belonging to the same cluster as the web page selected by the user is reduced and displayed in conjunction with the selected web page.
The content processing program according to claim 16.
前記クラスタリング表示機能は、ユーザがウェブページを選択してズームインすると、ユーザが選択したウェブページと同じクラスタに属するウェブページを選択されたウェブページと連動して拡大表示させ、かつ、異なるクラスタに属するウェブページを連動して縮小表示させる、
ことを特徴とする請求項16記載のコンテンツ処理プログラム。
When the user selects a web page and zooms in, the clustering display function enlarges and displays a web page belonging to the same cluster as the web page selected by the user in conjunction with the selected web page, and belongs to a different cluster. Display web pages in a reduced scale,
The content processing program according to claim 16.
ウェブページの検索結果を生成して出力するコンテンツ処理装置におけるコンテンツ処理方法であって、
検索要求に従って検索されて順位付けされた結果であるウェブページ群を受け付けるウェブページ検索結果受付工程と、
このウェブページ検索結果受付工程により受け付けた検索結果の前記ウェブページ群をクラスタリングするクラスタリング工程と、
このクラスタリング工程によりクラスタリングされたウェブページの検索結果について、同一画面内での詳細度変化や表示メディア遷移を属するクラスタ単位で連続的に実現するズーミングの操作/挙動を記述するズーミング記述生成工程と、
ユーザからの所定のウェブページに対するズームイン/アウト操作を受け付ける操作受付工程と、
この操作受付工程により受け付けたズームイン/アウト操作に応じ、前記ズーミング記述生成工程により生成された記述に従って、クラスタリングされたウェブページの検索結果を操作されたウェブページが属するクラスタ単位で詳細度変化や表示メディア遷移させて表示するクラスタリング表示工程と、
を含むことを特徴とするコンテンツ処理方法。
A content processing method in a content processing apparatus for generating and outputting a search result of a web page,
A web page search result receiving step for receiving a web page group that is a result of being searched and ranked according to a search request;
A clustering step of clustering the web page group of search results received by the web page search result reception step;
For the search results of web pages clustered by this clustering step, a zooming description generation step that describes a zooming operation / behavior that continuously realizes a change in level of detail and a transition of display media within the same screen in units of clusters,
An operation accepting step for accepting a zoom-in / out operation on a predetermined web page from a user;
In accordance with the zoom-in / out operation accepted in the operation accepting step, according to the description generated by the zooming description creating step, the search result of the clustered web page is changed or displayed in units of clusters to which the operated web page belongs. A clustering display process for displaying media transitions;
A content processing method comprising:
JP2005327675A 2005-11-11 2005-11-11 Content processing apparatus, content processing program, and content processing method Expired - Fee Related JP4836069B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005327675A JP4836069B2 (en) 2005-11-11 2005-11-11 Content processing apparatus, content processing program, and content processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005327675A JP4836069B2 (en) 2005-11-11 2005-11-11 Content processing apparatus, content processing program, and content processing method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011174382A Division JP5391431B2 (en) 2011-08-09 2011-08-09 Content processing apparatus, content processing program, and content processing method

Publications (2)

Publication Number Publication Date
JP2007133761A true JP2007133761A (en) 2007-05-31
JP4836069B2 JP4836069B2 (en) 2011-12-14

Family

ID=38155350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005327675A Expired - Fee Related JP4836069B2 (en) 2005-11-11 2005-11-11 Content processing apparatus, content processing program, and content processing method

Country Status (1)

Country Link
JP (1) JP4836069B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8009179B2 (en) 2006-07-18 2011-08-30 Ricoh Company, Ltd. Content browsing system, content browsing method, and computer program product
JP2013037513A (en) * 2011-08-08 2013-02-21 Zenrin Datacom Co Ltd Information presentation device, information display system, information presentation method, and computer program
US8704849B2 (en) 2008-07-01 2014-04-22 Canon Kabushiki Kaisha Display control apparatus and display control method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328220A (en) * 1998-05-14 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> Data retrieval method, device thereof, and recording medium

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328220A (en) * 1998-05-14 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> Data retrieval method, device thereof, and recording medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8009179B2 (en) 2006-07-18 2011-08-30 Ricoh Company, Ltd. Content browsing system, content browsing method, and computer program product
US8704849B2 (en) 2008-07-01 2014-04-22 Canon Kabushiki Kaisha Display control apparatus and display control method
US9190030B2 (en) 2008-07-01 2015-11-17 Canon Kabushiki Kaisha Display control apparatus and display control method
JP2013037513A (en) * 2011-08-08 2013-02-21 Zenrin Datacom Co Ltd Information presentation device, information display system, information presentation method, and computer program

Also Published As

Publication number Publication date
JP4836069B2 (en) 2011-12-14

Similar Documents

Publication Publication Date Title
US8392834B2 (en) Systems and methods of authoring a multimedia file
US7428705B2 (en) Web map tool
US7149755B2 (en) Presenting a collection of media objects
US8009179B2 (en) Content browsing system, content browsing method, and computer program product
JP4587634B2 (en) Method, apparatus and program for enlarging a portion of a document in a browser
US20030191776A1 (en) Media object management
US20070011316A1 (en) Contents viewing system, contents viewing method, and computer program product
JP2007128523A (en) IMAGE SUMMARIZING METHOD, IMAGE DISPLAY DEVICE, k-TREE DISPLAY SYSTEM, k-TREE DISPLAY PROGRAM AND k-TREE DISPLAY METHOD
CN100524315C (en) Content converting device, content display device, content browsing device, content converting method, and content browsing method
GB2472147A (en) Generating search terms from an object based on a profile
CN100485679C (en) Method and system for browsing multimedia document, and computer product
KR100403947B1 (en) Aggregation of content as a personalized document
JP4836068B2 (en) Content processing apparatus, content processing program, and content processing method
JP5391431B2 (en) Content processing apparatus, content processing program, and content processing method
JP2007025786A (en) Content search device, content search program, and content search method
JP4836069B2 (en) Content processing apparatus, content processing program, and content processing method
JP2007034960A (en) Content processing apparatus, content processing program, and content processing method
JP4736728B2 (en) Content processing apparatus, content processing program, and content processing method
Christel et al. XSLT for tailored access to a digtal video library
JP4953190B2 (en) Display device, content browsing method, and program
JP4798479B2 (en) Content editing apparatus, content editing program, and content editing method
JP2000020544A (en) Browsing system
JP2003099466A (en) Context data display method, editing method and program
CN120373255A (en) Document display method, device, equipment and storage medium
JP2009122906A (en) Content browsing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081107

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20081107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110404

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110510

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110809

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110906

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110920

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4836069

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees