JP2005196415A

JP2005196415A - 情報推薦プログラム、情報推薦サーバ及び情報推薦方法

Info

Publication number: JP2005196415A
Application number: JP2004001377A
Authority: JP
Inventors: Yoshihiro Kuwasawa; 嘉宏桑澤; Akira Ichinose; 彰一瀬
Original assignee: Nomura Research Institute Ltd; JFE Systems Inc
Current assignee: Nomura Research Institute Ltd; JFE Systems Inc
Priority date: 2004-01-06
Filing date: 2004-01-06
Publication date: 2005-07-21

Abstract

【課題】対象コンテンツが増加しても、リアルタイム処理が可能で、かつ情報推薦の精度を損なわない技術を提供する。
【解決手段】情報推薦プログラムであって、コンピュータに、（ａ）１又は２以上の利用者キーワードと利用者キーワード値とを含む、利用者プロファイルを、読み込む手順、（ｂ）対象情報群中に含まれる１又は２以上の情報の１又は２以上の情報キーワードと情報キーワード値とを含む情報プロファイルを、読み込む手順、（ｃ）利用者プロファイルから利用者キーワード値が大きい上位ｎ個の利用者キーワードを抽出する手順、（ｄ）上位ｎ個の利用者キーワードと同じキーワードを情報キーワードとして含む情報プロファイルを検索し、抽出する手順、（ｅ）上位ｎ個の利用者キーワードのキーワード値と、上位ｎ個の利用者キーワードと同じ情報キーワードの情報キーワード値とを乗算し、積算する手順、（ｆ）積算値が大きい上位ｍ個の情報プロファイルを有する情報を推薦情報として抽出する手順、を実行させる。
【選択図】図１２

Description

本発明は、利用者の嗜好にあった情報をリアルタイムで推薦する技術に関し、特にその技術を利用した情報推薦プログラム、情報推薦サーバ及び情報推薦方法に関する。

現在提案されている情報推薦方式の一つに、コンテンツの文章情報内からコンテンツのキーワードベクトルを形成し、また利用者プロファイルのキーワードベクトルも形成し、両キーワードベクトルの内積をとるなどして類似度を計算した上で、コンテンツを抽出するものなどがある（例えば、特許文献１参照）。しかし、そのような類似度の計算、コンテンツの抽出は、対象コンテンツが増加するに伴い、リアルタイム処理が困難になりつつある。
特開２００２−２１５６６５号公報

本発明は、対象コンテンツが増加しても、リアルタイム処理が可能で、かつ情報推薦の精度を損なわない情報推薦プログラム、情報推薦サーバ装置及び情報推薦方法を提供することを目的とする。

本発明の第１の特徴は、情報推薦プログラムであって、コンピュータに、（ａ）１又は２以上の利用者キーワードと各利用者キーワードに対応する利用者キーワード値とを含む、利用者プロファイルを、読み込む手順、（ｂ）対象情報群中に含まれる１又は２以上の情報の１又は２以上の情報キーワードと各情報キーワードに対応する情報キーワード値とを含む情報プロファイルを、読み込む手順、（ｃ）利用者プロファイルから利用者キーワード値が大きい上位ｎ個の利用者キーワードを抽出する手順、（ｄ）上位ｎ個の利用者キーワードと同じキーワードを情報キーワードとして含む情報プロファイルを検索し、抽出する情報プロファイル検索手順、（ｅ）上位ｎ個の利用者キーワードのキーワード値と、上位ｎ個の利用者キーワードと同じ情報キーワードの情報キーワード値とを乗算し、積算する手順、（ｆ）積算によって得られる積算値が大きい上位ｍ個の情報プロファイルを有する情報を推薦情報として抽出する手順、を実行させることにある（ｎ，ｍはいずれも自然数）。

例えば、（ａ）（利用者キーワード，利用者キーワード値）が
（ｒｋｗ１，ｒｋｗｖ１）、（ｒｋｗ２，ｒｋｗｖ２）、（ｒｋｗ３，ｒｋｗｖ３）である利用者プロファイルｒｐを読み込む。

（ｂ）（情報キーワード，情報キーワード値）が
（ｊｋｗ１１，ｊｋｗｖ１１）、（ｊｋｗ１２，ｊｋｗｖ１２）、（ｊｋｗ１３，ｊｋｗｖ１３）である情報プロファイルｊｐ１と、
（ｊｋｗ２１，ｊｋｗｖ２１）、（ｊｋｗ２２，ｊｋｗｖ２２）、（ｊｋｗ２３，ｊｋｗｖ２３）である情報プロファイルｊｐ２と、
（ｊｋｗ３１，ｊｋｗｖ３１）、（ｊｋｗ３２，ｊｋｗｖ３２）、（ｊｋｗ３３，ｊｋｗｖ３３）である情報プロファイルｊｐ３を読み込む。

（ｃ）ｒｋｗｖ１＞ｒｋｗｖ２＞ｒｋｗｖ３である場合、利用者プロファイルから利用者キーワード値が大きい上位２個の利用者キーワードとして、ｒｋｗ１とｒｋｗ２を抽出する。

（ｄ）ｒｋｗ１とｊｋｗ１１とｊｋｗ２１が同じ、ｒｋｗ２とｊｋｗ１２とｊｋｗ２２が同じである場合、利用者キーワードｒｋｗ１，２と同じキーワードを情報キーワードとして含む情報プロファイルとして、情報プロファイルｊｐ１とｊｐ２が、抽出される。

（ｅ）（ｒｋｗｖ１＊ｊｋｗｖ１１）＋（ｒｋｗｖ２＊ｊｋｗｖ１２）＝Ｖ１と、
（ｒｋｗｖ１＊ｊｋｗｖ２１）＋（ｒｋｗｖ２＊ｊｋｗｖ２２）＝Ｖ２とを求める。

（ｆ）Ｖ１＞Ｖ２である場合に、積算値が最も大きい情報プロファイル
（ｊｋｗ１１，ｊｋｗｖ１１）、（ｊｋｗ１２，ｊｋｗｖ１２）、（ｊｋｗ１３，ｊｋｗｖ１３）
を有する情報を推薦情報として抽出する。

本発明の第２の特徴は、情報プロファイル検索手順において、上位ｎ個の利用者キーワードに含まれ、かつ対象情報群中における出現頻度が上位ｐ個に含まれるキーワードを、情報キーワードとして含む情報プロファイルを検索し、抽出することにある（ｐは自然数）。

本発明の第３の特徴は、（ａ）利用者が参照した情報の１又は２以上の情報キーワードと、情報キーワードに対応する情報キーワード値とを含む情報プロファイルを読み込む手順、（ｂ）利用者キーワード値の各々を、
（１−更新係数）＊利用者キーワード値＋全体正規化スケール値＊更新係数＊情報キーワード値／情報キーワード数
によって得られる値で更新する手順、をさらに実行させることにある（更新係数は、１未満）。

本発明の第４の特徴は、情報キーワード値が所定値未満である情報キーワードを削除し、削除されずに残った情報キーワードのキーワード値を利用して情報プロファイルを形成する手順、をさらに実行させることにある。

本発明の第１の特徴によれば、利用者キーワード値が大きい利用者キーワードを用いて、推薦情報を決定することによって、利用者にとって有益な情報を迅速に推薦することが可能になる。

本発明の第２の特徴によれば、利用者キーワード値が大きい利用者キーワードであって、かつ対象商品群中における出現頻度が多いキーワードを情報キーワードとして用いて、推薦情報を決定することによって、利用者にとって有益な情報をより迅速に推薦することが可能になる。

本発明の第３の特徴によれば、利用者が情報を実際に参照すると、利用者プロファイルが参照された情報の影響を受けて更新されるため、利用者プロファイルが常に利用者の嗜好を反映したものとなる。このため、利用者の嗜好が変化しても、常に利用者の嗜好に沿った情報を推薦することが可能になる。

本発明の第４の特徴によれば、重要度の低い情報キーワードを削除し、さらに削除されずに残った情報キーワードの値を利用して、推薦情報を決定することによって、利用者にとって有益な情報をより一層迅速に推薦することが可能になる。

図１は、本発明を適用した情報推薦システムの全体構成を示す。本システムは、Ｗｅｂブラウザを用いて商品情報を閲覧するために利用者が使用するクライアントパソコン（ＰＣ）１，２と、ＨＴＭＬファイルを送信するなどして最適な商品の情報をＷｅｂブラウザが閲覧可能な状態にするＷｅｂサーバ８と、利用者プロファイルデータなどに基づいて各利用者に最適な情報を推薦する情報推薦サーバ１０とを備える。クライアントパソコン１，２とＷｅｂサーバ８は、インターネットなどの通信網５を介してデータの送受信が可能である。

情報推薦サーバ１０は、商品プロファイルデータなどを入力するためなどに使用される入力装置１１と、データ入力の際に入力されるデータの内容を確認するためなどに使用される表示装置１２と、データの送受信が可能な送受信部１３と、入力装置１１からの入力、表示装置１２への出力、並びに送受信部１３からの入力及び送受信部１３への出力などを制御する入出力制御部１４と、記憶装置２０と、各構成要素を制御する主制御部１５とを備える。

入力装置１１には、キーボードやポインティングデバイスが含まれる。ポインティングデバイスには、マウス、トラックボール、トラックパッド、スティックなどが含まれる。表示装置１２には、ＣＲＴディスプレイ、液晶ディスプレイ、ＥＬディスプレイ、有機ＥＬディスプレイ、プラズマディスプレイなどが含まれる。送受信部１３には、ネットワーク・インタフェース・カード（ＮＩＣ）などが含まれる。

記憶装置２０とは、ハードディスク（ＨＤ）、フレキシブルディスク（ＦＤ）、光ディスク、光磁気ディスク、リードオンリーメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）などであり、商品プロファイルデータベース（ＤＢ）と、キーワード統計情報ＤＢと、利用者プロファイルＤＢと、お勧めルールＤＢとが記憶されている。また、図示されていないが、基本入出力システム（ＢＩＯＳ）やオペレーティングシステム（ＯＳ）なども記憶されている。

図２に、商品プロファイルデータ構造の一例を示す。図２に示すように、商品プロファイルデータは、商品プロファイル基本情報テーブルと商品プロファイル基本キーワードテーブルとを有する。

図２（ａ）に示す商品プロファイル基本情報テーブルは、商品ＩＤと、商品名と、プロファイルカテゴリ種別と、商品分類種別１，２，３とを有する。プロファイルカテゴリ種別は、利用者プロファイルを形成する際のプロファイルカテゴリを示す。商品分類種別１，２，３は、より適切な推薦をするために必要な分類情報である。

図２（ｂ）に示す商品プロファイル基本キーワードテーブルは、商品ＩＤと商品プロファイルキーワード（適宜「商品キーワード」と略す。）とを有する。単一の商品ＩＤに対して、１又は２以上の商品キーワードが存在する。

図３（ａ）に、利用者プロファイルデータ構造の一例を示す。図３（ａ）に示すように、利用者プロファイルデータは、利用者ＩＤと、プロファイルカテゴリ種別と、利用者プロファイルキーワード（適宜「利用者キーワード」と略す。）と利用者プロファイルキーワード値（適宜「利用者キーワード値」と略す。）とを有する。利用者キーワード値は、利用者キーワードの利用者プロファイル中における重みを示す。単一の利用者ＩＤに対して、１又は２以上のプロファイルカテゴリ種別が存在する。単一のプロファイルカテゴリ種別に対して、１又は２以上の利用者プロファイルキーワードが存在する。単一の利用者プロファイルキーワードに対して、単一の利用者プロファイルキーワード値が存在する。

図３（ｂ）に、利用者プロファイルデータの一例を示す。図３（ｂ）に示すように、利用者ＩＤ：１００に対して、プロファイルカテゴリ種別は「女性向け商品」と「男性向け商品」とが存在する。「利用者ＩＤ：１００、プロファイルカテゴリ種別：女性向け商品」という組み合わせに対して、利用者プロファイルキーワードは「スカート」、「ギャザー」、「ヒップ」が存在する。また、「利用者ＩＤ：１００、プロファイルカテゴリ種別：男性向け商品」という組み合わせに対して、利用者プロファイルキーワードは「リア」、「エクステリア」が存在する。そして、「キーワード、キーワード値」は「スカート、８００」、「ギャザー、６３０」、「ヒップ、２０」、「リア、９４０」、「エクステリア、５５０」となっている。

図４に、キーワード統計情報データ構造の一例を示す。図４に示すように、キーワード統計情報データは、キーワードとキーワード出現頻度を有する。キーワードは、商品プロファイルを構成する要素である。出現頻度は、そのキーワードをプロファイル中に含む商品の数である。

お勧めルールとは、推薦情報決定処理時に参照されるルールである。例えば、利用者プロファイル中におけるキーワード値が大きい上位キーワードで対象商品群の商品プロファイルを検索する場合に、上位「３つ」（第１番から第３番まで）だけを検索キーワードとして使用し、４番目以降は使用しない、などが含まれる。

本実施例における処理の全体像を説明する。

まず、図５（ａ）に示すように、前処理として、商品データを入力し（ステップＳ１０）、商品データを記録し（ステップＳ２０）、商品プロファイルを形成し（ステップＳ３０）、キーワード統計情報を生成する（ステップＳ４０）。商品プロファイルの形成、キーワード統計情報の生成については、追って詳述する。

次に、図５（ｂ）に示すように、利用者アクション情報を収集し（ステップＳ５０）、利用者プロファイルを形成する（ステップＳ６０）。利用者プロファイルの形成には、ステップＳ３０で形成された商品プロファイルが利用される。利用者プロファイルの形成については、追って詳述する。

さらに、図５（ｃ）に示すように、推薦する情報を決定し（ステップＳ７０）、推薦する情報を表示する（ステップＳ８０）。推薦する情報の決定には、ステップＳ３０で形成された商品プロファイル、ステップＳ４０で生成されたキーワード統計情報、及びステップＳ６０で形成された利用者プロファイルが利用される。推薦する情報の決定については、追って詳述する。情報推薦サーバが「推薦情報」を決定する。「推薦情報」に関連付けられ、「推薦情報」を表示可能なＨＴＭＬファイルを、ＷｅｂサーバがクライアントＰＣに提供する。ＨＴＭＬファイルがクライアントＰＣで起動しているＷｅｂブラウザによって解釈され、「推薦情報」が閲覧可能になる。

（商品プロファイル形成処理について）
図６に基づいて、商品プロファイル形成処理について説明する。

ステップＳ１０１：商品関連コンテンツを入力する。商品関連コンテンツには、商品ＩＤ、商品名、プロファイルカテゴリ種別、キーワードが含まれる。

ステップＳ１０２：キーワードベクトルを抽出する。キーワードベクトル抽出法としては、主にＴＦ／ＩＤＦ法が使用される。IT/IDF法でキーワード毎に生成される重み値をキーワード値とする。

キーワードベクトルは、「キーワード」と「キーワード値」からなる。各商品ＩＤは、１又は２以上のキーワードを有し、各キーワードはキーワード値を有する。

図７（ａ）に、抽出されたキーワードベクトルの一例を示す。図７（ａ）に示すように、例えば、「１２５３１」という商品ＩＤを有する商品のキーワードベクトルは、
（キーワード，キーワード値）＝（フリル，５）、（暖かい，４）、（女性らしい，４）、（白，２）
となる。

ステップＳ１０３：常用度の低いキーワードベクトルを廃棄する。例えば、図７（ｂ）に、図７（ａ）のキーワードベクトルからキーワード値が「２」以下のキーワードを除去した例を示す。図７（ｂ）に示すように、商品ＩＤが「１２５３１」である商品に関して、キーワード値が「２」であるキーワード「白」が除去される。そして、商品ＩＤが「１２５３１」である商品のキーワードベクトルは、
（キーワード，キーワード値）＝（フリル，５）、（暖かい，４）、（女性らしい，４）
となる。

除去されるキーワードはキーワード値が「２」以下のキーワードに限定されない。重みが「３」以下のキーワードを除去するとしても良い。キーワード値が「３」以下のキーワードを除去した場合、商品ＩＤが「１２５３２」である商品のキーワードベクトルは、
（キーワード，キーワード値）＝（ＵＶ，５）、（形状記憶，５）
だけになる。

キーワード値が所定値以下のキーワードを除去するのではなく、各商品毎にキーワード値が上から所定番目以降のキーワードを除去するとしても良い。例えば、キーワード値が上から４番目以降のキーワードを除去する場合、商品ＩＤが「１２５３３」である商品のキーワードベクトルは、
（キーワード，キーワード値）＝（暖かい，４）、（女性らしい，５）、（ウール，３）
になる。また、キーワード値が上から５番目以降のキーワードを除去する場合、商品ＩＤが「１２５３４」である商品のキーワードベクトルは、
（キーワード，キーワード値）＝（撥水性，３）、（ロング，３）、（雨，２）、（寒い，２）
になる。

ステップＳ１０５：各商品のプロファイルカテゴリ種別及び商品分類種別を決定する。図８にプロファイルカテゴリ種別及び商品分類種別の一例を示す。図８に示すように、プロファイルカテゴリ種別として「女性向け商品」、「男性向け商品」などの大きな種別を入れ、また商品分類種別として「ミドル・シニア」、「手洗い」、「ドライ」などの細かな種別を入れる。

ステップＳ１０６：商品プロファイル情報を商品プロファイルＤＢへ保存する。上記のような処理の結果、形成された商品プロファイルを商品プロファイルＤＢへ保存し、後述するキーワード統計情報生成処理、利用者プロファイル更新処理、推薦情報決定処理において使用する。

（キーワード統計情報生成処理について）
図９に基づいて、キーワード統計情報生成について説明する。

ステップＳ２０１：商品プロファイルデータを取得する。

ステップＳ２０２：商品プロファイルデータからキーワード統計情報を抽出する。キーワード統計情報には、例えばキーワードの出現頻度が含まれる。

図１０に、図７（ｂ）のキーワードの集合に関するキーワード出現頻度を示す。図１０に示すように、「フリル」というキーワードは、商品ＩＤ：１２５３１に関してしか使用されていないので、出現頻度は「１」となり、「暖かい」というキーワードは、商品ＩＤ：１２５３１、１２５３３、１２５３５に関してしか使用されているので、出現頻度は「３」となる。

ステップＳ２０３：キーワード統計情報をキーワード統計情報ＤＢへ保存する。

（利用者プロファイル形成処理について）
図１１に基づいて、利用者プロファイル形成処理について説明する。この例では、利用者がWebサービス上で商品を購入したり、商品情報を参照したりする場合の利用者プロファイルの形成処理について説明している。

ステップＳ３０１：利用者が参照した商品の商品プロファイルＡを商品プロファイルＤＢから取得する。商品プロファイルＡは、例えば
（キーワード、キーワード値）＝（ＬＳＩ２．０、アメリカ３．０）とする。

ステップＳ３０２：利用者の利用者プロファイルを利用者プロファイルＤＢから取得する。利用者プロファイルＰは、例えば
（キーワード、キーワード値）＝（コンピュータ４００、通信３５０、無線１５０、ＬＳＩ１００）とする。

ステップＳ３０３：利用者プロファイルＰの各キーワード値を全体正規化スケール値Ｔで除算して利用者プロファイルＰ’とする。Ｔ＝１０００とすると、利用者プロファイルＰ’は、
（キーワード、キーワード値）＝（コンピュータ０．４、通信０．３５、無線０．１５、ＬＳＩ０．１）となる。

全体正規化スケール値Ｔとは、利用者プロファイルＰの全てのキーワード値の合計値である。利用者プロファイルＰが、
（キーワード、キーワード値）＝（コンピュータ４００、通信３５０、無線１５０、ＬＳＩ１００）の場合、
（４００＋３５０＋１５０＋１００）＝１０００
であるから、全体正規化スケール値Ｔは「１０００」になる。

ステップＳ３０４：利用者プロファイルＰ’の各キーワードの値を（１−更新係数α）で乗算して利用者プロファイルＰ’’する。更新係数α＝０．２とすると、（１−更新係数α）＝０．８であるから、利用者プロファイルＰ’’は、
（キーワード、キーワード値）＝（コンピュータ０．３２、通信０．２８、無線０．１２、ＬＳＩ０．０８）となる。

更新係数αは「０．２」に限られない。

利用者の長期にわたる嗜好傾向を重視する場合は、更新係数は小さい方が好ましいので、例えば「０．１」とする。これにより、選択された商品プロファイルの利用者プロファイルへの影響が大きくなる。一方、利用者の短期の嗜好傾向を重視する場合は、更新係数は大きい方が好ましいので、例えば「０．３」とする。これにより、選択された商品プロファイルの利用者プロファイルへの影響は小さくなる。

ステップＳ３０５：更新係数αを、商品プロファイルＡのキーワード数Ｎで割った値を商品プロファイルＡの各キーワード値に乗算して、商品プロファイルＡ’を得る。更新係数α＝０．２、商品プロファイルＡのキーワード数Ｎ＝２であるから、
（更新係数α／商品プロファイルのキーワード数Ｎ）＝０．１となり、
商品プロファイルＡ’は、
（キーワード、キーワード値）＝（ＬＳＩ０．１、アメリカ０．１）となる。

ステップＳ３０６：利用者プロファイルＰ’’のキーワード値を、商品プロファイルＡ’のキーワード値に加えて、利用者プロファイルＰ’’’とする。

利用者プロファイルＰ’’が、
（キーワード、キーワード値）＝（コンピュータ０．３２、通信０．２８、無線０．１２、ＬＳＩ０．０８）で、
商品プロファイルＡ’が、
（キーワード、キーワード値）＝（ＬＳＩ０．１、アメリカ０．１）であるから、
利用者プロファイルＰ’’’は、
（キーワード、キーワード値）＝（コンピュータ０．３２、通信０．２８、無線０．１２、ＬＳＩ０．１８、アメリカ０．１）となる。

ステップＳ３０７：利用者プロファイルＰ’’’の各キーワード値を全体正規化スケール値Ｔで乗算して、利用者プロファイルＰ’’’’とする。

利用者プロファイルＰ’’’は、
（キーワード、キーワード値）＝（コンピュータ０．３２、通信０．２８、無線０．１２、ＬＳＩ０．１８、アメリカ０．１）であり、
全体正規化スケール値Ｔ＝１０００であるから、
利用者プロファイルＰ’’’’は、
（キーワード、キーワード値）＝（コンピュータ３２０、通信２８０、無線１２０、ＬＳＩ１８０、アメリカ１００）となる。

ステップＳ３０８：利用者プロファイルＰ’’’’を更新された利用者プロファイルとして利用者プロファイルＤＢに保存する。

これら一連の処理によって、利用者プロファイルは、利用者が参照した商品の商品プロファイルを反映して
（キーワード、キーワード値）＝（コンピュータ４００、通信３５０、無線１５０、ＬＳＩ１００）から
（キーワード、キーワード値）＝（コンピュータ３２０、通信２８０、無線１２０、ＬＳＩ１８０、アメリカ１００）へ更新される。

よって、利用者の嗜好の変化に適切に追従して、利用者プロファイルを逐次更新することが可能となる。

なお、上記説明は利用者プロファイルの「更新」として説明したが、同様な方法で利用者プロファイルの初期値を形成することもできる。

例えば、利用者プロファイルが無い初期状態で、商品プロファイルＡ
（キーワード、キーワード値）＝（ＬＳＩ１．０、アメリカ１．０）
の商品を閲覧したとする。

この場合、ステップＳ３０２の利用者プロファイルＰが「０」であるから、
ステップＳ３０３の利用者プロファイルＰ’も「０」となり、
ステップＳ３０４の利用者プロファイルＰ’’も「０」となる。

そして、ステップＳ３０１の商品プロファイルＡが
（キーワード、キーワード値）＝（ＬＳＩ１．０、アメリカ１．０）
であるから、
ステップＳ３０５の商品プロファイルＡ’は、
（キーワード、キーワード値）＝（ＬＳＩ０．１、アメリカ０．１）
となり、
ステップＳ３０６の利用者プロファイルＰ’’’は
（キーワード、キーワード値）＝（ＬＳＩ０．１、アメリカ０．１）
となり、キーワード値の比は０．１：０．１のままで、キーワード値の総和が１０００となるようにするために、５０００を乗算して、
ステップＳ３０７の利用者プロファイルＰ’’’’は
（キーワード、キーワード値）＝（ＬＳＩ５００、アメリカ５００）
となる。

（推薦情報決定処理について）
図１２に基づいて、推薦情報決定処理について説明する。

ステップＳ４０１：利用者の利用者プロファイルを取得する。利用者プロファイルが、
（キーワード、キーワード値）＝（コンピュータ３００、通信２８０、ＬＳＩ２００、無線１２０、アメリカ１００）であるとする。

ステップＳ４０２：対象商品群のキーワード統計情報を取得する。対象商品群とは、利用者プロファイルに記憶されているカテゴリ種別と同じカテゴリ種別を有する商品の集合を言う。

例えば、ある利用者が、２つの利用者プロファイルを有し、一方の利用者プロファイルのプロファイルカテゴリ種別がカテゴリ００１で、他方の利用者プロファイルのプロファイルカテゴリ種別がカテゴリ００２であるとする。そして、その利用者が、あるＷｅｂページにアクセスした場合に、そのＷｅｂページで閲覧可能な商品は、商品プロファイルのプロファイルカテゴリ種別がカテゴリ００１のものと、カテゴリ００３のものであるとする。

このような場合に、ステップＳ４０２では、利用者のプロファイルカテゴリ種別のいずれかと一致するカテゴリ種別を有する商品のみが、対象商品群に含まれる。つまり、前記の例では、商品プロファイルのプロファイルカテゴリ種別がカテゴリ００１である商品のみが、対象商品群に含まれる。

実施例１におけるキーワード統計情報は、
（キーワード、出現頻度）＝（アメリカ３０、日本２０、コンピュータ２０、ＬＳＩ１５、ネットワーク１０、光１０）とする。

ステップＳ４０３：利用者プロファイルの上位キーワードでキーワード統計情報を検索する。例えば、上位キーワードの個数を「３」とすると、最上位のキーワード「コンピュータ」と、２番目のキーワード「通信」と、３番目のキーワード「ＬＳＩ」が検索キーワードとなる。

上位キーワードの個数は、「３」に限定されない。この数は、推薦情報をどのくらい絞り込めるかに依存する。例えば、３で実施して、該当する商品が何百件もマッチするようであれば、数を増やすべきであるし、逆に一件もマッチしないようであれば、数を減らすべきである。

ステップＳ４０４：利用者プロファイル中の上位キーワードで、キーワード統計情報を検索する。例えば、利用者プロファイル中の上位キーワードが「コンピュータ、通信、ＬＳＩ」であるなら、これらとマッチするキーワード統計情報中のキーワードとその出現頻度は、
（キーワード、出現頻度）＝（コンピュータ２０）、(ＬＳＩ１５）となる。

ステップＳ４０５：ステップＳ４０４で取得されたキーワードを商品プロファイル中に含む商品を検索し、抽出する。

ステップＳ４０６：ステップＳ４０５で抽出された商品の商品プロファイルを取得する。例えば、以下のような商品Ａ〜Ｃの商品プロファイルが取得される。

商品Ａの商品プロファイル
（キーワード、キーワード値）＝（コンピュータ１．０、光２．０、日本１．０）
商品Ｂの商品プロファイル
（キーワード、キーワード値）＝（ＬＳＩ２．０、無線１．０、アメリカ３．０）
商品Ｃの商品プロファイル
（キーワード、キーワード値）＝（コンピュータ２．０、ＬＳＩ１．０）
ステップＳ４０７：ステップＳ４０６で取得された商品プロファイルと利用者プロファイルとの一致度を計算する。具体的には、両プロファイル中に共通して存在するキーワードのキーワード値を乗算し、得られた値の総和を求める。

例えば、まず利用者プロファイルと商品Ａの商品プロファイルとの一致度を計算する。両プロファイル中に共通して存在するキーワードは、コンピュータだけであって、
利用者プロファイル中のコンピュータのキーワード値は「３００」、
商品Ａの商品プロファイル中のコンピュータのキーワード値は「１．０」であるから、一致度は、３００＊１．０＝３００となる。

次に、利用者プロファイルと商品Ｂの商品プロファイルとの一致度を計算する。両プロファイル中に共通して存在するキーワードは、「ＬＳＩ」、「無線」、「アメリカ」の３つであって、
利用者プロファイル中のＬＳＩのキーワード値は「２００」、無線のキーワード値は「１２０」、アメリカのキーワード値は「１００」、
商品Ｂの商品プロファイル中のＬＳＩのキーワード値は「１．０」、無線のキーワード値は「１．０」、アメリカのキーワード値は「１．０」であるから、
一致度は、２００＊２．０＋１２０＊１．０＋１００＊３．０＝８２０となる。

さらに、利用者プロファイルと商品Ｃの商品プロファイルとの一致度を計算する。両プロファイル中に共通して存在するキーワードは、「コンピュータ」と「ＬＳＩ」の２つであって、
利用者プロファイル中のコンピュータのキーワード値は「３００」、ＬＳＩのキーワード値は「２００」、
商品Ｂの商品プロファイル中のコンピュータのキーワード値は「１．０」、ＬＳＩのキーワード値は「１．０」であるから、
一致度は、３００＊２．０＋２００＊１．０＝８００となる。

よって、商品Ａの一致度は３００、商品Ｂの一致度は８２０、商品Ｃの一致度は８００となる。

ステップＳ４０８：一致度の高い商品を推薦商品とする。例えば、上位２つを推薦商品とする場合、商品Ｂと商品Ｃがお勧め商品としてピックアップされる。なお、推薦商品は、「上位２つ」に限定されない。

上記の如く、利用者プロファイル、キーワード統計情報に基づいて、推薦情報が決定される。利用者プロファイル中の上位キーワードだけを用いて、利用者プロファイルと商品プロファイルとの一致度を計算し、一致度の高い商品だけを推薦することによって利用者の嗜好に沿った情報を迅速に推薦することが可能になる。

上記実施例においては、利用者プロファイルに沿った最適な「商品」を推薦するものとしたが、本発明は「商品」を推薦する場合に限定されない。「商品」の代わりに、「ニュース」などの情報を推薦する場合にも使用可能である。その場合は、各ニュースに対して「ニュース・キーワード」や「ニュース・キーワード値」を設定する。

本発明を適用した情報推薦システムの全体構成を示す図である。（ａ）は商品プロファイル基本情報テーブルの一例を示し、（ｂ）は商品プロファイル基本キーワードテーブルの一例を示す。（ａ）は利用者プロファイルデータ構造の一例を示し、（ｂ）は利用者プロファイルデータの一例を示す。キーワード統計情報データ構造の一例を示す。（ａ）は前処理の流れを示すフローチャートであり、（ｂ）は利用者プロファイル形成処理の流れを示すフローチャートであり、（ｃ）は推薦情報決定処理の流れを示すフローチャートである。商品プロファイル形成処理の流れを示すフローチャートである。（ａ）は抽出されたキーワードベクトルの一例を示し、（ｂ）は図７（ａ）のキーワードベクトルから重みが「２」以下のキーワードを除去した例を示す。プロファイルカテゴリ種別及び商品分類種別の一例を示す。キーワード統計情報生成の流れを示すフローチャートである。図７（ｂ）のキーワードの集合に関するキーワード出現頻度を示す。利用者プロファイル形成処理の流れを示すフローチャートである。推薦情報決定処理の流れを示すフローチャートである。

符号の説明

１…クライアントＰＣ、２…クライアントＰＣ、５…通信網、
８…Ｗｅｂサーバ、１１…入力装置、１２…表示装置、
１３…送受信部１４…入出力制御部、１５…主制御部（ＣＰＵ）、
２０…記憶装置、

Claims

コンピュータに、
１又は２以上の利用者キーワードと前記利用者キーワードに対応する利用者キーワード値とを含む利用者プロファイルを、読み込む手順、
推薦対象情報群中に含まれる１又は２以上の情報の１又は２以上の情報キーワードと前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを、読み込む手順、
前記利用者プロファイルから前記利用者キーワード値が大きい上位ｎ個の利用者キーワードを抽出する手順、
前記上位ｎ個の利用者キーワードと同じキーワードを前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する情報プロファイル検索手順、
前記上位ｎ個の利用者キーワードのキーワード値と、前記上位ｎ個の利用者キーワードと同じ情報キーワードの情報キーワード値とを乗算し、積算する手順、
前記積算によって得られる積算値が大きい上位ｍ個の情報プロファイルを有する情報を推薦情報として抽出する手順、
を実行させる情報推薦プログラム（ｎ，ｍはいずれも自然数）。
前記情報プロファイル検索手順において、前記上位ｎ個の利用者キーワードに含まれ、かつ前記対象情報群中における出現頻度が上位ｐ個に含まれるキーワードを、前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する請求項１記載の情報推薦プログラム（ｐは自然数）。
コンピュータに、
利用者が参照した情報の１又は２以上の前記情報キーワードと前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを読み込む手順、
前記利用者キーワード値の各々を、
（１−更新係数）＊前記利用者キーワード値＋全体正規化スケール値＊前記更新係数＊前記情報キーワード値／情報キーワード数
によって得られる値で更新する手順、をさらに実行させる請求項１又は２記載の情報推薦プログラム（更新係数は、１未満）。
コンピュータに、
前記情報キーワード値が所定値未満である前記情報キーワードを削除し、削除されずに残った前記情報キーワードの前記キーワード値を利用して前記情報プロファイルを形成する手順、をさらに実行させる請求項１乃至３記載の情報推薦プログラム。
１又は２以上の利用者キーワードと前記利用者キーワードに対応する利用者キーワード値とを含む利用者プロファイルを、読み込む手段、
推薦対象情報群中に含まれる１又は２以上の情報キーワードと前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを、読み込む手段、
前記利用者プロファイルから前記利用者キーワード値が大きい上位ｎ個の利用者キーワードを抽出する手段、
前記上位ｎ個の利用者キーワードと同じキーワードを前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する情報プロファイル検索手段、
前記上位ｎ個の利用者キーワードのキーワード値と、前記上位ｎ個の利用者キーワードと同じ情報キーワードの情報キーワード値とを乗算し、積算する手順、
前記積算によって得られる積算値が大きい上位ｍ個の情報プロファイルを有する情報を推薦情報として抽出する手段、
を具備する情報推薦サーバ（ｎ，ｍはいずれも自然数）。
前記情報プロファイル検索手段が、前記上位ｎ個の利用者キーワードに含まれ、かつ前記対象情報群中における出現頻度が上位ｐ個に含まれるキーワードを、前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する請求項５記載の情報推薦サーバ（ｐは自然数）。
利用者が参照した情報の１又は２以上の情報キーワードと前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを読み込む手段、
前記利用者キーワード値の各々を、
（１−更新係数）＊前記利用者キーワード値＋全体正規化スケール値＊前記更新係数＊前記情報キーワード値／情報キーワード数
によって得られる値で更新する手段、をさらに具備する請求項５又は６記載の情報推薦サーバ（更新係数は、１未満）。
前記情報キーワード値が所定値未満である前記情報キーワードを削除し、削除されずに残った前記情報キーワードの前記キーワード値を利用して前記情報プロファイルを形成する手段、をさらに具備する請求項５乃至７記載の情報推薦サーバ。
コンピュータが、
１又は２以上の利用者キーワードと前記利用者キーワードに対応する利用者キーワード値とを含む、利用者プロファイルを、読み込む手順、
対象情報群中に含まれる１又は２以上の情報の１又は２以上の情報キーワードと前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを、読み込む手順、
前記利用者プロファイルから前記利用者キーワード値が大きい上位ｎ個の利用者キーワードを抽出する手順、
前記上位ｎ個の利用者キーワードと同じキーワードを前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する情報プロファイル検索手順、
前記上位ｎ個の利用者キーワードのキーワード値と、前記上位ｎ個の利用者キーワードと同じ情報キーワードの情報キーワード値とを乗算し、積算する手順、
前記積算によって得られる積算値が大きい上位ｍ個の情報プロファイルを有する情報を推薦情報として抽出する手順、
を実行する情報推薦方法（ｎ，ｍはいずれも自然数）。
前記情報プロファイル検索手順において、前記上位ｎ個の利用者キーワードに含まれ、かつ前記対象情報群中における出現頻度が上位ｐ個に含まれるキーワードを、前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する請求項９記載の情報推薦方法（ｐは自然数）。
コンピュータが、
利用者が参照した情報の１又は２以上の情報キーワードと、前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを読み込む手順、
前記利用者キーワード値の各々を、
（１−更新係数）＊前記利用者キーワード値＋全体正規化スケール値＊前記更新係数＊前記情報キーワード値／情報キーワード数
によって得られる値で更新する手順、をさらに実行する請求項９又は１０記載の情報推薦方法（更新係数は、１未満）。
コンピュータが、
前記情報キーワード値が所定値未満である前記情報キーワードを削除し、削除されずに残った前記情報キーワードの前記キーワード値を利用して前記情報プロファイルを形成する手順、をさらに実行する請求項９乃至１１記載の情報推薦方法。