JP2005196415A - 情報推薦プログラム、情報推薦サーバ及び情報推薦方法 - Google Patents
情報推薦プログラム、情報推薦サーバ及び情報推薦方法 Download PDFInfo
- Publication number
- JP2005196415A JP2005196415A JP2004001377A JP2004001377A JP2005196415A JP 2005196415 A JP2005196415 A JP 2005196415A JP 2004001377 A JP2004001377 A JP 2004001377A JP 2004001377 A JP2004001377 A JP 2004001377A JP 2005196415 A JP2005196415 A JP 2005196415A
- Authority
- JP
- Japan
- Prior art keywords
- information
- keyword
- user
- keywords
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】 対象コンテンツが増加しても、リアルタイム処理が可能で、かつ情報推薦の精度を損なわない技術を提供する。
【解決手段】 情報推薦プログラムであって、コンピュータに、(a)1又は2以上の利用者キーワードと利用者キーワード値とを含む、利用者プロファイルを、読み込む手順、(b)対象情報群中に含まれる1又は2以上の情報の1又は2以上の情報キーワードと情報キーワード値とを含む情報プロファイルを、読み込む手順、(c)利用者プロファイルから利用者キーワード値が大きい上位n個の利用者キーワードを抽出する手順、(d)上位n個の利用者キーワードと同じキーワードを情報キーワードとして含む情報プロファイルを検索し、抽出する手順、(e)上位n個の利用者キーワードのキーワード値と、上位n個の利用者キーワードと同じ情報キーワードの情報キーワード値とを乗算し、積算する手順、(f)積算値が大きい上位m個の情報プロファイルを有する情報を推薦情報として抽出する手順、を実行させる。
【選択図】 図12
【解決手段】 情報推薦プログラムであって、コンピュータに、(a)1又は2以上の利用者キーワードと利用者キーワード値とを含む、利用者プロファイルを、読み込む手順、(b)対象情報群中に含まれる1又は2以上の情報の1又は2以上の情報キーワードと情報キーワード値とを含む情報プロファイルを、読み込む手順、(c)利用者プロファイルから利用者キーワード値が大きい上位n個の利用者キーワードを抽出する手順、(d)上位n個の利用者キーワードと同じキーワードを情報キーワードとして含む情報プロファイルを検索し、抽出する手順、(e)上位n個の利用者キーワードのキーワード値と、上位n個の利用者キーワードと同じ情報キーワードの情報キーワード値とを乗算し、積算する手順、(f)積算値が大きい上位m個の情報プロファイルを有する情報を推薦情報として抽出する手順、を実行させる。
【選択図】 図12
Description
本発明は、利用者の嗜好にあった情報をリアルタイムで推薦する技術に関し、特にその技術を利用した情報推薦プログラム、情報推薦サーバ及び情報推薦方法に関する。
現在提案されている情報推薦方式の一つに、コンテンツの文章情報内からコンテンツのキーワードベクトルを形成し、また利用者プロファイルのキーワードベクトルも形成し、両キーワードベクトルの内積をとるなどして類似度を計算した上で、コンテンツを抽出するものなどがある(例えば、特許文献1参照)。しかし、そのような類似度の計算、コンテンツの抽出は、対象コンテンツが増加するに伴い、リアルタイム処理が困難になりつつある。
特開2002−215665号公報
本発明は、対象コンテンツが増加しても、リアルタイム処理が可能で、かつ情報推薦の精度を損なわない情報推薦プログラム、情報推薦サーバ装置及び情報推薦方法を提供することを目的とする。
本発明の第1の特徴は、情報推薦プログラムであって、コンピュータに、(a)1又は2以上の利用者キーワードと各利用者キーワードに対応する利用者キーワード値とを含む、利用者プロファイルを、読み込む手順、(b)対象情報群中に含まれる1又は2以上の情報の1又は2以上の情報キーワードと各情報キーワードに対応する情報キーワード値とを含む情報プロファイルを、読み込む手順、(c)利用者プロファイルから利用者キーワード値が大きい上位n個の利用者キーワードを抽出する手順、(d)上位n個の利用者キーワードと同じキーワードを情報キーワードとして含む情報プロファイルを検索し、抽出する情報プロファイル検索手順、(e)上位n個の利用者キーワードのキーワード値と、上位n個の利用者キーワードと同じ情報キーワードの情報キーワード値とを乗算し、積算する手順、(f)積算によって得られる積算値が大きい上位m個の情報プロファイルを有する情報を推薦情報として抽出する手順、を実行させることにある(n,mはいずれも自然数)。
例えば、(a)(利用者キーワード,利用者キーワード値)が
(rkw1,rkwv1)、(rkw2,rkwv2)、(rkw3,rkwv3)である利用者プロファイルrpを読み込む。
(rkw1,rkwv1)、(rkw2,rkwv2)、(rkw3,rkwv3)である利用者プロファイルrpを読み込む。
(b)(情報キーワード,情報キーワード値)が
(jkw11,jkwv11)、(jkw12,jkwv12)、(jkw13,jkwv13)である情報プロファイルjp1と、
(jkw21,jkwv21)、(jkw22,jkwv22)、(jkw23,jkwv23)である情報プロファイルjp2と、
(jkw31,jkwv31)、(jkw32,jkwv32)、(jkw33,jkwv33)である情報プロファイルjp3を読み込む。
(jkw11,jkwv11)、(jkw12,jkwv12)、(jkw13,jkwv13)である情報プロファイルjp1と、
(jkw21,jkwv21)、(jkw22,jkwv22)、(jkw23,jkwv23)である情報プロファイルjp2と、
(jkw31,jkwv31)、(jkw32,jkwv32)、(jkw33,jkwv33)である情報プロファイルjp3を読み込む。
(c)rkwv1>rkwv2>rkwv3である場合、利用者プロファイルから利用者キーワード値が大きい上位2個の利用者キーワードとして、rkw1とrkw2を抽出する。
(d)rkw1とjkw11とjkw21が同じ、rkw2とjkw12とjkw22が同じである場合、利用者キーワードrkw1,2と同じキーワードを情報キーワードとして含む情報プロファイルとして、情報プロファイルjp1とjp2が、抽出される。
(e)(rkwv1*jkwv11)+(rkwv2*jkwv12)=V1と、
(rkwv1*jkwv21)+(rkwv2*jkwv22)=V2とを求める。
(rkwv1*jkwv21)+(rkwv2*jkwv22)=V2とを求める。
(f)V1>V2である場合に、積算値が最も大きい情報プロファイル
(jkw11,jkwv11)、(jkw12,jkwv12)、(jkw13,jkwv13)
を有する情報を推薦情報として抽出する。
(jkw11,jkwv11)、(jkw12,jkwv12)、(jkw13,jkwv13)
を有する情報を推薦情報として抽出する。
本発明の第2の特徴は、情報プロファイル検索手順において、上位n個の利用者キーワードに含まれ、かつ対象情報群中における出現頻度が上位p個に含まれるキーワードを、情報キーワードとして含む情報プロファイルを検索し、抽出することにある(pは自然数)。
本発明の第3の特徴は、(a)利用者が参照した情報の1又は2以上の情報キーワードと、情報キーワードに対応する情報キーワード値とを含む情報プロファイルを読み込む手順、(b)利用者キーワード値の各々を、
(1−更新係数)*利用者キーワード値+全体正規化スケール値*更新係数*情報キーワード値/情報キーワード数
によって得られる値で更新する手順、をさらに実行させることにある(更新係数は、1未満)。
(1−更新係数)*利用者キーワード値+全体正規化スケール値*更新係数*情報キーワード値/情報キーワード数
によって得られる値で更新する手順、をさらに実行させることにある(更新係数は、1未満)。
本発明の第4の特徴は、情報キーワード値が所定値未満である情報キーワードを削除し、削除されずに残った情報キーワードのキーワード値を利用して情報プロファイルを形成する手順、をさらに実行させることにある。
本発明の第1の特徴によれば、利用者キーワード値が大きい利用者キーワードを用いて、推薦情報を決定することによって、利用者にとって有益な情報を迅速に推薦することが可能になる。
本発明の第2の特徴によれば、利用者キーワード値が大きい利用者キーワードであって、かつ対象商品群中における出現頻度が多いキーワードを情報キーワードとして用いて、推薦情報を決定することによって、利用者にとって有益な情報をより迅速に推薦することが可能になる。
本発明の第3の特徴によれば、利用者が情報を実際に参照すると、利用者プロファイルが参照された情報の影響を受けて更新されるため、利用者プロファイルが常に利用者の嗜好を反映したものとなる。このため、利用者の嗜好が変化しても、常に利用者の嗜好に沿った情報を推薦することが可能になる。
本発明の第4の特徴によれば、重要度の低い情報キーワードを削除し、さらに削除されずに残った情報キーワードの値を利用して、推薦情報を決定することによって、利用者にとって有益な情報をより一層迅速に推薦することが可能になる。
図1は、本発明を適用した情報推薦システムの全体構成を示す。本システムは、Webブラウザを用いて商品情報を閲覧するために利用者が使用するクライアントパソコン(PC)1,2と、HTMLファイルを送信するなどして最適な商品の情報をWebブラウザが閲覧可能な状態にするWebサーバ8と、利用者プロファイルデータなどに基づいて各利用者に最適な情報を推薦する情報推薦サーバ10とを備える。クライアントパソコン1,2とWebサーバ8は、インターネットなどの通信網5を介してデータの送受信が可能である。
情報推薦サーバ10は、商品プロファイルデータなどを入力するためなどに使用される入力装置11と、データ入力の際に入力されるデータの内容を確認するためなどに使用される表示装置12と、データの送受信が可能な送受信部13と、入力装置11からの入力、表示装置12への出力、並びに送受信部13からの入力及び送受信部13への出力などを制御する入出力制御部14と、記憶装置20と、各構成要素を制御する主制御部15とを備える。
入力装置11には、キーボードやポインティングデバイスが含まれる。ポインティングデバイスには、マウス、トラックボール、トラックパッド、スティックなどが含まれる。表示装置12には、CRTディスプレイ、液晶ディスプレイ、ELディスプレイ、有機ELディスプレイ、プラズマディスプレイなどが含まれる。送受信部13には、ネットワーク・インタフェース・カード(NIC)などが含まれる。
記憶装置20とは、ハードディスク(HD)、フレキシブルディスク(FD)、光ディスク、光磁気ディスク、リードオンリーメモリ(ROM)、ランダムアクセスメモリ(RAM)などであり、商品プロファイルデータベース(DB)と、キーワード統計情報DBと、利用者プロファイルDBと、お勧めルールDBとが記憶されている。また、図示されていないが、基本入出力システム(BIOS)やオペレーティングシステム(OS)なども記憶されている。
図2に、商品プロファイルデータ構造の一例を示す。図2に示すように、商品プロファイルデータは、商品プロファイル基本情報テーブルと商品プロファイル基本キーワードテーブルとを有する。
図2(a)に示す商品プロファイル基本情報テーブルは、商品IDと、商品名と、プロファイルカテゴリ種別と、商品分類種別1,2,3とを有する。プロファイルカテゴリ種別は、利用者プロファイルを形成する際のプロファイルカテゴリを示す。商品分類種別1,2,3は、より適切な推薦をするために必要な分類情報である。
図2(b)に示す商品プロファイル基本キーワードテーブルは、商品IDと商品プロファイルキーワード(適宜「商品キーワード」と略す。)とを有する。単一の商品IDに対して、1又は2以上の商品キーワードが存在する。
図3(a)に、利用者プロファイルデータ構造の一例を示す。図3(a)に示すように、利用者プロファイルデータは、利用者IDと、プロファイルカテゴリ種別と、利用者プロファイルキーワード(適宜「利用者キーワード」と略す。)と利用者プロファイルキーワード値(適宜「利用者キーワード値」と略す。)とを有する。利用者キーワード値は、利用者キーワードの利用者プロファイル中における重みを示す。単一の利用者IDに対して、1又は2以上のプロファイルカテゴリ種別が存在する。単一のプロファイルカテゴリ種別に対して、1又は2以上の利用者プロファイルキーワードが存在する。単一の利用者プロファイルキーワードに対して、単一の利用者プロファイルキーワード値が存在する。
図3(b)に、利用者プロファイルデータの一例を示す。図3(b)に示すように、利用者ID:100に対して、プロファイルカテゴリ種別は「女性向け商品」と「男性向け商品」とが存在する。「利用者ID:100、プロファイルカテゴリ種別:女性向け商品」という組み合わせに対して、利用者プロファイルキーワードは「スカート」、「ギャザー」、「ヒップ」が存在する。また、「利用者ID:100、プロファイルカテゴリ種別:男性向け商品」という組み合わせに対して、利用者プロファイルキーワードは「リア」、「エクステリア」が存在する。そして、「キーワード、キーワード値」は「スカート、800」、「ギャザー、630」、「ヒップ、20」、「リア、940」、「エクステリア、550」となっている。
図4に、キーワード統計情報データ構造の一例を示す。図4に示すように、キーワード統計情報データは、キーワードとキーワード出現頻度を有する。キーワードは、商品プロファイルを構成する要素である。出現頻度は、そのキーワードをプロファイル中に含む商品の数である。
お勧めルールとは、推薦情報決定処理時に参照されるルールである。例えば、利用者プロファイル中におけるキーワード値が大きい上位キーワードで対象商品群の商品プロファイルを検索する場合に、上位「3つ」(第1番から第3番まで)だけを検索キーワードとして使用し、4番目以降は使用しない、などが含まれる。
本実施例における処理の全体像を説明する。
まず、図5(a)に示すように、前処理として、商品データを入力し(ステップS10)、商品データを記録し(ステップS20)、商品プロファイルを形成し(ステップS30)、キーワード統計情報を生成する(ステップS40)。商品プロファイルの形成、キーワード統計情報の生成については、追って詳述する。
次に、図5(b)に示すように、利用者アクション情報を収集し(ステップS50)、利用者プロファイルを形成する(ステップS60)。利用者プロファイルの形成には、ステップS30で形成された商品プロファイルが利用される。利用者プロファイルの形成については、追って詳述する。
さらに、図5(c)に示すように、推薦する情報を決定し(ステップS70)、推薦する情報を表示する(ステップS80)。推薦する情報の決定には、ステップS30で形成された商品プロファイル、ステップS40で生成されたキーワード統計情報、及びステップS60で形成された利用者プロファイルが利用される。推薦する情報の決定については、追って詳述する。情報推薦サーバが「推薦情報」を決定する。「推薦情報」に関連付けられ、「推薦情報」を表示可能なHTMLファイルを、WebサーバがクライアントPCに提供する。HTMLファイルがクライアントPCで起動しているWebブラウザによって解釈され、「推薦情報」が閲覧可能になる。
(商品プロファイル形成処理について)
図6に基づいて、商品プロファイル形成処理について説明する。
図6に基づいて、商品プロファイル形成処理について説明する。
ステップS101:商品関連コンテンツを入力する。商品関連コンテンツには、商品ID、商品名、プロファイルカテゴリ種別、キーワードが含まれる。
ステップS102:キーワードベクトルを抽出する。キーワードベクトル抽出法としては、主にTF/IDF法が使用される。IT/IDF法でキーワード毎に生成される重み値をキーワード値とする。
キーワードベクトルは、「キーワード」と「キーワード値」からなる。各商品IDは、1又は2以上のキーワードを有し、各キーワードはキーワード値を有する。
図7(a)に、抽出されたキーワードベクトルの一例を示す。図7(a)に示すように、例えば、「12531」という商品IDを有する商品のキーワードベクトルは、
(キーワード,キーワード値)=(フリル,5)、(暖かい,4)、(女性らしい,4)、(白,2)
となる。
(キーワード,キーワード値)=(フリル,5)、(暖かい,4)、(女性らしい,4)、(白,2)
となる。
ステップS103:常用度の低いキーワードベクトルを廃棄する。例えば、図7(b)に、図7(a)のキーワードベクトルからキーワード値が「2」以下のキーワードを除去した例を示す。図7(b)に示すように、商品IDが「12531」である商品に関して、キーワード値が「2」であるキーワード「白」が除去される。そして、商品IDが「12531」である商品のキーワードベクトルは、
(キーワード,キーワード値)=(フリル,5)、(暖かい,4)、(女性らしい,4)
となる。
(キーワード,キーワード値)=(フリル,5)、(暖かい,4)、(女性らしい,4)
となる。
除去されるキーワードはキーワード値が「2」以下のキーワードに限定されない。重みが「3」以下のキーワードを除去するとしても良い。キーワード値が「3」以下のキーワードを除去した場合、商品IDが「12532」である商品のキーワードベクトルは、
(キーワード,キーワード値)=(UV,5)、(形状記憶,5)
だけになる。
(キーワード,キーワード値)=(UV,5)、(形状記憶,5)
だけになる。
キーワード値が所定値以下のキーワードを除去するのではなく、各商品毎にキーワード値が上から所定番目以降のキーワードを除去するとしても良い。例えば、キーワード値が上から4番目以降のキーワードを除去する場合、商品IDが「12533」である商品のキーワードベクトルは、
(キーワード,キーワード値)=(暖かい,4)、(女性らしい,5)、(ウール,3)
になる。また、キーワード値が上から5番目以降のキーワードを除去する場合、商品IDが「12534」である商品のキーワードベクトルは、
(キーワード,キーワード値)=(撥水性,3)、(ロング,3)、(雨,2)、(寒い,2)
になる。
(キーワード,キーワード値)=(暖かい,4)、(女性らしい,5)、(ウール,3)
になる。また、キーワード値が上から5番目以降のキーワードを除去する場合、商品IDが「12534」である商品のキーワードベクトルは、
(キーワード,キーワード値)=(撥水性,3)、(ロング,3)、(雨,2)、(寒い,2)
になる。
ステップS105:各商品のプロファイルカテゴリ種別及び商品分類種別を決定する。図8にプロファイルカテゴリ種別及び商品分類種別の一例を示す。図8に示すように、プロファイルカテゴリ種別として「女性向け商品」、「男性向け商品」などの大きな種別を入れ、また商品分類種別として「ミドル・シニア」、「手洗い」、「ドライ」などの細かな種別を入れる。
ステップS106:商品プロファイル情報を商品プロファイルDBへ保存する。上記のような処理の結果、形成された商品プロファイルを商品プロファイルDBへ保存し、後述するキーワード統計情報生成処理、利用者プロファイル更新処理、推薦情報決定処理において使用する。
(キーワード統計情報生成処理について)
図9に基づいて、キーワード統計情報生成について説明する。
図9に基づいて、キーワード統計情報生成について説明する。
ステップS201:商品プロファイルデータを取得する。
ステップS202:商品プロファイルデータからキーワード統計情報を抽出する。キーワード統計情報には、例えばキーワードの出現頻度が含まれる。
図10に、図7(b)のキーワードの集合に関するキーワード出現頻度を示す。図10に示すように、「フリル」というキーワードは、商品ID:12531に関してしか使用されていないので、出現頻度は「1」となり、「暖かい」というキーワードは、商品ID:12531、12533、12535に関してしか使用されているので、出現頻度は「3」となる。
ステップS203:キーワード統計情報をキーワード統計情報DBへ保存する。
(利用者プロファイル形成処理について)
図11に基づいて、利用者プロファイル形成処理について説明する。この例では、利用者がWebサービス上で商品を購入したり、商品情報を参照したりする場合の利用者プロファイルの形成処理について説明している。
図11に基づいて、利用者プロファイル形成処理について説明する。この例では、利用者がWebサービス上で商品を購入したり、商品情報を参照したりする場合の利用者プロファイルの形成処理について説明している。
ステップS301:利用者が参照した商品の商品プロファイルAを商品プロファイルDBから取得する。商品プロファイルAは、例えば
(キーワード、キーワード値)=(LSI 2.0、アメリカ 3.0)とする。
(キーワード、キーワード値)=(LSI 2.0、アメリカ 3.0)とする。
ステップS302:利用者の利用者プロファイルを利用者プロファイルDBから取得する。利用者プロファイルPは、例えば
(キーワード、キーワード値)=(コンピュータ 400、通信 350、無線 150、LSI 100)とする。
(キーワード、キーワード値)=(コンピュータ 400、通信 350、無線 150、LSI 100)とする。
ステップS303:利用者プロファイルPの各キーワード値を全体正規化スケール値Tで除算して利用者プロファイルP’とする。T=1000とすると、利用者プロファイルP’は、
(キーワード、キーワード値)=(コンピュータ 0.4、通信 0.35、無線 0.15、LSI 0.1)となる。
(キーワード、キーワード値)=(コンピュータ 0.4、通信 0.35、無線 0.15、LSI 0.1)となる。
全体正規化スケール値Tとは、利用者プロファイルPの全てのキーワード値の合計値である。利用者プロファイルPが、
(キーワード、キーワード値)=(コンピュータ 400、通信 350、無線 150、LSI 100)の場合、
(400+350+150+100)=1000
であるから、全体正規化スケール値Tは「1000」になる。
(キーワード、キーワード値)=(コンピュータ 400、通信 350、無線 150、LSI 100)の場合、
(400+350+150+100)=1000
であるから、全体正規化スケール値Tは「1000」になる。
ステップS304:利用者プロファイルP’の各キーワードの値を(1−更新係数α)で乗算して利用者プロファイルP’’する。更新係数α=0.2とすると、(1−更新係数α)=0.8であるから、利用者プロファイルP’’は、
(キーワード、キーワード値)=(コンピュータ 0.32、通信 0.28、無線 0.12、LSI 0.08)となる。
(キーワード、キーワード値)=(コンピュータ 0.32、通信 0.28、無線 0.12、LSI 0.08)となる。
更新係数αは「0.2」に限られない。
利用者の長期にわたる嗜好傾向を重視する場合は、更新係数は小さい方が好ましいので、例えば「0.1」とする。これにより、選択された商品プロファイルの利用者プロファイルへの影響が大きくなる。一方、利用者の短期の嗜好傾向を重視する場合は、更新係数は大きい方が好ましいので、例えば「0.3」とする。これにより、選択された商品プロファイルの利用者プロファイルへの影響は小さくなる。
ステップS305:更新係数αを、商品プロファイルAのキーワード数Nで割った値を商品プロファイルAの各キーワード値に乗算して、商品プロファイルA’を得る。更新係数α=0.2、商品プロファイルAのキーワード数N=2であるから、
(更新係数α/商品プロファイルのキーワード数N)=0.1となり、
商品プロファイルA’は、
(キーワード、キーワード値)=(LSI 0.1、アメリカ 0.1)となる。
(更新係数α/商品プロファイルのキーワード数N)=0.1となり、
商品プロファイルA’は、
(キーワード、キーワード値)=(LSI 0.1、アメリカ 0.1)となる。
ステップS306:利用者プロファイルP’’のキーワード値を、商品プロファイルA’のキーワード値に加えて、利用者プロファイルP’’’とする。
利用者プロファイルP’’が、
(キーワード、キーワード値)=(コンピュータ 0.32、通信 0.28、無線 0.12、LSI 0.08)で、
商品プロファイルA’が、
(キーワード、キーワード値)=(LSI 0.1、アメリカ 0.1)であるから、
利用者プロファイルP’’’は、
(キーワード、キーワード値)=(コンピュータ 0.32、通信 0.28、無線 0.12、LSI 0.18、アメリカ 0.1)となる。
(キーワード、キーワード値)=(コンピュータ 0.32、通信 0.28、無線 0.12、LSI 0.08)で、
商品プロファイルA’が、
(キーワード、キーワード値)=(LSI 0.1、アメリカ 0.1)であるから、
利用者プロファイルP’’’は、
(キーワード、キーワード値)=(コンピュータ 0.32、通信 0.28、無線 0.12、LSI 0.18、アメリカ 0.1)となる。
ステップS307:利用者プロファイルP’’’の各キーワード値を全体正規化スケール値Tで乗算して、利用者プロファイルP’’’’とする。
利用者プロファイルP’’’は、
(キーワード、キーワード値)=(コンピュータ 0.32、通信 0.28、無線 0.12、LSI 0.18、アメリカ 0.1)であり、
全体正規化スケール値T=1000であるから、
利用者プロファイルP’’’’は、
(キーワード、キーワード値)=(コンピュータ 320、通信 280、無線 120、LSI 180、アメリカ 100)となる。
(キーワード、キーワード値)=(コンピュータ 0.32、通信 0.28、無線 0.12、LSI 0.18、アメリカ 0.1)であり、
全体正規化スケール値T=1000であるから、
利用者プロファイルP’’’’は、
(キーワード、キーワード値)=(コンピュータ 320、通信 280、無線 120、LSI 180、アメリカ 100)となる。
ステップS308:利用者プロファイルP’’’’を更新された利用者プロファイルとして利用者プロファイルDBに保存する。
これら一連の処理によって、利用者プロファイルは、利用者が参照した商品の商品プロファイルを反映して
(キーワード、キーワード値)=(コンピュータ 400、通信 350、無線 150、LSI 100)から
(キーワード、キーワード値)=(コンピュータ 320、通信 280、無線 120、LSI 180、アメリカ 100)へ更新される。
(キーワード、キーワード値)=(コンピュータ 400、通信 350、無線 150、LSI 100)から
(キーワード、キーワード値)=(コンピュータ 320、通信 280、無線 120、LSI 180、アメリカ 100)へ更新される。
よって、利用者の嗜好の変化に適切に追従して、利用者プロファイルを逐次更新することが可能となる。
なお、上記説明は利用者プロファイルの「更新」として説明したが、同様な方法で利用者プロファイルの初期値を形成することもできる。
例えば、利用者プロファイルが無い初期状態で、商品プロファイルA
(キーワード、キーワード値)=(LSI 1.0、アメリカ 1.0)
の商品を閲覧したとする。
(キーワード、キーワード値)=(LSI 1.0、アメリカ 1.0)
の商品を閲覧したとする。
この場合、ステップS302の利用者プロファイルPが「0」であるから、
ステップS303の利用者プロファイルP’も「0」となり、
ステップS304の利用者プロファイルP’’も「0」となる。
ステップS303の利用者プロファイルP’も「0」となり、
ステップS304の利用者プロファイルP’’も「0」となる。
そして、ステップS301の商品プロファイルAが
(キーワード、キーワード値)=(LSI 1.0、アメリカ 1.0)
であるから、
ステップS305の商品プロファイルA’は、
(キーワード、キーワード値)=(LSI 0.1、アメリカ 0.1)
となり、
ステップS306の利用者プロファイルP’’’は
(キーワード、キーワード値)=(LSI 0.1、アメリカ 0.1)
となり、キーワード値の比は0.1:0.1のままで、キーワード値の総和が1000となるようにするために、5000を乗算して、
ステップS307の利用者プロファイルP’’’’は
(キーワード、キーワード値)=(LSI 500、アメリカ 500)
となる。
(キーワード、キーワード値)=(LSI 1.0、アメリカ 1.0)
であるから、
ステップS305の商品プロファイルA’は、
(キーワード、キーワード値)=(LSI 0.1、アメリカ 0.1)
となり、
ステップS306の利用者プロファイルP’’’は
(キーワード、キーワード値)=(LSI 0.1、アメリカ 0.1)
となり、キーワード値の比は0.1:0.1のままで、キーワード値の総和が1000となるようにするために、5000を乗算して、
ステップS307の利用者プロファイルP’’’’は
(キーワード、キーワード値)=(LSI 500、アメリカ 500)
となる。
(推薦情報決定処理について)
図12に基づいて、推薦情報決定処理について説明する。
図12に基づいて、推薦情報決定処理について説明する。
ステップS401:利用者の利用者プロファイルを取得する。利用者プロファイルが、
(キーワード、キーワード値)=(コンピュータ 300、通信 280、LSI 200、無線 120、アメリカ 100)であるとする。
(キーワード、キーワード値)=(コンピュータ 300、通信 280、LSI 200、無線 120、アメリカ 100)であるとする。
ステップS402:対象商品群のキーワード統計情報を取得する。対象商品群とは、利用者プロファイルに記憶されているカテゴリ種別と同じカテゴリ種別を有する商品の集合を言う。
例えば、ある利用者が、2つの利用者プロファイルを有し、一方の利用者プロファイルのプロファイルカテゴリ種別がカテゴリ001で、他方の利用者プロファイルのプロファイルカテゴリ種別がカテゴリ002であるとする。そして、その利用者が、あるWebページにアクセスした場合に、そのWebページで閲覧可能な商品は、商品プロファイルのプロファイルカテゴリ種別がカテゴリ001のものと、カテゴリ003のものであるとする。
このような場合に、ステップS402では、利用者のプロファイルカテゴリ種別のいずれかと一致するカテゴリ種別を有する商品のみが、対象商品群に含まれる。つまり、前記の例では、商品プロファイルのプロファイルカテゴリ種別がカテゴリ001である商品のみが、対象商品群に含まれる。
実施例1におけるキーワード統計情報は、
(キーワード、出現頻度)=(アメリカ 30、日本 20、コンピュータ 20、LSI 15、ネットワーク 10、光 10)とする。
(キーワード、出現頻度)=(アメリカ 30、日本 20、コンピュータ 20、LSI 15、ネットワーク 10、光 10)とする。
ステップS403:利用者プロファイルの上位キーワードでキーワード統計情報を検索する。例えば、上位キーワードの個数を「3」とすると、最上位のキーワード「コンピュータ」と、2番目のキーワード「通信」と、3番目のキーワード「LSI」が検索キーワードとなる。
上位キーワードの個数は、「3」に限定されない。この数は、推薦情報をどのくらい絞り込めるかに依存する。例えば、3で実施して、該当する商品が何百件もマッチするようであれば、数を増やすべきであるし、逆に一件もマッチしないようであれば、数を減らすべきである。
ステップS404:利用者プロファイル中の上位キーワードで、キーワード統計情報を検索する。例えば、利用者プロファイル中の上位キーワードが「コンピュータ、通信、LSI」であるなら、これらとマッチするキーワード統計情報中のキーワードとその出現頻度は、
(キーワード、出現頻度)=(コンピュータ 20)、(LSI 15)となる。
(キーワード、出現頻度)=(コンピュータ 20)、(LSI 15)となる。
ステップS405:ステップS404で取得されたキーワードを商品プロファイル中に含む商品を検索し、抽出する。
ステップS406:ステップS405で抽出された商品の商品プロファイルを取得する。例えば、以下のような商品A〜Cの商品プロファイルが取得される。
商品Aの商品プロファイル
(キーワード、キーワード値)=(コンピュータ 1.0、光 2.0、日本 1.0)
商品Bの商品プロファイル
(キーワード、キーワード値)=(LSI 2.0、無線 1.0、アメリカ 3.0)
商品Cの商品プロファイル
(キーワード、キーワード値)=(コンピュータ 2.0、LSI 1.0)
ステップS407:ステップS406で取得された商品プロファイルと利用者プロファイルとの一致度を計算する。具体的には、両プロファイル中に共通して存在するキーワードのキーワード値を乗算し、得られた値の総和を求める。
(キーワード、キーワード値)=(コンピュータ 1.0、光 2.0、日本 1.0)
商品Bの商品プロファイル
(キーワード、キーワード値)=(LSI 2.0、無線 1.0、アメリカ 3.0)
商品Cの商品プロファイル
(キーワード、キーワード値)=(コンピュータ 2.0、LSI 1.0)
ステップS407:ステップS406で取得された商品プロファイルと利用者プロファイルとの一致度を計算する。具体的には、両プロファイル中に共通して存在するキーワードのキーワード値を乗算し、得られた値の総和を求める。
例えば、まず利用者プロファイルと商品Aの商品プロファイルとの一致度を計算する。 両プロファイル中に共通して存在するキーワードは、コンピュータだけであって、
利用者プロファイル中のコンピュータのキーワード値は「300」、
商品Aの商品プロファイル中のコンピュータのキーワード値は「1.0」であるから、一致度は、300*1.0=300となる。
利用者プロファイル中のコンピュータのキーワード値は「300」、
商品Aの商品プロファイル中のコンピュータのキーワード値は「1.0」であるから、一致度は、300*1.0=300となる。
次に、利用者プロファイルと商品Bの商品プロファイルとの一致度を計算する。両プロファイル中に共通して存在するキーワードは、「LSI」、「無線」、「アメリカ」の3つであって、
利用者プロファイル中のLSIのキーワード値は「200」、無線のキーワード値は「120」、アメリカのキーワード値は「100」、
商品Bの商品プロファイル中のLSIのキーワード値は「1.0」、無線のキーワード値は「1.0」、アメリカのキーワード値は「1.0」であるから、
一致度は、200*2.0+120*1.0+100*3.0=820となる。
利用者プロファイル中のLSIのキーワード値は「200」、無線のキーワード値は「120」、アメリカのキーワード値は「100」、
商品Bの商品プロファイル中のLSIのキーワード値は「1.0」、無線のキーワード値は「1.0」、アメリカのキーワード値は「1.0」であるから、
一致度は、200*2.0+120*1.0+100*3.0=820となる。
さらに、利用者プロファイルと商品Cの商品プロファイルとの一致度を計算する。両プロファイル中に共通して存在するキーワードは、「コンピュータ」と「LSI」の2つであって、
利用者プロファイル中のコンピュータのキーワード値は「300」、LSIのキーワード値は「200」、
商品Bの商品プロファイル中のコンピュータのキーワード値は「1.0」、LSIのキーワード値は「1.0」であるから、
一致度は、300*2.0+200*1.0=800となる。
利用者プロファイル中のコンピュータのキーワード値は「300」、LSIのキーワード値は「200」、
商品Bの商品プロファイル中のコンピュータのキーワード値は「1.0」、LSIのキーワード値は「1.0」であるから、
一致度は、300*2.0+200*1.0=800となる。
よって、商品Aの一致度は300、商品Bの一致度は820、商品Cの一致度は800となる。
ステップS408:一致度の高い商品を推薦商品とする。例えば、上位2つを推薦商品とする場合、商品Bと商品Cがお勧め商品としてピックアップされる。なお、推薦商品は、「上位2つ」に限定されない。
上記の如く、利用者プロファイル、キーワード統計情報に基づいて、推薦情報が決定される。利用者プロファイル中の上位キーワードだけを用いて、利用者プロファイルと商品プロファイルとの一致度を計算し、一致度の高い商品だけを推薦することによって利用者の嗜好に沿った情報を迅速に推薦することが可能になる。
上記実施例においては、利用者プロファイルに沿った最適な「商品」を推薦するものとしたが、本発明は「商品」を推薦する場合に限定されない。「商品」の代わりに、「ニュース」などの情報を推薦する場合にも使用可能である。その場合は、各ニュースに対して「ニュース・キーワード」や「ニュース・キーワード値」を設定する。
1…クライアントPC、 2…クライアントPC、 5…通信網、
8…Webサーバ、 11…入力装置、 12…表示装置、
13…送受信部 14…入出力制御部、 15…主制御部(CPU)、
20…記憶装置、
8…Webサーバ、 11…入力装置、 12…表示装置、
13…送受信部 14…入出力制御部、 15…主制御部(CPU)、
20…記憶装置、
Claims (12)
- コンピュータに、
1又は2以上の利用者キーワードと前記利用者キーワードに対応する利用者キーワード値とを含む利用者プロファイルを、読み込む手順、
推薦対象情報群中に含まれる1又は2以上の情報の1又は2以上の情報キーワードと前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを、読み込む手順、
前記利用者プロファイルから前記利用者キーワード値が大きい上位n個の利用者キーワードを抽出する手順、
前記上位n個の利用者キーワードと同じキーワードを前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する情報プロファイル検索手順、
前記上位n個の利用者キーワードのキーワード値と、前記上位n個の利用者キーワードと同じ情報キーワードの情報キーワード値とを乗算し、積算する手順、
前記積算によって得られる積算値が大きい上位m個の情報プロファイルを有する情報を推薦情報として抽出する手順、
を実行させる情報推薦プログラム(n,mはいずれも自然数)。 - 前記情報プロファイル検索手順において、前記上位n個の利用者キーワードに含まれ、かつ前記対象情報群中における出現頻度が上位p個に含まれるキーワードを、前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する請求項1記載の情報推薦プログラム(pは自然数)。
- コンピュータに、
利用者が参照した情報の1又は2以上の前記情報キーワードと前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを読み込む手順、
前記利用者キーワード値の各々を、
(1−更新係数)*前記利用者キーワード値+全体正規化スケール値*前記更新係数*前記情報キーワード値/情報キーワード数
によって得られる値で更新する手順、をさらに実行させる請求項1又は2記載の情報推薦プログラム(更新係数は、1未満)。 - コンピュータに、
前記情報キーワード値が所定値未満である前記情報キーワードを削除し、削除されずに残った前記情報キーワードの前記キーワード値を利用して前記情報プロファイルを形成する手順、をさらに実行させる請求項1乃至3記載の情報推薦プログラム。 - 1又は2以上の利用者キーワードと前記利用者キーワードに対応する利用者キーワード値とを含む利用者プロファイルを、読み込む手段、
推薦対象情報群中に含まれる1又は2以上の情報キーワードと前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを、読み込む手段、
前記利用者プロファイルから前記利用者キーワード値が大きい上位n個の利用者キーワードを抽出する手段、
前記上位n個の利用者キーワードと同じキーワードを前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する情報プロファイル検索手段、
前記上位n個の利用者キーワードのキーワード値と、前記上位n個の利用者キーワードと同じ情報キーワードの情報キーワード値とを乗算し、積算する手順、
前記積算によって得られる積算値が大きい上位m個の情報プロファイルを有する情報を推薦情報として抽出する手段、
を具備する情報推薦サーバ(n,mはいずれも自然数)。 - 前記情報プロファイル検索手段が、前記上位n個の利用者キーワードに含まれ、かつ前記対象情報群中における出現頻度が上位p個に含まれるキーワードを、前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する請求項5記載の情報推薦サーバ(pは自然数)。
- 利用者が参照した情報の1又は2以上の情報キーワードと前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを読み込む手段、
前記利用者キーワード値の各々を、
(1−更新係数)*前記利用者キーワード値+全体正規化スケール値*前記更新係数*前記情報キーワード値/情報キーワード数
によって得られる値で更新する手段、をさらに具備する請求項5又は6記載の情報推薦サーバ(更新係数は、1未満)。 - 前記情報キーワード値が所定値未満である前記情報キーワードを削除し、削除されずに残った前記情報キーワードの前記キーワード値を利用して前記情報プロファイルを形成する手段、をさらに具備する請求項5乃至7記載の情報推薦サーバ。
- コンピュータが、
1又は2以上の利用者キーワードと前記利用者キーワードに対応する利用者キーワード値とを含む、利用者プロファイルを、読み込む手順、
対象情報群中に含まれる1又は2以上の情報の1又は2以上の情報キーワードと前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを、読み込む手順、
前記利用者プロファイルから前記利用者キーワード値が大きい上位n個の利用者キーワードを抽出する手順、
前記上位n個の利用者キーワードと同じキーワードを前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する情報プロファイル検索手順、
前記上位n個の利用者キーワードのキーワード値と、前記上位n個の利用者キーワードと同じ情報キーワードの情報キーワード値とを乗算し、積算する手順、
前記積算によって得られる積算値が大きい上位m個の情報プロファイルを有する情報を推薦情報として抽出する手順、
を実行する情報推薦方法(n,mはいずれも自然数)。 - 前記情報プロファイル検索手順において、前記上位n個の利用者キーワードに含まれ、かつ前記対象情報群中における出現頻度が上位p個に含まれるキーワードを、前記情報キーワードとして含む前記情報プロファイルを検索し、抽出する請求項9記載の情報推薦方法(pは自然数)。
- コンピュータが、
利用者が参照した情報の1又は2以上の情報キーワードと、前記情報キーワードに対応する情報キーワード値とを含む情報プロファイルを読み込む手順、
前記利用者キーワード値の各々を、
(1−更新係数)*前記利用者キーワード値+全体正規化スケール値*前記更新係数*前記情報キーワード値/情報キーワード数
によって得られる値で更新する手順、をさらに実行する請求項9又は10記載の情報推薦方法(更新係数は、1未満)。 - コンピュータが、
前記情報キーワード値が所定値未満である前記情報キーワードを削除し、削除されずに残った前記情報キーワードの前記キーワード値を利用して前記情報プロファイルを形成する手順、をさらに実行する請求項9乃至11記載の情報推薦方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004001377A JP2005196415A (ja) | 2004-01-06 | 2004-01-06 | 情報推薦プログラム、情報推薦サーバ及び情報推薦方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004001377A JP2005196415A (ja) | 2004-01-06 | 2004-01-06 | 情報推薦プログラム、情報推薦サーバ及び情報推薦方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2005196415A true JP2005196415A (ja) | 2005-07-21 |
Family
ID=34816909
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004001377A Pending JP2005196415A (ja) | 2004-01-06 | 2004-01-06 | 情報推薦プログラム、情報推薦サーバ及び情報推薦方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2005196415A (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007323274A (ja) * | 2006-05-31 | 2007-12-13 | Hitachi Electronics Service Co Ltd | 情報提供装置、情報提供方法及び情報提供プログラム |
| JP2008123210A (ja) * | 2006-11-10 | 2008-05-29 | Fujitsu Ltd | 情報検索装置及び情報検索方法 |
| JP2009508275A (ja) * | 2005-09-13 | 2009-02-26 | ヤフー! インコーポレイテッド | 短期及び長期ユーザ行動的関心度の組合せに基づいてネットワーク上で広告を選択して配信するためのフレームワーク |
| JP2009129458A (ja) * | 2007-11-19 | 2009-06-11 | Core Logic Inc | コンテンツ推薦装置及び方法 |
| EP2397952A1 (en) * | 2010-06-15 | 2011-12-21 | Axel Springer Digital TV Guide GmbH | Profile based content retrieval for recommender systems |
-
2004
- 2004-01-06 JP JP2004001377A patent/JP2005196415A/ja active Pending
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009508275A (ja) * | 2005-09-13 | 2009-02-26 | ヤフー! インコーポレイテッド | 短期及び長期ユーザ行動的関心度の組合せに基づいてネットワーク上で広告を選択して配信するためのフレームワーク |
| JP2007323274A (ja) * | 2006-05-31 | 2007-12-13 | Hitachi Electronics Service Co Ltd | 情報提供装置、情報提供方法及び情報提供プログラム |
| JP2008123210A (ja) * | 2006-11-10 | 2008-05-29 | Fujitsu Ltd | 情報検索装置及び情報検索方法 |
| JP2009129458A (ja) * | 2007-11-19 | 2009-06-11 | Core Logic Inc | コンテンツ推薦装置及び方法 |
| US8209337B2 (en) | 2007-11-19 | 2012-06-26 | Core Logic, Inc. | Content recommendation apparatus and method using tag cloud |
| EP2397952A1 (en) * | 2010-06-15 | 2011-12-21 | Axel Springer Digital TV Guide GmbH | Profile based content retrieval for recommender systems |
| WO2011157729A3 (en) * | 2010-06-15 | 2012-03-01 | Axel Springer Digital Tv Guide Gmbh | Profile based content retrieval for recommender systems |
| CN103052954A (zh) * | 2010-06-15 | 2013-04-17 | 阿克塞尔斯普林格数字电视指导有限责任公司 | 推荐系统的基于简档内容检索 |
| US9477783B2 (en) | 2010-06-15 | 2016-10-25 | Funke Digital Tv Guide Gmbh | Profile based content retrieval for recommender systems |
| US10372759B2 (en) | 2010-06-15 | 2019-08-06 | Funke Digital Tv Guide Gmbh | Profile based content retrieval for recommender systems |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11681750B2 (en) | System and method for providing content to users based on interactions by similar other users | |
| JP5638031B2 (ja) | 格付け方法、検索結果分類方法、格付けシステム及び検索結果分類システム | |
| Carraro et al. | Enhancing recommendation diversity by re-ranking with large language models | |
| US20070260597A1 (en) | Dynamic search engine results employing user behavior | |
| KR100672277B1 (ko) | 개인화 검색 방법 및 검색 서버 | |
| JP6664599B2 (ja) | 曖昧性評価装置、曖昧性評価方法、及び曖昧性評価プログラム | |
| CN112579854A (zh) | 信息处理方法、装置、设备和存储介质 | |
| JP6593873B2 (ja) | 情報分析装置及び情報分析方法 | |
| JP2003091552A (ja) | 検索要求情報抽出方法及びその実施システム並びにその処理プログラム | |
| JP5084796B2 (ja) | 関連性判定装置、関連性判定方法およびプログラム | |
| JP5579140B2 (ja) | 文書検索装置及び方法及びプログラム | |
| JP4640554B2 (ja) | サーバ装置、情報処理方法およびプログラム | |
| JP2005196415A (ja) | 情報推薦プログラム、情報推薦サーバ及び情報推薦方法 | |
| JP2023091791A (ja) | 回答候補提案システムおよび回答候補提案方法 | |
| JP5072792B2 (ja) | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ | |
| WO2017134760A1 (ja) | 情報検索方法及び情報検索装置並びに情報検索システム | |
| JP2004157649A (ja) | 階層化されたユーザプロファイル作成方法およびシステム並びに階層化されたユーザプロファイル作成プログラムおよびそれを記録した記録媒体 | |
| JP7046592B2 (ja) | 検索支援システム、検索支援方法、及び検索支援プログラム | |
| JP2011175453A (ja) | キーワード検索システム | |
| JP4938515B2 (ja) | 単語間相関度計算装置および方法、プログラム並びに記録媒体 | |
| JP7309669B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
| JP5835754B2 (ja) | 情報検索支援装置、情報検索支援方法、情報検索支援プログラム、プログラム格納媒体 | |
| JP4755834B2 (ja) | 属性評価装置、属性評価方法および属性評価プログラム | |
| JP2002117043A (ja) | 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体 | |
| JP2015084178A (ja) | 広告生成装置および広告生成方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061127 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090714 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090909 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090929 |