トップ :: G 物理学 :: G06 計算;計数




【発明の名称】 情報検索装置
【発明者】 【氏名】立石 健二

【要約】 【課題】文書内において評判情報が出現する位置を判別する。

【解決手段】評判情報判別手段3は、評価表現を記憶する評価表現記憶部301と、文書入力手段1から入力された文書集合における検索語入力手段2から入力された検索語の位置を特定し、その検索語の位置情報を表現間距離判定手段304に出力する検索語位置特定手段302と、文書入力手段1から入力された文書集合における評価表現記憶部301に記憶されたいずれかの評価表現が出現する位置を特定し、その評価表現の位置情報を表現間距離判定手段304に出力する評価表現位置特定手段303と、検索語位置特定手段302で出力された検索語の位置情報と評価表現位置特定手段303で出力された評価表現の位置情報の距離が一定の範囲内ならば、その評価表現を検索語の評判情報と判別し、その評判情報の位置情報を判別結果記憶部4に出力する表現間距離判定手段304を有する。
【特許請求の範囲】
【請求項1】文書内における事物に対する価値を定める評価表現が検索語に対する評判情報か否かを判断し、評判情報の位置情報を判別することを特徴とする情報検索装置。
【請求項2】入力された文書集合における入力された検索語の位置を特定する検索語位置特定手段と、事物に対する価値を定める評価表現を記憶する評価表現記憶部と、入力された文書集合における前記評価表現記憶部に記憶されたいずれかの前記評価表現が出現する位置を特定する評価表現位置特定手段と、前記検索語位置特定手段により出力された前記検索語の位置と前記評価表現位置特定手段により出力された前記評価表現の位置の距離が一定の範囲内ならば当該評価表現を前記検索語の評判情報と判別する表現間距離判定手段とを備えたことを特徴とする情報検索装置。
【請求項3】前記検索語の分野を特定する検索語分野特定手段を備え、前記評価表現記憶部が、前記評価表現に加え、前記評価表現に関する分野情報を記憶し、前記評価表現位置特定手段が、前記検索語分野特定手段により特定された前記検索語の分野と、前記評価表現記憶部の前記評価表現に関する分野情報とを参照し、前記評価表現記憶部に記憶された前記特定された検索語の分野に属するいずれかの前記評価表現が出現する位置を特定することを特徴とする請求項2に記載の情報検索装置。
【請求項4】入力された文書集合における入力された検索語の位置を特定する検索語位置特定手段と、数値表現の内、事物に対する価値を定める数値評価表現を記憶する数値評価表現記憶部と、入力された文書集合における前記数値評価表現記憶部に記憶されたいずれかの数値評価表現が出現する位置を特定する数値評価表現位置特定手段と、前記検索語位置特定手段により出力された前記検索語の位置と前記数値評価表現位置特定手段により出力された前記数値評価表現の位置の距離が一定の範囲内ならば当該数値評価表現を前記検索語の評判情報と判別する表現間距離判定手段とを備えたことを特徴とする情報検索装置。
【請求項5】入力された文書集合における入力された検索語の位置を特定する検索語位置特定手段と、記号表現の内、事物に対する価値を定める記号評価表現を記憶する記号評価表現記憶部と、入力された文書集合における前記記号評価表現記憶部に記憶されたいずれかの記号評価表現が出現する位置を特定する記号評価表現位置特定手段と、前記検索語位置特定手段により出力された前記検索語の位置と前記記号評価表現位置特定手段により出力された前記記号評価表現の位置の距離が一定の範囲内ならば当該記号評価表現を前記検索語の評判情報と判別する表現間距離判定手段とを備えたことを特徴とする情報検索装置。
【請求項6】文書内における評判情報の候補となる位置を判別し、当該評判情報の候補となる位置から一定の範囲にある文字列を抽出する評判候補判別手段と、前記評候補判別手段により出力される評判情報の候補となる位置と、その位置から一定範囲にある文字列とを記憶する評判候補記憶部と、前記評判候補記憶部に記憶された前記評判情報の候補となる位置から一定範囲にある文字列に、入力された検索語が含まれる場合、当該評判情報の候補を当該検索語の評判情報と判別する検索語検索手段とを備えることを特徴とする情報検索装置。
【請求項7】前記評判候補判別手段が、事物に対する価値を定める評価表現を記憶する評価表現記憶部と、入力された文書集合における前記評価表現記憶部に記憶されたいずれかの前記評価表現が出現する位置を特定する評価表現位置特定手段と、前記評価表現位置特定手段により特定された前記評価表現の位置を前記評判情報の候補となる位置とし、当該評判情報の候補となる位置から一定の範囲にある文字列を抽出する評判候補抽出手段とを備えたことを特徴とする請求項6に記載の情報検索装置。
【請求項8】前記評判候補判別手段が、数値表現の内、事物に対する価値を定める数値評価表現を記憶する数値評価表現記憶部と、入力された文書集合における前記数値評価表現記憶部に記憶されたいずれかの数値評価表現が出現する位置を特定する数値評価表現位置特定手段と、前記数値評価表現位置特定手段によりそれぞれ特定された前期数値評価表現の位置を前記評判情報の候補となる位置とし、当該評判情報の候補となる位置から一定の範囲にある文字列を抽出する評判候補抽出手段とを備えたことを特徴とする請求項6に記載の情報検索装置。
【請求項9】前記評判候補判別手段が、記号表現の内、事物に対する価値を定める記号評価表現を記憶する記号評価表現記憶部と、入力された文書集合における前記記号評価表現記憶部に記憶されたいずれかの記号評価表現が出現する位置を特定する記号評価表現位置特定手段と、前記記号評価表現位置特定手段により特定された前期記号評価表現の位置を前記評判情報の候補となる位置とし、当該評判情報の候補となる位置から一定の範囲にある文字列を抽出する評判候補抽出手段とを備えたことを特徴とする請求項6に記載の情報検索装置。
【請求項10】入力された文書集合における入力された検索語の位置を特定する検索語位置特定処理と、事物に対する価値を定める評価表現を記憶する評価表現記憶処理と、入力された文書集合における前記評価表現記憶処理により記憶されたいずれかの前記評価表現が出現する位置を特定する評価表現位置特定処理と、前記検索語位置特定処理により出力された前記検索語の位置と前記評価表現位置特定処理により出力された前記評価表現の位置の距離が一定の範囲内ならば当該評価表現を前記検索語の評判情報と判別する表現間距離判定処理とをコンピュータに実行させるためのプログラムを記録したことを特徴とする記録媒体。
【請求項11】入力された文書集合における入力された検索語の位置を特定する検索語位置特定処理と、数値表現の内、事物に対する価値を定める数値評価表現を記憶させる数値評価表現記憶処理と、入力された文書集合における前記数値評価表現記憶処理により記憶されたいずれかの数値評価表現が出現する位置を特定する数値評価表現位置特定処理と、前記検索語位置特定処理により出力された前記検索語の位置と前記数値評価表現位置特定処理により出力された前記数値評価表現の位置の距離が一定の範囲内ならば当該数値評価表現を前記検索語の評判情報と判別する表現間距離判定処理とをコンピュータに実行させるためのプログラムを記録したことを特徴とする記録媒体。
【請求項12】入力された文書集合における入力された検索語の位置を特定する検索語位置特定処理と、記号表現の内、事物に対する価値を定める記号評価表現を記憶させる記号評価表現記憶処理と、入力された文書集合における前記記号評価表現記憶処理により記憶されたいずれかの記号評価表現が出現する位置を特定する記号評価表現位置特定処理と、前記検索語位置特定処理により出力された前記検索語の位置と前記記号評価表現位置特定処理により出力された前記記号評価表現の位置の距離が一定の範囲内ならば当該記号評価表現を前記検索語の評判情報と判別する表現間距離判定処理とをコンピュータに実行させるためのプログラムを記録したことを特徴とする記録媒体。
【請求項13】文書内における評判情報の候補となる位置を判別し、当該評判情報の候補となる位置から一定の範囲にある文字列を抽出する評判候補判別処理と、前記評候補判別手段により出力される評判情報の候補となる位置と、その位置から一定範囲にある文字列とを記憶させる評判候補記憶処理と、前記評判候補記憶処理により記憶された前記評判情報の候補となる位置から一定範囲にある文字列に、入力された検索語が含まれる場合、当該評判情報の候補を当該検索語の評判情報と判別する検索語検索処理とをコンピュータに実行させるためのプログラムを記録したことを特徴とする記録媒体。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、情報検索装置に関し、特に評判情報を検索できる情報検索装置に関する。
【0002】
【従来の技術】現在、検索語を手掛かりにその属性情報を自動的に収集し利用者に提示する情報検索システムは多く存在する。例えば、MySimon(http://www.mysimon.com)が提供するシステムでは、検索語として商品名を入力するとその商品を販売しているオンラインショップから価格属性を自動抽出し、価格一覧を利用者に提示することができる。この抽出は、商品名や価格属性を他のオンラインショップ検索結果の定型的な検索結果情報を利用して位置を特定するものである。
【0003】また、検索語を手掛かりにその属性情報を検索できるシステムとして、あらかじめ人手で収集した属性情報から利用者が欲しい情報を見ることができるシステムが存在する。例えば、BizRate.com(http://www.bizrate.com)では、あらかじめ消費者からオンラインショップに関する属性情報として評判情報を収集し、利用者はオンラインショップの名前を選択するとその評判情報を得ることができる。
【0004】
【発明が解決しようとする課題】しかしながら、上述の属性情報を自動的に収集できる情報検索システムにおいては、商品名や価格属性のように定型的な検索結果情報を利用して出現位置を特定できる属性情報を扱うことはできても、評判情報のような検索結果情報として現れないため出現位置が特定できない属性情報は自動収集することは出来なかった。
【0005】一方で、属性情報をあらかじめ人手で収集する情報検索システムにおいては、評判情報のような不特定の属性を扱うことが可能であるが、人間の作業に依存する方法は量の面で限界があり、上記の商品の評判情報においても極端な著名な商品以外は商品購入の判断材料として利用するには十分ではないのが現状である。
【0006】本発明はこのような問題点に鑑みてなされたもので、その目的は不特定の属性情報である評判情報を自動的に検索することである。
【0007】
【課題を解決するための手段】本発明の第1の情報検索装置は、入力された文書集合における入力された検索語の位置を特定する検索語位置特定手段(図2の302)と、評価表現を記憶する評価表現記憶部(図2の301)と、入力された文書集合における評価表現記憶部に記憶されたいずれかの評価表現が出現する位置を特定する評価表現位置特定手段(図2の303)と、検索語位置特定手段で出力された検索語の位置と評価表現位置特定手段で出力された評価表現の位置の距離が範囲内ならば評判情報と判別する表現間距離判定手段(図2の304)を有する。このような構成を採用し、検索語と評価表現の表現間距離を判定することにより検索語に関する評判情報が出現する位置を自動的に判別することが可能となる。
【0008】また、本発明の第2の情報検索装置は、第1の情報検索装置の構成に加え、検索語入力手段2で入力された検索語の分野を特定し、その結果を評価表現位置特定手段303に出力する検索語分野特定手段(図4の309)を有する。このような構成を採用し、評価表現位置特定手段(図4の303)が評価表現の位置を特定する際に、評価表現記憶部(図4の301)に記憶されている評価表現の中から、検索語の分野における評判では使用されない評価表現を除外して、評価表現の位置を特定することができる。このため、評判情報の判別精度の向上および判別速度の高速化が可能となる。
【0009】本発明の第3の情報検索装置は、入力された文書集合における入力された検索語の位置を特定する検索語位置特定手段(図6の302)と、数値評価表現を記憶する数値評価表現記憶部(図6の305)と、入力された文書集合における数値評価表現記憶部に記憶されたいずれかの数値評価表現が出現する位置を特定する数値評価表現位置特定手段(図6の306)と、検索語位置特定手段で出力された検索語の位置と数値評価表現位置特定手段で出力された数値評価表現の位置の距離が範囲内ならば評判情報と判別する表現間距離判定手段(図6の304)を有する。このような構成を採用し、検索語と数値評価表現の表現間距離を判定することにより、検索語に関する数値表現で記述される評判情報が出現する位置を自動的に判別することが可能となる。
【0010】本発明の第4の情報検索装置は、入力された文書集合における入力された検索語の位置を特定する検索語位置特定手段(図11の302)と、記号評価表現を記憶する記号評価表現記憶部(図11の307)と、入力された文書集合における記号評価表現記憶部に記憶されたいずれかの記号評価表現が出現する位置を特定する記号評価表現位置特定手段(図11の308)と、検索語位置特定手段で出力された検索語の位置と記号評価表現位置特定手段で出力された記号評価表現の位置の距離が範囲内ならば評判情報と判別する表現間距離判定手段(図11の304)を有する。このような構成を採用し、検索語と記号評価表現の表現間距離を判定することにより、検索語に関する記号情報で記述される評判情報が出現する位置を自動的に判別することが可能となる。
【0011】本発明の第5の情報検索装置は、入力された文書集合における入力された検索語の位置を特定する検索語位置特定手段(図15の302)と、評価表現を記憶する評価表現記憶部(図15の301)と、入力された文書集合における評価表現記憶部に記憶されたいずれかの評価表現が出現する位置を特定する評価表現位置特定手段(図15の303)と、数値評価表現を記憶する数値評価表現記憶部(図15の305)と、入力された文書集合における数値評価表現記憶部に記憶されたいずれかの数値評価表現が出現する位置を特定する数値評価表現位置特定手段(図15の306)と、記号評価表現を記憶する記号評価表現記憶部(図15の307)と、入力された文書集合における記号評価表現記憶部に記憶されたいずれかの記号評価表現が出現する位置を特定する記号評価表現位置特定手段(図15の308)と、検索語位置特定手段で出力された検索語の位置と評価表現位置特定手段および数値評価表現位置特定手段および記号評価表現位置特定手段で出力された評価表現、数値評価表現、または記号評価表現の位置の距離が範囲内ならば評判情報と判別する表現間距離判定手段(図15の304)を有する。このような構成を採用し、検索語と評価表現及び検索語と数値評価表現及び検索語と記号評価表現の表現間距離を判定することにより、さまざまな表現で記述される検索語に関する評判情報が出現する位置を自動的に判別することが可能となる。
【0012】本発明の第6の情報検索装置は、文書入力手段1で入力された文書集合の内評判情報の候補となる位置を判別し、評判候補記憶部11に出力する評判候補判別手段(図17の10)と、評判候補判別手段で出力された評判情報の候補となる位置を記憶する評判候補記憶部(図17の11)と、評判候補記憶部に記憶された評判情報の候補となる位置に入力された検索語が出現する場合、その位置を評判情報と判別する検索語検索手段(図17の12)を有する。このような構成を採用し、評判情報の候補となる位置をあらかじめ判別することにより評判情報の判別を高速に行うことが可能となる。
【0013】
【発明の実施の形態】次に、本発明の実施の形態について図面を参照して詳細に説明する。
【0014】[実施の形態1]図1を参照すると、本発明の第1の実施の形態は、文書入力手段1と検索語入力手段2と評価情報判別手段3と判別結果記憶部4とを含む。
【0015】文書入力手段1は、評判情報検索の対象となる文書の集合である文書集合を入力するものである。
【0016】検索語入力手段2は、評判情報検索の検索語となる文字列を入力するものである。
【0017】評判情報判別手段3は、文書入力手段1から文書集合を受け取り、検索語入力手段2から検索語を受け取り、文書集合に含まれる検索語に関する評判情報の位置を判別し、その評判情報の位置情報を判別結果記憶部4に出力するものである。
【0018】判別結果記憶部4は、評判情報判別手段3により判別された検索語に関する評判情報の位置情報を記憶するものである。
【0019】図2に示すように、評判情報判別手段3は、評価表現記憶部301と検索語位置特定手段302と評価表現位置特定手段303と表現間距離判定手段304とを有する。
【0020】評価表現記憶部301は、評価表現を記憶するものである。ここで評価表現とは、事物に対する価値を定めることのできる表現である。したがって、「遊ぶ」「動く」「研究する」といった事物に対する価値を示さない表現は評価表現でない。評価表現は、「良い」「好き」「最高だ」「面白い」といった用言の他に、「人気」「絶品」「駄作」といった名詞も存在する。また、評価表現記憶部301における評価表現の記憶形式は、各評価表現の活用による表記の違いを吸収する単位で記憶する方式が記憶容量節約の面で効果的であるが、この方式に限定されるものではない。
【0021】検索語位置特定手段302は、文書入力手段1から文書集合を受け取り、検索語入力手段2から検索語を受け取り、文書集合における検索語の位置を特定し、その検索語の位置情報を表現間距離判定手段304に出力するものである。
【0022】評価表現位置特定手段303は、文書入力手段1から文書集合を受け取り、評価表現記憶部301から評価表現を取り出し、文書集合における評価表現記憶部301に記憶されたいずれかの評価表現が出現する位置を特定し、その評価表現の位置情報を表現間距離判定手段304に出力するものである。
【0023】表現間距離判定手段304は、検索語位置特定手段302で出力された検索語の位置情報と評価表現位置特定手段303で出力された評価表現の位置情報の距離を計算し、その両者の距離が一定の範囲内の場合、その評価表現をその検索語の評判情報と判別し、評価表現位置特定手段303で出力された評価表現の位置情報を評判情報の位置情報として判別結果記憶部4に出力するものである。
【0024】次に本発明の第1の実施の形態の動作について、図面を用いて説明する。
【0025】まず、文書入力手段1から文書集合を入力する(図3のステップS1)。各文書には文書を識別するための文書番号が付与されている。また、検索語入力手段2から、評判情報の検索語となる文字列を入力する(図3のステップS2)。尚、文書入力手段1による文書集合の入力と、検索語入力手段2による評判情報の検索語となる文字列の入力については、どちらを先に行ってもよく、また、同時でも構わないものとする。
【0026】いま、文書集合に含まれる文書として文書番号1のテキスト文書「商品Aは非常に面白い。また、商品Bは価格が安いのでお勧め。」が文書入力手段1から入力され、検索語として「商品A」が検索語入力装置2から入力された場合について以下説明する。
【0027】次に、検索語位置特定手段302は、文書入力手段1から入力された文書集合における検索語入力手段2から入力された検索語が出現する位置を特定し、その検索語の位置情報を表現間距離判定手段304に出力する(図3のステップS3)。位置情報の算出は、文書の先頭や最後尾等といった基準位置からの距離を算出する方法を用いて算出することができる。また、基準位置からの距離を算出する方法は、基準位置からの距離を算出することができれば、いかなる方法でも良い。具体的には、文書の先頭からの文字数により距離を算出する方法、文書の先頭からのByte数により距離を算出する方法、文書の先頭からの行数により距離を算出する方法が含まれる。また、出力する検索語の位置情報は、少なくとも検索語が出現する文書を特定する情報と、その文書内で検索語が出現する位置を特定する情報を含む。
【0028】文書入力手段1から上記した文書番号1のテキスト文書が入力され、検索語入力手段2から検索語「商品A」が入力され、検索語の位置の特定方法として文書の先頭からのByte数を採用する場合、検索語位置特定手段302は、文書番号1のテキスト文書から、「商品A」の位置を0Byteと特定して、「商品A」の位置情報(文書番号1,0Byte,商品A)を表現間距離判定手段304に出力する。
【0029】次に、評価表現位置特定手段303は、文書入力手段1から文書集合を受け取り、受け取った文書集合における評価表現記憶部301に記憶されたいずれかの評価表現集合のいずれかの評価表現が出現する位置を特定し、その評価表現の位置情報を表現間距離判定手段304に出力する(図3のステップS4)。具体的には、評価表現位置特定手段303は、評価表現記憶部301に記憶された評価表現ごとに、文書集合に含まれているかを調べ、文書集合に評価表現が含まれている場合、その評価表現の位置を特定する。評価表現位置特定手段303における位置の特定方法は検索語位置特定手段302と同一の方法で行う。また、出力する位置情報は、少なくとも検索語が出現する文書を特定する情報と、その文書内で評価表現が出現する位置を特定する情報とを含んでいる。
【0030】文書入力手段1から上記した文書番号1のテキスト文書が入力され、検索語入力手段2から検索語「商品A」が入力され、評価表現記憶手段301に、評価表現の集合として(面白い、お勧め、好き、いい)が記憶され、評価表現の位置の特定方法として文書の先頭からのByte数を採用する場合、評価表現位置特定手段303は、評価表現記憶部301に記憶されている評価表現のうち、「面白い」と「お勧め」が文書番号1のテキスト文書に含まれていることを判別し、そして、それぞれの評価表現の位置を特定し、評価表現の位置情報((文書番号1,面白い,14Byte),(文書番号1,お勧め,48Byte))を表現間距離判定手段304に対し出力する。
【0031】次に、表現間距離判定手段304は、検索語位置特定手段302で出力された検索語の位置情報と評価表現位置特定手段303で出力された評価表現の位置情報の距離が一定の範囲内ならば、その評価表現をその検索語の評判情報と判別し、その評判情報の位置情報を判別結果記憶部4に出力する(図3のステップS5)。ここで、距離が一定の範囲内とは、例えば検索語と評価表現との間の数値的差分の大きさが閾値以下である場合や、検索語と評価表現との間に構文解析的依存関係がある場合が該当する。また、評判情報の位置情報は、少なくとも評判情報が出現する文書番号を含むものとする。
【0032】判別結果記憶部4には、評判情報の位置情報が格納される(図3のステップS6)。
【0033】文書入力手段1から上記した文書番号1のテキスト文書が入力され、検索語入力手段2から検索語「商品A」が入力され、数値的差分の大きさの閾値を30Byteに設定した場合、表現間距離判定手段304は、検索語位置特定手段302から出力された検索語の位置情報(文書番号1,商品A,0Byte)と評価表現位置特定手段303から出力された評価表現の位置情報((文書番号1,面白い,14Byte),(文書番号1,お勧め,48Byte))の距離を測定し、評価表現が評判情報であるか否かを判断する。そして、この場合、表現間距離判定手段304は、「商品A」と「面白い」の距離が14−0=14Byteであり、閾値30Byte以下であるため、評価表現「面白い」を「商品A」の評判情報と判定し、「商品A」と「お勧め」の距離が48−0=48Byteであり、閾値30Byte以下でないため、評価表現「お勧め」を「商品A」の評判情報と判定しない。その結果、表現間距離判定手段304は、判別結果記憶部4に対し、検索語「商品A」に対する評判情報「面白い」の位置情報として(文書番号1,商品A,0Byte,面白い,14Byte)を出力する。
【0034】なお、前記検索語位置特定手段302と前記評価表現位置特定手段303の処理順序はどちらを先に処理することも可能である。
【0035】また上記の動作では、表現間距離判定手段304は検索位置特定手段302と評価表現位置特定手段303の両方から出力された後に動作を開始する方法を説明したが、それ以外にも検索語位置特定手段302で特定された検索語の位置と評価表現位置特定手段303で特定された評価表現の位置のいずれかを基準として動作を行うことも可能である。今、検索語位置特定手段302により特定された検索語の位置情報を基準とする場合について説明すると、まず基準とした手段である検索語位置特定手段302が検索語の位置情報を表現間距離判定手段304に出力し、次に表現間距離判定手段304は基準としなかった手段である評価表現位置特定手段303に対し、基準とした手段である検索語位置特定手段302の出力した検索語の位置情報と距離の範囲を出力する。そして、基準としなかった手段である評価表現位置特定手段303は、受け取った検索語の位置情報と距離の範囲から、検索語の位置から設定された距離の範囲だけ前方又は後方の範囲内に評価表現があるか否かを調べ、評価表現が存在する場合、その評価表現の位置を特定し、その評価表現の位置情報を表現間距離判定手段304に出力する。そして、最後に表現間距離判定手段304は、基準としなかった手段である評価表現位置特定手段303から出力された評価表現の位置情報を受け取り、検索語の位置情報と評判表現の位置情報から、検索語と評判表現の距離が一定の範囲内である場合、評判表現を検索語の評判情報として判別し、その結果を判別結果記憶部4に記憶するという方法でもよい。
【0036】以上のように、本発明の第1の実施の形態に置いては、検索語と評価表現の表現間距離を判定することにより検索語に関する評判情報が出現する位置を自動的に特定することが可能となる。
【0037】[実施の形態2]次に、本発明の第2の実施の形態について説明する。
【0038】図4に示すように、本発明の第2の実施の形態は、評判情報判別手段3が検索語分野特定手段309を有する点で第1の実施の形態と異なる。
【0039】第2の実施の形態における評価表現記憶部301は、評価表現に加え、その評価表現が使用される分野を示す情報又はその評価表現が使用されない分野を示す情報を、評価表現との組にして記憶している。
【0040】検索語分野特定手段309は、検索語入力手段2で入力された検索語の分野を特定し、その結果を評価表現位置特定手段303に出力するものである。
【0041】ここで、検索語の分野を特定する方法は、検索語入力手段2の入力が検索語とその検索語の分野とを組にして入力する場合については、その入力された分野を検索語の分野として特定し、それ以外の場合については、図示しないが、検索語と検索語の分野の対応関係を記憶したデータベースを備え、そのデータベースを参照することにより検索語の分野を特定する。
【0042】また、評価表現位置特定手段303は、評価表現記憶部301に記憶された評価表現の内、検索語分野特定手段309で特定された分野で使用される評価表現のみを選択し、そのいずれかの評価表現が文書入力手段1で入力された文書に存在する位置を特定する。
【0043】第2の実施の形態の動作を図面を参照して説明する。
【0044】図5のステップS1、ステップS3、及びステップS7からステップS8の動作は、第1の実施の形態における動作と同一であるため説明を省略する。
【0045】検索語入力手段2から、検索語と検索語の分野を入力する(図5のステップS2)。尚、文書入力手段1による文書集合の入力と、検索語入力手段2による検索語と検索語の文野との入力については、どちらを先に行ってもよく、また、同時でも構わないものとする。
【0046】次に、検索語分野特定手段309が、検索語の分野を特定し、その検索語の分野情報を評価表現位置特定手段303に出力する(図5のステップS4)。なお、検索語の分野については、入力されるかどうかは任意である。検索語が入力されない場合は、検索語と検索語の分野の対応関係を記憶したデータベースを備え、検索語分野特定手段309がそのデータベースを参照することにより検索語の分野を特定する。
【0047】評価表現位置特定手段303は、検索語分野特定手段309により出力された検索語の分野を用いて、評価表現記憶部301からその検索語の分野で使用される評価表現を選択する(図5のステップS5)。そして、評価表現位置特定手段303は、各文書における選択した評価表現が出現する位置を特定し、その評価表現の位置情報を表現間距離判定手段304に出力する(図5のステップS6)。
【0048】本実施の形態では、例えば、検索語の分野が「書籍」の場合、評価表現位置特定手段303が評価表現の位置を特定する際に、評価表現記憶部301に記憶されている評価表現の中から、評価表現「おいしい」のような「書籍」に関する評判では使用されない評価表現を除外して、評価表現の位置を特定することができる。このため、評判情報の判別精度の向上および判別速度の高速化が可能となる。
【0049】[実施の形態3]図6を参照すると、本発明の第3の実施の形態は、図1と図2を参照して説明した前記第1の実施の形態の構成と、評価表現記憶部301の代わりに数値評価表現記憶部305を、評価表現位置特定手段303の代わりに数値表現位置特定手段306を備えている点で異なる。
【0050】数値評価表現記憶部305は、数値表現の内事物に対する価値を定めることのできる表現を記憶する。ここで、数値評価表現とは、数値表現の内事物に対する価値を定めることのできる表現である。数値表現は数値及びその付属単位とを少なくとも含むものである。したがって、数値評価表現とは、数値表現の内事物に対する価値を定めることのできる付属単位及び数値の範囲をもつ表現である。数値評価表現記憶部305の記憶形式は、各数値評価表現につき付属単位と許される数値の範囲を組にして記憶する。特に、付属単位の記録形式はそれが接頭語であるか接尾語であるかがわかるよう記憶することを要する。
【0051】数値評価表現位置特定手段306は、文書入力手段1から入力された文書集合の各文書において、数値評価表現記憶部301に記憶されたいずれかの数値評価表現集合のいずれかの数値評価表現が出現する位置を特定しその数値評価表現の位置情報を表現間距離判定手段304に出力するものである。
【0052】次に本発明の第3の実施の形態の動作について図6から図10を参照して説明する。
【0053】図7のステップS1からステップS2の動作は、第1の実施の形態の動作と同一のため説明を省略する。
【0054】今、文書入力手段1から図8に示す文書番号1の文書と図9に示す文書番号2の文書を入力し、検索語入力手段2から検索語「商品B」を入力した場合を例として説明する。
【0055】検索語位置特定手段302は、入力された文書集合の各文書における検索語が出現する位置を特定し、その検索語の位置情報を表現間距離判定手段304に出力する(図7のステップS3)。検索語の位置の算出方法については第1の実施の形態と同様である。今、検索語位置特定手段302による位置の算出方法として、文書の先頭から行数を採用する場合について説明する。この場合、検索語位置特定手段302は、図8に示す文書番号1の文書については、「商品B」の位置をx行目と特定し、図9に示す文書番号2の文書については「商品B」の位置の位置をy行目と特定し、表現間距離判定手段304に対し、検索語「商品B」の位置情報((文書番号1,商品B,x行目),(文書番号2,商品B,y行目))を出力する。
【0056】数値評価表現位置特定手段306は、文書入力手段1から入力された文書集合の各文書における数値評価表現記憶部301に記憶されたいずれかの数値評価表現が出現する位置を特定し、その数値評価表現の位置情報を表現間距離判定手段304に出力する(図7のステップS4)。数値評価表現位置特定手段306における数値評価表現の位置の特定方法は、次の2通りがある。
【0057】(1)文書内に数値評価表現記憶部301に記憶されたいずれかの付属単位が、設定された許される範囲を満たす数値の接頭語または接尾語として出現する場合、その数値と付属単位が出現する位置を数値評価表現の位置と特定する。
(2)文書内に数値で記述される列又は行を有する表が存在し、かつその見出し語が数値評価表現記憶部301に記憶されたいずれか付属単位と同一である場合、その列又は行に存在する数値のうち、設定された許される範囲を満たすものが出現する位置を数値評価表現の位置と特定する。
【0058】位置の算出方法については、検索語位置特定手段302と同一方法で行う。また、出力する数値評価表現の位置情報は、少なくとも数値評価表現が出現する文書を特定する情報と、その文書内で数値評価表現が出現する位置を特定する情報を含むものとする。
【0059】今、数値評価表現記憶手段305に、図10に示す数値評価表現の集合が記憶されており、数値評価表現の位置の算出方法として文書の先頭からの行数を選択した場合について説明する。この場合、数値評価表現位置特定手段306は、上記した数値評価表現の位置の特定方法(1)により文書番号1の文書において、数値評価表現「1位」がx−1行目と、「2位」がx行目と、「3位」がx+1行目と特定し、上記した数値評価表現の位置の特定方法(2)により文書番号2の文書において、数値評価表現「順位1」がy−1行目と、「順位2」がy行目と、「順位3」がy+1行目と特定し、数値評価表現の位置情報として((文書番号1,1位,x−1行目),(文書番号1,2位,x行目),(文書番号1,3位,x+1行目)(文書番号2,順位1,y−1行目),(文書番号2,順位2,y行目),(文書番号2,順位3,y+1行目))を出力する。
【0060】次に、表現間距離判定手段304は、検索語位置特定手段302で出力された検索語の位置情報と数値評価表現位置特定手段306で出力された数値評価表現の位置情報を受け取り、検索語の位置情報と数値評価表現の位置情報の距離が一定範囲内ならば、その数値評価表現をその検索語の評価表現と判別し、その評価表現の位置情報を判別結果記憶部4に対し出力する(図7のステップS5)。距離が一定範囲内か否かの判断の方法は、本発明の第1の実施の形態の表現間距離判定手段4における方法と同一であるため、ここでは説明を省略する。
【0061】今、検索語と数値評価表現との間の数値的差分の大きさの閾値を0行と設定した場合ついて説明する。この場合、表現間距離判定手段304は、検索語の位置情報((文書番号1,商品B,x行目),(文書番号2,商品B,y行目))と数値評価表現の位置情報((文書番号1,1位,x−1行目),(文書番号1,2位,x行目),(文書番号1,3位,x+1行目)(文書番号2,順位1,y−1行目),(文書番号2,順位2,y行目),(文書番号2,順位3,y+1行目))の距離を測定し、文書番号1の文書における「商品B」と「2位」および文書番号2の文書における「商品B」と「順位2」の距離が閾値以下であるため、「2位」および「順位2」を検索語「商品B」の評判情報と判断し、判別結果記憶手段4に対し、評判情報の位置情報((文書番号1,商品B,x行目,2位、x行目),(文書番号2,商品B,y行目,2位,y行目)を出力する。
【0062】なお、検索語位置特定手段302と数値評価表現位置特定手段306の処理順序はどちらを先に処理することも可能である。
【0063】また上記の動作では、表現間距離判定手段304は検索位置特定手段302と数値評価表現位置特定手段306の両方から出力された後に動作を開始する方法を説明したが、それ以外にも検索語位置特定手段302で特定された検索語の位置と数値評価表現位置特定手段306で特定された数値評価表現の位置のいずれかを基準として動作を行うことも可能である。今、検索語位置特定手段302により特定された検索語の位置情報を基準とする場合について説明すると、まず基準とした手段である検索語位置特定手段が検索語の位置情報を表現間距離判定手段304に対し出力し、次に表現間距離判定手段304は基準としなかった手段である数値評価表現位置特定手段306に対し、基準とした手段である検索語位置特定手段302の出力した検索語の位置情報と距離の範囲を出力する。そして、基準としなかった手段である数値評価表現位置特定手段306は受け取った検索語の位置情報の前方距離の範囲又は後方距離の範囲に存在する数値評価表現の位置を特定し、その数値評価表現の位置情報を表現間距離判定手段304に出力する。そして、最後に表現間距離判定手段304は、基準としなかった手段である数値評価表現位置特定手段306から出力された数値評価表現の位置情報を受け取り、検索語の位置情報と数値評価表現の位置情報から、検索語と数値評価表現の距離が一定の範囲内である場合、数値評価表現を検索語の評判情報として判別し、判別結果記憶部4に記憶するという方法でもよい。
【0064】以上のように、本発明の第3の実施の形態では、検索語と数値評価表現の表現間距離を判定することにより数値評価表現で記述される検索語に関する評判情報が出現する位置を自動的に特定することが可能となる。
【0065】[実施の形態4]図11を参照すると、本発明の第4の実施の形態は、図1と図2を参照して説明した前記第1の実施の形態の構成と、評価表現記憶部301の代わりに記号評価表現記憶部307を、評価表現位置特定手段303の代わりに記号評価表現位置特定手段308を備えている点で異なる。
【0066】記号評価表現記憶部307は、記号表現の内事物に対する価値を定めることのできる表現を記憶する。ここで、記号評価表現とは、記号表現の内事物に対する価値を定めることのできる表現である。具体例として、「★」「★★★」「◎」「×」「△」が該当する。記号評価表現記憶部305の記憶形式は、各記号評価表現につき記号評価表現とそのグループを示す情報を組にして記憶する。ここで同一のグループは、同一の評価基準であるが評価の程度が異なる記号表現の集合であり、例えば「★」と「★★」又は「○」と「×」が該当する。
【0067】記号評価表現位置特定手段308は、文書入力手段1から入力された文書集合の各文書における記号評価表現記憶部307に記憶されたいずれかの記号評価表現集合のいずれかの記号評価表現が出現する位置を特定しその位置情報を表現間距離判定手段304に出力するものである。
【0068】次に本発明の第3の実施の形態の動作について図11から図14を参照して説明する。
【0069】図12のステップS1からステップS2までの動作は、第1の実施の形態の動作と同一のため説明を省略する。
【0070】今、文書入力手段1から図13に示す文書番号1の文書を入力し、検索語入力手段2から検索語「商品B」を入力した場合を例として説明する。
【0071】検索語位置特定手段302は、入力された文書集合の各文書における検索語が出現する位置を特定し、その検索語の位置情報を表現間距離判定手段304に出力する(図12のステップS3)。検索語の位置の算出方法については第1の実施の形態と同様である。今、検索語位置特定手段302による位置の算出方法として、文書の先頭から行数を採用する場合について説明する。この場合、検索語位置特定手段302は、図13に示す文書番号1の文書については、「商品B」の位置をy行目と特定し、表現間距離判定手段304に対し、検索語「商品B」の位置情報(文書番号1,商品B,y行目)を出力する。
【0072】記号評価表現位置特定手段308は、文書入力手段1から入力された文書集合の各文書における記号評価表現記憶部307に記憶されたいずれかの記号評価表現が出現する位置を特定し、その記号評価表現の位置情報を表現間距離判定手段304に出力する(図13のステップS4)。記号評価表現位置特定手段308における記号評価表現の位置の特定方法は、(1)文書内に記号評価表現記憶部307に記憶されたいずれかの記号評価表現が出現し、かつ(2)その文書内で同一グループの異なる記号評価表現が一定回数以上出現する場合に、その位置を記号評価表現の位置と特定する。(2)の条件を採用する理由は、(1)の条件のみを採用すると、表題の装飾に使われる記号表現(例えば、「★★ タイトル★★」)や箇条書きの行頭文字に使われる記号表現(例えば、「○箇条書きの使い方」)のように、検索語に対する記号評価表現でない記号表現の位置を誤って特定するためであり、(2)の条件を採用すれば、記号評価表現でない記号表現「★★」や「○」等のみが複数出現する文書を除外することができる。また、位置の算出方法については検索語位置特定手段302と同一方法で行う。また、出力する位置情報は少なくとも記号評価表現が出現する文書を特定する情報と、その文書内で記号評価表現が出現する位置を特定する情報を組みにして出力する。今、記号評価表現記憶手段307に、図14に示す記号評価表現の集合が記憶されており、数値評価表現の位置の特定方法として、文書内で同一グループの異なる記号評価表現が3回以上出現することを条件とし、数値評価表現の位置の算出方法として文書の先頭からの行数を選択した場合について説明する。この場合、図13に示す文書番号1の文書内でグループ番号1の異なる記号評価表現「★★★」「★★」「★★★★」が3回出現するため、記号評価表現位置特定手段308は、記号評価表現の位置について、「★★★」をy−l行目と、「★★」をy行目と、「★★★★」をy+l行目とそれぞれ特定して、表現間距離判定手段304に対し、記号評価表現の位置情報((文書番号1,★★★,y−l行目),(文書番号1,★★,y行目),(文書番号1,★★★★,y+l行目))を出力する。
【0073】次に、表現間距離判定手段304は、検索語位置特定手段302で出力された検索語の位置情報と数値評価表現位置特定手段306で出力された数値評価表現の位置情報を受け取り、検索語の位置情報と数値評価表現の位置情報の距離が一定範囲内ならば、その数値評価表現をその検索語の評価表現と判別し、その評価表現の位置情報を判別結果記憶部4に対し出力する(図12のステップS6)。距離が一定範囲内か否かの判断の方法は、本発明の第1の実施の形態の表現間距離判定手段4における方法と同一であるため、ここでは説明を省略する。
【0074】今、検索語と記号評価表現との間の数値的差分の大きさの閾値を0行と設定した場合について説明する。この場合、表現間距離判定手段304は、検索語の位置情報(文書番号1,商品B,y行目)と記号評価表現の位置情報((文書番号1,★★★,y−l行目),(文書番号1,★★,y行目),(文書番号1,★★★★,y+l行目))の距離を測定し、文書番号1の文書における「商品B」と「★★」の距離が閾値以下であるため、記号評価表現「★★」を検索語「商品B」の評判情報と判別し、判別結果記憶手段4に対し、評判情報の位置情報(文書番号1,商品B,y行目,★★、y行目)を出力する。
【0075】なお、検索語位置特定手段302と記号評価表現位置特定手段308の処理順序はどちらを先に処理することも可能である。
【0076】また上記の動作では、表現間距離判定手段304は検索位置特定手段302と記号評価表現位置特定手段308の両方から出力された後に動作を開始する方法を説明したが、それ以外にも検索語位置特定手段302で特定された検索語の位置と記号評価表現位置特定手段308で特定された数値評価表現の位置のいずれかを基準として動作を行うことも可能である。今、検索語位置特定手段302により特定された検索語の位置情報を基準とする場合について説明すると、まず基準とした手段である検索語位置特定手段302が検索語の位置情報を表現間距離判定手段304に対し出力し、次に表現間距離判定手段304は基準としなかった手段である記号評価表現位置特定手段308に対し、基準とした手段である検索語位置特定手段302の出力した検索語の位置情報と距離の範囲を出力する。そして、基準としなかった手段である記号評価表現位置特定手段308は、受け取った検索語の位置情報の前方距離の範囲又は後方距離の範囲に存在する記号評価表現の位置を特定し、その記号評価表現の位置情報を表現間距離判定手段304に出力する。そして、最後に表現間距離判定手段304は、基準としなかった手段である記号評価表現位置特定手段308から出力された記号評価表現の位置情報を受け取り、検索語の位置情報と記号評価表現の位置情報から、検索語と数値評価表現の距離が一定の範囲内である場合、記号評価表現を検索語の評判情報として判別結果記憶部4に記憶するという方法でもよい。
【0077】以上のように、本発明の第4の実施の形態では、検索語と記号評価表現の表現間距離を判定することにより記号表現で記述される検索語に関する評判情報が出現する位置を自動的に判定することが可能となる。
【0078】[実施の形態5]図15を参照すると、本発明の第5の実施の形態は文書入力手段1と、検索語入力手段2と、評判情報判別手段3と、判別結果記憶部4とを備えている。
【0079】文書入力手段1と検索語入力手段2は、第1の実施の形態と同一であるため、ここでは説明を省略する。
【0080】図15に示す評判情報判別手段3は、評価表現記憶部301と、検索語位置特定手段302と、評価表現位置特定手段303と、表現間距離判定手段304と、数値評価表現記憶部305と、数値評価表現位置特定手段306と、記号評価表現記憶部307と、記号評価表現位置特定手段308とを有する。
【0081】検索語位置特定手段302は、第1の実施の形態と同一であるため、ここでは説明を省略する。
【0082】評価表現記憶部301と評価表現位置特定手段303は、第1の実施の形態と同一であるため、ここでは説明を省略する。
【0083】また、数値評価表現記憶部305と数値評価表現位置特定手段306は、第3の実施の形態と同一であるため、ここでは説明を省略する。
【0084】記号評価表現記憶部307と記号評価表現位置特定手段308は、第4の実施の形態と同一であるため、ここでは説明を省略する。
【0085】次に、本発明の第5の実施の形態の動作について図面を参照して、説明する。
【0086】図16のステップS1からステップS4までの動作は、第1の実施の形態における動作と同一のため説明を省略する。
【0087】図16のステップS5における動作は第3の実施の形態における動作と同一である。
【0088】図16のステップS6における動作は第4の実施の形態における動作と同一である。
【0089】図16のステップS7における表現間距離判定手段304の動作は、第1の実施の形態、第3の実施の形態及び第4の実施の形態における表現間距離判定手段304の動作と同一の動作を行う。
【0090】図16のステップS8における動作は、第1の実施の形態、第3の実施の形態及び第4の実施の形態における動作と同一の動作を行う。
【0091】以上のように、本発明の第5の実施の形態では、検索語と評価表現及び検索語と数値評価表現及び検索語と記号評価表現の表現間距離を判定することにより、さまざまな表現で記述される検索語に関する評判情報を出現する位置を自動的に判別することが可能となる。
[実施の形態6]図17を参照すると、本発明の第6の実施の形態は文書入力手段1と、評判候補判別手段10と、評判候補記憶部11と、検索語入力手段2と、検索語検索手段12と、判別結果記憶部4とを備えている。
【0092】文書入力手段1と検索語入力手段2は、本発明の第1の実施の形態と同一であるため説明を省略する。
【0093】評判候補判別手段10は、文書入力手段1から入力された文書集合を受け取り、受け取った文書集合の各文書において、評判情報の候補となるものが出現する位置を判別し、その評判情報の候補の位置情報を評判候補記憶部11に対し出力するものである。図18に示すように、評判候補判別手段10は、評価表現記憶部301と、評価表現位置特定手段303と、数値評価表現記憶部305と、数値評価表現位置特定手段306と、記号評価表現記憶部307と、記号評価表現位置特定手段308と、評判候補抽出手段1001とを有する。
【0094】評価表現記憶部301は、第1の実施の形態における評判表現記憶部301と同一であるため、説明を省略する。
【0095】評価表現位置特定手段303は、文書入力手段1から文書集合を受け取り、評価表現記憶部301から評価表現を取り出し、文書集合における評価表現記憶部301に記憶されたいずれかの評価表現が出現する位置を特定し、その評価表現の位置情報を評判候補抽出手段1001に出力するものである。
【0096】数値評価表現記憶部305は、第3の実施の形態における数値評価表現記憶部305と同一であるため、説明を省略する。
【0097】数値評価表現位置特定手段306は、文書入力手段1から入力された文書集合の各文書において、数値評価表現記憶部301に記憶されたいずれかの数値評価表現集合のいずれかの数値評価表現が出現する位置を特定し、その数値評価表現の位置情報を評判候補抽出手段1001に出力するものである。
【0098】記号評価表現記憶部307は第4の実施の形態における記号評価表現記憶部307と同一であるため説明を省略する。
【0099】記号評価表現位置特定手段308は、文書入力手段1から入力された文書集合の各文書における記号評価表現記憶部307に記憶されたいずれかの記号評価表現集合のいずれかの記号評価表現が出現する位置を特定し、その記号評価表現の位置情報を評判候補抽出手段1001に対し出力するものである。
【0100】評判候補抽出手段1001は、評価表現位置特定手段303、数値評価表現位置特定手段306又は記号評価表現位置特定手段308から、それぞれ評価表現の位置、数値評価表現の位置又は記号評価表現の位置を受け取り、それらの位置から一定の範囲にある文字列を抽出し、位置情報とそれらの位置から一定の範囲にある文字列を評判候補記憶部11に対し出力するものである。
【0101】評判候補記憶部11は、評判候補判別手段10で出力された評判情報の候補となる位置とそれらの位置から一定の範囲にある文字列を記憶するものである。評判候補記憶部11の記憶形式は、少なくとも評判候補抽出手段1001により抽出された文字列とその文字列が存在する文書の文書番号を記憶する。また必要により、評価表現、数値評価表現又は記号評価表現の種類や位置、抽出した文字列の位置や長さを記憶してもよい。
【0102】検索語検索手段12は、評判候補記憶部11に記憶された評判情報の候補となる位置から一定範囲内に検索語入力手段2で入力された検索語が出現する場合、その位置を評判情報の位置と判別し、その評判情報の位置情報を判別結果記憶部4に対し出力するものである。
【0103】判別結果記憶部4は、検索語検索手段12から評判情報の位置情報を受け取り、その評判情報の位置情報を記憶するものである。
【0104】次に本発明の第6の実施の形態の動作について図19を参照して説明する。
【0105】図19のステップS1からステップS2までの動作は、第1の実施の形態における動作と同一であるため、説明を省略する。今、文書入力手段1から文書集合に含まれる文書として文書番号1のテキスト文書「商品Aは非常に面白い。また、商品Bは価格が安いのでお勧め。」を入力し、検索語入力手段2から検索語「商品A」を入力した場合について説明する。
【0106】評判候補判別手段10の評価表現位置特定手段303は、文書入力手段1から文書集合を受け取り、受け取った文書集合における評判候補判別手段10の評価表現記憶部301に記憶されたいずれかの評価表現集合のいずれかの評価表現が出現する位置を特定し、その評価表現の位置情報を評判候補抽出手段1001に出力する(図19のステップS3)。評価表現位置特定手段303における位置の特定方法は、第1の実施の形態の評価表現位置特定手段303における特定方法と同一であるため、ここでは説明を省略する。
【0107】評判候補判別手段10の数値評価表現位置特定手段306は、文書入力手段1から入力された文書集合の各文書における評判候補判別手段10の数値評価表現記憶部301に記憶されたいずれかの数値評価表現が出現する位置を特定し、その数値評価表現の位置情報を評判候補抽出手段1001に出力する(図19のステップS4)。数値評価表現位置特定手段306における数値評価表現の位置の特定方法は、第3の実施の形態の数値評価表現位置特定手段306における特定方法と同一であるためここでは説明を省略する。
【0108】評判候補判別手段10の記号評価表現位置特定手段308は、文書入力手段1から入力された文書集合の各文書における評判候補判別手段10の記号評価表現記憶部307に記憶されたいずれかの記号評価表現が出現する位置を特定し、その記号評価表現の位置情報を評判候補抽出手段1001に出力する(図19のステップS5)。記号評価表現位置特定手段308における数値評価表現の位置の特定方法は、第4の実施の形態の数値評価表現特定手段における特定方法と同一のため説明を省略する。
【0109】今、評価表現の位置、数値評価表現の位置及び記号評価表現の位置の特定方法として、文書の先頭からのByte数により算出する方法を選択する場合について説明する。この場合、評判候補判別手段10の評価表現位置特定手段303は、上記した文書番号1のテキスト文書から、検索語「商品A」から一定範囲内にある評価表現の位置を特定し、その位置情報((文書番号1,面白い,14Byte),(文書番号1,お勧め,48Byte))を評判候補抽出手段1001に対し出力する。
【0110】次に、評判候補抽出手段1001は、評価表現位置特定手段303、数値評価表現位置特定手段306又は記号評価表現位置特定手段308で特定された評価表現の位置、数値評価表現の位置又は記号評価表現の位置から一定の範囲にある文字列を抽出し、それらの位置情報と文字列を評判候補記憶部11に対し出力する(図19のステップS6)。ここで、一定の範囲にある文字列とは評価表現、数値評価表現又は記号評価表現の周囲にある文字列のことをいい、具体的には、評判候補抽出手段1001は、評価表現等の位置から一定の文字数、Byte数、行数等の数値的範囲内に存在する文字列を抽出する。またこの際、評価表現等の一定の範囲にある文字列から、特定の品詞である単語や、評価表現等と構文解析的依存関係のある単語に限って抽出してもよい。
【0111】今、評判候補抽出手段1001が、一定の範囲として評価表現等の位置から前後30Byteの範囲を選択する場合について説明する。この場合、評判候補抽出手段1001は、評価表現「面白い」に対して(商品Aは非常に面白い。また、商品Bは価格が安)を抽出し、評価表現「お勧め」に対して(。また、商品Bは価格が安いのでお勧め。)を抽出し、評判候補記憶部11には、((文書番号1,面白い,14Byte,商品Aは非常に面白い。また、商品Bは価格が安,0Byte),(文書番号1,お勧め,48Byte,い。また、商品Bは価格が安いのでお勧め。,18Byte))が記憶されることになる。
【0112】次に、検索語検索手段12は、評判候補記憶部11に記憶された評判情報の候補となる位置とその位置から一定範囲内にある文字列内に、検索語入力手段2で入力された検索語が出現する場合、その位置にある評価表現等を検索語に対する評判情報と判別し(図19のステップS7)、判別結果記憶部4に対し出力する(図19のステップS8)。この場合、検索語入力手段2で入力された検索語「商品A」が評判候補記憶部11に記憶されている「商品Aは非常に面白い。また、商品Bは価格が安」内に出現するため、検索語検索手段12は、評判情報の位置情報として(文書番号1,商品A,0Byte,面白い,14Byte)を判別結果記憶部4に対し出力する。
【0113】以上のように、本発明の第6の実施の形態では、評判情報の候補となる位置をあらかじめ判別することにより評判情報の判別を高速に行うことができる。
【0114】尚、評判候補判別手段10が、評価表現記憶部301と、評価表現位置特定手段303と、数値評価表現記憶部305と、数値評価表現位置特定手段306と、記号評価表現記憶部307と、記号評価表現位置特定手段308と、評判候補抽出手段1001とを有する場合についてのみ説明した。しかし、評判候補判別手段10が、評価表現記憶部301と、評価表現位置特定手段303と、評判候補抽出手段1001とを有する場合、評判候補判別手段10が、数値評価表現記憶部305と、数値評価表現位置特定手段306と、評判候補抽出手段1001とを有する場合、及び評判候補判別手段10が、記号評価表現記憶部307と、記号評価表現位置特定手段308と、評判候補抽出手段1001とを有する場合についても同様に説明することができる。また、評判候補判別手段10が、評価表現記憶部301と、評価表現位置特定手段303と、数値評価表現記憶部305と、数値評価表現位置特定手段306と、評判候補抽出手段1001とを有する場合、評判候補判別手段10が、評価表現記憶部301と、評価表現位置特定手段303と、記号評価表現記憶部307と、記号評価表現位置特定手段308と、と、評判候補抽出手段1001とを有する場合、評判候補判別手段10が、数値評価表現記憶部305と、数値評価表現位置特定手段306と、記号評価表現記憶部307と、記号評価表現位置特定手段308と、評判候補抽出手段1001とを有する場合についても同様に説明することができる。
【0115】[実施の形態7]次に、本発明の第7の実施の形態について図面を参照して詳細に説明する。
【0116】図20を参照すると、本発明の第7の実施の形態は、本発明の第1の実施の形態と同様に、入力装置13、データ処理装置15、記憶装置14、出力装置16を備え、更に、情報検索装置を実現するためのプログラムを記録した記録媒体17を備える。この記録媒体17は磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってよい。
【0117】情報検索装置を実現するためのプログラムは記録媒体17からデータ処理装置15に読み込まれ、データ処理装置15の動作を制御し、記憶装置14に評価表現記憶部301と判別結果記憶部4との領域を確保する。データ処理装置15は情報検索装置を実現するためのプログラムの制御により第1の実施の形態における文書入力手段1、検索語入力手段2、検索語位置特定手段302、評価表現位置特定手段303、及び表現間距離判定手段304による処理と同一の処理を実行する。
【0118】[実施の形態8]次に、本発明の第8の実施の形態について図面を参照して詳細に説明する。
【0119】図20を参照すると、本発明の第8の実施の形態は、本発明の第2の実施の形態と同様に、入力装置13、データ処理装置15、記憶装置14、出力装置16を備え、更に、情報検索装置を実現するためのプログラムを記録した記録媒体17を備える。この記録媒体17は磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってよい。
【0120】情報検索装置を実現するためのプログラムは記録媒体17からデータ処理装置15に読み込まれ、データ処理装置15の動作を制御し、記憶装置14に評価表現記憶部301と判別結果記憶部4との領域を確保する。データ処理装置15は情報検索装置を実現するためのプログラムの制御により第2の実施の形態における文書入力手段1、検索語入力手段2、検索語位置特定手段302、評価表現位置特定手段303、表現間距離判定手段304、及び検索語分野特定手段309による処理と同一の処理を実行する。
【0121】[実施の形態9]次に、本発明の第9の実施の形態について図面を参照して詳細に説明する。
【0122】図20を参照すると、本発明の第9の実施の形態は、本発明の第3の実施の形態と同様に、入力装置13、データ処理装置15、記憶装置14、出力装置16を備え、更に、情報検索装置を実現するためのプログラムを記録した記録媒体17を備える。この記録媒体17は磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってよい。
【0123】情報検索装置を実現するためのプログラムは記録媒体17からデータ処理装置15に読み込まれ、データ処理装置15の動作を制御し、記憶装置14に数値評価表現記憶部305と判別結果記憶部4との領域を確保する。データ処理装置15は情報検索装置を実現するためのプログラムの制御により第3の実施の形態における文書入力手段1、検索語入力手段2、検索語位置特定手段302、数値評価表現位置特定手段306、及び表現間距離判定手段304による処理と同一の処理を実行する。
【0124】[実施の形態10]次に、本発明の第10の実施の形態について図面を参照して詳細に説明する。
【0125】図20を参照すると、本発明の第10の実施の形態は、本発明の第4の実施の形態と同様に、入力装置13、データ処理装置15、記憶装置14、出力装置16を備え、更に、情報検索装置を実現するためのプログラムを記録した記録媒体17を備える。この記録媒体17は磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってよい。
【0126】情報検索装置を実現するためのプログラムは記録媒体17からデータ処理装置15に読み込まれ、データ処理装置15の動作を制御し、記憶装置14に記号評価表現記憶部307と判別結果記憶部4との領域を確保する。データ処理装置15は情報検索装置を実現するためのプログラムの制御により第4の実施の形態における文書入力手段1、検索語入力手段2、検索語位置特定手段302、記号評価表現位置特定手段308、及び表現間距離判定手段304による処理と同一の処理を実行する。
【0127】[実施の形態11]次に、本発明の第11の実施の形態について図面を参照して詳細に説明する。
【0128】図20を参照すると、本発明の第11の実施の形態は、本発明の第5の実施の形態と同様に、入力装置13、データ処理装置15、記憶装置14、出力装置16を備え、更に、情報検索装置を実現するためのプログラムを記録した記録媒体17を備える。この記録媒体17は磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってよい。
【0129】情報検索装置を実現するためのプログラムは記録媒体17からデータ処理装置15に読み込まれ、データ処理装置15の動作を制御し、記憶装置14に評価表現記憶部301と数値評価表現記憶部305と記号評価表現記憶部307と判別結果記憶部4との領域を確保する。データ処理装置15は情報検索装置を実現するためのプログラムの制御により第5の実施の形態における文書入力手段1、検索語入力手段2、検索語位置特定手段302、評価表現位置特定手段303、数値評価表現位置特定手段306、記号評価表現位置特定手段308、及び表現間距離判定手段304による処理と同一の処理を実行する。
【0130】[実施の形態12]次に、本発明の第12の実施の形態について図面を参照して詳細に説明する。
【0131】図20を参照すると、本発明の第12の実施の形態は、本発明の第6の実施の形態と同様に、入力装置13、データ処理装置15、記憶装置14、出力装置16を備え、更に、情報検索装置を実現するためのプログラムを記録した記録媒体17を備える。この記録媒体17は磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってよい。
【0132】情報検索装置を実現するためのプログラムは記録媒体17からデータ処理装置15に読み込まれ、データ処理装置15の動作を制御し、記憶装置14に評価表現記憶部301と数値評価表現記憶部305と記号評価表現記憶部307と評判候補記憶部11と判別結果記憶部4との領域を確保する。データ処理装置15は情報検索装置を実現するためのプログラムの制御により第6の実施の形態における文書入力手段1、検索語入力手段2、評価表現位置特定手段303、数値評価表現位置特定手段306、記号評価表現位置特定手段308、評判候補抽出手段1001及び検索語検索手段12による処理と同一の処理を実行する。
【0133】尚、第6の実施の形態と同様に、記憶装置14に、評価表現記憶部301、数値評価表現記憶部305または記号評価表現記憶部307のいずれか1つの記憶部の領域と、評判候補記憶部11と判別結果記憶部4の領域を確保し、データ処理装置15が、第6の実施の形態における文書入力手段1、検索語入力手段2、評判候補抽出手段1001及び検索語検索手段12による処理と同一の処理と、評価表現位置特定手段303、数値評価表現位置特定手段306または記号評価表現位置特定手段308のいずれか1つの手段による処理と同一の処理とを実行しても良い。
【0134】
【発明の効果】本発明の第1の効果は、さまざまな評価表現で記述される検索語に関する評判情報が出現する位置を自動的に判別できることである。その理由は、検索語と評価表現及び検索語と数値評価表現及び検索語と記号評価表現の表現間距離が一定の範囲内ならば評判情報と判別するように構成したためである。
【0135】本発明の第2の効果は、評判情報を高速に判別することができることである。その理由は、評判情報の候補となる位置をあらかじめ判別する手段を備えるためである。
【出願人】 【識別番号】000004237
【氏名又は名称】日本電気株式会社
【出願日】 平成12年9月13日(2000.9.13)
【代理人】 【識別番号】100082935
【弁理士】
【氏名又は名称】京本 直樹 (外2名)
【公開番号】 特開2002−91981(P2002−91981A)
【公開日】 平成14年3月29日(2002.3.29)
【出願番号】 特願2000−278430(P2000−278430)