トップ :: G 物理学 :: G06 計算;計数




【発明の名称】 情報検索支援システムおよびプログラム
【発明者】 【氏名】高木 友博

【要約】 【課題】メニュー検索方式を基本とする検索において、目的とする情報を効率良く検索する。

【解決手段】入力装置1を介して情報検索のためのキーワードを入力し、このキーワードを概念変換部5でキーワードを表す概念のベクトルに変換する。マッチング部6は、パスデータベース3に格納された階層メニューのパスを表す概念のベクトルと、概念変換部5で変換されたキーワードを表す概念のベクトルとのマッチング度を計算し、求められたマッチング度に基づいて最適パスを決定する。この最適パスを表示装置2に表示する。
【特許請求の範囲】
【請求項1】 検索対象となる情報を分類するための分類項目を階層メニューのパスとして記憶すると共に、前記階層メニューのパスを表示することにより、前記階層メニューのパスから前記検索対象となる情報の探索を可能にする情報検索支援システムにおいて、前記検索対象となる情報を検索するためのキーワードを入力する入力手段と、前記階層メニューのパスを記憶するパスデータ記憶手段と、前記入力されたキーワードと前記パスデータ記憶手段に記憶された階層メニューのパスとのマッチング度を求めると共に求められたマッチング度に基づいて最適パスを決定するマッチング手段と、このマッチング手段で決定された最適パスを前記階層メニューのパスとして表示する表示手段とを備えてなることを特徴とする情報検索支援システム。
【請求項2】 前記入力されたキーワードから当該キーワードを表す概念のベクトルを出力する概念変換手段を更に備え、前記パスデータ記憶手段は、前記階層メニューの全てのパスに対して、各パスを表す概念のベクトルを記憶したものであり、前記マッチング手段は、前記キーワードを表す概念のベクトルと前記パスを表す概念のベクトルとの内積をマッチング度として算出するものであることを特徴とする請求項1記載の情報検索支援システム。
【請求項3】 前記キーワードを表す概念のベクトルは、当該キーワードと概念との関連の深さを各概念毎にスコアで示すベクトルであることを特徴とする請求項2記載の情報検索支援システム。
【請求項4】 前記概念変換手段は、複数のキーワードが入力されたときに各キーワードを表す概念のベクトルの同一概念のスコアのうち大きい方のスコアを選択することにより、前記複数のキーワードを表す概念のベクトルを算出し出力するものであることを特徴とする請求項3記載の情報検索支援システム。
【請求項5】 前記パスを表す概念のベクトルは、当該パスを構成する各分類項目を表す概念のベクトルを全分類項目について合成したベクトルであり、前記各分類項目を表すベクトルは、当該分類項目と概念との関連の深さを各概念毎にスコアで示すベクトルであることを特徴とする請求項2〜4のいずれか1項記載の情報検索支援システム。
【請求項6】 前記パスを表す概念のベクトルは、当該パスを構成する各分類項目を表す概念のベクトルの同一概念のスコアのうち大きい方のスコアを選択することにより、前記各分類項目を表すベクトルを全分類項目について合成したものであることを特徴とする請求項5記載の情報検索支援システム。
【請求項7】 前記パスを表す概念のベクトルは、当該パスを構成する各分類項目を表す概念のベクトルを、前記階層メニューの下位の分類項目ほど大きな重みを与えて全分類項目について合成したものであることを特徴とする請求項5記載の情報検索支援システム。
【請求項8】 前記マッチング手段は、算出されたマッチング度が高い順から所定数のパスのみを最適パスとして出力するものであることを特徴とする請求項1〜7のいずれか1項記載の情報検索支援システム。
【請求項9】 検索対象となる情報を分類するための分類項目を階層メニューのパスとして記憶すると共に、前記階層メニューのパスを表示することにより、前記階層メニューのパスから前記検索対象となる情報の探索を可能にする情報検索支援プログラムであって、前記検索対象となる情報を検索するためのキーワードを入力するステップと、この入力されたキーワードと前記記憶された階層メニューのパスとのマッチング度を求めると共に求められたマッチング度に基づいて最適パスを決定するステップと、決定された最適パスを前記階層メニューのパスとして表示するステップとをコンピュータに実行させるように構成された情報検索支援プログラム。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、インターネットによるWeb検索等の用途に適した情報検索支援システム及びプログラムに関する。
【0002】
【従来の技術】従来より、膨大な情報ソースから目的とする情報を効率良く検索するための情報検索方式として、キーワードによるマッチングで所望とする情報を検索するキーワード検索方式と、メニューから所望とする情報を探索していくメニュー検索方式とが知られている。キーワード検索方式による検索は、検索が簡単でキーワードを含む情報を速やかに検索することができるという利点がある反面、キーワードの設定の仕方が難しく、キーワードが1字でも異なれば目的とする情報が検索されないという可能性がある。これに対し、メニュー検索方式は、階層メニューを上位の分類項目から辿っていくことにより、目的とする情報を見つけ出していく方式であるため、関連した情報を複数参照しながら最適なパスを探索していくことができるという利点がある。しかし、このメニュー検索方式では、上位の分類項目を選択する段階で、それらの分類項目の下位の分類項目が分からないと、どのパスを辿って良いのかを判断することができず、最適パスを見つけ出すまでに時間がかかるという問題がある。
【0003】
【発明が解決しようとする課題】このように、従来のキーワード検索方式、メニュー検索方式のいずれの情報検索方式においても情報を検索するまでに時間がかかり、効率の良い検索ができないという問題がある。
【0004】本発明は、このような点に鑑みなされたもので、メニュー検索方式を基本とする検索において、目的とする情報を効率良く検索することができる情報検索支援システムおよびプログラムを提供することを目的とする。
【0005】
【課題を解決するための手段】本発明に係る情報検索支援システムは、検索対象となる情報を分類するための分類項目を階層メニューのパスとして記憶すると共に、前記階層メニューのパスを表示することにより、前記階層メニューのパスから前記検索対象となる情報の探索を可能にする情報検索支援システムにおいて、前記検索対象となる情報を検索するためのキーワードを入力する入力手段と、前記階層メニューのパスを記憶するパスデータ記憶手段と、前記入力されたキーワードと前記パスデータ記憶手段に記憶された階層メニューのパスとのマッチング度を求めると共に求められたマッチング度に基づいて最適パスを決定するマッチング手段と、このマッチング手段で決定された最適パスを前記階層メニューのパスとして表示する表示手段とを備えてなることを特徴とする。
【0006】本発明に係る情報検索支援プログラムは、検索対象となる情報を分類するための分類項目を階層メニューのパスとして記憶すると共に、前記階層メニューのパスを表示することにより、前記階層メニューのパスから前記検索対象となる情報の探索を可能にする情報検索支援プログラムであって、前記検索対象となる情報を検索するためのキーワードを入力するステップと、この入力されたキーワードと前記記憶された階層メニューのパスとのマッチング度を求めると共に求められたマッチング度に基づいて最適パスを決定するステップと、決定された最適パスを前記階層メニューのパスとして表示するステップとをコンピュータに実行させるように構成されたものである。
【0007】本発明によれば、検索対象となる情報を検索するためのキーワードを入力し、このキーワードと階層メニューのパスとのマッチング度を計算して、求められたマッチング度に基づいて最適パスを決定し、この最適パスを表示するようにしているので、表示された最適パスを辿っていけば、キーワードを含む情報及びそれに関連する情報を効率よく探索することができる。
【0008】なお、本発明の一つの実施形態においては、入力されたキーワードから当該キーワードを表す概念のベクトルを出力する概念変換手段を更に備え、パスデータ記憶手段が、階層メニューの全てのパスに対して、各パスを表す概念のベクトルを記憶したものであり、マッチング手段は、キーワードを表す概念のベクトルとパスを表す概念のベクトルとの内積をマッチング度として算出する。このようにキーワードやパスの概念をベクトルという形で拡張することにより、より総合的で広い観点からキーワードとパスの概念のマッチング度を求めることができる。
【0009】なお、キーワードを表す概念のベクトルは、例えば当該キーワードと概念との関連の深さを各概念毎にスコアで示すベクトルである。この場合、概念変換手段は、複数のキーワードが入力されたときに、例えば各キーワードを表す概念のベクトルの同一概念のスコアのうち大きい方のスコアを選択することにより、複数のキーワードを表す概念のベクトルを算出し出力するように構成することができる。
【0010】また、パスを表す概念のベクトルは、例えば当該パスを構成する各分類項目を表す概念のベクトルを全分類項目について合成したベクトルであり、各分類項目を表すベクトルは、例えば当該分類項目と概念との関連の深さを各概念毎にスコアで示すベクトルである。更に、パスを表す概念のベクトルは、例えば当該パスを構成する各分類項目を表す概念のベクトルの同一概念のスコアのうち大きい方のスコアを選択することにより、各分類項目を表すベクトルを全分類項目について合成したものである。
【0011】更に、パスを表す概念のベクトルは、例えば当該パスを構成する各分類項目を表す概念のベクトルを、階層メニューの下位の分類項目ほど大きな重みを与えて全分類項目について合成したものである。このように合成時に各分類項目に重み付けを行うと、よりキーワードに近い、具体的な概念の重みが大きくなり、実情を反映した最適パスを得ることができる。
【0012】
【発明の実施の形態】以下、図面を参照しながら、本発明の一実施形態を詳細に説明する。図1は、本実施形態に係る情報検索支援システムの構成を示す図である。この情報検索支援システムは、マウス、キーボード等の入力装置1と、CRTディスプレイ、LCDディスプレイ等の表示装置2と、ハードディスク装置などの記憶装置からなるパスデータベース3と、CPUおよび必要な情報検索支援プログラムによって実現されるユーザインタフェース4、概念変換部5及びマッチング部6とを備えて構成されている。
【0013】入力装置1とユーザインタフェース4の一部の機能とが、情報検索のためのキーワードを入力するための入力手段を構成する。パスデータベース3は、検索対象となる情報を分類する分類項目を階層化してなる階層メニューの全てのパスを記憶するパスデータ記憶手段であり、より具体的には、階層メニューの全てのパスに対して、各パスを表す概念のベクトルに拡張したものを記憶している。概念変換部5は、内部に概念辞書を有し、入力されたキーワードに対して、そのキーワードを表す概念をワードベクトルの形態に拡張して出力する。マッチング部6は、概念変換部5から出力されたキーワードを表す概念のベクトルと、パスデータベース3に記憶された階層メニューのパスを表す概念のベクトルとの内積をマッチング度として求め、このマッチング度が高いパス、例えばマッチング度が高い順に抽出した所定個のパス、又はマッチング度が所定値よりも高いパスを最適パスとして出力する。これら最適パスはユーザインタフェース4を介して表示装置2に表示される。
【0014】次に、このように構成された情報検索支援システムの動作を説明する。図2は、階層メニューのパスの一例を示す図である。この階層メニューは、Yahoo(商標:ヤフー株式会社)のWeb検索画面のメニューの例であり、そのうちの一部のパスが例示されている。左側が最も高い階層、右側が最も低い階層を示しており、“>”が階層の区切りを示している。
【0015】ここで、例えば「パソコン」及び「本」に関連するサイトを検索しようとする場合、階層メニューの上位の階層から下位の階層を辿る操作で最適なパスを見つけ出すことはかなりの慣れも必要であるし、探索に要する時間もかかる。一方、「パソコン」、「本」をキーワードとしてサイトを検索する場合、検索されたサイトに関連はするが、そのキーワードを含まないサイトについては検索結果として抽出されない。そこで、このシステムでは、「パソコン」、「本」をキーワードとして入力した場合、図2に示すような階層メニューの全パスから、入力されたキーワードに最も適したパスを最適パスとして抽出し、これを表示装置2に表示する。図2の例では、Aが第1順位の最適パス、Bが第2順位の最適パスを示している。以下、最適パスの抽出方法について説明する。
【0016】図3は、本実施形態の情報検索支援プログラムのフローチャートである。まず、入力装置1およびユーザインタフェース4を介してキーワード、例えば「パソコン」、「本」が入力されると(S1)、概念変換部5は、入力された「キーワード」を、「そのキーワードを示す概念」に拡張する(S2)。すなわち、概念変換部5には、図4に示すような概念辞書が備えられている。概念辞書には、例えば、「インターネット」というキーワードに対して「インターネット 1.0/パソコン 0.9/通信 0.8/電話 0.8/携帯 0.8/Eメール 0.9/…」のような概念のワードベクトルが登録され、「エンターテインメント」というキーワードに対して「エンターテインメント 1.0/エンターテイメント 1.0/遊び 0.8/娯楽 0.8/…」のような概念のワードベクトルが登録されている。ここで、各概念の後ろに付された0.0〜1.0の数値は、キーワードと概念の関連の深さを示すスコアである。このような概念辞書は、CFS(Conceptual Fuzzy Sets:概念ファジィ集合)の概念体系により適宜作成することができる。
【0017】図5は、1又は複数のキーワードから1つの概念のベクトルを生成するためのスコアテーブルを示す図である。スコアテーブルには、概念辞書に登録された各キーワードA,B,C,…に対して概念a,b,c,…のスコアのベクトルが登録されている。キーワードA,B,C,…と概念a,b,c,…とは、同一のワードの集合でも良いし、異なるワードの集合でも良い。例えばキーワードAと概念aとがたまたま同じワードである場合、両者の関連を示すスコアは当然ながら最高値である1.0を示す。キーワード「A」が入力された場合には、1段目のベクトルV1(1.0,0.3,0.1,…)がそのままキーワードを表す概念のベクトル出力となる。また、図示のように複数のキーワード「A」、「C」が入力された場合には、各キーワード「A」、「C」に対応したベクトルV1,V2の対応する概念a,b,c,…のスコアのうち数値の高いほうのスコアが採用されて出力ベクトルVoが構成される。これにより、1つでもキーワードと関連性の高い概念のスコアを高い値に維持しておくことができる。なお、出力ベクトルVoの合成法としては、この方法に限らず、例えば合成するスコアの加算平均をとるようにすることも考えられる。図6は、「パソコン」、「本」というキーワードに対して生成された概念のベクトルの例を示している。
【0018】一方、パスデータベース3には、図2に示した階層メニューの全パスについて上記と同様の方法で作成された概念のベクトルが記憶されている。この場合、パスを構成する「芸術と人文」、「ビジネスと経済」、…のような分類項目をそれぞれキーワードとして概念のベクトルへの拡張を行う。但し、階層メニューの場合、上位の階層よりも下位の階層の分類項目の方が、よりキーワードとの関連性が高いということが言えるので、例えば【0019】ビジネスと経済(*1/5)>企業(*2/5)>本(*3/5)>書店(*4/5)>コンピュータ(*5/5)【0020】のように、各分類項目に重みを待たせ、これら重みを各概念のスコアに乗算することにより、更に精度の高い検索が可能になる。図7は、「ビジネスと経済>企業>本>コンピュータ」のパスから拡張された概念のベクトルの一例を示す図、図8は、「コンピュータとインターネット>企業>本」のパスから拡張された概念のベクトルの一例を示している。
【0021】このようにして拡張されたキーワードを表す概念とパスを表す概念とは、マッチング部6においてマッチング処理される(S3)。マッチング処理は、両ベクトルの内積をマッチング度として求め、得られたマッチング度が高い順に全パスをソートし、マッチング度が高いほうから例えば2つのパスを選択する(S4)。図2のA,Bは、このようにして選択された2つの最適パスを示している。従って、この2つの最適パスを表示装置2に表示させる(S5)ことにより、最も適切なパスの周辺から探索を開始させることができる。
【0022】なお、上記実施形態では、キーワードとパスの両方を概念のベクトルに拡張した後に両者のマッチング度を求めたが、いずれか一方のみを概念のベクトルに拡張しても良いし、また両方とも拡張せずに、そのままマッチング度を求めるようにしてもよい。
【0023】
【発明の効果】以上述べたように本発明によれば、検索対象となる情報を検索するためのキーワードを入力し、このキーワードと階層メニューのパスとのマッチング度を計算して、求められたマッチング度に基づいて最適パスを決定し、この最適パスを表示するようにしているので、表示された最適パスを辿っていけば、キーワードを含む情報及びそれに関連する情報を効率よく探索することができるという効果を奏する。
【出願人】 【識別番号】500572269
【氏名又は名称】学校法人明治大学
【出願日】 平成14年5月15日(2002.5.15)
【代理人】 【識別番号】100092820
【弁理士】
【氏名又は名称】伊丹 勝
【公開番号】 特開2003−330952(P2003−330952A)
【公開日】 平成15年11月21日(2003.11.21)
【出願番号】 特願2002−140440(P2002−140440)