| 【発明の名称】 |
多角的検索サービス方法および装置、ならびにそのプログラムを記録した記録媒体 |
| 【発明者】 |
【氏名】樋渡 仁
|
| 【要約】 |
【課題】キーワードとの一致度以外の検索評価情報を用いて、多角的な観点から検索結果を吟味することにより、検索エンジンから返却されるページ群から利用者が意中のページを容易に発見できるようにする。
【解決手段】利用者端末11〜13から検索サーバ14に対して評価情報識別子と評価の基準となる基準ページを引数として当該ページ情報群の再ソートリクエストを発行すると、検索サーバ14は評価情報サーバ15に対して評価情報取得リクエストを発行し、評価情報サーバ15は予め各ページから評価情報を計算して、評価情報データベース16に登録しておき、検索して評価情報が存在ない時評価情報を計算し、評価情報に対する料金を課金して計算結果を検索サーバ14に返却し、検索サーバ14は、評価情報順にソートして利用者端末11〜13に返却する。 |
【特許請求の範囲】
【請求項1】 利用者端末から検索サーバに対して、キーワードを引数として検索リクエストを発行した時、検索サーバが当該キーワードを含むページを選定し、ページ情報および該ページ情報毎のキーワードとの一致度を計算し、当該ページ情報群を一致度順にソートして上記利用者端末に返却し、利用者端末で表示した画面上で利用者により選択された該当ページを表示する検索サービス方法において、返却された上記利用者端末から上記検索サーバに対して評価情報識別子と評価の基準となる基準ページを引数として当該ページ情報群の再ソートリクエストを発行した時には、上記検索サーバは当該ページ情報群の各ページに関し、評価情報サーバに対して当該評価情報識別子と基準ページを引数として、当該ページに対する評価情報取得リクエストを発行し、該評価情報サーバは、予めインターネット上の各ページから評価情報を計算して、評価情報データベースに登録しておき、上記評価情報取得リクエストを受けた時、上記評価情報データベースを検索し、当該ページに関する評価情報が存在した時には、該評価情報を取得して、上記検索サーバに返却し、当該ページに関する評価情報が存在しない時には、当該ページから当該評価情報を計算し、計算結果を検索サーバに返却して、当該評価情報に対する料金を課金し、該検索サーバは、受け取った当該ページ情報群を当該評価情報順にソートして上記利用者端末に返却し、該利用者端末は当該ページ情報群を表示することを特徴とする多角的検索サービス方法。 【請求項2】 請求項1に記載の多角的検索サービス方法において、前記評価情報識別子が網羅度である時には、該評価情報サーバは、対象ページに対して、該対象ページから張られているドメイン外へのリンク数を求め、対象ページから張られているドメイン内への各リンクに関して、リンク先のページから張られているドメイン外リンク数に、当該ページから張られているリンク数の逆数を掛けた数を加算し、両者を加算した数を対象ページの網羅度として、検索サーバを介して利用者端末に返却することを特徴とする多角的検索サービス方法。 【請求項3】 請求項1に記載の多角的検索サービス方法において、前記評価情報識別子が権威度である時には、該評価情報サーバは、対象ページに対して、該対象ページに張られているドメイン外から被リンク数を求め、対象ページに張られているドメイン内からの各リンクに関して、リンク元のページに張られているドメイン外被リンク数に、当該ページに張られている被リンク数の逆数を掛けた数を加算し、両者を加算した数を対象ページの権威度として、検索サーバを介して利用者端末に返却することを特徴とする多角的検索サービス方法。 【請求項4】 請求項1に記載の多角的検索サービス方法において、前記評価情報識別子が類似度(1)である時には、該評価情報サーバは、対象ページおよび基準ページが共通にドメイン外リンクしているページ群に関して、平均ドメイン外リンク数の平均値の自然対数を、リンク先のページに張られているドメイン外からの被リンク数の自然対数で除算した数を求め、当該ページ群に関して加算した数を対象ページと基準ページの類似度(1)として、検索サーバを介して利用者端末に返却することを特徴とする多角的検索サービス方法。 【請求項5】 請求項1に記載の多角的検索サービス方法において、前記評価情報識別子が類似度(2)である時には、該評価情報サーバは、対象ページおよび基準ページから共通にドメイン外リンクされているページ群に関して、平均ドメイン外被リンク数の平均値の自然対数を、リンク元のページから張っているドメイン外へのリンク数の自然対数で割った数を求め、当該ページ群に関して加算した数を対象ページと基準ページの類似度(2)として、検索サーバを介して利用者端末に返却することを特徴とする多角的検索サービス方法。 【請求項6】 請求項1に記載の多角的検索サービス方法において、前記評価情報識別子がグラフィック度、ビジュアル度、またはオーディオ度である時には、該評価情報サーバは、対象ページから画像ファイル、動画ファイル、または音楽ファイルへの各リンク数を、それぞれオーディオ度、ビジュアル度、またはオーディオ度として、検索サーバを介して利用者端末に返却することを特徴とする多角的検索サービス方法。 【請求項7】 請求項1に記載の多角的検索サービス方法において、前記評価情報識別子が重要度である時には、該評価情報サーバは、総てのページに関し、定数a=0.15を総ページ数で除算し、当該対象ページがリンクを張っているページ群に関して、リンク先ページの重要度を当該ページの被リンク数で割った数を当該ページ群に関して加算した数に定数b=0.15を乗算し、当該対象ページにリンクを張っているページ群に関して、リンク元ページの重要度を、当該ページのリンク数で割った数を、当該ページ群に関して加算した数を1から定数a=0.15、定数b=0.15を引いた数と乗算し、上記各値を加算することで連立方程式を作成し、作成された多次元の連立方程式を数値計算により解き、その結果をデータベースに格納し、当該結果を対象ページに対する重要度として、検索サーバを介して利用者端末に返却することを特徴とする多角的検索サービス方法。 【請求項8】 請求項1に記載の多角的検索サービス方法において、前記評価情報識別子が新鮮度である時には、該評価情報サーバは、現在時刻から最終更新時刻を引いた数を更新頻度で割った数を、1から引いた数を求め、当該数で自然対数の底eをべき乗した数から1を減算した数を新鮮度として、検索サーバを介して利用者端末に返却することを特徴とする多角的検索サービス方法。 【請求項9】 請求項1に記載の多角的検索サービス方法において、前記評価情報識別子が豊富度である時には、該評価情報サーバは、対象ページのファイルサイズを豊富度として、検索サーバを介して利用者端末に返却することを特徴とする多角的検索サービス方法。 【請求項10】 請求項1に記載の多角的検索サービス方法において、前記評価情報識別子が人気度である時には、該評価情報サーバは、単位時間内に対象ページをクリックしたユーザ群に関して、単位時間内での全ユーザの平均クリック数の自然対数を、単位時間内にユーザによりクリックされた数の自然対数で除算し、当該ユーザ群に関して加算した数を人気度として、検索サーバを介して利用者端末に返却することを特徴とする多角的検索サービス方法。 【請求項11】 請求項1に記載の多角的検索サービス方法において、前記評価情報識別子が類似度(3)である時には、該評価情報サーバは、対象ページおよび基準ページから共通にユーザが移動しているページ群に関して、被トラフィック数の平均値の自然対数を移動先のページに移動しているユーザ数、つまりトラフィック数の自然対数で除算し、当該ページ群に関して加算した数を対象ページと基準ページの類似度(3)として、検索サーバを介して利用者端末に返却することを特徴とする多角的検索サービス方法。 【請求項12】 請求項1に記載の多角的検索サービス方法において、前記評価情報識別子が類似度(4)である時には、該評価情報サーバは、対象ページおよび基準ページから共通にユーザが移動しているページ群に関して、トラフィック数の平均値の自然対数を、移動元のページから移動しているユーザ数、つまりトラフィック数の自然対数で除算し、当該ページ群に関して加算した数を対象ページと基準ページの類似度(4)として、検索サーバを介して利用者端末に返却することを特徴とする多角的検索サービス方法。 【請求項13】 インターネット上のページを検索する多角的検索サービス装置であって、利用者端末から評価情報識別子と評価の基準となる基準ページを引数として当該ページ情報群の再ソートリクエストを受信した時には、当該ページ情報群の各ページに関して、当該評価情報識別子と基準ページを引数として当該ページに対する評価情報取得リクエストを発行する手段と、予めインターネット上の各ページから評価情報を計算して、計算結果を登録しておく評価情報データベースと、当該評価情報識別子と基準ページを引数として、上記評価情報データベースを検索する手段と、当該ページに関する評価情報を取得し、該評価情報を返却する手段と、当該評価情報データベース上に当該評価情報が存在しない時には、インターネット上の当該ページから当該評価情報を計算する手段と、当該評価情報に対する料金を課金する手段と、当該ページ情報群を当該評価情報順にソートする手段と、当該評価情報および課金情報を上記利用者端末に返却する手段とを有することを特徴とする多角的検索サービス装置。 【請求項14】 請求項1ないし請求項12のうちのいずれかに記載の多角的検索サービス方法の各処理ステップをプログラムに変換し、該プログラムを記録媒体に格納したことを特徴とするコンピュータにより読み出し可能なプログラム記録媒体。
|
【発明の詳細な説明】【0001】 【発明の属する技術分野】本発明は、インターネット上の検索エンジンにおいて、キーワードとの一致度以外の評価情報を用いて、検索結果をソートすることで多角的な観点から検索結果を吟味することが可能な多角的検索サービス方法および装置、ならびにプログラムを記録した記録媒体に関する。 【0002】 【従来の技術】検索エンジンは、インターネット上のWWWページ(以下、単にページ)を検索する時に利用されるシステムであって、従来の検索エンジンに対してユーザがキーワードを入力すると、検索エンジンは当該キーワードを含むページを返却している。しかし、検索のためのキーワードを1個ないし少数にした場合には、当該キーワードを含むページは膨大な数となることが多く、またキーワードを5,6個ないし多数にした場合には、当該キーワードを含むページは存在しないと返答されることも多く、結局は多数のページの中から最適なものを自分で探す作業が必要になっていた。 【0003】従来、検索エンジンにおいて、検索の結果である複数のページから重要度の高いページを探す技術としては、例えば、Sergey Brin and Lawrence Page: The anatomy of a large−scale hypertextual Web search engine,Proc.Of the Seventh International World Wide Web Conference,pp.107-117(1998-4)がある。また、同じく重要度の高いページを探す技術として、Monika Henzinger,Allan Heydon,Michael Mitzenmacher,and Marc A.Najork.Measuring Index Quality using Random Walks on theWeb. In Proceedings of the Eight International World Wide Web Conference,pages213-225(1999-5)がある。 【0004】さらに、検索結果である複数のページから類似度の高いページを探す技術としては、例えば、Ron Weiss,Bienvenido Velez,Mark A.Sheldon,Chanathip Manprempre,peter Szilagyi,Andrzei David K.Gifford.HyPursuit:A Hierarchical Network Search Engine that Exploits Content−Link Hypertext Clustering.Proceedingsof the 7th ACM Conference onHypwertext,New York(1996)がある。 【0005】 【発明が解決しようとする課題】このように、従来の技術では、インターネット上の検索エンジンから返却されるページ群から、利用者が意中のページを発見することは極めて困難であるという問題があった。すなわち、適切なキーワードを用いて検索を要求しても、検索エンジンから返却されるキーワードに一致するページは複数の場合が多く、その中から自分の希望するページを探す必要があり、この時間や労力は想像以上のものである。また、上記外国文献には、検索された複数ページから類似度の高いものを探す技術や、重要度の高いものを探す技術が提案されているが、いずれも利用者の意中のページを自動的に探すことは不可能であり、結局は、ユーザ自身が多角的な観点から検索結果を吟味する必要があった。 【0006】そこで、本発明の目的は、これら従来の課題を解決し、キーワードとの一致度以外の評価情報を用いて、検索結果をソードすることにより、多角的な観点から自動的に検索結果を吟味することが可能な多角的検索サービス方法および装置、ならびにそのプログラムを記録した記録媒体を提供することにある。 【0007】 【課題を解決するための手段】上記目的を達成するため、本発明の多角的検索サービス方法は、■利用者端末から検索サーバに対して、キーワードを引数として検索リクエストを発行した時、検索サーバが当該キーワードを含むページを選定し、ページ情報および該ページ情報毎のキーワードとの一致度を計算し、当該ページ情報群を一致度順にソートして上記利用者端末に返却し、利用者端末で表示した画面上で利用者により選択された該当ページを表示する検索サービス方法において、返却された上記利用者端末から上記検索サーバに対して評価情報識別子と評価の基準となる基準ページを引数として当該ページ情報群の再ソートリクエストを発行した時には、上記検索サーバは当該ページ情報群の各ページに関し、評価情報サーバに対して当該評価情報識別子と基準ページを引数として、当該ページに対する評価情報取得リクエストを発行し、該評価情報サーバは、予めインターネット上の各ページから評価情報を計算して、評価情報データベースに登録しておき、上記評価情報取得リクエストを受けた時、上記評価情報データベースを検索し、当該ページに関する評価情報が存在した時には、該評価情報を取得して、上記検索サーバに返却し、当該ページに関する評価情報が存在しない時には、当該ページから当該評価情報を計算し、計算結果を検索サーバに返却して、該評価情報に対して料金を課金し、該検索サーバは、受け取った当該ページ情報群を当該評価情報順にソートして上記利用者端末に返却し、該利用者端末は当該ページ情報群を表示する。 【0008】■また、前記評価情報識別子が網羅度である時には、該評価情報サーバは、対象ページに対して、該対象ページから張られているドメイン外へのリンク数を求め、対象ページから張られているドメイン内への各リンクに関して、リンク先のページから張られているドメイン外リンク数に、当該ページから張られているリンク数の逆数を掛けた数を加算し、両者を加算した数を対象ページの網羅度として、検索サーバを介して利用者端末に返却する。 【0009】■また、前記評価情報識別子が権威度である時には、該評価情報サーバは、対象ページに対して、該対象ページに張られているドメイン外から被リンク数を求め、対象ページに張られているドメイン内からの各リンクに関して、リンク元のページに張られているドメイン外被リンク数に、当該ページに張られている被リンク数の逆数を掛けた数を加算し、両者を加算した数を対象ページの権威度として、検索サーバを介して利用者端末に返却する。 【0010】■また、前記評価情報識別子が類似度(1)である時には、該評価情報サーバは、対象ページおよび基準ページが共通にドメイン外リンクしているページ群に関して、平均ドメイン外リンク数の平均値の自然対数を、リンク先のページに張られているドメイン外からの被リンク数の自然対数で除算した数を求め、当該ページ群に関して加算した数を対象ページと基準ページの類似度(1)として、検索サーバを介して利用者端末に返却する。 【0011】■また、前記評価情報識別子が類似度(2)である時には、該評価情報サーバは、対象ページおよび基準ページから共通にドメイン外リンクされているページ群に関して、平均ドメイン外被リンク数の平均値の自然対数を、リンク元のページから張っているドメイン外へのリンク数の自然対数で割った数を求め、当該ページ群に関して加算した数を対象ページと基準ページの類似度(2)として、検索サーバを介して利用者端末に返却する。 【0012】■また、前記評価情報識別子がグラフィック度、ビジュアル度、またはオーディオ度である時には、該評価情報サーバは、対象ページから画像ファイル、動画ファイル、または音楽ファイルへの各リンク数を、それぞれオーディオ度、ビジュアル度、またはオーディオ度として、検索サーバを介して利用者端末に返却する。 【0013】■また、前記評価情報識別子が重要度である時には、該評価情報サーバは、総てのページに関し、定数a=0.15を総ページ数で除算し、当該対象ページがリンクを張っているページ群に関して、リンク先ページの重要度を当該ページの被リンク数で割った数を当該ページ群に関して加算した数に定数b=0.15を乗算し、当該対象ページにリンクを張っているページ群に関して、リンク元ページの重要度を、当該ページのリンク数で割った数を、当該ページ群に関して加算した数を1から定数a=0.15、定数b=0.15を引いた数と乗算し、上記各値を加算することで連立方程式を作成し、作成された多次元の連立方程式を数値計算により解き、その結果をデータベースに格納し、当該結果を対象ページに対する重要度として、検索サーバを介して利用者端末に返却する。 【0014】■また、前記評価情報識別子が新鮮度である時には、該評価情報サーバは、現在時刻から最終更新時刻を引いた数を更新頻度で割った数を、1から引いた数を求め、当該数で自然対数の底eをべき乗した数から1を減算した数を新鮮度として、検索サーバを介して利用者端末に返却する。 【0015】■また、前記評価情報識別子が豊富度である時には、該評価情報サーバは、対象ページのファイルサイズを豊富度として、検索サーバを介して利用者端末に返却する。 【0016】10)また、前記評価情報識別子が人気度である時には、該評価情報サーバは、単位時間内に対象ページをクリックしたユーザ群に関して、単位時間内での全ユーザの平均クリック数の自然対数を、単位時間内にユーザによりクリックされた数の自然対数で除算し、当該ユーザ群に関して加算した数を人気度として、検索サーバを介して利用者端末に返却する。 【0017】11)また、前記評価情報識別子が類似度(3)である時には、該評価情報サーバは、対象ページおよび基準ページから共通にユーザが移動しているページ群に関して、被トラフィック数の平均値の自然対数を移動先のページに移動しているユーザ数、つまりトラフィック数の自然対数で除算し、当該ページ群に関して加算した数を対象ページと基準ページの類似度(3)として、検索サーバを介して利用者端末に返却する。 【0018】12)また、前記評価情報識別子が類似度(4)である時には、該評価情報サーバは、対象ページおよび基準ページから共通にユーザが移動しているページ群に関して、トラフィック数の平均値の自然対数を、移動元のページから移動しているユーザ数、つまりトラフィック数の自然対数で除算し、当該ページ群に関して加算した数を対象ページと基準ページの類似度(4)として、検索サーバを介して利用者端末に返却する。 【0019】本発明の多角的検索サービス装置は、13)利用者端末から評価情報識別子と評価の基準となる基準ページを引数として当該ページ情報群の再ソートリクエストを受信した時には、当該ページ情報群の各ページに関して、当該評価情報識別子と基準ページを引数として当該ページに対する評価情報取得リクエストを発行する手段と、予めインターネット上の各ページから評価情報を計算して、計算結果を登録しておく評価情報データベースと、当該評価情報識別子と基準ページを引数として、上記評価情報データベースを検索する手段と、当該ページに関する評価情報を取得し、該評価情報を返却する手段と、当該評価情報データベース上に当該評価情報が存在しない時には、インターネット上の当該ページから当該評価情報を計算する手段と、当該評価情報に対する料金を課金する手段と、当該ページ情報群を当該評価情報順にソートする手段と、当該評価情報および課金情報を上記利用者端末に返却する手段とを有している。 【0020】14)上記■ないし(12)に記載された多角的検索サービス方法の各処理ステップをプログラムに変換し、該プログラムを記録媒体に格納する。 【0021】 【発明の実施の形態】以下、本発明の実施例を、図面により詳細に説明する。 (装置構成)図1は、本発明の一実施例を示す多角的検索サービス装置の構成図である。図1に示すように、インターネット17には各利用者により利用される利用者端末11,12,13が接続されるとともに、検索サービス提供者により提供され、検索エンジンを内蔵した検索サーバ14が接続される。ここまでは、従来の構成と同じであるが、本発明においては、これに加えて評価情報提供者により提供される評価情報サーバ15が新たにインターネット17に接続されている。評価情報サーバ15には、評価情報データベース16が接続される。 【0022】評価情報サーバ15は、複数の検索結果が返却された利用者端末11〜13から、検索結果の情報評価要求が検索サーバ14に発行された場合、検索サーバ14から評価情報取得リクエストが発行されることにより、起動する。評価情報サーバ15は、評価情報データベース16を検索して当該ページに関する評価情報を取得し、検索サーバ14に返却する。評価情報データベース16には、評価情報サーバ16が予めインターネット上の各ページから当該評価情報を計算して登録しておく。しかし、インターネット上のページは毎日増加するので、リクエストが発行された対象ページに関して、評価情報データベース16に評価情報が登録されていなかった場合には、評価情報サーバ15はインターネット上の当該ページから当該評価情報を計算し、計算結果を検索サーバ14に返却する。 【0023】図20は、図1における多角的検索サービス装置の詳細ブロック図である。利用者端末装置20は、ユーザが任意のページから次のページにリクエストすることにより移動する動作を行うページ移動手段21と、キーワードを引数として検索リクエストを検索サービス提供装置(検索サーバ)40に対して送信した後、再度、基準ページと評価情報識別子とを引数として再ソートリクエストを検索サービス提供装置(検索サーバ)40に対して送信する要求結果送信手段24と、検索サービス提供装置40から最初の検索リクエストの検索結果および再度の再ソートリクエストの要求結果を受信する要求受信手段22と、これらに必要な操作を実行する操作実行手段23とを備えている。 【0024】検索サービス提供装置(検索サーバ)40は、キーワードを含むページを選定する検索手段44と、選択したページ情報の一致度を計算する一致度解析手段46と、利用者端末20から再ソートリクエストが発行された場合、評価情報提供装置(評価情報サーバ)30からのページ情報群を評価情報順にソートする再ソート手段45と、利用者端末20からの検索リクエストおよび再ソートリクエストを受信する要求受信手段41と、利用者端末20に対して検索ページ群および評価情報順にソートされたページ情報群を送信するとともに、評価情報提供装置30に対して評価情報取得リクエストを発行する要求結果送信手段43と、これらに必要な操作を実行する操作実行手段42とを備えている。 【0025】評価情報提供装置(評価情報サーバ)30は、評価情報データベース装置36を検索して、当該ページに関する評価情報を取得する評価情報取得手段32と、評価情報に対する料金の課金を行う評価情報課金手段31と、検索サービス提供装置40からの評価情報取得リクエストを受信する要求受信手段33と、検索サービス提供装置40に対して評価情報および課金情報を送信する要求結果送信手段35と、これらに必要な操作を実行する操作実行手段34とを備えている。評価情報サーバ30を運営する評価情報提供者は、評価情報課金手段31により提供する評価情報に対する料金を課金する。このようにして、評価情報提供者は、検索サーバ40を運営する検索サービス提供者から評価情報に対する料金を徴収するビジネスモデルを構築できる。 【0026】(処理動作)図21および図22は、一致度だけの検索の場合と権威度を追加した検索の場合の各検索結果例を示す図である。図1において、利用者は利用者端末11〜13を介してインターネット17を介して検索サーバ14に対して検索リクエストを発行する。この場合は、従来の検索方法と同じ処理となる。この際、利用者はパラメタとしてKW:花火を指定する。検索サービス提供者は、検索サーバ14を介して当該花火を含むページを選定し、ページ情報(タイトル、概要、URL)および一致度を計算する。タイトルは『花火』に関する題名、概要は『花火』の内容の概略説明、URLは『プロトコル名/サーバ名/ファイル名』である。WWWブラウザは、URLを指定する機能を備えている。検索サービス提供者は、検索サーバ14を介して一致度順にソートされた図21に示す検索結果例を利用者端末11〜13に返却する。図21では、ページ内に『花火』と一致する用語が99存在するページを先頭に、88、77、66の順にソートされたURL群を利用者端末に返却している。 【0027】次に、利用者は、利用者端末11〜13を介して検索サーバ14に対して再ソートリクエストを発行する。この際、利用者は、パラメタとして評価情報ID:権威度を指定する。検索サーバ14は、当該検索結果の各URLに関しては、検索サーバ14は評価情報ID:権威度をパラメタとして評価情報サーバ15に対して当該URLに関する評価情報の取得リクエストを発行する。評価情報サーバ15は、評価情報データベース16を検索し、当該URLに関する評価情報:権威度を取得する。図22に示す評価情報例が取得できる。評価情報サーバ15は、検索サーバ14に対して当該評価情報例を返却し、当該評価情報取得リクエストに対する料金:1円を課金する。検索サーバ14は、当該評価情報順にソートした検索結果を利用者端末11〜13に返却する。利用者端末11〜13には、先頭に表示されたURLに移動して、検索サービスを終了する。 【0028】図22では、評価情報の権威度の値が最も大きい値から順にソートされたURL群を利用者端末に返却している。権威度が大きいURLとは、そのページが他に最も多く引用(リンク)されており、またそのページ内でも他からリンクされているものであり、一般的にはそのパラメタに関しては通常の利用者が必ずアクセスするページと言うことができる。 【0029】(表示画面例)図8は、本発明を実行する場合の画面例を示す説明図である。本発明を実行する際には、利用者端末の表示部に図8に示す画面が表示される。先ず、利用者は検索すべきパラメタとして、例えば『花火』を入力欄に入力し、右側の検索ボタンをクリックすると、『花火』に一致するページが一致度1〜100の順にソートされた100件が検索される。次に、利用者が下方に配置された権威、網羅、新鮮、豊富の各ボタンのうち権威ボタンをクリックすると、次に権威度の順にソートされた100件が提供される。権威ボタンの下に矢印があり、100件のうちの1件目が表示されたことを示している。また、類似度を指定するために、例えばNTTホームページに設定した後、右側の類似のページをのボタンをクリックすると、NTTのホームページに類似したページが検索されて出力される。 【0030】(多角的検索サービス方法)図2および図3は、本発明の一実施例を示す多角的検索サービス方法の処理フローチャートである。図2に示すように、多角的検索サービス方法の処理は、先ず利用者は、従来と同じように、利用者端末およびネットワークを介して検索サーバに対して検索リクエストを発行する。この際に、利用者はパラメタとしてKW(例として『花火』)を指定する(ステップ100)。次に、検索サービス提供者は、検索サーバを介して当該KWを含むページを選定し、ページ情報(タイトル、概要、URL)および一致度を計算する。検索サービス提供者は、検索サーバを介して一致度順にソートした検索結果を利用者に返却する(ステップ101)。利用者端末は、当該検索結果が表示され、利用者に提示される。利用者は、利用者端末を介して当該検索結果の任意のページに移動できる(ステップ102)。 【0031】次に、利用者は、本発明の多角的検索サービスを要求するため、利用者端末を介して再ソートリクエストを発行する。この際、利用者はパラメタとして評価情報IDおよび基準ページ(任意)を指定する。当該リクエストにより、検索サーバは、検索結果を指定した評価情報でソートする(ステップ103)。当該検索結果上の各URL毎に繰り返し行って、全て終了したならば(ステップ104)、図3に示すように、検索サーバは当該評価情報順にソートした検索結果を利用者に返却する(ステップ107)。そして、終了であれば(ステップ108)、処理を終了する。また、新規検索であれば(ステップ108)、再度、ステップ100に戻ってこれまでの処理を繰り返し行う。それ以外の場合には、ステップ102に戻って、利用者端末の画面に表示され、任意のページに移動できる。 【0032】図2の検索結果上の各URL毎に繰り返し行う場合(ステップ104)、図3に示すように、検索サーバは当該評価情報IDおよび当該基準ページ(任意)をパラメタとして、評価情報サーバに対して当該URLに関する評価情報の取得リクエストを発行する(ステップ105)。評価情報サーバは、評価情報データベースを検索し、当該URLに関する評価情報を取得する。評価情報データベース上に当該URLに関する評価情報が存在しない場合には、インターネット上のサイトにアクセスし、当該評価情報を計算する。評価情報サーバは、検索サーバに対して、当評価情報を返却し、当該評価情報取得リクエストに対する料金を課金する(なお、評価情報サーバおよび評価情報データベースの詳細な方法は、特願2000−82111号明細書および図面を参照のこと)(ステップ106)。そして、当該検索結果上の各URL毎に繰り返し行った後(ステップ104)、終了したならば、前述と同じように、評価情報順にソートした検索結果を利用者に返却する(ステップ107)。 【0033】(評価情報計算方法)図4〜図7は、本発明の評価情報サーバにおける評価情報計算方法の処理フローチャートであり、図9〜図19は、本発明の一実施例を示す評価情報の計算式を示す説明図である。評価情報サーバは、評価情報取得リクエストを受信したならば(ステップ111)、評価情報IDが網羅度の時、図9に示す式に従ってページxについて、ページxから張られているドメイン外へのリンク数と、ページxから張られているドメイン内への各リンクに関して、リンク先のページyから張られているドメイン外リンク数に、ページyから張られているリンク数の逆数を掛けた数を足し合わせた数を、足した数をページxの網羅度として計算し、その結果を返却する(ステップ112)。ここで、逆数を掛けた数は、重み付けであって、例えばページyから張られたドメイン外リンク数が3、ページxから張られているドメイン外各リンク数を2とすると、前者のみの逆数(重み)を加算して、(1/3)×3+2=3が全体として寄与する値となる。つまり、網羅度が大きいページとは、他のページに多くリンクを持つとともに、同じページ内にも多くリンクを持っているものである。 【0034】次に、評価情報IDが権威度の時、図10に示す式に従ってページxについて、ページxに張られているドメイン外からの被リンク数、ページxに張られているドメイン内からの各リンクに関して、リンク元のページyに張られているドメイン外被リンク数に、ページyに張られている被リンク数の逆数を掛けた数を、足し合わせた数を、足した数をページxの権威度として計算して、計算結果を返却する(ステップ113)。例えば、ページxへのリンク数が2、ページyからページxのドメイン外リンク数が3とすると、後者のみの逆数(重み)を加算して、(1/3)×3+2=3が全体として寄与する値となる。つまり、権威度の大きいページとは、他のページから多く参照されているとともに、同じページ内からも多く参照されるものである。網羅度と権威度の式の相違点は、網羅度の式がx→yの方向にリンクが張られているのに対して、権威度の式はy→xの方向にリンクが張られている点が異なっている【0035】次に、評価情報IDが類似度(1)の時、図11に示す式に従って、ページxおよび基準ページyが共通にドメイン外リンクしているページ群に関して、平均ドメイン外リンク数の平均値(例:10)の自然対数を、リンク先のページAに張られているドメイン外からの被リンク数の自然対数で割った数を足し合わせた数をページxと基準ページyの類似度(1)として計算して、計算結果を返却する(ステップ114)。つまり、類似度(1)の大きいページとは、基準ページに対して共通にドメイン外にリンクされている数が多いものである。図11の式では、平均ドメイン外被リンク数を、ページxにドメイン外から張られている全ての被リンク数で割った値(分数)により正規化して、使い易くしている。なお、従来より平均ドメイン外リンク数の平均値を、10にするのが最適とされているので、本実施例もこれに従うことにする。 【0036】次に、評価情報IDが類似度(2)の時、図12に示す式に従って、ページxおよび基準ページyから共通にドメイン外リンクされているページ群に関して、平均ドメイン外被リンク数の平均値(例:10)の自然対数を、リンク元のページAから張っているドメイン外へのリンク数の自然対数で割った数を足し合わせた数をページxと基準ページyの類似度(2)として計算し、計算結果を返却する(ステップ115)。類似度(1)と類似度(2)の相違点は、前者は基準ページyとページxとが外部のページaに共通にリンクしているのに対して、後者は基準ページyとページxとが外部のページaから共通にリンクされていることである。つまり、類似度(2)が大きいページとは、同じものからリンクされている数が多いものほど、互いに類似していると言える。 【0037】次に、評価情報IDがグラフィック度、ビジュアル度、オーディオ度の時、図13に示す式に従って、ページxから画像ファイル、動画ファイル、音楽ファイルへのリンク数を、グラフィック度、ビジュアル度、オーディオ度として返却する。各ファイルへのリンクの判定基準は、拡張子を用いる(ステップ116)。つまり、グラフィック度、ビジュアル度、オーディオ度が大きいページとは、リンク先が画像ファイル、動画ファイル、音楽ファイルに張られているリンク数の多いものが該当する。 【0038】次に、評価情報IDが重要度の時、図14に示す式に従って、総てのページに関して、定数a(例:0.15)を総ページTで割った数と、定数b(例:0.15)に、当該ページxがリンクを張っているページ群に関して、リンク先ページpの重要度を、ページpの被リンク数で割った数を足し合わせた数に、掛けた数と、1から定数a,bを引いた数に、当該ページxにリンクを張っているページ群に関して、リンク元ページqの重要度を、ページqのリンク数で割った数を足し合わせた数に、掛けた数を加える式を作成する。上記の手順で作成される多次元の連立方程式を数値計算により解き、その結果をデータベースに格納する。リクエスト時には、ページxに対する重要度を返却する(ステップ117)。なお、図14に示す式で、従来における指標では、定数a=0.15が最適な値として知られているので、本実施例でもこの値を使用する。また、定数bについては、未だ最適値が決定されていないが、本実施例ではb=0.15を最適値として使用する。また、従来の重要度を示す式では、図14に示す式の最後の項がないのが通例であるが、本実施例で最後の項を追加した式を用いることにより、より正確な解が得られることが分った。 【0039】図14に示す式の意味は、a・1/Tの項では総てのページ(例えば、100万ページ)のうちページxを利用者が見ている確率を示し、次のLinking(x)の項では、ある時点で観測したとき、ページxが見られている確率は100万人のうち何人であるかを示す部分であって、例えばページpに対して10本のリンクが張られており、そのうちの1本がページxからであるとき、pの持っている重要度のうち、1/10がページxからの寄与分であることを示す。次のLinked(x)の項は、リンク元ページqの重要度を、ページqに張られている被リンク数で割算した値に、1からaとbを差し引いた値を掛け合わした値である。この項が新しい付加部分である。例えば、連立方程式が100万式だけ記述することができるので、それぞれ代数式を解いて、計算したものが重要度となる。 【0040】次に、評価情報IDが新鮮度の時、図15に示す式に従って、現在時刻から最終更新時刻を引いた数を更新頻度で割った数を、1から引いた数で、自然対数の底eをべき乗した数から1を引いた数を新鮮度として計算し、計算結果を返却する。例えば、最終更新時刻は、HTTPヘッダのLast−modifiedタグから、また更新頻度は定期監視により取得する(ステップ118)。 【0041】次に、評価情報IDが豊富度の時、図16に示す式に従って、ページxのファイルサイズを豊富度として返却する(ス扱ップ119)。例えば、ファイルサイズは、HTTPヘッダのContent−Lengthタグから取得する。 【0042】次に、評価情報IDが人気度の時、図17に示す式に従って、単位時間内(例:1時間)にページxをクリックしたユーザ群に関して、単位時間内での全ユーザの平均クリック数(例:1クリック/時間)の自然対数を、単位時間内にユーザがクリックした数の自然対数で割った数を足し合わせた数を人気度として計算し、計算結果を返却する(ステップ120)。このように、人気度の式は正規化している。これは、1日に100万ページをクリックする人がそのページを見る場合と、1日に10ページしかクリックしない人がそのページを見る場合とを同列に扱うことなく、後者の方の寄与度を高くするためである。 【0043】次に、評価情報IDが類似度(3)の時、図18に示す式に従って、ページxおよび基準ページyから共通にユーザが移動しているページ群に関して、被トラフィック数の平均値の自然対数を、移動先のページAに移動しているユーザ数(トラフィック数)の自然対数で割った数を足し合わせた数をページxと基準ページyの類似度(3)として計算し、その結果を返却する(ステップ121)。前述の類似度(1)と類似度(2)では、直接リンクしている数を計算していたが、図18に示す類似度(3)の式では、ページxおよび基準ページyから他のページAに移動(トラバース)しているユーザが何人いるかを見れば、その数が多いほど類似度(3)が高いと言うことになる。 【0044】次に、評価情報IDが類似度(4)の時、図19に示す式に従って、ページxおよび基準ページyに共通にユーザが移動しているページ群に関して、トラフィック数の平均値の自然対数を、移動元のページAから移動しているユーザ数(トラフィック数)の自然対数で割った数を足し合わせた数をページxと基準ページyの類似度(4)として計算し、計算結果を返却する(ステップ122)。前記の類似度(3)はページxと基準ページyから他のページAに移動する人が何人いるかを計算していたが、図19の式で示す類似度(4)は、他のページAからページx,yに共通して移動している人が何人いるかを計算するものである。 【0045】図2〜図3に示す多角的検索サービス方法および図4〜図7に示す評価情報計算方法の各処理ステップをプログラムに変換し、変換されたプログラムをCD−ROMなどの記録媒体に格納しておくことで、この記録媒体をインターネットに接続された任意のコンピュータに装着し、プログラムをインストールするか、あるいはインターネットを介して他のコンピュータにダウンロードすることにより、それらのコンピュータで本発明を容易に実現することができる。 【0046】 【発明の効果】以上説明したように、本発明によれば、網羅度、権威度、類似度(1)(2)、グラフィカル度、オーディオ度、ビジュアル度、重要度、新鮮度、人気度、類似度(3)(4)等のようなキーワードとの一致度以外の検索評価情報を用いて、検索結果をソートすることで、多角的な観点から検索結果を吟味することができるので、検索エンジンから返却されるページ群から利用者が意中のページを容易に発見することが可能となる。
|
| 【出願人】 |
【識別番号】000004226 【氏名又は名称】日本電信電話株式会社
|
| 【出願日】 |
平成12年10月25日(2000.10.25) |
| 【代理人】 |
【識別番号】100077274 【弁理士】 【氏名又は名称】磯村 雅俊 (外1名)
|
| 【公開番号】 |
特開2002−132769(P2002−132769A) |
| 【公開日】 |
平成14年5月10日(2002.5.10) |
| 【出願番号】 |
特願2000−324812(P2000−324812) |
|