| 【発明の名称】 |
データ検索システム |
| 【発明者】 |
【氏名】原田 昌明
|
| 【要約】 |
【課題】不特定多数の者による検索をより高速かつ容易にする。
【解決手段】検索対象として、ハードディスク207に編成した文書データベースが選択された場合は、検索条件に従って文書データベースから検索し、他方、文書データベースの検索結果と、検索時に用いた検索条件と、検索内容を表すコメントとにより編成した検索ログデータベースであって、ハードディスク209上に編成した検索ログデータベースが選択された場合は、検索内容を表すコメントを含む検索条件に従って検索ログデータベースから検索し、検索結果を表示する。検索結果は、当該検索時に用いた検索条件と、入力された検索内容を表すコメントとともに検索ログデータベースに保存する。 |
【特許請求の範囲】
【請求項1】 文書データベースと、該文書データベースの検索結果と、検索時に用いた検索条件と、検索内容を表すコメントとにより編成した検索ログデータベースと、該検索ログデータベースまたは前記データベースのいずれを検索するかを選択するためのデータベース選択手段と、該データベース選択手段により文書データベースが選択された場合は、検索条件に従って前記文書データベースから検索し、他方、検索ログデータベースが選択された場合は、検索内容を表すコメントを含む検索条件に従って前記検索ログデータベースから検索する検索手段と、前記検索手段による検索結果を表示する検索結果表示制御手段と、コメントを入力するための入力手段と、前記検索手段により検索された検索結果を、当該検索時に用いた検索条件と、前記入力手段により入力された検索内容を表すコメントとともに前記検索ログデータベースに保存する保存手段とを備えたことを特徴とするデータ検索システム。 【請求項2】 請求項1において、前記検索結果表示制御手段は、検索結果とともに、検索条件を表示することを特徴とするデータ検索システム。 【請求項3】 請求項1において、前記検索結果表示制御手段により表示された検索結果から保存のための検索結果を選択するための選択手段と、該選択手段により選択された選択結果を確定する確定手段とをさらに備え、前記保存手段は、前記確定手段により確定された確定結果を、当該検索時に用いた検索条件と、前記入力手段により入力された検索内容を表すコメントとともに前記検索ログデータベースに保存することを特徴とするデータ検索システム。 【請求項4】 請求項3において、前記確定手段により確定された場合に、コメント入力用のテキスト入力フィールドを表示する表示制御手段をさらに備えたことを特徴とするデータ検索システム。 【請求項5】 請求項1において、前記文書データベースは、WebページおよびURLを含むことを特徴とするデータ検索システム。 【請求項6】 請求項5において、前記検索ログデータベースにおけるURLの全出現回数が多い順に検索結果を表示する検索結果表示制御手段をさらに備えたことを特徴とするデータ検索システム。
|
【発明の詳細な説明】【0001】 【発明の属する技術分野】本発明は、キーワードにより文書データを検索可能なデータ検索システムに関するものである。 【0002】 【従来の技術】従来から、インタネット上に構築された世界規模のWWW(world wide web)から、キーワードまたはその他の検索パラメータをもとにデータを取り出すのに検索エンジンが利用されている。このような検索エンジンは大きく2つのタイプ、すなわち、■WWWから文字情報を収集し、収集した文字情報の全文検索を行うものと、■Webページの内容を表すキーワードや解説、分類項目を設定し、それらの情報について検索を行うものとに分類される。一般に、前者はロボット検索と呼ばれ、後者はディレクトリ検索と呼ばれている。 【0003】 【発明が解決しようとする課題】しかしながら、ディレクトリ検索においては、Webページの情報が人間の判断で整理され分類されているため、キーワード検索による整合性が比較的高い一方、Webページ情報の登録内容が登録者の主観に左右され、検索者のキーワードと適合しなかったり、キーワード検索による該当(ヒット)件数が少なかったりする。 【0004】他方、ロボット検索においては、検索の元になるデータ量が多く、ヒット件数が多く出やすい一方、偶然キーワードを含んでいるようなページまでヒットしてしまうことがあった。このような場合、多くのキーワードを設定して絞り込み検索を行う必要があるが、検索に使用するキーワードの選択や論理式の設定などに技術が必要であったり、複雑な検索式を用いた場合など、検索処理に時間がかかっていた。 【0005】そこで、大量データの検索において、検索作業を容易にするため、例えば、過去の検索履歴を利用することが考えられており、この過去の検索履歴を利用した情報検索システムとしては、例えば、特開平10−63685号公報に記載のものが知られている。 【0006】しかしながら、この情報検索システムは検索履歴として検索者の項目が必須であり、検索履歴の検索要素として検索者の指定が必須であるので、インタネット上のWebページ検索のような不特定多数の検索者による検索に用いることはできなかった。 【0007】本発明の目的は、上記のような問題点を解決し、不特定多数の者による検索がより高速かつ容易にできるデータ検索システムを提供することにある。 【0008】 【課題を解決するための手段】請求項1の発明は、文書データベースと、該文書データベースの検索結果と、当該検索時に用いた検索条件と、検索内容を表すコメントとにより編成した検索ログデータベースと、該検索ログデータベースまたは前記データベースのいずれを検索するかを選択するためのデータベース選択手段と、該データベース選択手段により文書データベースが選択された場合は、検索条件に従って前記文書データベースから検索し、他方、検索ログデータベースが選択された場合は、検索内容を表すコメントを含む検索条件に従って前記検索ログデータベースから検索する検索手段と、前記検索手段による検索結果を表示する検索結果表示制御手段と、コメントを入力するための入力手段と、前記検索手段により検索された検索結果を、当該検索時に用いた検索条件と、前記入力手段により入力された検索内容を表すコメントとともに前記検索ログデータベースに保存する保存手段とを備えたことを特徴とする。 【0009】請求項1において、検索結果表示制御手段は、検索結果とともに、検索条件を表示することができる。 【0010】請求項1において、検索結果表示制御手段により表示された検索結果から保存のための検索結果を選択するための選択手段と、該選択手段により選択された選択結果を確定する確定手段とをさらに備え、保存手段は、前記確定手段により確定された確定結果を、当該検索時に用いた検索条件と、前記入力手段により入力された検索内容を表すコメントとともに前記検索ログデータベースに保存することができる。 【0011】請求項3において、確定手段により確定された場合に、コメント入力用のテキスト入力フィールドを表示する表示制御手段をさらに備えることができる。 【0012】請求項1において、文書データベースは、WebページおよびURLを含むことができる。 【0013】請求項5において、検索ログデータベースにおけるURLの全出現回数が多い順に検索結果を表示する検索結果表示制御手段をさらに備えることができる。 【0014】 【発明の実施の形態】以下、本発明の実施の形態を図面を参照して詳細に説明する。 【0015】図1は本発明の一実施の形態を示す。これはデータ検索システムの例であり、コンピュータ1と、サーバ2と、ルータ3が相互に接続してある。 【0016】コンピュータ1はクライアントとなるパーソナルコンピュータである。サーバ2はネットワーク上で他のコンピュータにサービスを提供するものである。ルータ3はインタネットに接続してありパケットのルーティングを行なうものである。 【0017】図2は図1のサーバ2の構成を示す。CPU(central processing unit)201と、ROM(read only memory)202と、RAM(random access memory)203と、入出力部204と、キーボード205と、ディスクコントローラ(DKC)206、208がシステムバスを介して相互に接続してある。 【0018】入出力部204は種々のデータ通信を制御するものである。RAM203は主メモリ、ワークエリア等として用いられ、制御プログラムおよびデータがストアしてある。CPU201はRAM203の制御プログラムに従って各部を制御するものである。ROM202はサーバ2を始動するためのプログラムがストアしてある。ディスクコントローラ206はハードディスク(HD)207を駆動制御するものである。ディスクコントローラ208はハードディスク209を駆動制御するものである。ハードディスク207には文書データベースが編成してあり、ハードディスク209には検索時に使用されたキーワードおよび論理式、検索結果、検索履歴を説明したコメント、等により検索ログデータベースが編成してある。 【0019】図3は図1のRAM203にストアされる検索プログラムの一例を示すフローチャートである。検索者により検索対象が選択されると、この処理を開始し、検索者により選択された検索対象が文書データまたは検索ログデータのうちのいずれであるかを判定する(S101)。そして、検索対象が文書データと判定した場合は、その後、検索キーワードが入力され(S111)、キーワード間の論理式が入力されると(S112)、この検索条件による検索を文書データベースに対して行なう(S113)。 【0020】そして、検索者により絞込検索が要求されたか否かを判定し(S114)、絞込検索が要求されたと判定した場合は、その後、追加検索条件が入力されると(S115)、S113に戻る。この検索者による絞込検索要求は、ヒットデータ数が多過ぎる場合に行われることが多い。他方、絞込検索要求がないと判定した場合は、ヒットデータ中に有効データが得られたか否かを判定する(S116)。そして、有効データが得られなかったと判定した場合は、S111に戻り、他方、有効データが得られたと判定した場合は、検索条件とともに検索ログデータベースに保存する有効データを選択する(S117)。そして、一連の検索についてその検索内容を示すコメントが入力されると(S118)、そのコメントを検索条件および有効データとともに、検索ログデータベースに保存する(S119)。 【0021】他方、検索対象が検索ログデータと判定した場合は(S101)、検索ログデータベースに保存されている各検索ログデータ項目に対してログ検索条件、すなわち、検索ログに対して、検索日時、キーワード、論理式が入力され、検索コメントに対して、各検索条件が入力されると(S102)、各検索条件に従い検索ログデータベースからデータを検索する(S103)。そして、各検索条件に合致する過去の検索ログの一覧を表示する。 【0022】そして、検索者により絞込検索が要求されたか否かを判定し(S104)、絞込検索要求があったと判定した場合は、その後、追加検索条件が入力されると(S105)、S103に戻る。他方、絞込検索要求がないと判定した場合は、ヒットデータ中に有効データが得られたか否かを判定する(S106)。そして、有効データが得られなかったと判定した場合は、S102に戻り、他方、有効データが得られたと判定した場合は、検索条件とともに検索ログデータベースに保存する有効データを選択する(S107)。そして、一連の検索についてその検索内容を示すコメントが入力されると(S108)、検索条件、有効データとともに検索ログデータベースに保存する。 【0023】なお、検索ログデータベースに保存される検索結果は、検索条件に合致する全ヒットデータを保存することも可能であるが、検索者が有効であると判断したデータのみを抽出して保存するのが好ましい。 【0024】また、ヒットデータから本当に有効なデータのみに限定して検索ログとして保存することにより、後の検索ログデータベースからの検索において、検索の正確性が向上することになる。 【0025】さらに、検索ログとして保存される検索条件は、絞込検索を行った場合には、最終的に絞込検索を加味した検索条件が保存される。この検索ログとして保存されるものは、少なくとも、キーワード、キーワード論理式、検索結果、検索コメントを含んだものであり、必要に応じて検索日時、検索者等のデータを保存し、後のログ検索の検索条件として使用することもできる。 【0026】検索されたデータの表示は、抽出された検索ログデータの検索結果において、個々の検索ログに重複したデータが存在する場合、重複回数が多い結果から順にデータ一覧を表示することも可能である。 【0027】検索ログは、先の新規検索からの検索ログと区別して保存されることが好ましい。そして、さらに後のログデータからの検索において、検索対象を「新規検索の検索ログ」または「ログ検索の検索ログ」のいずれか、あるいは、両方といったように選択可能であるようにすることが好ましい。 【0028】(新規検索)次に、例えば「川崎市内の賃貸住宅情報」についてのインタネットWebページを検索する例を説明する。図4は検索システムのトップページを示す。この画面からは、新規検索またはログ検索のいずれかの選択が可能であり、いずれかが選択されると、次画面へ移るようになっている。 【0029】ここで、「新規検索」とラベル付けされたラジオボタンが選択されたとすると、画面が図5の検索条件設定画面に変わる。この図5の画面では、いくつかのキーワードとキーワード間の論理式の設定が可能である。ここで、テキスト入力フィールドに、キーワードとして、「川崎」、「賃貸住宅」、「情報」が入力され、全てのキーワードを含むAND検索するための論理式が設定され、「検索実行」ボタンが操作されると、検索が実行され、その検索結果が表示される。その例を図6に示す。この例では、246件のURL(uniform resource locator)データがヒットしていて、画面には最初の20件が一覧表示されている。「次の20件を表示」が操作されると、次の20件が表示されるので、ヒットデータのURLを確認することができる。 【0030】ここで、ヒット件数が246件と多いため、絞込検索するため、「絞込検索を行なう」に対応する「Yes」ボタンが操作されたとすると、画面が図7の画面に変わる。そして、図7の画面において、例えば「南武線」というキーワードが「キーワード4」とラベル付けされたテキスト入力フィールドに追加され、「演算式の設定」とラベル付けされたテキスト入力フィールドに、全てのキーワードを含むAND検索するための論理式が設定され、「検索実行」ボタンが操作されると、検索が実行され、その検索結果が表示される。その例を図8に示す。この例では、34件のURLデータがヒットしていて、画面には最初の20件が一覧表示されている。「次の20件を表示」が操作されると、次の20件が表示されることになる。 【0031】そして、目的とする有効なWebページが見つからない場合は、目的とする有効なWebページが見つかるまで、検索者はこのような検索を繰り返すことになる。 【0032】検索ログを保存するには、図8の画面において、「No(ログ保存へ)」ボタンの操作が必要であり、その操作により、画面が図9に示す画面に変わる。図9の画面において、保存したい出力結果に対応するチェックボックスにチェックマークを付ける必要がある。この図10の検索ログ保存画面において、最終的に検索ログデータベースに保存する抽出データの確認を行うことが可能である。そして、「OK」ボタンが操作されると、画面が図10に示すような検索コメント入力画面に変わる。 【0033】図10の検索コメント入力画面において、コメントが入力され、「OK」ボタンが操作されると、図10の画面に表示されている検索結果が検索ログデータベースに保存され、この他に、検索に用いたキーワード、論理式、検索者によるコメント、抽出データ数/検索ヒットデータ数、検索日が、検索ログとして、検索ログデータベースに保存される。 【0034】(ログ検索)次に、ログ検索について説明する。図11は検索システムのトップページを示す。この画面からも、新規検索またはログ検索のいずれかが選択が可能であり、いずれかが選択されると、次画面へ移るようになっている。 【0035】ここで、「ログ検索」とラベル付けされたラジオボタンが選択されたとすると、画面が図12の検索条件設定画面に変わる。この図12の画面では、いくつかのキーワードの入力と、論理検索のための論理式の設定とが可能である。また、この論理検索は、検索ログのコメント内容に対して行う場合と、検索ログのキーワードに対して行う場合と別々に設定可能となっている。さらに、検索対象となるデータベースを、新規検索結果を記録した検索ログデータベースと、ログ検索の結果を記録したログ検索ログデータベースのいずれか、あるいは両方かを選択可能になっている。さらにまた、検索ログの記録日を限定することも可能になっている。 【0036】本例は、テキスト入力フィールドに、キーワードとして、「川崎」と「住宅」が入力されており、検索は検索コメントに上記2つのキーワードを両方含むものを、新規検索ログデータベースに対して行う例である。なお、検索ログ記録日および検索キーワードに対しては、設定を行っていない。 【0037】そして、図12の画面において、「検索実行」ボタンが操作されると、データベース検索を実施し、画面を図13に示すような検索結果表示画面に変える。図13の画面には、上記検索条件での過去の検索ログのヒット件数と、ヒットした検索ログの一覧が、キーワードおよび論理式、検索結果の保存件数/検索ヒット件数、保存されている検索内容コメントとともに表示される。 【0038】これら検索ログ一覧には詳細画面表示へのリンクが設定され、図14に示すような検索ログの詳細表示画面へ移ることができるようになっている。 【0039】このように、ログ検索によれば、保存されている検索ログの有効な検索履歴を参照することによって、目的とする情報を容易に得ることができる。 【0040】次に、検索結果をさらに絞り込む例を説明する。図15の画面は、図12の画面と同様の検索条件設定画面であるが、図12の画面とは次の■ないし■の点で異なる。 【0041】■「キーワード3」とラベル付けされたテキスト入力フィールドに、キーワードとして「賃貸」が追加されている。 【0042】■「キーワード演算式検索」における「する」オプションのラジオボタンがONにされ、テキスト入力フィールドに「3」が入力され、「否定演算子以後のキーワードは対象外」オプションのラジオボタンがONにされている。 【0043】■「検索期間限定」とラベル付けされたテキスト入力フィールドに、1999年1月1日から2000年6月20日までの検索期間が設定されている。 【0044】このような条件が設定された後、「検索実行」ボタンが操作されると、「川崎」および「住宅」という文字列を含む検索結果(図13には一部表示されている)に対して、さらに上記■ないし■を条件とする検索が行われることになる。すなわち、この場合の新規検索ログデータベースに対する検索により、「賃貸」をキーワードとして含み、かつ、検索実行日が1999年1月1日から2000年6月20日までの間のものが取り出されることになる。なお、「否定演算子以後のキーワードは対象外」オプションのラジオボタンがONにされていることから、否定演算子#の後ろにある「賃貸」は、当然に検索対象とはならない。 【0045】この検索による検索結果の一部を図16に示す。この例では、ヒット件数は31件に絞り込まれ、その結果、ヒットする検索ログの整合性も上昇した。 【0046】図16に示す「登録回数降順表示」ボタンが操作されると、重複量の多いデータ順にソートされ、その結果が一覧表示される。その例を図17示す。 【0047】このように重複量の多いデータ順にソート可能なのは、ログ検索においては、検索条件が異なっているにもかかわらず、検索結果が似通ることがあり、例えば、複数の検索結果にURL情報が重複して現れることがあるからである。そして、幾つもの検索履歴に重複して保存されているURL情報こそ有用な情報源ということができる。 【0048】そして、図17の「ログ保存」ボタンが操作されると、画面が図18の結果一覧画面に変わる。図18の結果一覧画面において、チェックボックスにチェックが行われ、「OK」ボタンが操作されると、検索条件とともに保存するURL情報が選択されることになり、画面が図19に示す画面に変わる。 【0049】図19の画面において、所定のテキスト入力フィールドに、検索内容を示すコメントが入力され、「OK」ボタンが操作されると、検索に用いたキーワードと、キーワード間の論理式と、検索内容コメントと、検索結果の有効抽出データと抽出データ数/検索ヒットデータ数と、検索日とが、検索ログとして検索ログデータベースに保存されることになる。 【0050】このように、新規検索と同様にログ検索の結果も保存することによって、有効なURL情報はさらに重複して保存されるので、このような検索が繰り返されることにより、有効なURL情報については重み付けが増加し、さらに検索精度が上昇することになる。 【0051】また、過去の検索ログを検索対象としたので、過去に同様の検索が行われている場合には、必要なデータを容易に検索することができる。さらに、優れた検索技術を持つ検索者が過去に同様の検索を行なっていた場合には、検索技術のない未熟な検索者であっても、検索ログデータベースを有効に活用することができる。 【0052】 【発明の効果】以上説明したように、本発明によれば、上記のように構成したので、不特定多数の者による検索がより高速かつ容易にできる。
|
| 【出願人】 |
【識別番号】000001007 【氏名又は名称】キヤノン株式会社
|
| 【出願日】 |
平成12年9月29日(2000.9.29) |
| 【代理人】 |
【識別番号】100077481 【弁理士】 【氏名又は名称】谷 義一 (外1名)
|
| 【公開番号】 |
特開2002−108933(P2002−108933A) |
| 【公開日】 |
平成14年4月12日(2002.4.12) |
| 【出願番号】 |
特願2000−301095(P2000−301095) |
|