トップ :: G 物理学 :: G06 計算;計数




【発明の名称】 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
【発明者】 【氏名】高藤 淳

【要約】 【課題】文書中の図や表等の画像を検索対象とした検索を行うことができるようにすること。

【解決手段】文書中の画像を検索するための検索条件を入力する複数のクライアント100と、文書DB101中の文書から文書中に存在する画像の位置情報を抽出すると共に、画像に関する記述を文書中の画像を検索するための画像検索情報として抽出し、抽出した画像検索情報をベクター表現に変換し、変換した画像検索情報のベクター表現に画像の位置情報を付加して転置ファイル102に登録し、クライアント100から入力した検索条件をベクター表現に変換し、検索条件のベクター表現と画像検索情報のベクター表現との類似度を求め、求めた類似度が所定の閾値を超える画像検索情報に対応する画像の位置情報を検索結果として出力する検索サーバ103と、を備えている。
【特許請求の範囲】
【請求項1】 予め用意された文書に含まれた図や表等の画像を検索する画像検索装置であって、前記文書に含まれた画像の位置情報を抽出すると共に、前記画像に関する記述を文書中の画像を検索するための画像検索情報として抽出して格納する画像情報格納手段と、検索条件を入力する入力手段と、前記入力手段を介して入力した検索条件に基づいて、前記画像情報格納手段から該当する画像検索情報を検索し、検索した画像検索情報に対応する前記画像の位置情報を検索結果として出力する検索手段と、を備えたことを特徴とする画像検索装置。
【請求項2】 前記画像検索情報は、前記文書中の画像に関する記述および前記文書中に存在する画像中の文字列を含むことを特徴とする請求項1に記載の画像検索装置。
【請求項3】 前記画像情報格納手段は、前記画像検索情報をベクター表現に変換して格納し、前記検索手段は、前記入力手段を介して入力した検索条件をベクター表現に変換し、前記検索条件のベクター表現と前記画像検索情報のベクター表現との類似度を求め、求めた類似度が所定の閾値を超える画像検索情報に対応する前記画像の位置情報を検索結果として出力することを特徴とする請求項1または2に記載の画像検索装置。
【請求項4】 前記請求項1〜3のいずれか1つに記載の画像検索装置の各手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、文書中の図や表等の画像を検索対象とした検索を行うことができるようにした画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】コンピュータの発達に伴って、紙を媒体として記録され、また保存されていた文書についても、電子化された情報として取り扱うことが一般的となり、大量の電子化された文書がデータベースに蓄積されることとなっている。
【0003】ところで、大量の電子化された文書が蓄積されていくに従って、大量の文書の中から所望の文書を容易に探し出すことができる検索技術が重要となってくる。特に、誰もがコンピュータを用いて作業を行う今日にあっては、特殊な手法を用いることなく、コンピュータの初心者であっても簡単に所望の文書を検索できるような検索システムを構築することが重要なポイントとなる。
【0004】検索の容易化を図るための1つの手法として、人間が通常用いる自然言語を用いて検索条件を入力することができるようにする技術を挙げることができる。この技術は、近年の自然言語処理技術の発達に伴って、多くの検索システムに取り入れられつつある。
【0005】
【発明が解決しようとする課題】近年のマルチメディア技術の進歩により、ワードプロセッサ等においても図や表等の画像を含めた文書を簡単に作成することができるようになっている。そのため、文書そのものではなく、文書中の画像を検索対象とすることができる技術の開発が望まれているが、上記従来の技術においては、文書中の画像を直接の検索対象とした検索を行うことはできなかった。換言すれば、上記従来の技術を用いて文書中の画像を検索するには、所望の画像が含まれていると思われる文書を検索した後、検索した文書から利用者自ら所望の画像を探し出さなければならなかった。
【0006】本発明は上記に鑑みてなされたものであって、文書中の図や表等の画像を検索対象とした検索を行うことができるようにすることを目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため、請求項1の画像検索装置は、予め用意された文書に含まれた図や表等の画像を検索する画像検索装置であって、前記文書に含まれた画像の位置情報を抽出すると共に、前記画像に関する記述を文書中の画像を検索するための画像検索情報として抽出して格納する画像情報格納手段と、検索条件を入力する入力手段と、前記入力手段を介して入力した検索条件に基づいて、前記画像情報格納手段から該当する画像検索情報を検索し、検索した画像検索情報に対応する前記画像の位置情報を検索結果として出力する検索手段と、を備えたものである【0008】また、請求項2の画像検索装置は、請求項1に記載の画像検索装置において、前記画像検索情報が、前記文書中の画像に関する記述および前記文書中に存在する画像中の文字列を含むものである。
【0009】また、請求項3の画像検索装置は、請求項1または2に記載の画像検索装置において、前記画像情報格納手段が、前記画像検索情報をベクター表現に変換して格納し、前記検索手段が、前記入力手段を介して入力した検索条件をベクター表現に変換し、前記検索条件のベクター表現と前記画像検索情報のベクター表現との類似度を求め、求めた類似度が所定の閾値を超える画像検索情報に対応する前記画像の位置情報を検索結果として出力するものである。
【0010】さらに、請求項4のコンピュータ読み取り可能な記録媒体は、前記請求項1〜3のいずれか1つに記載の画像検索装置の各手段としてコンピュータを機能させるためのプログラムを記録したものである。
【0011】
【発明の実施の形態】以下、本発明の画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体の一実施の形態について、添付の図面を参照しつつ詳細に説明する。
【0012】図1は、本実施の形態の画像検索装置のシステム構成図である。図1に示す画像検索装置は、文書中の画像を検索するための検索条件を入力すると共に、入力した検索条件に該当する文書中の画像を画面表示する複数のクライアント100と、クライアント100等で作成された複数の文書を格納した文書DB(データベース)101中の文書から文書中に存在する画像の位置情報を抽出すると共に、画像に関する記述を文書中の画像を検索するための画像検索情報として抽出し、抽出した画像検索情報をベクター表現に変換し、変換した画像検索情報のベクター表現に画像の位置情報を属性情報として付加して転置ファイル102に登録し、クライアント100から入力した検索条件をベクター表現に変換し、検索条件のベクター表現と画像検索情報のベクター表現との類似度を求め、求めた類似度が所定の閾値を超える画像検索情報に対応する画像の位置情報を検索結果として出力する検索サーバ103と、上記クライアント100や検索サーバ103等を接続するネットワーク104と、から構成されている。なお、クライアント100や検索サーバ103は、パーソナルコンピュータやワークステーション等のコンピュータで構成される。
【0013】図2は、検索サーバ103の処理を示す概略ブロック図である。検索サーバ103は、ベクトル空間法を用いた検索処理を行うことが可能なものであって、検索対象を文書中の画像とする検索処理だけでなく、検索対象を文書とする検索処理をも行うことができるものである。以下では、この図2を用いて、ベクトル空間法による検索処理を可能とするために、文書DB101に格納された文書を転置ファイル102に登録する処理およびベクトル空間法による検索処理について説明する。
【0014】(1)転置ファイルに登録する処理文書を転置ファイル102に登録する処理は、図2に示す自然言語処理モジュール200およびデータベース・ビルド・コンポーネント204によって行われる。
【0015】自然言語処理モジュール200は、文書DB101から文書を入力し、入力した文書について、フォーマットの認識処理や、品詞情報を格納した辞書201および各単語の係り受け等を解析するための文法辞書202を用いて形態素解析,構文解析等の解析処理を行う。そして、解析結果に基づいて、文書を複数のセンテンスからなるサブドキュメントに区切り、サブドキュメントから名詞句を抽出した後,サブドキュメント毎の名詞句リストからなるドキュメント・セット203を生成する。
【0016】また、自然言語処理モジュール200は、上記解析結果に基づいて、文書DB101から入力した文書中に存在する図や表等の画像の位置情報を抽出すると共に、画像に関する記述を文書中の画像を検索するための画像検索情報として抽出した後、この画像検索情報から名詞句を抽出し、画像検索情報の名詞句リストを含めてドキュメント・セット203を生成する。なお、画像検索情報の名詞句リストには、対応する画像の位置情報および画像検索情報であることを示す情報が属性情報として付加される。また、自然言語処理モジュール200は、図や表等の画像中の文字列についても画像検索情報として抽出することができる。
【0017】図3は、自然言語処理モジュール200の処理を説明するための説明図である。図3に示すように、文書中のあるページにグラフが存在する場合、自然言語処理モジュール200は、このグラフに関する記述を画像検索情報として抽出する。図3においては、例えば、「図2は、1996年の円相場の変動を示している」等を画像検索情報として抽出する。また、グラフ中の「図2 円相場の変動」等の文字列についても画像検索情報として抽出することができる。
【0018】データベース・ビルド・コンポーネント204は、自然言語処理モジュール200で生成したドキュメント・セット203を入力し、サブドキュメント中の各名詞句について、サブドキュメント中の出現頻度,文書DB101全体における分布等の統計情報を求め、求めた名詞句毎の統計情報を用いてサブドキュメントをベクター表現に変換する。この処理をドキュメント・セット203中の全てのサブドキュメントについて行い、変換したサブドキュメントのベクター表現に基づいて、文書のベクター表現を生成し、転置ファイル102に登録する。
【0019】また、画像検索情報中の各名詞句について、画像検索情報中の出現頻度,文書DB101全体における分布等の統計情報を求め、求めた名詞句毎の統計情報を用いて画像検索情報をベクター表現に変換し、属性情報である画像の位置情報および画像検索情報であることを示す情報を付加して転置ファイル102に登録する。なお、画像検索情報のベクター表現は、対応する文書のベクター表現と共に管理される。
【0020】このようにして、文書DB101中の各文書がベクター表現に変換されて転置ファイル102に登録される。これにより、ベクトル空間法を用いて文書中の画像の検索および文書の検索を行うことができるようになる。
【0021】(2)ベクトル空間法による検索処理ベクトル空間法による検索処理は、図2に示す自然言語処理モジュール200,クエリー・ビルド・コンポーネント207および検索エンジン209によって行われる。以下、■文書の検索処理,■文書中の画像の検索処理の順でベクトル空間法による検索処理を説明する。
【0022】■文書の検索処理自然言語処理モジュール200は、クライアント100から検索条件206を入力し、入力した検索条件206について、品詞情報を格納した辞書201および各単語の係り受け等を解析するための文法辞書202を用いて形態素解析,構文解析等の解析処理を行い、検索条件206から名詞句を抽出して、抽出した名詞句のリストからなるドキュメント・セット203を生成する。
【0023】クエリー・ビルド・コンポーネント207は、自然言語処理モジュール200から検索条件206のドキュメント・セット203を入力し、入力したドキュメント・セット203中の各名詞句について、ドキュメント・セット203中の出現頻度,転置ファイル102全体における分布等の統計情報を求め、求めた統計情報を用いてドキュメント・セット203をベクター表現に変換したクエリー・ドキュメント208(検索条件206のベクター表現)を生成する。
【0024】検索エンジン(例えば、CLARITECH社のCLARIT)209は、クエリー・ビルド・コンポーネント207で生成したクエリー・ドキュメント208と転置ファイル102中の文書のベクター表現との類似度を求め、各文書にクエリー・ドキュメント208との類似度に応じたスコアリングを行い、判定閾値を超えるスコアの文書を検索結果として出力する。
【0025】■文書中の画像の検索処理続いて、文書中の画像の検索処理について説明する。自然言語処理モジュール200は、クライアント100から検索条件206を入力し、入力した検索条件206について、品詞情報を格納した辞書201および各単語の係り受け等を解析するための文法辞書202を用いて形態素解析,構文解析等の解析処理を行う。解析処理を行った結果、入力した検索条件206中に文書中の画像を検索することを指定した制約条件が含まれている場合は、検索条件206から名詞句を抽出して、抽出した名詞句のリストからなるドキュメント・セット203を生成し、生成したドキュメント・セット203に文書中の画像を検索することを指定した画像検索指定情報を付加する。
【0026】クエリー・ビルド・コンポーネント207は、上述したように、自然言語処理モジュール200から入力したキュメント・セット203をベクター表現に変換したクエリー・ドキュメント208(検索条件206のベクター表現)を生成する。
【0027】検索エンジン209は、自然言語処理モジュール200によって付加された画像検索指定情報に基づいて、画像検索情報であることを示す情報が付加されている画像検索情報のベクター表現を検索対象として検索処理を行う。すなわち、クエリー・ビルド・コンポーネント207で生成したクエリー・ドキュメント208と転置ファイル102中の画像検索情報のベクター表現との類似度を求め、各画像検索情報にクエリー・ドキュメント208との類似度に応じたスコアリングを行い、判定閾値を超えるスコアの画像検索情報に対応する画像の位置情報を検索結果として出力する。
【0028】以上の構成において、本実施の形態の画像検索装置の概略動作を図4のフローチャートを用いて説明する。
【0029】クライアント100は、検索サーバ103に対して検索条件206を入力する。ここで、文書中の画像を検索したい場合には、例えば、「円相場の変動を示すグラフ」と入力する。この「円相場の変動を示すグラフ」中の「グラフ」が文書中の画像の検索を指定する制約条件となる。その他、表の場合は「・・・の表」,写真の場合は「・・・の写真」等と入力することにより、文書中の画像の検索を指定する制約条件を入力することができる。一方、文書を検索したい場合には、例えば「円相場の変動」と入力する。
【0030】検索サーバ103は、クライアント100から検索条件206を入力すると(S401)、自然言語処理モジュール200において、入力した検索条件206の解析処理を行う(S402)。
【0031】ステップS402の解析処理の結果に基づいて、検索条件206中に文書中の画像の検索を指定した制約条件が含まれているか否かを判定する(S403)。ステップS403において、検索条件206が「円相場の変動を示すグラフ」である場合には、「グラフ」という記述に基づいて、文書中の画像の検索を指定した制約条件が含まれていると判定し、ステップS404に進む。一方、検索条件206が「円相場の変動」である場合には、文書中の画像の検索を指定した制約条件が含まれていないと判定し、ステップS408に進む。
【0032】ステップS403において、文書中の画像の検索を指定した制約条件が含まれていると判定した場合、検索条件206から名詞句を抽出して、抽出した名詞句のリストからなるドキュメント・セット203を生成すると共に、生成したドキュメント・セット203に文書中の画像を検索することを指定する画像検索指定情報を付加する(S404)。
【0033】そして、生成したドキュメント・セット203に基づいて、検索条件206をベクター表現に変換したキュメント・セット203を生成する(S405)。
【0034】続いて、ステップS404で付加した画像検索指定情報に基づいて、ステップS405で生成したクエリー・ドキュメント208と転置ファイル102中の画像検索情報のベクター表現との類似度を求め、各画像検索情報にクエリー・ドキュメント208との類似度に応じたスコアリングを行い(S406)、判定閾値を超えるスコアの画像検索情報に対応する画像の位置情報を検索結果として出力する(S407)。すなわち、ベクトル空間法による検索処理が行われる。なお、判定閾値に代え、上位n番目のスコアの画像検索情報に対応する画像の位置情報を検索結果として出力することにしても良い。
【0035】クライアント100は、検索サーバ100から検索結果を入力し、検索結果である文書中の画像の一覧を画面表示すると共に、所望の画像が選択されると、位置情報に基づいて、該当する文書中の画像を画面表示する。なお、検索結果である文書中の画像の一覧を表示する際には、ステップS406の検索時に検索条件206と画像検索情報との類似度が判定されているため、検索条件206との関連性の高い画像から順に一覧表示することができる。
【0036】一方、ステップS403において、文書中の画像の検索を指定した制約条件が含まれていないと判定した場合、検索条件206から名詞句を抽出して、抽出した名詞句のリストからなるドキュメント・セット203を生成する(S408)。
【0037】そして、生成したドキュメント・セット203に基づいて、検索条件206をベクター表現に変換したクエリー・ドキュメント208(検索条件206のベクター表現)を生成する(S409)。
【0038】続いて、ステップS409で生成したクエリー・ドキュメント208と転置ファイル102中の文書のベクター表現との類似度を求め、各文書にクエリー・ドキュメント208との類似度に応じたスコアリングを行い(S410)、判定閾値を超えるスコアの文書を検索結果として出力する(S407)。すなわち、ベクトル空間法による検索処理が行われる。なお、判定閾値に代え、上位n番目のスコアの文書を検索結果として出力することにしても良い。
【0039】クライアント100は、検索サーバ100から検索結果を入力し、検索結果である文書の一覧を画面表示すると共に、所望の文書が選択されると、該当する文書を画面表示する。なお、検索結果である文書の一覧を表示する際には、ステップS406の検索時に検索条件206と文書との類似度が判定されているため、検索条件206との関連性の高い文書から順に一覧表示することができる。
【0040】なお、図4に示したフローチャートにおいては、文書中の画像を対象とした検索および文書を対象とした検索を別々に行うことにして説明したが、例えば、検索条件206が「円相場の変動を示すグラフ」である場合に、「円相場の変動」に関する文書と「円相場の変動を示すグラフ」とを同時に検索することにしても良い。また、図4に示したステップS403において、検索条件206中に制約条件が含まれているか否かで文書中の画像を対象とした検索または文書を対象とした検索のいずれを行うかを決定することにしたが、両方を検索対象として検索を行い、検索結果を出力する際に制約条件で絞り込みを行うという処理にしても良い。
【0041】このように、本実施の形態の画像検索装置によれば、文書中の画像に関する記述を抽出し、この記述を検索対象とするため、文書中の図や表等の画像を検索対象とした検索を行うことができる。
【0042】なお、本実施の形態において、ベクトル空間法に基づいて検索処理を説明したが、ベクトル空間法による検索処理に代えて、ブーリアン検索による検索処理を用いることにしても良い。
【0043】また、本実施の形態で説明した画像検索装置は、予め用意されたプログラムをパーソナルコンピュータやワークステーション等のコンピュータで実行することによって実現される。このプログラムは、ハードディスク,フロッピーディスク,CD−ROM,MO,DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、このプログラムは、上記記録媒体を介して、またはネットワークを介して配布することができる。
【0044】
【発明の効果】以上説明したように、本発明の画像検索装置(請求項1)によれば、予め用意された文書に含まれた図や表等の画像を検索する画像検索装置であって、文書に含まれた画像の位置情報を抽出すると共に、画像に関する記述を文書中の画像を検索するための画像検索情報として抽出して格納する画像情報格納手段と、検索条件を入力する入力手段と、入力手段を介して入力した検索条件に基づいて、画像情報格納手段から該当する画像検索情報を検索し、検索した画像検索情報に対応する画像の位置情報を検索結果として出力する検索手段と、を備えたため、文書中の図や表等の画像を検索対象とした検索を行うことができる。
【0045】また、本発明の画像検索装置(請求項2)によれば、請求項1に記載の画像検索装置において、画像検索情報は、文書中の画像に関する記述および文書中に存在する画像中の文字列を含むため、文書中の画像を検索するための画像検索情報として多くの情報を用いることができ、文書中の図や表等の画像を検索対象とした検索の精度の向上を図ることができる。
【0046】また、本発明の画像検索装置(請求項3)によれば、請求項1または2に記載の画像検索装置において、画像情報格納手段が、画像検索情報をベクター表現に変換して格納し、検索手段は、入力手段を介して入力した検索条件をベクター表現に変換し、検索条件のベクター表現と画像検索情報のベクター表現との類似度を求め、求めた類似度が所定の閾値を超える画像検索情報に対応する画像の位置情報を検索結果として出力するため、検索条件に最も関連のある文書中の画像から順に検索結果を表示することができる。
【0047】さらに、本発明のコンピュータ読み取り可能な記録媒体(請求項4)によれば、請求項1〜3のいずれか1つに記載の画像検索装置の各手段としてコンピュータを機能させるためのプログラムを記録したため、文書中の図や表等の画像を検索対象とした検索を行うことができる画像検索装置を実現することができる。
【出願人】 【識別番号】390024350
【氏名又は名称】株式会社ジャストシステム
【出願日】 平成9年(1997)8月18日
【代理人】 【弁理士】
【氏名又は名称】酒井 昭徳
【公開番号】 特開平11−66084
【公開日】 平成11年(1999)3月9日
【出願番号】 特願平9−221350