トップ :: G 物理学 :: G06 計算;計数




【発明の名称】 画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法
【発明者】 【氏名】守屋 博之

【要約】 【課題】画像データベースにおいて画像に対応付けられるキーワードの人的な要因によるばらつきを軽減するための画像特徴量対キーワード辞書構築装置を提供する。

【解決手段】電子文書ファイル及び電子文書ファイルに挿入されている画像ファイルを入力する手段102と、画像ファイルを解析して、画像ファイルに含まれる物体の特徴量を抽出する手段103と、電子文書ファイルを解析して、電子文書ファイルから物体に対するキーワード候補を抽出して、キーワード候補に対する得点を算出する手段104と、特徴量とキーワード候補と得点を対応付けて画像特徴量対キーワード辞書に登録する手段105、106と、を備える。
【特許請求の範囲】
【請求項1】 識別番号と不定数の画像特徴量が1対n(nは自然数)の関係で対応付けられ、前記識別番号と不定数のキーワード候補が1対m(mは自然数)の関係で対応付けられ、各キーワード候補に得点が1対1の関係で対応付けられており、前記画像特徴量は画像から抽出された画像の特徴を表す量であり、前記キーワード候補は前記画像に対応付けられている単語であり、前記得点は該得点に対応する前記キーワード候補の前記画像特徴量に対する調和度を表す、画像特徴量対キーワード辞書を記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
【請求項2】 電子文書ファイル及び前記電子文書ファイルに挿入されている画像ファイルを入力する手段と、前記画像ファイルを解析して、前記画像ファイルに含まれる物体の特徴量を抽出する手段と、前記電子文書ファイルを解析して、前記電子文書ファイルから前記物体に対するキーワード候補を抽出して、該キーワード候補に対する得点を算出する手段と、前記特徴量と前記キーワード候補と前記得点を対応付けて画像特徴量対キーワード辞書に登録する手段と、を備えることを特徴とする画像特徴量対キーワード辞書構築装置。
【請求項3】 請求項2に記載の画像特徴量対キーワード辞書構築装置において、相互に近似する特徴量を前記画像特徴量対キーワード辞書から検索する手段と、検索された前記特徴量との間で共通するキーワード候補があるか否かを調べる手段と、検索された前記特徴量に対する前記共通するキーワード候補の得点を増加させる手段と、を備えることを特徴とする画像特徴量対キーワード辞書構築装置。
【請求項4】 請求項2又は3に記載の画像特徴量対キーワード辞書構築装置において、得点が低いキーワード候補を前記画像特徴量対キーワード辞書から削除する手段を備えることを特徴とする画像特徴量対キーワード辞書構築装置。
【請求項5】 画像ファイルを入力する手段と、前記画像ファイルを解析して、前記画像ファイルに含まれる物体の特徴量を抽出する手段と、前記特徴量に近似する近似特徴量と、該近似特徴量に対応付けられているキーワード候補と、該キーワード候補に対応付けられている得点を画像特徴量対キーワード辞書から検索する手段と、前記キーワード候補を表示装置に表示させる手段と、表示された前記キーワード候補のうちから選択された選択キーワード候補を入力する手段と、を備えることを特徴とする画像データベース構築補助装置。
【請求項6】 請求項5に記載の画像データベース構築補助装置において、前記画像特徴量対キーワード辞書における選択キーワード候補の得点を増加させる手段を備えることを特徴とする画像データベース構築補助装置。
【請求項7】 請求項5又は6に記載の画像データベース構築補助装置において、表示された前記キーワード候補のうちから選択されなかったキーワード候補の得点を減少させる手段を備えることを特徴とする画像データベース構築補助装置。
【請求項8】 請求項5乃至7のいずれか1項に記載の画像データベース構築補助装置において、前記画像ファイルに対する新たなキーワード候補を入力する手段と、前記新たなキーワード候補を前記近似特徴量に対応付けて前記画像特徴量対キーワード辞書に登録する手段と、を備えることを特徴とする画像データベース構築補助装置。
【請求項9】 請求項5乃至7に記載の画像データベース構築補助装置において、前記選択キーワード候補を出力する手段を備えることを特徴とする画像データベース構築補助装置。
【請求項10】 請求項8に記載の画像データベース構築補助装置において、前記選択キーワード候補と前記新たなキーワード候補を出力する手段を備えることを特徴とする画像データベース構築補助装置。
【請求項11】 電子文書ファイル及び前記電子文書ファイルに挿入されている画像ファイルを入力するステップと、前記画像ファイルを解析して、前記画像ファイルに含まれる物体の特徴量を抽出するステップと、前記電子文書ファイルを解析して、前記電子文書ファイルから前記物体に対するキーワード候補を抽出して、該キーワード候補に対する得点を算出するステップと、前記特徴量と前記キーワード候補と前記得点を対応付けて画像特徴量対キーワード辞書に登録するステップと、を有することを特徴とする画像特徴量対キーワード辞書構築方法。
【請求項12】 請求項10に記載の画像特徴量対キーワード辞書構築方法において、相互に近似する特徴量を前記画像特徴量対キーワード辞書から検索するステップと、検索された前記特徴量との間で共通するキーワード候補があるか否かを調べるステップと、検索された前記特徴量に対する前記共通するキーワード候補の得点を増加させるステップと、を有することを特徴とする画像特徴量対キーワード辞書構築方法。
【請求項13】 請求項11又は12に記載の画像特徴量対キーワード辞書構築方法において、得点が低いキーワード候補を前記画像特徴量対キーワード辞書から削除するステップを有することを特徴とする画像特徴量対キーワード辞書構築方法。
【請求項14】 画像ファイルを入力するステップと、前記画像ファイルを解析して、前記画像ファイルに含まれる物体の特徴量を抽出するステップと、前記特徴量に近似する近似特徴量と、該近似特徴量に対応付けられているキーワード候補と、該キーワード候補に対応付けられている得点を画像特徴量対キーワード辞書から検索するステップと、前記キーワード候補を表示装置に表示させるステップと、表示された前記キーワード候補のうちから選択された選択キーワード候補を入力するステップと、を有することを特徴とする画像データベース構築補助方法。
【請求項15】 請求項14に記載の画像データベース構築補助方法において、前記画像特徴量対キーワード辞書における選択キーワード候補の得点を増加させるステップを有することを特徴とする画像データベース構築補助方法。
【請求項16】 請求項14又は15に記載の画像データベース構築補助方法において、表示された前記キーワード候補のうちから選択されなかったキーワード候補の得点を減少させるステップを有することを特徴とする画像データベース構築補助方法。
【請求項17】 請求項14乃至16のいずれか1項に記載の画像データベース構築補助方法において、前記画像ファイルに対する新たなキーワード候補を入力するステップと、前記新たなキーワード候補を前記近似特徴量に対応付けて前記画像特徴量対キーワード辞書に登録するステップと、を有することを特徴とする画像データベース構築補助方法。
【請求項18】 請求項14乃至16のいずれか1項に記載の画像データベース構築補助方法において、前記選択キーワード候補を出力するステップを有することを特徴とする画像データベース構築補助方法。
【請求項19】 請求項17に記載の画像データベース構築補助方法において、前記選択キーワード候補と前記新たなキーワード候補を出力するステップを有することを特徴とする画像データベース構築補助方法。
【請求項20】 コンピュータを請求項2乃至4のいずれか1項に記載の画像特徴量対キーワード辞書構築装置として機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
【請求項21】 コンピュータを請求項5乃至10のいずれか1項に記載の画像データベース構築補助装置として機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、画像の有する画像特徴量とその画像についての1又は2以上のキーワード等を対応付けて保持する画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、その辞書を構築する画像特徴量対キーワード辞書構築装置及びその方法並びにその辞書を用いた画像データベース構築補助装置及びその方法に関する。
【0002】
【従来の技術】大量の画像を蓄積する画像データベースにおいては、ユーザが必要とする画像を画像データベースから検索するために、各画像に1又は2以上のキーワードを付加して、そのキーワードを画像に対応付けて画像データベースに蓄積しておく。このような画像データベースから画像を検索する際には、ユーザは、検索したい画像について思いつくキーワードを入力する。すると、画像データベースからは、そのキーワードに対応付けられている1又は2以上の画像が出力される。複数のキーワードを入力した場合には、全てのキーワードが対応付けられている1又は2以上の画像が画像データベースから出力される。
【0003】上記の各画像に対して1又は2以上のキーワードを対応付けて大量の画像及びそれらに対応するキーワードを蓄積する画像データベースの構築は、従来、人手により行われていた。すなわち、画像データベースに登録するべき画像をコンピュータの画面に表示し、その画面を見た作業者がその画像から思いつくキーワードをコンピュータの画面に表示されている所定のキーワード入力欄に入力し、それからコンピュータ画面の所定のキーを押すなどして画像とキーワードを対応付けて画像データベースに登録していた。
【0004】
【発明が解決しようとする課題】しかしながら、上記の画像データベースの構築方法では、同一の画像を対象とした場合であっても、作業者毎に画像に対応付けるキーワードが異なってしまうことがあるという問題があった。大量の画像を画像データベースに蓄積するためには、複数の作業者が分担して画像を画像データベースに追加する必要があるので、上記の問題は避けられないものであった。また、この大量の入力作業自体も作業者にとっては大変なことであった。
【0005】本発明は、画像データベースにおいて画像に対応付けられるキーワードの人的な要因によるばらつきを軽減するための画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、その辞書を構築する画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法を提供することを目的とする。
【0006】また、本発明は、画像データベースを構築するための人手による作業を軽減するための画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、その辞書を構築する画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明によるコンピュータ読み取り可能な記録媒体は、識別番号と不定数の画像特徴量が1対n(nは自然数)の関係で対応付けられ、前記識別番号と不定数のキーワード候補が1対m(mは自然数)の関係で対応付けられ、各キーワード候補に得点が1対1の関係で対応付けられており、前記画像特徴量は画像から抽出された画像の特徴を表す量であり、前記キーワード候補は前記画像に対応付けられている単語であり、前記得点は該得点に対応する前記キーワード候補の前記画像特徴量に対する調和度を表す、画像特徴量対キーワード辞書を記録したことを特徴とする。
【0008】本発明による画像特徴量対キーワード辞書構築装置は、電子文書ファイル及び前記電子文書ファイルに挿入されている画像ファイルを入力する手段と、前記画像ファイルを解析して、前記画像ファイルに含まれる物体の特徴量を抽出する手段と、前記電子文書ファイルを解析して、前記電子文書ファイルから前記物体に対するキーワード候補を抽出して、該キーワード候補に対する得点を算出する手段と、前記特徴量と前記キーワード候補と前記得点を対応付けて画像特徴量対キーワード辞書に登録する手段と、を備えることを特徴とする。
【0009】また、本発明による画像特徴量対キーワード辞書構築装置は、上記の画像特徴量対キーワード辞書構築装置において、相互に近似する特徴量を前記画像特徴量対キーワード辞書から検索する手段と、検索された前記特徴量との間で共通するキーワード候補があるか否かを調べる手段と、検索された前記特徴量に対する前記共通するキーワード候補の得点を増加させる手段と、を備えることを特徴とする。
【0010】更に、本発明による画像特徴量対キーワード辞書構築装置は、上記の画像特徴量対キーワード辞書構築装置において、得点が低いキーワード候補を前記画像特徴量対キーワード辞書から削除する手段を備えることを特徴とする。
【0011】本発明による画像データベース構築補助装置は、画像ファイルを入力する手段と、前記画像ファイルを解析して、前記画像ファイルに含まれる物体の特徴量を抽出する手段と、前記特徴量に近似する近似特徴量と、該近似特徴量に対応付けられているキーワード候補と、該キーワード候補に対応付けられている得点を画像特徴量対キーワード辞書から検索する手段と、前記キーワード候補を表示装置に表示させる手段と、表示された前記キーワード候補のうちから選択された選択キーワード候補を入力する手段と、を備えることを特徴とする。
【0012】また、本発明による画像データベース構築補助装置は、上記の画像データベース構築補助装置において、前記画像特徴量対キーワード辞書における選択キーワード候補の得点を増加させる手段を備えることを特徴とする。
【0013】更に、本発明による画像データベース構築補助装置は、上記の画像データベース構築補助装置において、表示された前記キーワード候補のうちから選択されなかったキーワード候補の得点を減少させる手段を備えることを特徴とする。
【0014】更に、本発明による画像データベース構築補助装置は、上記の画像データベース構築補助装置において、前記画像ファイルに対する新たなキーワード候補を入力する手段と、前記新たなキーワード候補を前記近似特徴量に対応付けて前記画像特徴量対キーワード辞書に登録する手段と、を備えることを特徴とする。
【0015】更に、本発明による画像データベース構築補助装置は、上記の画像データベース構築補助装置において、前記選択キーワード候補を出力する手段を備えることを特徴とする。
【0016】更に、本発明による画像データベース構築補助装置は、上記の画像データベース構築補助装置において、前記選択キーワード候補と前記新たなキーワード候補を出力する手段を備えることを特徴とする。
【0017】
【発明の実施の形態】以下、図面を参照して本発明の実施形態について詳細に説明する。
【0018】本実施形態で生成される画像特徴量対キーワード辞書は、画像の有する画像特徴量に、その画像についての1又は2以上のキーワードとそのキーワードに与えられた得点を対応付けて保持するものである。
【0019】図1を参照すると、本実施形態による辞書構築装置101は、インターネット120、画像特徴量対キーワード辞書121と接続されており、HTML(Hypertext Markup Language)ファイル、画像ファイル取得部102、画像ファイル解析、特徴量抽出部103、HTMLファイル解析、キーワード候補抽出部104、画像特徴量、キーワード候補対応付け部105、画像特徴量対キーワード辞書登録部106、キーワード候補切捨部107を備える。
【0020】HTMLファイル、画像ファイル取得部102は、インターネット201と接続されており、物理層、データリンク層、IP(Internet Protocol)層、TCP(Transmission Control Protocol)層の上で、HTTP(Hypertext Transfer Protocol)又はFTP(File Transfer Protocol)により、WWW(World Wide Web)サーバからWWWサーバに蓄積されているHTMLファイル及びHTMLファイルに挿入されている画像ファイルを取得する。この際、例えばサーチエンジン構築システムで用いられているWWWロボットの方式、HTMLファイルのハイパーリンクを次から次へと辿っていく方式、IPアドレスを虱潰しに調べる方式等により、多数のWWWサーバから多数のHTMLファイル及び画像ファイルを取得する。
【0021】画像ファイル解析、特徴量抽出部103は、取得部102が取得した各画像ファイルを解析して、その画像ファイルが表示されると現れる物体を抽出し、抽出された物体の特徴量を更に抽出する。
【0022】図2を参照して、抽出部103による各画像ファイルから物体の特徴量を抽出する動作を説明する。
【0023】まず、取得部102から直接又はハードディスク等の記憶装置(不図示)を介して画像ファイルを読み込む(ステップS201)。次に、読み込んだ画像ファイルに対して、雑音除去、歪み補正、シャープネス補正等の前処理を施す(ステップS202)。次に、前処理が施された画像ファイルに対して、エッジ検出、領域分割等の物体抽出処理を施し、物体を抽出する(ステップS203)。最後に、抽出された物体を更に分割して色情報、形、面積比、外形輪郭軌跡、物体内領域輪郭軌跡等の特徴量を抽出する(ステップS204)。輪郭軌跡は、例えば、パラメトリック曲線(ベジェ曲線、Bスプライン曲線、NURBS曲線等)で近似表現しても良い。
【0024】HTMLファイル解析、キーワード候補抽出部104は、取得部102が取得した各HTMLファイルを解析し、HTMLファイルに記載されている単語であってHTMLファイルに挿入されている画像ファイルに関するキーワードになりそうな単語をキーワード候補として抽出する。
【0025】図3を参照して、抽出部104によるHTMLファイルからキーワード候補を抽出する動作を説明する。
【0026】まず、取得部102から直接又はハードディスク等の記憶装置(不図示)を介してHTMLファイルを読み込む(ステップS301)。次に、HTMLファイルに対して形態素解析を行い、HTMLファイルから単語をキーワード候補として抽出する(ステップS32)。次に、抽出されたキーワード候補の文字サイズ、文字修飾、画像(画像ファイルを基にHTML文書に表示される画像)からのHTML文書上での距離等をHTMLファイルのタグ、HTMLファイル中でのキーワード候補の位置、画像ファイルの位置等により取得する(ステップS303)。次に、画像からの距離が短いキーワード候補に例えば40点を与え(ステップS304)、文字サイズが大きいキーワード候補に例えば30点を与え(ステップS305)、出現頻度が高いキーワード候補に例えば20点を与え(ステップS306)、それ以外のキーワード候補に10点を与える(ステップS307)。従って、得点は、キーワード候補の画像特徴量に対する調和度を表すものである。
【0027】画像特徴量、キーワード候補対応付け部105は、抽出部103で抽出された特徴量と抽出部104で抽出されたキーワード候補とそのキーワード候補に与えられた得点を対応付ける。
【0028】画像特徴量対キーワード辞書登録部106は、画像特徴量とその画像特徴量に対応付けられたキーワード候補とそのキーワードに対する特典を辞書121に登録する。辞書121をオブジェクト・リレーショナル・データベースにより構成することにより、幾つあるかが不定である画像特徴量、キーワード候補、得点を、可変配列を持つ項目やネストされたテーブルを用いて柔軟に辞書121に登録することができる。
【0029】例えば、第1のテーブルに画像特徴量のユニークな識別番号を記録し、第2のテーブルにユニークでない識別番号及び画像特徴量を記録し、第3のテーブルにユニークでない識別番号、キーワード候補及び得点を記録し、第1のテーブルに第2のテーブルを識別番号をキーとして1対n(nは自然数)の関係でネストさせ、第1のテーブルに第3のテーブルを識別番号をキーとして1対m(mは自然数)の関係でネストさせればよい。
【0030】また、辞書121に登録を行う際、登録対象の特徴量に近似する特徴量が辞書121に既に登録されているか否かを調べる。そのような特徴量が既に辞書121に既に登録されている場合には、両者の特徴量の間で共通するキーワード候補(「共通キーワード候補」という。)があるか否かを調べる。共通キーワード候補がある場合には、登録しようとする特徴量に対応付けられている共通キーワード候補の得点を増加させ、登録しようとする特徴量に近似する特徴量に対応付けられている共通キーワード候補の得点も増加させる。このようにして、共通キーワード候補の得点を増加することにより、辞書121の精度を高めることができる。
【0031】キーワード候補切捨部107は、ある程度の量の特徴量が辞書121に蓄積された時点で、得点が低いキーワード候補を辞書121から削除する。キーワード候補切捨部107により、辞書121が不要に大きくなることを防止することができる。
【0032】図4を参照すると、画像データベース構築補助装置401は、画像特徴量対キーワード辞書121、画像ファイル420、ディスプレイ421、画像データベース422に接続されており、画像ファイル入力部402、画像ファイル解析、特徴量抽出部403、画像特徴量対キーワード辞書404、画像特徴量対キーワード辞書へのフィードバック部405、キーワード候補表示、選択部406、画像、キーワード登録部407を備える。
【0033】画像ファイル入力部402は、画像ファイル420を読み込む。
【0034】画像ファイル解析、特徴量抽出部403は、画像ファイル解析、特徴量抽出部読み取り103と同一であるので、これについての重複した説明は省略する。
【0035】画像特徴量対キーワード辞書検索部404は、抽出部403から入力する特徴量をキーとして、その特徴量に最も近似している特徴量であって辞書に登録されている特徴量(「近似特徴量」という。)並びに近似特徴量に対応付けられているキーワード候補及びそのキーワード候補に与えられている得点を辞書121から検索する。
【0036】キーワード候補表示、選択部406は、検索部404が検索したキーワード候補及び得点と入力部402が入力した画像ファイルの画像等を含む画面をディスプレイ421に表示させる。
【0037】選択部406がディスプレイ421に表示させる画面の例を図5に示す。その画面には、キーワード候補501、得点502、画像503の他に、キーワード候補を選択するチェックボックス504、新たなキーワード候補を入力する入力欄505、登録ボタン506がある。
【0038】作業者は、表示されたキーワード候補のうち適切であると判断する1又は2以上のキーワード候補についてのチェックボックスをチェックすることによりそのようなキーワードを選択する。また、作業者は、表示されたキーワード候補の他に適切なキーワードを想起した場合には、そのキーワードを新規キーワード候補として入力欄505に入力する。作業者は、最後に、登録ボタン506を押す。
【0039】登録ボタン406が押されると、選択部406は、選択されたキーワード候補(「選択キーワード候補」という。)及び新規キーワード候補を画像、キーワード登録部407及び画像特徴量対キーワード辞書へのフィードバック部405に出力する。
【0040】フィードバック部405は、検索部404から近似特徴量並びに近似特徴量に対応付けられたキーワード候補及び得点を入力し、選択部406から選択キーワード候補及び新規キーワード候補を入力する。次に、フィードバック部405は、近似特徴量に対応付けられたキーワード候補のうち選択キーワード候補となったキーワード候補の得点を増加させて、増加後の得点により辞書121に既存の得点を上書きする。また、フィードバック部405は、近似特徴量に対応付けられたキーワード候補のうち選択キーワード候補とならなかったキーワード候補の得点を減少させて、減少後の得点により辞書121に既存の得点を上書きする。更に、フィードバック部405は、新規キーワード候補に例えば選択キーワード候補と同程度の得点を与えて、新規キーワード候補とそれに与えられた得点を当該特徴量に対応させて辞書121に登録する。
【0041】画像、キーワード登録部407は、画像ファイル入力部402から入力した画像ファイルに、選択部406から入力した選択キーワード候補及び新規キーワード候補を関連付けて、それらを画像データベース422に登録する。
【0042】本発明の画像特徴量対キーワード辞書121の応用例として、デジタルコンテンツ販売の検索システムの一部として画像特徴量対キーワード辞書を用いることができる。画像特徴量対キーワード辞書とは別個に画像特徴量対画像データベースを構築しておく。画像特徴量対画像データベースは、デジタルコンテンツに蓄積されている画像ファイルを画像ファイル解析、特徴量抽出部103に与えて、画像ファイル解析、特徴量抽出部103から得られた特徴量を用いて構築することができる。
【0043】購買者は、所望の画像を購買するために検索システムにその画像に相応しいと思うキーワードを入力する。検索システムでは、まず、キーワードをキーとして、画像特徴量対キーワード辞書からそのキーワードに対応付けられている1又は2以上の特徴量を検索する。次に、検索された特徴量をキーとして、画像特徴量対画像データベースから1又は2以上の画像を検索し、検索された画像を表示する。表示された画像が多すぎる場合には、更に、それらの画像の集合と他のキーワードに対応して得られた画像の集合との論理積集合をとって、論理積集合に含まれる画像を表示する。
【0044】なお、画像特徴量対キーワード辞書121は、コンピュータ読み取り可能な記録媒体に記録される。
【0045】また、辞書構築装置101、画像データベース構築補助装置401の機能は、コンピュータをこれらの装置として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体からそのプログラムをコンピュータが読み込んで実行することにより実現することもできる。
【0046】また、上記の実施形態では、取得部102は、インターネット120に接続されるとしたが、本発明はこれに限られず、取得部102がHTMLファイルとHTMLファイルに挿入された画像ファイルを取得できるものであれば、取得部102が何と接続されていても良い。例えば、取得部102をイントラネット、LAN(Local Area Network)、コンピュータ読み取り可能な記録媒体に接続しても良い。
【0047】上記の記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、CD−ROM(Compact Disc Read Only Memory)、光磁気ディスク、DVD(Digital Versatile Disk)をあげることができる。
【0048】また、上記の実施形態では、登録部106が新たな画像特徴量とキーワード候補を登録するときに、得点を増加する処理を行うとしたが、本発明はこれに限られず、既に登録済みの画像特徴量とキーワード候補と得点に基づいて、得点を増加する処理を行っても良い。すなわち、既に登録済みの画像特徴量から相互に近似する画像特徴量を検索して、検索された画像特徴量間で共通するキーワード候補を探して、共通するキーワード候補が探せたならば、検索された画像特徴量についての共通するキーワード候補の得点を増加させるようにしても良い。
【0049】また、上記の実施形態では、HTMLファイルに画像が挿入され、HTMLファイルからキーワード候補を抜き出すとしたが、本発明はこれに限られず、画像が挿入され且つその画像についてのキーワード候補を抜き出せる電子文書ファイルであればいかなる電子文書ファイルもHTMLファイルの代わりに使用することができる。例えば、XML(Extensible Markup Language)ファイル、SGML(Standard Generalized Markup Language)ファイル、ワープロファイルも、HTMLファイルの代わりに使用することができる。
【0050】
【発明の効果】以上説明したように、本発明によれば、画像特徴量対キーワード辞書並びにその辞書を構築する辞書構築装置及びその辞書を用いて画像データベースを構築する画像データベース構築補助装置を導入したので、画像データベースを構築する際の作業者間のキーワードのバラツキを抑えることができ、作業者の負担も軽減することができる。
【出願人】 【識別番号】000162113
【氏名又は名称】共同印刷株式会社
【出願日】 平成12年10月24日(2000.10.24)
【代理人】 【識別番号】100065385
【弁理士】
【氏名又は名称】山下 穣平
【公開番号】 特開2002−132796(P2002−132796A)
【公開日】 平成14年5月10日(2002.5.10)
【出願番号】 特願2000−324309(P2000−324309)