| 【発明の名称】 |
画像修正システムおよび方法 |
| 【発明者】 |
【氏名】クレス,ウイリアム シー.
|
| 【要約】 |
【課題】画像データの画質を修正するシステムおよび方法を提供する。
【構成】画像データを受け取り、そのスペクトル頻度データを算出し、累積確率分布を計算する。また、画像データから空間パラメータを計算し、画像データによって表される画像がバックライトされたものか否かを判断する。バックライトされたものである場合には、バックライト領域のマスクを生成し、色調あるいは明度の修正をバックライト領域に適用する。 |
【特許請求の範囲】
【請求項1】 画像データを受け取る手段と、 受け取った画像データから、少なくとも1つの主たる画像領域と、少なくとも1つの背景領域との間の遷移部を特定する遷移部検出手段と、 この遷移部検出手段によって特定された遷移部にしたがって、主たる画像領域および背景領域のうちの少なくともいずれか一方に関する画像データのパラメータを調整する調整手段と を有することを特徴とする画像修正システム。 【請求項2】 前記調整手段は、前記主たる画像領域の画像データおよび前記背景領域の画像データのうちの少なくとも一方について明度を調整する手段を含むことを特徴とする請求項1に記載の画像修正システム。 【請求項3】 前記調整手段は、前記主たる画像領域の画像データについて明度を増大させ、前記背景領域の画像データについて明度を減少させる手段を含むことを特徴とする請求項1に記載の画像修正システム。 【請求項4】 前記画像データに含まれる色データのスペクトル頻度分布を表すスペクトル頻度データを算出する算出手段を、さらに、有し、 前記調整手段は前記スペクトル頻度データにしたがって前記主たる画像領域の画像データおよび前記背景領域の画像データのうちの少なくともいずれか一方について明度を調整する手段を含むことを特徴とする請求項1に記載の画像修正システム。 【請求項5】 前記スペクトル頻度データは、前記画像データ中の符号化された値の累積確率分布を表す分布データを含むことを特徴とする請求項4に記載の画像修正システム。 【請求項6】 特定された遷移部に対応するマスク・データを生成するマスク・データ生成手段を、さらに、有し、 前記調整手段は、前記マスク・データにしたがって特定された遷移部にしたがって、前記主たる画像領域および前記背景領域のうちの少なくともいずれか一方に関係する画像データのパラメータを、選択的に調整する手段を含むことを特徴とする請求項1に記載の画像修正システム。 【請求項7】 前記マスク・データは前記画像データによって表わされる画像の少なくとも1つの部分に対応し、この少なくとも1つの部分は不連続を持たない形状を規定することを特徴とする請求項6に記載の画像修正システム。 【請求項8】 画像データを受け取るステップと、 受け取った画像データから、少なくとも1つの主たる画像領域と、少なくとも1つの背景領域との間の遷移部を特定するステップと、 このステップにおいて特定された遷移部にしたがって、主たる画像領域および背景領域のうちの少なくとも一方に関係する画像データのパラメータを調整するステップと を含むことを特徴とする画像修正方法。 【請求項9】 前記調整するステップは、前記主たる画像領域の画像データおよび背景領域の画像データのうちの少なくとも一方について明度を調整することを含むことを特徴とする請求項8に記載の画像修正方法。 【請求項10】 前記調整するステップは、前記主たる画像領域の画像データについて明度を増大させ、前記背景領域の画像データについて明度を減少させることを含むことを特徴とする請求項8に記載の画像修正方法。 【請求項11】 前記画像データに含まれる色データのスペクトル頻度分布を表すスペクトル頻度データを算出するステップと、 前記スペクトル頻度データにしたがって前記主たる画像領域の画像データおよび前記背景領域の画像データのうちの少なくともいずれか一方について明度を調整するステップを、さらに、含むことを特徴とする請求項8に記載の画像修正方法。 【請求項12】 前記スペクトル頻度データは、前記画像データ中の符号化された値の累積確率分布を表す分布データを含むことを特徴とする請求項11に記載の画像修正方法。 【請求項13】 特定された遷移部に対応するマスク・データを生成するステップと、 前記マスク・データにしたがって特定された遷移部にしたがって、前記主たる画像領域および前記背景領域のうちの少なくともいずれか一方に関係する画像データのパラメータを、選択的に調整するステップと を、さらに、含むことを特徴とする請求項8に記載の画像修正方法。 【請求項14】 前記マスク・データは前記画像データによって表わされる画像の少なくとも1つの部分に対応し、この少なくとも1つの部分は不連続を持たない形状を規定することを特徴とする請求項13に記載の画像修正方法。
|
【発明の詳細な説明】【技術分野】 【0001】 本発明は、画像修正システムおよび方法に関し、特に、バックライトされた主たる画像領域(specimen)を含む画像の修正システムおよび方法に関する。 【背景技術】 【0002】 昨今、電子的に符号化された画像は随所に存在する。現在、電子的に符号化された画像は、ディジタル・スチル・カメラまたはディジタル・ビデオ・レコーダのような装置から直接取得されるか、写真等の他のメディアを画像走査するか、ライブのテレビ放送のようなストリーミング・メディアから取得されるか、または、数値的に符号化された画像アーカイブからのようにストレージ装置から取り出された以前に得た画像から構成され得る。多くのそのような画像は、理想的とは言えない条件下で取得されるか、または取得する画像の種々の側面に関する照明または他の性質の変動が原因で最適とは言えない結果となる画像をレンダリングする機器によって記録されるかの、いずれかであった。一例は、バックライト設定において撮られた画像である。そのような状況は、晴れた空、直射日光または他の比較的強い背景照明源が、建築物、人物または景色等の、関心とする対象の背後にある時に生じ得る。そのような状況における背景の照明は十分に強いため、前景画像または前景物体、逆光の画像部分、または両方の細部すなわち解像度が劣化する。そのような懸案事項に対処する以前のアプローチは、アルゴリズム的に、もしくは電気的に、あるいは信号処理を通じてか、または画像を取得する際におけるフィルトレーション、Fストップ、開口径等によって機械的に、行われていた。しかしながら、以前のシステムは、画像全体についての、取得あるいは処理に焦点が当てられていたため、それにより画像の一部分に対する懸案事項に対処する試みは、画像の他の側面については逆に悪影響を及ぼす問題点があった。 【0003】 キャプチャされた画像または保存された画像は、通常、ディジタル的にといったように符号化フォーマットで保存され、その符号化は、多くの場合、原色空間の成分値と関連づけて行われる。そのような色成分は、赤、緑、青(RGB)等のように本質的に加法的であるか、またはシアン、マゼンタ、黄色(CMY)等のように減法的であり、後者はしばしば黒色(K)と組み合わされ、CMYKまたはCMY(K)と呼ばれる。加法混色の三原色空間記述は、一般に、モニタまたはプロジェクタ等の光を発生する装置に表示される画像に関係する。一方、減法混色の三原色空間記述は、一般に、用紙印刷等の光を発生しない媒体あるいは装置上に生成される画像に関係する。画像を、ディスプレイから紙等の固定された媒体に移動するためには、ドキュメントの電子的符号化に関連づけられた色空間の間で変換を行う必要がある。 【0004】 ここに開示されているコンセプトは、画像処理またはレンダリングの応用において、画像の表現および画像のカラー化に使用される数値モデルを理解することによって、より良好に認識することができる。最初に数学的に定義された色空間の一つは、1931年にCIEによって作られ、CIE 1931色空間としても知られる、CIE/XYZ色空間である。人間の目は、青、緑および赤の受容体としても知られる短(S)波長、中(M)波長、および長(L)波長のための受容体を有する。必要なことは、色の知覚を記述する3つのパラメータを生成することだけである。3つの数値、すなわち3刺激値とそれぞれの色を関連づけするための特定の方法が色空間と呼ばれ、CIE/XYZ色空間は多くの色空間の一つである。CIE/XYZ色空間は、人間の目の測定に直接基づいており、この他の多くの色空間がCIE/XYZ色空間から定められ、共通基盤となっている。 【0005】 CIE/XYZ色空間において、3刺激値は人間の目のS、M、およびLの刺激ではなく、X、Y、およびZと呼ばれる3刺激値のセットである。これらもまたそれぞれ概ね、赤、緑、および青である。種々の色の異なる混合からなり、しかも同じ色を有する2つの光源を作ることができる(条件等色(メタメリズム))。2つの光源が同一の見かけの色を有するとき、それらを作るために使用された光の混合とは無関係にそれらは同一の3刺激値を有することになる。 【0006】 CIE/L*a*b*(CIE/LABあるいはLabとも表現される。)は、しばしばもっとも完全なカラー・モデルの1つとして考えられている。従来からCIE/LABモデルは、人間の目に見えるすべての色を記述するために使用されている。CIE/LABモデルは、人間の目に見えるすべての色を記述する目的のために国際照明委員会(Commission Internationale d’Eclairage;しばしばCIEと略して呼ばれる。)によって開発された。このモデルの3つのパラメータ(L、a、b)のうち、Lは輝度(明度)を表し、a、bは色の領域を表す。輝度Lが0のときは黒であり、100のときは白色である。aは赤と緑の間の位置を示し、値が正ならば赤を表し、値が負ならば赤の補色の緑を表す。bは黄色と青の間の位置を示し、値が正ならば黄色を表し、値が負ならば黄色の補色の青を表す。 【0007】 Labカラー・モデルは、デバイスに依存しない基準モデルとしての役割を果たすように作られた。したがって、このモデルにおける色の全再現領域(full gamut)、すなわち利用可能な全範囲の視覚的表現は完全には正確ではなく、むしろ色空間を概念化するために使用されている。Labモデルは3次元であるので、それは3次元空間において正しく表現される。Labモデルの有用な特徴は、最初のパラメータ、すなわちLが極めて直観的なことである。値Lの変更は、TV受像器における輝度設定の変更に似ている。Labモデルにおいて輝度は垂直軸上で表現され、モデル内の水平『スライス』のいくつかの表現だけで全色再現領域の概念的視覚化に十分である。 【0008】 Labモデルは、本質的に正しくパラメータ化されている。したがって、このモデルに基づく特有の色空間は必要ではない。CIE 1976 L*a*b*モード、すなわちLabモードは、色の差の知覚性(perceptibility)を定義しようとしたものである。Lab空間における円表現は、XYZ空間における楕円に対応している。L*、a*およびb*における非線形の関係は、立方根に関連しており、視覚の対数的な応答の再現が意図されている。カラーリング情報はシステムの白色ポイントの色に対して参照される。 【0009】 カラー画像を表現するドキュメント等の、電子ドキュメントは、通常、1ないしは複数の標準的なフォーマットで符号化される。そのようなフォーマットは数多く存在するが、最近の代表的な記述フォーマットには、Microsoft Word(登録商標)ファイル(*.doc)、タグ付き情報ファイル・フォーマット(TIFF)、グラフィック画像フォーマット(GIF)、米国アドビ・システムズ社のポータブル・ドキュメント・フォーマット(PDF)、米国アドビ・システムズ社のPostScript(登録商標)、ハイパー・テキスト・マークアップ言語(HTML)、拡張マークアップ言語(XML)、ドローイング・エクスチェンジ・ファイル(*.dxf)、ドローイング・ファイル(*.dwg)、ペイントブラシ・ファイル(*.pcx)、ジョイント・フォトグラフィック・エキスパート・グループ(JPEG)をはじめ、その他多数のビットマップ化された、あるいは符号化された、あるいは圧縮されたフォーマット、またはベクトル・ファイル・フォーマットが含まれる。 【0010】 したがって、異なる照明またはライティング特性の影響を受けた画像の領域部分に関する画質の劣化に対処するために、上記のような任意の符号化がなされた画像を容易に画質修正可能とするシステムおよび方法が望まれる。 【発明の開示】 【発明が解決しようとする課題】 【0011】 本発明は、上記の従来の問題点に鑑みてなされたもので、画像修正システムおよび方法を提供することを目的とする。また、本発明は、キャプチャ画像の2つ以上の主たる画像領域が別個の明度、輝度またはコントラスト特性を有する画像の画質を修正するシステムおよび方法を提供することを目的とする。さらに、本発明は、異なる照明またはライティング特性の影響を受けた画像の主たる画像領域に関する画質を修正するために、任意の符号化がなされた画像の容易な画質修正を可能にするシステムおよび方法を提供することを目的とする。 【課題を解決するための手段】 【0012】 本発明による画像修正システムは、画像データを受け取る手段と、受け取った画像データから、少なくとも1つの主たる画像領域(specimen area)と、少なくとも1つの背景領域との間の遷移部を特定する遷移部検出手段と、この遷移部検出手段によって特定された遷移部にしたがって、主たる画像領域および背景領域のうちの少なくともいずれか一方に関する画像データのパラメータを調整する調整手段とを有する。 【0013】 一実施形態において、前記調整手段は、前記主たる画像領域の画像データおよび前記背景領域の画像データのうちの少なくとも一方について明度を調整する手段を含む。別の実施形態において、前記調整手段は、前記主たる画像領域の画像データについて明度を増大させ、前記背景領域の画像データについて明度を減少させる手段を含む。 【0014】 さらなる実施形態において、本発明による画像修正システムは、前記画像データに含まれる色データのスペクトル頻度分布を表すスペクトル頻度(frequency)データを算出する算出手段を、さらに、有し、前記調整手段は前記スペクトル頻度データにしたがって前記主たる画像領域の画像データおよび前記背景領域の画像データのうちの少なくともいずれか一方について明度を調整する手段を含む。好ましくは、前記スペクトル頻度データは、前記画像データ中の符号化された値の累積確率分布を表す分布データを含む。 【0015】 また別の実施形態において、特定された遷移部に対応するマスク・データを生成するマスク・データ生成手段を、さらに、有し、前記調整手段は、前記マスク・データにしたがって特定された遷移部にしたがって、前記主たる画像領域および前記背景領域のうちの少なくともいずれか一方に関係する画像データのパラメータを、選択的に調整する手段を含む。好ましくは、前記マスク・データは前記画像データによって表わされる画像の少なくとも1つの部分に対応し、この少なくとも1つの部分は不連続を持たない形状を規定する。 【0016】 本発明による画像修正方法は、画像データを受け取るステップと、受け取った画像データから、少なくとも1つの主たる画像領域と、少なくとも1つの背景領域との間の遷移部を特定するステップと、このステップにおいて特定された遷移部にしたがって、主たる画像領域および背景領域のうちの少なくとも一方に関係する画像データのパラメータを調整するステップとを含む。 【発明の効果】 【0017】 本発明によれば、画像修正システムおよび方法が提供される。また、本発明によれば、キャプチャ画像の2つ以上の主たる画像領域が別個の明度、輝度またはコントラスト特性を有する画像の画質を修正するシステムおよび方法が提供される。さらに、本発明によれば、異なる照明またはライティング特性の影響を受けた画像の主たる画像領域に関する画質を修正するために、任意の符号化がなされた画像の容易な画質修正を可能にするシステムおよび方法が提供される。 【発明を実施するための最良の形態】 【0018】 本発明による画像修正システムは、前述した多くのフォーマットと関係づけられたディジタル符号化画像データのような数値的に符号化された画像データの分析および操作によって有効に動作する。以下の説明においては、画像キャプチャ装置またはディジタル画像処理装置において一般に見受けられることから、例証の目的で、一般的に使用されるRGB色空間において符号化されたディジタル画像について説明する。しかし、以下の説明から明らかなように、本発明は、あらゆる表色系またはグレイスケールにおける、あらゆる符号化画像に適用されることが認識されるはずである。さらに、本発明は、適切なコンピュータ・プラットホームにおいて具体化することが可能であるため、ワークステーションのような汎用ディジタル・コンピューティング装置と関連させて説明を行う。しかし、以下でさらに詳細に述べるとおり、本発明による画像修正システムは、ディジタル画像処理装置、ドキュメント処理装置のコントローラに実装可能であり、あるいはディジタル・カメラのような画像キャプチャ装置において直接具体化され、それらの装置は以下に述べる分析および計算を実行可能な能力を組み込むことができる。 【0019】 以下、適宜、図面を参照しながら本発明による実施形態の説明を行う。図1は本発明による実施形態が実施されるコンピュータあるいはワークステーションのハードウェア構成例を示すブロック図である。ワークステーション100は、不揮発性読み出し専用メモリ、揮発性読み出し専用メモリまたはそれらの組み合わせとする読み出し専用メモリ(ROM)104、RAM106、表示インターフェイス108、ストレージ・インターフェイス110およびネットワーク・インターフェイス112とのデータ通信を行うプロセッサ102を備える。一実施形態においては、上記のモジュールとのインターフェイスは、バス114を介して行われる。以下の説明から分かるように、ワークステーションの機能性は、通常、ストレージ装置から読出され、RAM106上で展開されるインストラクションによって、適切に具体化される。 【0020】 読み出し専用メモリ(ROM)104は、BIOS、システム機能、構成データおよびプロセッサ102によってワークステーション100の動作のために使用されるその他のルーチン等の静的データまたは固定的なインストラクション等のファームウェアを保存する。 【0021】 RAM106は、プロセッサ102によって実行されるアプリケーションおよびデータ処理に関連するデータおよびインストラクションのための記憶領域を提供する。 【0022】 表示インターフェイス108は、バス114に接続された他のモジュールからデータまたはインストラクションを受信する。それらのデータまたはインストラクションは表示の生成に特有であり、ユーザ・インターフェイスを有効なものにする。表示インターフェイス108は、映像表示装置、例えばCRT、LCD、プラズマ・ディスプレイまたはその他の適切な視覚出力装置等である表示モニタ128に対して出力を提供する。 【0023】 ストレージ・インターフェイス110は、ワークステーション100内のデータまたはインストラクションの不揮発性の大容量保存または長期的な保存のためのメカニズムを提供する。ストレージ・インターフェイス110は、ディスク・ドライブ、テープ、CD−ROM、DVD−ROM等の光学式ドライブまたはその他の比較的大容量のアドレス指定可能、またはシリアル記憶媒体から構成される記憶装置118等の保存メカニズムを使用する。 【0024】 ネットワーク・インターフェイス112は、例えば、ネットワーク・インターフェイス・カード(NIC)120として示した、ネットワークとのインターフェイスをとる、少なくとも1つの通信ユニットと通信を行う。ネットワーク・インターフェイスは、物理レイヤおよびプロトコル・レイヤの両方からなり、ネットワーク・インターフェイス・カード120を介してEthernet(登録商標)、トークン・リングまたはその他のワイド・エリアまたはローカル・エリア・ネットワーク通信システム等の任意の有線ネットワーク・システム132、あるいは無線インターフェイス130を介してWiFi(Wireless Fidelity)、WiMaxまたはその他の任意の適切な無線ネットワーク・システム等によって他の装置と通信することを可能にする。 【0025】 バス114を介してデータ通信を行う入出力インターフェイス116には、キーボード等の入力装置122が接続される。また、入出力インターフェイス116は、USB、SCSI、IEEE1394またはその他の適切な任意のインターフェイスである周辺インターフェイス124に対してデータ出力を提供する。さらに、入出力インターフェイス116は、マウス、ライト・ペン、タッチ・スクリーン等との接続のためのポインティング・デバイス・インターフェイス126とデータ通信を行う。 【0026】 図1に示した例において、ネットワーク・インターフェイス・カード120のようなネットワーク・インターフェイスは、ネットワーク・インターフェイス112を、有線ネットワーク・システム132とデータ通信可能とさせる。また同図において、ディジタル画像処理装置134、およびコントローラ138を含むドキュメント出力装置136も、有線ネットワーク・システム132とデータ通信を行っている。ディジタル画像処理装置134のみならず、プリンタ、複写機、ファクシミリ装置、スキャナ装置またはそれらの機能を組合せた装置等のインテリジェント出力装置は、しばしば、図に例示したようなインテリジェント・コントローラを用いる。このような装置には、以下説明を行う、画像の質を向上させる機能を実行するために十分な能力を含ませることができる。または、画質向上機能を、相互にデータ通信可能な複数のインテリジェント装置間に適切に分散されることもできる。 【0027】 次に、図2を参照しながら、本発明による実施形態における動作を説明する。図2に、本発明による一実施形態における画像修正の動作を説明するためのフローチャートを示す。最初にS202で、画像データが、本技術分野において知られているいずれかの適切な手段を通じて、受け取られる。前述したように、受け取られる画像データは、例えば、前述した複数の画像データ・ソースのうちのいずれかからのディジタル符号化画像等の電子ドキュメントである。次にS204において、入力された画像データは、符号化データに関する頻度(frequency)情報について分析され、スペクトル頻度データが算出される。一実施形態においては、符号化データに関する頻度(frequency)情報の分析からヒストグラムが生成されるが、その詳細は以下で述べる。 【0028】 次にS206で、累積確率分布関数が計算され、S204で実行されたスペクトル分析、すなわち画像内容分析についてのヒストグラムを形成する。次にS208において、空間パラメータ、すなわち画像データで表される画像における特徴的領域に関する特性が計算される。この計算によって、画像に含まれ、区別可能な領域が特定され、特徴が異なる領域の間の遷移部も特定される。その後S210で、受け取った画像データについて統計に基づく判断が行われ、受け取った画像データがバックライトされている、すなわち逆光であるか否か判断される。画像がバックライトされていないと判断された場合には、処理は終了する。画像がバックライトされていると判断されると、S212では、1つまたは複数のバックライト画像部分、すなわち逆光の画像部分のマスク領域の生成あるいは特定が行われる。一実施形態のバックライト画像においては、マスクは連続的であり(contiguous)、ぼかされている。本実施形態においてはバックライト領域マスクが使用されているが、生成されるマスクはバックライト領域マスクか正面画像領域(frontal image area)マスクのいずれかである。どちらのマスクが選択されるかにしたがって行われる適切なアルゴリズム的調整が用いられる。次にS214で、本実施形態においては、色調(tone)修正がバックライト領域に適用されて、修正された画像出力が得られる。 【0029】 ここで、以上、説明を行った実施形態においては、主たる画像領域であるバックライト画像部分について、色調の修正を行っているが、修正は必ずしも色調に限定されるわけではなく、画像データのパラメータ、例えば明度、について調整を行うことも可能であることは明らかである。また、以上、説明を行った実施形態においては、主たる画像領域であるバックライト画像部分について、色調の修正を行っているが、修正の対象はバックライト画像部分に限定されるわけではなく、背景画像部分に対して行うことも可能である。 【0030】 上述のような画像修正は、多くの場合に符号化画像に付随するメタデータに対して実行される。しかしながら、そのような補正は、画像データから直接的に計算することによっても行うことができる。ディジタル・カメラのような装置は、多くの場合、メタデータを含む符号化画像を含む。ディジタル・カメラのようなディジタル・キャプチャ装置からの画像は、バックライト状況が避けられないか、または未熟な撮影者によって考慮されない限りにおいて、画像の取得については特に問題が多い。 【0031】 上述のシステムは、トーン・スケール・レンダリングにおいて行われる、空間的に制約された変更と同様に、画像に関係するパラメータの計算によって画像修正を実行する。実際の修正は、一実施形態においては、累積確率分布および空間予測子(spatial predictors)を用いて行われる。さらに、画像の一部分だけが、バックライト写真、すなわち逆光で撮った写真における晴れた空のようなトーン・スケールの問題がある場合、全体的な画質の顕著な改善を可能にするためには、問題がある部分だけについて対処する必要がある。相補的な画像部分は変更しないままとするか、または各々の部分について適切な方法で独立に画像修正を行う。この点は、通常、画像修正の方法あるいはアルゴリズムを画像の全体にわたって適用する従来のシステムと、大きく異なる点である。従来のアルゴリズムは、処理を行わなければ許容できる画質の画像部分を、処理または調整することがあり、結果的には許容できる画質の画像部分について劣化を招く。 【0032】 次に図3を参照しながら、本発明による実施形態の実施に関連して用いられるスペクトル頻度(frequency)分析に関して説明する。画像ピクセルに関する色の値の累積確率分布によって、対応する電子画像のバックライティング、すなわち逆光の程度の指標が有効に得られる。良好に照明された画像に比較して、バックライト画像に関する累積確率分布は、最初に急激に上昇する。さらに、バックライト画像に関する累積確率分布においてはスケールの中間の範囲に、多くの場合、平坦部が存在する。前述したように、代表的な符号化は赤、緑、青すなわちRGB色空間と関連しており、この符号化は以下で説明を行う図3、図4および図8に示す代表的なグラフに反映されている。 【0033】 図3に、バックライティング、すなわち逆光照明が存在する2つのサンプル画像についての累積確率分布データの例を示す。図3に示す2つのグラフは代表的なものにすぎないが、バックライト画像の特性をよく示している。この例においては、RGB符号化の赤、緑および青の各々を符号化するために8ビットが使用されており、赤、緑および青の各成分は、グラフの実線、点線、および一点鎖線としてそれぞれの曲線に反映されている(図4および図8においても同様)。8ビット符号化によって、3つの加法混色の原色のそれぞれは256(0〜255)のレベルを取りうる。グラフの横軸は、赤(R)、緑(G)および青(B)の値を表す。縦軸はRGB値それぞれに関係する累積確率分布である。すなわち、縦軸の値は、横軸に示された対応するRGB値未満である変動係数(a coefficient of variation)の関数である確率を表している。 【0034】 図3(a)に示した例は、図5〜図7を参照しながら後にも説明を行う、ハンブルグ大聖堂の画像に関する累積確率分布である。図3(a)に示したグラフは、最初の急激な上昇、スケールの中間の範囲に存在する平坦部、および以降の再開する上昇を呈している。このことは、前述したように、対応する画像がバックライトされた画像であることを示している。図3(b)に示した例は、バックライトされた仏像の画像に関する累積確率分布である。このグラフにおいても最初の急激な上昇、スケールの中間の範囲に存在する平坦部が見られる。しかし、このグラフにおいては図3(a)に示したグラフと異なり、第2の急激に上昇する領域が存在しないことが注目される。 【0035】 次に図4に、フロントライティング、すなわち前方照明が存在する2つのサンプル画像についての累積確率分布データの例を、図3と同様に、赤、緑および青の各成分は、グラフの実線、点線、および一点鎖線としてそれぞれの曲線に反映されている。図4に示した2つの例においては、図3に示したグラフに関連して述べた急速な上昇および以降の平坦部の傾向が、どちらの例においても見られないことが注目される。したがって、累積確率分布は、画像がフロントライティングであるのか、またはバックライティングであるのかを、容易に検出しうるメカニズムを提供する。 【0036】 他の検討事項は、累積確率分布が得られる関心領域、および種々の領域における符号値の相対的な分布である。例えば、ほとんどの人々が主な被写体を中央に配置して写真を撮ると統計的に仮定すれば、中央加重累積確率分布が関心事になる。それがバックライト状況のような場合には、画像の上部は、一般に、中心領域または底部領域よりも相当に高い符号値を有していなければならない。 【0037】 図5に、バックライティングが存在する、図3(a)で参照したハンブルグ大聖堂の代表的な写真の例を示す。尚、示した元の画像はカラーであるが、カラー画像をグレイスケールに変換して示している。一実施形態においては、比較的暗い画像部分を連続的なブロブ(blob)として特定するために操作が行われる。ここでブロブは、一般にピクチャまたは画像フレームの中心において、それに関係している不連続のない形状として定義される。図2を参照しながら説明したように、一実施形態において、マスクがブロブから適切に生成され、マスク領域内部の画像部分における符号値は変更される。ブロブが不連続を有する場合、直接的な操作がすべての不連続を埋めるために適切に使用され、画質修正を適用するための連続的ブロブ領域に到達する。 【0038】 図6に、図5に示した画像に対応し、本発明による実施形態において特定される適切なマスク領域の例を示す。上述のとおり、特定されたマスク領域の外部の符号値も、また、暗くするなどして適切に変更されて、背景画像部分の見た感じ(view)を改善する。前述の画像を明るくする処理、画像の背景またはバックライト部分を暗くする処理、またはそれらの処理を組合せて適用し、画像修正処理がなされた画像を、図7に例示する。尚、図7に例示した元の画像もカラーであるが、カラー画像をグレイスケールに変換して示している。画像またはその一部分を、明るくする、あるいは暗くするアルゴリズムは、本技術分野では良く知られている。図7に示した画像は、図5に示した原画像に比べて、以上述べた処理の適用によって、細部において顕著に改善されていることは明らかであろう。 【0039】 図8に、図7に例示した画像修正処理がなされた画像についての累積確率分布データを示す。図8においても、図3および図4と同様に、赤、緑および青の各成分は、グラフの実線、点線、および一点鎖線としてそれぞれの曲線に反映されている。図7に示した修正された画像に関係する累積確率分布は、その原画像(図5)に関係する累積確率分布(図3(a))の形とは、大きく変化している。すなわち、図8においては、図3(a)の累積確率分布曲線に見られた、最初の急激な上昇、スケールの中間の範囲に存在する平坦部が存在しない。図7に例示した修正された画像に関係する、図8に示される累積確率分布は、図4(a)および(b)に示したような、通常のフロントライトされた画像の累積確率分布とより類似していることが分かる。 【0040】 本発明は、ソースコード、オブジェクトコード、部分的にコンパイルされた形のようなコード中間ソースおよびオブジェクトコードの形、あるいは本発明の実施形態で使用するために適した任意の他の形のコンピュータ・プログラムに適用される。コンピュータ・プログラムは、スタンドアローンのアプリケーション、ソフトウェア・コンポーネント、スクリプト、または他のアプリケーションへのプラグインとすることができる。本発明を実施するコンピュータ・プログラムは、例えば、ROMやRAMなどの記憶媒体、CD−ROMなどの光記録媒体、フロッピー(登録商標)ディスクなどの磁気記録媒体などの、コンピュータ・プログラムを伝達することができる任意の実体または装置である担体上で具体化することができる。この担体は、電気ケーブルまたは光ケーブルによって、または無線や他の手段によって伝えられる電気信号や光信号などの任意の伝達可能な担体である。コンピュータ・プログラムは、サーバからインターネットを介してダウンロードすることもできる。また、コンピュータ・プログラムの機能は集積回路に組み込むこともできる。説明を行った本発明の原理を実質的にコンピュータまたはプロセッサに実行させるコードを含む任意およびすべての実施形態は、本発明の範囲内にある。 【0041】 本発明の好ましい実施形態の以上の説明は、例示と説明のために行った。説明は網羅的ではなく、本発明を開示した形態に限定しようとするものでもない。以上の開示を鑑みて明らかな修正または変形が可能である。例えば、本明細書においては、バックライトされた主たる画像領域(specimen)のキャプチャ画像への適用について、主に説明した。しかし、本明細書で開示した技術的思想が、キャプチャ画像の2つ以上の主たる画像領域が別個の明度、輝度またはコントラスト特性を有するあらゆる画像修正に対しても適用可能である。実施形態は、本発明の原理とその実際的な応用例を最もよく示し、それにより当業者が、本発明を、意図された特定の使用に適した様々な実施形態において様々な修正で使用できるように選択され説明された。そのようなすべての修正と変形は、特許請求の範囲の記載に明示されるとおりの本発明の原理および範囲内において、当業者によって行われ得ることは明らかであり、特許請求の範囲の記載によって定められる発明の範囲内にある。 【図面の簡単な説明】 【0042】 【図1】本発明による実施形態において、システムの動作が実行されるワークステーションのハードウェア構成例を示すブロック図である。 【図2】本発明による実施形態において、画像修正の動作例を示すフローチャートである。 【図3】バックライティングが存在する画像についての累積確率分布データの例である。 【図4】フロントライティングされた画像についての累積確率分布データの例である。 【図5】バックライティングが存在する画像の例である。 【図6】図5に示した原画像に対応し、本発明による実施形態において特定されたマスク領域の例である。 【図7】図5に示した原画像に、本発明による実施形態の画像修正処理がなされた画像の例である。 【図8】図5に示した原画像に、本発明による実施形態の画像修正処理がなされた画像についての累積確率分布データである。 【符号の説明】 【0043】 102 プロセッサ 104 読み出し専用メモリ、ROM 106 RAM 108 表示インターフェイス 110 ストレージ・インターフェイス 112 ネットワーク・インターフェイス 114 バス 116 入出力インターフェイス 118 記憶装置、ディスク・ドライブ 120 ネットワーク・インターフェイス・カード 122 入力装置、キーボード 124 周辺インターフェイス 126 ポインティング・デバイス・インターフェイス 128 表示モニタ 130 無線インターフェイス 132 有線ネットワーク・システム 134 ディジタル画像処理装置 136 ドキュメント出力装置 138 コントローラ
|
| 【出願人】 |
【識別番号】000003078 【氏名又は名称】株式会社東芝 【識別番号】000003562 【氏名又は名称】東芝テック株式会社
|
| 【出願日】 |
平成19年8月20日(2007.8.20) |
| 【代理人】 |
【識別番号】110000235 【氏名又は名称】特許業務法人 天城国際特許事務所
|
| 【公開番号】 |
特開2008−48419(P2008−48419A) |
| 【公開日】 |
平成20年2月28日(2008.2.28) |
| 【出願番号】 |
特願2007−213403(P2007−213403) |
|