トップ :: H 電気 :: H04 電気通信技術




【発明の名称】 デジタル画像内の主色を識別する装置
【発明者】 【氏名】アミール・サイド

【要約】 【課題】デジタル画像の圧縮効率を高める。

【構成】デジタル画像内の少なくとも1つの主色を識別する装置が提供され
【特許請求の範囲】
【請求項1】
デジタル画像内の少なくとも1つの主色を識別するための装置であって、該装置は、前記デジタル画像中のランダムに選択された画素に対して検出ルールを実行するよう構成されたプロセッサを備えており、該プロセッサにより実行される検出ルールは、
前記デジタル画像に対して第1のサンプリングを行い、該第1のサンプリングで得られた画素のそれぞれについて、該画素の色ベクトルが色出現リストにないならば、該リストに該色ベクトルを追加して、該色ベクトル対応するカウンタを初期化し、該画素の色ベクトルが該色出現リストにあるならば、該色ベクトルに対応するカウンタをインクリメントするステップと、
前記デジタル画像に対して少なくとも1つの追加のサンプリングを行い、それぞれの該追加のサンプリングにおいて、
該追加のサンプリングで得られた画素のそれぞれについて、該画素の色ベクトルが前記色出現リストにあるならば、該色ベクトルに対応するカウンタをインクリメントし、
前記色出現リストにおいて、しきい値Tnより小さいカウンタの値qを持つすべての色ベクトルを、該リストから除去し、
前記色出現リストが空か、または該リスト中のすべての色ベクトルのカウンタの値qがしきい値Unより大きい値を有するならば、追加のいかなるサンプリングも行うことなく、完成された該リスト内のすべての色ベクトルを、前記主色として識別する、ステップと、
を含む、装置。
【請求項2】
前記プロセッサは、前記デジタル画像のストリップのそれぞれについて、少なくとも1つの前記主色を求める、
請求項1に記載の装置。
【請求項3】
前記検出ルールは、誤りの肯定的結果および誤りの否定的結果のうちの少なくとも一方の確率を最小にするよう構成され、
前記誤りの肯定的結果の確率は、r<rである色を主色として識別する確率であり、rは、所定のサンプル領域内において該色を有する画素数を、該サンプル領域内の総画素数で割ることにより得られる値であり、rは、所定の許容可能な比率であり、
前記誤りの否定的結果の確率は、r>rである色を主色として識別しない確率であり、rは、所定のサンプル領域内において該色を有する画素の数を、該サンプル領域内の総画素数で割ることにより得られる値であり、rは、所望の比率である、
請求項1または2に記載の装置。
【請求項4】
前記検出ルールは、前記色出現リストを作成するのに使用される、
請求項1に記載の装置。
【発明の詳細な説明】【技術分野】
【0001】
本発明は、デジタル画像に関し、より具体的には、複合文書の圧縮に関する。
【背景技術】
【0002】
デジタル複写機などのハードコピー装置は、一般に、文書ページをデジタル画像に変換するための走査エンジン、デジタル画像を記憶するためのメモリ、および記憶された画像を印刷するための印刷エンジンを含む。メモリは、通常、少なくとも1つのデジタル画像全体を記憶するのに十分な大きさを持つ。デジタル複写機は、デジタル画像全体をメモリに記憶することによって、記憶した画像の複数のコピーを印刷することができる。
【0003】
デジタル複写機のメモリおよび帯域幅の要件を低減するために、デジタル画像圧縮が行われる。メモリおよび帯域幅の要件を低減すると、デジタル複写機のコストが減る。
【発明の開示】
【発明が解決しようとする課題】
【0004】
複合文書を圧縮するには、1つの圧縮アルゴリズムでは都合が悪い。複合文書は、テキスト、図および写真領域(重なっていることもある)、複雑な背景(例えば、文字の枠)、透かし、および階調を含むことがある。例えば雑誌、機関誌、教科書などは通常、これらの特徴のうちの2つ以上を含む。JPEGなどの圧縮アルゴリズムは、複合カラー文書の写真領域の圧縮には適しているが、該複合カラー文書の白黒テキスト領域の圧縮には適していない。このような非可逆な(損失有りの)圧縮アルゴリズムは、線形変換(例えば、離散コサイン変換、離散ウェーブレット変換)に基づいており、エッジを効率的に圧縮することができない。このようなアルゴリズムは、あまりにも多くのビットを必要とし、テキストのまわりにきわめて好ましくないアーティファクトを生成することがある。
【0005】
複合カラー文書の白黒テキスト領域の圧縮には、CCITT、G4、JBIGなどの圧縮アルゴリズムが適している。しかしながら、これらのアルゴリズムは、複合カラー文書の写真領域の圧縮には適していない。
【0006】
典型的な解決策は、含まれる情報の種類に従って領域を分けるよう、予め文書を処理することである。例えば、エッジを含む領域(例えば、テキスト、線画、図形を含む領域)と、自然の特徴を含む領域(例えば、写真、カラー背景、および階調を含む領域)が、様々なアルゴリズムに従って分けられ圧縮される。
【0007】
デジタル画像内の主色(predominant color)を認識することにより、デジタル画像の圧縮効率を高めることができる。
【課題を解決するための手段】
【0008】
本発明の1つの側面によれば、デジタル画像内でランダムに選択された画素に検出ルールを適用することによって、該デジタル画像内の少なくとも1つの主色を識別する。本発明の他の側面および利点は、本発明の原理を例として示す図面に関して行われる以下の詳しい説明から明らかになるであろう。
【発明を実施するための最良の形態】
【0009】
図1を参照すると、デジタル画像を処理する方法が示される。デジタル画像は複数の画素からなり、それぞれの画素は、nビットのワードによって表される。例えば、RGBカラー空間を表す典型的な24ビット・ワードでは、8ビットが赤色成分を表し、8ビットが緑色成分を表し、8ビットが青色成分を表す。
【0010】
デジタル画像は、1度に1つのストリップが処理される。それぞれのストリップは、連続したブロックの列を含む。それぞれのブロックは、デジタル画像内の画素数よりも相対的に少ない数の画素を含む。典型的なブロック・サイズは、例えば、16×16画素または32×32画素である。ブロックが小さいほど必要なメモリが少なく、その結果、より良好な解像度となる。実際には、ブロック・サイズは、ハードコピー装置のメモリの制約によって規定される。
【0011】
次に、単一のストリップの処理について説明する。ストリップは、バッファに入れられ(112)、ブロックは、1回に1つアクセスされる(114)。それぞれのブロックについて、異なる色がいくつあるか(以下、異なる色の数、と呼ぶ)が求められ(116)、しきい値数Tと比較される(118)。異なる色の数が該しきい値数よりも少ないブロックは、テキストまたは他のコンピュータ生成された特徴を含む可能性が高い。異なる色の数が、しきい値数と同じかまたはそれよりも多いブロックは、色の階調を含む可能性が高い。
【0012】
ブロックが、異なる色の数がしきい値数よりも少ない場合、そのカラーパターンが符号化される(120)。しきい値数が3で、ブロックが黒いテキストと白い背景の部分を含む例を検討する。ブロックは、2つの異なる色を有するので、そのカラーパターンが符号化される。白い画素に「0」の値を割り当て、黒い画素に「1」の値を割り当てることによって、ブロックを符号化することができる。こうして、1ビット・ワードを使用して、ブロックの各画素を符号化することができる。符号化により、0のストリングと1のストリングが得られる。処理の負担の大部分は、異なる色を見つけることに費やされるので、この単純な手法によって計算の負担が大幅に減少する。
【0013】
0のストリングおよび1のストリングは、圧縮される(122)。ランレングス符号化または任意の適切なアルゴリズムを使用して、0のストリングおよび1のストリングの長さを短くすることができる。
【0014】
3以外のしきい値数を使用することができる。しきい値の選択は、ある程度、画像の解像度に依存する。解像度が高いと、色はゆるやかに変化し、よってそれぞれのブロックは、2つまたは3つの色を含むだけであろう。しきい値数が4であり、ブロックが3つの異なる色を含む別の例を検討する。3つの色には、1、2、および3の値が割り当てられ、それにより、それぞれの色を符号化するのに2ビット・ワードが使用される。しかしながら、しきい値を2に制限することによって、それぞれの24ビット・ワードまたは32ビット・ワードを1ビットに減らすことができる。さらに、比較の数が減少し、分類の複雑さが低下する。
【0015】
ブロックの異なる色の数がしきい値数よりも多い場合(118)、ブロックを分類するためにエッジの検出が行われる(124)。エッジが検出された場合、ブロックは、非可逆な(損失有りの)高品質圧縮アルゴリズムによって符号化されるクラスに入れられる(128)。エッジが検出されない場合、ブロックは、写真または自然の特徴を含む可能性が高く、したがって、非可逆な低品質圧縮アルゴリズムによって符号化されるクラスに入れられる(130)。
【0016】
エッジ検出は、ブロック内のエッジの位置または向きを識別する必要はなく、ブロック内のエッジの存在を示すだけでよい。好ましいエッジ検出方法は、ブロック内のエッジの存在を検出するためにブロックにエントロピー関数を適用することを含む。好ましいエッジ検出方法は、参照により本明細書に組み込まれる、2001年7月24日に出願された米国特許出願番号09/912,278号に開示されている。
【0017】
非可逆圧縮(128および130)は、一般に、ブロックのカラー成分のそれぞれを、3つの別個のストリームに符号化する。
【0018】
付加的な処理を行うことができる。例えば、ブロックを処理する前に、バッファに入れたストリップ内の主色を識別することができる(132)。バッファに入れられたストリップの主色は、該バッファに入れられたストリップ内の画素のランダム・サンプリングに対して統計的解析を実行することによって、識別されることができる。主色をヘッダ情報に追加し、該主色を、ストリップ内のすべてのブロックを復号化するためのデフォルト色としてデコーダが使用することができる。代替的に、複数のストリップのうちの1つのストリップの主色を、画像全体の主色と見なすこともできる。主色を認識することにより、デジタル画像の圧縮効率を高めることができる。
【0019】
ヘッダ情報を各ブロックに追加してもよい。例えば、ブロック・ヘッダの第1のエントリが、色のしきい値数を示し、第2のエントリが、該しきい値を超えたかどうかを示し、第3のエントリが、ブロックがエッジを含むかどうかを示すことができる。
【0020】
追加のブロック・ヘッダ情報は、ブロックを圧縮するのに使用される圧縮アルゴリズムと、画像におけるブロックの空間的位置を示すことができる。しかしながら、空間的位置のこのエントリは、ブロックが連続的に符号化される場合には取り除くことができる。圧縮の種類についてのヘッダ・エントリは、該圧縮の種類が慣例上合意されている場合には、取り除くことができる。
【0021】
ヘッダ情報を、ブロックの各ストリップに追加してもよい。そのようなヘッダ情報は、主色を識別することができる。
【0022】
圧縮されたブロックを、ほとんどオーバヘッドなしに(または全くのオーバーヘッドなしに)復号化することができる。ブロックは、それらが圧縮されたのと同じアルゴリズムで復元される。各ブロック内のヘッダ情報によって、圧縮アルゴリズムを識別することができ、復元したブロックを、文書内のその元の空間的位置に再構成することができる。例えば、第2のヘッダ・エントリ(色のしきい値数を超えたかどうか)が真で、第3のヘッダ・エントリ(ブロックがエッジを含むかどうか)も真の場合は、合意に基づく非可逆圧縮アルゴリズムを使用してブロックを再現することができる。第2のエントリが真で、第3のエントリが偽の場合は、別の合意に基づく非可逆圧縮アルゴリズムを使用して、ブロックを再現することができる。第2のエントリが偽の場合、ブロックは復号化され、第1のエントリからワード長が導き出される(例えば、しきい値“3”は、各色が1ビット・ワードによって符号化されていることを示す)。カラー情報(例えば、「0」=黒、「1」=白)は、ブロック・ヘッダおよびストリップ・ヘッダから導き出されることができる。
【0023】
ブロック内の異なる色の数を求めるには様々な方法がある。以下に3つの例を示す。
【0024】
図2に、第1の例を示す。ブロックの各nビット・ワードの値は、色出現リストで調べられる(210)。このリストは、1つまたは複数のエントリ[(R,G,B),q]を含み、ここで(R,G,B)は色ベクトルであり、qは、色ベクトルが選択された回数である。色ベクトルが色出現リスト上にない場合(212)、その色ベクトルが該リストに追加される(214)。その色ベクトルが、既にリスト上にある場合(212)、色ベクトルのカウント(q)がインクリメントされる(216)。ブロックのすべてのワードが識別された後(218)、リストが処理される(220)。異なる色の数がしきい値数よりも少ない場合、リスト上の色の数が符号化され、さらにリスト上の異なる色が符号化される。そうでない場合(例えば、ブロックが色階調を含む場合)、そのリストは廃棄される。
【0025】
第2の例は、nビット・ワードが丸められること以外は第1の例と同様である。nビット・ワードが、例えば、その最下位ビットを無視することによって丸められる。この第2の例は、ノイズの多い画像に有効である。また、これにより、色出現リストのサイズが小さくなる。
【0026】
第3の例として、色空間を様々な「カラービン(color bin)」に分け、ブロック内の色を識別し、該識別されたそれぞれの色をカラービンに割り当てることによって、異なる色の数を求める。色出現リストは、それぞれのビンについての出現すなわちヒット(hit)の数を示すよう維持される。異なる色の数は、「満たされた」カラービンの数に対応する(識別された色のうちの少なくとも1つが、そのカラービンの範囲内にある場合、該カラービンが満たされたと見なすことができる)。こうして、色空間が8つのカラービンに分けられる場合、第1のビンは、0〜31の画素値を対象として含むことができ、第2のビンは、32〜63の画素値を対象として含むことができ、以下同様である。ブロックのnビット・ワードのすべてがカラービンに割り当てられた後、色出現リストが処理される。識別された色をカラービンと比較することにより、異なる色の数を求めるのに必要な比較の数が減少すると共に、色出現リストのサイズが小さくなる。
【0027】
次に図3を参照すると、デジタル画像の各ストリップ内の1つまたは複数の主色を識別する方法が示されている。画像のストリップは、バッファに入れられ(310)、ストリップ内でランダム・サンプリングされた画素に対して検出アルゴリズムが適用される(312)。検出アルゴリズムは、ストリップ内の1つまたは複数の主色を示す。
【0028】
この検出アルゴリズムは、真の色の比率(r)、許容可能な比率(r)、および所望の比率(r)の3つのパラメータに基づく。真の色の比率(r)は、ある特定の色を有する画素の数を、ストリップ内の画素の総数で割ったものである。r<rの場合、主色を検出する確率が低く、r>rの場合、主色を検出する可能性が高い。許容可能な比率(r)と望ましい比率(r)との差により、検出確率における滑らかな遷移が考慮される。
【0029】
検出アルゴリズムは、r<rを有する色を主色として識別する確率(誤りの肯定的結果(false-positive outcome))を最小にし、r>rを有する色を主色として識別しない確率(誤りの否定的結果(false-negative outcome))を最小にする。
【0030】
図5を参照すると、以下の例示的な検出アルゴリズムを使用して、色出現リストを作成することができる。
【0031】
1.色出現リストをリセットする(510)。リストを、空リストとして設定することができる。
【0032】
2.第1のサンプリングPの画素を検査する(512)。検査中の画素の色ベクトル(R、G、B)が色出現リストにある場合は、対応するカウンタ(q)を1だけインクリメントする。検査中の画素の色ベクトルが色出現リストにない場合、色ベクトルは、リストの新しいエントリとして該リストに追加され、そのカウンタqが1にセットされる。
【0033】
3.追加のサンプリングPの画素を検査する。ここで、n=2,3,4,...Nである(514)。それぞれのサンプリングについて、以下のステップが実行される。
【0034】
(a)検査中の画素の色ベクトルが色出現リストにある場合、その対応するカウンタが、1だけインクリメントされる。検査中の画素の色ベクトルが色出現リストにない場合、該色ベクトルは該リストに追加されない。代わりに、その色ベクトルは廃棄される。
【0035】
(b)n番目のサンプリングの終わりに、カウンタq<Tを有するすべてのエントリが、リスト(516)から除去される。
【0036】
(c)色出現リストが空か、またはすべてのエントリがカウンタq>Uを有する場合(518)、該リスト内のエントリが、主色として識別される。q≦Uの場合、制御はステップ(a)に戻り、別のサンプリングが行われる。
【0037】
画素検査の数P、対応するしきい値TおよびUは、いかなる主色もリストから除去されないように選択される。
【0038】
パラメータP、TおよびUの最適な組を、以下のように計算することができる。確率関数f(l,k,p)およびv(l,k,p)が、次のように定義される。
【0039】
【数1】


【0040】
n番目のステップ(上記のステップ3(b))でr≧rの色が廃棄される確率が、出現数と、前のステップで破棄されなかったどうかを検討することとによって決定される。色ベクトルが廃棄されない確率は、次の通りである。
【0041】
【数2】


【0042】
この式を使用してPおよびTを計算した後、以下の式を使用して該確率を更新することができる。
【0043】
【数3】


【0044】
ステップnにおける誤りの肯定的決定(false-positive decision)の確率と、誤りの否定的決定(false-negative decision)の確率は、次の通りである。
【0045】
【数4】


【0046】
誤りの肯定的決定の確率と誤りの否定的決定の確率の境界は、以下のように表される。
【0047】
【数5】


【0048】
こうして、初期値から始めて所望の確率が生じるまでこれらの値を調整することにより、パラメータを決定することができる。
【0049】
許容可能な比率(r)が比較的大きい(例えば、0.3)ときは、色出現リストには、きわめて少ない数のエントリしかない。しかしながら、許容可能な比率(r)が小さい場合は、色出現リストを、最も共通した色と画素を最初に比較するようソートされたリストとして効率良く実現し、または色の比較数を最少にするためにハッシュ・テーブルとして効率的に実現することができる。
【0050】
次に図4を参照すると、前述の方法を使用するハードコピー装置410が示される。ハードコピー装置410は、プロセッサ412、読取り専用メモリ414、およびランダム・アクセス・メモリ416を含む。読取り専用メモリ414は、実行されたときに、図1の方法に従ってプロセッサ412にデジタル画像を処理させるプログラムを記憶している。ランダム・アクセス・メモリ416は、ストリップをバッファに入れたり、処理の中間結果(各圧縮ブロックからの結果など)を記憶したりするのに使用される。ハードコピー装置はまた、エンジン418を含む。デジタル複写機において、例えばエンジン418は、印刷エンジンおよび走査エンジンを含む。
【0051】
この方法は、特定のハードコピー装置に限定されない。ハードコピー装置の例には、デジタル複写機、プリンタ、スキャナ、およびオール・イン・ワン装置(all-in-one machine)がある。この方法は、ハードコピー装置に限定されず、デジタル画像を記憶する任意の装置で実現されることができる。
【0052】
本発明は、以上説明し示した特定の実施形態に限定されず、本発明は、特許請求の範囲に従って解釈される。
【0053】
本発明は、以下の実施態様を含む。
(1)デジタル画像内の少なくとも1つの主色を識別する装置(410)であって、該画像(312)内のランダムに選択された画素に、検出ルールを適用するプロセッサ(412)を備える装置。
(2)前記プロセッサ(412)は、前記画像の各ストリップについて、少なくとも1つの主色を求める、上記(1)に記載の装置。
(3)前記検出ルールは、誤りの肯定的結果および誤りの否定的結果のうちの少なくとも一方の確率を最小にする、上記(1)に記載の装置。
(4)前記誤りの肯定的結果の確率は、r<rである色を主色として識別する確率であり、rは、ある特定の色を有するサンプル領域内の画素数を、該サンプル領域内の総画素数で割ったものであり、rは、許容可能な比率である、上記(3)に記載の装置。
(5)前記誤りの否定的結果の確率は、r>rである色を主色として識別しない確率であり、rは、ある特有の色を有するサンプル領域内の画素の数を、該サンプル領域内の総画素数で割ったものであり、rは、所望の比率である、上記(3)に記載の装置。
(6)前記検出ルールは、色出現リストを作成するのに使用される、上記(1)1に記載の装置。
(7)前記色出現リストは、前記画像(512)内の第1のサンプリングの画素を検査することによって作成され、該サンプリングにおける画素のそれぞれについて、
前記画素の色ベクトルが前記リストにある場合、対応するカウンタをインクリメントし、
前記色ベクトルが前記リストにない場合に、該リストに該色ベクトルを追加し、対応するカウンタを初期化する、上記(6)に記載の装置。
(8)前記画像(514)内の少なくとも1つの追加のサンプリングの画素を検査することを含み、各サンプリングの各画素について、
前記画素の色ベクトルが前記リストにある場合、前記対応するカウンタをインクリメントすることを含む、上記(7)に記載の装置。
(9)前記追加のサンプリングのそれぞれの終わりにおいて、カウンタq<Tを有するすべてのエントリが、前記リスト(516)から除去される、上記(8)に記載の装置。
(10)前記リストが空か、またはすべてのエントリがカウンタq>U(518)を有する場合、追加のいかなるサンプリングも検査されず、該リストが完成され、それにより、該リスト内のすべての色ベクトルが、前記主色として識別される、上記(8)に記載の装置。
【図面の簡単な説明】
【0054】
【図1】デジタル画像を処理する方法を示す図。
【図2】画像ブロック内の異なる色を識別する方法を示す図。
【図3】デジタル画像の主色を識別する一般的な方法を示す図。
【図4】図1の方法を実現するハードコピー装置を示す図。
【図5】デジタル画像内の主色を識別する例示的な方法を示す図。
【符号の説明】
【0055】
410 ハードコピー装置
412 プロセッサ
418 エンジン
【出願人】 【識別番号】398038580
【氏名又は名称】ヒューレット・パッカード・カンパニー
【氏名又は名称原語表記】HEWLETT−PACKARD COMPANY
【出願日】 平成19年9月10日(2007.9.10)
【代理人】 【識別番号】100081721
【弁理士】
【氏名又は名称】岡田 次生


【公開番号】 特開2008−48431(P2008−48431A)
【公開日】 平成20年2月28日(2008.2.28)
【出願番号】 特願2007−233858(P2007−233858)