トップ :: H 電気 :: H04 電気通信技術




【発明の名称】 自然言語カラー対話及びシステム・インターフェース
【発明者】 【氏名】ジェフリー ジェイ ウルフ

【要約】 【課題】自然言語色指定と、色画像処理及び装置制御アプリケーションで用いられる、正確な数値的色符号化の間のマッピングを開発する。

【構成】初期色空間内に文書を収容(receiving)し、自然言語のコマンドを受信して、文書の少なくとも一部の、1つあるいはそれより多い選択された色を調整し、そして、入力された自然言語コマンドに応じて、初期色空間内で、文書の前記1つあるいはそれより多い選択された色を調整するステップを含む、画像の色を調整するための方法。
【特許請求の範囲】
【請求項1】
初期色空間内に文書を収容(receiving)し、
自然言語のコマンドを受信して、前記文書の少なくとも一部の、1つあるいはそれより多い選択された色を調整し、そして、
前記入力された自然言語コマンドに応じて、前記初期色空間内で、前記文書の前記1つあるいはそれより多い選択された色を調整する、
ステップを含む、画像の色を調整するための方法。
【請求項2】
前記文書を、作業色空間内にマッピングし、
前記自然言語コマンドを、前記作業色空間内の変換(transform)に転換(converting)し、そして、
前記変換(transform)を、前記作業色空間内の、前記文書の前記少なくとも一部の、前記1つあるいはそれより多い選択された色に適用するステップを更に含み、
前記初期色空間における前記文書の色が、前記作業色空間における変換(transform)のアプリケーションに基づいて調整される、
請求項1に記載の方法。
【請求項3】
前記自然言語コマンドを転換(converting)するステップが、
前記コマンドを、修正されるべき色範囲、及び、当該色範囲に為されるべき修正に解析(parsing)するステップ、
を含む請求項2に記載の方法。
【請求項4】
色の前記範囲に為された前記修正を、(1)修正されるべき色特性の記述、(2)色修正の強度、及び、(3)修正の方向、に解析するステップ、
を更に含む、請求項3に記載の方法。
【請求項5】
1つあるいはそれより多い選択された色を調整するステップが、
以下の特性:
明るさ、暗さ、カラフルさ、色度、飽和、コントラスト、色相、赤っぽさ、緑っぽさ、黄色っぽさ、青っぽさ、オレンジっぽさ、ピンクっぽさ、茶色っぽさ、紫っぽさ、及び、緑っぽさ、
の1つあるいはそれより多くを調整するステップを含む、請求項1に記載の方法。
【請求項6】
通常の言語の色用語の辞書であって、作業色空間の全てのそれぞれの部分が、当該色用語辞書内の少なくとも1つの用語にマップされるものであり、
前記作業色空間における変換(transformation)に対応する前記通常の言語の色用語と共に使用するための、通常の言語コマンド語彙及び構文、及び、
画像に関連する、ユーザが入力した通常の言語のコマンドを、修正されるべき色、及び、その色に為されるべき修正に解析(parses)し、
前記解析されたコマンドに鑑みて、通常の言語用語の辞書を調べる(consulting)ことによって、前記画像のどの部分を修正するかを決定し、
前記通常の言語コマンド語彙及び構文を調べることによって、如何にして、前記修正されるべき色に関して前記画像を調整するかを決定し、そして、
前記言語を調整する、
色修正プログラムを実行するプロセッサ、
を備える自然言語色制御システム。
【発明の詳細な説明】【技術分野】
【0001】
本発明は、自然言語カラー対話及びシステム・インターフェースに関連する。
【背景技術】
【0002】
色差(color difference)を識別するための、多くの方法が存在する。カラー画像化研究者及び技術者は、標準色空間及び色符号化に基づいた、正確で、数値的な、色指定(specifications)を使用する。そのような指定は、しばしば、標準的な人間の観察者の色マッチング・ビヘイビヤ(matching behavior)に基づきます。色マッチング・ビヘイビヤは、例えば、測色法(colorimetry)のCIEXYZシステムで実現されてきた。標準的な人間の観察者の色マッチング・ビヘイビヤに基づく、他の関連するシステムには、広く用いられる、CIELab、又は、それよりは使用されない、CIELuvシステムが含まれる。これらの色指定は、広く、装置に依存しない色符号化(device-independent color encodings)と呼ばれる。カラー画像化(imaging)研究者及び技術者もまた、特定の装置の色特性に関して色が正確に指定され得る、装置に依存しない色指定を用いる。これらの色特性は、装置の白点及び色プライマリ(primary)(又は色素)を含む。色は、マンセルのカラーブック、スウェーデン自然カラー・システム、又は、パントーン・カラー・フォーミュラ・ガイドのような色順序システム(color order systems)を用いることによっても指定される。色指定のこれらのシステムもまた正確であるが、色画像化の専門家よりはむしろ、色グラフィックス及びデザイン産業の専門家によって、より広く使用される。
【0003】
他の、いたるところにある(ubiquitous)、色を指定する様式は、自然言語の色名称を使用するものである。自然言語は、上述のものに比して、色指定のためには、より正確ではない方法であるが、それにも関わらず、色の消費者(consumers of color)によって用いられる色指定のために、最も広く用いられ、最も良く理解される方法である。色指定のこの方法は、赤、緑、青、等のような、広く用いられる色名称を用いる。この方法は、指定を改良(refine)するために、広く用いられる色名称の組合せをも用いる。そのような組合せの例には、赤っぽい茶色、緑っぽい青、黄色っぽい緑、等が含まれる。更に、自然言語は、色指定における、更なる微細な区別を与えるための、多くの修正形容詞を提供する。そのような修正形容詞の例には、薄い、暗い、明るい、飽和した、鮮やかな、濁った、明度・彩度がほどよい(moderate)、鈍い、洗いざらしの、等が含まれる。
【0004】
自然色言語は、色及び色差を指定するために、他の色指定方法ほどには正確に定義されないことがあり得る、他の言葉及びフレーズを用いる。これらの言葉及びフレーズ(phrases)の例には、「わずかに、黄色が少ない」、「より暗い」、「より飽和された」、「より緑の」、「大きく迫力がある(punchier)」、及び、「ほんの少し薄い」が含まれる。さて、これらの表現が、本当に不正確である一方、多くの人々は、彼らの要望に合致させるために、彼らがどのようにして、それらの印刷された材料を変更して欲しいかを説明するために、それらを広く用いる。しかし、ユーザが、入力された色又は入力色の組を修正することを可能とする色管理システムは、一般的に、自然言語入力を使用せず、ユーザが、そのようなシステムのユーザ・インターフェースで提供される、種々の制御の振る舞いへの理解を発展させることを要求する。従って、そのようなシステムは、多くの人にとって、使用するのが困難である。
【0005】
色管理システムは、ユーザが、彼らの快適さを増すために、又は、ユーザの好みにあわせるために、画像が修正されるような場面で、画像又は文書処理アプリケーションにおける色を制御する、又は調整することを可能とする。例えばユーザは、印刷前に、絵の背景色、又は、デジタル画像の肌色のトーンを調整することを望み得る。装置制御も、装置の色再製特性を修正するために、色制御システムを用いる。一般的に、色印刷及び画像処理アプリケーションは、ユーザが、色要求又は命令を対話することを可能とするユーザ・インターフェースを含む。しかし、事実上、全ての色画像処理及び装置制御アプリケーションは、言語ベースの色指定でなくむしろ、定量的で、数値的な、色指定のシステムを用いて、色画像化研究者及び技術者によって開発されてきた。
【0006】
一般的な、非専門家の、画像処理及び装置制御アプリケーションの消費者は、しばしば、そのようなアプリケーションのユーザ・インターフェースをナビゲートする際に困難さを感じる。色符号化について少しの理解しか持たない、又は、それを全く理解しない、多くの消費者/ユーザは、自然言語フレーズを用いて色を説明する。これらのアプリケーションを開発する研究者及び技術者は、高度に正確な色符号化(encoding)を用いて色を説明する。殆どの画像処理アプリケーション、装置制御インターフェース、色ピッカー(picker)等、は、数値的で、定量的な色区間との関係においてのみ、ユーザが色と色変更を指定ことを可能とする。制御ツールはしばしば、ユーザが操作できる、スライダ(slider)、又は、対話ボックス、又は、グラフィカルに表示される機能(例えば、フォトショップにおける曲線)、の形式である。これらの制御ツールは、訓練を積んだ専門家のためでさえ、使用することが困難なものであり得、意図する修正を実現するための調整が必要となり得る。色について未経験なユーザの場合には、状況は極端に困難であり、しばしば、欲求不満と失望に繋がる。殆どのユーザは、殆どのアプリケーションで使用される、RGB、CIELab、又は、HSVのような、数値的で、定量的な、色空間について訓練されていない。それ故、殆どの、色画像及び文書の消費者は、これらの画像又は文書において、旨く色を調整できない。従って、一般的公衆の、話された、又は書かれた色要求を、画像編集又は装置制御アプリケーションの数値的設定に翻訳することは、グラフィックスの専門家、又は、印刷者の仕事となる。多くの色の専門家には、口述的な用語で、単純に、そして、簡潔に述べられ得る、美的な効果を実現するために、そのようなインターフェースにおける制御を旨く、及び、効率的に操作するために、高度の訓練及び経験が必要である。この色対話(communication)ギャップに取り組むために、色調整及び画像処理アプリケーションのための、自然言語インターフェースを与えることが望ましい。
【0007】
自然言語インターフェースは、殆どの、画像処理アプリケーションのユーザ、及び、色画像化装置のユーザにとって、大きな優位ポイントであり得る。そのようなアプリケーションにおいて自然色インターフェースを実装することは、色管理製品の消費者と、色専門家の間に存在する対話ギャップを強く橋渡しすることになろう。色指定の自然言語方法は、色符号化又は色順序(ordering)システムの正確性が欠如するが、依然として、合理的な正確性で、広い範囲の色を指定することが可能である。更に、色専門家と、色を使用する消費者の双方が、色の自然言語を理解するので、簡単に使用できる色対話の方法、または、画像/文書生成及び編集プログラム及び色装置ソフトウェアのような技術的アプリケーションのための色ユーザ・インターフェースとして、自然な選択である。色及び色差の口述的説明が、色空間の数値的指定に比して、より不正確である一方、それにも関わらず、より不正確であるが、より良く理解される対話システムが、高度に正確であるが分かり難いインターフェースよりも、依然として好ましいことを議論できる。
【0008】
自然言語色指定と、色画像処理及び装置制御アプリケーションで用いられる、正確な数値的色符号化の間のマッピングを開発することは、単純な問題ではない。多くの課題が、この問題を複雑にする。第1に、固有的に定義された、自然色言語が存在しない。色を説明するために用いられる用語及び文法は、文化、地理的位置、専門性、及び、個人の好みに基づいて変化し得る。第2に、名指しされた複数の色の間の境界が、正確には定義されない。実際にそれらは、いくらかファジーで、個人毎にある程度変動し得る。第3に、自然言語インターフェースにより与えられる、より低いレベルの正確性が、いくつかのアプリケーションにおいて完全に適切であるが、他のアプリケーションにおいて不適切であり得る。
【発明の開示】
【課題を解決するための手段】
【0009】
本発明の実施例で説明される色対話及びシステム・インターフェースは、画像処理及び装置制御アプリケーションを開発する、又は、画像編集オペレーションを実行する、色に精通した専門家及びテクニシャンと、消費者が、彼らの画像又は文書がどのように表現されたいか(即ち、彼らの好み)を指定するかを試みる、色について未経験な、色文書の消費者の間の対話ギャップを橋渡しすることを支援し得る。この色対話及びシステム・インターフェースは、色について未経験な消費者によって用いられる、色の自然言語記述と色差から、画像処理アルゴリズム及び装置制御変換で用いられる数値的な色空間値へのマッピングを提供することによって、色について未経験な公衆と、色制御システムとの間の、この大きな隔たりを橋渡しすることを支援し得る。そのような指令(instruction)の調査によって、各段階において、2つのタイプの色指定が存在することが示された。第1のタイプの色指定は、ユーザが、調整することを望む色のターゲット範囲を示す。色のターゲット範囲は、全体の色空間の領域又は副体積(subvolume)に対応する。第2のタイプの色指定は、実装される(implemented)べき色修正を含む。表1は、いくつかの例示的色変換命令(instructions)を用いた、これらの2つのタイプの色指定を示す。
【0010】
表1


【0011】
ここで提案されるものは、自然言語色対話システム、及び、色処理アプリケーションへのインターフェースである。それは、ユーザが、口述的に、自然言語用語を用いて、特定の変換を適用すべき色空間の領域を指定することを可能とする。適用されるべき変換もまた、自然言語を用いて口述的に指定される。口述的(verbal)色指定及び処理変換命令の例には、例えば、「緑を、適度により薄くしろ」、または「青を、わずかに、紫がからないようにしろ」、又は「赤の領域を、よりコントラストが少なくなるようにしろ」が含まれ得る。
【発明を実施するための最良の形態】
【0012】
ここで用いられる印刷装置は、紙の上に可視的なマークを生成する何らかの装置を意味する。印刷装置は、例えば、コピー機、プリンタ、又は、多機能装置を含む。ここで用いられる紙は、例えば、紙、プラスチック、及び、繊維材料のような、何らかの媒体を意味する。
【0013】
ここで用いられる文書は、印刷され得る、又は、表示スクリーンの上で観察され得る、1つあるいはそれより多いページの電子データを含む。文書は、例えば、画像、及び/又は、テキストを含み得る。
【0014】
ここに開示される実施例は、自然言語の色対話システム、及び、非専門家が、色情報、意図、及び、命令、について、合理的に正確で不明確でないやり方で対話することを支援するインターフェースを含む。ここに開示されるシステム及び方法の1つの特徴は、自然言語の色名称及び色意思(color intents)を、特定の測色(colorimetric)又は外見(appearance)座標にマップする数学的モデルである。ここに開示される本発明の実施例は、加工(proofing)による文書生成及び予備プレス活動(pre-press activities)から、装置制御までの範囲のアプリケーションで使用され得る。
【0015】
色管理システムの消費者の欲求不満と失望のレベルを減らすことに加えて、自然言語の色インターフェースは、プルーフィング・サイクル(proofing cycle)又は文書編集と承認工程で必要とされる反復の数を削減できる。自然言語の色インターフェースは、色ツールを、色に対して未経験の消費者にとって、よりアクセス容易にすることもできる。
【0016】
ユーザが彼らの快適さを高めるために、又は、ユーザの好みに応えるために、画像を修正できるような場面における、画像又は文書処理アプリケーションは、自然言語の色管理システムを使用できる。そのようなアプリケーションは、直接画像の画素に適用される、1つあるいはそれより多い変換を含み得る。自然言語の色管理システムのための、他の、広く用いられるアプリケーションは、装置制御に存在する。例えば、自然言語のインターフェースは、色訂正変換をその色管理プロファイルに適用することによって、ユーザが、装置の色再製特性を修正することを可能とし得る。そのようなアプリケーションにおける口述的指定(verbal specification)の例には、「コントラストをわずかに増加させること」、「赤を、少し、よりオレンジに、そして、より薄く印刷すること」、又は、「薄い緑を、適度に、より青にすること」が含まれ得る。
【0017】
自然言語の色制御システムを生成するために、通常の言語の色用語の1つあるいはそれより多い辞書が、選択され、又は、作られるべきである。それを使用することが意図されるユーザにとって適したものであることを除いて、色名称の辞書の語彙に与えられる制限は存在しない。色名称辞書を生成する概念が、やっかいなように思われる一方、多くの旨くいっている(successful)作成済みの辞書が既に存在する。更に、広く普及した、色を記述するために使用される言語における共通性が存在する。実際、膨大な研究が、英語及び殆どの欧州の言語において、11の基本的色名称(黒、白、赤、緑、黄色、青、茶、ピンク、オレンジ、紫、及び、グレイ)だけが存在することを示している。これらの基本的な色名称の間の境界は、いくらかファジーであるが、色パッチ(patch)の名称を述べるように尋ねられたときに、観察者の間で広く用いられる共通認識が存在する。これらの11の基本的色名称は、更に、より細かい記述と正確な色名称付けを可能とするために、普通に、複合名称に組み合わされ得る。そのような組合せの例には、黄色っぽい緑、緑青、茶色っぽい赤、赤っぽい紫、等が含まれる。そのような組合せが、新しい、単一語の、色名称と置き換えられるような場合も存在することに留意頂きたい。例えば、誰かが、緑青をシアン又はターコイズ(turquoise)と、緑がかった茶色をオリーブと、赤っぽいオレンジをオーチャー(orchre)と、そして、緑っぽい黄色をシャルトルーズ(Chartreuse)と、呼び得る。更に、基本的又は複合色名称との組合せで広く用いられるいくつかの修飾語が存在する。これらの修飾語には、例えば、薄い、暗い、青白い、深い、飽和した、中間、鈍い、パステル、等のような言葉が含まれる。色名称、複合名称、及び、修正された名称は、1つあるいはそれより多い辞書における用語を構成する。
【0018】
色名称辞書は、新規なものではない。標準化委員会(The National Bureau of Standards)は、インターソサエティ色委員会(the Inter-Society Color Council)と共同して、既に、標準化された色名称辞書を作っている。これは、色名称のNBS−ISCC辞書と呼ばれる。これは、対応付けられた名称についての267の色指定からなる。この名称は、修飾語、及び、基本的又は複合色名称のいずれかからなる。いくつかのより早期の研究もまた、色名称の語彙を発展させた。
【0019】
それが有用であるために、色辞書における用語は、色空間の全てのそれぞれの領域が色用語に対応するように、色空間の領域(regions)に対応するものであるべきである。実施例においては、色空間の有限領域(finite regions)(又は副容積(subvolumes))と、辞書の色用語の間の直接マッピングが存在し得る。或いは、用語は、色空間における原型の(prototypical)ポイント位置へマップし得る(例えば、色空間内のポイントは、シアン又はマゼンタの純粋な又は理想的な色調、又は、ネイビー・ブルーと消防車の赤に対応し得る)。
【0020】
もし、色空間における対応付けられた原型の位置を伴った色名称の組として色名称辞書が与えられるならば、色空間を、色名称辞書の種々の名称に割当てられた領域に分割(partition)するための手段が必要とされる。これらの領域を作るために、種々の方法が使用され得る。唯一の要求は、色空間内の全てのそれぞれの位置が、少なくとも1つの領域に割当てられることである。この領域は、解体され得、または重複し得る。領域のトポロジカルな類(topological genus)に制限は存在せず、領域は、複数の(multiple)、非接続の、副領域からなり得る。色空間を分割するための手段の1つの例は、色空間における原型の位置の組のヴォロノイ(Volonoi)分割を計算することである。このアプローチは、各原型の色空間位置の周りで、セル内の全ての色が、如何なる他の原型位置(prototypical location)に比して、原型位置に、より近づくように、凸(convex)ヴォロノイ・セルを計算する。
【0021】
色空間の領域を、色辞書における用語に割当てる他の手段には、精神物理学の(pschophysical)色名称付け研究の結果の統計的分析を用いることが含まれる。この方法は、色用語を、色空間の領域に直接マップするように作動し得るか、又は、色空間内の原型位置の周りの領域を定義するために使用され得る。
【0022】
その中で名称付けされた色の原型的位置が定義される作業色空間は、理論的には、如何なる、定量的色空間でもありうる。しかし、いくつかの色空間は、他のものに比して、作業空間(working spaces)として、より良く適する。より知覚的に(perceptually)均一な色空間は、アプリケーションにより良く適するが、知覚的に非均一な空間もまた、使用され得る。例えば、HSV(aka HSB)は、色相、飽和、及び、値(輝度)の要素(components)を持つ3次元色空間である。しかし、CIEL***のような、他の色空間も、使用され得る。色名称が、色空間内の原型の位置(prototypical locations)と関連付けられ、各原型位置に対応する色空間の副容積又は領域を決定するために、アルゴリズム的で幾何学的方法が使用されるような場合に、知覚的に均一な色空間が、知覚的に有利である。
【0023】
時として、異なったタイプのユーザの語彙をカバーするために、多様な(multiplicity)色名称辞書を使用することが有用である。複数の(multiple)色辞書が使用されるような場合には、各辞書は、独立に、色空間領域にマップされ得るか、又は、種々の辞書の間の語彙的(lexical)マッピングが、開発され得る。
【0024】
色用語の辞書に加えて、色制御又は調整システムもまた、コマンド又は命令言語用語の辞書を使用して、色意図(intents)又は色変更(差)、及び、それらに対応する定量的な色差を伝える(convey)であろう。に加えて、コマンド用語の語彙(lexicon)に加えて、コマンド又は命令言語は、そのようなコマンドを解析する(parse)ための構文(syntax)を使用、翻訳、又は、生成することを要求するであろう。理想的には、生成された構文は、比較的単純であろう。そのような言語の単純な例は、以下の構文を伴った、様式である<大きさ(magnitude)><方向(direction)><特性(property)>の3つの言葉(word phrases)から生成され得る(記号”:”は、”が、として定義される”を表し、記号”|”は、”又は”を表す)。
【0025】
<大きさ>:非常にわずかに|わずかに|いくらか|適度に|大きく|強く|非常に強く|
<方向>:より多く|より少なく
<特性>:明るい(light)|暗い|カラフル|飽和した|コントラストが多く|赤っぽい|茶色っぽい|黄色っぽい|緑っぽい|青っぽい|紫っぽい|ピンクっぽい|オレンジっぽい|グレイっぽい|
【0026】
この言語のフレーズは、定量的色空間で適用される、色修正変換の制御パラメータにマップされる。如何なる色空間も、これらの変換のために使用され得る。しかし、人間の視覚システムの、知覚的に均一で、知覚的属性(明るさ、彩度(chroma)、及び、色相)に密接に関連する次元(dimensions)を持つ色空間は、より単純で、より直感的な、マッピング工程を作り得る。
【0027】
ここに開示される色制御システムの実施例は一般的に、ユーザに、1つあるいはそれより多い自然言語を用いて、色、色変更(差)、又は、色の好み(color preferences)を指定するための手段を与えるであろうユーザ・インターフェースを含むソフトウェアを通じて実施されるであろう。
【0028】
図面に戻って、実施例において、利用可能な自然言語制御システムは、図1のフローチャートで説明されたように生成され得る。フローチャートでは、ステップが特定の順序で列挙される。しかし、この順序は、限定要因として考えられるべきではない。何故なら、これらのステップの多くの順序は、結果としての色制御システムに影響を与えることなしに変更され得るからである。第1に、用語の自然言語色記述辞書は、既に存在する辞書100の組から生成され、及び/又は、選択され得る。次に、その中で変換が実行されることになる色空間が選択される(110)。色空間の領域は、次に、色辞書内の用語にマップされる(120)。コマンド用語の辞書もまた、生成、又は、選択される必要がある(130)。実施例においては、種々のコマンド用語に対応する色空間における基本的変換のライブラリもまた、生成されるであろう(140)。これらは、特定の変換様式(forms)とコマンド様式との間の一般的なマッピングとなろう。図3に関してより詳細に説明されるように、ユーザ・コマンドの詳細は、一旦、それが、ライブラリから選択されたときに、変換を調整する(tailor)ために使用されるであろう。コマンド用語の語彙を生成することに加えて、色辞書の色用語との組合せで、コマンド・ライブラリ辞書からのコマンド用語を用いるための構文もまた選択されるであろう(150)。コマンド用語辞書と色用語辞書の双方は、単純に、1つの大きな辞書の一部であり得る。
【0029】
図2は、画像又はその一部を調整するためにユーザが使用することになる、自然言語色制御及び校正システムの一般的な実施例を説明する。再度、これらのステップは、フローチャートにおいて特定の順序で列挙される。しかし、この順序は、限定要素と考えられるべきではない。何故なら、これらのステップの多くの順序は、結果としての色制御システムに影響を与えること無しに変更され得るからである。
【0030】
ステップ200において、ユーザは、対象(subject)を選択する。対象は、例えば、走査された、若しくは、生成された画像、又は、多次元ルックアップ・テーブルの入力色の組でありうる。対象は、画像の一部でもあり得る。例えば、ユーザは、ユーザが調整を希望するであろう、画像の四半分(quadrant)、又は、画像における特定のオブジェクト(object)、を識別することが可能でありうる。ここに含まれる自然言語システムは、ポイント・アンド・クリック・システムを用いて調整されるべき画像の領域をマーキング(mark)する能力をも持つ。ステップ210において、選択された対象のいくつか、又は、その全ては、コマンドが入力される前又は後に、色制御システムの初期色空間から作業色空間にマップされることになる。初期色空間は、例えば、表示スクリーン上のRGB、又は、印刷文書上のCMYKでありうる。例えば、画像に対して、これは、画素毎のマッピングであり得る。しかし、そのようなマッピングの時間と処理パワーを削減するための多くのプログラムが存在する。例えば、種々のアルゴリズムは、サンプリング技術を用いる、及び/又は、システムが、均一なパッチを認識することを可能とする。作業色空間は、ステップ230で参照される色調整アルゴリズムが便利に適用されるような、何らかの色符号化であり得る。一般的に、知覚的に均一な、装置から独立した色符号化が、作業空間として好ましい。
【0031】
ステップ220において、ユーザは、画像において要求された変更を示すために、口述的な、又は、書かれた命令をも発行する。このコマンドは、画像又は画像の部分が作業色空間にマップされる前又は後に入力されうる。この命令ために用いられる言語は、ユーザの自然言語であり得るか、或いは、それは、アプリケーションによって定義、又は、限定された言語であり得る(例えば、アプリケーションは、言語を、定義された語彙に限定、又は、その解析(parsing)を促進し得るユーザ・インターフェースを提供し得る)。アプリケーションで定義された語彙は、ユーザに対する表現の100%の自由は可能としないことがあり得るが、依然として、色に関して広く用いられる言語用語の殆ど、又は、全てを包含するためには十分大きい。
【0032】
ステップ230において、プログラムは、入力された口述的な又は書かれた命令を、色作業空間内の色変換に翻訳するであろう。プログラムは、命令を解析(parsing)し、ユーザのコマンドに対応する画像への変換を実施するための、規則又は命令の組を含み得る。自然言語コマンドは、コマンドを、例えば、ターゲット色範囲指定240、及び、色修正指定250のような要素に分離するために、解析(parsing)され得る。
【0033】
ターゲット色範囲指定は、色、又は、修正されるべき色を含み得る。ターゲット色範囲指定は、特別に、修正されるべきでない色をも識別し得る。画像調整は、次に、調整されるために指定された色範囲に含まれるような色のみに適用され得る。ステップ260において、画像マスクは、指定された色範囲240、及び、作業色空間内の画像から生成されうる。それ故、画像調整は、マスクに含まれる色にのみに適用されるであろう。実施例においては、指定された色範囲の、重複する領域(regions)のエリア(area)に特定の色が存在し得、それ故、それは、2つ或いはそれより多い重複範囲内に含まれ得る。もし、ユーザが、これらの領域の双方に関係する(involving)口述的コマンドを入力する場合ならば、次にプログラムは、事前にプログラムされた規則の組に基づいて、内部論理決定を作成する。例えば、コマンドは、直近に入力された最後のコマンドに連続して続き得る(より早いコマンドに優先度が与えられて)。
【0034】
当業者に良く知られた、それによってマスクが生成され得る、多くの方法が存在する。1つのそのような方法には、指定された色範囲を作業色空間の副容積として表現し、次に、マップされた画像内の各画素に対して、画素の色が、指定された色範囲の副容積内にあるか否かを決定することが含まれる。指定された色範囲副容積内の、全てのそのような画素はマスク内にある一方、指定された色範囲副容積の外側の全ての画素は、マスクから除外される。画像マスクを生成する他の方法は、色名称辞書、又は、複数の辞書内の各色と、作業色空間内の1つあるいはそれより多い原型的(prototypical)位置(副容積ではなくむしろポイント)を対応付けることである。各画像画素に対して、最も近い原型的色名称位置が決定され、指定された色範囲内の色名称と対応付けられた、最も近い原型的位置を持つそれらの画素が、マスク内に含まれる。指定された色範囲内に無い、色名称と対応付けられた最も近い原型的位置を持つ画素は、マスクから除外される。各、個々の画素をマップすることが可能である一方、そのようなマッピングを単純化するためのアルゴリズムが存在する。例えば、種々のアルゴリズムは、サンプリング技術を使用、及び/又は、システムが均一なパッチを認識することを可能とする。
【0035】
マスクを構築するための、更に他の代替的方法は、多次元ルックアップ・テーブル(その入力値が作業色空間をサンプルする)を構築することである。画像画素色が、この多次元ルックアップ・テーブルを通じてマップされるときに、出力値は、画素がマスク内に含まれるか、マスクから除外されるかを示す。そのような実施例は、結果として、0と1の間の値をもたらし得る(ここで、値0はマスクからの除外を表わし、値1はマスク内に含まれることを表わす)。多次元ルックアップ・テーブルは一般的に、出力値を決定するために補間を用いるので、0と1の間の値が存在する可能性が存在する。そのような場合には、これらの分数の(fractional)値が、維持され得、結果として、ファジーな、又は、滲んだマスクがもたらされる。そのようなファジーな、又は、滲んだマスクにおいては、0と1の間の値を戻す画素は、マスクに部分的に含まれると考えられる。部分的にマスク内にある画素は、部分的な画像調整を与えられることになろう。或いは、出力値は、丸められ(rounded)得、又は、さもなければ、調整されて、0又は1の値だけを与えることによって、2進マスクを生成する。
【0036】
そのような入力用語を、作業色空間にマッピングするための他の方法には、例えば、ヴォロノイ分割(Volonoi partitions)、他のタイル張り(tessellation)方法、及び、k−Dツリーの使用が含まれる。凸(convex)領域及び非凸領域との双方のために適した、そのような方法の一般的な例には、色空間内の各名称付けされた領域への、四面体単体(tetrahedral simplices)によるタイル張り、が含まれる。所定の色が、領域を含む四面体のいずれかの中に位置する(lies)か否かのテストは、色が、当該領域内に位置するか否かを決定する。色空間の凸領域の場合には、領域のタイル張りを必要としない、より単純なテストが、使用され得る。
【0037】
ステップ300において、自然言語命令が使用されて、色調整変換を生成する。或る方法によってそのような変換が構築され得る、膨大な当該方法が存在する。しかし、一般的に、全てのそのような方法は、
1)所望の修正の大きさ(magnitude)、
2)修正されるべき性質、
3)それが修正されるべき方向、
を決定するために口述的な色修正指定(verbal color modification)を解析(parsing)するステップを含む。これらの3つの情報片(pieces)は、何らかの色調整変換に対する最小の要求である。変換が構築される前に、より完全に必要とされる変換を指定するために、追加的な情報が要求され得る。
【0038】
そのような追加的な情報は、マスクに含まれる画素(pixels)から獲得され得る。そのような画素に関連する情報は、色値(color values)及び空間的位置(spatial locations)を含み得る。変換構築(transform construction)において、個々の画素の値、又は、集団統計(population statistics)が使用され得る。次に説明されるものは、例えば、ここで議論されるもののような、例示的コマンド又は命令言語を用いた、変換構築(transform construction)の一般的な例である。変換構築の、この一般的例に含まれるステップは、図3に示される。
【0039】
最初に、修正されるべき色特性(color property)のための口述的指定320、色修正の大きさ330、及び、色修正の方向340、を得るために、口述的色修正指定が解析される310。自然言語画像編集命令(a natural language image editing instruction)の解析の例が、以下の表2に示される。
【0040】
表2


【0041】
上述のように、コマンド「赤色を、わずかに、より飽和しないようにする」は、最初に、1つ毎に(per)、ターゲット色範囲指定240(赤色)に、そして、色修正指定250(わずかに、より飽和しないように)に、解析される。次に、ステップ300において、色修正指定が、修正されるべき色特性(property)320(飽和:saturation)、色修正の大きさ330(わずかに)、及び、色修正340の方向(より少なく)、に解析される。
【0042】
修正されるべき色特性の口述的記述は、ステップ350の数値的正規化するスケール・ファクターにマップされる。このステップは、修正中の特性に関わらず、そして、修正中の色に関わらず、強度の口述的記述(330)が、ターゲット色における、均等の又は非常に類似する、知覚的変化に対応するように、強度指定が正規化される(normalized)ことを可能とする。この例に対して、要求される色変化の強度は「わずかに」であり、我々がどの知覚的特性を変更中であるかに関わらず、これは、ターゲットの「赤」色における、知覚的に類似する「わずかな」変化に導かれることになる。
【0043】
知覚的特性は、例えば、飽和、明るさ(lightness)、暗さ、オレンジっぽさ、ピンクっぽさ、茶色っぽさ、紫っぽさ、及び、グレイっぽさ、を含み得る。更に、選択された色を、(色名称)の原型の位置(prototypical location)に向かう方向に移動することによって、[たとえば、色の選択のモーブっぽさ(mauve-ness)を増加させるために、それらを、色名称「モーブ」の原型の位置に向かって移動させることによって]、(色名称)っぽさとして記述され得る、いずれの特性をも修正することが可能である。
【0044】
ステップ360において、色強度の口述的強度(verbal magnitude)は、数値的強度値の上にマップされる。一般的に、そして、常識に則って(in the interest of common sense)、より大きな強度を意味する言葉は、より大きな数値的強度値の上にマップされることになろうが、これは、必須要件ではない。しかし、通常の色的視覚を持つ平均集団が、口述的強度の言葉又はフレーズに対応付けするように、数値的強度スケール(この上に、強度を表わす言葉がマップされる)が、知覚された強度に線形的に対応することが望ましい。
【0045】
特性における知覚的変化は部分的に、修正されている色に、そして、その特性における、その初期的な値に依存することになろう。たとえば、もし、画像内の赤の低い飽和が存在し、次に、赤の高い飽和が存在すれば、画像における、赤の飽和のわずかな減少(lessening)を構築するものは異なりうる。実施例においては、作業色空間における「わずかに」の特性の強度の変化は、それが使用される文脈に依存する。
【0046】
ステップ370は、口述的方向の、数値的符号値(+又は−)へのマッピングを含む。これは、単純に、特性を増加させる口述的命令のための口述的方向(direction)の、+1の乗算型ファクター、そして、特性を増加させる口述的命令のための、−1の乗算型ファクターへのマッピングによって実施され得る。
【0047】
ステップ350、360、及び370で決定された数値的値は、色調整変換におけるパラメータとして使用される。これは、ステップ390において発生する。一般的に、色調整変換は、いくらかの、事前に規定された関数形態(functional form)を持つことになり、数値的値がこの関数形態に適用されて、色に対するその特定の効果を制御する。色調整変換の関数形態の選択は、ステップ380で為され得る。この選択はアプリケーション設計者によって任意に為され得、または、関数形態は、たとえば、修正されるべき色特性の値、色修正の口述的強度(verbal magnitude)、及び、色修正の口述的方向(verbal direction)、によって、アルゴリズム的に決定され得る。自然言語コマンドの、色作業空間における変換(transform)への転換(converting)を実施するプログラムは、ユーザ命令の異なった組へマップするための基本的形態(forms)のライブラリを持ち得る。ユーザによって入力された自然言語のコマンドに基づいて、プログラムは、このライブラリから機能的形態を選択する。たとえば、1つの機能的形態が、明るさの修正(lightness modifications)のために選択され得、そして、彩度修正のために、異なった形態が選択され得る。この場合において、関数的形態(それに対して、ステップ350、360、及び、370で決定された数値的値が適用される)は、修正されるべき色特性のタイプに依存することになろう。
【0048】
数値的値の、関数的形態への適用の平凡な例として、線形的マッピングの単純な関数的形態を考慮する。そのようなマッピングは、2つのパラメータ(線の傾斜及び交点(intercept))を持つことになろう。この平凡な(trivial)例において、線形関数は、指定された色特性のオリジナルの値を、その特性の修正された出力値にマップすることになろう。この線の傾斜は、数値的正規化スケール・ファクターの値、数値的強度値、及び、数値的符号値、の積(product)から決定され得る。そのような線形マッピングの交点値は、一般的にゼロであることになろうが、特別な場合には数値的強度値から導出され得るかもしれない。
【0049】
より複雑な関数形態は、一般的に、それらを定義するための、より多くのパラメータを要求することになろう。それ故、ステップ350、360、及び、370で決定された数値的な値が、パラメータの値を決定するために使用されることになろう。数値的値が、単純に、パラメータに割当てられ得るか、または、パラメータは、数値的値の組合せの、いくつかの数学的修正によって決定され得る。
【0050】
図2のステップ270に戻って、修正された画像が、それぞれ、ステップ380及び260で、オリジナルの画像に対して生成された、色修正変換及び画像マスクを印加することによって生成される。最後に、ステップ280において、修正された色画像が次に、元のオリジナル色空間に転換される。
【0051】
色に適応された変換が、円滑で、且つ、色関係を維持することが望ましい。画像及び色勾配(gradients)における輪郭付け(contouring)を回避するために、円滑さが重要である。色勾配逆転(reversals)を回避するために、色関係の維持(maintenance)が重要である。
【0052】
図4は、図2及び図3の方法を実施し得る、模範的コンピュータ・システム410の機能ブロック図を示す。説明されたコンピュータ・システム410は、プロセッサ412に接続されたメモリ414に記憶され得る処理命令の実行によって、コンピュータ・システム410の全体的作動を制御するプロセッサ412を含み得る。コンピュータ・システム410は、ネットワーク・インターフェース416、及び、ユーザ入力出力インターフェース418をも含み得る。I/Oインターフェース418は、情報をユーザに表示するための、1つあるいはそれより多いディスプレイ420、スピーカ422、及び、テキストを入力するための、キーボード424、または、タッチ若しくは書き込み可能なスクリーンのようなユーザ入力装置、及び/又は、ユーザ入力情報及びプロセッサ412へのコマンド選択を通信するための、マウス、トラックボール等のようなカーソル制御装置426と通信し得る。コンピュータ10の種々の要素が、全て、バス428によって接続され得る。プロセッサ412は、図2、及び/又は、図3に概説された方法を実行するための命令を実行する。コンピュータ・システム410は、たとえば、メインフレーム、デスクトップ、ラップトップ、若しくは、パームトップコンピュータ、又は、色を修正するための特定用途の装置であり得る。
【0053】
メモリ414は、図1−3に関して説明された、自然言語色修正システム420のための命令を保持する。メモリ414は、作業色空間、コマンド用語語彙及び構文、並びに、変換ライブラリ450の一部に対応する通常の言語色用語を含む、自然言語色用語辞書430をも保持し得る。
【0054】
メモリ414は、ランダム・アクセス・メモリ(RAM)、リード・オンリー・メモリ(ROM)、磁気ディスク若しくはテープ、光ディスク、フラッシュ・メモリ、又は、ホログラッフィック・メモリのような、外部又は内部の、如何なるタイプのコンピュータ読み出し可能な媒体であり得る。実施例においては、メモリ14は、これらの要素の組合せを含む。たとえば、自然言語色用語辞書がハード・ドライブに記憶され得る一方、色修正工程命令はチップ上のRAMに記憶され得る。いくつかの実施例において、プロセッサ12及びメモリ14は、単一のチップ内で組合せられ得る。ネットワーク・インターフェース16は、コンピュータが、ローカル・エリア・ネットワーク(LAN)、若しくは、ワイド・エリア・ネットワーク(WAN)、又は、インターネットのようなコンピュータ・ネットワークを介して、他の装置と通信することを可能とし、変調器/復調器(MODEM)を含み得る。
【0055】
容易に理解できるように、図4は、コンピュータ・システム410内に組み込まれる要素の一部のみの高レベル機能ブロック図である。プログラマブルなコンピュータの構成及び作動は良く知られているので、更には説明されない。
【0056】
図5は概略的に、図2及び図3に説明された方法を実現するのための模範的装置を示す。多くの、又は、全てのこれらの要素が、同じ装置の一部であり得ることに留意することが重要である。ここに説明される要素によって採られる全ての動作は、広く用いられているプロセッサ、又は、プロセッサのアレイを用いて実行され得る。文書又は画像入力装置500は、色画像に対応するデータのソースでありうる。入力装置500は、たとえば、色スキャナ、適切な文書若しくは画像生成ソフトウェア、カメラ若しくはデータ記憶装置、又は、インターネットでリンクされた電子記憶部、を持つパーソナル・コンピュータ又はワークステーションであり得る。修正されるべき画像データは、ユーザ・インターフェースを通じて、ユーザによって選択される。画像データは次に、色マッピング装置510に送られる。この色マッピング装置510において、画像データは、作業色空間(好ましくは、別個の輝度、クロミナンス、及び、色相要素を持つ作業色空間であるが、他の色空間も使用され得る)に転換される。色マッピング装置510は、たとえば、プロセッサの上で走るソフトウェア、又は、ASICのような、種々の形態及び詳細な作動を採り得る。色マッピング装置510は、画像入力装置500の要素でもあり得る。本装置は、ユーザによって入力されたコマンドを解析するための解析器(parser)520をも含み得る。実施例においては、解析器520は、ユーザ・コマンドを、修正中の色(又は複数の色)、及び、当該色に為されるべき修正に変える(reduces)。実施例においては、本システムは、色辞書430を用いて、どの色が、ユーザが入力したコマンドによって影響を受けるかを決定する。マスク生成器530は、修正されるべき、ユーザが入力した色又は複数の色に対応する作業色空間の領域を識別する。解析器540は、修正コマンドの、修正されるべき特性、修正の強度、及び、修正の方向、への分離をも行う。実施例において、コマンド言語及び構文は、コマンド言語語彙及び構文440内の、事前に規定された用語(terms)及び構造(structures)と比較される。解析器540は、解析器520と同じであり得るか、又は、別個の工程(process)として実行され得る。実施例において、変換生成器(transform generator)550は、次に、作業色空間内の変換ライブラリ450から変換の様式(form)を選択する。変換生成器550は、ユーザのコマンド言語による変換を修正することによって、適用されるべき変換を生成する。変換適用器560は、変換を、修正されるべき色に対応する色空間内の容積(volumes)に適用する。最後に、修正された画像出力ユニット570が、画像を、たとえば、表示スクリーン、プリンタ、ファクシミリ機器、又は、電子ペーパ、のような適切な出力装置に送る。
【0057】
ここにおいて実施例に開示される本発明は、色制御システム、及び、色を制御する方法を越えて拡張されることが可能であり得る。他の画像処理作動(operation)の修正及び制御もまた、自然言語コマンド・インターフェースからの恩恵を受け得る。そのような画像処理作動は、鮮鋭化(sharpening)、ノイズ削減、ポスタリゼーション(posterization)、及び、他の特別効果を含み得る。
【0058】
ここに説明される色制御システムは、自然言語コマンド・システムの1つのアプリケーションである。ここに開示される自然言語色修正方法が、色に加えて他の特性のために働き得ること、並びに、本発明が、色制御システムを越えた自然言語コマンドに基づいて、文書への修正をも包含し得ることが予測される。
【図面の簡単な説明】
【0059】
【図1】作業(working)色空間を、色用語の自然辞書(natural dictionary)と関連付けるための模範的方法を詳細に説明するフローチャートである。
【図2】自然言語の色修正方法の模範的実施例を詳細に説明するフローチャートである。
【図3】作業色空間における自然言語のコマンドを実施するための一般的工程を詳細に説明するフローチャートである。
【図4】図2及び図3による自然言語の色修正方法の模範的実施例を備えるコンピュータ・システムの機能ブロック図である。
【図5】自然言語の色修正システムの模範的実施例を概略説明する。
【出願人】 【識別番号】596170170
【氏名又は名称】ゼロックス コーポレイション
【氏名又は名称原語表記】XEROX CORPORATION
【出願日】 平成19年6月25日(2007.6.25)
【代理人】 【識別番号】100082005
【弁理士】
【氏名又は名称】熊倉 禎男

【識別番号】100067013
【弁理士】
【氏名又は名称】大塚 文昭

【識別番号】100086771
【弁理士】
【氏名又は名称】西島 孝喜

【識別番号】100109070
【弁理士】
【氏名又は名称】須田 洋之


【公開番号】 特開2008−17466(P2008−17466A)
【公開日】 平成20年1月24日(2008.1.24)
【出願番号】 特願2007−166189(P2007−166189)