トップ :: H 電気 :: H04 電気通信技術




【発明の名称】 データ圧縮装置およびデータ圧縮プログラム
【発明者】 【氏名】杉田 由紀夫

【要約】 【課題】CTデータも圧縮可能な新たな好ましい可逆圧縮処理を行うことができるデータ圧縮装置およびデータ圧縮プログラムを提供する。

【構成】被圧縮データの種別を判定する種別判定部と、被圧縮データを構成する数値の連続について隣接する数値どうしの差分を求めて新たな被圧縮データを生成する差分生成部と、被圧縮データを構成する各数値を所定値だけオフセットさせるオフセット部と、オフセットされた被圧縮データの各数値を、単位ビット数よりも小さい所定の分割ビット数のところで上位ビット部分と下位ビット部分とに分けて、被圧縮データを各数値における上位ビット部分の連続からなる上位データと各数値の下位ビット部分の連続からなる下位データとに分割する分割部と、下位データに対して判定された種別に応じた可逆圧縮処理を施す下位データ圧縮部と、上位データに対して可逆圧縮処理を施す上位データ圧縮部とを備えた。
【特許請求の範囲】
【請求項1】
所定の単位ビット数で表わされる数値の連続からなる被圧縮データにデータ圧縮処理を施すデータ圧縮装置において、
被圧縮データの種別を判定する種別判定部と、
被圧縮データを構成する数値の連続について隣接する数値どうしの差分を求めることにより該差分を表わす数値の連続からなる新たな被圧縮データを生成する差分生成部と、
被圧縮データを構成する各数値を所定値だけオフセットさせるオフセット部と、
前記オフセット部によって数値がオフセットされた被圧縮データの各数値を、前記単位ビット数よりも小さい所定の分割ビット数のところで上位ビット部分と下位ビット部分とに分けることによって、該被圧縮データを、各数値における上位ビット部分の連続からなる上位データと各数値の下位ビット部分の連続からなる下位データとに分割する分割部と、
前記分割部によって分割された下位データに対して前記種別判定部によって判定された種別に応じた可逆圧縮処理を施す下位データ圧縮部と、
前記分割部によって分割された上位データに対して可逆圧縮処理を施す上位データ圧縮部とを備えたことを特徴とするデータ圧縮装置。
【請求項2】
前記種別判定部が、前記分割部によって分割された下位データに基づいて被圧縮データの種別を判定するものであることを特徴とする請求項1記載のデータ圧縮装置。
【請求項3】
被圧縮データは、連続階調画像およびラインワーク画像のうちの一方を表すデータであって、前記種別判定部は、連続階調画像を表す第1種別のデータであるかラインワーク画像を表す第2種別のデータであるかを判定するものであることを特徴とする請求項1記載のデータ圧縮装置。
【請求項4】
前記種別判定部は、データ中に出現する数値のヒストグラムに基づいて、被圧縮データの種別を判定するものであることを特徴とする請求項3記載のデータ圧縮装置。
【請求項5】
前記種別判定部は、前記差分生成部により生成された新たな被圧縮データに基づいて、被圧縮データの種別を判定するものであることを特徴とする請求項3記載のデータ圧縮装置。
【請求項6】
前記下位データ圧縮部は、
前記種別判定部によって被圧縮データの種別が第2種別であると判定された場合には、前記下位データ中、1つもしくは複数の所定の圧縮対象数値を除く数値についてはそのまま出力するとともに、圧縮対象数値については、該圧縮対象数値と、該圧縮対象数値と同一の圧縮対象数値の連続数を表わす数値とに符号化して出力し、前記種別判定部によって被圧縮データの種別が第1種別であると判定された場合には、前記下位データ中の全ての数値をそのまま出力する種別符号化部を備えたものであることを特徴とする請求項3記載のデータ圧縮装置。
【請求項7】
前記下位データ圧縮部は、
前記種別判定部によって被圧縮データの種別が第2種別であると判定された場合には、前記下位データ中、1つもしくは複数の所定の圧縮対象数値を除く数値についてはそのまま出力するとともに、圧縮対象数値については、該圧縮対象数値と、該圧縮対象数値と同一の圧縮対象数値の連続数を表わす数値とに符号化して出力し、前記種別判定部によって被圧縮データの種別が第1種別であると判定された場合には、前記下位データ中の全ての数値をそのまま出力する種別符号化部と、
前記種別符号化部から出力された数値からなるデータに対し、符号と数値を対応づけるテーブルを用いてエントロピー符号化を施すエントロピー符号化部とを備えたものであることを特徴とする請求項3記載のデータ圧縮装置。
【請求項8】
前記エントロピー符号化部は、圧縮省略の指示を受けて、前記種別符号化部から出力された数値からなるデータを無圧縮で出力するものであることを特徴とする請求項7記載のデータ圧縮装置。
【請求項9】
前記種別判定部によって被圧縮データの種別が第2種別であると判定された場合には、前記下位データ中、1つもしくは複数の所定の圧縮対象数値を除く数値についてはそのまま出力するとともに、圧縮対象数値については、該圧縮対象数値と、該圧縮対象数値と同一の圧縮対象数値の連続数を表わす数値とに符号化して出力し、前記種別判定部によって被圧縮データの種別が第1種別であると判定された場合には、前記下位データ中の全ての数値をそのまま出力する種別符号化部と、
前記種別符号化部から出力された数値からなるデータに対し、ハフマンテーブルを用いてハフマン符号化を施すハフマン符号化部とを備えたものであることを特徴とする請求項3記載のデータ圧縮装置。
【請求項10】
前記ハフマン符号化部は、圧縮省略の指示を受けて、前記種別符号化部から出力された数値からなるデータを無圧縮で出力するものであることを特徴とする請求項9記載のデータ圧縮装置。
【請求項11】
前記上位データ圧縮部が、上位データ中、1つもしくは複数の所定の圧縮対象数値を除く数値についてはそのまま出力するとともに、圧縮対象数値については、該圧縮対象数値と、該圧縮対象数値と同一の圧縮対象数値の連続数を表わす数値とに符号化して出力する第1の符号化部を備えたものであることを特徴とする請求項1記載のデータ圧縮装置。
【請求項12】
前記上位データ圧縮部が、
上位データ中、1つもしくは複数の所定の圧縮対象数値を除く数値についてはそのまま出力するとともに、圧縮対象数値については、該圧縮対象数値と、該圧縮対象数値と同一の圧縮対象数値の連続数を表わす数値とに符号化して出力する第1の符号化部と、
符号と数値を対応づけるテーブルを用いて、前記第1の符号化部で符号化された後のデータにエントロピー符号化を施す第2の符号化部を備えたものであることを特徴とする請求項1記載のデータ圧縮装置。
【請求項13】
前記上位データ圧縮部が、
上位データ中、1つもしくは複数の所定の圧縮対象数値を除く数値についてはそのまま出力するとともに、圧縮対象数値については、該圧縮対象数値と、該圧縮対象数値と同一の圧縮対象数値の連続数を表わす数値とに符号化して出力する第1の符号化部と、
ハフマンテーブルを用いて、前記第1の符号化部で符号化された後のデータにハフマン符号化を施す第2の符号化部を備えたものであることを特徴とする請求項1記載のデータ圧縮装置。
【請求項14】
前記上位データ圧縮部が、
上位データ中、1つもしくは複数の所定の圧縮対象数値を除く数値についてはそのまま出力するとともに、圧縮対象数値については、該圧縮対象数値と、該圧縮対象数値と同一の圧縮対象数値の連続数を表わす数値とに符号化して出力する第1の符号化部と、
前記第1の符号化部で符号化された後のデータ中に出現する数値のヒストグラムを求めるヒストグラム算出部と、
前記ヒストグラム算出部で求められたヒストグラムに基づき、符号と数値を対応づけるテーブルに、出現頻度の高い数値ほど符号長の短かい符号を割り当てる符号割当部と、
前記符号割当部で符号が割り当てられたテーブルを用いて、前記第1の符号化部で符号化された後のデータにエントロピー符号化を施す第2の符号化部を備えたものであることを特徴とする請求項1記載のデータ圧縮装置。
【請求項15】
プログラムを実行する情報処理装置内に組み込まれて該情報処理装置に、所定の単位ビット数で表わされる数値の連続からなる被圧縮データにデータ圧縮処理を実行させるデータ圧縮プログラムにおいて、
前記情報処理装置上に、
被圧縮データの種別を判定する種別判定部と、
被圧縮データを構成する数値の連続について隣接する数値どうしの差分を求めることにより該差分を表わす数値の連続からなる新たな被圧縮データを生成する差分生成部と、
被圧縮データを構成する各数値を所定値だけオフセットさせるオフセット部と、
前記オフセット部によって数値がオフセットされた被圧縮データの各数値を、前記単位ビット数よりも小さい所定の分割ビット数のところで上位ビット部分と下位ビット部分とに分けることによって、該被圧縮データを、各数値における上位ビット部分の連続からなる上位データと各数値の下位ビット部分の連続からなる下位データとに分割する分割部と、
前記分割部によって分割された下位データに対して前記種別判定部によって判定された種別に応じた可逆圧縮処理を施す下位データ圧縮部と、
前記分割部によって分割された上位データに対して可逆圧縮処理を施す上位データ圧縮部とを構築することを特徴とするデータ圧縮プログラム。
【発明の詳細な説明】【技術分野】
【0001】
本発明は、画像データ等のデータを圧縮するデータ圧縮装置、およびコンピュータ等の情報処理装置をデータ圧縮装置として動作させるデータ圧縮プログラムに関する。
【背景技術】
【0002】
従来より、記憶容量の低減化や通信量の低減化等のために、画像データ等のデータを圧縮する技術が広く採用されている。
【0003】
例えば、特許文献1には、原画像から代表色を選定しCLUT(カラールックアップテーブル)を構成する際に、連続する色番号が近い値の色データを持つように色番号を割り当て、次にCLUTに対応したビットマップを作成して隣接画素間の色番号の差分を求め、差分が大きな値を取る場合、画質劣化を起こさない範囲でビットマップの色番号を変更し、差分を小さな値に偏らせ、差分データに対してランレングス符号化を施すという技術が開示されている。
【0004】
ここで、データ圧縮技術を適用した1つのシステムを紹介する。
【0005】
図1は、データ圧縮技術が適用されたプリントシステムの一例を示す図、図2は、プリントシステムにおけるデータ処理の流れを示す図である。
【0006】
このプリントシステムは、図1に示すように、ホストコントローラ100と、インターフェース機器200と、プリンタ300とで構成されており、ホストコントローラ100とインターフェース機器200との間はSCSI等の汎用インターフェースケーブル150で接続され、さらにインターフェース機器200とプリンタ300との間は専用インターフェースケーブル250で接続されている。
【0007】
ホストコントローラ100の内部では、図2に示すように、PDF,PS,TIFF等、様々な言語やフォーマットで記述された文字や画像のデータ11が、画像(CT;Continuous Tone)データと文字やライン等(LW;Line Work)のデータとに分けられて、それぞれについてRIP(Raster Image Processing)を行なうことによりビットマップデータ12A,13Aが生成され、さらにそれぞれについてデータ圧縮処理が行なわれて、CTについての圧縮データ14、LWについての圧縮データ15が生成される。これらの圧縮データ14,15は、図1に示す汎用インターフェースケーブル150を経由して、ホストコントローラ100からインターフェース機器200に転送される。インターフェース機器200では、転送されてきた圧縮データ14,15にデータ伸長処理を施して、ホストコントローラ100でデータ圧縮処理を行なう前の状態のビットマップデータ12A,13Aに対応するビットマップデータ12B,13Bを生成する。
【0008】
インターフェース機器200では、データ伸長後のCTデータ(ビットマップデータ12B)とLWデータ(ビットマップデータ13B)とが合成され、さらに網点情報等がタグとして付加されてプリンタ300に送られる。プリンタ300では、インターフェース機器200から受け取ったビットマップデータとそれに付加されたタグ情報とに従って画像がプリント出力される。
【0009】
ホストコントローラ100とインターフェース機器200とが例えば相互に離れている場合、あるいは、インターフェース機器200が複数台のホストコントローラから画像データを受信するシステムの場合など、ホストコントローラ100とインターフェース機器200を別々の装置として構成する必要がある場合には、図2に示すような、ホストコントローラ100でデータ圧縮を行なってインターフェース機器200にデータ転送しインターフェース機器でデータ伸長するように構成することにより、ホストコントローラ100からインターフェース機器200へのデータ転送時間を短縮することができ、プリントの生産性が向上する。
【0010】
ここで、一般的には、CTデータについては、非可逆ではあるが圧縮率の高いJPEG等の圧縮方式が採用され、LWデータについてはPackBits等の可逆圧縮方式が採用される。
【特許文献1】特開平5−328142号公報
【発明の開示】
【発明が解決しようとする課題】
【0011】
しかし、JPEG等の圧縮方式では、ソフトウェアでの圧縮処理に時間を要し、圧縮処理のシステム全体としての処理能力を劣化させる要因となっていた。
【0012】
また、JPEG等は非可逆な圧縮処理であるため画質の劣化を必然的に伴うが、近年、高画質化への要求がますます高まってきており、CTデータについても画質の劣化を招かないよう可逆圧縮を行うことが検討されてきている。
【0013】
本発明は上記事情に鑑み、CTデータも圧縮可能な新たな好ましい可逆圧縮処理を行うことができるデータ圧縮装置およびデータ圧縮プログラムを提供することを目的とする。
【課題を解決するための手段】
【0014】
上記目的を達成する本発明のデータ圧縮装置は、
所定の単位ビット数で表わされる数値の連続からなる被圧縮データにデータ圧縮処理を施すデータ圧縮装置において、
被圧縮データの種別を判定する種別判定部と、
被圧縮データを構成する数値の連続について隣接する数値どうしの差分を求めることにより該差分を表わす数値の連続からなる新たな被圧縮データを生成する差分生成部と、
被圧縮データを構成する各数値を所定値だけオフセットさせるオフセット部と、
上記オフセット部によって数値がオフセットされた被圧縮データの各数値を、上記単位ビット数よりも小さい所定の分割ビット数のところで上位ビット部分と下位ビット部分とに分けることによって、該被圧縮データを、各数値における上位ビット部分の連続からなる上位データと各数値の下位ビット部分の連続からなる下位データとに分割する分割部と、
上記分割部によって分割された下位データに対して上記種別判定部によって判定された種別に応じた可逆圧縮処理を施す下位データ圧縮部と、
上記分割部によって分割された上位データに対して可逆圧縮処理を施す上位データ圧縮部とを備えたことを特徴とする。
【0015】
ここで、上記の『被圧縮データを構成する数値の連続について隣接する数値どうしの差分を求めることにより』における『隣接する』とは、データストリーム上で隣接してもよいが、必ずしもそれに限定されるものではない。例えば、2次元画像データが1次元ストリーム状のデータとして扱われている場合であれば、2次元的な画像上で見て隣接してもよい。また、『隣接する数値どうしの差分』とは、1次元的な差分のみならず2次元以上の多次元的な差分も含む意である。以下においても同様である。
【0016】
また、本発明のデータ圧縮装置は、上記種別判定部が、上記分割部によって分割された下位データに基づいて被圧縮データの種別を判定するものであるものであることが好ましい。
【0017】
また、本発明のデータ圧縮装置は、
被圧縮データは、連続階調画像およびラインワーク画像のうちの一方を表すデータであって、上記種別判定部は、連続階調画像を表す第1種別のデータであるかラインワーク画像を表す第2種別のデータであるかを判定するものであってもよく、この場合には、上記種別判定部は、データ中に出現する数値のヒストグラムに基づいて、被圧縮データの種別を判定するものであることが好ましく、また、上記種別判定部は、上記差分生成部により生成された新たな被圧縮データに基づいて、被圧縮データの種別を判定するものであることも好ましい。
【0018】
また、被圧縮データは、連続階調画像およびラインワーク画像のうちの一方を表すデータであって、上記種別判定部は、連続階調画像を表す第1種別のデータであるかラインワーク画像を表す第2種別のデータであるかを判定するものである場合には、上記種別判定部によって被圧縮データの種別が第2種別であると判定された場合には、上記下位データ中、1つもしくは複数の所定の圧縮対象数値を除く数値についてはそのまま出力するとともに、圧縮対象数値については、該圧縮対象数値と、該圧縮対象数値と同一の圧縮対象数値の連続数を表わす数値とに符号化して出力し、上記種別判定部によって被圧縮データの種別が第1種別であると判定された場合には、上記下位データ中の全ての数値をそのまま出力する種別符号化部を備えたものであることが好ましい。この好ましい形態においては、上記種別符号化部から出力された数値からなるデータに対し、符号と数値を対応づけるテーブルを用いてエントロピー符号化を施すエントロピー符号化部とを備えたものであることがさらに好ましく、上記種別符号化部から出力された数値からなるデータに対し、ハフマンテーブルを用いてハフマン符号化を施すハフマン符号化部とを備えたものであることがとりわけ好ましい。また、エントロピー符号化部やハフマン符号化部を備えた形態においては、上記のエントロピー符号化部やハフマン符号化部が、圧縮省略の指示を受けて、上記種別符号化部から出力された数値からなるデータを無圧縮で出力するものであることも好ましい。
【0019】
また、本発明のデータ圧縮装置は、
上記上位データ圧縮部が、上位データ中、1つもしくは複数の所定の圧縮対象数値を除く数値についてはそのまま出力するとともに、圧縮対象数値については、該圧縮対象数値と、該圧縮対象数値と同一の圧縮対象数値の連続数を表わす数値とに符号化して出力する第1の符号化部を備えたものであることが好ましく、さらには、符号と数値を対応づけるテーブルを用いて、上記第1の符号化部で符号化された後のデータにエントロピー符号化を施す第2の符号化部を備えたものであることが好ましい。この場合、第2の符号化部は、ハフマンテーブルを用いて、上記第1の符号化部で符号化された後のデータにハフマン符号化を施すものであることがとりわけ好ましい。
【0020】
また、本発明のデータ圧縮装置は、
上記上位データ圧縮部が、上位データ中、1つもしくは複数の所定の圧縮対象数値を除く数値についてはそのまま出力するとともに、圧縮対象数値については、該圧縮対象数値と、該圧縮対象数値と同一の圧縮対象数値の連続数を表わす数値とに符号化して出力する第1の符号化部と、上記第1の符号化部で符号化された後のデータ中に出現する数値のヒストグラムを求めるヒストグラム算出部と、上記ヒストグラム算出部で求められたヒストグラムに基づき、符号と数値を対応づけるテーブルに、出現頻度の高い数値ほど符号長の短かい符号を割り当てる符号割当部と、上記符号割当部で符号が割り当てられたテーブルを用いて、上記第1の符号化部で符号化された後のデータにエントロピー符号化を施す第2の符号化部を備えたものであることが好ましい。
【0021】
上記目的を達成する本発明のデータ圧縮プログラムは、
プログラムを実行する情報処理装置内に組み込まれて該情報処理装置に、所定の単位ビット数で表わされる数値の連続からなる被圧縮データにデータ圧縮処理を実行させるデータ圧縮プログラムにおいて、
上記情報処理装置上に、
被圧縮データの種別を判定する種別判定部と、
被圧縮データを構成する数値の連続について隣接する数値どうしの差分を求めることにより該差分を表わす数値の連続からなる新たな被圧縮データを生成する差分生成部と、
被圧縮データを構成する各数値を所定値だけオフセットさせるオフセット部と、
上記オフセット部によって数値がオフセットされた被圧縮データの各数値を、上記単位ビット数よりも小さい所定の分割ビット数のところで上位ビット部分と下位ビット部分とに分けることによって、該被圧縮データを、各数値における上位ビット部分の連続からなる上位データと各数値の下位ビット部分の連続からなる下位データとに分割する分割部と、
上記分割部によって分割された下位データに対して上記種別判定部によって判定された種別に応じた可逆圧縮処理を施す下位データ圧縮部と、
上記分割部によって分割された上位データに対して可逆圧縮処理を施す上位データ圧縮部とを構築することを特徴とする。
【0022】
なお、本発明にいうデータ圧縮プログラムについては、ここではその基本形態のみを示すのにとどめるが、これは単に重複を避けるためであり、本発明にいうデータ圧縮プログラムには、上記の基本形態のみではなく、前述したデータ圧縮装置の各形態に対応する各種の形態が含まれる。
【0023】
また、本発明のデータ圧縮プログラムがコンピュータ上に構成するオフセット部などといった要素は、1つの要素が1つのプログラム部品によって構築されるものであってもよく、1つの要素が複数のプログラム部品によって構築されるものであってもよく、複数の要素が1つのプログラム部品によって構築されるものであってもよい。また、これらの要素は、そのような作用を自分自身で実行するものとして構築されてもよく、あるいは、コンピュータに組み込まれている他のプログラムやプログラム部品に指示を与えて実行するものとして構築されても良い。
【発明の効果】
【0024】
上記本発明のデータ圧縮装置ないしデータ圧縮プログラムによれば、差分生成部によって生成された新たな被圧縮データがオフセット部によって数値がオフセットされた後に上位データと下位データとに分割されて、上位データに対しては可逆圧縮処理が実行され、下位データに対しては、種別判定部によって判定された被圧縮データの種別に応じた可逆圧縮処理が実行される。
【0025】
ここで、被圧縮データの種別の特徴は、データの分割後の上記の下位データ中に顕著に現れるため、上記の種別判定部が。元のデータよりデータ量が少ない下位データに基づいて被圧縮データの種別を判定することにより、判定効率を向上させることができる。
【0026】
また、LWデータでは、CTデータに比べてデータ中の数値がいくつかの特定数値に集中する傾向が強い。そこで、LWデータに対しては、そのような特定数値のみをその特定数値と連続数とを表わす数値とに符号化する種別符号化部を備えることで大きな圧縮率が達成される。このとき、被圧縮データがLWデータであるか、あるいはCTデータであるかの判定の方法としては、データ中に出現する数値のヒストグラムに基づいて、データ中の数値が特定数値に集中している度合によって判定する方法や、差分をとった後のデータである、上記の新たな被圧縮データ中に出現する数値の集中度によって判定する方法が採用可能であり、これらの方法では、被圧縮データがLWデータであるか、あるいはCTデータであるかが簡単に判定される。
【0027】
また、上記の下位データ圧縮部がエントロピー符号化部を備えると、エントロピー符号化による、圧縮率の更なる向上が見込まれる。特に、エントロピー符号化の典型として、上記の下位データ圧縮部がハフマン符号化部を備えると、ハフマン符号化による、高い圧縮率が実現する。このとき、エントロピー符号化部やハフマン符号化部が、圧縮省略の指示を受けて下位データを無圧縮で出力するものであると、そのような指示によってより高速な圧縮処理を選択することができる。
【0028】
また、上記の上位データ圧縮部が第1の符号化部を備えると、圧縮対象数値のみが、その圧縮対象数値と連続数とを表わす数値とに符号化されるため、原データよりも冗長度が増すという事態が回避され、圧縮率が向上する。
【0029】
また、上記の上位データ圧縮部が第2の符号化部を備えると、エントロピー符号化(典型的にはハフマン符号化)による、圧縮率の更なる向上が見込まれる。
【0030】
さらに、上記の上位データ圧縮部が、ヒストグラム算出部と符号割当部とを備え、第2の符号化部が、符号割当部で符号が割り当てられたテーブルを用いてエントロピー符号化(例えばハフマン符号化)を施すものであると、符号の割り当てが固定されたテーブルを用いたエントロピー符号化と比べ、圧縮率をさらに大きく向上させることができる。
【発明を実施するための最良の形態】
【0031】
以下において説明する実施形態は、図1に示す全体システムの中のホストコントローラに組み込まれる画像圧縮装置であり、さらに具体的には、図2に示すホストコントローラ内のCTのビットマップデータ12AおよびLWのビットマップデータ13Aについてデータ圧縮を行なう処理に関するものである。したがって、ここでは、図1,図2を参照して説明したCTデータおよびLWデータについてのデータ圧縮処理が以下に説明する本発明の実施形態としてのデータ圧縮処理に置き換わり、インターフェース機器内でのデータ伸長(解凍)処理もその本発明の実施形態としてのデータ圧縮処理に対応したデータ伸長(解凍)処理に置き換わるものと理解し、図1に示す全体システムおよび図2に示す処理の流れについて重複した図示および重複説明は省略する。
【0032】
図3は、本発明のデータ圧縮装置の一実施形態に相当する画像圧縮装置を示すブロック構成図である。
【0033】
この図3に示す画像圧縮装置500は、CTデータおよびLWデータの両方に対して、可逆圧縮処理を施す画像圧縮装置であり、この可逆圧縮処理のために、差分符号化部510、ヒストグラム解析部515、オフセット部520、プレーン分割部530、Lプレーン圧縮部540、Hプレーン圧縮部550を備えている。各部510〜550の詳細は後述するが、この画像圧縮装置500内での画像データの流れは以下のとおりである。
【0034】
入力画像ファイルD0(本実施形態では、図2に示すように、ビットマップに展開されたCTデータ12AやLWデータ13Aが格納されたファイル)は、差分符号化部510に入力されて、2次元差分符号化処理、すなわち、入力されてきたデータを構成する数値の連続について、画像上で見てその数値に複数方向それぞれに隣接する複数の数値に基づいた2次元的な差分を求めることによりその差分を表わす8ビットの数値の連続からなる画像データを生成する処理が行なわれる。この差分符号化部510は、本発明にいう差分生成部の一例に相当する。
【0035】
差分符号化部510で生成された、差分を表わす数値の連続からなる画像データは、オフセット部520に入力されて所定量のオフセットが施される。プレーン分割部530では、オフセット後の画像データ中の8ビットの各数値が、下位ビットと上位ビットとに分けられることにより、画像データが、下位ビットの数値の連続からなる下位サブプレーンD1Lと上位ビットの数値の連続からなる上位サブプレーンD1Hとに分割される。このオフセット部520が、本発明にいうオフセット部の一例に相当し、プレーン分割部530が、本発明にいう分割部の一例に相当する。また、下位サブプレーンD1Lおよび上位サブプレーンD1Hは、それぞれ、本発明にいう下位データおよび上位データの各一例に相当する。
【0036】
プレーン分割部530で分割された下位サブプレーンD1Lおよび上位サブプレーンD1Hは、それぞれ、Lプレーン圧縮部540およびHプレーン圧縮部550において可逆圧縮が施されるが、下位サブプレーンD1Lについては、Lプレーン圧縮部540への入力前に、ヒストグラム解析部515においてヒストグラム解析が行われて、入力画像ファイルD0中のデータがCTデータであるか、あるいはLWデータであるかが判定される。Lプレーン圧縮部540では、ヒストグラム解析部515の判定結果に応じた可逆圧縮処理を施す。ここで、Lプレーン圧縮部540およびHプレーン圧縮部550は、それぞれ、本発明にいう下位データ圧縮部および上位データ圧縮部の各一例に相当し、ヒストグラム解析部515が、本発明にいう種別判定部の一例に相当する。
【0037】
Lプレーン圧縮部540には、処理分岐部544が備えられており、ヒストグラム解析部515が入力画像ファイルD0中のデータがCTデータであると判定した場合には、処理分岐部544は、入力されてきた下位サブプレーンD1Lをハフマン符号化部541に向けて出力する。一方、ヒストグラム解析部515が入力画像ファイルD0中のデータがLWデータであると判定した場合には、処理分岐部544は、入力されてきた下位サブプレーンD1Lをランレングス符号化部545に向けて出力する。ランレングス符号化部545では、入力されてきた下位サブプレーンD1Lのデータの中から1つもしくは複数の圧縮対象数値の存在及び同一の圧縮対象数値の連続数が検出される。次いで、ランレングス符号化部545では、その検出結果を受けて、下位サブプレーンD1Lのデータ中、圧縮対象数値を除く数値についてはそのまま出力すると共に、圧縮対象数値については、その圧縮対象数値と、その圧縮対象数値と同一の圧縮対象数値の連続数を表わす数値とに符号化して出力するという符号化処理が行なわれる。このランレングス符号化部545では、その符号化処理にあたっては、同一の圧縮対象数値の連続数に応じ、その連続数を異なるビット数で表現する符号化が行なわれる。ここでは、具体的には、同一の圧縮対象数値の連続数が所定数以下のときはその連続数を1単位ビット数で表現し、その連続数が所定数を越えるときは2単位ビット数で表現する符号化が行なわれる。本実施形態では、このランレングス符号化部545と処理分岐部544とを合わせたものが、本発明にいう種別符号化部の一例に相当する。ランレングス符号化部545での符号化後のデータは、次に、ハフマン符号化部541に入力される。すなわち、上記の処理分岐部544の働きにより、LWデータの下位サブプレーンD1Lは、ランレングス符号化が行われた後、ハフマン符号化部541に入力され、CTデータの下位サブプレーンD1Lは、そのままハフマン符号化部541に入力されることになる。
【0038】
Lプレーン圧縮部540のハフマン符号化部541では、数値と符号とを対応づける固定的なハフマンテーブルに従って、そのハフマン符号化部541に入力されてきた下位サブプレーンD1Lを構成する数値をそのハフマンテーブルに従う符号に置き換える符号化処理が行なわれる。このハフマン符号化は、エントロピー符号化の一種である。このハフマン符号化部541は、本発明にいうエントロピー符号化の一例に相当するとともに、本発明にいうハフマン符号化部の一例にも相当する。なお、Lプレーン圧縮部540にはモード切換部542が組み込まれており、このモード切換部542は、ユーザから、高速モードと通常モードとの切り換えを指示されて、上記のハフマン符号化部541によるハフマン符号化を経る通常モードと、ハフマン符号化を省略して下位サブプレーンD1Lをそのまま出力する高速モードとを切り換える。従って、最終的にLプレーン圧縮部540からは、通常モードの場合には、下位サブプレーンD1Lがハフマン符号化により圧縮された下位圧縮データD2Lが出力され、高速モードの場合には、ハフマン符号化が施されていない下位圧縮データD2Lが出力されることになる。
【0039】
一方、Hプレーン圧縮部550には、ランレングス符号化部551と、データスキャニング部552と、ハフマン符号化部553が備えられており、上位サブプレーンD1Hは、Hプレーン圧縮部550中のランレングス符号化部551に入力される。
【0040】
Hプレーン圧縮部550中のランレングス符号化部551は、入力されてきた上位サブプレーンD1Hに対し、上述した、Lプレーン圧縮部540中のランレングス符号化部545で行われたのと同様のランレングス符号化を施す。本実施形態では、Hプレーン圧縮部550中のランレングス符号化部551が、本発明にいう第1の符号化部の一例に相当する。Hプレーン圧縮部550中のランレングス符号化部551での符号化後のデータは、次に、データスキャニング部552とハフマン符号化部553との双方に入力される。データスキャニング部552では、ランレングス符号化部551で符号化された後のデータの全てをスキャニングして、そのデータ中に出現する全ての数値の出現頻度(ヒストグラム)が求められる。ここで、この出現頻度を求める処理は、本実施形態では、図3に示す上位サブプレーンD1Hの1つずつを単位として実行され、各上位サブプレーンD1Hの、ランレングス符号化部551で符号化された後のデータ中の数値の出現頻度が求められる。さらに、データスキャニング部552では、求められたデータヒストグラム(数値の出現頻度)に基づき、ハフマンテーブルに、出現頻度の高い数値ほど符号長の短かい符号を割り当てる。このデータスキャニング部552が、本発明にいうヒストグラム算出部および符号割当部の一例に相当する。
【0041】
データスキャニング部552で数値に符号が割り当てられてなるハフマンテーブルは、ハフマン符号化部553に渡され、ハフマン符号化部553では、その渡されたハフマンテーブルに従って、そのハフマン符号化部553に入力されてきたデータを構成する数値を、そのハフマンテーブルに従う符号、すなわち、出現頻度の高い数値ほど短かいビット長で表わされる符号に置き換える符号化処理が行なわれる。このハフマン符号化部553は、本発明にいう第2の符号化部の一例に相当する。
【0042】
ハフマン符号化部553でハフマン符号化された後のデータは、データスキャニング部552で割り当てられた数値と符号との割当テーブルを含む圧縮情報が添付され、上位サブプレーンD1Hが圧縮された上位圧縮データD2HとしてHプレーン圧縮部550から出力される。
【0043】
このようにLプレーン圧縮部540およびHプレーン圧縮部550のそれぞれから出力される下位圧縮データD2Lと上位圧縮データD2Hとの組が、元の画像データに対する圧縮データが構成される。この圧縮データは、図1に示すSCSI等の汎用インターフェース150を経由してインターフェース機器200に転送される。インターフェース機器200では、その受け取った可逆圧縮データにデータ伸長処理が施されるが、このデータ伸長処理にあたっては、図3で説明した各種の符号化処理に対応する復号化処理が施されて元の入力画像ファイル中の画像データと同一の画像データが復元される。
【0044】
図4は、図1に示すホストコントローラのハードウェア構成図である。
【0045】
図1に示すホストコントローラ100は、図4に示す構成のコンピュータシステムで構成されている。
【0046】
この図4に示す、コンピュータシステムで構成されたホストコントローラ100には、CPU111、RAM112、通信インターフェース113、ハードディスクコントローラ114、FDドライブ115、CDROMドライブ116、マウスコントローラ117、キーボードコントローラ118、ディスプレイコントローラ119、および通信用ボード120が備えられており、これらはバス110で相互に接続されている。
【0047】
ハードディスクコントローラ114は、このホストコントローラ100に内蔵されているハードディスク104のアクセスを制御するものであり、FDドライブ115、CDROMドライブ116は、このホストコントローラ100に取出し自在に装填されるフレキシブルディスク(FD)130、CDROM140のアクセスを制御するものである。また、マウスコントローラ117、キーボードコントローラ118は、このホストコントローラ100に備えられたマウス107、キーボード108の操作を検出してCPU111に伝達する役割を担っている。さらに、ディスプレイコントローラ119は、このCPU111の指示に基づいて、ホストコントローラ100に備えられた画像ディスプレイ109の表示画面上に画像を表示する役割を担っている。
【0048】
通信用ボード120は、SCSI等の汎用インターフェースプロトコルに準拠した通信を担っており、圧縮後の画像データをインターフェースケーブル150を介してインターフェース機器200(図1参照)に転送する役割を担っている。
【0049】
さらに、通信用インターフェース113は、インターネット等の汎用の通信を担っており、このホストコントローラ100は、この通信用インターフェース113を経由して画像データを取り込むこともできる。
【0050】
RAM112には、ハードディスク104に格納されているプログラムが読み出されてCPU111での実行のために展開され、CPU111では、そのRAM112に展開されたプログラムが読み出されて実行される。
【0051】
図5は、本発明のデータ圧縮プログラムの一実施形態に相当する画像圧縮処理プログラムの模式構成図である。
【0052】
ここでは、この画像圧縮プログラム600は、CDROM140に記憶されている。
【0053】
この画像圧縮プログラム600は、差分符号化部610、ヒストグラム解析部615、オフセット部620、プレーン分割部630、Lプレーン圧縮部640、Hプレーン圧縮部650から構成されている。このCDROM140には、ここに示す画像圧縮プログラム600のほか、図1に示すホストコントローラ100における一連の処理を実行するための各種プログラムが記憶されているが、それらについては従来と同様であるため図示および説明は省略する。
【0054】
この図5に示すCDROM140が、図4に示すホストコントローラ100に装填されCDROMドライブ116でアクセスされてそのCDROM140に記憶されているプログラムがこのホストコントローラ100にアップロードされ、ハードディスク104に記憶される。このハードディスク104に記憶されたプログラムがそのハードディスク104から読み出されてRAM112に展開されCPU111で実行されると、このホストコントローラ100は、図3に示す画像圧縮装置500としての処理を含む、ホストコントローラとしての各種処理を実行する装置として動作する。
【0055】
ここで、図5に示す画像圧縮プログラム600は、ホストコントローラ100にインストールされてCPU111で実行されることにより、そのホストコントローラ100内に図3に示す画像圧縮装置500を実現するものであり、差分符号化部610、ヒストグラム解析部615、オフセット部620、プレーン分割部630、Lプレーン圧縮部640、Hプレーン圧縮部650は、CPU111で実行されることにより、そのホストコントローラ100を、図3に示す画像圧縮装置500を構成する、それぞれ、差分符号化部510、ヒストグラム解析部515、オフセット部520、プレーン分割部530、Lプレーン圧縮部540、Hプレーン圧縮部550として動作させるプログラム部品である。つまり、これらのプログラム部品により、画像圧縮装置500の構成要素がホストコントローラ100上に実質的に構築されることとなる。
【0056】
図5の画像圧縮プログラム600を構成する各部610〜650の、CPU111で実行されたときの作用は、それぞれ、図3の画像圧縮装置500を構成する各部510〜550の作用そのものである。したがって、図3の画像圧縮装置500の各部510〜550に関する、これまでの説明、および、以下に説明する詳細説明をもって、図5の画像圧縮プログラム600を構成する各部610〜650の説明を兼ねるものとする。
【0057】
図6は、図3のデータ圧縮装置500に入力される入力画像ファイル中の画像データの構造を示す図、図7は、このデータに対して2次元差分符号化処理が施された後のデータの構造を示す図である。
【0058】
入力画像ファイル中の画像データで表される画像は、所定の主走査方向に画素がM個並んでなるラインが、その主走査方向とは直角な副走査方向にNライン並ぶことによって構成されており、このような構成を反映してその画像データも、図6に示すように、主走査方向(図の左右方向)に画素値がM個並んでなるラインが、副走査方向(図の上下方向)にNライン並んでいるという構造を備えている。この図では、上からn番目のライン中の、左からm番目の画素値はPn,mと表記されており、この表記法を用いて、副走査方向にn番目のラインについては、主走査方向に並ぶ各画素の画素値が、その並び順に、
n,1,Pn,2,…,Pn,m−1,Pn,m,…,Pn,M−2,Pn,M−,Pn,M
と表されている。これらの画素値は、16進表示で表された数値である。
【0059】
ここで、図3に示すデータ圧縮装置500を構成する差分符号化部510には、上記のような画像データが入力されて2次元差分符号化処理が施され、主走査方向に隣接する画素どうしの差分における副走査方向での更なる差分が求められる。
【0060】
図7には、2次元差分符号化処理が施されたデータの構造が示されており、このデータも、2次元差分符号化後の画素値が主走査方向にM個並んでなるラインが、副走査方向にNライン並んでいるという構造を備えている。この図では、上からn番目のライン中の、左からm番目の、2次元差分符号化後の画素値は、Xn,mと表記されており、この2次元差分符号化後の画素値Xn,mは、図6の中央部に示す、2次元差分符号化前の4つの画素値{Pn−1,m−1,Pn−1,m,Pn,m−1,Pn,m}から、下記の変換式によって得られる。
n,m=(Pn,m−Pn,m−1)−(Pn−1,m−Pn−1,m−1) …(1)
ここで、n=1の場合やm=1の場合には、右辺の2次元差分符号化前の画素値の添え字に0が現れることとなるが、添え字が0となる画素値については、下記のように定義する。
0,0=P0,m=00 (m=1〜M), Pn,0=Pn−1,M (n=1〜N)…(2) ここで、式(2)の「00」は、画素値を16進表示で表したときに値がゼロであることを表している。以下、式(1)および式(2)の意味について簡単に説明する。
【0061】
式(1)は、主走査方向に隣接する画素どうしの差分(すなわち、カッコの中の値)における副走査方向での更なる差分によって2次元差分符号化後の画素値Xn,mが得られることを表しており、2次元差分符号化前の画素値Pn,mが隣接する画素の画素値と相関が強い(すなわち同じような大きさの画素値である)場合には、2次元差分符号化後の画素値Xn,mは、ゼロに近い値となる。
【0062】
式(2)は、副走査方向の仮想的な0番目のラインと、各ラインの左から0番目の仮想的な画素値とを新たに設けたときの各画素値の定義を表す式である。主走査方向については左端の画素値(左から0番目の画素値Pn,0)とそのラインより1ライン前のラインの右端の画素値Pn−1,Mとを同一視するという定義となっている。また、副走査方向については、図の一番上側の画素値(0番目のライン上の画素値)、すなわち、P0,0やP0,mが全て0に固定された定義となっている。
【0063】
2次元差分符号化後のデータにおいて、1ライン目の画素値、および各ラインの1番目の画素値については、式(1)の変換式の右辺に、添え字が「0」である項が現れるため、式(2)の定義が適用されることとなる。具体的には上記の式(1)および式(2)により、2次元差分符号化後の1ライン目の画素値は、
1,1=P1,1
1,2=P1,2−P1,1
1,3=P1,3−P1,2
…………
1,M=P1,M−P1,M−1
のように表される。
【0064】
一方、2次元差分符号化後のデータにおいて、各ラインの1番目の画素値については、上記の式(2)により、
1,1=P1,1
2,1=(P2,1−P1,M)−P1,1
3,1=(P3,1−P2,M)−(P2,1−P1,M),
…………
N,1=(PN,1−PN−1,M)−(PN−1,1−PN−2,M
のように表される。このように、1ライン目の画素値、および各ラインの1番目の画素値については、その変換の仕方がやや特殊であるが、これらの画素値以外の画素値については、式(2)の定義が適用されることなく、式(1)がそのまま適用される。例えば、2ライン目の画素値のうち一番左端を除いた画素値は、
2,2=(P2,2−P2,1)−(P1,2−P1,1),
2,3=(P2,3−P2,2)−(P1,3−P1,2),
…………
2,M=(P2,M−P2,M−1)−(P1,M−P1,M−1
のように表される。
【0065】
この2次元差分符号化処理を、具体的な数値を用いて説明する。
【0066】
図8は、図3のデータ圧縮装置500を構成する差分符号化部510における2次元差分符号化処理を例示して示す図である。
【0067】
この図の左側(パート(A))に示す各数値が画像データを構成する画素値であり、この図の右側(パート(B))に示す各数値が2次元差分符号化処理で出力される出力値である。この図の横方向が主走査方向であり、主走査方向に並んだ8つの数値の並びが上記のラインである。この図に示すデータにはこうした8つの数値が並んだラインが全部で8本あり、図6および図7のデータにおいてN=8,M=8の場合のデータに相当する。
【0068】
図8のパート(A)に示すデータの2次元差分符号化処理では、先ず、1ライン目の各画素値「90 8A 8A 7B …」のうち、一番左の「90」については、この値がそのまま上記のX1,1として出力され、それ以外のX1,2,X1,3,…については、主走査方向に隣接する画素値どうしの差分の値「8A−90=FA」「8A−8A=00」…が出力される。ここで、「8A」から「90」を引き算した結果は実際には負の数となり、9ビットで「1FA」と表されるが、MSBの1ビットである最上位の「1」は省略し、下位8ビットである「FA」のみを出力する。
【0069】
2ライン目については、X2,1を求める式、
2,1=(P2,1−P1,M)−P1,1
において、M=8としたときの右辺の{P2,1,P1,8,P1,1}に対し、図8のパート(A)に示す数値が代入されて、「(87−58)−90=9F」がX2,1として出力される。それ以外のX2,2,X2,3,…については、2ライン目についての主走査方向に隣接する画素値どうしの差分と、1ライン目についての主走査方向に隣接する画素値どうしの差分とのさらなる差分の値「(84−87)−(8A−90)=3」「(88−84)−(8A−8A)=04」…が出力される。
【0070】
3ライン目については、X3,1を求める式、
3,1=(P3,1−P2,M)−(P2,1−P1,M
において、M=8としたときの右辺の{P3,1,P2,8,P2,1,P1,8}に、図8のパート(A)に示す数値が代入されて、「(8B−4C)−(87−58)=10」がX3,1として出力される。それ以外のX3,2,X3,3,…については、3ライン目についての主走査方向に隣接する画素値どうしの差分と、2ライン目についての主走査方向に隣接する画素値どうしの差分とのさらなる差分の値「(86−8B)−(84−87)=FE」「(8A−86)−(88−84)=00」…が出力される。
【0071】
以下、4ライン目以降についても、3ライン目の演算と同じ演算を繰り返すことにより、図8のパート(B)に示す各数値が得られることとなる。
【0072】
図1に示すインターフェース機器200では、このように2次元差分符号化されたデータに対してデータの復号化処理が行われる。この復号化処理では、2次元差分符号化されたデータの値からPn,mを求める式が使用されており、この式は以下のようにして求めることができる。
【0073】
2次元差分符号化後の画素値Xi,jを、i=1からi=mまで足し上げ、さらにj=1からj=mについて足し上げた結果は、式(1)および式(2)を用いて下記の式(3)のように表される。
【0074】
【数1】


【0075】
ここで、式の途中に現れる{P0,0,Pn,0,P0,m}に対して、式(2)が適用されている。この式から、2次元差分符号化前の画素値Pn,mは、下記の式(4)のように表される。
【0076】
【数2】


【0077】
図1に示すインターフェース機器200では、上記の式(4)により、先ず、1ライン目の画素値P1,1,P1,2,…,P1,Mが求められる。例えば、1ライン目の画素値のうち主走査方向にm番目の画素値は、上記の式(4)にn=1を代入し、さらに式(2)のP0,M=0を利用して、下記の式(5)のように表される。
【0078】
【数3】


【0079】
このようにして、1ライン目の画素値、P1,1,P1,2,…,P1,Mがすべて求められる。
【0080】
2ライン目の画素値P2,1,P2,1,…,P2,Mについては、同様に上記の式(4)にn=2を代入し、さらに1ライン目の画素値の複合化で得られたP1,Mを用いることで求めることができる。例えば、2ライン目の画素値のうち主走査方向にm番目の画素値は、下記の式(6)のように表される。
【0081】
【数4】


【0082】
3ライン目以降の画素値についても同様にして、上記の式(6)やそれ以降の計算で複合化された画素値を用いて求めることができる。図1に示すインターフェース機器200では、このような方式でデータの復号化処理が行われる。
【0083】
図3の差分符号化部510では、以上説明したような2次元差分符号化が画像データに施される。この2次元差分符号化によって得られるデータは、図3のオフセット部520に入力され、そのデータの各数値について所定のオフセット値が加算され、データが下位サブプレーンD1Lと上位サブプレーンD1Hとに分割される。ここでは、データの分割までの処理についてCTの画像データを例に用いて具体的に説明する。データの分割までの処理については、LWの画像データも同様な処理が施される。
【0084】
図9は、CTの画像データの例を示す図である。
【0085】
この図9のパート(A)には、CTの画像データが表しているCT画像の一例としてモノクロの風景画像が示されており、本実施形態では、このようなCT画像の各画素における色の濃度が8ビットの数値で表現された画像データが用いられる。図9のパート(B)には、パート(A)に示す風景画像を表す画像データにおけるデータ値のヒストグラムが示されており、このヒストグラムの横軸はデータ値、縦軸はデータ数(画素数)を表している。CT画像では一般に、ヒストグラムの幅が広く、ヒストグラム中でデータ数の山谷は生じてもヒストグラムの途中にデータ数が「0」の領域が生じることは極めてまれである。
【0086】
図10は、CTの画像データに対する差分符号化およびオフセットの効果を示す図である。
【0087】
この図10のパート(A)には、図9に示したCTの画像データに対して差分符号化が施されて得られるデータのヒストグラムが示されており、このヒストグラムの横軸はデータ値、縦軸は出現頻度を表している。CTの画像データに対して、図6および図8で説明した差分符号化が施されると、データのヒストグラムは、一般に、この図10のパート(A)に示すような、最小データ値と最大データ値の双方に鋭いピークを有するヒストグラムとなる。そして、このようなデータに対してオフセットが施されると、データのヒストグラムは、図10のパート(B)に示すような、オフセット値のところに鋭いピークを持つヒストグラムとなる。本実施形態ではオフセット値として「8」が用いられており、オフセットの結果、値が「16」以上となるデータの頻度はほとんど「0」となっている。
【0088】
このように差分符号化およびオフセットによってヒストグラムが変形されたデータは、図3のプレーン分割部530によって下位サブプレーンD1Lと上位サブプレーンD1Hとに分割される。
【0089】
図11は、プレーン分割部530によるデータ分割の効果を説明する図である。
【0090】
この図11には、図10のパート(B)に示すヒストグラムがデータ値「15」とデータ値「16」との間で切り離されたヒストグラムが示されており、図3のプレーン分割部530によるデータ分割は、まさにこのようなヒストグラムの分割に相当する効果を生じる。すなわち、本実施形態では、データを構成している8ビットの各数値が上位4ビットと下位4ビットとに分割されることで、下位4ビットが表す数値の連続からなる下位サブプレーンD1Lと上位4ビットが表す数値の連続からなる上位サブプレーンD1Hとが得られる。そして、下位サブプレーンD1Lを構成する4ビットの数値が値「0」から値「15」までの各数値をそのまま表現していて、上位サブプレーンD1Hを構成する4ビットの数値の場合は、値「16」から値「256」までの、16間隔16種類の数値を表現していると解釈すると、下位サブプレーンD1Lのヒストグラムは、この図11の左側に示されたヒストグラムとほぼ同じものとなり、上位サブプレーンD1Hのヒストグラムは、図11の右側に示されたヒストグラムとほぼ同じものとなる。ただし、上位サブプレーンD1Hのヒストグラムについては、図11の右側に示されたヒストグラムのデータ値「16」のところに、図11の左側に示されたヒストグラムの面積に等しい高さのピークが付加されたものとなる。
【0091】
以下では、上位サブプレーンD1Hと下位サブプレーンD1Lとに分割された後のデータの処理について説明する。上述したように、LWの画像データとCTの画像データとで処理が異なるのは、下位サブプレーンD1Lの処理のみであり、上位サブプレーンD1Hについては、LWの画像データとCTの画像データとで同じ処理が施される。
【0092】
まず、上位サブプレーンD1Hに対する処理について説明する。
【0093】
図11の右側に示されたヒストグラムにおいて画素の出現頻度がほとんどゼロに近いことからわかるように、上位サブプレーンD1H中の数値は、ゼロに近い値(16進数表示での「00」や「01」や「FF」)の連続が多いことが予想される。このため、上位サブプレーンD1Hに圧縮を施すには、同一の数値の連続を符号化することで圧縮を行うランレングス符号化が有効であり、上位サブプレーンD1Hは、図3に示すHプレーン圧縮部550の構成要素の1つであるランレングス符号化部551に入力される。
【0094】
本実施形態では、処理の都合上、ランレングス符号化部551で、上位サブプレーンD1Hを構成する連続した4ビットの数値が2つで1つの8ビットの数値として取り扱われ、16進数表示で値「00」から値「FF」までの数値の連続に対して以下の符号化処理が適用される。
【0095】
この符号化処理では、複数の8ビットの数値のうちの特定の数値についてのみ符号化処理が行なわれる。このため、このランレングス符号化部551では、受け取ったデータの中から、符号化処理を行なう数値(ここでは、この数値を「圧縮対象数値」と称する)と、その圧縮対象数値の連続数が検出される。
【0096】
本実施形態では、一例として、「01」、「FF」および「00」の3つの数値を圧縮対象数値としている。
【0097】
図12は、図3に示すランレングス符号化部551での符号化の説明図である。
【0098】
図12の上のラインは、上位サブプレーンD1Hを構成するデータ、下のラインは、ランレングス符号化部551での符号化処理を行なった後のデータである。
【0099】
ここでは、図12の上のラインに示すように、ランレングス符号化部551からは、
「06 02 02 02 01 01 01 01 04 05 00 … 」
なるデータが入力されたものとする。このとき、図3のランレングス符号化部551では、先頭の「06」は圧縮対象数値ではなく、次に続く「02 02 02」も圧縮対象数値ではなく、次に、圧縮対象数値である「01」が4つ連続していること、次に、圧縮対象数値ではない「04」、「05」を間に置いて、圧縮対象数値である「00」が32767個連続していることが検出される。
【0100】
図13は、ランレングス符号化部における、圧縮対象数値を対象にした符号化のアルゴリズムを示す図である。
【0101】
この図13中、Zは同一の圧縮対象数値の連続数、例えば図12の上のラインの「01」についてはZ=4、「00」についてはZ=32767である。
【0102】
また、図13中、「YY」は、16進2桁で表わされた圧縮対象数値自体を表わしている。その「YY」に続く、「0」又は「1」は1ビットで表現された「0」又は「1」であり、さらにそれに続く「XXX XXXX…」は、1つの「X」が1ビットを表わしており、この「XXX XXXX…」でZの値を表現している。
【0103】
すなわち、図13は、圧縮対象数値「YY」がZ<128連続するときは、1バイト目で圧縮対象数値「YY」を表現し、それに続く1バイトで、先頭ビットが「0」、それに続く7ビットでZの値を表現すること、また、圧縮対象数値「YY」がZ≧128連続するときは、1バイト目で圧縮対象数値「YY」を表現し、それに続く2バイト(16ビット)のうちの先頭の1ビットを「1」とすることで2バイトに跨って表現されていることを表現し、それに続く15ビットで、Zの値を表現することを意味している。
【0104】
この図13に示す規則に従って図12に示す符号化の例について説明する。
【0105】
図3のプレーン分割部530から入力されてきた上位サブプレーンD1Hのデータ(上のライン)を構成する先頭の数値「06」は圧縮対象数値ではないため、その「06」のまま出力される。また、それに続く「02 02 02」も、「02」は圧縮対象数値ではなく、これら3つの「02」もそのまま出力される。次に、圧縮対象数値である「01」が4個連続するため、「01 04」に符号化される。次の「04」及び「05」は圧縮対象数値ではないため、そのまま「04 05」が出力される。
【0106】
次に「00」が32767個連続しているため、「00」を置き、次の1バイトのうちの先頭の1ビットを「1」とし、次いで15ビットで32767−128を表現することにより、「00 FF 7F」の3バイトで「00」が32767個連続していることを表現する。すなわち、連続数128は、最初のビット「1」を除き、「00 00」と表現される。
【0107】
図14は、図3のランレングス符号化部551における、連続数に応じた符号化処理の例を示す図である。
・「00」が127個連続するときは、2バイトを用いて「00 7F」に符号化され、
・「00」が32767個連続するときは、3バイトを用いて「00 FF 7E」に符号化され、
・「00」が32895個連続するときは、3バイトを用いて「00 FF FF」に符号化され、
・ 「00」が128個連続するときは、3バイトを用いて「00 80 00」に符号化され、
・ 「01」が129個連続するときは、3バイトを用いて「01 81 00」に符号化され、
・「FF」が4096個連続するときは、3バイトを用いて「FF 8F 80」に符号化される。
【0108】
図3に示すランレングス符号化部551では、上記のような符号化処理が行なわれる。
【0109】
本実施形態によるランレングス符号化部551によれば、最大圧縮率は、3/32895=1/10,965にまで向上する。また、このランレングス符号化部551が符号化処理の対象としている上位サブプレーンD1Hのデータは、図11のヒストグラムで説明したように、4ビットの数値のほとんどが、データ値「16」を表現した数値「0」であり、その4ビットの数値から作られる8ビットの数値も、多くが、16進数表示で数値「00」となる。このためランレングス符号化部551における符号化処理によって大幅なデータ圧縮が期待される。
【0110】
図3のランレングス符号化部551で上記の符号化処理の行なわれた後のデータは、次に図3のHプレーン圧縮部550を構成するデータスキャニング部552とハフマン符号化部553に入力される。
【0111】
このデータスキャニング部552では、先ず、ランレングス符号化部551から出力されたデータの全体がスキャニングされてデータ値の出現頻度が求められる。
【0112】
図15は、データスキャニング部552によるスキャニング結果の例を示す図である。
【0113】
ここでは、「A1」の出現頻度が最も強く、以下順に、「A2」、「A3」、「A4」、…の順であるとする。尚、これら「A1」、「A2」等は数値を直接表わしている訳ではなく、数値を表わす符号である。すなわち、「A1」は例えば数値「00」、「A2」は数値「FF」等である。また、ここでは、簡単のため、図3のランレングス符号化部551から送られてくるデータは全てのデータ値が「A1」〜「A16」の16個の数値のうちのいずれかの数値であるものとする。そして、このような16個の数値それぞれに対して、データスキャニング部552では、出現頻度に応じた符号が割り当てられてハフマンテーブルが作成される。即ち、出現頻度の最も高い「A1」には、2ビットで表わされた符号「00」が割り当てられ、次の「A2」には、やはり2ビットで表わされた符号「01」が割り当てられ、次の「A3」、さらに次の「A4」には、3ビットで表わされる、それぞれ、符号「100」、符号「101」が割り当てられ、次の「A5」〜「A8」には、5ビットで表わされる各符号が割り当てられ、以下同様に、出現頻度が低い数値ほど多くのビット数で表わされた符号が割り当てられる。
【0114】
図16は、ハフマンテーブルの一例を示す図である。
【0115】
このハフマンテーブルは、図15と一致させてあり、出現頻度が高い数値ほど短かいビット数で表わされた符号に置き換えられるように並べられた、符号化前(置き換え前)の数値と符号化後(置き換え後)の数値との対応テーブルである。
【0116】
図3のHプレーン圧縮部550を構成するハフマン符号化部553では、このようなハフマンテーブルに従ってデータの数値が符号化され、その結果、多くの数値が短かいビット数の符号に置き換えられることとなってデータ圧縮が実現される。
【0117】
図17は、ハフマンテーブルに用意される符号列の具体例を示す図である。
【0118】
図17に示す符号列では、各符号列中の「,」よりも右側の数値がビット長を意味しており、その「,」から左側に並ぶそのビット長分の2進符号が実際の符号を表わしている。例えば、図17の左上の第1番目の符号は「11」の2ビット、次の2番目の符号は「011」の3ビット、その次の3番目の符号は「010」の3ビット、さらにその次の4番目の符号は「1010」の4ビットである。このような符号列により、出現頻度が高い数値ほど短かいビット数で表わされた符号に置き換えられる。
【0119】
以上の図12〜図17で説明した処理により、図3のHプレーン圧縮部550に入力される上位サブプレーンD1Hについては、ランレングス符号化部551による符号化とハフマン符号化部553による符号化が施されることにより高い圧縮率で圧縮されて上位圧縮データD2Hとなる。
【0120】
次に、下位サブプレーンD1Lに対する処理について説明する。プレーン分割部530で分割された下位サブプレーンD1Lは、ヒストグラム解析部515に入力されてデータのヒストグラム解析が行われる。このヒストグラム解析により、入力画像ファイルD0中のデータがCTデータであるか、あるいはLWデータであるかが判定される。本実施形態では、処理の都合上、ヒストグラム解析部515において、下位サブプレーンD1Lを構成する連続した4ビットの数値が2つで1つの8ビットの数値として取り扱われる。
【0121】
図18は、8ビットの数値となった下位サブプレーンD1Lを構成する画素データのヒストグラムの一例を表した図である。
【0122】
このヒストグラムの横軸は10進数表示で表記したデータ値を表しており、縦軸は出現頻度を表している。この図に示すように、データ値は136付近に集中しており、データ値が136のところで出現頻度が最大の第1ピーク17aが現れている。データ値が137での出現頻度や、データ値が135での出現頻度も高く、それぞれ第2ピーク17b、第3ピーク17bを形成している。本実施形態では、ヒストグラム解析部515は、第1ピーク17aの高さ(出現頻度)をAとし、第2ピーク17b、第3ピーク17bの高さをそれぞれB,Cとしたときに、下記の判定方法により、入力画像ファイルD0中のデータがCTデータであるか、あるいはLWデータであるかの判定を行う。
(B+C)> k×A …… CTデータと判定
(B+C)≦ k×A …… LWデータと判定
ここで、上式のkは、0.2程度の定数である。
【0123】
一般に、2次元差分符号化後のLWデータは、CTデータに比べてデータ値の集中度が高く、特定のデータ値で高いピークを持つ傾向が強い。そうした傾向は、図11に示されているように、そのままデータの分割後の下位サブプレーンD1Lに現れる。そこで、2次元差分符号化後の画像データが下位サブプレーンD1Lと上位サブプレーンD1Hとに分割された後に、下位サブプレーンD1Lについて、データ値の集中度を評価することを通じて、画像データがLWデータであるか、あるいはCTデータであるかを判定することが可能となる。データ値の集中度を評価する方法としては従来より様々な方法が知られており、上記のヒストグラム解析部515による判定方法はそのような様々な方法の一例である。この判定方法では、第1ピーク17aの高さAが、すぐ隣のピークの高さ(BやC)に比べて充分高いかどうかを調べることによりデータ値の集中度が評価されており、この評価により画像データがCTデータであるか、LWデータであるかの判定が行われる。この判定方法において上記の定数kは、実験を通じて(あるいは経験的に)決定される定数である。
【0124】
ヒストグラム解析部515による判定後、下位サブプレーンD1Lは、Lプレーン圧縮部540中の処理分岐部544に入力される。画像データがLWデータの場合、データ値の集中度が高いため、特定の値(図18では136のデータ値)の連続が多い。このため、LWデータの下位サブプレーンD1Lに圧縮を施すには、同一の数値の連続を符号化することで圧縮を行うランレングス符号化が有効である。そこで、処理分岐部544は、ヒストグラム解析部515において画像データがLWデータであると判定された場合には、入力された下位サブプレーンD1Lをランレングス符号化部545に向けて出力し、ランレングス符号化部545において図12〜図14で説明したランレングス符号化処理が行われる。ランレングス符号化処理後の下位サブプレーンD1Lは、ハフマン符号化部541において、図15〜図17で説明したハフマン符号化処理が行われる。
【0125】
一方、ヒストグラム解析部515において画像データがCTデータであると判定された場合には、処理分岐部544は、入力された下位サブプレーンD1Lをハフマン符号化部541に向けて出力し、このCTデータの下位サブプレーンD1Lに対しては、ランレングス符号化処理が施されることなく、ハフマン符号化処理が直接行われる。
【0126】
LWデータおよびCTデータのいずれの場合も、ハフマン符号化後の下位サブプレーンD1Lは、下位圧縮データD2LとしてLプレーン圧縮部540から出力される。
【0127】
なお、上述したように、ユーザから、高速モードが指示された場合には、LWデータおよびCTデータのいずれのデータに対しても上記のハフマン符号化部541によるハフマン符号化処理は省略されて、Lプレーン圧縮部540から出力されることになる。
【0128】
以上が、本実施形態の説明である。
【0129】
本実施形態では、8ビットの数値の連続からなる画像データを可逆圧縮するものであるが、本発明は、圧縮対象となるデータは、複数のビット数の数値で表された数値の連続からなるデータであれば、処理対象は、8ビットの数値の連続からなるデータに限定されない。例えば、データ中の数値のビット数(ビット幅)が8ビットではなく、12ビットや16ビットのデータであってもよい。
【図面の簡単な説明】
【0130】
【図1】データ圧縮技術が適用されたプリントシステムの一例を示す図である。
【図2】プリントシステムにおけるデータ処理の流れを示す図である。
【図3】本発明のデータ圧縮装置の一実施形態に相当する画像圧縮装置を示すブロック構成図である。
【図4】図1に示すホストコントローラのハードウェア構成図である。
【図5】本発明のデータ圧縮プログラムの一実施形態に相当する画像圧縮処理プログラムの模式構成図である。
【図6】図3のデータ圧縮装置に入力される入力画像ファイル中の画像データの構造が示す図である。
【図7】図3のデータ圧縮装置500に入力される入力画像ファイル中の画像データに対して2次元差分符号化処理が施された後のデータの構造を示す図である。
【図8】図3のデータ圧縮装置を構成する差分符号化部における2次元差分符号化処理を例示して示す図である。
【図9】CTの画像データの例を示す図である。
【図10】CTの画像データに対する2次元差分符号化およびオフセットの効果を示す図である。
【図11】プレーン分割部によるデータ分割の効果を説明する図である。
【図12】図3に示すランレングス符号化部での符号化の説明図である。
【図13】ランレングス符号化部における、圧縮対象数値を対象にした符号化のアルゴリズムを示す図である。
【図14】図3のランレングス符号化部における、連続数に応じた符号化処理の例を示す図である。
【図15】データスキャニング部によるスキャニング結果の例を示す図である。
【図16】ハフマンテーブルの一例を示す図である。
【図17】ハフマンテーブルに用意される符号列の具体例を示す図である。
【図18】8ビットの数値となった下位サブプレーンを構成する画素データのヒストグラムの一例を表した図である。
【符号の説明】
【0131】
11 画像のデータ
12A,12B,13A,13B ビットマップデータ
14,15 圧縮データ
100 ホストコントローラ
140 CDROM
150 汎用インターフェースケーブル
200 インターフェース機器
250 専用インターフェースケーブル
300 プリンタ
500 画像圧縮装置
510 差分符号化部
515 ヒストグラム解析部
520 オフセット部
530 プレーン分割部
540 Lプレーン圧縮部
541 ハフマン符号化部
542 モード切換部
544 処理分岐部
545 ランレングス符号化部
550 Hプレーン圧縮部
551 ランレングス符号化部
552 データスキャニング部
553 ハフマン符号化部
600 画像圧縮プログラム
610 差分符号化部
615 ヒストグラム解析部
620 オフセット部
630 プレーン分割部
640 Lプレーン圧縮部
650 Hプレーン圧縮部
【出願人】 【識別番号】306037311
【氏名又は名称】富士フイルム株式会社
【出願日】 平成18年7月5日(2006.7.5)
【代理人】 【識別番号】100094330
【弁理士】
【氏名又は名称】山田 正紀

【識別番号】100079175
【弁理士】
【氏名又は名称】小杉 佳男

【識別番号】100109689
【弁理士】
【氏名又は名称】三上 結


【公開番号】 特開2008−17115(P2008−17115A)
【公開日】 平成20年1月24日(2008.1.24)
【出願番号】 特願2006−185579(P2006−185579)