トップ :: H 電気 :: H04 電気通信技術




【発明の名称】 画像符号化装置
【発明者】 【氏名】中山 啓満

【氏名】小川 貴也

【氏名】渡辺 究

【氏名】鈴村 竜広

【氏名】竹川 智

【氏名】繁田 良則

【氏名】大上 晃弘

【氏名】道中 秀治

【要約】 【課題】少ない処理量で、最適な予測モードを決定する。

【構成】入力される2値シンボル列中の各2値シンボルに対する発生確率に基づく値を符号量の情報として出力する符号量情報出力手段(65〜67)と、前記符号量情報出力手段からの情報によって与えられる符号量を加算して、前記2値シンボル列を算術符号化した場合の発生符号量の推定値を出力する符号量累積加算手段64と、を有する発生符号量推定部54を具備したことを特徴とする。
【特許請求の範囲】
【請求項1】
入力される2値シンボル列中の各2値シンボルに対する発生確率に基づく値を符号量の情報として出力する符号量情報出力手段と、
前記符号量情報出力手段からの情報によって与えられる符号量を加算して、前記2値シンボル列を算術符号化した場合の発生符号量の推定値を出力する符号量累積加算手段と、を有する発生符号量推定部
を具備したことを特徴とする画像符号化装置。
【請求項2】
入力画像信号を予測符号化する予測符号化手段と、
前記予測符号化手段の出力を算術符号化して出力する算術符号化手段と、
予測符号化における複数の予測モード毎に予測信号を生成する予測信号生成手段と、
前記予測信号を用いて、前記予測符号化手段と同様の予測符号化処理によって、前記入力画像信号を予測符号化する仮予測符号化手段と、
前記仮予測符号化手段の出力を2値化して2値シンボル列を出力する2値化手段と、
前記2値化手段からの2値シンボル列中の各2値シンボルに対する発生確率に基づく値を符号量の情報として出力する符号量情報出力手段と、前記符号量情報出力手段からの情報によって与えられる符号量を加算して、前記2値シンボル列を算術符号化した場合の発生符号量の推定値を出力する符号量累積加算手段と、を有する発生符号量推定部と、
前記発生符号量推定部が推定した発生符号量に基づいて最適な予測モードを決定して、最適な予測モードにおける予測信号を前記予測符号化手段に与えて予測符号化させる予測モード決定手段と
を具備したことを特徴とする画像符号化装置。
【請求項3】
前記予測モード決定手段は、前記発生符号量推定部が推定した発生符号量及び前記仮予測符号化手段による符号歪みから求めた符号化コストに基づいて最適な予測モードを決定することを特徴とする請求項2に記載の画像符号化装置。
【請求項4】
前記符号量情報出力手段は、前記各2値シンボルに対する発生確率の対数値を符号量の情報として出力することを特徴とする請求項1又は2のいずれか一方に記載の画像符号化装置。
【請求項5】
前記符号量情報出力手段は、
前記各2値シンボルに対する発生確率に応じた対数値を保持する符号量テーブルと、
前記2値シンボル列に対応して前記符号量テーブルの読出しを制御するためのコンテキスト情報を保持するコンテキストテーブルとを具備し、
前記符号量累積加算手段は、前記2値シンボル列に応じて前記コンテキスト情報を更新することを特徴とする請求項3に記載の画像符号化装置。
【発明の詳細な説明】【技術分野】
【0001】
本発明は、予測符号化及び算術符号化を採用した画像符号化装置に関する。
【背景技術】
【0002】
近年、画像処理のディジタル化が普及している。ディジタル化された画像データは、符号量を削減するために、H.264、AVC規格等の動画像符号化方法を採用して符号化後に伝送や記録が行われることが多い。
【0003】
H.264規格等においては、複数の予測モードで複数のブロック形状の予測符号化を採用しており、画像ブロック単位に多数の予測モードの中から最適なモードを選択して、予測符号化を行う。最適な予測モードは、画像ブロックの性質毎に相違し、適切なモードを選択することで、符号化効率を向上させることができる。
【0004】
複数の予測モードから最適なモードを選択する手法として、ラグランジュの未定乗数法に基づくレート−歪み最適化手法が知られている。このレート−歪み最適化手法では、各予測モードで符号化した際の符号化歪みD(現画像と再生画像の2乗誤差)と発生符号量とから、符号化コストを算出する。画像符号化における符号化効率は、いかに少ない符号量で、いかに画質劣化の少ない符号化ができるかということを意味している。つまり符号化コストが小さいほど符号化効率が高くなる。従って、与えられた量子化パラメータに対して、符号化コストが最小となる予測モードを画像ブロック毎に選択することで、符号化効率を最大にすることができる。
【0005】
ところで、H.264では、圧縮率が高いエントロピー符号化方式としてCABACと呼ばれる符号化方式が採用されている。CABAC符号化は、2値シンボル1ビット毎に複雑な処理が必要であり、また、符号化は1ビットずつ順番に行う必要があり並列化が困難である。
【0006】
レート−歪最適化手法では、画像ブロック毎に取り得る全ての予測モードで符号化(仮符号化)及び復号化(仮復号化)を行って符号化コストを算出する必要がある。ところが、CABAC仮符号化及び仮復号化における処理量は極めて大きく、発生符号量の計測に膨大な処理時間が必要となる。
【0007】
そこで、従来、CABAC仮符号化における発生符号量計測の演算量を削減する手法が提案されている。例えば、非特許文献1においては、仮符号化時には算術符号化は行わずに、2値シンボルのシンボル長の総和から算術符号化の発生符号量を推定する方法が提案されている。この手法では、2値シンボル長の仮符号化時に算術符号化を行わないため、大幅な演算量の削減が可能である。
【0008】
しかしながら、非特許文献1の方法では、実際の算術符号化の発生符号量は2値シンボルの発生確率とそのシンボル値で決まるため、2値シンボル長からの推定では画像によっては誤差が大きくなり、符号化効率に悪影響を与える場合がある。
【0009】
なお、特許文献1においては、画像特徴量(2値シンボル)の発生確率から、目標符号量を算出して、量子化ステップサイズを調整する装置が開示されている。
【特許文献1】特開2002−27459号公報
【非特許文献1】浅野 渉,他「CABAC圧縮率推定を用いたH.264におけるレート−歪み最適化モード判定の高速化」.第3回情報科学技術フォーラム(FIT2004)講演論文集.京都,2004−09,(社)電子情報通信学会.東京,2004,p.233−234
【発明の開示】
【発明が解決しようとする課題】
【0010】
本発明は、比較的少ない処理量で最適な予測モードを高精度に検出して高効率の符号化を行うことができる画像符号化装置を提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明の一態様に係る画像符号化装置は、入力される2値シンボル列中の各2値シンボルに対する発生確率に基づく値を符号量の情報として出力する符号量情報出力手段と、前記符号量情報出力手段からの情報によって与えられる符号量を加算して、前記2値シンボル列を算術符号化した場合の発生符号量の推定値を出力する符号量累積加算手段と、を有する発生符号量推定部を具備したことを特徴とするものであり、
本発明の他の態様に係る画像符号化装置は、入力画像信号を予測符号化する予測符号化手段と、前記予測符号化手段の出力を算術符号化して出力する算術符号化手段と、予測符号化における複数の予測モード毎に予測信号を生成する予測信号生成手段と、前記予測信号を用いて、前記予測符号化手段と同様の予測符号化処理によって、前記入力画像信号を予測符号化する仮予測符号化手段と、前記仮予測符号化手段の出力を2値化して2値シンボル列を出力する2値化手段と、前記2値化手段からの2値シンボル列中の各2値シンボルに対する発生確率に基づく値を符号量の情報として出力する符号量情報出力手段と、前記符号量情報出力手段からの情報によって与えられる符号量を加算して、前記2値シンボル列を算術符号化した場合の発生符号量の推定値を出力する符号量累積加算手段と、を有する発生符号量推定部と、前記発生符号量推定部が推定した発生符号量に基づいて最適な予測モードを決定して、最適な予測モードにおける予測信号を前記予測符号化手段に与えて予測符号化させる予測モード決定手段とを具備したことを特徴とする。
【発明の効果】
【0012】
本発明によれば、比較的少ない処理量で最適な予測モードを高精度に検出して高効率の符号化を行うことができるという効果を有する。
【発明を実施するための最良の形態】
【0013】
以下、図面を参照して本発明の実施の形態について詳細に説明する。
【0014】
<第1の実施の形態>
図1は本発明の第1の実施の形態に係る画像符号化装置を示すブロック図である。
【0015】
本実施の形態は、推定した発生符号量と符号化歪みとに基づいてレート−歪み最適化モードの判定を行い、判定結果に基づく予測モードで動画像の符号化を行うものである。
【0016】
符号化部11には画像信号が入力される。この画像信号は符号化部11の減算器12及び予測信号生成部23に供給される。減算器12は、後述するMB予測モード選択部24から予測信号が与えられており、入力された画像信号と予測信号との差分値(予測誤差)を出力する。なお、予測誤差は、予測モードに応じたサイズのブロック単位で求められる。
【0017】
減算器12からの予測誤差は、直交変換部13に与えられる。直交変換部13は、入力された予測誤差を直交変換して、ブロック単位で空間周波数成分に変換する。これにより空間的な相関成分が削減可能となる。直交変換部13からの変換係数は量子化部14に与えられる。量子化部14は、入力された変換係数を量子化することにより、ブロックの信号の冗長度を削減して出力する。
【0018】
量子化部14からの量子化出力は、CABAC符号化部15に供給される。CABAC符号化部15は、2値化部16及び算術符号化部17によって構成されている。2値化部16は、量子化出力であるシンタックス要素が入力されると共に、MB予測モード選択部24から予測モード情報も入力され、シンタックス要素を可変長の2値のシンボル列に変換する。算術符号化部17は、2値化部16からの2値シンボル列を、シンボルの発生確率に応じて算術符号化する。こうして、CABAC符号化部15は、符号量を一層削減した符号化出力を出力バッファ18に出力するようになっている。
【0019】
また、MB予測モード選択部24から出力される量子化係数等の予測方法に関する情報は、可変長符号化部25に与えられる。可変長符号化部25は入力された情報を可変長符号化して出力バッファ18に出力する。出力バッファはCABAC符号化部15の出力及び可変長符号化部25の出力を、所定のビットレートで符号化データとして出力する。
【0020】
量子化部14の出力は、予測信号を生成するために逆量子化部19にも与えられる。逆量子化部19、逆直交変換部20、加算器21及び参照画像メモリ22によって局部復号器が構成される。逆量子化部19は入力された量子化出力を逆量子化して、量子化前のデータ(変換係数)に戻して逆直交変換部20に出力する。逆直交変換部20は入力された変換係数を逆直交変換することにより、直交変換前の予測誤差を得る。この予測誤差は加算器21に与えられる。
【0021】
加算器21はMB予測モード選択部24から予測信号も与えられており、予測誤差と予測信号との加算によって、入力画像を復元する。加算器21からの復元画像は、参照画像として参照画像メモリ22に与えられる。参照画像メモリ22は、参照画像を保持すると共に、動きベクトルに基づくブロック化位置の参照画像をブロック単位で予測信号生成部23に出力する。
【0022】
予測信号生成部23には入力画像信号も入力されている。予測信号生成部23は、予測モードを示す予測モード制御信号に基づいて、入力画像信号又は参照画像信号から予測信号を生成する。この場合には、予測信号生成部23は、各予測モード毎の符号化コストを算出し、予測モードの情報及び対応した符号化コストの情報(コスト情報)を出力すると共に、MB予測モード選択部24の選択処理に従って、最適な予測モードにおける予測信号を出力するようになっている。
【0023】
MB予測モード選択部24は、予測信号生成部23から、各予測モード毎のコスト情報がその予測モードを示す予測モード情報と共に与えられる。MB予測モード選択部24は、符号化コストが最も小さい予測モードを選択するための予測モード制御信号を予測信号生成部23に出力する(図示省略)。MB予測モード選択部24は、予測信号生成部23から出力された予測信号を減算器12及び加算器21に出力するようになっている。
【0024】
符号化制御部31は、発生符号量のフィードバック制御及び量子化特性制御等によって発生符号量を制御するレート制御、予測モードの決定処理の制御、符号化全体の制御等を行う。符号化制御部31は、符号化対象のピクチャタイプ情報及びスライスタイプ情報等をMB予測モード選択部24に与える。これにより、MB予測モード選択部24は、予測モードを制御するための予測モード制御信号を生成して予測信号生成部23に出力するようになっている。
【0025】
図2は図1中の予測信号生成部23の具体的な構成を示すブロック図である。また、図3は図2中のフレーム内符号化部43の具体的な構成を示すブロック図である。
【0026】
予測信号生成部23は、ブロック化部42、フレーム内符号化部43及びフレーム間符号化部44によって構成されている。ブロック化部42には、参照画像メモリ22からの参照画像信号及び入力画像信号が入力される。ブロック化部42は、予測モードを示す予測モード制御信号によって制御されて、予測モードがフレーム内符号化を採用したモードである場合には、入力画像信号から予測モードで指定されたブロック化位置のブロック単位の画像信号を予測信号としてフレーム内符号化部43に出力する。また、予測モードがフレーム間符号化を採用したモードである場合には、参照画像信号から予測モード及び動きベクトルで指定されたブロック化位置のブロック単位の画像信号を予測信号としてフレーム間符号化部44に出力する。
【0027】
フレーム内符号化部43とフレーム間符号化部44の構成は同様であり、図3では一方のフレーム内符号化部43の構成のみを具体的に示す。
【0028】
ブロック化部42からの各予測モードに対応した各予測信号のいずれが最適な予測信号であるかを判定するために、フレーム内符号化部43及びフレーム間符号化部44は、入力された予測信号に対する仮符号化処理を行って、発生符号量及び符号化歪みを求めて、符号化コストを算出する。
【0029】
即ち、ブロック化部42からの予測信号は減算器51に供給される。減算器51、直交変換部52及び量子化部53の構成は、夫々符号化部11における減算器12、直交変換部13及び量子化部14と同様である。即ち、減算器51には入力画像信号も与えられており、減算器51は、入力画像信号と予測信号との差分(予測誤差)を求めて、求めた予測誤差を直交変換部52に出力する。直交変換部52は、入力された予測誤差を直交変換して、変換係数を量子化部53に出力する。量子化部53は、入力された変換係数を量子化して量子化出力を発生符号量推定部54に出力する。
【0030】
また、量子化部53からの量子化出力は、符号化歪みの算出のために、逆量子化部56にも与えられる。逆量子化部56、逆直交変換部57及び加算器58は、夫々局部復号器を構成する逆量子化部19、逆直交変換部20及び加算器21と同様の構成である。即ち、逆量子化部56は、入力された量子化出力を逆量子化処理して変換係数に戻し、逆直交変換部57は入力された変換係数を逆直交変換して予測誤差を得る。加算器58は予測誤差と予測信号との加算によって、元の入力画像を復元する。
【0031】
加算器58からの復元画像の画像信号及び入力画像信号は、符号化歪み算出部59に与えられる。符号化歪み算出部59は、入力画像と復元画像の2乗誤差を算出し、算出結果を符号化歪みDとして、符号化コスト計算部55に出力する。
【0032】
発生符号量は、量子化部53の出力をCABAC符号化部によって算術符号化することによって、求めることができる。しかしながら、上述したように、この演算には膨大な処理時間が必要である。そこで、本実施の形態においては、発生符号量推定部54は、算術符号化を行うことなく、算術符号化において用いるシンボルの発生確率を用いて、発生符号量を推定するようになっている。
【0033】
図4は図3中の発生符号量推定部54の具体的な構成を示すブロック図である。
【0034】
量子化部53からの量子化出力は、シンタックスによって伝送することが規定されているデータ(多値シンタックス要素)であり、この多値シンタックス要素は符号量を算出するために、CABAC符号化部15の2値化部16と同様の構成の2値化部63に供給される。2値化部63は、入力された多値シンタックス要素を可変長の2値シンボル列に変換する。
【0035】
一般的なCABAC符号化では、2値シンボル列の各シンボルの発生確率を用いて算術符号化が行われる。この場合には、シンボル“0”,“1”のうち発生確率が高いシンボル(MPS:Most Probable Symbol)を符号化するか、発生確率が低いシンボル(LPS:Least Probable Symbol)を符号化するかによって、各シンボルの発生確率の設定を更新するようになっている。各シンボルの発生確率を決定するために、コンテキスト計算部及びコンテキストテーブルが用いられる。
【0036】
なお、図1のCABAC符号化部15では図示を省略したが、算術符号化部17に発生確率の情報を与えるものとして、コンテキスト計算部及びコンテキストテーブルは、一般的に用いられるものである。
【0037】
即ち、一般的には、コンテキスト計算部は、各シンボルの発生確率を算術符号化部に与えるものであり、多値シンタックス要素及び2値シンボル列が与えられて、シンボルの発生確率を保持するテーブル(確率テーブル)の読出しを制御する。
【0038】
確率テーブルは、2値シンボル列の各MPS毎の発生確率の情報を保持している。確率テーブルは、符号化の状況に応じて発生確率を変更するために、各MPS毎に複数(H.264では64個)の発生確率の情報を保持する。
【0039】
確率テーブルの読出しには、コンテキストテーブルが用いられる。コンテキストテーブルは、シンタックス要素の種類(H.264では460種類)に応じた複数の領域を有し、更にこの各領域は確率テーブル中の各MPS毎に保持された複数の発生確率に夫々対応した領域を有している。コンテキスト計算部は、多値シンタックス要素の種類及び2値シンボル列の状況から、内部に保持している周囲マクロブロック情報メモリ(図示せず)を参照してコンテキスト計算を行い、計算結果に基づいて、各2値シンボルを算術符号化する場合の発生確率を決定するために、コンテキストテーブルにコンテキストテーブルインデックスを出力する。コンテキストテーブルは、コンテキストテーブルインデックスに応じた読出しアドレスを確率テーブルに出力して、各2値シンボルに対応した発生確率の情報を算術符号化部に出力させる。
【0040】
図4中のコンテキスト計算部65及びコンテキストテーブル66は、上述した一般的なコンテキスト計算部及びコンテキストテーブルと同様の構成である。
【0041】
本実施の形態においては、確率テーブルに代えて符号量情報出力手段としての最適符号量テーブル67が採用される。コンテキストテーブル66は、コンテキストテーブルインデックスが入力されると、コンテキストテーブルインデックスで指定された領域を参照して、参照した値(コンテキスト情報)を最適符号量テーブル67に最適符号量テーブルインデックスとして出力すると共に、最適符号量累積加算部64にMPSを出力する。
【0042】
図5は図4中の最適符号量テーブルの割り当てを示す説明図である。図5に示すように、最適符号量テーブル67は、一般的な確率テーブルと同様の領域を有し、各領域には、各発生確率に代えて発生確率の対数値を保持するようになっている。本実施の形態においては、CABAC符号化の算術符号化において用いる発生確率テーブルの各要素を対数計算した値を、発生確率を用いて算術符号化するビットの最適符号量とする。即ち、コンテキストテーブル66は、通常のコンテキスト計算結果によって得られた2値シンボルの発生確率に相当する最適符号量テーブルインデックスに応じて、最適符号量を示す発生確率の対数値を出力する。
【0043】
最適符号量累積加算部64は、2値シンボル列及びMPSと共に最適符号量の情報が与えられ、最適符号量の総和を発生符号量推定値として出力する。また、最適符号量累積加算部64は、発生符号量推定値に応じて、コンテキストテーブル66に更新した最適符号量テーブルインデックスを出力する。これにより、コンテキストテーブル66のコンテキスト情報が更新されるようになっている。
【0044】
発生確率が既知の符号については、符号量の対数を算術符号化における発生確率として用いることで、統計上、最も符号化効率を高くすることができる。2値化部63の出力が発生確率通りの符号であるとは限らないが、統計的には、発生確率の対数値を累積することで略発生符号量の推定値を得ることができる。また、最適符号量累積加算部64において、更新した最適符号量テーブルインデックスを出力することで、コンテキストテーブル66によって選択しようとする確率を、入力される実際の2値シンボル列に応じて更新することができる。これにより、発生符号量推定値の精度を向上させることができる。
【0045】
発生符号量推定部54からの発生符号量推定値は、符号化コスト計算部55に与えられる。符号化コスト計算部55は、符号化歪み算出部59からの符号化歪みDと発生符号量推定値Rとをメモリ61に蓄積し、蓄積した符号化歪みDと発生符号量推定値Rとから符号化コストを算出する。例えば、符号化コスト計算部55は、下記(1)式の演算によって符号化コストJiを求める。
【0046】
Ji=Di+λ・Ri …(1)
但し、λは、量子化パラメータに基づいて計算される定数
符号化コスト計算部55は、予測モードの決定対象のブロックに対する符号化コストの情報(コスト情報)とその符号化コストが得られる予測モードの情報(予測モード情報)とをMB予測モード選択部24に出力する。フレーム間符号化部44も同様の構成であり、各予測モード毎に、コスト情報及び予測モード情報をMB予測モード選択部24に出力する。
【0047】
MB予測モード選択部24は、各予測モードについてのコスト情報及び予測モード情報をメモリ62に記憶させ、ラグランジュ未定乗数法を用いて、コスト最小の予測モードを最終予測モードとして決定する。MP予測モード選択部24は、決定した最終的な予測モードを、予測モード制御信号としてブロック化部42に出力する。ブロック化部42は、予測モード制御信号に応じた予測信号を生成して、MB予測モード選択部24に出力し、MB予測モード選択部24は、この予測信号を実際の符号化に用いる予測信号として、減算器12及び加算器21に出力するようになっている。
【0048】
次に、このように構成された実施の形態の動作について図6及び図7を参照して説明する。図6は符号化に用いる予測信号を決定するための最適予測モードの判定処理を示すフローチャートであり、図7は図6中の発生符号量推定処理の具体的なフローを示すフローチャートである。
【0049】
実際の符号化に先立って、仮符号化による最適予測モードの判定処理が行われる。先ず、図6のステップS11において、符号化コストが初期化される。入力画像信号及び参照画像メモリ22からの参照画像信号は、予測信号生成部23に供給される。予測信号生成部23のブロック化部42は、予測モード制御信号に応じた予測モードで、ブロック化を行って予測信号を生成する(ステップS12)。予測モードがフレーム内符号化モードである場合には、フレーム内符号化部43において符号化コストが求められ、予測モードがフレーム間符号化モードである場合には、フレーム間符号化部44において符号化コストが求められる。
【0050】
先ず、予測信号は減算器51に供給されて、入力画像信号との差分(予測誤差)が求められる。予測誤差は、直交変換部52において直交変換され(ステップS13)、量子化部53において量子化される(ステップS14)。
【0051】
量子化部53の出力は、現予測モードにおける発生符号量及び符号化歪みを算出するために、多値シンタックス要素として発生符号量推定部54に供給されると共に、逆量子化部56にも供給される。量子化部53の量子化出力は、逆量子化部56において逆量子化され(ステップS15)、逆直交変換部57において逆直交変換されて予測誤差が復元される(ステップS16)。加算器58は復元された予測誤差とブロック化部42からの予測信号とを加算して、入力画像を復元する。加算器58からの復元画像は、符号化コスト計算部55及び符号化歪み算出部59に与えられる。
【0052】
ステップS17においては、図7の発生符号量推定処理が行われる。即ち、量子化部53からの多値シンタックス要素は、ステップS31において、2値シンボル列に変換される。ステップS32では、多値シンタックス要素及び2値シンボル列に基づいて、コンテキスト計算が行われて、コンテキストテーブルインデックスが求められる。
【0053】
このコンテキストテーブルインデックスに基づいて、コンテキストテーブル66が参照されて、最適符号量テーブルインデックスが出力される(ステップS33)。最適符号量テーブルインデックスによって、最適符号量テーブル67が参照されて(ステップS34)、最適符号量テーブル67から最適符号量が出力される。
【0054】
本実施の形態においては、最適符号量テーブル67は、各2値シンボルの発生確率に対応してその対数値を記憶しており、2値シンボルの発生確率に対応した対数値を最適符号量として出力する。最適符号量累積加算部64は、最適符号量テーブル67からの最適符号量を累積加算することで、発生符号量推定値を得る(ステップS35)。
【0055】
従って、本実施の形態においては、所定の予測モードにおける発生符号量を、簡単な累積加算演算によって得ることができ、比較的処理能力が低い装置を用いた場合でも、短時間に発生符号量の推定値を高精度に求めることができる。
【0056】
ステップS36では、最適符号量累積加算部64は、最適符号量テーブル67の参照の仕方を実際の2値シンボル列に応じたものとするために、更新した最適符号量テーブルインデックスをコンテキストテーブル66に出力する(ステップS36)。これにより、コンテキストテーブル66は、コンテキスト情報を更新する(ステップS37)。
【0057】
最適符号量累積加算部64からの発生符号量推定値は、符号化コスト計算部55に与えられる。一方、符号化歪み算出部59は、加算器58からの復元画像と入力画像とが与えられ、符号化歪みを算出する。算出された符号化歪みは、符号化コスト計算部55に供給される(ステップS18)。
【0058】
ステップS19においては、符号化コストの算出及び評価が行われる。符号化コスト計算部55は、メモリ61に発生符号量推定値及び符号化歪みを蓄積すると共に、これらの値を用いて符号化コストを算出する。符号化コスト計算部55は、求めたコスト情報を現予測モードを示す予測モード情報と共に出力する。
【0059】
こうして、フレーム内符号化部43又はフレーム間符号化部44からコスト情報及び予測モード情報がMB予測モード選択部24に出力される。MB予測モード選択部24は、入力されたコスト情報及び予測モード情報をメモリ62に蓄積する。MB予測モード選択部24は、メモリ62の情報を読み出して、符号化コストが最も小さくなる予測モードを選択する。
【0060】
例えば、MB予測モード選択部24は、ステップS20において、現予測モードにおける符号化コストJが最小コストよりも小さいか否かを判定する。現予測モードにおける符号化コストJが最小コストよりも大きい場合には、処理をステップS22に移行し、全ての予測モードについて符号化コストを求めたか否かを判定する。全ての予測モードについて符号化コストを求めていない場合には、ステップS23において予測モードを更新する。即ち、MB予測モード選択部24は、予測モード制御信号によってブロック化部42に次の予測モードによる予測信号を生成させる。
【0061】
現予測モードにおける符号化コストJが最小コストよりも小さい場合には、ステップS21において、現予測モードの符号化コストJを最小コストに設定した後、ステップS22を経て予測モードを更新する(ステップS23)。
【0062】
以後、同様の動作を繰り返し、全ての予測モードについて、符号化コストを求めて、最小符号化コストを得る予測モードを得る。MB予測モード選択部24は、最小符号化コストが得られる予測モードを最適予測モードとして、ブロック化部42に最適予測モードを設定するための予測モード制御信号を出力する(ステップS24)。
【0063】
ブロック化部42は、最適予測モードに対応した予測信号を出力する。この予測信号は、MB予測モード選択部24を介して減算器12及び加算器21に供給される。こうして、直交変換部13、量子化部14及びCABAC符号化部15において、実際の符号化が行われる。この場合には、符号化コストが最小となる予測モードが選択されており、高効率の符号化が可能である。
【0064】
なお、図6及び図7においては、説明のために直列的な処理を行う例を示しているが、並列処理が可能であることは明らかであり、処理順も図6及び図7に限定されるものではない。
【0065】
このように本実施の形態においては、最適予測モードの選択のための仮符号化に際して、CABAC符号化における算術符号化を行うことなく、2値シンボルの発生確率の対数を累積加算することで、発生符号量を推定する。これにより、少ない処理量で高精度の発生符号量推定値を得ることができる。高精度に求めた発生符号量推定値を用いてレート−歪み最適化モード判定を行うことで、高画質な符号化画像を高い符号化効率で得ることができる。
【0066】
図8は本発明の第2の実施の形態を示すブロック図である。図8は発生符号量推定部の構成を示している。図8において図4と同一の構成要素には同一符号を付して説明を省略する。また、図9は第2の実施の形態における発生符号量推定処理フローを示すフローチャートである。
【0067】
本実施の形態における発生符号量推定部は、コンテキストテーブル66のコンテキスト情報の更新を行わない点が図4の発生符号量推定部54と異なるのみである。コンテキストテーブル66は、コンテキストテーブルインデックスに対応した最適符号量テーブルインデックスを出力するのみである。最適符号量累積加算部64は、最適符号量を累積加算することで、2値シンボル列を算術符号化した場合の発生符号量推定値を得る。
【0068】
図4の発生符号量推定部54は、実際に入力される2値シンボルに応じて、最適符号量を変化させるように、コンテキスト情報の更新を行った。これに対し、本実施の形態では、実際の入力に拘わらず、最適符号量テーブル67からは2値シンボルに応じた規定の最適符号量の情報が出力される。
【0069】
このような構成によれば、図7と図9との比較から明らかなように、ステップS36のコンテキストテーブル更新処理が省略されている。本実施の形態においては、コンテキストテーブルの更新が不要であることから、並列化による高速処理が可能であるという利点を有する。
【0070】
他の構成及び作用は第1の実施の形態と同様である。
【0071】
なお、本発明は上記各実施の形態に限定されるものではなく、種々の変形が可能である。例えば、符号化装置の構成及び符号化手法は、特に限定されるものではない。
【図面の簡単な説明】
【0072】
【図1】本発明の第1の実施の形態に係る画像符号化装置を示すブロック図。
【図2】図1中の予測信号生成部23の具体的な構成を示すブロック図。
【図3】図2中のフレーム内符号化部43の具体的な構成を示すブロック図。
【図4】図3中の発生符号量推定部54の具体的な構成を示すブロック図。
【図5】図4中の最適符号量テーブルの割り当てを示す説明図。
【図6】符号化に用いる予測信号を決定するための最適予測モードの判定処理を示すフローチャート。
【図7】図6中の発生符号量推定処理の具体的なフローを示すフローチャート。
【図8】本発明の第2の実施の形態を示すブロック図。
【図9】第2の実施の形態における発生符号量推定処理フローを示すフローチャート。
【符号の説明】
【0073】
23…予測信号生成部、24…MB予測モード選択部、15…CABAC符号化部。
【出願人】 【識別番号】000003078
【氏名又は名称】株式会社東芝
【出願日】 平成18年6月30日(2006.6.30)
【代理人】 【識別番号】100076233
【弁理士】
【氏名又は名称】伊藤 進


【公開番号】 特開2008−11431(P2008−11431A)
【公開日】 平成20年1月17日(2008.1.17)
【出願番号】 特願2006−182324(P2006−182324)