| 【発明の名称】 |
動画像符号化装置 |
| 【発明者】 |
【氏名】川島 裕司
【氏名】菊池 義浩
【氏名】鈴木 真吾
|
| 【要約】 |
【課題】符号化コスト算出に、符号化対象である4×4ブロック内の全ての画素のSADではなく、処理負荷が大きくなるにつれて、予測に用いる隣接画素から空間的に近い画素をSAD算出対象の画素から除外するよう、SAD対象画素開始点を変更することで、符号化性能の劣化を抑えつつ、処理量削減する動画像符号化装置及び方法を提供する。
【構成】本発明は、負荷を検出し負荷情報を出力する処理負荷検出部1と、上記負荷情報に基づき負荷レベルを判断し、当該負荷レベルに応じてブロック内の画素よりSADを計算する対象画素の開始点を定め、当該開始点に基づいてSADを計算し、当該SADに基づいて符号化コストを計算し、当該符号化コストが最小のモードを選択するビデオエンコーダ2と、を具備することを特徴とする動画像符号化装置が提供される。 |
【特許請求の範囲】
【請求項1】 負荷を検出し負荷情報を出力する処理負荷検出部と、 上記負荷情報に基づき負荷レベルを判断し、当該負荷レベルに応じてブロック内の画素よりモード選択のための評価値を計算する対象画素の開始点を定め、当該開始点に基づいて前記評価値を計算し、当該評価値に基づいて符号化コストを計算し、当該符号化コストが最小のモードを選択するビデオエンコーダと、を具備することを特徴とする動画像符号化装置。 【請求項2】 前記評価値は、動画像信号と予測画像信号とから求まる差分の絶対値和であることを特徴とする請求項1に記載の動画像符号化装置。 【請求項3】 上記ビデオエンコーダは、上記ブロック内の対象画素に対するSADと符号化モード情報の符号量に対するコストとの加算からイントラ予測の上記符号化コストを計算することを更に特徴とする請求項1に記載の動画像符号化装置。 【請求項4】 上記負荷とは、レンダリング負荷、オーディオ処理負荷、ビデオエンコード処理負荷の少なくともいずれかである、ことを更に特徴とする請求項1に記載の動画像符号化装置。 【請求項5】 動画像信号と予測画像信号との差分である残差信号を生成する残差信号算出部と、 上記残差信号に対してDCT及び量子化を行うDCT・量子化部と、 上記量子化された変換係数信号に対して逆DCT及び逆量子化を行い、復号信号を生成する逆DCT・逆量子化部と、 上記予測画像信号と上記復号信号を加算し復号画像信号を生成するデコード部と、 上記復号画像信号をフィルタリングするデブロックフィルタと、 上記デブロック後の復号画像信号を蓄積するフレームバッファと、 負荷情報に基づき負荷レベルを判断し、当該負荷レベルに応じてブロック内の画素よりSADを計算する対象画素の開始点を定めるSAD対象画素開始判定部と、 上記フレームバッファの参照画像信号を読み出し、上記開始点の情報に基づいてイントラ予測を行い、予測画像信号とモード選択のための評価値を生成するイントラ予測部と、 を具備することを特徴とする動画像符号化装置。
|
【発明の詳細な説明】【技術分野】 【0001】 本発明は、動画像符号化装置に関する。 【背景技術】 【0002】 動画像の圧縮符号化技術であるMPEG方式では、インター予測、イントラ予測、離散コサイン変換(DCT)及び可変長符号化を組み合わせて符号化を行う。イントラ予測では、符号化対象ブロックの画素値を周囲の参照ブロックの画素値から予測し、予測値に対する実際の画素値の誤差である予測誤差を符号化する。 【0003】 一方、MPEG方式をさらに発展させたH.264/AVCと称される動画像符号化規格では、複雑な画像については4×4画素のブロック単位のイントラ予測(以下、イントラ4×4予測モードと称する)を行い、平坦な画像については16×16画素のマクロブロック単位のイントラ予測(以下、イントラ16×16予測モードと称する)を行うなどして、符号化効率を向上させている。いずれも隣接ブロックの復号済みの画素を予測画素とし、これを元に作成された予測画像と原画像との差分を符号化する。 【0004】 イントラ16×16予測モードは、マクロブロックごとに4つのモード、イントラ4×4予測モードは、4×4ブロックごとに9つのモードが存在する。このイントラ4×4予測モードの選択処理では、9つのモードに対する符号化コストを算出し、コスト最小のモードを最適符号化モードとして選択する。一般的に、符号化コストとして原画像と予測画像とのSADが用いられる。イントラ4×4予測モード選択処理は、モード数が9つと多いため符号化コスト算出にかかる処理量が多い。一方、適切な符号化コストを用いずにモード選択を行うと、符号化性能に多大な影響を及ぼしてしまう。 【0005】 ここで、イントラ4×4予測モード選択のコスト計算に用いる画素数については、非特許文献1に開示されている。 【0006】 その第1章の中盤以降では、JVT標準化で使用されている参照ソフトJM5.0のアルゴリズムについて記述されている。すなわち、非特許文献1の数式(1)では、4×4ブロック内の全ての画素に対するSADSAD_16と、符号化モード情報(垂直予測、水平予測等)の符号量に対するコスト4Pλ(Qp)との加算からイントラ4×4予測のコストCost_4x4を計算し、コスト最小のモードを選択する。 【0007】 また、その第2章では、EIP方式について記述されている。すなわち、非特許文献1の数式(3)では、サブサンプルされた4画素に対するSADSAD_4と符号化モード情報の符号量に対するコストPλ(Qp)との加算からイントラ4×4予測のコストCost_4を用いてコストを計算し、コスト最小のモードを選択する。 【非特許文献1】Bojun Meng等,“Efficient Intra-Prediction Algorithm in H.264”,ICIP2003 【発明の開示】 【発明が解決しようとする課題】 【0008】 しかしながら、符号化対象4×4ブロック内の画素は、隣接ブロックに空間的に近いほど予測画像の値に類似し、空間的に遠いほど予測画像の値からはずれる傾向にある。そのため、符号化コストとして得られる4×4画素のSADの大部分は、隣接ブロックから空間的に遠い画素とのSADが占めると考えられる。 【0009】 本発明の目的とするところは、符号化コスト算出に、符号化対象である4×4ブロック内の全ての画素を対象に算出された評価値ではなく、処理負荷が大きくなるに連れて予測に用いる隣接画素から空間的に近い画素を評価値算出対象の画素から除外するよう評価値対象画素開始点を変更することで、符号化性能の劣化を抑えつつ、処理量削減することにある。 【課題を解決するための手段】 【0010】 本発明の第1の観点によれば、負荷を検出し負荷情報を出力する処理負荷検出部と、上記負荷情報に基づき負荷レベルを判断し、当該負荷レベルに応じてブロック内の画素よりモード選択のための評価値を計算する対象画素の開始点を定め、当該開始点に基づいて前記評価値を計算し、当該評価値に基づいて符号化コストを計算し、当該符号化コストが最小のモードを選択するビデオエンコーダと、を具備することを特徴とする動画像符号化装置が提供される。 【0011】 本発明の第2の観点によれば、動画像信号と予測画像信号との差分である残差信号を生成する残差信号算出部と、上記残差信号に対してDCT及び量子化を行うDCT・量子化部と、上記量子化された変換係数信号に対して逆DCT及び逆量子化を行い、復号信号を生成する逆DCT・逆量子化部と、上記予測画像信号と上記復号信号を加算し復号画像信号を生成するデコード部と、上記復号画像信号をフィルタリングするデブロックフィルタと、上記デブロック後の復号画像信号を蓄積するフレームバッファと、負荷情報に基づき負荷レベルを判断し、当該負荷レベルに応じてブロック内の画素よりSADを計算する対象画素の開始点を定めるSAD対象画素開始判定部と、上記フレームバッファの参照画像信号を読み出し、上記開始点の情報に基づいてイントラ予測を行い、予測画像信号とモード選択のための評価値を生成するイントラ予測部と、を具備することを特徴とする動画像符号化装置が提供される。 【発明の効果】 【0012】 本発明によれば、符号化コスト算出に、符号化対象である4×4ブロック内の全ての画素を対象に算出された評価値ではなく、処理負荷が大きくなるに連れて予測に用いる隣接画素から空間的に近い画素を評価値算出対象の画素から除外するよう対象画素開始点を変更することで、符号化性能の劣化を抑えつつ、処理量削減する動画像符号化装置を提供することができる。 【発明を実施するための最良の形態】 【0013】 以下、添付図面を参照して、本発明の実施の形態について説明する。 【0014】 図1には本発明の一実施の形態に係る動画像符号化装置の構成を示し説明する。 【0015】 この図1に示されるように、動画像符号化装置は、処理負荷検出部1とビデオエンコーダ2を有している。このような構成において、動画像符号化装置では、処理負荷検出部1が、レンダリング処理負荷、オーディオ処理負荷、ビデオエンコード処理負荷の情報を受けて、負荷情報を生成し、ビデオエンコーダ2に出力する。ビデオエンコーダ2では、この負荷情報を受けると、イントラ予測モード判定で用いるための評価値(例えば、動画像信号と予測画像信号とから求まる差分の絶対値和であるSAD(Sum of Absolute Difference))の画素数を、処理負荷に応じて変更する。そして、処理負荷が大きくなるにつれて、予測に用いる隣接画素から空間的に近い画素を評価値算出対象の画素から除外するよう、評価値を求めるための対象画素開始点を変更する。これにより、処理量を削減する。 【0016】 次に、図2には本発明の一実施の形態に係る動画像符号化装置のビデオエンコーダ2の構成を更に詳細に示し説明する。 【0017】 この図2に示されるように、動画像符号化装置は、原画像を符号化して符号化データが多重化されたストリームを出力するものであり、その構成要素としては、符号化制御部11、残差信号算出部12、離散コサイン変換(DCT)・量子化部13、逆離散コサイン変換(IDCT)・逆量子化部14、デコード部15、デブロックフィルタ16、フレームバッファ17、イントラ予測部18、動き補償部19、動きベクトル検出部20、選択部21、エントロピー符号化部22、対象画素開始判定部23を備えている。 【0018】 この実施の形態では、H.264/AVCへの適用を想定しているので、4×4画素のブロック単位のイントラ予測、及び16×16画素のマクロブロック(MB)単位のイントラ予測が可能である。なお、予測に用いる画素が符号化対象画素と同一のフレームに属する場合をフレーム内予測(イントラ予測)、異なるフレームに属する場合をフレーム間予測(インター予測)という。 【0019】 このような構成において、フレーム単位で原画像の動画像信号が入力されると、残差信号算出部12にて、予測画像信号との差分である残差信号が生成される。この予測画像信号については、イントラ予測部18によるイントラ予測、動き補償部19によるインター予測の結果得られた予測画像信号より選択部21が選択し、出力する。 【0020】 この残差信号に対してDCT・量子化部13にてDCT及び量子化が実施される。この量子化された変換係数信号は、逆DCT・逆量子化部14に入力される。この逆DCT・逆量子化部14では、変換係数信号に対してDCT及び量子化の逆の処理であるIDCT及び逆量子化が施され、復号信号が生成される。この復号信号は、デコード部15に入力される。このデコード部15では、予測画像信号と復号信号を加算し復号画像信号を生成し、復号画像信号がデブロックフィルタ16を介してフィルタリングされた後、デブロック後の復号画像信号がフレームバッファ17に蓄積される。このようにして、符号化対象画像である動画像信号の前後の複数フレームの参照画像信号が順次記憶される。 【0021】 このデブロッキングフィルタ16によるフィルタリングは、画像の符号化時に生じるブロック歪みを減少させるためのフィルタである。その適用は、H.264/AVCに特有のものであるが、フレームバッファ17に復号画像を格納するのに先立って、適応的にブロッキングフィルタ16によって、ブロック歪の除去を行うのである。 【0022】 イントラ予測部18は、フレームバッファ17の参照画像信号を読み出し、イントラ予測を実施し、予測画像信号、モード選択のための評価値を生成する。このとき、対象画素開始判定部23が、負荷情報に基づいて、予測に用いる隣接画素から空間的に近い画素を評価値算出対象の画素から除外するよう、評価値を求めるための対象画素開始点を変更する。 【0023】 動きベクトル検出部20は、フレームバッファ17の参照画像信号を読み出し、マクロブロック単位に前のフレームのどの部分(座標)が良好かを検出する。つまり、動きベクトルを検出する。一般に、動きベクトルは、周囲ブロックの動きベクトルと強い相関があることから、周囲ブロックから予測を行う。H.264/AVCにおいては、周囲ブロックの動きベクトルから中央値を用いて動きベクトルを予測することになる。但し、可変ブロック・サイズ動き補償や複数参照画像からの動き補償が用いられるために、より細かな処理も必要となることは勿論である。動き補償部19は、上記動きベクトル検出部20で検出された動きベクトルを受けて、参照画像信号と動画像信号との間の当該動きベクトルによる動き補償予測、即ちインター予測を行い、予測画像信号、評価値を生成する。 【0024】 評価は、動画像信号と予測画像信号の類似度を表すもので、上記SAD以外には、参照画像信号と動画像信号の二乗誤差和(SSD)が一般に用いられる。そして、このような評価値を算出する際に、処理負荷検出部1から送信された負荷情報に基づいて、対象画素開始判定部23が、イントラ予測モード判定で用いる評価値を求めるための画素数を、処理負荷に応じて変更する。即ち、処理負荷が大きくなるにつれて、予測に用いる隣接画素から空間的に近い画素を評価値算出対象の画素から除外するよう、評価値を求めるための対象画素開始点を変更する。これにより、処理量を削減する。その詳細については、後述する。この予測画像信号、評価値は選択部21に入力される。 【0025】 符号化制御部11は、画像のフレーム(画面)単位、あるいは更に小さな単位で符号化の方法(符号化モード)を選び、或いはそのパラメータを選ぶことによって、発生情報量を目的の値に近づける処理を司る。さらに、エントロピー符号化部22は、頻度の高い情報は短い符号で、そうでない情報は長い符号で表現することで、全体として伝送ビット数を減らす処理を行い、符号化データが多重化されたストリームを出力する。 【0026】 以下、図2のフローチャートを参照して、本発明の一実施の形態に係る動画像符号化装置のイントラ予測モード判定処理について処理手順を詳細に説明する。 【0027】 なお、以下では、図3乃至図8を適宜参照しつつ、説明を進める。 【0028】 さて、このイントラ予測モード判定処理を開始すると、サブルーチン「評価値を求めるための対象画素開始点判定処理」を実行し、対象画素の開始点を判定する(ステップS1)。 【0029】 即ち、図4に示されるように、サブルーチン「評価値を求めるための対象画素開始点判定処理」に入ると、先ず処理負荷検出部1が負荷量を検出し(ステップS11)、ビデオエンコーダ2側で負荷レベルを判断し(ステップS12)、負荷レベル0,1,2…Lに応じて評価値を求めるための対象画素の開始点sad_start(0〜S)を定め(ステップS13乃至S16)、リターンする。 【0030】 なお、図5乃至図8は、4×4ブロックの画素位置と評価値を求めるための対象画素開始点の関係を示している。なお、ここでは、評価値として上記SADを利用した場合について説明し、以下では、評価値をSADと表現する。 【0031】 図5はパターン1(S=15)、図6はパターン2(S=6)、図7はパターン3(S=3)、図8はパターン4(S=3)での関係をそれぞれ示している。なお、SAD対象画素開始点とは、SADを計算する対象画素群である場合もある。 【0032】 こうして図3に戻り、このSAD対象画素の開始点に基づいてSADを計算する(ステップS2)。ここでは、開始点からSまでの画素についてSADを計算する。 【0033】 そして、このSADに基づいて符号化コストを計算する(ステップS3)。具体的には、SADに用いる画素数をnとすると、4×4ブロック内の対象画素に対するSAD_nと、符号化モード情報(垂直予測,水平予測等)の符号量に対するコスト(n/16)×P×λ(Qp)との加算からイントラ4×4予測のコストCost_nを次式により計算する。 【0034】 Cost_n = SAD_n + (n/16)×P×λ(Qp) ここでλはラグランジェ未定乗数で量子化パラメータQpにより決定される定数であり、Pは隣接ブロックから得られる予測モードと一致する場合は0、それ以外の場合は1となる値である。 【0035】 こうして、コスト最小のモードを選択し(ステップS4)、一連の処理を終了する。 【0036】 以上説明したように、本発明の一実施の形態に係る動画像符号化装置によれば、イントラ4×4予測において、符号化コストを算出するにあたり、符号化対象である4×4ブロック内の全ての画素のSADを算出するのではなく、処理負荷を検出し、当該処理負荷が大きくなるにつれて予測に用いる隣接画素から空間的に近い画素をSAD算出対象の画素から除外するようSAD対象画素開始点を変更し、それによりSAD算出の対象画素を絞り込むことで、符号化性能の劣化を抑えつつ、処理量削減することができる。 【0037】 以上、本発明の実施の形態について説明したが、本発明はこれに限定されることなくその趣旨を逸脱しない範囲で種々の改良・変更が可能であることは勿論である。例えば、イントラ4×4予測に適用範囲は限定されず、イントラ8×8予測、イントラ16×16予測にも適用可能であることは勿論である。 【図面の簡単な説明】 【0038】 【図1】本発明の一実施の形態に係る動画像符号化装置の構成図である。 【図2】本発明の一実施の形態に係る動画像符号化装置のビデオエンコーダ2の構成を更に詳細に示す構成図である。 【図3】本発明の一実施の形態に係る動画像符号化装置のイントラ予測モード判定処理について処理手順を詳細に説明するフローチャートである。 【図4】図3のステップS1で実行されるサブルーチン「評価値を求めるための対象画素開始点判定処理」の処理手順を詳細に示すフローチャートである。 【図5】4×4ブロックの画素位置とSAD対象画素開始点の関係(パターン1、S=15)を示す概念図である。 【図6】4×4ブロックの画素位置とSAD対象画素開始点の関係(パターン2、S=6)を示す概念図である。 【図7】4×4ブロックの画素位置とSAD対象画素開始点の関係(パターン3、S=3)を示す概念図である。 【図8】4×4ブロックの画素位置とSAD対象画素開始点の関係(パターン4、S=3)を示す概念図である。 【符号の説明】 【0039】 1…処理負荷検出部、2…ビデオエンコーダ、11…符号化制御部、12…加算器、13…変換・スケーリング部、14…スケーリング・逆変換部、15…加算器、16…デブロッキングフィルタ、17…フレームバッファ、18…イントラ予測部、19…動き補償部、20…動き検出部、21…スイッチ、22…エントロピー符号化部。
|
| 【出願人】 |
【識別番号】000003078 【氏名又は名称】株式会社東芝
|
| 【出願日】 |
平成18年8月11日(2006.8.11) |
| 【代理人】 |
【識別番号】100058479 【弁理士】 【氏名又は名称】鈴江 武彦
【識別番号】100091351 【弁理士】 【氏名又は名称】河野 哲
【識別番号】100088683 【弁理士】 【氏名又は名称】中村 誠
【識別番号】100108855 【弁理士】 【氏名又は名称】蔵田 昌俊
【識別番号】100075672 【弁理士】 【氏名又は名称】峰 隆司
【識別番号】100109830 【弁理士】 【氏名又は名称】福原 淑弘
【識別番号】100084618 【弁理士】 【氏名又は名称】村松 貞男
【識別番号】100092196 【弁理士】 【氏名又は名称】橋本 良郎
|
| 【公開番号】 |
特開2008−48065(P2008−48065A) |
| 【公開日】 |
平成20年2月28日(2008.2.28) |
| 【出願番号】 |
特願2006−220371(P2006−220371) |
|