| 【発明の名称】 |
通信端末装置 |
| 【発明者】 |
【氏名】鈴木 真吾
【氏名】菊池 義浩
【氏名】川島 裕司
|
| 【要約】 |
【課題】選択された符号化モードに応じて離散コサイン変換および量子化処理を制御することで、これらの処理に伴う負荷の低減を図り、かつ画質の劣化を抑えることの出来る通信端末装置を提供する。
【構成】制御部121は、画像入力部11を介して入力された動画像の符号かを行う際、処理部122によって実行される符号化処理が、輝度信号に対する4×4イントラ予測符号化または16×16イントラ世s区符号化、色差信号に対するイントラ予測符号化、またはインター予測符号化のいずれの符号化モードが実行されるか確認し、選択された符号化モードに応じ、更に、予測誤差を考慮して離散コサイン変換処理および量子化処理における処理内容を切替える。 |
【特許請求の範囲】
【請求項1】 イントラ予測符号化処理およびインター予測符号化処理を選択的に実行することで動画像の符号化を行う符号化部を備えた通信端末装置において、 前記符号化部は、イントラ予測符号化処理を実行する場合、 符号化対象の第1のサイズのブロックと、このブロックに隣接するブロックから作成した第1のサイズの予測画像ブロックとの差を計算して差分画像を作成し、 該差分画像を前記第1のサイズのブロックより小さい第2のサイズのブロックに分割し、 該分割された差分画像から予測誤差を計算し、 該予測誤差と予め設定された閾値とを比較し、 この比較の結果、予測誤差が閾値を超える場合は、前記差分画像に対して離散コサイン変換を行うとともに、この離散コサイン変換で得た交流成分に対して量子化処理を行い、予測誤差が閾値以下である場合は、離散コサイン変換を行って直流成分のみを求めるとともに、交流成分にゼロを設定する第1の処理を実行し、 前記第1の処理を行った後、直流成分に対して直交変換および量子化処理を行う第2の処理を実行する ことを特徴とする通信端末装置。 【請求項2】 イントラ予測符号化処理およびインター予測符号化処理を選択的に実行することで動画像の符号化を行う符号化部を備えた通信端末装置において、 前記符号化部は、イントラ予測符号化処理を実行する場合、 符号化対象の第1のサイズのブロックと、このブロックに隣接するブロックから作成した第1のサイズの予測画像ブロックとの差を計算して差分画像を作成し、 該差分画像を前記第1のサイズのブロックより小さい第2のサイズのブロックに分割し、 該分割された差分画像から予測誤差を計算し、 該予測誤差と予め設定された閾値とを比較し、 この比較の結果、予測誤差が閾値以上である場合は、前記差分画像に対して離散コサイン変換を行うとともに、この離散コサイン変換で得た交流成分に対して量子化処理を行い、予測誤差が閾値未満である場合は、離散コサイン変換を行って直流成分のみを求めるとともに、交流成分にゼロを設定する第1の処理を実行し、 前記第1の処理を行った後、直流成分に対して直交変換および量子化処理を行う第2の処理を実行する ことを特徴とする通信端末装置。
|
【発明の詳細な説明】【技術分野】 【0001】 本発明は、動画像を符号化するための通信端末装置に関し、特に、画質の劣化を伴うことなく離散コサイン変換、量子化処理の負荷を低減する機能を備えた通信端末装置に関する。 【背景技術】 【0002】 動画像の符号化は、入力した画像をフレーム単位に区切るとともに、このフレームを、例えば8画素×8画素の矩形領域からなるマクロブロック(MB)に分割し、このMBに対して離散コサイン変換(DCT変換)、量子化、そしてハフマン符号化と各種の処理を施すことで実行される。 【0003】 このような動画像の符号化においては、DCT変換と量子化の処理は処理量が非常に大きいため、その処理量を低減するための様々な技術が考えられている。 【0004】 例えば、特許文献1には、画像信号をブロックに分割して符号化を行う際に、ブロック毎に予測残差信号の評価量を求め、この評価量が閾値以上の場合は有効ブロック、一方、閾値未満のときは無効ブロックと判定し、無効ブロックと判定されたブロックについては予測誤差情報を送らない技術が開示されている。 【0005】 特許文献1に開示されている技術を用いることで、量子化処理を行った結果の係数が全てゼロとなる場合にDCT変換と量子化の処理を省略することが可能となる。 【特許文献1】特開平10−210480号公報 【発明の開示】 【発明が解決しようとする課題】 【0006】 ところで、近年、動画像を符号化する技術の一つとしてH.264と呼ばれる技術が標準化されているが、このH.264では、符号化モードが非常に多いことから、選択された符号化モードによっては予測誤差の性質が異なる場合がある。このため、全ての符号化モードに対して画一的な処理量削減の方法を適用すると、画質の劣化につながる恐れがある。 【0007】 この発明はこのような課題を解決するためになされたもので、選択された符号化モードに応じて離散コサイン変換および量子化処理を制御することで、これらの処理に伴う負荷の低減を図り、かつ画質の劣化を抑えることを目的としている。 【課題を解決するための手段】 【0008】 上記の目的を達成するため、この発明では、イントラ予測符号化処理およびインター予測符号化処理を選択的に実行することで動画像の符号化を行う符号化部を備えた通信端末装置において、前記符号化部は、イントラ予測符号化処理を実行する場合、符号化対象の第1のサイズのブロックと、このブロックに隣接するブロックから作成した第1のサイズの予測画像ブロックとの差を計算して差分画像を作成し、該差分画像を前記第1のサイズのブロックより小さい第2のサイズのブロックに分割し、該分割された差分画像から予測誤差を計算し、該予測誤差と予め設定された閾値とを比較し、この比較の結果、予測誤差が閾値を越える場合は、前記差分画像に対して離散コサイン変換を行うとともに、この離散コサイン変換で得た交流成分に対して量子化処理を行い、予測誤差が閾値以下である場合は、直流成分のみを求める離散コサイン変換を行うとともに、交流成分にゼロを設定する第1の処理を実行し、前記第1の処理を行った後、直流成分に対して直交変換および量子化処理を行う第2の処理を実行することを特徴としている。 【発明の効果】 【0009】 この発明によれば、選択された符号化モードに応じて離散コサイン変換および量子化処理を制御することで、画質の劣化を伴うことなく離散コサイン変換および量子化処理の負荷を低減することのできる動画像の符号化機能を備えた通信端末装置を提供できる。 【発明を実施するための最良の形態】 【0010】 以下、図面を参照して本発明の一実施形態について説明する。 図1は本発明に係る動画像の符号化処理が適用された通信端末装置10の概略構成を示す図であり、通信端末装置は、携帯電話、パーソナルコンピュータなどである。なお、通信端末装置が携帯電話やパーソナルコンピュータである場合は、同図で示される構成以外に表示部やキー入力部などが存在するが、本発明の説明に必要としないため、図中には示されていない。 【0011】 図1において、通信端末装置10は、カメラなどの画像入力部11、画像入力部11から入力された動画像を符号化処理する符号化部12、符号化部12で符号化された動画像を無線回線などを介して外部に送信処理する送信部13とを備えている。 【0012】 また、符号化部12は、符号化の処理動作を制御する制御部121と、制御部121による制御に従って入力した動画像の符号化処理を行う処理部122とから構成される。 【0013】 ここで処理部122が動画像の符号化を行うために備える機能について説明する。 図2は処理部122の内部の概略構成を示すもので、処理部122は、演算部20、DCT(離散コサイン変換)・量子化部21、エントロピー符号化部22、逆DCT・逆量子化部23、演算部24、デブロッキングフィルタ25、フレームメモリ26、インター予測部27、イントラ予測部28、および切替え部29とを有している。 【0014】 演算部20は、切替え部29から出力された予測信号と、画像入力部11を介して入力された画像から求めた画像フレーム信号である入力信号との差分を求める演算を行う。そして、求められた差分は差分信号として後続する処理のために出力される。 【0015】 DCT・量子化部21は、演算部20から出力された差分信号に対してDCT処理を施してDCT係数を求めるとともに、このDCT係数を量子化して量子化係数を求める。 【0016】 エントロピー符号化部22は、DCT・量子化部21から出力された量子化係数に対してエントロピー符号化処理を施す。このエントロピー符号化としては、例えば、コンテキスト適応型可変長符号化方式やコンテキスト適応型2値算術符号化方式が用いられる。 【0017】 一方、DCT・量子化部21から出力された量子化係数は、逆量子化・逆DCT部23にも入力される。逆量子化・逆DCT部23では、入力された量子化係数に対して逆量子化処理を行ってDCT係数を復元されるとともに、このDCT係数に対して逆DCT処理を行って差分信号を復元させる。 【0018】 演算部24は、逆量子化・逆DCT部23から出力された差分信号と演算部21に入力された予測信号とを用いて画像フレーム信号を復元する。そして、この復元された画像フレーム信号はデブロッキングフィルタ25を介してフレームメモリ26に記憶され、後のインター予測に利用される。 【0019】 デブロッキングフィルタ25は、演算部24の出力である復元された画像フレーム信号に対してデブロッキング処理を行い、符号化処理の単位であるブロック間に生じた歪を低減する処理を行う。 【0020】 インター予測部27は、上記入力信号(画像フレーム信号)とフレームメモリ26に記憶されている復元された過去の画像フレーム信号とから、インター予測での圧縮効率を示すインター予測評価値を求め、また、フレームメモリ26に記憶されている画像フレーム信号から切り出した部分画像フレーム信号をインター予測信号として出力する。 【0021】 イントラ予測部28は、入力された1つの画像フレーム信号を構成するブロック間の相関関係を利用して圧縮処理を行うための予測を行うもので、符号化対象のブロックとこのブロックに隣接したブロックから求めたイントラ予測信号と、このイントラ予測での圧縮効率を示すイントラ予測評価値を出力する。 【0022】 そして、切替え部29は、制御部121の指示に従い、上記入力信号である画像フレーム信号を構成するブロックに対し、インター符号化を行わせるか、イントラ符号化を行わせるかの切り替えを行う。 【0023】 さて、H.264/AVCのイントラ符号化では、輝度信号に対して4×4画素単位で符号化を行う4×4イントラ予測符号化と16×16画素単位で符号化を行う16×16イントラ予測符号化の2つの符号化処理と、色差信号に対する画面内予測符号化と3種類の符号化モードが存在しているため、インター符号化と合わせると合計4つの符号化処理(符号化モード)が存在することになる。 そこで、本発明では、各符号化モードに応じて離散コサイン変換および量子化の処理を適応的に制御することで画質の劣化を伴うことなくこれらの処理の負荷を低減するようにしている。 【0024】 以下、制御部121によって実行される本発明の離散コサイン変換および量子化処理の制御内容、および処理部122による離散コサイン変換および量子化の処理内容について説明する。 【0025】 制御部121は、まず符号化モードの判定を行い、この判定の結果が、インター予測モード、輝度に対するイントラ4×4予測モード、輝度に対するイントラ16×16予測モード、および色差に対するイントラ予測モードのいずれかに該当するかに応じて離散コサイン変換および量子化の処理内容を決定し、処理部122に対して指示を出す。 【0026】 まず、制御部121がインター予測モードであると認識した場合について、図3を参照して説明する。 インター予測モードであることが認識されると、制御部121による制御を受けて、演算部20は、インター予測部27から出力され切替え部29を介して入力されたインター予測信号と入力信号を分割して得た信号とを入力して差分を求め、差分画像を作成する(S11)。そして、この差分画像が求まると、制御部121は、差分画像から4×4画素で構成されるブロック毎に予測誤差を表すSAD(Sum of Absolute Difference)値を計算する(S12)。 【0027】 続いて制御部121は、SAD値の計算が終わると、即ち、予測誤差が求まると、この予測誤差と予め設定されている閾値とを比較し、予測誤差が閾値以下であるか否かの判定を行う(S13)。この判定の結果、予測誤差が閾値以下である場合は、DCT・量子化部21を制御して、全ての量子化係数にゼロ値を代入させる(S14)。 【0028】 ゼロ値の代入処理が完了すると、制御部121は、処理を行ったブロックの示すブロックインデックスが最大値を示すか否かを確認し(S17)、最大値を示す場合は、8×8画素で構成されるブロック、即ち上記SAD値の計算対象とした4×4画素で構成されるブロックが4つで構成されるブロック毎にCBP(coded_block_pattern)値を計算し(S18)、インター予測による符号化処理を終了する。 【0029】 なお、CBP値とは、量子化処理によって得た量子化係数の交流(AC)成分の係数、直流(DC)成分の係数が存在するか否かを示す情報で、CBP値が0のとき交流・直流成分とも係数なし、1のとき直流成分の係数のみ存在、そして2のとき交流成分の係数のみ存在または交流・直流成分とも係数が存在することを示す。 一方、ブロックインデックスが最大値でない場合は、再びS13に戻り、次の4×4画素で構成されるブロックの予測誤差と閾値との比較処理以降を実行する。 【0030】 また、S13の判定において予測誤差が閾値を超えている場合は、制御部121はDCT・量子化部21を制御して、4×4画素で構成されるブロック単位で整数精度のDCT処理を実行させるとともに(S15)、この整数精度のDCT処理で得られた係数に対して量子化処理を実行させる(S16)。 【0031】 その後は、上述のようにブロックインデックスが最大値を示すか否かの確認(S17)、CBPの計算(S18)が行われる。そして、上記の処理が完了すると、DCT・量子化部21から出力された量子化係数はエントロピー符号化部22で可変長符号化処理を施され、送信部13を介してネットワークなどへ出力される。 【0032】 次に、制御部121がイントラ4×4予測モードであると認識した場合について、図4を参照して説明する。 イントラ4×4予測モードであることが認識されると、制御部121による制御に基づいて4×4画素から構成されるブロックの予測画像を作成する(S21)。ここで、予測画像とは、符号化対象のブロック内の各画素をこのブロックの周囲に存在するブロック中で、ブロックの境界位置にある画素を用いて予測するものである。 【0033】 予測画像の作成が終わると、演算部20は、入力信号に含まれる符号化対象のブロックと上記予測画像とから差分画像を作成する(S22)。そして、演算部20によって差分画像が作成されると、制御部121は、この差分画像から予測誤差を表すSAD値の計算を行う(S23)。 【0034】 続いて、制御部121は、予測誤差が求まると、この予測誤差と予め設定されている閾値との比較を行い(S24)、予測誤差が閾値以下である場合は、DCT処理および量子化の処理を行わずに、処理を行ったブロックの示すブロックインデックスが最大値を示すか確認し(S28)、最大値を示す場合は処理を終了する。 一方、ブロックインデックスが最大値でない場合は、再びS21に戻り、次の4×4画素で構成されるブロックに対する処理を継続する。 【0035】 また、S24の判定において予測誤差が閾値を超えている場合は、制御部121はDCT・量子化部21を制御して、4×4画素で構成されるブロックに対するDCT処理を行うとともに(S25)、この整数精度のDCT処理で得られた係数に対して量子化処理を実行させる(S26)。そして、制御部121は、前述のDCT・量子化処理部21で行われた処理結果に基づいてCBP値を計算する(S27)。 【0036】 その後、制御部121は、上記と同様に処理を行ったブロックの示すブロックインデックスが最大値を示すか確認し、ブロックインデックスが最大値でなければS21以下の処理を継続させ、最大値を示す場合は処理を終了させる。 そして、上記の処理が完了すると、DCT・量子化部21から出力された量子化係数はエントロピー符号化部22で可変長符号化処理を施され、送信部13を介してネットワークなどへ出力される。 【0037】 次に、制御部121がイントラ16×16予測モードであると認識した場合について、図5を参照して説明する。 イントラ16×16予測モードであることが認識されると、制御部121による制御に基づいて、イントラ予測部28は、16×16画素から構成されるブロックの予測画像を作成する(S21)。ここでも同様に、予測画像は、符号化対象のブロック内の各画素をこのブロックの周囲に存在するブロック中で、ブロックの境界位置にある画素を用いて予測することで作成される。 【0038】 そして、演算部20を制御することで、作成された予測画像と入力信号を分割して得た16×16画素で構成されるブロックとから差分を求め、差分画像を作成する(S32)。差分画像が求まると、制御部121は、16×16画素で構成される差分画像を4×4画素で構成されるブロックに分割するとともに、この4×4画素のブロック単位で予測誤差を示すSAD値を計算する(S33)。 続いて制御部121は、計算した予測誤差と予め設定された閾値との比較を行い(S34)、予測誤差が閾値以下である場合は、直流成分のみを求める離散コサイン変換を実行させるとともに(S35)、交流成分にゼロ値を代入させる(S36)。 なお、この直流成分のみを求める離散コサイン変換処理は、直流成分と交流成分とを求める通常の離散コサイン変換に比べて軽い処理で求めることが出来るという特徴と備えている。 【0039】 一方、上記予測誤差が閾値を越えている場合は、DCT・量子化部を制御して、4×4画素で構成される差分画像に対して整数精度の離散コサイン変換を実行させ(S37)、そして、この離散コサイン変換で得た交流成分のみについて量子化処理を実行させる(S38)。 そして、上記S36およびS38の処理が終わると、制御部121は、符号化対象の4×4画素のブロックが示すブロックインデックスが最大値であるか確認し(S39)、最大値でない場合は、S34に戻って、次の4×4画素の差分画像に対して同様の処理を実行させる。 また、ブロックインデックスが最大値である場合は、直流成分の係数に対してのみ量子化処理を行い(S40)、その後CBPを計算して処理を終了させる。 なお、上記直流成分の係数に対する量子化処理を行う前に、アダマール変換などの直交変換が行われる。 【0040】 そして、上記の処理が完了すると、DCT・量子化部21から出力された量子化係数はエントロピー符号化部22で可変長符号化処理を施され、送信部13を介してネットワークなどへ出力される。 【0041】 次に、制御部121が色差信号に対して符号化処理を行うと認識した場合について、図6を参照して説明する。 制御部121が色差信号に対して符号化を行うことを認識すると、入力信号中に含まれる符号化対象のブロックと、インター予測部27,またはイントラ予測部28を制御して、符号化対象のブロックの予測画像を求め、そして演算部20を制御して符号化対象のブロックと予測画像との差を演算させて差分画像を作成させる(S51)。なお、色差信号を符号化する場合は、8×8画素で構成されるブロック単位で実行されるため、前記符号化対象のブロックは8×8画像で構成される。 【0042】 差分画像が求まると、制御部121は、差分画像を4×4画素からなるブロックに分割し、この分割されたブロック毎に予測誤差を表すSAD値を計算し(S52)、この予測誤差とあらかじめ設定された閾値との比較を行う(S53)。 この比較の結果、予測誤差が閾値以下である場合は、直流成分のみを求める離散コサイン変換を実行させるとともに(S54)、交流成分にゼロ値を代入させる(S55)。 【0043】 一方、上記予測誤差が閾値を越えている場合は、DCT・量子化部を制御して、4×4画素で構成される差分画像に対して整数精度の離散コサイン変換を実行させ(S56)、そして、この離散コサイン変換で得た交流成分のみについて量子化処理を実行させる(S57)。 【0044】 そして、上記S55およびS57の処理が終わると、制御部121は、符号化対象の4×4画素のブロックが示すブロックインデックスが最大値であるか確認し(S58)、最大値でない場合は、S53に戻って、次の4×4画素の差分画像に対して同様の処理を実行させる。 また、ブロックインデックスが最大値である場合は、直流成分の係数に対してのみ量子化処理を行い(S59)、その後CBPを計算して処理を終了させる。 なお、上記直流成分の係数に対する量子化処理を行う前に、アダマール変換などの直交変換が行われる。 【0045】 そして、上記の処理が完了すると、DCT・量子化部21から出力された量子化係数はエントロピー符号化部22で可変長符号化処理を施され、送信部13を介してネットワークなどへ出力される。 【0046】 このように、符号化モードに応じて離散コサイン変換および量子化処理を変更させることで、画質の劣化を抑えながら離散コサイン変換および量子化処理における処理量を削減することが可能となる。 【0047】 また、イントラ16×16予測モードと色差信号を符号化するモードでは、直流成分の係数が残りやすいという特徴があることから、直流成分の係数に対する量子化は行うことも特徴としている。 【0048】 なお、上記予測誤差と閾値との比較では、「予測誤差<閾値」を基準に判定を行っているが、これを「予測誤差>閾値」として判定しても良い。 【図面の簡単な説明】 【0049】 【図1】動画像の符号化処理機能を備えた通信端末装置の構成を示す図。 【図2】動画像を符号化するための構成を示す図。 【図3】本発明によるインター予測を実行する場合の処理を示す図。 【図4】本発明によるイントラ予測を実行する場合の処理を示す図。 【図5】本発明によるイントラ予測を実行する場合の処理を示す図。 【図6】本発明の色差信号に対する符号化処理を示す図。 【符号の説明】 【0050】 10・・・通信端末装置、11・・・画像入力部、12・・・符号化部、13・・・送信部、121・・・制御部、122・・・処理部、20・・・演算部、21・・・DCT・量子化部、22・・・エントロピー符号化部、23・・・逆量子化・逆DCT部、24・・・演算部、25・・・デブロッキングフィルタ、26・・・フレームメモリ、27・・・インター予測部、28・・・イントラ予測部、29・・・切替え部
|
| 【出願人】 |
【識別番号】000003078 【氏名又は名称】株式会社東芝
|
| 【出願日】 |
平成18年7月6日(2006.7.6) |
| 【代理人】 |
【識別番号】100109900 【弁理士】 【氏名又は名称】堀口 浩
|
| 【公開番号】 |
特開2008−17225(P2008−17225A) |
| 【公開日】 |
平成20年1月24日(2008.1.24) |
| 【出願番号】 |
特願2006−187124(P2006−187124) |
|