トップ :: H 電気 :: H04 電気通信技術




【発明の名称】 エンコード装置、エンコード方法、プログラム、記録媒体、および記録媒体製造方法
【発明者】 【氏名】水野 博志

【氏名】石居 俊之

【要約】 【課題】2パスエンコード方式によるエンコード処理で、簡単に良好な画質の映像を得ることができるようにする。

【構成】エンコード処理101で、入力ビデオデータD1が固定された量子化ステップでエンコードされる。決定処理102で、ピクチャ毎の目標データ量として、目標データ量が、発生データ量と略比例し、目標データ量の総和が一定の容量となるように、目標データ量が決定される。エンコード処理103で、入力ビデオデータD1が所定の量子化ステップでエンコードされるが、ここでの量子化ステップは、決定された各目標データ量が発生する量子化ステップとされる。評価処理104では、エンコード処理103が施されたビデオデータD2の画質が評価され、ビデオデータD2の画質が劣化している部分が特定され、その部分が、新たな目標データ量に基づいて再エンコードされる。本発明はオーサリング装置に適用することができる。
【特許請求の範囲】
【請求項1】
入力映像信号を、可変レートでエンコードするエンコード装置において、
所定の符号化パラメータを用いて、前記入力映像信号をエンコードする第1エンコード手段と、
前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量を、第1のエンコード手段によるエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定する決定手段と、
前記決定手段により決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号をエンコードする第2のエンコード手段と、
前記映像単位の映像信号毎に、前記第2のエンコード手段によりエンコードされた前記入力映像信号に基づく映像の画質を評価する評価手段と
を備え、
前記評価手段は、
前記映像単位の映像信号毎に、前記第2のエンコード手段によりエンコードされた前記入力映像信号を復号し、その結果得られた復号映像信号と、エンコード前の前記入力映像信号との差異を表す歪み係数を算出する第1の算出手段と、
前記映像単位の映像信号に対応する映像の複雑さを表す複雑さ係数を算出する第2の算出手段と、
前記映像単位の映像信号毎に、前記歪み係数と前記複雑さ係数に基づいて、前記復号映像信号に対応する映像の画質の状態を表す歪み指標を算出する第3の算出手段と、
前記歪み指標に基づいて、画質が劣化している区間を特定する特定手段と
を備え、
前記決定手段は、前記特定手段により特定された前記区間に存在する前記映像単位の映像信号の前記目標データ量を調整し、
前記第2のエンコード手段は、前記特定手段により特定された前記区間を、前記決定手段により調整された前記目標データ量に基づいた符号化パラメータを用いてエンコードする
エンコード装置。
【請求項2】
前記目標データの調整量を選択できる選択画面を表示する表示制御手段と
をさらに備え、
前記決定手段は、前記選択画面で選択された調整量だけ前記目標データ量を増加させる
請求項1に記載のエンコード装置。
【請求項3】
前記複雑さ係数は、複雑さ係数が算出されるフレームと、そのフレームの1つ前のフレームの予測誤差の絶対値誤差和、発生ビットレートに量子化パラメータの値を乗算して結果得られた値に対応する値である
請求項1に記載のエンコード装置。
【請求項4】
入力映像信号を、可変レートでエンコードするエンコード方法において、
所定の符号化パラメータを用いて、前記入力映像信号をエンコードする第1エンコードステップと、
前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量を、第1のエンコードステップでのエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定する決定ステップと、
前記決定ステップの処理で決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号をエンコードする第2のエンコードステップと、
前記映像単位の映像信号毎に、前記第2のエンコードステップでエンコードされた前記入力映像信号に基づく映像の画質を評価する評価ステップと
を含み、
前記評価ステップは、
前記映像単位の映像信号毎に、前記第2のエンコードステップでエンコードされた前記入力映像信号を復号し、その結果得られた復号映像信号と、エンコード前の前記入力映像信号との差異を表す歪み係数を算出する第1の算出ステップと、
前記映像単位の映像信号に対応する映像の複雑さを表す複雑さ係数を算出する第2の算出ステップと、
前記映像単位の映像信号毎に、前記歪み係数と前記複雑さ係数に基づいて、前記復号映像信号に対応する映像の画質の状態を表す歪み指標を算出する第3の算出ステップと、
前記歪み指標に基づいて、画質が劣化している区間を特定する特定ステップと
を含み、
前記決定ステップは、前記特定ステップの処理で特定された前記区間に存在する前記映像単位の映像信号の前記目標データ量を調整し、
前記第2のエンコードステップは、前記特定ステップの処理で特定された前記区間を、前記決定ステップの処理で調整された前記目標データ量に基づいた符号化パラメータを用いてエンコードする
エンコード方法。
【請求項5】
入力映像信号を、可変レートでエンコードするエンコード処理をコンピュータに実行させるプログラムにおいて、
所定の符号化パラメータを用いて、前記入力映像信号をエンコードする第1エンコードステップと、
前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量を、第1のエンコードステップでのエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定する決定ステップと、
前記決定ステップの処理で決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号をエンコードする第2のエンコードステップと、
前記映像単位の映像信号毎に、前記第2のエンコードステップでエンコードされた前記入力映像信号に基づく映像の画質を評価する評価ステップと
を含み、
前記評価ステップは、
前記映像単位の映像信号毎に、前記第2のエンコードステップでエンコードされた前記入力映像信号を復号し、その結果得られた復号映像信号と、エンコード前の前記入力映像信号との差異を表す歪み係数を算出する第1の算出ステップと、
前記映像単位の映像信号に対応する映像の複雑さを表す複雑さ係数を算出する第2の算出ステップと、
前記映像単位の映像信号毎に、前記歪み係数と前記複雑さ係数に基づいて、前記復号映像信号に対応する映像の画質の状態を表す歪み指標を算出する第3の算出ステップと、
前記歪み指標に基づいて、画質が劣化している区間を特定する特定ステップと
を含み、
前記決定ステップは、前記特定ステップの処理で特定された前記区間に存在する前記映像単位の映像信号の前記目標データ量を調整し、
前記第2のエンコードステップは、前記特定ステップの処理で特定された前記区間を、前記決定ステップの処理で調整された前記目標データ量に基づいた符号化パラメータを用いてエンコードする
エンコード処理をコンピュータに実行させるプログラム。
【請求項6】
所定の符号化パラメータを用いて、入力映像信号がエンコードされ、
前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量が、前記所定の符号化パラメータを用いたエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定され、
決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号がエンコードされ、
前記映像単位の映像信号毎に、決定された前記目標データに基づいた符号化パラメータを用いてエンコードされた前記入力映像信号に基づく映像の画質が評価され、
その評価結果に基づいて画質が劣化している区間であると特定された区間が、調整された前記目標データ量に基づいた符号化パラメータを用いて再度エンコードされた前記入力映像信号を記録する記録媒体。
【請求項7】
所定の符号化パラメータを用いて、入力映像信号がエンコードされ、
前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量が、前記所定の符号化パラメータを用いたエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定され、
決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号がエンコードされ、
前記映像単位の映像信号毎に、決定された前記目標データに基づいた符号化パラメータを用いてエンコードされた前記入力映像信号に基づく映像の画質が評価され、
その評価結果に基づいて画質が劣化している区間であると特定された区間が、調整された前記目標データ量に基づいた符号化パラメータを用いて再度エンコードされた前記入力映像信号を入力する入力ステップと、
前記入力されたエンコードされた前記入力映像信号を記録媒体に記録する記録ステップと
を含む記録媒体製造方法。
【発明の詳細な説明】【技術分野】
【0001】
本発明は、エンコード装置、エンコード方法、プログラム、記録媒体、および記録媒体製造方法に関し、2パスエンコード方式によるエンコード処理により、良好な画質の画像を容易に得ることができるようにするエンコード装置、エンコード方法、プログラム、記録媒体、および記録媒体製造方法に関する。
【背景技術】
【0002】
光ディスク等のパッケージメディアを作成するために、各種メディアに記録するビデオデータやオーディオデータ等の素材を、データ圧縮するオーサリング装置が存在する。
【0003】
このオーサリング装置におけるビデオデータの圧縮手法として、例えばMPEG(Moving Picture Expert Group)の規格に準拠して、入力素材を一旦固定の量子化ステップでエンコードし、そのとき発生する符号量(すなわち、データ量)などのデータに基づいて本番のエンコード時に発生する目標データ量を決定し、その目標データ量が発生する量子化ステップで本番のエンコードを行うという、2パスエンコードと呼ばれる方式がある(特許文献1参照)。
【0004】
図1には、この2パスエンコード方式によるエンコード処理の概要が図示されている。
【0005】
すなわち第1パス目のエンコード処理1により、例えば、直交基底変換の1種である離散コサイン変換された入力ビデオデータD1が固定の量子化ステップで量子化されて、フレーム内圧縮及びフレーム間圧縮が行われる。
【0006】
目標データ量決定処理2により、例えば、フレーム毎の目標データ量として、目標データ量が、第1パス目のエンコード処理1により発生した符号量(すなわち、データ量)と略比例し、かつ、それぞれの目標データ量の総和が図示せぬ記録媒体(例えば、光ディスク)の総容量となるように、目標データ量が決定される。
【0007】
そして第2パス目のエンコード処理3により、第1パス目のエンコード処理1と同様に離散コサイン変換された入力ビデオデータD1の各フレームが、目標データ量決定処理2で決定された各目標データ量が発生する量子化ステップで量子化されて、フレーム内圧縮及びフレーム間圧縮が行われる。
【0008】
第2パス目のエンコード処理3の結果得られたビデオデータD2が図示せぬ記録媒体に記録される。
【0009】
フレーム間符号化では、動きの激しい部分において予測フレームからの予測誤差が大きくなり、その分、画質劣化を低減するために多くのデータ量が必要となる。またフレーム内符号化では、高周波数成分が多い場合に、離散コサイン変換処理により高次の係数データが発生することにより、その分、画質劣化を低減するために多くのデータ量が必要となる。
【0010】
一定の値に固定された量子化ステップで行われる第1パス目のエンコード処理1により、このように画質劣化を低減するために多くのデータ量を要する部分からは多くのデータ量が発生する。従って第1パス目のエンコード処理1で発生するデータ量は、各フレームの符号化の難易度を表しており、目標データ量決定処理2で、その難易度に基づいてデータ量を配分して目標データ量を決定し、第2パス目のエンコード処理3で、その目標データ量の符号が発生するように入力ビデオデータD1をエンコードすることにより、効率的に入力ビデオエンコードD1を符号化することができる。
【特許文献1】特開平10-66067号公報
【発明の開示】
【発明が解決しようとする課題】
【0011】
しかしながら、上述したように符号化の難易度に応じてデータ量を分配してエンコードを行っても、その配分の結果と人間の視覚特定が完全に対応しない場合があり、2パスエンコード方式で符号化された画像を復号して表示してみると、画質が劣化して見える場合がある。
【0012】
そこで、従来では、第2パス目のエンコード処理3により得られたビデオデータD2を復号して表示して、オペレータが見て画質評価を行い、画質劣化が認められた場合には、その区間の各フレームの目標データ量をオペレータが調整し、再度その目標データ量でその区間をエンコードすることが行われる。
【0013】
すなわち従来の方法では、2パスエンコード方式で良好な画質を得るには、オペレータによる画質評価および目標データ量の調整が必要となり、手間や時間がかかる等の問題があった。
【0014】
また特に、ISO/IEC 14496-10で規格化されたAVC(advanced video coding)を使ったデータ圧縮は、符号化に関する計算処理が多岐に及ぶため、エンコードに多くの時間を要するので、従来の2パスエンコード方式によるデータ圧縮では、オペレータを長時間拘束することとなる。
【0015】
本発明は、このような状況に鑑みてなされたものであり、2パスエンコード方式によるエンコード処理により、良好な画質の映像を容易に得ることができるようにするものである。
【課題を解決するための手段】
【0016】
本発明の第1の側面のエンコード装置は、入力映像信号を、可変レートでエンコードするエンコード装置において、所定の符号化パラメータを用いて、前記入力映像信号をエンコードする第1エンコード手段と、前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量を、第1のエンコード手段によるエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定する決定手段と、前記決定手段により決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号をエンコードする第2のエンコード手段と、前記映像単位の映像信号毎に、前記第2のエンコード手段によりエンコードされた前記入力映像信号に基づく映像の画質を評価する評価手段とを備え、前記評価手段は、前記映像単位の映像信号毎に、前記第2のエンコード手段によりエンコードされた前記入力映像信号を復号し、その結果得られた復号映像信号と、エンコード前の前記入力映像信号との差異を表す歪み係数を算出する第1の算出手段と、前記映像単位の映像信号に対応する映像の複雑さを表す複雑さ係数を算出する第2の算出手段と、前記映像単位の映像信号毎に、前記歪み係数と前記複雑さ係数に基づいて、前記復号映像信号に対応する映像の画質の状態を表す歪み指標を算出する第3の算出手段と、前記歪み指標に基づいて、画質が劣化している区間を特定する特定手段とを備え、前記決定手段は、前記特定手段により特定された前記区間に存在する前記映像単位の映像信号の前記目標データ量を調整し、前記第2のエンコード手段は、前記特定手段により特定された前記区間を、前記決定手段により調整された前記目標データ量に基づいた符号化パラメータを用いてエンコードする。
【0017】
前記目標データの調整量を選択できる選択画面を表示する表示制御手段とをさらに設け、
前記決定手段は、前記選択画面で選択された調整量だけ前記目標データ量を増加させることができる。
【0018】
前記複雑さ係数は、複雑さ係数が算出されるフレームと、そのフレームの1つ前のフレームの予測誤差の絶対値誤差和、発生ビットレートに量子化パラメータの値を乗算して結果得られた値に対応する値であるようにすることができる。
【0019】
本発明の第1の側面のエンコード方法、またはプログラムは、入力映像信号を、可変レートでエンコードするエンコード方法において、または入力映像信号を、可変レートでエンコードするエンコード処理をコンピュータに実行させるプログラムにおいて、所定の符号化パラメータを用いて、前記入力映像信号をエンコードする第1エンコードステップと、前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量を、第1のエンコードステップでのエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定する決定ステップと、前記決定ステップの処理で決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号をエンコードする第2のエンコードステップと、前記映像単位の映像信号毎に、前記第2のエンコードステップでエンコードされた前記入力映像信号に基づく映像の画質を評価する評価ステップとを含み、前記評価ステップは、前記映像単位の映像信号毎に、前記第2のエンコードステップでエンコードされた前記入力映像信号を復号し、その結果得られた復号映像信号と、エンコード前の前記入力映像信号との差異を表す歪み係数を算出する第1の算出ステップと、前記映像単位の映像信号に対応する映像の複雑さを表す複雑さ係数を算出する第2の算出ステップと、前記映像単位の映像信号毎に、前記歪み係数と前記複雑さ係数に基づいて、前記復号映像信号に対応する映像の画質の状態を表す歪み指標を算出する第3の算出ステップと、前記歪み指標に基づいて、画質が劣化している区間を特定する特定ステップとを含み、前記決定ステップは、前記特定ステップの処理で特定された前記区間に存在する前記映像単位の映像信号の前記目標データ量を調整し、前記第2のエンコードステップは、前記特定ステップの処理で特定された前記区間を、前記決定ステップの処理で調整された前記目標データ量に基づいた符号化パラメータを用いてエンコードする。
【0020】
本発明の第1の側面のエンコード装置、エンコード方法、またはプログラムにおいては、所定の符号化パラメータを用いて、前記入力映像信号がエンコードされ、前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量が、エンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定され、決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号がエンコードされ、前記映像単位の映像信号毎に、目標データ量に基づいてエンコードされた前記入力映像信号に基づく映像の画質が評価され、前記映像単位の映像信号毎に、目標データ量に基づいてエンコードされた前記入力映像信号を復号し、その結果得られた復号映像信号と、エンコード前の前記入力映像信号との差異を表す歪み係数が算出され、前記映像単位の映像信号に対応する映像の複雑さを表す複雑さ係数が算出され、前記映像単位の映像信号毎に、前記歪み係数と前記複雑さ係数に基づいて、前記復号映像信号に対応する映像の画質の状態を表す歪み指標が算出され、前記歪み指標に基づいて、画質が劣化している区間が特定され、特定された前記区間に存在する前記映像単位の映像信号の前記目標データ量が調整され、特定された前記区間が、調整された前記目標データ量に基づいた符号化パラメータを用いてエンコードされる。
【0021】
本発明の第2の側面の記録媒体は、所定の符号化パラメータを用いて、入力映像信号がエンコードされ、前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量が、前記所定の符号化パラメータを用いたエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定され、決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号がエンコードされ、前記映像単位の映像信号毎に、決定された前記目標データに基づいた符号化パラメータを用いてエンコードされた前記入力映像信号に基づく映像の画質が評価され、その評価結果に基づいて画質が劣化している区間であると特定された区間が、調整された前記目標データ量に基づいた符号化パラメータを用いて再度エンコードされた前記入力映像信号が記録される。
【0022】
本発明の第3の側面の記録媒体製造方法は、所定の符号化パラメータを用いて、入力映像信号がエンコードされ、前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量が、前記所定の符号化パラメータを用いたエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定され、決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号がエンコードされ、前記映像単位の映像信号毎に、決定された前記目標データに基づいた符号化パラメータを用いてエンコードされた前記入力映像信号に基づく映像の画質が評価され、その評価結果に基づいて画質が劣化している区間であると特定された区間が、調整された前記目標データ量に基づいた符号化パラメータを用いて再度エンコードされた前記入力映像信号を入力する入力ステップと、前記入力されたエンコードされた前記入力映像信号を記録媒体に記録する記録ステップとを含む。
【0023】
本発明の第3の側面の記録媒体製造方法においては、所定の符号化パラメータを用いて、入力映像信号がエンコードされ、前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量が、前記所定の符号化パラメータを用いたエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定され、決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号がエンコードされ、前記映像単位の映像信号毎に、決定された前記目標データに基づいた符号化パラメータを用いてエンコードされた前記入力映像信号に基づく映像の画質が評価され、その評価結果に基づいて画質が劣化している区間であると特定された区間が、調整された前記目標データ量に基づいた符号化パラメータを用いて再度エンコードされた前記入力映像信号が入力され、前記入力されたエンコードされた前記入力映像信号が記録媒体に記録される。
【発明の効果】
【0024】
本発明に第1乃至第3の側面によれば、2パスエンコード方式によるエンコード処理により、良好な画質の映像を容易に得ることができ、またそのような映像を記録することができる。
【発明を実施するための最良の形態】
【0025】
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
【0026】
本発明の第1の側面のエンコード装置は、
入力映像信号を、可変レートでエンコードするエンコード装置(例えば、図2のビデオ信号処理装置24)において、
所定の符号化パラメータを用いて、前記入力映像信号をエンコードする第1エンコード手段(例えば、図5の第1パス目のエンコード処理101を行う図4のAVCコントロール93とAVCエンコーダ94)と、
前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量を、第1のエンコード手段によるエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定する決定手段(例えば、図5の目標データ量決定処理102を行う図4のエンコードマネージャ92)と、
前記決定手段により決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号をエンコードする第2のエンコード手段(例えば、図5の第2パス目のエンコード処理101を行う図4のAVCコントロール93とAVCエンコーダ94)と、
前記映像単位の映像信号毎に、前記第2のエンコード手段によりエンコードされた前記入力映像信号に基づく映像の画質を評価する評価手段段(例えば、図5の目標データ量決定処理102を行う図4のエンコードマネージャ92)と
を備え、
前記評価手段は、
前記映像単位の映像信号毎に、前記第2のエンコード手段によりエンコードされた前記入力映像信号を復号し、その結果得られた復号映像信号と、エンコード前の前記入力映像信号との差異を表す歪み係数(例えば、歪み係数DIST)を算出する第1の算出手段(例えば、図7のステップS11)と、
前記映像単位の映像信号に対応する映像の複雑さを表す複雑さ係数(例えば、複雑さ係数Q)を算出する第2の算出手段(例えば、図7のステップS12)と、
前記映像単位の映像信号毎に、前記歪み係数と前記複雑さ係数に基づいて、前記復号映像信号に対応する映像の画質の状態を表す歪み指標(例えば、歪み指標W)を算出する第3の算出手段(例えば、図7のステップS13)と、
前記歪み指標に基づいて、画質が劣化している区間を特定する特定手段(例えば、図7のステップS14およびステップS15)と
を備え、
前記決定手段は、前記特定手段により特定された前記区間に存在する前記映像単位の映像信号の前記目標データ量を調整し、
前記第2のエンコード手段は、前記特定手段により特定された前記区間を、前記決定手段により調整された前記目標データ量に基づいた符号化パラメータを用いてエンコードする。
【0027】
前記目標データの調整量を選択できる選択画面(例えば、図9)を表示する表示制御手段(例えば、図4のGUI91)と
をさらに備え、
前記決定手段は、前記選択画面で選択された調整量だけ前記目標データ量を増加させることができる。
【0028】
本発明の第2の側面の記録媒体は、
所定の符号化パラメータを用いて、入力映像信号がエンコードされ、
前記入力映像信号を構成する所定の映像単位の映像信号毎の目標データ量が、所定の符号化パラメータを用いたエンコードにより発生したデータ量と略比例し、かつ、それぞれの目標データ量の総和が所定の容量となるように決定され、
決定された前記目標データに基づいた符号化パラメータを用いて、前記入力映像信号がエンコードされ、
前記映像単位の映像信号毎に、決定された前記目標データに基づいた符号化パラメータを用いてエンコードされた前記入力映像信号に基づく映像の画質が評価され、
その評価結果に基づいて画質が劣化している区間であると特定された区間が、調整された前記目標データ量に基づいた符号化パラメータを用いて再度エンコードされた前記入力映像信号を記録する記録媒体(例えば、図3のマスタディスク64)。
【0029】
図2は、本発明を適用したオーサリング装置11の構成例を示している。オーサリング装置11は、メニュー信号処理装置21乃至オーサリングアプリケーション28が、ネットワーク30を介して相互に接続されている構成を有し、後述する光ディスク等のマスタディスク64(図3)に記録される多重ストリームを生成し、出力部29を介して出力する。
【0030】
メニュー信号処理装置21は、オーサリングアプリケーション28による制御に従って、図示せぬビデオテープレコーダ等より供給されるメニュー画面のビデオデータをエンコード処理し、その結果得られるビデオデータをネットワーク30を介してファイルサーバ27に供給して格納する。
【0031】
タイトル信号処理装置22は、オーサリングアプリケーション28による制御に従って、図示せぬビデオテープレコーダより供給されるタイトル等のビデオデータをエンコード処理し、その結果得られたビデオデータをネットワーク30を介してファイルサーバ27に供給して格納する。
【0032】
オーディオ信号処理装置23は、オーサリングアプリケーション28による制御に従って、図示せぬテープレコーダより供給されるオーディオデータをエンコード処理し、その結果得られたオーディオデータをファイルサーバ27に供給して格納する。
【0033】
ビデオ信号処理装置24は、オーサリングアプリケーション28による制御に従って、後述するように、マスタディスク64に主として記録されるコンテンツのビデオデータをエンコード処理し、その結果得られたビデオデータをネットワーク30を介してファイルサーバ27に供給して格納する。
【0034】
マルチプレクサ25は、オーサリングアプリケーション28による制御に従って、エンコード処理されてファイルサーバ27に記憶されているビデオデータ等について、これらビデオデータ等による多重ストリーム作成用のファイルを作成し、多重ストリームを生成する。
【0035】
ダウンローダ26は、外部とのインタフェースとしての出力部29を介して、マルチプレクサ25により作成された多重ストリームファイルを、外部に出力する。
【0036】
例えば、出力部29が磁気テープ(例えば、デジタルリニアテープ等)やHDDに接続されている場合、多重ストリームは、その磁気テープやHDDに記録される。この場合、その磁気テープ等によって、エンコードされたビデオデータ等が後述するマスタディスク64を作成するオーサリング装置51(図3)に提供される。
【0037】
また出力部29がマスタディスク64を作成するオーサリング装置51とネットワーク(図示せず)を介して接続されている場合、作成された多重ストリームは、そのネットワークを介してオーサリング装置51に提供される。
【0038】
ファイルサーバ27は、ネットワーク管理機能をもつコンピュータと高速アクセス可能なディスクアレイにより構成され、ビデオ信号処理装置24等によりデータ圧縮されたビデオデータ等を記憶し、またマルチプレクサ25等の要求に応動して保持したデータを出力する。
【0039】
オーサリングアプリケーション28は、このオーサリング装置11全体の動作を制御するコンピュータにより構成され、オペレータの設定した条件に従って各装置の動作を制御する。
【0040】
図3は、図2のオーサリング装置11により生成された多重ストリームを記録媒体(図3の例では、マスタディスク64)に記録するオーサリング装置51の構成例を示している。
【0041】
オーサリング装置11により作成された多重ストリームは、磁気テープ等の記録媒体やネットワークを介してオーサリング装置51に供給され、そのディスクイメージデータが、プリマスタリング61に入力される。
【0042】
プリマスタリング61には、さらに、外部から与えられたコピープロテクションデータが入力され、プリマスタリング61は、そのコピープロテクションデータを用いてディスクイメージデータを暗号化して、フォーマッタ62に出力する。
【0043】
フォーマッタ62は、プリマスタリング62から供給された暗号化されたディスクイメージデータに対して、信号のレベル変換などの処理を施し、カッティング装置63に出力する。カッティング装置63は、フォーマッタ62から送られる信号を元にマスタディスク64を作成する。
【0044】
図4は、図2のオーサリング装置11のビデオ信号処理装置24の構成例を示している。
【0045】
ビデオファイルサーバ81は、図3のマスタディスク64に記録される入力ビデオデータをファイル形式で保持し、オーサリングアプリケーション28により通知された編集リストに示された入力ビデオデータファイルを提供し、これにより処理対象のビデオデータD1をコントローラ82に供給する。
【0046】
ビデオファイルサーバ81はまた、コントローラ82によりビデオデータD1が後述するようにエンコードされた結果得られたビデオデータD2を記憶する。
【0047】
コントローラ82は、ビデオ信号処理装置24に割当てられたコンピュータにより構成され、ネットワーク30を介して、オーサリングアプリケーション28とビデオファイルサーバ81に接続されている。
【0048】
コントローラ82は、ネットワーク30を介してオーサリングアプリケーション28との間のデータ通信により、このビデオ信号処理装置24全体の動作を制御し、例えばビデオファイルサーバ81から出力されたビデオデータD1に対して、2パスエンコード方式のエンコード処理を施して、データ圧縮を行う。コントローラ82は、このエンコード処理の結果得られたビデオデータD2を、ネットワーク30を介してビデオファイルサーバ81に供給して格納する。
【0049】
ここでコントローラ82により行われる2パスエンコード方式のエンコード処理の概要を、図5を参照して説明する。なおここでは、H.264/AVC(advanced video coding)規格に準拠した可変レートエンコード処理が実行されるものとする。
【0050】
第1パス目のエンコード処理101により、例えば、直交基底変換の1種である離散コサイン変換された入力ビデオデータD1が所定の量子化パラメータ(すなわち、量子化ステップ)を用いてエンコードされて、フレーム内圧縮及びフレーム間圧縮される。ここでの量子化ステップは、図1の第1パス目のエンコード処理1の場合と同様に所定の値に固定されている。
【0051】
目標データ量決定処理102により、例えば、フレーム毎の目標データ量として、目標データ量が、第1パス目のエンコード処理101により発生する発生データ量と略比例し、かつ、それぞれの目標データ量の総和が記録媒体(例えば、図3のマスタディスク64)の総容量から一定の容量が差し引かれた容量となるように、目標データ量が決定される。
【0052】
MPEG-2やMPEG-4では、ピクチャやフレームに相当するVOP(Video Object Plane)が符号化の基本単位とされていたが、AVCでは、スライスと呼ばれる単位が存在し、1つのピクチャを異なる種類のスライスで構成することができる。しかしながら、ここでは簡単のために、AVCにおける符号化単位を単にフレームと称する。
【0053】
第2パス目のエンコード処理103により、離散コサイン変換された入力ビデオデータD1の各フレームが、目標データ量決定処理102で決定された各目標データ量に基づいた所定の量子化パラメータ(すなわち、各目標データが発生する量子化ステップ)でエンコードされて、フレーム内圧縮及びフレーム間圧縮される。
【0054】
評価処理104により、第2パス目のエンコード処理103の結果得られたビデオデータD2に基づく画像の画質が評価され、画質が劣化している部分が特定される。
【0055】
例えばフレーム毎に、第2パス目のエンコード処理103の結果得られたビデオデータD2が復号された結果得られたビデオデータと、入力ビデオデータD1の差異が数値化されて、画質が劣化している部分が特定される。なおこの例では、画質が劣化している部分は、RAP(Ramdon Access Point)-IDR(Instantaneous Decoding Refresh:デコーダ復号動作の瞬時リフレッシュ)ピクチャ間隔の区間単位で特定されるものとする。
【0056】
このように評価処理104により画質が劣化している区間が特定されると、目標データ量決定処理102により、画質が劣化しているとされた区間の目標データ量が、所定分だけ増加される。そして、第2パス目のエンコード処理103により、その区間が、増加された目標データ量が発生する量子化ステップで再エンコードされる。
【0057】
このように本発明に係る2パスエンコード方式によるエンコード処理では、最初に決定された目標データ量に基づいて行われたエンコードの結果得られたビデオデータD2に基づく画像の画質が評価されて、画質が劣化している部分が特定されるとともに、画質が劣化している部分については、目標データ量が調整されて再エンコードされるので、原則、オペレータによる画質評価や目標データ量の調整が必要なく、簡単に良好な画質を得ることができる。
【0058】
図4に戻り、コントローラ82の構成について説明する。
【0059】
コントローラ82は、コントローラ82を構成するROM等に記憶されているプログラムを実行することによって、GUI91乃至デコードコントロール97の機能を実現し、ビデオファイルサーバ81から出力されたビデオデータD1に対して、図5に示したような2パスエンコード方式のエンコード処理を施して、データ圧縮を行う。
【0060】
グラフィカルユーザインターフェース(GUI:Graphical User Interface)91は、オペレータのオーサリング装置11に対する操作を受け付け、オーサリングアプリケーション28に通知するとともに、オーサリングアプリケーション28からの指令を、エンコードマネージャ92に通知する。
【0061】
エンコードマネージャ92は、AVCコントロール93、ウェイトコントロール95、およびデコードコントロール97を制御して、図5に示した第1パス目のエンコード処理101や第2パス目のエンコード処理103に相当する処理等を実行させるとともに、自ら目標データ量決定処理102および評価処理104に相当する処理を実行する。
【0062】
AVCコントロール93は、AVCエンコーダ94に実行させるエンコード処理における条件を適宜変更する。
【0063】
AVCエンコーダ94は、AVCコントロール93により設定されたエンコードの条件に基づいて、H.264/AVCの規格に準拠するデータ圧縮を行う。
【0064】
例えばAVCエンコーダ94は、AVCコントロール93に設定された固定の量子化ステップで、ビデオデータD1をエンコードするとともに(図5の第1パス目のエンコード処理101に相当する処理)、そのエンコードにより発生したデータ量(すなわち、難易度)を、AVCコントロール93を介してエンコードマネージャ92に供給する。エンコードマネージャ92はこうして得られた難易度をinfoデータベース98に供給して格納する。
【0065】
AVCエンコーダ94はまた、AVCコントロール93に設定された、エンコードマネージャ92により、符号化の難易度に基づいて決定された目標データ量(図5の目標データ量決定処理102に相当する処理)が発生する量子化ステップで、ビデオデータB1をエンコードし(図5の第2パス目のエンコード処理103)、その結果得られたビデオデータD2をネットワーク30を介してビデオファイルサーバ81に供給して格納する。
【0066】
AVCエンコーダ94はさらに、マルチパスコントロール96に設定された、エンコードマネージャ92により、ビデオデコーダD2の画質評価に基づいて画質が劣化していると特定されたビデオデータD1の部分を(図5の評価処理104に相当する処理)、新たに設定された目標データ量(図5の目標データ量決定処理102に相当する処理)が発生する量子化ステップで再度エンコードし、その結果得られたビデオデータD2をネットワーク30を介してファイルビデオファイルサーバ81に供給して格納する。
【0067】
ビデオファイルサーバ81は、再エンコードされた結果得られたビデオデータD2(以下、適宜、ビデオデータD2’と称する)が供給された場合、先に記憶しているビデオデータD2の中の、ビデオデータD2’に対応する部分をそのビデオデータD2’に差し替えて記憶する。
【0068】
ウェイトコントロール95は、画質が劣化している部分に割当てられる目標データ量の調整量を、マルチパスコントロール96に設定する。なおこの調整量は、オーサリングアプリケーション28より通知される。
【0069】
マルチパスコントロール96は、ウェイトコントロール95に設定された調整量に基づいて目標データ量を調整し、AVCエンコーダ94に設定する。
【0070】
デコードコントロール97は、ビデオファイルサーバ81に格納されている目標データ量に基づくエンコードの結果得られたビデオデータD2がデコードされた結果得られたビデオデータD3を、表示部83に供給して表示させる。
【0071】
なおこの例では、AVCエンコーダ94が、オーサリングアプリケーション28により通知された編集リストに従ってビデオファイルサーバ81内のビデオデータファイルを制御し、所定の編集対象(すなわち、所定のビデオデータD2)をデコードし、その結果得られたビデオデータD3をデコードコントロール97またはビデオファイルサーバ81に供給するものとする。
【0072】
次に、ビデオ信号処理装置24の動作を、図6のフローチャートを参照して説明する。
【0073】
ビデオ信号処理装置24のコントローラ82は、オーサリングアプリケーション28より編集リストが供給され、処理対象のビデオデータが指示されると、ステップS1において、グラフィカルユーザインターフェース91の管理によりエンコードマネージャ92を起動させるとともに、オーサリングアプリケーション28から供給された符号化ファイル(例えば、VENC.XMLファイル)から、アクセス(チャプタ)ポイント、シーンチェンジ自動検出ON/OFF、ディスク容量(この例の場合、図3のマスタディスク64の容量)、ビデオデータに割当てられるデータ量、入力ビデオファイルの開始および終了位置などのエンコードの条件を取得する。
【0074】
オーサリングアプリケーション28から供給される符号化ファイルには、オペレータが設定したチャプタの時間情報も含まれている。ここでチャプタは、強制的にフレーム内符号化処理により符号化処理するフレームであり、この種の光ディスク装置では、このチャプタを目標にしてトラックジャンプして記録内容を確認できるようになされている。
【0075】
符号化ファイルにはまた、ビデオ信号について、GOP(Group Of Pictures)に相当するIDRピクチャ間隔の最大表示フィールド数(15フレーム)、各IDRピクチャ間隔区間におけるエンコード処理の配列を示す情報等も含まれている。
【0076】
符号化ファイルにはまた、ウェイトコントロール95に通知される、画質が劣化している部分に割当てられる目標データ量の調整量も含まれている。
【0077】
さらに符号化ファイルには、マルチアングルの処理対象を示す情報が含まれている。なおマルチアングルとは、複数のビデオ素材を時分割多重化して光ディスクに記録することにより、ユーザの選択に応じて、例えば列車の走行シーン等を異なる撮影箇所より視聴できるようにした処理である。
【0078】
ステップS2において、エンコードマネージャ92は、AVCコントロール93およびAVCエンコーダ94を制御して、各フレームのエンコードに要する難易度を測定させる。
【0079】
すなわちAVCコントロール93は、所定の値の量子化ステップをAVCエンコーダ94に設定し、AVCエンコーダ94は、設定された値で固定した量子化ステップでエンコード処理対象でなる一連の入力ビデオデータD1をエンコード処理し、その処理により発生した各フレームの符号量(すなわち、データ量)を、AVCコントロール93を介してエンコードマネージャ92に通知する(図5の第1パス目のエンコード処理101に相当する処理)。エンコードマネージャ92は、AVCエンコーダ94により通知された、各フレームから発生したデータ量(すなわち、難易度)を、infoデータベース98に供給して格納する。
【0080】
ステップS3において、エンコードマネージャ92は、各フレームのピクチャタイプの設定処理を行う。なおこの例では、各フレームは、1つのピクチャタイプからなるピクチャで構成されているものとする。
【0081】
具体的には、エンコードマネージャ92は、オーサリングアプリケーション28から供給された符号化ファイルに、オペレータが設定したチャプタの時間情報が含まれている場合、AVCコントロール93に、その時間情報に対応するフレームを指定し、AVCエンコーダ94に、指定したフレームをIDRピクチャに設定させる。
【0082】
またエンコードマネージャ92は、オーサリングアプリケーション28から供給された符号化ファイルに、シーンチェンジ自動検出がONに設定されている旨を示す情報が含まれている場合、AVCコントロール93を制御して、AVCエンコーダ94に、前後のフレームデータの相関関係からシーンチェンジと判定されたフレームを強制的にIDRピクチャに設定させる。
【0083】
次にステップS4において、エンコードマネージャ92は、ステップS2で測定した各フレームの難易度と、ステップS3で決定したピクチャタイプに基づいて、各フレームに割当てる目標データ量を決定する(図5の目標データ量決定処理102に相当する処理)。
【0084】
各フレームの目標データ量は、ステップS2でのエンコード処理(図5の第1パス目のエンコード処理101に相当する処理)により発生する発生データ量(すなわち、難易度)と略比例し、かつ、式(1)に示すように、それぞれの目標データ量の総和TOTAL_SUPPLYが記録媒体(例えば、図3のマスタディスク64)の総容量の中のビデオデータに割当てられている容量TOTAL_BYTESから一定の容量TOTAL_HEADERが差し引かれた容量となるように、目標データ量が決定される。
【0085】
【数1】


【0086】
一定の容量TOTAL_HEADERは、GOPの総数により計算されるヘッダ等の付随的なデータのデータ量と、画質が劣化している部分に再度割当てられる目標データ量の増加分のための記録媒体に設けられたマージン領域の容量である。
【0087】
次に、ステップS5において、エンコードマネージャ92は、AVCコントロール93およびAVCエンコーダ94を制御して、ステップS4で決定した目標データ量に基づいて入力ビデオデータD1をエンコードさせる(図5の第2パス目のエンコード処理103に相当する処理)。
【0088】
すなわちAVCコントロール93は、ステップS4で決定された目標データ量を、AVCエンコーダ94に設定し、AVCエンコーダ94は、設定された目標データ量が発生する量子化ステップで、ビデオファイルサーバ81から出力された編集対象としてのビデオデータD1をエンコードし、その結果得られたビデオデータD2をネットワーク30を介してビデオファイルサーバ81に供給して格納する。
【0089】
次にステップS6において、ステップS5で行われた目標データ量に基づくエンコードの結果を評価する(図5の評価処理104に相当する処理)。
【0090】
ここでの処理の詳細は、図7のフローチャートに示されている。
【0091】
ステップS11において、エンコードマネージャ92は、符号化前のビデオデータD1と図6のステップS5での目標データに基づくエンコード処理が施されたビデオデータD2を復号した結果得られるビデオデータD3との差異を示す係数(以下、歪み係数DISTと称する)を算出する。
【0092】
具体的には、各フレーム毎に、符号化前のビデオデータD1と、ステップS5で目標データ量に基づくエンコード処理が施された結果得られビデオデータD2が復号されたビデオデータD3との各画素の画素値の差分の2乗平均値が歪み係数DISTとして算出される。
【0093】
なおここでのビデオデータD2のデコードは、AVCエンコーダ94により行われるものとする。
【0094】
ステップS12において、エンコードマネージャ92は、各フレーム毎に、絵柄等の複雑さを表す係数(以下、複雑さ係数Qと称する)を算出する。
【0095】
具体的には、複雑さ係数Qが算出されるフレームと、そのフレームの1つ前のフレームの予測誤差の絶対値総和が複雑さ係数Qとして求められ、また式(2)や式(3)によって複雑さ係数Qが求められる。
【0096】
【数2】


【0097】
【数3】


【0098】
式(2)および式(3)中のiRateは、発生ビットレートであり、QSは、式(4)で求められる。式(4)中、iBaseQPは、量子化パラメータの値である。
【0099】
【数4】


【0100】
次にステップS13において、エンコードマネージャ92は、ステップS11で求めた歪み係数DISTとステップS12で求めた複雑さ係数Qを利用して、式(5)を演算して、歪み指標Wを算出する。式(5)中、Aは、重み係数(A ≧ 1.0)である。
【0101】
【数5】


【0102】
すなわち歪み指標Wは、歪み係数DISTに比例し、複雑さ係数Qに反比例する値であり、例えば歪み係数DISTが各フレームにおいてだいたい同じである場合、平坦な絵柄のフレームでは、複雑さ係数Qが小さな値となるので、そのフレームの歪み指標Wは大きな値となる。
【0103】
ステップS14において、エンコードマネージャ92は、基準閾値Lを算出する。
【0104】
具体的には、基準閾値Lは、式(6)および式(7)で求められるS1からS2の間の所定の値とされる。
【0105】
【数6】


【0106】
【数7】


【0107】
式(6)および式(7)中の、Aveは、図8に示すように、各フレームの歪み指標Wの平均値であり、SDはその標準偏差値である。
【0108】
図7に戻り次に、ステップS15において、エンコードマネージャ92は、ステップS14で求めた基準閾値Lを利用して、画質が劣化している部分(以下、カスタマイズ区間と称する)を特定する。
【0109】
この例の場合、カスタマイズ区間は、RAP-IDRピクチャ間隔単位に特定される。
【0110】
例えば、RAP-IDRピクチャ間隔内の各ピクチャの歪み指標Wの平均値が基準閾値L以上となっているRAP-IDRピクチャ間隔の区間がカスタマイズ区間とされる。
【0111】
またRAP-IDRピクチャ間隔内の各ピクチャの歪み指標Wが基準閾値L以上になっているピクチャの数が総ピクチャ数の20%以上であるRAP-IDRピクチャ間隔の区間がカスタマイズ区間とされる。
【0112】
またRAP-IDRピクチャ間隔内に基準閾値L以上のピクチャが一つでも存在するRAP-IDRピクチャ間隔の区間がカスタマイズ区間とされる。
【0113】
このようにカスタマイズ区間が特定されると、図6のステップS7に進み、エンコードマネージャ92は、ステップS6での処理により、カスタマイズ区間が特定されたか否かを判定し、特定されたと判定した場合、ステップS8に進む。
【0114】
ステップS8において、エンコードマネージャ92は、ウェイトコントロール95を制御して、カスタマイズ区間に割当てる目標データ量の調整量を決定させ、マルチコントロール96に設定させる。そのときマルチコントロール96は、ウェイトコントロール95に設定された調整量に基づいて目標データ量を増加させ、データ量が増加した目標データ量を、AVCエンコーダ94に設定する。
【0115】
いまの例の場合、カスタマイズ区間の目標データ量は、ステップS5でのエンコード処理で用いた目標データ量を、予め決められた所定分(例えば、10%)だけ増やしたデータ量となる。
【0116】
ステップS9において、AVCエンコーダ94は、マルチコントロール96により設定された新たな目標データ量が発生する量子化ステップで、ビデオデータD1のカスタマイズ区間をエンコードし、その結果得られたビデオデータD2を、ネットワーク30を介してビデオファイルサーバ81に供給する。
【0117】
ビデオファイルサーバ81は、再エンコードされたビデオデータD2’が供給された場合、先に記憶しているビデオデータD2の中の、再エンドードされたビデオデータD2’に対応する部分をそのビデオデータD2’に差し替えて記憶する。
【0118】
ステップS7で、カスタマイズ区間が存在しないと判定されたとき、またはステップS9でカスタマイズ区間が再エンコードされたとき、処理は終了する。
【0119】
以上のように、1度設定した目標データ量に基づくエンコード処理の結果を評価して、その評価結果に基づいて目標データを調整し、再度エンコード処理を行うようにしたので、2パスエンコード方式によるエンコード処理において、簡単に良好な画質の画像を得ることができる。
【0120】
また絵柄が簡単な映像では、視覚的に、歪み係数DSITによる映像の歪みが大きく、視覚上目立つことが知られている。そこで式(5)に示したように、各フレームにおいて歪み係数DSITがほぼ同じである場合であっても、複雑さ係数Qが小さいとき(すなわち、例えば平坦な絵柄のフレームの場合)、歪み指標Wが大きくなるようにし、そのフレームについて再エンコードされるようにしたので、効率よく、画質の劣化を補正することができる。
【0121】
また以上においては、図7のステップS12では複雑さ係数Qが、複雑さ係数Qが算出されるフレームと、そのフレームの1つ前のフレームの予測誤差の絶対値総和、又は式(2)若しくは式(3)によって求められる値の中の所定のものに予め決められており、ステップS14では、基準閾値LとするS1とS2間の位置が予め決められており、ステップS15ではカスタマイズ区間の特定パターンが予め決められており、そして図6のステップS8ではカスタマイズ区間の目標データ量の調整量も、所定のものに予め決められていたが、これらの選択を、オペレータが行うことができるようにすることもできる。
【0122】
例えば、ステップS14での基準閾値Lについては、オペレータは、基準閾値LをS1よりまたはS2よりに設定することができる。なお基準閾値L=Ave+S1とすると、多くのピクチャがカスタマイズ区間を決定する際に参照されることになり、特定されるカスタマイズ区間の数を多くすることができる。一方、基準閾値L=Ave+S2とすると、カスタマイズ区間を決定する際に参照されるピクチャが少なくなり、特定されるカスタマイズ区間の数を少なくすることができる。
【0123】
また、ステップS8でのカスタマイズ区間の再配分される目標データ量の調整量を選択することができる場合、例えば、いくつかの調整量から選択することができるように、図9に示すような選択画面を表示させることができる。
【0124】
図9に示す選択画面の表示部201には、選択可能な調整量(図9の例の場合、最初に決定された目標データ量に対して、10%、12%、14%分のデータ量を増やすことができる調整量)を選択することができる表示が設定され、オペレータは、図示せぬ操作部を操作して、いずれかの調整量を選択することができる。
【0125】
図9の例ではまた、いずれかの調整量を選択して、表示部202の“Temporary”に対応するチェックボタン211を選択して、決定ボタン203を操作すれば、その調整量で増加した目標データ量に基づいて再エンコードされたそのカスタマイズ区間に関する情報を、図10に示したように表示することができる。すなわちオペレータは、その調整量でのエンコードの内容を確認することができる。
【0126】
また図9の表示部202の“Determinate”のチェックボタン212をチェックして、決定ボタン203を操作すれば、そのカスタマイズ区間を再エンコードする際の目標データ量を、その調整量に応じて増加したデータ量に決定することができる。
【0127】
なお図10の表示部251には、双方向の矢印291に対応するカスタマイズ区間に対する目標データ量が10%増加されていることが示されている。
【0128】
なお図9または図10に示す画面の表示およびその画面に対する入力の受付は、図4のGUI91により管理される。
【0129】
このようにオペレータが各条件を選択する際には、入力ビデオデータD1と、最初の目標データ量に基づいてエンコードされたビデオデータD2を復号して、両者を比べやすいように表示部83に表示させ、オペレータは、それらの映像を見ながら各条件を選択することができるようにすることもできる。
【0130】
また以上においては、予めマージン領域を確保しておき、カスタマイズ区間が特定され、その区間の目標データ量が増加しても、データ量が記録媒体の記録容量を超えないようにしておくことにより、カスタマイズ区間毎に再エンコードができるようにしたが、このマージン領域を確保せずに、カスタマイズ区間が特定された後、入力ビデオデータ全体の目標データ量の決定を最初からやり直すこともできる。
【0131】
また以上においては、目標データ量の調整量が一律に決定されたが、第2パス目のエンコード処理103により発生したデータ量をさらに考慮して目標データ量の調整量を決定することもできる。
【0132】
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
【0133】
そこで、図11は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
【0134】
プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク105やROM103に予め記録しておくことができる。
【0135】
あるいはまた、プログラムは、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体111に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体111は、いわゆるパッケージソフトウエアとして提供することができる。
【0136】
なお、プログラムは、上述したようなリムーバブル記録媒体111からコンピュータにインストールする他、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部108で受信し、内蔵するハードディスク105にインストールすることができる。
【0137】
コンピュータは、CPU(Central Processing Unit)102を内蔵している。CPU102には、バス101を介して、入出力インタフェース110が接続されており、CPU102は、入出力インタフェース110を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部107が操作等されることにより指令が入力されると、それにしたがって、ROM(Read Only Memory)103に格納されているプログラムを実行する。あるいは、また、CPU102は、ハードディスク105に格納されているプログラム、衛星若しくはネットワークから転送され、通信部108で受信されてハードディスク105にインストールされたプログラム、またはドライブ109に装着されたリムーバブル記録媒体111から読み出されてハードディスク105にインストールされたプログラムを、RAM(Random Access Memory)104にロードして実行する。これにより、CPU102は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU102は、その処理結果を、必要に応じて、例えば、入出力インタフェース110を介して、LCD(Liquid Crystal Display)やスピーカ等で構成される出力部106から出力、あるいは、通信部108から送信、さらには、ハードディスク105に記録等させる。
【0138】
ここで、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むものである。
【0139】
また、プログラムは、1のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
【0140】
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【図面の簡単な説明】
【0141】
【図1】従来の2パスエンコード方式によるエンコード処理の概要を示す図である。
【図2】本発明を適用したオーサリング装置11の構成例を示すブロック図である。
【図3】本発明を適用したオーサリング装置51の構成例を示すブロック図である。
【図4】図2のオーサリング装置11のビデオ信号処理装置24の構成例を示すブロック図である。
【図5】本発明の2パスエンコード方式によるエンコード処理の概要を示す図である。
【図6】ビデオ信号処理装置24の動作を説明するフローチャートである。
【図7】図6のステップS6の処理の詳細を示すフローチャートである。
【図8】図7のステップS14での基準閾値Lの決定方法を説明する図である。
【図9】目標データ量の調整量を選択する選択画面の表示例を示す図である。
【図10】カスタマイズ区間に関する情報の表示例を示す図である。
【図11】本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
【符号の説明】
【0142】
11 オーサリング装置, 24 ビデオ信号処理装置, 27 ファイルサーバ, 28 オーサリングアプリケーション, 51 オーサリング装置, 64 マスタディスク, 81 ビデオファイルサーバ, 82 コントローラ, 91 GUI, 92 エンコードマネージャ, 93 AVCコントロール, 94 AVCエンコーダ, 95 ウェイトコントロール, 96 マルチパスコントロール, 97 デコードコントロール, 98 Infoデータベース
【出願人】 【識別番号】000002185
【氏名又は名称】ソニー株式会社
【出願日】 平成18年9月15日(2006.9.15)
【代理人】 【識別番号】100082131
【弁理士】
【氏名又は名称】稲本 義雄


【公開番号】 特開2008−72591(P2008−72591A)
【公開日】 平成20年3月27日(2008.3.27)
【出願番号】 特願2006−251132(P2006−251132)