トップ :: H 電気 :: H04 電気通信技術




【発明の名称】 再生装置及び再生方法
【発明者】 【氏名】川村 幸里

【氏名】李 星日

【要約】 【課題】動画像を悪化させることなく、簡単な構成で音声との同期再生を可能にする。

【構成】推定部106aは単位動画像データを半分復号処理した時点での復号処理時間をもとに、単位動画像データの復号完了時間を推定し、比較部106bは推定した復号完了時間と、単位動画像データと同時に再生する音声データの再生時間とを比較し、音声処理時間調整部106cは比較の結果、復号完了時間が再生時間よりも長い場合、復号完了時間に合わせるように再生時間を調整する。
【特許請求の範囲】
【請求項1】
動画像及び音声を同時に再生する再生装置において、
単位動画像データを半分復号処理した時点での復号処理時間をもとに、前記単位動画像データの復号完了時間を推定する推定部と、
推定した前記復号完了時間と、前記単位動画像データと同時に再生する音声データの再生時間とを比較する比較部と、
比較の結果、前記復号完了時間が前記再生時間よりも長い場合、前記復号完了時間に合わせるように前記再生時間を調整する音声処理時間調整部と、
を有することを特徴とする再生装置。
【請求項2】
前記推定部では、前記単位動画像データの半分の復号処理を検出すると、前記復号処理時間を2倍することで、前記復号完了時間を見積もることを特徴とする請求項1記載の再生装置。
【請求項3】
前記音声処理時間調整部は、前記音声データの出力の際のサンプリング周波数を可変することによって、前記再生時間を調整することを特徴とする請求項1記載の再生装置。
【請求項4】
前記音声処理時間調整部は、前記音声データの出力の際に出力するデータ個数を調整することで、前記再生時間を調整することを特徴とする請求項1記載の再生装置。
【請求項5】
動画像及び音声を同時に再生する再生方法において、
単位動画像データを半分復号処理した時点での復号処理時間をもとに、前記単位動画像データの復号完了時間を推定し、
推定した前記復号完了時間と、前記単位動画像データに対応した音声データの再生時間とを比較し、
比較の結果、前記復号完了時間が前記再生時間よりも長い場合、前記復号完了時間に合わせるように前記再生時間を調整することを特徴とする再生方法。
【発明の詳細な説明】【技術分野】
【0001】
本発明は再生装置及び再生方法に関し、特に動画像及び音声を同時に再生する再生装置及び再生方法に関する。
【背景技術】
【0002】
近年、楽曲などの音声データや動画像データは様々な方式で圧縮符号化され、携帯電話やデジタルカメラなどでも利用されている。
図4は、圧縮符号化された音声データ及び動画像データを再生する従来の再生装置の概略構成図である。
【0003】
再生装置500は、制御部501、ビデオデコーダ502、オーディオデコーダ503、表示処理部504、音声処理部505、同期処理部506、ディスプレイ507、スピーカ508を有する。
【0004】
ここで、制御部501は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などを有し、圧縮符号化された音声データと動画像データとを分離して、動画像データはビデオデコーダ502に入力し、音声データはオーディオデコーダ503に入力する。
【0005】
ビデオデコーダ502は、例えば、MPEG(Motion Picture Experts Group)−2、MPEG−4などの圧縮符号化方式で符号化された動画像データを復号する。復号した動画像データは、表示処理部504に入力され、D/A(Digital / Analogue)変換などが行われる。そして、LCD(Liquid Crystal Display)、有機EL(Electro Luminescence)などのディスプレイ507に表示される。
【0006】
オーディオデコーダ503は、例えば、MP3(MPEG-1 Audio Layer-3, MPEG-2 AudioBC(Back word Compatible), ISO(International Organization for Standardization)非標準規格のMPEG-2.5 Audio Layer-3)や、AAC(Advanced Audio Coding. MPEG-2 AAC: ISO/IEC(International Electro technical Commission) 13818-7, MPEG-4 AAC: ISO/IEC 1446-3, Subpart 4などとして勧告されている)などに代表される圧縮符号化方式で符号化された音声データを復号する。復号した音声データは、音声処理部505にてD/A変換やフィルタリングなどが施された後、スピーカ508から出力される。
【0007】
同期処理部506は、動画像データと音声データとの同期処理を行う。従来の同期処理では、同期処理部506は、音声データとの同期を行うために、単位時間当たりに表示する画像の処理枚数(あるいは、同義となるが、1枚の画像を表示する時間)を変化することが一般的である(例えば特許文献1参照。)。これは、1フレームあたりの画像出力時間を一定にした場合、音声との同期がとれず、音切れなどが発生してしまうからである。
【特許文献1】特開平10−200860号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
しかし、従来のように、音声と同期をとるために動画像の処理枚数などを調整すると、画像の飛びが発生し、視聴者に不快な印象を与えてしまうという問題があった。
本発明はこのような点に鑑みてなされたものであり、動画像を悪化させることなく簡単な構成で音声との同期再生が可能な再生装置を提供することを目的とする。
【0009】
また、本発明の他の目的は、動画像を悪化させることなく簡単な構成で音声との同期再生が可能な再生方法を提供することである。
【課題を解決するための手段】
【0010】
本発明では上記問題を解決するために、動画像及び音声を同時に再生する再生装置において、図1に示すように、単位動画像データを半分復号処理した時点での復号処理時間をもとに、単位動画像データの復号完了時間を推定する推定部106aと、推定した復号完了時間と、単位動画像データと同時に再生する音声データの再生時間とを比較する比較部106bと、比較の結果、復号完了時間が再生時間よりも長い場合、復号完了時間に合わせるように再生時間を調整する音声処理時間調整部106cと、を有することを特徴とする再生装置100が提供される。
【0011】
上記の構成によれば、推定部106aは単位動画像データを半分復号処理した時点での復号処理時間をもとに、単位動画像データの復号完了時間を推定し、比較部106bは推定した復号完了時間と、単位動画像データと同時に再生する音声データの再生時間とを比較し、音声処理時間調整部106cは比較の結果、復号完了時間が再生時間よりも長い場合、復号完了時間に合わせるように再生時間を調整する。
【0012】
また、動画像及び音声を同時に再生する再生方法において、単位動画像データを半分復号処理した時点での復号処理時間をもとに、前記単位動画像データの復号完了時間を推定し、推定した前記復号完了時間と、前記単位動画像データに対応した音声データの再生時間とを比較し、比較の結果、前記復号完了時間が前記再生時間よりも長い場合、前記復号完了時間に合わせるように前記再生時間を調整することを特徴とする再生方法が提供される。
【0013】
上記の方法によれば、単位動画像データを半分復号処理した時点での復号処理時間をもとに、単位動画像データの復号完了時間が推定され、推定された復号完了時間と、単位動画像データに対応した音声データの再生時間とが比較され、比較の結果、復号完了時間が再生時間よりも長い場合、復号完了時間に合わせるように再生時間が調整される。
【発明の効果】
【0014】
本発明によれば、単位動画像データの復号完了時間が、同時に再生する音声データの再生時間よりも長い場合にも、音切れの発生を防止することができ、簡単な構成で音声データと動画像データとの同期再生が可能になる。また、音声データとの同期のために動画像データの読み飛ばしなどを行わないため、動画像を悪化させることもない。
【発明を実施するための最良の形態】
【0015】
以下、本発明の実施の形態を図面を参照して詳細に説明する。
図1は、本実施の形態の再生装置の構成図である。
本実施の形態の再生装置100は、制御部101、ビデオデコーダ102、オーディオデコーダ103、表示処理部104、音声処理部105、同期処理部106、ディスプレイ107、スピーカ108を有する。
【0016】
制御部101は、CPUまたはMPUなどを有し、圧縮符号化された音声データと動画像データとを分離して、動画像データはビデオデコーダ102に入力し、音声データはオーディオデコーダ103に入力する。
【0017】
ビデオデコーダ102は、例えば、MPEG−2、MPEG−4などの圧縮符号化方式で符号化された動画像データを復号する。復号した動画像データは、表示処理部104に入力され、D/A変換などが行われる。そして、LCD、有機ELなどのディスプレイ107に表示される。
【0018】
オーディオデコーダ103は、例えば、MP3や、AACなどに代表される圧縮符号化方式で符号化された音声データを復号する。復号した音声データは、音声処理部105にてD/A変換やフィルタリングなどが施された後、スピーカ108から出力される。
【0019】
同期処理部106は、動画像データと音声データとの同期処理を行う。図1に示す本実施の形態の再生装置100において、同期処理部106は、推定部106a、比較部106b、音声処理時間調整部106cを有している。
【0020】
推定部106aは、単位動画像データを、ビデオデコーダ102にて半分復号処理した時点での復号処理時間をもとに、単位動画像データの復号完了時間を推定する。例えば、単位動画像データを1フレームの画像データとすると、半フレームの復号処理が完了した時点で、それまでにかかった復号処理時間を2倍して、さらに、表示処理部104でディスプレイ107に出力処理する時間などを加えて復号完了時間を算出する。
【0021】
比較部106bは、推定部106aで推定した復号完了時間と、単位動画像データと同時に再生する音声データの再生時間とを比較する。
音声処理時間調整部106cは、比較部106bでの比較の結果、復号完了時間が再生時間よりも長い場合、復号完了時間に合わせるように再生時間を調整する。例えば、PLL(Phase Locked Loop)により、音声処理部105での音声出力処理の際のサンプリング周波数を変更したり、音声出力するデータ個数を調整するなどの処理を行わせ、再生時間を引き延ばし、単位動画像データの復号完了時間と合うように調整する。
【0022】
以下、このような再生装置100を用いた本実施の形態の再生方法を説明する。
なお、以下では単位動画像データを、1フレームの動画像データであるとして説明する。
【0023】
外部から、圧縮符号化された音声データと動画像データが再生装置100に入力されると、制御部101は、音声データと動画像データとを分離して、動画像データはビデオデコーダ102に入力し、音声データはオーディオデコーダ103に入力する。
【0024】
図2は、動画像データと音声データとの同期再生の様子を示す図である。
図2(A)で示すように、まず、画像復号処理のための事前処理時間Tpreで、復号するフレーム1の動画像データを図示しないバッファに蓄積する。その後、ビデオデコーダ102にてフレーム1の動画像データの復号を開始する。
【0025】
一方、フレーム1の動画像データと同時に再生する音声データは、オーディオデコーダ103に入力されて復号された後、音声処理部105でD/A変換され、動画像データと同期して再生される。
【0026】
動画像データの復号処理が進み、半フレーム分の復号処理が終了すると、同期処理部106はこれを検出する。そして、推定部106aは、半フレーム分の復号処理にかかった復号処理時間Tdec1をもとに、フレーム1の復号完了時間T_DEC1を推定する。復号完了時間T_DEC1は、半フレーム分の復号処理時間Tdec1を2倍することによって見積もることができる。ただし、前述の事前処理時間Tpreのほか、復号処理後の出力処理などのための事後処理時間Tpostを加味し、T_DEC1=Tdec1×2+Tpre+Tpostと表すことができる。
【0027】
比較部106bは、オーディオデコーダ103から、フレーム1の動画像データと同時に再生する音声データの再生時間T_OUT1の情報を取得し、推定部106aにて推定したフレーム1の動画像データの復号完了時間T_DEC1と比較する。図2(A)の場合、フレーム1では、動画像データの復号完了時間T_DEC1と再生時間T_OUT1は等しい。そのため、音声処理時間調整部106cは、音声処理部105に対して、引き続き同一のサンプリング周波数で、音声再生出力を継続させる。
【0028】
フレーム1の動画像データの復号処理が完了すると、ビデオデコーダ102は、事前処理時間Tpre経過後にフレーム2の動画像データの復号処理を開始する。そして、半フレーム分の復号処理の終了時に推定部106aは、フレーム2の復号完了時間T_DEC2を推定する。フレーム1の場合と同様に、復号完了時間T_DEC2は、T_DEC2=Tdec2×2+Tpre+Tpostと表すことができる。
【0029】
そして、比較部106bは、復号完了時間T_DEC2と、フレーム2の動画像データと同時に再生する音声データの再生時間T_OUT2とを比較する。フレーム2の場合、フレーム1と異なり、T_DEC2>T_OUT2となっている。この場合、フレーム2の動画像データの再生が完了する前に、同時に再生すべき音声データの再生が終了してしまう。そして、次のフレームの動画像データの再生が開始するまで音切れが発生し、視聴者に不快感を与えてしまう。
【0030】
しかし、本実施の形態の再生装置100において、音声処理時間調整部106cは、半フレームの復号処理が終了した時点で推定した復号完了時間T_DEC2が、音声データの再生時間T_OUT2より長い場合、図2(B)に示すように、復号完了時間T_DEC2に合わせるように再生時間T_OUT2を調整する。具体的には、半フレーム分の復号処理が終了した時刻T1以降の音声出力に対して、音声処理部105でのサンプリング周波数を可変して、再生時間を引き延ばす。これによって、復号完了時間T_DEC2と等しい、音声の再生時間T_OUT2aを得ることができる。なお、サンプリング周波数を可変する代わりに、音声出力するデータ個数を調整するなどして再生時間を引き延ばすようにしてもよい。
【0031】
このように、本実施の形態の再生装置100によれば、単位動画像データの復号完了時間が、同時に再生する音声データよりも長い場合にも、音切れの発生を防止することができ、簡単な構成で音声データと動画像データとの同期再生が可能になる。また、音声データとの同期のために動画像データの読み飛ばしなどを行わないため、動画像を悪化させることもない。
【0032】
なお、上記では単位動画像データを、1フレームの動画像データであるとして説明したが、これに限定されない。例えば、MPEG−2では各フレームが、Iピクチャ、Pピクチャ、Bピクチャといったピクチャタイプで区別されるが、これらのピクチャタイプの組であるGOP(Group Of Pictures)を1つの単位動画像データとしてもよい。
【0033】
また、上記のビデオデコーダ102、オーディオデコーダ103、同期処理部106などは、ハードウェアで実装してもよいが、ソフトウェアで実現することも可能である。
その場合、復号処理や同期処理部106での処理内容などを記述したプログラムが、制御部101の制御のもと実行されることで、上記の再生方法が実現される。
【0034】
次に、本実施の形態の再生方法を携帯電話に適用した場合について説明する。
図3は、携帯電話の概略の構成図である。
携帯電話200は、アンテナ201、ベースバンドプロセッサ202、マルチメディアプロセッサ203、ディスプレイ204、スピーカ205、SD(Secure Digital)カード206を有している。
【0035】
アンテナ201は、電波によって、動画像データ及び音声データを含むコンテンツデータを受信する。
ベースバンドプロセッサ202は、図1の制御部101の機能を有し、圧縮符号化されたコンテンツデータの動画像データと音声データとを分離する。
【0036】
マルチメディアプロセッサ203は、I/F(Interface)211、SRAM(Static Random Access Memory)212、ビデオデコーダ213、オーディオデコーダ214、バス215、表示処理部216、音声処理部217、同期処理部218を有し、これらが、LSI(Large Scale Integrated circuit)化された構成となっている。
【0037】
I/F211は、ベースバンドプロセッサ202とマルチメディアプロセッサ203との間で情報の入出力を行う。
SRAM212は、例えば、複数設けられ、分離した動画像データと音声データを一時記憶する。
【0038】
ビデオデコーダ213は、例えば、MPEG−2、MPEG−4などの圧縮符号化方式で符号化された動画像データを復号する。
オーディオデコーダ214は、例えば、MP3や、AACなどに代表される圧縮符号化方式で符号化された音声データを復号する。
【0039】
バス215は、I/F211、SRAM212、ビデオデコーダ213、オーディオデコーダ214、SDカード206を接続し、これらの間で情報を伝達する。
表示処理部216は、復号された動画像データに対し、D/A変換などを行い、LCD、有機ELなどのディスプレイ204に表示させる。
【0040】
音声処理部217は、復号された音声データに対し、所定のサンプリング周波数によるD/A変換などを行い、スピーカ205から出力させる。
同期処理部218は、図1に示したような、推定部106a、比較部106b、音声処理時間調整部106cの機能を有し、動画像データと音声データとの同期処理を行う。
【0041】
以下、携帯電話200において、コンテンツデータの再生処理について説明する。
アンテナ201によって、コンテンツデータを受信すると、コンテンツデータはベースバンドプロセッサ202からバス215を介してSDカード206に記録される。再生時には、SDカード206に記録されたコンテンツデータは、ベースバンドプロセッサ202により、動画像データと音声データに分離されて、マルチメディアプロセッサ203内のSRAM212に一時記憶される。
【0042】
そして、ビデオデコーダ213及びオーディオデコーダ214は、SRAM212に展開されている動画像データ及び音声データの復号処理を行う。復号された動画像データは表示処理部216によりアナログ信号に変換されて、ディスプレイ204に表示される。また、復号された音声データは、音声処理部217によってアナログ信号に変換されてスピーカ205から出力される。
【0043】
このとき同期処理部218は、図2で示したように、単位動画像データを半分復号処理した時点で、復号完了時間を推定して、その単位動画像データと同時に再生する音声データの再生時間と比較して、復号完了時間が再生時間より長い場合には、再生時間を引き延ばして復号完了時間と一致するようにする。これにより、音声の音切れをなくすことができ、滑らかな動画像と音声との同期再生を実現することができる。
【0044】
なお、上記では、本実施の形態の再生装置及び再生方法を携帯電話200に適用した場合について説明したが、これに限定されない。例えば、図3のような同期処理部218を有するマルチメディアプロセッサ203を搭載することで、PDA(Personal Digital Assistant)などの携帯機器でも実現可能である。また、動画像再生機能がついたミュージックプレイヤ、さらには、デジタルビデオカメラやデジタルスチルカメラなどの撮像装置に適用することも可能である。
【0045】
(付記1) 動画像及び音声を同時に再生する再生装置において、
単位動画像データを半分復号処理した時点での復号処理時間をもとに、前記単位動画像データの復号完了時間を推定する推定部と、
推定した前記復号完了時間と、前記単位動画像データと同時に再生する音声データの再生時間とを比較する比較部と、
比較の結果、前記復号完了時間が前記再生時間よりも長い場合、前記復号完了時間に合わせるように前記再生時間を調整する音声処理時間調整部と、
を有することを特徴とする再生装置。
【0046】
(付記2) 前記推定部では、前記単位動画像データの半分の復号処理を検出すると、前記復号処理時間を2倍することで、前記復号完了時間を見積もることを特徴とする付記1記載の再生装置。
【0047】
(付記3) 前記音声処理時間調整部は、前記音声データの出力の際のサンプリング周波数を可変することによって、前記再生時間を調整することを特徴とする付記1記載の再生装置。
【0048】
(付記4) 前記音声処理時間調整部は、前記音声データの出力の際に出力するデータ個数を調整することで、前記再生時間を調整することを特徴とする付記1記載の再生装置。
【0049】
(付記5) 動画像及び音声を同時に再生する再生方法において、
単位動画像データを半分復号処理した時点での復号処理時間をもとに、前記単位動画像データの復号完了時間を推定し、
推定した前記復号完了時間と、前記単位動画像データに対応した音声データの再生時間とを比較し、
比較の結果、前記復号完了時間が前記再生時間よりも長い場合、前記復号完了時間に合わせるように前記再生時間を調整することを特徴とする再生方法。
【0050】
(付記6) 前記単位動画像データの半分の復号処理を検出すると、前記復号処理時間を2倍することで、前記復号完了時間を見積もることを特徴とする付記5記載の再生方法。
【0051】
(付記7) 前記音声データの出力の際のサンプリング周波数を可変することによって、前記再生時間を調整することを特徴とする付記5記載の再生方法。
(付記8) 前記音声データの出力の際に出力するデータ個数を調整することで、前記再生時間を調整することを特徴とする付記5記載の再生方法。
【図面の簡単な説明】
【0052】
【図1】本実施の形態の再生装置の構成図である。
【図2】動画像データと音声データとの同期再生の様子を示す図である。
【図3】携帯電話の概略の構成図である。
【図4】圧縮符号化された音声データ及び動画像データを再生する従来の再生装置の概略構成図である。
【符号の説明】
【0053】
100 再生装置
101 制御部
102 ビデオデコーダ
103 オーディオデコーダ
104 表示処理部
105 音声処理部
106 同期処理部
106a 推定部
106b 比較部
106c 音声処理時間調整部
107 ディスプレイ
108 スピーカ
【出願人】 【識別番号】000005223
【氏名又は名称】富士通株式会社
【出願日】 平成18年6月30日(2006.6.30)
【代理人】 【識別番号】100092152
【弁理士】
【氏名又は名称】服部 毅巖


【公開番号】 特開2008−11337(P2008−11337A)
【公開日】 平成20年1月17日(2008.1.17)
【出願番号】 特願2006−181289(P2006−181289)