トップ :: G 物理学 :: G10 楽器;音響




【発明の名称】 音声再生装置及び音声再生方法
【発明者】 【氏名】富田 彰

【要約】 【課題】音声データの有音区間/無音区間を判別するための閾値を動的に変化させることにより、最適な閾値に基づく音声データの間引き処理を行い、任意の逓倍での高速再生を可能とする【解決手段】 音声再生装置は、入力された音声データから音声レベル情報を抽出する音声レベル抽出回路105と、音声データから各フレームの開始フラグを検出するフレーム先頭検出回路104と、検出結果と音声レベル情報と入力された所望の再生レートに基づいて有音/無音区間を判別のための閾値を生成及び制御する閾値生成回路109と、音声レベルと閾値の比較により音声データの有音/無音区間を判別する閾値比較回路111と、判別結果の有音/無音区間の音声レベルの連続性に基づいて再生/間引き区間を判定し、間引き制御信号を出力する連続性判定回路108と、間引き制御信号に基づいて入力された音声データから間引き区間を間引いて再生区間をデコード出力する音声デコード回路102とを具備する。

【解決手段】音声再生装置は、入力された音声データから音声レベル情報を抽出する音声レベル抽出回路105と、音声データから各フレームの開始フラグを検出するフレーム先頭検出回路104と、検出結果と音声レベル情報と入力された所望の再生レートに基づいて有音/無音区間を判別のための閾値を生成及び制御する閾値生成回路109と、音声レベルと閾値の比較により音声データの有音/無音区間を判別する閾値比較回路111と、判別結果の有音/無音区間の音声レベルの連続性に基づいて再生/間引き区間を判定し、間引き制御信号を出力する連続性判定回路108と、間引き制御信号に基づいて入力された音声データから間引き区間を間引いて再生区間をデコード出力する音声デコード回路102とを具備する。
【特許請求の範囲】
【請求項1】 入力された音声データから一定時間内の信号振幅に対応した音声レベルを抽出し、音声レベルを出力する音声レベル抽出回路と、前記音声データから各フレームの開始フラグを検出し検出結果を出力するフレーム先頭検出回路と、前記検出結果と前記音声レベルと入力された所望の再生レートに基づいて有音/無音区間を判別のための閾値を生成および制御する閾値生成回路と、前記音声レベルを前記閾値と比較することにより前記音声データの有音/無音区間を判別し、判別結果を出力する閾値比較回路と、前記判別結果の有音区間における前記閾値より大きい音声レベルの連続性と無音区間における前記閾値より小さい音声レベルの連続性に基づいて再生/間引き区間を判定し、間引き制御信号を出力する連続性判定回路と、前記間引き制御信号に基づいて入力された音声データから前記間引き区間を間引いて前記再生区間をデコード出力する音声デコード回路とを具備することを特徴とする音声再生装置。
【請求項2】 前記閾値生成回路は、前記間引き制御信号に基づいて現時点での再生レートを算出し、前記入力された所望の再生レートと前記現時点での再生レートが等しい場合には予め設定された閾値を保持し、前記所望の再生レートが前記現時点での再生レートより大きい場合には前記閾値を高く再設定し、前記所望の再生レートが前記現時点での再生レートより小さい場合には前記閾値を低く再設定するように制御することを特徴とする請求項1記載の音声再生装置。
【請求項3】 前記閾値生成回路は、前記音声レベルが時間経過に従って大きくなる場合には前記閾値をさらに高く再設定し、前記音声レベルが時間経過に従って小さくなる場合には前記閾値をさらに低く再設定するように制御することを特徴とする請求項2記載の音声再生装置。
【請求項4】 前記連続性判定回路は、前記有音区間の前記閾値より大きい音声レベルの連続性が低い場合には間引き区間と判定し、無音区間の前記閾値より小さい音声レベルの連続性が低い場合には再生区間と判定することを特徴とする請求項1記載の音声再生装置。
【請求項5】 入力された音声データから一定時間内の信号振幅に対応した音声レベルを抽出するステップと、前記入力された音声データから各フレームの開始フラグを検出するステップと、前記検出結果と前記抽出された音声レベルと入力された所望の再生レートに基づいて有音/無音区間を判別のための閾値を生成および制御するステップと、前記抽出された音声レベルを前記閾値と比較することにより前記音声データの有音/無音区間を判別し、判別結果を出力するステップと、前記判別結果の有音区間における前記閾値より大きい音声レベルの連続性と無音区間における前記閾値より小さい音声レベルの連続性に基づいて再生/間引き区間を判定し、判定結果を出力するステップと、前記判定結果に基づいて入力された音声データから前記間引き区間を間引いて前記再生区間をデコード出力するステップとを有することを特徴とする音声再生方法。
【請求項6】 前記判定結果に基づいて現時点での再生レートを算出し、前記入力された所望の再生レートと前記現時点での再生レートが等しい場合には予め設定された閾値を保持し、前記所望の再生レートが前記現時点での再生レートより大きい場合には前記閾値を高く再設定し、前記所望の再生レートが前記現時点での再生レートより小さい場合には前記閾値を低く再設定するように制御することを特徴とする請求項5記載の音声再生方法。
【請求項7】 前記音声レベルが時間経過に従って大きくなる場合には設定された閾値をさらに高く再設定し、音声レベルが時間経過に従って小さくなる場合には前記閾値をさらに低く再設定するように制御することを特徴とする請求項6記載の音声再生方法。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、ディジタル音声データの音声再生装置及び音声再生方法に関する。
【0002】
【従来の技術】従来より、ディジタル音声データを高速再生する場合においては、音声データの不必要な無音区間を間引くことによって任意の逓倍での高速再生を実現している。以下、図6、7を参照して、従来の音声再生装置の構成及びその動作について説明する。
【0003】図6は、従来のディジタル音声データの音声再生装置の回路構成図を示す。
【0004】従来の音声再生装置は、図6に示すように、バッファメモリ301、音声デコーダ302、間引き制御回路303を備えている。
【0005】以下、各部を具体的に説明する。
【0006】バッファメモリ301は、各種記録媒体304または外部インターフェイスから入力されたディジタル音声圧縮データを一時的に記録蓄積するRAM等のメモリである。また、バッファメモリ301は、音声デコーダ302からのストリーム要求制御信号に従って、音声デコーダ302に対してディジタル音声圧縮ストリームを出力する。
【0007】音声デコーダ302は、再生動作時にバッファメモリ301からディジタル音声圧縮データを読み出し、伸張処理を行う。また、間引き制御回路303からの間引き制御信号に従って音声データの一定の条件で間引いてデコード出力する。
【0008】間引き制御回路303は、バッファメモリ301に格納されたディジタル音声圧縮データから無音区間を間引くための各種制御処理を行い、その結果を間引き制御信号として音声デコーダ302に出力する。
【0009】ここで、間引き制御処理としては、有音/無音区間を判別して間引く処理と、有音/無音区間とは関係なく一定間隔で間引く処理の二通りが知られている。有音/無音区間の判別を行って間引く処理は、一定時間内の信号振幅に対応した音声レベル成分を検出し、予め決められた所定の閾値と比較して、有音区間と無音区間の判別を行う。すなわち、一定時間内の信号振幅に対応した音声レベル成分が所定の閾値以上である区間を有音区間と判別し、閾値より小さい区間を無音区間と判別する。一方、有音/無音区間とは関係なく一定間隔で間引く処理は、音声データの1フレーム毎に再生区間と間引き区間とを設定する。
【0010】次に、上記のような音声再生装置におけるディジタル音声データの高速再生方法について説明する。
【0011】上記のような音声再生装置を利用したディジタル音声データの高速再生時においては、まず、ディジタル音声圧縮データは、各種記憶媒体304又は外部インターフェイスからバッファメモリ301上に読み出され、一時的に記録蓄積される。次に、間引き制御回路303は、バッファメモリ301上のディジタル音声圧縮データから一定時間内の音声信号振幅に対応した音声レベル成分を抽出し、有音区間と無音区間を判別するための所定の閾値と比較し、比較結果を間引き制御信号として音声デコーダ302に出力する。一方、有音/無音区間を区別せずに一定間隔で間引く処理においては、間引き制御回路303は、バッファメモリ301上のディジタル音声圧縮データから一定間隔で再生区間と間引き区間とを設定し、その結果を間引き制御信号として音声デコーダ302に出力する(図7(A)を参照)。続いて、音声デコーダ302は、ディジタル音声圧縮データをバッファメモリ301から読み出し、間引き制御回路303から入力された間引き制御信号に従って無音区間(または間引き区間)であるフレームを間引いて伸張処理を施した後、デコード出力する。図7(B)は、有音/無音区間を区別せずに一定間隔で音声データの間引き処理を行った場合の結果を示す。
【0012】
【発明が解決しようとする課題】しかしながら、上記従来の音声再生装置において、有音/無音区間を判別して間引く場合、音声データの有音区間と無音区間を判別するための閾値が常に一定であるため、任意の逓倍での高速再生を保証できないといった問題が生じる。具体的には、例えば、2倍速で高速再生を行う場合、10秒の音声データは5秒で高速再生する必要がある。このとき、有音区間と無音区間の判別により10秒の音声データ中に5秒の無音区間があると判別された場合、この5秒の無音区間を間引くことで残りの5秒間の有音区間を再生すれば、2倍速の高速再生を実現することができる。しかし、有音区間と無音区間の判別により10秒の音声データ中に4秒しか無音区間がないと判別された場合、有音区間中の音声データからさらに1秒間のデータを間引く必要が生じてしまい、その結果、音声に欠落が生じ、音声の内容を理解することが不可能となってしまう。また、上記従来の音声再生装置において、有音/無音区間を区別せずに一定間隔で間引く場合には、有音区間も間引かれるため音声の内容を認識しづらくなるといった問題が生じる。
【0013】そこで、本発明は上記問題に鑑みてなされたもので、有音/無音区間を判別するための閾値を動的に変化させることによって最適な閾値に基づく音声データの間引き処理を行い、音質を劣化されることなく任意の逓倍での高速再生を可能とする高速再生装置及び音声再生方法を提供することを目的とする。
【0014】
【課題を解決するための手段】上記目的を達成するために、本発明に係る音声再生装置の特徴は、入力された音声データから一定時間内の信号振幅に対応した音声レベル成分を抽出し、音声レベルを出力する音声レベル抽出回路と、音声データから各フレームの開始フラグを検出し検出結果を出力するフレーム先頭検出回路と、検出結果と抽出された音声レベルと入力された所望の再生レートに基づいて有音/無音区間を判別のための閾値を生成および制御する閾値生成回路と、音声レベルを生成された閾値と比較することにより音声データの有音/無音区間を判別し、判別結果を出力する閾値比較回路と、判別結果の有音区間における閾値より大きい音声レベルの連続性と無音区間における閾値より小さい音声レベルの連続性に基づいて再生/間引き区間を判定し、間引き制御信号を出力する連続性判定回路と、間引き制御信号に基づいて入力された音声データから間引き区間を間引いて前記再生区間をデコード出力する音声デコード回路とを具備することにある。
【0015】上記のような音声再生装置によれば、音声データの有音区間と無音区間を判別するための閾値を動的に変化させて制御できるので、最適な閾値に基づく間引き処理を実現することができる。
【0016】なお、閾値生成回路は、間引き制御信号に基づいて現時点での再生レートを算出し、入力された所望の再生レートと現時点での再生レートが等しい場合には予め設定された閾値を保持し、入力された所望の再生レートが現時点での再生レートより大きい場合には閾値を高く再設定し、入力された所望の再生レートが現時点での再生レートより小さい場合には閾値を低く再設定するように制御することが望ましい。この構成によれば、入力される所望の再生レート、フレーム同期信号、間引き制御信号の各信号状態に応じて、音声データの有音区間/無音区間を判別するための閾値を動的に変化させるので、最適な間引き制御処理を行うことが可能となる。
【0017】また、閾値生成回路は、音声レベルが時間経過に従って大きくなる場合には閾値をさらに高く再設定し、前記音声レベルが時間経過に従って小さくなる場合には閾値をさらに低く再設定するように制御すると良い。このような構成によれば、過去の音声レベル情報より今後の音声レベルの変化を予測して閾値を動的に制御するので、音声レベルが激しく変化する場合に短時間で最適な間引き制御処理を行うことが可能となる。
【0018】さらに、連続性判定回路は、有音区間の前記閾値より大きい音声レベルの連続性が低い場合には間引き区間と判定し、無音区間の閾値より小さい音声レベルの連続性が低い場合には再生区間と判定することが望ましい。このような構成によれば、必要な有音区間を削除することなく最適な間引き処理を実現することができる。
【0019】一方、本発明に係る音声再生方法の特徴は、入力された音声データから一定時間内の信号振幅に対応した音声レベル成分を抽出するステップと、入力された音声データから各フレームの開始フラグを検出するステップと、検出結果と抽出された音声レベルと入力された所望の再生レートに基づいて有音/無音区間を判別のための閾値を生成および制御するステップと、抽出された音声レベルを生成された閾値と比較し、音声データの有音/無音区間を判別し、判別結果を出力するステップと、前記判別結果の有音区間における閾値より大きい音声レベルの連続性と無音区間における閾値より小さい音声レベルの連続性に基づいて再生/間引き区間を判定し、判定結果を出力するステップと、判定結果に基づいて入力された音声データから間引き区間を間引いて再生区間をデコード出力するステップとを有することにある。
【0020】上記のような音声再生方法によれば、音声データの有音区間と無音区間を判別するための閾値を動的に変化させて制御できるので、最適な閾値に基づく間引き処理を実現することができる。
【0021】本発明の第6の特徴は、なお、閾値生成回路は、間引き制御信号に基づいて現時点での再生レートを算出し、入力された所望の再生レートと現時点での再生レートが等しい場合には予め設定された閾値を保持し、入力された所望の再生レートが現時点での再生レートより大きい場合には閾値を高く再設定し、入力された所望の再生レートが現時点での再生レートより小さい場合には閾値を低く再設定するように制御することが望ましい。この構成によれば、入力される所望の再生レート、フレーム同期信号、間引き制御信号の各信号状態に応じて、音声データの有音区間/無音区間を判別するための閾値を動的に変化させるので、最適な間引き制御処理を行うことが可能となる。
【0022】
【発明の実施の形態】以下、図1〜図5を参照して本発明の実施の一形態となる音声再生装置の構成及びその動作について説明する。
【0023】図1は、本発明の実施の一形態となる音声再生装置の構成を示す図である。
【0024】図1に示すように、この音声再生装置は、バッファメモリ101、音声デコーダ102、間引き処理部201を備えている。さらに、間引き処理部201は、フレーム先頭検出回路104、音声レベル抽出回路105、閾値比較回路111、閾値設定回路110、閾値比較回路111、ホストコントローラ106、連続回数設定回路107、連続性判定回路108から構成されている。
【0025】以下、各部を具体的に説明する。
【0026】バッファメモリ101は、各種記録媒体103または外部インターフェイスから入力されたディジタル音声圧縮データを一時的に記録蓄積するRAM等のメモリである。また、バッファメモリ101は、音声デコーダ102からのストリーム要求制御信号に従ってディジタル音声圧縮ストリームをフレーム先頭検出回路104、音声レベル抽出回路105、音声デコーダ102に対して出力する。
【0027】ここで、ディジタル音声圧縮ストリームとは、フレームというデータ単位の集合からなるデータの連続した流れである。フレームとは、ある一定時間の時間軸方向に連続する音声データと、音声データの波形振幅を示すレベル成分情報や何分何秒を示す時間情報の制御信号等とから構成された情報の集合体である。
【0028】間引き処理部201は、バッファメモリ101を介して入力されたディジタル音声圧縮データから有音区間/無音区間を判別し、その結果を間引き制御信号として音声デコーダ102に対して出力する。以下、間引き処理部201を構成する各部について詳細に説明する。
【0029】フレーム先頭検出回路104は、入力されたディジタル音声圧縮ストリームのフレームの開始フラグを検出し、検出結果としてフレーム同期信号を音声レベル抽出回路105及び閾値生成回路109に出力する。具体的には、ディジタル音声圧縮ストリームの各フレームの始まり(開始フラグ)を検出した場合にONとなり、フレームの先頭を検出したことを示すフレーム同期信号を音声レベル抽出回路105と閾値生成回路109に出力する。
【0030】音声レベル抽出回路105は、フレーム先頭検出回路104から入力されたフレーム同期信号とバッファメモリ101から入力されたデジタル音声圧縮ストリームからディジタル音声圧縮ストリームからフレーム同期信号に応じて各フレームのデコード後の音声信号振幅に対応する音声レベル情報(以下、音声レベルと略す)を抽出し、抽出結果(音声レベル信号)を閾値比較回路111と閾値生成回路109に出力する。
【0031】ホストコントローラ106は、有音区間/無音区間を判別するための初期閾値及び期待再生レートを閾値生成回路に出力し、所定の閾値以上あるいは閾値未満の音声レベルの連続性を判定するための連続回数の値を連続回数設定回路107に出力する。ここで、期待再生レートとは、ユーザが入力あるいは予め初期設定された高速再生を行う際の再生レート(任意の逓倍)である。
【0032】連続回数設定回路107は、ホストコントローラ106からの初期連続回数の値に基づいて音声レベルの連続性を判定するための連続回数を設定し、その値を連続性判定回路108に出力する。
【0033】閾値生成回路109は、フレーム先頭検出回路104から入力されるフレーム同期信号と、音声レベル抽出回路105から入力される音声レベルと、連続判定回路108から入力される間引き制御信号と、ホストコントローラから入力される閾値の初期値及び期待再生レート(N)とから、これらの信号状態に応じて間引き処理を行うための閾値の生成及び制御処理を行い、閾値制御信号を閾値設定回路110に出力する。閾値制御信号には、再生レートによる閾値制御信号と音声レベルによる閾値制御信号があり、再生レートによる閾値制御信号は長時間での再生レートの合わせ込みを行うように制御する信号であり、音声レベルによる閾値制御信号は短時間に変化する音声レベルに対して追従して制御する信号である。なお、閾値生成回路109には、期待再生レートと現時点での再生レートとの比較を行う再生レート比較回路と、過去の音声レベルから今後の音声レベル変化を予測する音声レベル予測回路とが備えられている。
【0034】閾値設定回路110は、閾値生成回路109から入力される閾値制御信号に基づいて、有音区間/無音区間を判別するための閾値の設定を行い、閾値比較回路111に対して最適な閾値を出力する。
【0035】閾値比較回路111は、音声レベル抽出回路105から入力される音声レベルを閾値設定回路110から入力される閾値と1フレーム毎に大小比較して有音区間/無音区間の判別を行い、その比較結果を連続性判定回路108に出力する。
【0036】連続性判定回路108は、閾値比較回路111から入力される比較結果と連続回数設定回路107から入力される連続性判定のための連続回数に基づいて、有音区間/無音区間のそれぞれの音声レベルの連続性を判定し、判定結果(間引き制御信号)を間引き制御信号として音声デコーダ102と閾値生成回路109に出力する。連続性の判定は、具体的には、図5(A)に示すように、例えば、有音区間において音声レベルが所定の閾値より大きいが連続性が低い場合(所定の連続回数より低い場合)には間引き区間と判定し、無音区間において音声レベルが所定の閾値より小さいが連続性が低い場合(所定の連続回数より低い場合)には再生区間と判定する。
【0037】音声デコーダ102は、再生動作時にバッファメモリ101に対してストリーム要求制御信号を出力し、バッファメモリ101に記録蓄積されたディジタル音声圧縮データを読み出し、伸張処理を行う。また、音声デコーダ102は、バッファメモリ101から読み出したデジタル音声圧縮ストリームを伸張処理した後、図5(B)に示すように、連続性判定回路108から入力された間引き制御信号に従って、間引き区間のフレームを間引いて、再生区間のフレームのみをデコード出力する。
【0038】上記のような音声再生装置によれば、音声データの有音区間と無音区間を判別するための閾値を動的に変化させて制御することにより、最適な閾値に基づく間引き制御処理を実現することができる。
【0039】(閾値生成回路の制御処理方法)次に、図2を参照して上述した閾値生成回路109の制御処理方法の詳細について説明する。本実施の形態の音声再生装置の制御処理方法において、閾値生成回路109は、入力される初期閾値及び期待再生レート、フレーム同期信号、間引き制御信号の各信号に基づいて、有音区間/無音区間を判別するための閾値の生成及び制御を行う。
【0040】まず、ステップS101aにおいて、閾値生成回路109は、ホストコントローラ106から初期閾値及び期待再生レートが入力されたことを検出すると、初期閾値を閾値設定回路110にロードすると共に、期待再生レート(N)をカウントする。
【0041】そして、ステップS101bにおいて、閾値生成回路109は、フレーム先頭検出回路104からフレーム同期信号が入力されたことを検出すると、フレーム同期信号に基づいてディジタル音声圧縮ストリームの入力フレーム数(IFN)をカウントする。
【0042】さらに、ステップS101cにおいて、閾値生成回路109は、連続性判定回路108から間引き制御信号が入力されたことを検出すると、間引き制御信号に基づいて間引きするフレーム数(EFN)をカウントする。
【0043】次に、ステップS102において、閾値生成回路109は、入力フレーム数(IFN)と間引きするフレーム数(EFN)から現時点での再生レート(M)を算出する。ここで、現時点での再生レート(M)は、入力されたフレーム数(IFN)をデコード出力した(再生を行った)フレーム数(IFN−EFN)で除した値である。
【0044】次に、ステップS103において、再生レート比較回路は、期待再生レート(N)と現時点での再生レート(M)との比較を行う。
【0045】そして、ステップS104において、比較結果がN=Mならば、すなわち、期待再生レート(N)と現時点での再生レート(M)が等しい場合(Yes)、閾値生成回路109は、閾値設定回路110に対して既に設定されている閾値を保つように制御する(再生レートによる閾値制御信号を出力)。ここで、閾値設定回路110は、ステップS101aにおいてロードされた初期閾値を保持する。
【0046】一方、ステップS104において、期待再生レート(N)と現時点での再生レート(M)が等しくない場合には(No)、ステップS105へ移行する。
【0047】ステップS105において、比較結果がN>Mならば、すなわち、期待再生レート(N)が現時点での再生レート(M)より大きい場合(Yes)、閾値生成回路109は、閾値設定回路110に対して閾値を上げるように制御する(再生レートによる閾値制御信号を出力)。ここで、閾値設定回路110は、ステップS101aにおいてロードされた初期閾値の値を高く設定し直す。
【0048】一方、ステップS105において、期待再生レート(N)が現時点での再生レート(M)より小さい場合(No)、閾値生成回路109は、閾値設定回路110に対して閾値を下げるように制御する(再生レートによる閾値制御信号を出力)。ここで、閾値設定回路110は、ステップS101aにおいてロードされた初期閾値の値を低く設定し直す。
【0049】上記のような音声再生方法によれば、入力される初期閾値及び期待再生レート、フレーム同期信号、間引き制御信号の各信号状態に応じて、音声データの有音区間/無音区間を判別するための閾値を動的に変化させるので、最適な間引き制御処理を行うことが可能となる。
【0050】(閾値生成回路の制御処理方法の変形例)次に、図3を参照して上述した閾値生成回路109の制御処理方法の変形例について説明する。
【0051】この例は、上記閾値生成回路109の制御処理方法において、閾値生成回路109は、初期閾値及び期待再生レート、フレーム同期信号、間引き制御信号に加え、さらに音声レベル抽出回路105から入力される過去の音声レベル情報を考慮して閾値を制御している点が異なる。すなわち、過去の音声レベル情報から今後の音声レベルを予測して閾値の制御を行うことができる。
【0052】図3に示すように、まず、ステップS201aにおいて、閾値生成回路109は、ホストコントローラ106から初期閾値及び期待再生レートが入力されたことを検出すると、初期閾値を閾値設定回路110にロードし、期待再生レート(N)をカウントする。
【0053】次に、ステップS201bにおいて、閾値生成回路109は、フレーム先頭検出回路104からフレーム同期信号が入力されたことを検出すると、フレーム同期信号に基づいてディジタル音声圧縮ストリームの入力フレーム数(IFN)をカウントする。
【0054】次に、ステップS201cにおいて、閾値生成回路109は、連続性判定回路108から間引き制御信号が入力されたことを検出すると、間引き制御信号に基づいて間引きするフレーム数(EFN)をカウントする。
【0055】さらに、ステップS202において、閾値生成回路109は、入力フレーム数(IFN)と間引きするフレーム数(EFN)から現時点での再生レート(M)を算出する。
【0056】次に、ステップS203において、再生レート比較回路は、期待再生レート(N)と現時点での再生レート(M)との比較を行う。
【0057】そして、ステップS204において、比較結果がN=Mならば、すなわち、期待再生レート(N)と現時点での再生レート(M)が等しい場合(Yes)、閾値生成回路109は、閾値設定回路110に対して既に設定されている閾値を保つよう閾値制御信号を出力する(再生レートによる閾値制御信号を出力)。ここで、閾値設定回路110は、ステップS201aにおいてロードされた初期閾値を保持する。
【0058】一方、ステップS204において、期待再生レート(N)と現時点での再生レート(M)が等しくない場合には(No)、ステップS205へ移行する。
【0059】ステップS205において、比較結果がN>Mならば、すなわち、期待再生レート(N)が現時点での再生レート(M)より大きい場合(Yes)、閾値生成回路109は、閾値設定回路110に対して閾値を上げるように制御する(再生レートによる閾値制御信号を出力)。ここで、閾値設定回路110は、ステップS201aにおいてロードされた初期閾値の値を高く設定し直す。
【0060】一方、ステップS205において、期待再生レート(N)が現時点での再生レート(M)より小さい場合(No)、閾値生成回路109は、閾値設定回路110に対して閾値を下げるように制御する(再生レートによる閾値制御信号を出力)。ここで、閾値設定回路110は、ステップS201aにおいてロードされた初期閾値の値を低く設定し直す。
【0061】次に、ステップS201dにおいて、音声レベル予測回路は、フレーム先頭検出回路104からフレーム同期信号が入力されたことを検出し、さらに音声レベル抽出回路105から音声レベル信号が入力されたことを検出すると、フレーム同期信号及び音声レベル信号に基づいて、音声レベルの今後の予測を行う。
【0062】ステップS206において、既に再生されたディジタル音声データの連続する複数のフレームの音声レベルの変化の傾きが0ならば、すなわち、音声レベルが時間軸方向に対して急激な変化がない場合、閾値生成回路109は、閾値設定回路110に対して既に設定されている閾値(ステップS201a、S204、S205において設定された閾値)を保つように制御する(音声レベルによる閾値制御信号を出力)。ここで、閾値設定回路110は、既に設定されている閾値(ステップS201a、S204、S205において設定された閾値)を保持する。
【0063】一方、ステップS206において、既に再生されたディジタル音声データの連続する複数のフレームの音声レベルの変化の傾きが0でない場合、すなわち、音声レベルが時間軸方向に対して急激な変化がある場合、ステップS207へ移行する。
【0064】ステップS207において、既に再生されたディジタル音声データの連続する複数のフレームの音声レベルの変化の傾きが正ならば(図4、傾き>0)、すなわち、音声レベルが時間経過に従って次第に大きくなる傾向にある場合、閾値生成回路109は、閾値設定回路110に対して閾値を上げるように制御する(音声レベルによる閾値制御信号を出力)。ここで、閾値設定回路110は、既に設定されている閾値(ステップS201a、S204、S205において設定された閾値)をさらに高く設定し直す。
【0065】一方、ステップS207において、既に再生されたディジタル音声データの連続する複数のフレームの音声レベルの変化の傾きが負ならば(図4、傾き<0)、すなわち、音声レベルが時間経過に従って次第に小さくなる傾向にある場合、閾値生成回路109は、閾値設定回路110に対して閾値を下げるように制御する(音声レベルによる閾値制御信号を出力)。ここで、閾値設定回路110は、既に設定されている閾値(ステップS201a、S204、S205において設定された閾値)をさらに低く設定し直す。
【0066】上記のような音声再生方法によれば、過去の音声レベル情報より今後の音声レベルの変化を予測して閾値を動的に制御するので、音声レベルが激しく変化する場合に短時間で最適な間引き制御処理を行うことが可能となる。
【0067】
【発明の効果】以上述べてきたように、本発明の音声再生装置及び音声再生方法によれば、音声データの有音区間/無音区間を判別するための閾値を音声データの各種信号状態に基づいて動的に変化させることができるので、最適な閾値に基づく音声データの間引き処理を行い、音質を劣化されることなく任意の逓倍での高速再生が可能となる。
【出願人】 【識別番号】000003078
【氏名又は名称】株式会社東芝
【出願日】 平成13年2月28日(2001.2.28)
【代理人】 【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和 (外7名)
【公開番号】 特開2002−258900(P2002−258900A)
【公開日】 平成14年9月11日(2002.9.11)
【出願番号】 特願2001−55259(P2001−55259)