| 【発明の名称】 |
音声符号化装置 |
| 【発明者】 |
【氏名】石井 友規
|
| 【要約】 |
【課題】符号化に許容される処理時間内で最も効果の高い聴覚心理分析を行って音声を符号化する音声符号化装置を提供する。
【解決手段】入力切換部11は、複数チャンネルの音声データを入力とし優先順位管理部から指定されたチャンネルの音声データを出力する。聴覚心理分析部12は、入力切換部から出力されたチャンネルの音声データに対する聴覚心理分析を行う。分析結果記憶部13は、各チャンネルに対する分析結果を記憶する。優先順位管理部14は、優先度テーブルの内容に従って分析するチャンネルの優先度を決定し、優先度テーブルへの優先度情報の記録を行い、処理結果に応じて分析結果記憶部の操作を行う。音声符号化部16は、分析結果記憶部から読み出した対象チャンネルの分析結果に従ってビット割当を行う。 |
【特許請求の範囲】
【請求項1】 複数のチャネルを介してそれぞれ入力される複数の音声信号を聴覚心理モデルを用いて符号化する音声符号化装置であって、前記複数のチャネルから各チャネルを選択する順序を決定する順序決定手段と、決定された順序に基づいて順次選択されたチャネルを介して、所定長の音声信号であるフレーム信号を取得する取得手段と、取得したフレーム信号の聴覚心理分析に要すると予測される予測分析時間が、符号化されていないフレーム信号を符号化するために許容される許容残時間より大きいかどうかを判断する判断手段と、許容残時間より大きいと判断される場合に、取得した前記フレーム信号に聴覚心理分析を施して分析結果を算出し、許容残時間より小さい又は等しいと判断される場合に、既に算出されている分析結果を当該フレーム信号の分析結果とする分析手段と、許容残時間より大きいと判断されるまで、又は全てのフレーム信号の取得を完了するまで、前記取得手段、前記予測手段及び前記分析手段に対して、前記フレーム信号の取得、前記判断及び前記分析結果の算出を繰り返すように制御する制御手段と、フレーム信号毎に決定された分析結果を用いて、当該フレーム信号に対する量子化ステップ幅を決定するためのビット割当を行い、定められたビット割当に基づいて当該フレーム信号を符号化する符号化手段とを備えることを特徴とする音声符号化装置。 【請求項2】 前記複数のチャネルのうちの2個以上のチャネルの間には、各チャネルを介して取得される音声信号に相関関係があり、前記分析手段は、当該フレーム信号を取得したチャネルと相関関係のある他のチャネルを介して取得した他のフレーム信号について算出された分析結果を当該フレーム信号の分析結果とすることを特徴とする請求項1に記載の音声符号化装置。 【請求項3】 前記分析手段は、許容残時間より大きいと判断される場合に、当該フレーム信号を取得したチャネルを介して、過去に取得したフレーム信号について、既に算出されている分析結果を当該フレーム信号の分析結果とすることを特徴とする請求項2に記載の音声符号化装置。 【請求項4】 前記音声符号化装置は、複数のフレーム信号の符号化のプロセスを繰り返すことにより、複数の音声信号を符号化し、各プロセスにおいて、前記分析手段は、さらに、取得した各フレーム信号に対応付けて、聴覚心理分析を実施したか否かを示す実施履歴情報を記憶し、前記順序決定手段は、聴覚心理分析を実施していないことを示す実施履歴情報が対応付けられたフレーム信号を取得したチャネルを優先的に選択することを特徴とする請求項3に記載の音声符号化装置。 【請求項5】 前記順序決定手段は、相関関係のあるチャネルを、相関関係のないチャネルより、優先的に選択することを特徴とする請求項4に記載の音声符号化装置。 【請求項6】 前記音声符号化装置は、さらに、各プロセスにおける複数のフレーム信号の符号化に要する所要時間が、あらかじめ定められた許容時間より大きい場合に、次のプロセスにおける複数のフレーム信号の符号化を抑制する抑制手段を含むことを特徴とする請求項5に記載の音声符号化装置。 【請求項7】 複数のチャネルを介してそれぞれ入力される複数の音声信号を聴覚心理モデルを用いて符号化する音声符号化装置で用いられる音声符号化方法であって、前記複数のチャネルから各チャネルを選択する順序を決定する順序決定ステップと、決定された順序に基づいて順次選択されたチャネルを介して、所定長の音声信号であるフレーム信号を取得する取得ステップと、取得したフレーム信号の聴覚心理分析に要すると予測される予測分析時間が、符号化されていないフレーム信号を符号化するために許容される許容残時間より大きいかどうかを判断する判断ステップと、許容残時間より大きいと判断される場合に、取得した前記フレーム信号に聴覚心理分析を施して分析結果を算出し、許容残時間より小さい又は等しいと判断される場合に、既に算出されている分析結果を当該フレーム信号の分析結果とする分析ステップと、許容残時間より大きいと判断されるまで、又は全てのフレーム信号の取得を完了するまで、前記取得ステップ、前記予測ステップ及び前記分析ステップに対して、前記フレーム信号の取得、前記判断及び前記分析結果の算出を繰り返すように制御する制御ステップと、フレーム信号毎に決定された分析結果を用いて、当該フレーム信号に対する量子化ステップ幅を決定するためのビット割当を行い、定められたビット割当に基づいて当該フレーム信号を符号化する符号化ステップとを含むことを特徴とする音声符号化方法。 【請求項8】 複数のチャネルを介してそれぞれ入力される複数の音声信号を聴覚心理モデルを用いて符号化する音声符号化装置で用いられる音声符号化プログラムを記録しているコンピュータ読み取り可能な記録媒体であって、前記音声符号化プログラムは、前記複数のチャネルから各チャネルを選択する順序を決定する順序決定ステップと、決定された順序に基づいて順次選択されたチャネルを介して、所定長の音声信号であるフレーム信号を取得する取得ステップと、取得したフレーム信号の聴覚心理分析に要すると予測される予測分析時間が、符号化されていないフレーム信号を符号化するために許容される許容残時間より大きいかどうかを判断する判断ステップと、許容残時間より大きいと判断される場合に、取得した前記フレーム信号に聴覚心理分析を施して分析結果を算出し、許容残時間より小さい又は等しいと判断される場合に、既に算出されている分析結果を当該フレーム信号の分析結果とする分析ステップと、許容残時間より大きいと判断されるまで、又は全てのフレーム信号の取得を完了するまで、前記取得ステップ、前記予測ステップ及び前記分析ステップに対して、前記フレーム信号の取得、前記判断及び前記分析結果の算出を繰り返すように制御する制御ステップと、フレーム信号毎に決定された分析結果を用いて、当該フレーム信号に対する量子化ステップ幅を決定するためのビット割当を行い、定められたビット割当に基づいて当該フレーム信号を符号化する符号化ステップとを含むことを特徴とする記録媒体。
|
【発明の詳細な説明】【0001】 【発明の属する技術分野】本発明は、音声信号を聴覚心理モデルを用いて符号化する音声符号化技術に関する。 【0002】 【従来の技術】MPEG規格(ISO11172-2、ISO13818-7等)による音声圧縮アルゴリズムでは、聴覚心理分析手法が用いられている。聴覚心理分析は、音響工学に基づいた心理聴覚モデルが基礎になっており、主にスペクトル分解、音圧レベル・ノイズレベル解析、マスキング閾値算出、ビット割当の決定によって構成される。 【0003】しかしながら、聴覚心理分析手法を用いた音声圧縮アルゴリズムを、DSPやRISCプロセッサを用いて実装する場合、聴覚心理分析に要する処理時間が大きく、多チャンネルの圧縮を少ないハードウェア・リソースで行うことが困難である。例えば、スペクトル分解は本質的に演算規模が大きく、音圧レベル・ノイズレベル解析とマスキング閾値算出は比較と条件分岐の繰り返しが膨大な為、聴覚心理分析が収束するまでには長い処理時間を要する。処理量を削減して処理時間を短縮する為にスペクトル分解に於いてはFFT等の数学的手法を用いた高速アルゴリズムが用いられ高い効果を上げているが、マスキング閾値算出については効果的な高速化手法が確立されていない。またマスキング閾値の収束に要する時間は、解析する音声素材に依存し、実時間での解析が困難である。 【0004】このような問題点を解決するために、音声入力信号のデータサンプル数を数え、音声入力信号をサンプル数に応じて高速にオン、オフして入力を制限し、Nフレームおきに聴覚心理分析を行う音声符号化装置が、特開平10−126271号公報により開示されている。 【0005】 【発明が解決しようとする課題】しかしながら、この音声符号化装置によると、Nフレームおきに聴覚心理分析を行うので、演算量は削減されるものの、Nフレームおきに算出された分析結果を用いて音声を符号化するので、Nフレーム内において、音声の変化が大きい場合などに、適切な分析結果を用いた符号化が困難となるという問題点がある。 【0006】上記の問題点を解決するために、本発明は、符号化に許容される処理時間内で効果的に音声を符号化する音声符号化装置、音声符号化方法及び音声符号化プログラムを記録している記録媒体を提供することを目的とする。 【0007】 【課題を解決するための手段】上記の目的を達成するために、本発明は、複数チャンネルの音声データを入力とし優先順位管理部から指定されたチャンネルの音声データを出力とする入力切換部と、入力切換部から出力されたチャンネルの音声データに対する聴覚心理分析を行う聴覚心理分析部と、各チャンネルに対する分析結果を記憶する分析結果記憶部と、優先度テーブルの内容に従って分析するチャンネルの優先度を決定し、優先度テーブルへの優先度情報の記録を行い、処理結果に応じて分析結果記憶部の操作を行う優先順位管理部と、優先度情報を記憶保持する優先度テーブルと、分析結果記憶部から読み出した対象チャンネルの分析結果に従ってビット割当を行う音声符号化部と現在時刻を出力するタイマ部とを備えることを特徴とする。 【0008】 【発明の実施の形態】本発明に係る1の実施の形態としての音声符号化装置10について説明する。 1.音声符号化装置10の構成音声符号化装置10は、図1に示すように、入力部18、入力切換部11、聴覚心理分析部12、分析結果記憶部13、優先順位管理部14、優先順位記憶部15、音声符号化部16及びタイマ部17から構成されている。 【0009】音声符号化装置10は、入力された音声信号に対してMPEG1符号化を施して音声信号を符号化する。MPEG1符号化では、一定の符号化単位毎に符号化を施す。 (1)入力部18入力部18は、n個のチャネルを介して外部の音声入力装置と接続されており、また、n個のチャネルを介して入力切換部11と接続されている。 【0010】入力部18は、前記音声入力装置からn個のチャネルを介してn種類の音声電気信号を受け取る。一例として、第1チャネル(Ch1と称する。以下、第mチャネルをChmと称する。)及びCh2はステレオ音声のLチャンネル及びRチャンネルであり、Ch3は、モノラルチャンネルである。 【0011】入力部18は、各チャネルを介して入力された音声電気信号を48kHzのサンプルレートにより、16ビットでサンプリングしてデジタルの音声データを生成し、生成したデジタルの音声データをアクセスユニット毎に対応するチャネルを介して入力切換部11へ出力する。ここで、1アクセスユニットは、1152個のサンプルから構成される。 【0012】このとき、1アクセスユニットの符号化を24ミリ秒以内に行えば、リアルタイム符号化となる。 (2)入力切換部11入力切換部11は、n個のチャネルを介して入力部18と接続されており、優先順位管理部14からチャネルの指示を受け取り、指示されたチャネルを介して入力部18から1アクセスユニットのデジタルの音声データを選択し、選択した1アクセスユニットの音声データを聴覚心理分析部12と音声符号化部16へ出力する。 (3)優先順位記憶部15優先順位記憶部15は、具体的には、半導体メモリなどから構成され、図2に一例として示すように、優先順位テーブルを有している。 【0013】優先順位テーブルは、チャネル番号と分析履歴情報と相関度情報と選択順位とから構成される組を、n個記憶している。チャネル番号は、入力部18と外部の音声入力装置とを接続する各チャネルを識別するための番号である。分析履歴情報は、聴覚心理分析部12における聴覚心理分析の現プロセスより1個過去のプロセスにおいて、当該分析履歴情報と同じ組に含まれるチャネル番号により示されるチャネルを介して聴覚心理分析部12へ入力された1アクセスユニットについて、聴覚心理分析部12により聴覚心理分析が行われたか否かを示す。具体的には、図2において、「前回分析非実行」は、1個過去のプロセスにおいて聴覚心理分析が行われなかったことを示し、「前回分析実行」は、1個過去のプロセスにおいて聴覚心理分析が行われたことを示している。 【0014】相関度情報は、当該分析履歴情報と同じ組に含まれるチャネル番号により示されるチャネルと他のチャネルとの間の相関を示している。具体的には、図2において、「ch1」のチャネル番号と同じ組に含まれる相関度情報は、「STEREO pair of ch2」である。ここで、相関度情報「STEREOpair of ch2」は、「ch1」及び「ch2」により示される2個のチャネルがステレオの組であり、「ch1」及び「ch2」の間に相関があることを示している。また、「ch3」のチャネル番号と同じ組に含まれる相関度情報は、「Mono chanel」であり、他のチャネルとの相関がないことを示している。 【0015】選択順位は、優先順位管理部14により設定され、各チャネルを選択する順位を示す。数字の小さい選択順位と同じ組に含まれるチャネル番号により示されるチャネルから順に入力切換部11により選択される。 (4)優先順位管理部14(選択順位の設定)優先順位管理部14は、優先順位記憶部15が有する優先度テーブルに記憶されている組の中から分析履歴情報「前回分析非実行」を含む組を選択する。ここで、分析履歴情報「前回分析非実行」を含む組が無ければ、全ての組を選択する。 【0016】次に、優先順位管理部14は、選択された組の中から、他の組と相関を有する組を選択する。具体的には、選択された組の中から、相関度情報「STEREOpair of ch2」又は相関度情報「STEREO pair ofch1」を含む組を選択する。図2に示す優先度テーブルにおいては、チャネル番号「ch1」及び「ch2」を含む組が選択される。 【0017】次に、優先順位管理部14は、選択されたペアの組の一方の組に1の値から順に選択順位を設定して優先度テーブルに書き込む。具体的には、チャネル番号「ch1」を含む組については、選択順位を「1」とする。次に、優先順位管理部14は、選択された組であって、相関度を有しない組について、最後に設定した選択順位の次の番号から、選択順位を順に設定して優先度テーブルに書き込む。具体的には、チャネル番号「ch3」を含む組については、選択順位を「2」とする。 【0018】次に、優先順位管理部14は、選択されなかった組について、又は選択順位の設定されなかった組について、上記と同様にして、最後に設定した選択順位の次の番号から、選択順位を順に設定して優先度テーブルに書き込む。具体的には、チャネル番号「ch2」を含む組については、選択順位を「3」とする。 (入力切換の設定)優先順位管理部14は、聴覚心理分析開始時刻をタイマ部17より読み出した値を基にして算出する。 【0019】優先順位管理部14は、優先度テーブルに記憶されている選択順位が若い方から順に、当該選択順位と同じ組に含まれるチャネル番号を選択する。このとき、優先順位管理部14は、タイマ部17から現在時刻を読み出し、次の式によりて符号化に許容される残り時間を算出する。 (式1)(残り時間)=(現在時刻)−(聴覚心理分析開始時刻) 次に、予め記憶しており当該符号化単位に割り当てることができる聴覚心理分析時間と算出された残り時間とを比較して、残り時間が分析時間より大きいか等しいならば、当該チャネルのアクセスユニットに対する聴覚心理分析時間が確保できると判断し、残り時間が分析時間より小さいならば、確保できないと判断する。確保できると判断する場合に、優先順位管理部14は、選択したチャネル番号により示されるチャネルに切り換えるように入力切換部11へ指示を出力し、分析結果記憶部13に対して、選択された前記チャネルに対応する領域を選択するように指示を出力する。 【0020】確保できないと判断する場合に、優先順位管理部14は、選択された前記チャネル番号と相関の高いチャネル番号を優先度テーブルから抽出し、相関の高いチャネル番号が存在するときは、相関の高い前記チャネル番号に対応する領域から分析結果を読み出し、ー選択された前記チャネル番号に対応する領域に読み出した前記分析結果を上書きする。相関の高いチャネル番号が存在しないときは、何もしない。従って、このとき、選択された前記チャネル番号に対応する領域には、前回書き込まれた分析結果がそのまま記憶されていることとなる。 【0021】このようにして聴覚心理分析処理が制限時間内に完了する。 (優先度テーブルの更新)優先順位管理部14は、聴覚心理分析部12の処理結果に基づいて、優先度テーブルに記憶されている分析履歴情報を更新する。具体的には、各チャネル番号毎に、当該チャネルを介して得られたアクセスユニットに対して、聴覚心理分析部12による聴覚心理分析が行われた場合には、当該チャネル番号と同じ組に含まれる分析履歴情報を「前回分析実行」とし、聴覚心理分析部12による聴覚心理分析が行われなかった場合には、当該チャネル番号と同じ組に含まれる分析履歴情報を「前回分析非実行」とする。 (符号化単位のスキップ判定)優先順位管理部14は、符号化開始通知及び符号化完了通知を音声符号化部16から受け取り、受け取った符号化開始通知及び符号化完了通知に呼応してタイマ部17より読み出した値を基にして符号化単位の符号化開始時刻及び符号化完了時刻を算出する。 【0022】次に、優先順位管理部14は、符号化完了時刻と符号化開始時刻とを用いて、次の式により符号化単位の符号化に要した処理時間を算出する。 (式2) (符号化処理時間)=(符号化完了時刻)−(符号化開始時刻) さらに、優先順位管理部14は、予め記憶している符号化単位の符号化に許容される制限時間と、算出された処理時間を比較して、処理時間が制限時間を上回っている場合は、聴覚心理分析スキップ情報(以下、スキップフラグと呼ぶ。)をONに設定する。 【0023】優先順位管理部14は、次の符号化単位の聴覚心理分析処理の開始前に、スキップフラグがONかOFFかを判定し、ONであれば、聴覚心理分析の全部または一部をスキップし、スキップフラグをOFFに設定する。 (5)分析結果記憶部13分析結果記憶部13は、具体的には、半導体メモリなどから構成され、n個のチャネルに対応するn個の領域を備える。各領域には、聴覚心理分析部12により出力された分析結果が記憶される。 【0024】分析結果記憶部13は、優先順位管理部14から、選択された前記チャネルに対応する領域を選択するように指示を受け取り、聴覚心理分析部12から分析結果を受け取り、前記指示により示される領域に、受け取った前記分析結果を上書きにより書き込む。 (6)聴覚心理分析部12聴覚心理分析部12は、入力切換部11を介して入力部18と接続されており、入力部18からアクセスユニットを受け取り、受け取ったアクセスユニットに対して、周波数解析を行い、周波数解析されたデータから人間の耳に関知できないようなマスキング閾値(具体的には、信号対マスク比SMR)を算出する聴覚心理分析を施し、得られた分析結果を分析結果記憶部13へ出力する。なお、聴覚心理分析については、公知であるので、詳細の説明を省略する。 (7)音声符号化部16音声符号化部16は、入力切換部11から1アクセスユニットの音声データを受け取る。 【0025】また、音声符号化部16は、符号化開始通知を優先順位管理部14へ出力し、次に、分析結果記憶部13が有する各領域から分析結果をチャネル番号の順に読み出す。次に、読み出した分析結果を用いて前記1アクセスユニットの音声データに対して量子化ステップ幅を決定するためのビット割当を行い、ビット割当に基づいて受け取った1アクセスユニットの音声データに音声符号化を施して、音声データストリームを生成し、生成した音声データストリームを出力する。符号化単位の音声符号化が完了すると、符号化完了通知を優先順位管理部14へ出力する。 (8)タイマ部17タイマ部17は、時刻を計測し、計測した時刻を優先順位管理部14の要求に応じて、優先順位管理部14へ出力する。 2.音声符号化装置10の動作音声符号化装置10の動作について、図3に示すフローチャートを用いて説明する。 【0026】優先順位管理部14は、初期値としてスキップフラグをOFFに設定する(ステップS101)。次に、優先順位管理部14は、スキップフラグがONかOFFかを判断し、OFFであるなら(ステップS102)、優先順位管理部14は、アクセスユニットの選択順序を決定し(ステップS103)、全てのアクセスユニットの取得が終了したなら、ステップS108へ進む。 【0027】アクセスユニットの取得が終了していないなら(ステップS104)、優先順位管理部14は、決定された順位に従ってアクセスユニットを入力部18から入力切換部11を介して聴覚心理分析部12へ出力するにように、入力切換部11を制御し、残り時間が分析時間より大きいか又は等しいなら(ステップS106)、聴覚心理分析部12は、取得したアクセスユニットに聴覚心理分析を施して、分析結果記憶部13内の対応する領域にその分析結果を書き込む(ステップS107)。次に、ステップS104へ戻って処理を繰り返す。 【0028】優先順位管理部14は、全てのアクセスユニットの取得が終了したなら、分析していないアクセスユニットがあれば、相関するチャネルの分析結果を複製する(ステップS108)。次に、音声符号化部16は、ビット割当を行い音声符号化を施し、その結果を出力する(ステップS109)。次に、優先順位管理部14は、優先度テーブルを更新し(ステップS110)、処理時間が制限時間以内か否かを判断し、処理時間が制限時間を超えるなら(ステップS111)、スキップフラグをONに設定する(ステップS112)。次に、ステップS102へ戻って、処理を繰り返す。 【0029】ステップS102で、優先順位管理部14は、スキップフラグがONであると判断するなら、スキップフラグをOFFに設定し(ステップS113)、ステップS108へ進む。次に、ステップS103に示すアクセスユニットの選択順位の決定動作の詳細について、図4に示すフローチャートを用いて説明する。 【0030】優先順位管理部14は、優先順位記憶部15が有する優先度テーブルに記憶されている組の中から分析履歴情報「前回分析非実行」を含む組を選択する(ステップS201)、このとき、分析履歴情報「前回分析非実行」を含む組が無ければ(ステップS202)、全ての組を選択する(ステップS203)。次に、優先順位管理部14は、選択された組の中から、他の組と相関を有する組を選択し、選択された各組に1の値から順に選択順位を設定して優先度テーブルに書き込む(ステップS204)。 【0031】次に、優先順位管理部14は、選択された組であって、相関度を有しない組について、最後に設定した選択順位の次の番号から、選択順位を順に設定して優先度テーブルに書き込む(ステップS205)。次に、優先順位管理部14は、選択されなかった組について、最後に設定した選択順位の次の番号から、選択順位を順に設定して優先度テーブルに書き込む(ステップS206)。 3.まとめ以上説明したように、優先順位管理部14は、優先度テーブルから各チャンネルの優先度情報を読み出し、優先度の高いチャンネルから順番に聴覚心理分析部12に印加されるように入力切換部11からの出力を切り換えるとともに優先度情報を必要があれば更新する。また、優先順位管理部14は、タイマ部17から必要に応じて現在時刻を読み出すことにより分析処理にかかった時間を管理し、次に分析すべき優先度のチャンネルの処理時間が確保出来ない場合には、聴覚心理分析処理を終了する。各チャンネルの分析結果は、分析結果記憶部13に記憶されており聴覚心理分析が為されたチャンネルに関しては記憶内容が更新される。処理時間が確保出来ない為に分析を中止されたチャンネルの分析結果は、更新されずに過去の記憶内容が保持されている。音声符号化部16は、分析結果記憶部13から各チャンネル毎の分析結果を読み出すことによりビット割当を行い音声符号化を完了する。各チャンネルの聴覚心理分析処理が制限時間内に完了しなかった場合、優先順位管理部14は、聴覚心理スキップ情報をセットし、次回の聴覚心理分析処理を実行しないようにする。 【0032】このように、本発明によると、聴覚心理分析を用いた音声符号化装置において音声信号に対する聴覚心理分析処理に要する処理時間が大きくなる場合に、相関のある他の音声信号の分析結果を用いることにより、制限時間内で聴覚心理分析処理を完了させることができる。こうして、聴覚心理分析を用いた音声符号化装置に於いて入力信号によって聴覚心理分析処理に要する処理時間が理論的に大きくなる性質を改善し、人が聞いて意味のある音声信号にハードウェアスペックを合わせることにより、より低価格かつ処理性能の低いハードウェアで音声符号化を実現出来る。 【0033】なお、本発明を上記の実施の形態に基づいて説明してきたが、本発明は、上記の実施の形態に限定されないのはもちろんである。以下のような場合も本発明に含まれる。 (1)上記の実施の形態において、分析対象とするチャンネルの優先度については、分析履歴とチャンネル相関度から決定するとしているが、利用者が指定する順序に基づいて決定するとしてもよい。 【0034】また、過去数回の分析履歴を統計的に利用してもよい。例えば、優先度テーブルは、チャネル毎に何回前に分析が行われたかを記憶しており、2つのチャネルのその差が、2以下なら、相関に基づいて選択順位を決定し、3以上なら、分析履歴に基づいて選択順位を決定するとしてもよい。 (2)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。 【0035】また、本発明は、前記コンピュータプログラム又は前記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フロッピー(登録商標)ディスク、ハードディスク、CD―ROM、MO、DVD、DVD−ROM、DVD−RAM、半導体メモリなど、に記録したものとしてもよい。また、これらの記録媒体に記録されている前記コンピュータプログラム又は前記デジタル信号であるとしてもよい。 【0036】また、本発明は、前記コンピュータプログラム又は前記デジタル信号を、電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク等を経由して伝送するものとしてもよい。また、本発明は、マイクロプロセッサとメモリとを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムに従って動作するとしてもよい。 【0037】また、前記プログラム又は前記デジタル信号を前記記録媒体に記録して移送することにより、又は前記プログラム又は前記デジタル信号を前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。 (3)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。 【0038】 【発明の効果】以上説明したように、本発明は、複数のチャネルを介してそれぞれ入力される複数の音声信号を聴覚心理モデルを用いて符号化する音声符号化装置であって、前記複数のチャネルから各チャネルを選択する順序を決定する順序決定手段と、決定された順序に基づいて順次選択されたチャネルを介して、所定長の音声信号であるフレーム信号を取得する取得手段と、取得したフレーム信号の聴覚心理分析に要すると予測される予測分析時間が、符号化されていないフレーム信号を符号化するために許容される許容残時間より大きいかどうかを判断する判断手段と、許容残時間より大きいと判断される場合に、取得した前記フレーム信号に聴覚心理分析を施して分析結果を算出し、許容残時間より小さい又は等しいと判断される場合に、既に算出されている分析結果を当該フレーム信号の分析結果とする分析手段と、許容残時間より大きいと判断されるまで、又は全てのフレーム信号の取得を完了するまで、前記取得手段、前記予測手段及び前記分析手段に対して、前記フレーム信号の取得、前記判断及び前記分析結果の算出を繰り返すように制御する制御手段と、フレーム信号毎に決定された分析結果を用いて、当該フレーム信号に対する量子化ステップ幅を決定するためのビット割当を行い、定められたビット割当に基づいて当該フレーム信号を符号化する符号化手段とを備える。 【0039】この構成によると、取得したフレーム信号の聴覚心理分析に要すると予測される予測分析時間が、許容残時間を超えると判断される場合に、聴覚心理分析を行わず、既に算出されている分析結果を用いるので、許容時間内に音声符号化を行うことができる。ここで、前記複数のチャネルのうちの2個以上のチャネルの間には、各チャネルを介して取得される音声信号に相関関係があり、前記分析手段は、当該フレーム信号を取得したチャネルと相関関係のある他のチャネルを介して取得した他のフレーム信号について算出された分析結果を当該フレーム信号の分析結果とするように構成してもよい。 【0040】この構成によると、相関関係のあるチャネルについては、聴覚心理分析を行わず、既に算出されている分析結果を用いるので、許容時間内に音声符号化を行うことができる。ここで、前記分析手段は、許容残時間より大きいと判断される場合に、当該フレーム信号を取得したチャネルを介して、過去に取得したフレーム信号について、既に算出されている分析結果を当該フレーム信号の分析結果とするように構成してもよい。 【0041】この構成によると、許容残時間を超える場合に、過去に算出されている分析結果を用いるので、許容時間内に音声符号化を行うことができる。ここで、前記音声符号化装置は、複数のフレーム信号の符号化のプロセスを繰り返すことにより、複数の音声信号を符号化し、各プロセスにおいて、前記分析手段は、さらに、取得した各フレーム信号に対応付けて、聴覚心理分析を実施したか否かを示す実施履歴情報を記憶し、前記順序決定手段は、聴覚心理分析を実施していないことを示す実施履歴情報が対応付けられたフレーム信号を取得したチャネルを優先的に選択するように構成してもよい。 【0042】この構成によると、聴覚心理分析を実施していないことを示す実施履歴情報が対応付けられたフレーム信号を取得したチャネルを優先的に選択するので、聴覚心理分析が実施されないチャネルが発生しないようにすることができる。ここで、前記順序決定手段は、相関関係のあるチャネルを、相関関係のないチャネルより、優先的に選択するように構成してもよい。 【0043】この構成によると、相関関係のあるチャネルを、相関関係のないチャネルより、優先的に選択するので、相関関係のあるチャネルについては、聴覚心理分析を行わず、既に算出されている分析結果を用いることにより、許容時間内に音声符号化を行うことができる。ここで、前記音声符号化装置は、さらに、各プロセスにおける複数のフレーム信号の符号化に要する所要時間が、あらかじめ定められた許容時間より大きい場合に、次のプロセスにおける複数のフレーム信号の符号化を抑制する抑制手段を含むように構成してもよい。 【0044】この構成によると、各プロセスにおける複数のフレーム信号の符号化に要する所要時間が、あらかじめ定められた許容時間を超える場合に、次のプロセスにおける複数のフレーム信号の符号化を抑制するので、1のプロセスにおいて、符号化に要する時間が許容時間を超えた場合であっても、次のプロセスの符号化を省略等することにより、全体としての音声信号の符号化に要する時間を許容時間内に抑えることができる。
|
| 【出願人】 |
【識別番号】000005821 【氏名又は名称】松下電器産業株式会社
|
| 【出願日】 |
平成12年12月15日(2000.12.15) |
| 【代理人】 |
【識別番号】100090446 【弁理士】 【氏名又は名称】中島 司朗
|
| 【公開番号】 |
特開2002−182699(P2002−182699A) |
| 【公開日】 |
平成14年6月26日(2002.6.26) |
| 【出願番号】 |
特願2000−382546(P2000−382546) |
|