| 【発明の名称】 |
音声信号処理モジュールとこのモジュールを備えた音声通信装置 |
| 【発明者】 |
【氏名】小原 隆 【住所又は居所】神奈川県川崎市幸区柳町70番地 株式会社東芝柳町事業所内
|
| 【要約】 |
【課題】比較的簡単な処理でエコーを抑圧し、かつ背景雑音のレベル変化を低減して通話品質の向上を図ると共に、伝送効率の向上を図る。
【解決手段】送話信号処理部80Aおよび受話信号処理部70Aにそれぞれ代替無音圧縮データを記憶するメモリ82,72とその切替スイッチ88,77a,77bを設ける。そして信号処理制御部100により、ダブルトークが検出されると前フレームにおける通話状態をもとに受話優先か送話優先かを判定し、受話優先の場合には上記切替スイッチ88を切り替えることで上記メモリ82に記憶されている無音圧縮データを符号化音声データに代えて送信させ、一方送話優先の場合には上記切替スイッチ77a,77bを切り替えることで上記メモリ72に記憶されている無音圧縮データをもとに疑似背景雑音を生成してこれを受信再生された音声信号に代えて出力する。 |
【特許請求の範囲】
【請求項1】 送話信号処理部と、受話信号処理部と、信号処理制御部とを具備し、前記送話信号処理部は、入力された送話信号の有音区間と無音区間とを識別する有音判定手段と、この有音判定手段の判定結果に基づき、前記入力された送話信号の有音区間を符号化して符号化音声データを生成する音声符号化手段と、前記有音判定手段の判定結果に基づき、前記入力された送話信号の無音区間を符号化して無音圧縮データを生成する無音符号化手段と、前記音声符号化手段により生成された符号化音声データと、前記無音符号化手段により生成された無音圧縮データと、これらのデータの種別を表す種別情報とを多重化して多重化送信データを生成し、送信に供する多重化手段とを備え、前記受話信号処理部は、入力された多重化受信データに含まれる種別情報をもとに、当該多重化受信データから符号化音声データと無音圧縮データとを分離する分離手段と、この分離手段により分離された符号化音声データを復号して受話信号の有音区間を再生し出力する音声復号手段と、前記分離手段により分離された無音圧縮データを復号して受話信号の無音区間を再生し出力する無音復号手段とを備え、前記信号処理制御部は、前記送話信号処理部に入力された送話信号および前記受話信号処理部から出力される受話信号のダブルトーク区間を検出するダブルトーク検出手段と、このダブルトーク検出手段により検出されたダブルトーク区間に、前記符号化音声データに代えて予め用意してある代替無音圧縮データを前記多重化手段に供給する処理と、前記音声復号手段により再生された受話信号の有音区間に代えて予め用意してある代替無音区間を出力する処理とを選択的に実行する置換手段とを備えたことを特徴とする音声信号処理モジュール。 【請求項2】 前記置換手段は、送話信号および受話信号の過去のフレーム期間における種別に応じて送話優先か受話優先かを判定する判定手段と、この判定手段により受話優先と判定された場合に、前記符号化音声データに代えて予め用意してある代替無音圧縮データを前記多重化手段に供給する手段と、前記判定手段により送話優先と判定された場合には、前記音声復号手段により再生された受話信号の有音区間に代えて予め用意してある代替無音区間を出力する手段とを備えたことを特徴とする請求項1記載の音声信号処理モジュール。 【請求項3】 前記置換手段は、前記代替無音圧縮データを、送話信号の無音区間において前記無音符号化手段により生成される無音圧縮データに更新する手段と、前記代替無音区間を再生するための代替無音圧縮データを、受話信号の無音区間に前記無音復号手段に入力される無音圧縮データに更新する手段とを、さらに備えたことを特徴とする請求項1又は2記載の音声信号処理モジュール。 【請求項4】 送話信号を入力するための入力手段と、受話信号を出力するための出力手段と、前記入力手段により入力された送話信号を符号化して多重化送信データを生成すると共に、入力された多重化受信データを復号して受話信号を再生し前記出力手段から出力させる音声信号処理モジュールと、この音声信号処理モジュールにより生成された多重化送信データを通話相手装置に向け通信回線へ送信すると共に、当該通話相手装置から通信回線を介して到来した多重化受信データを受信して前記音声信号処理モジュールに入力する送受信部とを具備し、前記音声信号処理モジュールは、前記入力手段により入力された送話信号の有音区間と無音区間とを識別する有音判定手段と、この有音判定手段の判定結果に基づき、前記入力された送話信号の有音区間を符号化して符号化音声データを生成する音声符号化手段と、前記有音判定手段の判定結果に基づき、前記入力された送話信号の無音区間を符号化して無音圧縮データを生成する無音符号化手段と、前記音声符号化手段により生成された符号化音声データおよび前記無音符号化手段により生成された無音圧縮データを、これらのデータの種別を表す種別情報と共に多重化して多重化送信データを生成し、この多重化送信データを前記送受信部へ出力する多重化手段と、前記送受信部から入力された多重化受信データに含まれる種別情報をもとに、当該多重化受信データから符号化音声データと無音圧縮データとを分離する分離手段と、この分離手段により分離された符号化音声データを復号して受話信号の有音区間を再生し、前記出力手段から出力させる音声復号手段と、前記分離手段により分離された無音圧縮データを復号して受話信号の無音区間を再生し、前記出力手段から出力させる無音復号手段と、前記送話信号処理部に入力された送話信号および前記受話信号処理部から出力される受話信号のダブルトーク区間を検出するダブルトーク検出手段と、このダブルトーク検出手段により検出されたダブルトーク区間に、前記符号化音声データに代えて予め用意してある代替無音圧縮データを前記多重化手段に供給する処理と、前記音声復号手段により再生された受話信号の有音区間に代えて予め用意してある代替無音区間を前記出力手段へ出力する処理とを選択的に実行する置換手段とを備えたことを特徴とする音声通信装置。 【請求項5】 前記置換手段は、送話信号および受話信号の過去のフレーム期間における種別に応じて送話優先か受話優先かを判定する判定手段を備え、受話優先と判定された場合に、前記符号化音声データに代えて予め用意してある代替無音圧縮データを前記多重化手段に供給する手段と、送話優先と判定された場合に、前記音声復号手段により再生された受話信号の有音区間に代えて予め用意してある代替無音区間を前記出力手段から出力させる手段とを備えたことを特徴とする請求項4記載の音声通信装置。 【請求項6】 前記置換手段は、前記代替無音圧縮データを、送話信号の無音区間において前記無音符号化手段により生成される無音圧縮データに更新する手段と、前記代替無音区間を再生するための代替無音圧縮データを、受話信号の無音区間に前記無音復号手段に入力される無音圧縮データに更新する手段とを、さらに備えたことを特徴とする請求項4又は5記載の音声通信装置。
|
【発明の詳細な説明】【0001】 【発明の属する技術分野】この発明は、例えばディジタル自動車電話装置のようにハンズフリー通話機能を備えた音声通信装置と、この音声通信装置で使用される音声信号処理モジュールに関する。 【0002】 【従来の技術】近年、コンピュータや通信分野では、ディジタル信号処理技術が多く使用されている。ディジタル信号処理は、アナログ信号処理では困難だった特性定数の任意変更や適応処理等の複雑な処理を容易に実現することができるため、特に音声処理や画像処理の分野において汎用的な技術となっている。 【0003】例えば、自動車電話等のハンズフリー通話機能を備えた音声通信装置では、ハンズフリー通話中においてスピーカから出力された受話音声がマイクロホンに回り込み、この受話音声が通話相手の音声通信装置へ送られて音響エコーが発生することがある。そこで、この受話音声の回り込みを打ち消して通話品質を保つため、一般にエコーキャンセラが使用される。エコーキャンセラでは、ディジタル信号処理により擬似エコー信号を生成し、マイクロホンから入力された信号から上記擬似エコー信号を差し引くことによって、エコー成分を除去している。ところが、エコーキャンセラは多くの信号処理量とメモリ容量を必要とするため、携帯電話機等の小型の音声通信装置には不向きである。 【0004】一方、簡易的に音響エコーを抑圧する技術としてボイススイッチが知られている。図5は、ボイススイッチを採用した音声信号処理装置の一例を示すブロック図である。 【0005】同図において、受信された音声データは、先ず音声復号器(DEC)101により音声復号処理されてディジタル受話信号Xsとなる。そして、このディジタル受話信号Xsは、受話信号減衰器(R−LOSS)102を介してD/A変換器103に入力され、ここでアナログ信号に変換されたのち図示しない受話増幅器を介してスピーカ104に供給されて拡声出力される。 【0006】これに対し、話者の送話音声は、マイクロホン105で送話音声信号に変換されたのち図示しない送話増幅器を介してA/D変換器106に入力され、ここでディジタル送話信号Ysに変換される。そして、このディジタル送話信号Ysは、送話信号減衰器(T−LOSS)107を介して音声符号器(ENC)108に入力され、ここで音声符号化処理されて圧縮されたのち送信に供される。 【0007】ところで、この音声信号処理装置はダブルトーク判定部(D−DEC)109と、減衰制御部(LOSSCONT)110とを備えている。ダブルトーク判定部109では、音声復号器101から出力されたディジタル受話信号Xsの信号パワーと、A/D変換器106から出力されたディジタル送話信号Ysの信号パワーがそれぞれ監視され、送話と受話が同時に行われている状態と、送話又は受話のみが行われている状態とが判定される。 【0008】減衰制御部110は、上記ダブルトーク判定部109の判定結果に基づいて上記各信号減衰器102,107に対し所定の減衰量(ロス)を設定する。例えば、ダブルトーク判定部109においてディジタル受話信号Xsの信号パワーのみがあるしきい値を越えていると判定された場合には、受話のみに音声があり送話の音声がない状態と判断される。そしてこの場合には、減衰制御部110によりディジタル送話信号Ysの信号レベルを減少させるべく、送信信号減衰器107に減衰量が設定される。反対に、ダブルトーク判定部109で送話側のみ音声があると判断された場合には、ディジタル受話信号Xsの信号パワーを減少させるべく受話信号減衰器102に減衰量が設定される。また、送話も受話も音声があると判断された場合、つまりダブルトークが検出された場合には、設定中の減衰量を維持するか、又は各信号減衰器102,107の両方に減衰量が設定される。なお、上記ディジタル受話信号Xsおよびディジタル送話信号Ysのパワー値は、ピーク値でも代用可能である。 【0009】かくして、音声が存在しない受話信号路又は送話信号路に減衰量を設定することで、スピーカ104からマイクロホン105ヘの回り込みにより発生する音響エコー成分を抑圧することが可能となる。 【0010】 【発明が解決しようとする課題】しかしながら、このようなボイススイッチを備えた従来の音声信号処理装置では、減衰量を制御するためにディジタル受話信号Xsおよびディジタル送話信号Ysのパワー値又はピーク値を算出する必要がある。このため、ハードウエアで実現する場合には部品点数が多くなり、またソフトウエアで実現する場合にはプロセッサの処理量が増えることから消費電力の増加を招く。また、送受のいずれかに減衰量が設定されるため、その値によっては音声信号がないときとあるときとで背景雑音のレベルが変化して通話に違和感を与えることがある。 【0011】さらに、減衰量が小さいと音響エコーの抑圧が十分に行えないため、有音判定処理に支障が生じる場合がある。例えば音声符号器108の前段に有音検出器を設け、この有音検出器の検出結果に基づき無音圧縮器を動作させて無音圧縮を行う機能を備えた音声通信装置では、有音検出器が残留エコーを有音として検出したり、また通話にそれほど重要ではないダブルトークの音声を有音として判断してしまうことがあり、結果的に無音圧縮の効率低下を招く。 【0012】この発明は上記事情に着目してなされたもので、その目的とするところは、比較的簡単な処理でエコーを抑圧し、しかも背景雑音のレベル変化を低減して通話品質の向上を図ると共に、不要な音声データの伝送期間を短縮して伝送効率の向上を図った音声信号処理モジュールとこのモジュールを備えた音声通信装置を提供することにある。 【0013】 【課題を解決するための手段】上記目的を達成するためにこの発明に係わる音声信号処理モジュールは、送話信号処理部と、受話信号処理部と、信号処理制御部とを具備する。そして、送話信号処理部においては、入力された送話信号の有音区間と無音区間とを識別し、有音区間では符号化音声データを生成すると共に、無音区間では無音圧縮データを生成して、これらの符号化音声データおよび無音圧縮データをとその種別を表す種別情報と共に多重化して多重化送信データを生成し送信に供する。一方、受話信号処理部では、入力された多重化受信データに含まれる種別情報をもとに、当該多重化受信データから符号化音声データと無音圧縮データとを分離し、この分離された符号化音声データおよび無音圧縮データをそれぞれ復号して受話信号の有音区間および無音区間を再生出力する。 【0014】さらに信号処理制御部において、上記送話信号および受話信号のダブルトーク区間を検出し、この検出されたダブルトーク区間に、上記符号化音声データに代えて予め用意してある代替無音圧縮データを送信させるか、又は音声復号手段により再生された受話信号の有音区間に代えて予め用意してある代替無音区間を出力するように構成したものである。 【0015】上記ダブルトーク検出区間における符号化音声データの代替無音圧縮データへの置き換え、或いは受話信号の有音区間の代替無音区間への置き換え処理は、送話信号および受話信号の過去のフレーム期間における種別に応じて送話優先か受話優先かを判定し、受話優先と判定された場合に上記符号化音声データに代えて代替無音圧縮データを出力し、一方送話優先と判定された場合に受話信号の有音区間に代えて代替無音区間を出力することにより実現できる。 【0016】従ってこの発明によれば次のような作用効果が呈せられる。すなわち、ボイススイッチでは無音側の送信パス又は受信パスに損失が挿入されたが、その代わりに無音データが送受信されることになる。このため、受話期間において、音声信号がないときとあるときとで背景雑音のレベル変化をなくすことができ、これにより通話の自然感を高く保つことができる。 【0017】しかも、ダブルトークが検出されると、その区間では送話音声データ或いは受話音声データに代えて無音データが送信或いは出力されることになる。このため、受話期間中に音響エコーが発生しても、この音響エコーは無音データに置き換えられてこの無音データが通話相手装置へ送信されることになる。また送話期間中に通話相手装置から音響エコーが受話音声として帰還しても、この音響エコーは無音データに置き換えられてこの無音データが受話出力されることになる。このため、音響エコーは抑圧されて高品質の通話が実現できる。 【0018】また、音響エコーが無音データに置き換えられることにより、音響エコーが有音として検出されて符号化音声データとして送信されることはなく、この区間には無音圧縮データが送信されることになる。このため、圧縮効率の高い音声通信を実現できる。 【0019】またこの発明は、上記代替無音圧縮データを、送話信号の無音区間において上記無音符号化手段により生成される無音圧縮データに更新する手段と、上記代替無音区間を再生するための代替無音圧縮データを、受話信号の無音区間に上記無音復号手段に入力される無音圧縮データに更新する手段をさらに備えたことも特徴とする。 【0020】このように構成することで、上記送信用および受信用の代替無音圧縮データがそれぞれ実際に送受信された無音圧縮データに定期的又は不定期に置き換えられるので、上記代替無音圧縮データをもとに再生した無音区間と、実際の通話の無音区間との差異を少なくして、これにより通話の自然感をより一層高く保持することができる。 【0021】 【発明の実施の形態】図1は、この発明に係わる音声信号処理モジュールを備えた音声通信装置の第1の実施形態を示すもので、CDMA移動通信端末の構成を例示している。 【0022】同図において、図示しない基地局から送信された無線信号は、アンテナ1で受信されたのちアンテナ共用器2(DUP)を介して受信回路(RX)3に入力される。この受信回路3では、上記無線信号が周波数シンセサイザ(SYN)4から出力された受信局部発振信号とミキシングされて受信中間周波信号に周波数変換される。なお、上記周波数シンセサイザ4から発生される受信局部発振信号の周波数は、制御部5から出力される発振制御信号SYCによって指定される。 【0023】上記受信中間周波信号はCDMA信号処理部6に入力される。CDMA信号処理部6では、上記受信中間周波信号が先ず受信チャネルに割り当てられた拡散符号により逆拡散され、続いて例えばQPSK(Quadriphase Phase Shift Keying)変調方式に対応する復調方式により復調される。このCDMA信号処理部6により、データレートに応じた所定のフォーマットの復調データが再生される。 【0024】この再生された復調データは、後述する音声信号処理モジュール7により音声復号処理や、ボイススイッチ処理、PCM復号処理等の受信音声信号処理が施される。そして、この信号処理により得られたアナログ受話信号は、受話増幅器9を介してスピーカ10に入力され、このスピーカ10から受話音声として拡声出力される。 【0025】一方、話者の送話音声は、マイクロホン11でアナログの送話音声信号に変換されたのち、送話増幅器18で所定の信号レベルに増幅されて音声信号処理モジュール7に入力される。音声信号処理モジュール7では、上記アナログ送話音声信号に対しPCM符号化処理、ボイススイッチ処理および音声符号化処理等の送話音声信号処理が施され、これらの処理により得られた送話データはCDMA信号処理部6に入力される。 【0026】CDMA信号処理部6では、上記音声信号処理モジュール7から出力された送話データをもとに搬送波信号がQPSK変調され、この変調された搬送波信号に対し送信チャネルごとに割り当てられた拡散符号によりスペクトラム拡散処理が施される。そして、この拡散符号化された送信搬送波信号は送信回路(TX)5に入力される。 【0027】送信回路5では、上記拡散符号化された送信搬送波信号が、先ず周波数シンセサイザ14から発生される送信局部発振信号と合成されて、無線周波信号に周波数変換される。そして、この無線周波信号は、制御部5により通知される送信データレートに基づいて上記無線周波信号の有効部分だけが電力増幅され、この増幅された送信無線周波信号がアンテナ共用器2を介してアンテナ1に供給され、このアンテナ1から接続中の基地局へ向けて送信される。 【0028】なお、入力部14にはダイヤルキーや発信キー、電源キー、終了キー、音量調節キー、モード指定キーなどのキー群が設けられている。また表示部15には、LCD表示器やLEDランプが設けられている。LCD表示器には、通信相手の端末の電話番号や自端末の動作状態をはじめ、送受信メッセージなどが表示される。またLEDランプは、バッテリ71のディスチャージ状態を表示するために使用される。 【0029】さらに記憶部13には、電話帳や受信メッセージが保存される。また記憶部13は、留守モードが設定されているときに送受話音声データを留守記録する機能も有する。なお、17は電源回路であり、バッテリ16の出力をもとに所定の動作電源電圧Vccを生成して各回路部に供給する。 【0030】ところで、上記音声信号処理モジュール7は次のように構成される。図2はその構成を示す機能ブロック図である。この音声信号処理モジュール7は、受話信号処理部70Aと、送話信号処理部80Aと、信号処理制御部90とから構成される。 【0031】先ず送話信号処理部80Aは次のように構成される。すなわち、送話増幅器18から出力された送話信号は、A/D変換器81でディジタル信号に変換されたのち有音検出器(VAD)85に入力される。有音検出器85は、上記入力されたディジタル送話信号の有音区間を検出し、この検出結果をもとに切替スイッチ87aを切替制御する。そして、この切替制御により、上記ディジタル送話信号の有音区間の信号、つまりディジタル音声信号を音声符号器(ENC)83に供給し、一方上記ディジタル送話信号の無音区間の信号、つまりディジタル背景雑音信号を無音圧縮器(DTX−ENC)84に供給する。 【0032】音声符号器83は、供給された上記ディジタル音声信号を所定の音声符号化方式に従い符号化して符号化音声データを生成する。無音圧縮器84は、供給された上記ディジタル背景雑音信号を所定の符号化圧縮方式により符号化して無音データに変換する。なお、音声符号化方式としては例えばAMR(Adaptive MultiRate)符号化方式が使用される。また、無音圧縮方式としては無音圧縮データを間欠的に送信する方式が使用される。この方式は、例えば長時間連続して無音状態となっている場合に、音声符号化処理の単位時間である1フレームごとに無音圧縮データを送信せずに数フレームに1回だけ無音圧縮データを送信し、他の期間にはデータを送信しないようにする方式である。 【0033】上記音声符号器83により生成された符号化音声データおよび無音圧縮器84により生成された無音圧縮データは、切替スイッチ87bを介して多重部(MUX)86に入力される。多重部86は、前記有音検出器85の検出結果をもとに送信データの種別を表す情報、つまり有音、無音或いはデータ無しを表す情報を生成し、この送信データタイプを表す情報tx-typeをヘッダに挿入する。そして、上記音声符号器83から入力された符号化音声データと、無音圧縮器84から入力された無音圧縮データと、上記ヘッダとを多重化して送信データTDを生成し、この送信データTDを前記CDMA信号処理部6へ出力する。なお、上記切替スイッチ87bは、上記送信データタイプを表す情報tx-typeにより切替制御される。 【0034】またこの送話信号処理部80Aは、無音データ保存用のメモリ(MEM)82と、切替スイッチ88とを備えている。メモリ82は例えばRAMからなり、背景雑音を再生するための代替無音圧縮データを保存している。そして、この代替無音圧縮データを、後述する信号処理制御部100から発生される送信パス制御信号e-contに従い読み出す。 【0035】切替スイッチ88は、上記メモリ82から読み出された代替無音圧縮データを、音声符号器83により生成された符号化音声データに代えて上記多重部86に供給するためのもので、その切替動作は信号処理制御部100から発生される送信パス制御信号e-contにより制御される。 【0036】なお、メモリ82は、上記多重部86から出力される送信データタイプを表す情報tx-typeに従い無音圧縮データの出力期間に書き込みモードとなり、この期間に上記無音圧縮器84から出力された無音圧縮データにより、上記保存中の代替無音圧縮データを更新する。 【0037】次に、受話信号処理部70Aは次のように構成される。すなわち、CDMA信号処理部6から出力された受信データRDは分離部(DEMUX)71に入力される。分離部71は、入力された受信データからヘッダを抽出し、このヘッダに含まれている受信データタイプを表す情報rx-typeをもとに符号化音声データと無音圧縮データとを分離する。そして、上記受信データタイプを表す情報rx-typeにより切替スイッチ76aを切り替えることで、上記符号化音声データおよび無音圧縮データをそれぞれ音声復号器(DEC)73および疑似雑音生成器(DTX−DEC)74に供給する。 【0038】音声復号器73は、上記分離部71から供給された符号化音声データを符号化してディジタル音声信号を再生する。疑似雑音生成器74は、上記分離部71から供給された無音圧縮データをもとにディジタル疑似雑音信号を再生する。これらの音声復号器73および疑似雑音生成器74により再生されたディジタル音声信号およびディジタル疑似雑音信号は、上記受信データタイプを表す情報rx-typeにより切替制御される切替スイッチ76bを介して、D/A変換器75に入力される。D/A変換器75は、入力された上記ディジタル音声信号およびディジタル疑似雑音信号からアナログの音声信号および疑似雑音信号を再生し、この再生した音声信号および疑似雑音信号を受話信号として受話増幅器9へ出力する。 【0039】またこの受話信号処理部70Aは、無音データ保存用のメモリ(MEM)72と、切替スイッチ77a,77bとを備えている。メモリ72は例えばRAMからなり、背景雑音を作成するために使用する代替無音圧縮データを保存している。そして、この代替無音圧縮データを、後述する信号処理制御部100から発生される受信パス制御信号d-contに従い読み出す。 【0040】切替スイッチ77a,77bは、上記音声復号器73により再生されたディジタル音声信号に代えて、上記メモリ72から読み出された代替無音圧縮データをもとに疑似雑音生成器74で生成されたディジタル疑似雑音信号をD/A変換器75に供給するためのもので、その切替動作は後述する信号処理制御部100から発生される受信パス制御信号d-contにより制御される。 【0041】なお、上記メモリ72は、上記分離部71から出力される受信データタイプを表す情報rx-typeに従い無音圧縮データの受信期間に書き込みモードとなり、この期間に上記分離部71から出力された無音圧縮データにより、上記保存中の代替無音圧縮データを更新する。 【0042】信号処理制御部100は、前記送話信号処理部80Aの多重部86から出力される送信データタイプを表す情報tx-typeと、前記受話信号処理部70Aの分離部71から出力される受信データタイプを表す情報rx-typeとをそれぞれ取り込み、これらの情報tx-type,rx-typeをもとにダブルトークの有無を判定する。そして、この判定結果をもとに、ダブルトーク区間に代替無音圧縮データを送信或いは再生出力させるための送信パス制御信号e-contおよび受信パス制御信号d-contを発生する。 【0043】次に、以上のように構成された音声信号処理モジュールの動作を説明する。端末において発呼が行われ、これにより当該端末と通信相手端末との間が無線リンクを介して接続され、通話が開始されたとする。そうすると、この通話中に音声信号処理モジュール7では次のような処理動作が行われる。 【0044】すなわち、先ず送話信号処理部80Aでは、送話信号が入力されると有音検出器85で有音区間が検出され、その検出結果に基づいて切替スイッチ87aが切り替わる。この結果、有音区間ではディジタル送話音声信号が音声符号器83に、一方無音区間ではディジタル背景雑音信号が無音圧縮器84にそれぞれ入力されて符号化される。 【0045】また、上記有音検出器85の検出結果は多重部86に入力され、多重部86はこの検出結果をもとに送信データのタイプを表す情報tx-typeを生成する。例えば、有音データの送信期間は “2”無音圧縮データの送信期間は “1”送信データが存在しない期間は “0”のように設定された情報を生成する。 【0046】多重部86から上記送信データタイプを表す情報tx-typeが出力されると、この情報に応じて切替スイッチ87bが切り替わる。この結果、上記音声符号器83により生成された符号化音声データと、無音圧縮器84により生成された無音圧縮データが多重部86にそれぞれ入力され、多重部86では上記符号化音声データおよび無音圧縮データが多重化されてCDMA信号処理部6へ出力される。また、このとき多重部86では上記送信データタイプを表す情報tx-typeを含むヘッダが作成され、このヘッダも上記符号化音声データおよび無音圧縮データとともに多重化される。 【0047】一方、通信相手装置から送られた受信データRDが音声信号処理モジュール7に入力されると、受話信号処理部70Aでは先ず分離部71により上記受信データRDのヘッダに含まれる受信データタイプを表す情報rx-typeをもとに符号化音声データと無音圧縮データとに分離される。 【0048】なお、受信データタイプを表す情報rx-typeは、例えば上記送信データタイプを表す情報tx-typeと同様に、有音データの受信期間は “2”無音圧縮データの受信期間は “1”受信データが存在しない期間は “0”のように設定されている。 【0049】このような受信データタイプを表す情報rx-typeに応じて、切替スイッチ76a,76bがそれぞれ音声復号器73と疑似雑音生成器74との間で切り替わる。このため、上記符号化音声データおよび無音圧縮データはそれぞれ、切替スイッチ76aにより振り分けられて音声復号器73および疑似雑音生成器74に入力され、これにより音声復号器73および疑似雑音生成器74ではディジタル音声信号および疑似雑音信号が再生される。そして、この再生されたディジタル音声信号および疑似雑音信号は、D/A変換器75でアナログの音声信号および疑似雑音信号に変換され、受話増幅器9を介してスピーカ10から出力される。 【0050】さて、以上の送受話信号処理中において信号処理制御部100では次のような制御が行われる。図3は、この信号処理制御部100の制御内容を示す図である。 【0051】先ず、受信データタイプを表す情報rx-typeが“2”で、かつ送信データタイプを表す情報tx-typeが“0又は1”のときには、信号処理制御部100は端末が受話状態にあると判断する。そして、信号処理制御部100は、受信パス制御信号d-contおよび送信パス制御信号e-contを共に“0”に設定する。このとき、d-cont=0は受信した符号化音声データをそのまま出力させるための信号である。従って、このとき受話信号処理部70Aでは、上記受信データタイプを表す情報rx-type=2により切替スイッチ76a,76bがともに復号器73側に切り替わるとともに、上記受信パス制御信号d-cont=0により切替スイッチ77bが音声復号器73側に切り替わる。このため、受信された符号化音声データが音声復号器73で復号されたのちD/A変換器75でアナログ信号に変換されてそのままスピーカ10から受話音声として出力される。 【0052】また送話信号処理部80Aでは、送信データタイプを表す情報tx-typeが“0又は1”であるため切替スイッチ87a,87bがともに無音圧縮器84側に切り替わる。このため、マイクロホン11から入力された背景雑音が無音圧縮器84で符号化されて無音圧縮データとなり、この無音圧縮データが多重部86からCDMA信号処理部6へ出力される。 【0053】なお、このときメモリ82は、送信データタイプを表す情報tx-typeが“1”の期間に書き込みモードとなる。このため、メモリ82に記憶されている無音圧縮データは、上記無音圧縮器84で生成された無音圧縮データに書き換えられる。すなわち、メモリ82の無音圧縮データは常に最新のものに更新される。 【0054】次に、受信データタイプを表す情報rx-typeが“0又は1”で、かつ送信データタイプを表す情報tx-typeが“2”のときには、信号処理制御部100は端末が送話状態にあると判断する。そして、この場合にも受信パス制御信号d-contおよび送信パス制御信号e-contを共に“0”に設定する。このとき、e-cont=0は符号化音声データをそのまま送信させるための信号である。従って、送話信号処理部80Aでは、上記送信データタイプを表す情報tx-type=2に応じて切替スイッチ87a,87bがともに音声符号器83側に切り替わると共に、切替スイッチ88も音声符号器83側に切り替わる。このため、A/D変換器81から出力されたディジタル音声信号が音声符号器83で符号化されて符号化音声データとなる。そして、この符号化音声データがそのまま多重部86に入力され、ここでヘッダが多重化されたのちCDMA信号処理部6へ出力される。 【0055】また受話信号処理部70Aでは、受信データタイプを表す情報rx-typeが“0又は1”であるため、切替スイッチ76a,76bがともに疑似雑音生成器74側に切り替わる。また、送信パス制御信号e-contが“0”であるため、切替スイッチ77a,77bがそれぞれ分離部71および切替スイッチ76b側に切り替わる。このため、受信された無音圧縮データが分離部71から疑似雑音生成器74に入力され、ここで疑似背景雑音が生成されてこの疑似背景雑音がD/A変換器75でアナログ信号に変換されてスピーカ10から出力される。 【0056】なお、このときメモリ72は、受信データタイプを表す情報rx-typeが“1”の期間に書き込みモードとなる。このため、メモリ72に記憶されている無音圧縮データは、上記受信された無音圧縮データに書き換えられる。すなわち、メモリ72の無音圧縮データは常に最新のものに更新される。 【0057】さらに、受信データタイプを表す情報rx-typeおよび送信データタイプを表す情報tx-typeがともに“0又は1”のときには、信号処理制御部100は送受とも無音の状態にあると判断する。そして、受信パス制御信号d-contおよび送信パス制御信号e-contを共に“0”に設定する。従って、受話信号処理部70Aでは、受信データタイプを表す情報rx-typeが“0又は1”であるため、切替スイッチ76a,76bがともに疑似雑音生成器74側に切り替わる。また、送信パス制御信号e-contが“0”であるため、切替スイッチ77a,77bがそれぞれ分離部71および切替スイッチ76b側に切り替わる。このため、受信された無音圧縮データが分離部71から疑似雑音生成器74に入力され、ここで疑似背景雑音が生成されてこの疑似背景雑音がD/A変換器75でアナログ信号に変換されてスピーカ10から出力される。 【0058】また送話信号処理部80Aでは、送信データタイプを表す情報tx-typeが“0又は1”であるため切替スイッチ87a,87bがともに無音圧縮器84側に切り替わる。このため、マイクロホン11から入力された背景雑音が無音圧縮器84で符号化されて無音圧縮データとなり、この無音圧縮データが多重部86からCDMA信号処理部6へ出力される。 【0059】なお、このときもメモリ72,82は、受信データタイプを表す情報rx-typeおよび送信データタイプを表す情報tx-typeが“1”の期間に書き込みモードとなる。このため、メモリ72,82に記憶されている無音圧縮データは新しいデータに順次更新される。 【0060】ところで、いま仮に受話状態において、その受話音声がマイクロホン11に回り込み、これが有音検出器85により送話信号の有音区間として検出されたとする。そうすると送信データタイプを表す情報tx-typeは“2”になる。このため、切替スイッチ87a,87bはともに音声符号器83側に切り替わる。 【0061】しかし、このとき信号処理制御部100は、送信データタイプを表す情報tx-typeが“2”になったことでダブルトークが発生したものと判断する。そして、1フレーム前の受信データタイプを表す情報rx-typeおよび送信データタイプを表す情報tx-typeをもとに、現在の通話状態が受話優先であるか送話優先であるかを判定する。 【0062】この判定の結果、受話優先、つまり受話状態からダブルトーク状態に変化したと判断すると、送信パスの送話音声を抑圧するべく送信パス制御信号e-contを“1”に設定する。従って、切替スイッチ87bが音声符号器83側からメモリ82側に切り替わり、これによりメモリ82に記憶されていた無音圧縮データが、音声符号器83により生成された符号化音声データに代わって多重部86に入力される。すなわち、送信パスに回り込んだ音響エコーは無音圧縮データに置き換えられることになる。このため、ハウリングの発生は抑圧される。 【0063】一方、通話相手装置において受話音声の送話パスへの回り込みが発生し、その影響で自己の端末装置がダブルトーク状態になったとする。そうすると、この場合には送話状態からダブルトーク状態に変化したため、信号処理制御部100は送話優先と判定する。そして、受信パスの音声出力を抑圧するべく受信パス制御信号d-contを“1”に設定する。従って、切替スイッチ77a,77bがそれぞれメモリ72および疑似雑音生成器74側に切り替わる。この結果、メモリ72に記憶されていた無音圧縮データが疑似雑音生成器74に入力され、これにより疑似背景雑音が生成される。そして、この疑似背景雑音が音声符号器73で再生されたディジタル音声信号に代わってD/A変換器75に入力され、スピーカ10から出力される。すなわち、通話相手装置から送られた音響エコーは、受話信号処理部70Aにおいて疑似背景雑音に置き換えられることになる。このため、ハウリングの発生は抑圧される。 【0064】以上説明したように第1の実施形態では、送話信号処理部80Aおよび受話信号処理部70Aにそれぞれ代替無音圧縮データを記憶するメモリ82,72を設けると共に、これらのメモリ82,72に記憶された代替無音圧縮データを送信又は再生出力するための切替スイッチ88,77a,77bを設けている。そして信号処理制御部100により、ダブルトークが検出されると前フレームにおける通話状態をもとに受話優先か送話優先かを判定し、受話優先の場合には上記切替スイッチ88を切り替えることで上記メモリ82に記憶されている無音圧縮データを符号化音声データに代えて送信させ、一方送話優先の場合には上記切替スイッチ77a,77bを切り替えることで上記メモリ72に記憶されている無音圧縮データをもとに疑似背景雑音を生成し、この疑似背景雑音を受信再生されたディジタル音声信号に代えてスピーカ10から出力するようにしている。 【0065】従ってこの実施形態によれば、送話状態および受話状態においては無音区間にロスが挿入される代わりに無音圧縮データが送受信される。このため、受話時において、音声信号がないときとあるときとで背景雑音のレベル変化をなくすことができ、これにより通話の自然感を高く保つことが可能となる。 【0066】また、受話期間中又は送話期間中に音響エコーが発生した場合でも、この音響エコーに代わって、メモリ82,72に記憶されていた無音圧縮データが送信されるか或いは疑似背景雑音としてスピーカ10から出力される。このため、自端末においてスピーカ10からマイクロホン11に回り込んだ音響エコーは抑圧され、かつ通話相手装置から送られた音響エコーも抑圧されることになる。従って、ハウリングの発生は防止される。また、音響エコーを無音圧縮データに置き換えて送信することで、送信データの情報量を削減して伝送効率をさらに高めることができる。 【0067】さらに、上記メモリ82,72に記憶される無音圧縮データは、送受話期間中の無音区間において生成或いは受信される無音圧縮データに更新される。このため、代替データとして使用される無音圧縮データは常に最新となるように保たれる。従って、音響エコーを抑圧するために代替無音圧縮データが使用されても、端末では常にその時々の通話環境に対応した背景雑音が出力されることになり、通話の自然感をより一層高く保持することができる。 【0068】またさらに、信号処理制御部100では送話信号処理部80Aの多重部86および受話信号処理部70Aの分離部71からそれぞれ出力される送信データタイプを表す情報tx-typeおよび受信データタイプを表す情報rx-typeをもとに、ダブルトークの判定を行っている。このため、送話音声信号および受話音声信号の信号パワー値又はピーク値を検出する必要がなくなり、これにより回路構成の大型化或いはソフトウエア処理量の増大を招かずにダブルトークを判定することが可能となる。 【0069】(第2の実施形態)この発明の第2の実施形態は、予め数種類の代替無音圧縮データを記憶した雑音データバンクと、雑音レベル推定部とを設ける。そして、ダブルトークが発生する直前の背景雑音レベルを推定し、この推定結果をもとに上記雑音データバンクから対応する代替無音圧縮データを選択して、この代替無音圧縮データを符号化音声データに置き換えて送信するか、或いは上記代替無音圧縮データをもとに生成した疑似背景雑音を、受信再生した音声に置き換えて出力するようにしたものである。 【0070】図4は、この発明に係わる音声信号処理モジュールの第2の実施形態を示す回路ブロック図である。なお、同図において前記図2と同一部分には同一符号を付して詳しい説明は省略する。 【0071】受話信号処理部70Bには雑音データバンク(N−BANK)79および雑音推定部(NE)78が設けてあり、また送話信号処理部80Bには雑音データバンク90および雑音推定部89が設けてある。 【0072】雑音データバンク79,90はともにROMにより構成され、予め数種類の代替無音圧縮データが記憶してある。これらの代替無音圧縮データは、標準的な背景雑音の複数のレベルの各々に対応付けて予め作成したものである。 【0073】雑音推定部78,89はそれぞれ、符号化フレームごとに、少なくともその1フレーム前に受信された無音圧縮データおよび送信する無音圧縮データを保持する。そして、ダブルトークが発生した場合に、1フレーム前に保持した上記無音圧縮データに最も近いレベルを有する代替無音圧縮データを、上記雑音データバンク79,90から選択的に出力させる。 【0074】このような構成であるから、受話優先の状態からダブルトークの状態に変化すると、信号処理制御部100から送信パスの送話音声を抑圧するべく送信パス制御信号e-contを“1”に設定する。このため、切替スイッチ87bが音声符号器83側からメモリ82側に切り替わる。またこのとき、雑音推定部89では1フレーム前の無音圧縮データに最も近いレベルを有する代替無音圧縮データの番号が雑音データバンク90に与えられ、これにより雑音データバンク90から上記番号に対応する代替無音圧縮データが読み出される。従って、雑音データバンク90から読み出された代替無音圧縮データが、音声符号器83により生成された符号化音声データに代わって多重部86に入力される。すなわち、送信パスに回り込んだ音響エコーは代替無音圧縮データに置き換えられることになる。このため、ハウリングの発生は抑圧される。 【0075】一方、送話優先の状態からダブルトークの状態に変化すると、信号処理制御部100から受信パスの音声出力を抑圧するべく受信パス制御信号d-contを“1”に設定する。このため、切替スイッチ77a,77bがそれぞれ雑音データバンク79および疑似雑音生成器74側に切り替わる。またこのとき、雑音推定部78では1フレーム前の無音圧縮データに最も近いレベルを有する代替無音圧縮データの番号が雑音データバンク79に与えられ、これにより雑音データバンク79から上記番号に対応する代替無音圧縮データが読み出される。従って、雑音データバンク79から読み出された代替無音圧縮データが疑似雑音生成器74に入力され、これにより疑似背景雑音が生成される。そして、この疑似背景雑音が音声符号器73で再生されたディジタル音声信号に代わってD/A変換器75に入力され、スピーカ10から出力される。すなわち、通話相手装置から送られた音響エコーは、受話信号処理部70Bにおいて疑似背景雑音に置き換えられることになる。このため、ハウリングの発生は抑圧される。 【0076】従ってこの第2の実施形態においても、先に述べた第1の実施形態と同様に、ロスの代わりに無音圧縮データが伝送されるので通話の自然感を高く保持することができ、しかも音響エコーに代わって、雑音データバンク79,90に記憶されていた代替無音圧縮データが送信されるか或いは疑似背景雑音として出力されるため、音響エコーを抑圧してハウリングの発生を防止することが可能となる。また、音響エコーを無音圧縮データに置き換えて送信することで、送信データの情報量を削減して伝送効率をさらに高めることができる。 【0077】さらにこの実施形態では、予め数種類の代替無音圧縮データを記憶した雑音データバンク79,90を使用することにより、前記第1の実施形態に比べて代替無音圧縮データを記憶するためのメモリ容量を削減することができ、これによりモジュールの小型化および低価格化を図ることが可能となる。また、前記第1の実施形態のようにメモリに記憶された代替無音圧縮データを更新する処理が一切不要となるので、その分モジュールの低消費電力化を図ることができる。 【0078】(その他の実施形態)なお、この発明は上記第1および第2の実施形態に限定されるものではない。例えば、前記第2の実施形態では背景雑音の複数のレベルに対応する複数の無音圧縮データを雑音バンク79,90に記憶した場合について述べた。しかし、それに限らず、種類の異なる複数の背景雑音に対応する複数の無音圧縮データを記憶しておくようにしてもよい。また、上記複数種の背景雑音の各々に対応してレベルの異なる複数の無音圧縮データを用意し、これを雑音バンクに記憶しておくようにしてよい。このようにすることによって、通話環境の背景雑音の種類が変化した場合でも、その都度最適な背景雑音を出力することが可能となり、これにより通話の自然性をより高く保持することができる。 【0079】また前記各実施形態では、音声信号処理モジュールをハードウエア回路により構成した場合を例にとって説明したが、マイクロプロセッサ或いはDSP(Digital Signal Processor)をソフトウエアにより動作する構成により実現してもよく、またハードウエア回路とソフトウエアにより動作する回路とが混在する構成により実現してもよい。 【0080】さらに、前記各実施形態ではCDMA移動通信端末を例にとって説明したが、TDMA携帯電話機等のその他のディジタル移動通信端末や、ディジタルボタン電話機やディジタル固定電話機等の有線音声通信端末にも、この発明は適用できる。 【0081】その他、音声通信端末の種類とその構成、音声信号処理モジュールの構成とその処理内容等についても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。 【0082】 【発明の効果】以上詳述したようにこの発明では、有音検出結果に基づいて送話信号を有音区間と無音区間とに分けてそれぞれ符号化を行って送信し、かつ通話相手装置から到来した符号化データを復号して受話信号の有音区間および無音区間を再生する機能を備えた音声信号処理モジュールにあって、信号処理制御部を新たに設けている。そして、この信号処理制御部により、上記送話信号および受話信号のダブルトーク区間を検出し、この検出されたダブルトーク区間に、符号化音声データに代えて予め用意してある代替無音圧縮データを送信させるか、又は音声復号手段により再生された受話信号の有音区間に代えて予め用意してある代替無音区間を出力するようにしている。 【0083】従ってこの発明によれば、比較的簡単な処理でエコーを抑圧でき、しかも背景雑音のレベル変化を低減して通話品質の向上を図ると共に、不要な音声データの伝送期間を短縮して伝送効率の向上を図った音声信号処理モジュールとこのモジュールを備えた音声通信装置を提供することができる。
|
| 【出願人】 |
【識別番号】000003078 【氏名又は名称】株式会社東芝 【住所又は居所】東京都港区芝浦一丁目1番1号
|
| 【出願日】 |
平成13年6月26日(2001.6.26) |
| 【代理人】 |
【識別番号】100058479 【弁理士】 【氏名又は名称】鈴江 武彦 (外6名)
|
| 【公開番号】 |
特開2003−5800(P2003−5800A) |
| 【公開日】 |
平成15年1月8日(2003.1.8) |
| 【出願番号】 |
特願2001−193568(P2001−193568) |
|