トップ :: G 物理学 :: G10 楽器;音響




【発明の名称】 動力学で制限されたオーディオシステムのための動力学低減
【発明者】 【氏名】ミヒヤエル・バルカー

【要約】 【課題】動力学で制限されたオーディオシステムのための動力学低減を提供すること。

【解決手段】オーディオ端末においてオーディオ信号の動的応答を制限する方法であって、入力信号xが、端末からの出力信号yについて定義された最大限界値ymaxを超えないように処理され、事前決定可能な一定の増幅値vが設定され、v≦1では、公称レベルをもつ入力信号xが、最大振幅≦ymaxで歪みなしに出力信号yとして再生され、かつv=const>1では、信号の歪みが発生する方法に関する。第1のステップでは、入力信号xが、その動的応答において中間値y<xに圧縮され、次の第2のステップでは、一定の増幅値vで増幅された出力信号y=v*yが形成される。
【特許請求の範囲】
【請求項1】 音響有効信号の伝送のために、オーディオ端末、特に通信(=TC)端末において、オーディオ信号、特に人の音声信号の動的応答を制限または低減する方法であって、入力信号xが、端末からの出力信号yについて定義された最大限界値ymaxを超えないように処理され、事前決定可能な一定の増幅値vが設定され、v≦1では、公称レベルをもつ入力信号xが、最大振幅≦ymaxで歪みなしに出力信号yとして再生され、かつv=const>1では、信号の歪みが発生し、第1のステップでは、入力信号xが、その動的応答において中間値y<xに圧縮され、次の第2のステップでは、一定の増幅値vで増幅された出力信号y=v*yが形成される方法。
【請求項2】 f(cf)を、入力信号xおよび一定の増幅値vに応じて計算される動的増幅係数cfの関数として、中間値yをy=x*v−1*f(cf)から形成する、請求項1に記載の方法。
【請求項3】 短時間平均値sam(x)を入力信号xから形成し、v≦1では、動的増幅係数cfをcf=1/vとして計算し、v>1では、動的増幅係数cfをcf=1/(v*sam(x))として計算し、出力信号y=x*f(cf)をそこから形成する、請求項2に記載の方法。
【請求項4】 短時間平均値sam(x)を入力信号xから形成し、v>1では、動的増幅係数cfをcf=1/(v*sam(x))
として計算し、出力信号y=x*f(cf)をそこから形成し、v≦1では、y=v*xから出力信号yを直接決定する、請求項2に記載の方法。
【請求項5】 短時間平均値sam(x)を入力信号xから形成し、sam(x)≧1/vでは、動的増幅係数cfをcf=1/vとして計算し、sam(x)<1/vでは、動的増幅係数cfを|n|∈N≠0の場合にcf=1/(v*sam(x)
として計算し、そこから出力信号y=x*f(cf)を形成する、請求項2に記載の方法。
【請求項6】 入力信号xを、等間隔の時間ステップTで、サンプリング周波数f=1/Tで、時間kにおいてサンプリングし、時間定数τ<tmaxでは、ak=1−bk=1−e−T/τ、時間定数τ>tminでは、al=1−bl=1−e−T/τとして【数1】

に従って、関数f(cf)を平滑化された増幅値cg(k)として計算する、請求項3に記載の方法。
【請求項7】 入力信号xを、等間隔の時間ステップTで、サンプリング周波数f=1/Tで、時間kにおいてサンプリングし、また短時間平均値sam(x(k))を時間定数τ<tmaxでは、αk=1−βk=1−e−T/τ、時間定数τ>minでは、αl=1−βl=1−e−T/τとして【数2】

に従って計算する、請求項3に記載の方法。
【請求項8】 請求項1に記載の前記方法を実行するためのサーバユニット。
【請求項9】 請求項1に記載の前記方法を実行するための、プロセッサユニット、特にデジタル信号プロセッサ。
【請求項10】 請求項1に記載の前記方法を実行するためのプログラム可能なゲートアレイユニット。
【発明の詳細な説明】【0001】本発明は、参照により本明細書に組み込まれる優先権出願DE10050 150.8に基づくものである。
【0002】
【発明の属する技術分野】本発明は、音響有効信号(acoustic useful signal)の伝送のために、オーディオ端末、特に通信(=TC)端末において、オーディオ信号、特に人の音声信号の動的応答(dynamic response)を制限または低減する方法であって、入力信号xが、端末からの出力信号yについて定義された最大限界値ymaxを超えないように処理され、事前決定可能な一定の増幅値vが設定され、v≦1では、公称レベルをもつ入力信号xが、最大振幅≦ymaxで歪みなしに出力信号yとして再生され、かつv=const>1では、信号の歪みが発生する方法に関する。
【0003】
【従来の技術】この種の方法は、たとえば、いわゆるハードクリッパ(hard clipper)原理を通じて理解される。
【0004】オーディオ信号は、図1bに示すようなハードクリッパ原理に従って、固定値にハード制限される。アナログ技術では、一般に、制限は、利用可能な電源電圧を制限することで生まれるか、又は、リミッタ回路を用いて固定値に設定される。デジタル信号処理では、数字のオーバフローを回避するために、デジタルサンプル値を最大の表現可能値に制限しなければならない。ハード制限によって可聴歪みが発生し、音声品質および了解度(intelligibility)が悪化する。
【0005】音声信号を磁気テープに記録する場合には、動的範囲(dynamic scope)がテープ素材の物理的性質によって制限される。周知のドルビー(DOLBY)方法では、磁気テープへの記録の前に固定圧縮度にしたがって動的な圧縮が行われる。磁気テープからの読取り後、記録内容が動的伸長器を用いて元の動的レンジに復元される。圧縮度と伸長度は互いに補償し合う。しかし、これが以下の不都合をもたらす。固定された圧縮により動的レンジ全体の音の大きさが変化し、「ブリージング(breathing)」を引き起こす。しかしながら、目的としては、レンジ全体をできるだけ本来の状態に忠実に伝送すべきである。しかし、ドルビー方法では、利用可能な動的レンジに自動的に適合させることはできない。
【0006】A法則またはμ法則の圧縮特性によるデジタルオーディオ信号に対する動的低減方法は、ITUT−T G721標準に従って理解される。それらの方法は、64kbit/sへのデータ低減に備えている。ここで、動的レンジは、伝送に先がけて、36dBに対応する6ビットだけ圧縮され、伝送後にはまた、同じ特性で解凍される。
【0007】特性曲線の非線形関数に対応する個々のサンプル値それぞれの歪みが発生するので、これらの方法には短所があり、出力信号yにおいて、強い可聴歪みを引き起こす。
【0008】
【発明が解決しようとする課題】反対に、本発明の目的は、出力信号yにおける歪みを、最小限に抑えることが可能な場合には、または高増幅vに対してさえも完全に排除できる場合には、相当程度を低減するように、導入部で説明したタイプの方法を最も簡単な可能な手段によってなおいっそう発展させることである。
【0009】
【課題を解決するための手段】この目的は、本発明によれば、第1のステップ(a)では入力信号xが、その動的レンジにおいて中間値y<xに圧縮されるので、次の第2のステップ(b)では、一定の増幅値vで増幅された出力信号y=v*yが形成されるので、驚くほど簡単で、同時に効果的な方式により実現される。
【0010】増幅値vは、音の大きさ調整に対して使え、v>1が公称レベルをもつ信号の歪みを引き起こす場合に、v=1が信号の最大限の変調(full modulation)に対応するように定義される。
【0011】音声信号には、話者個々のストレスによって引き起こされるレベル変動がある。すべての音節(passage)に対して最大で、歪みのない増幅を達成するために、これらの静かな音節および大きな音節は、この場合別の仕方で処理されなければならない。
【0012】しかし、音声信号の信号形式は、できるだけ忠実に伝送されるべきである。信号形式は、会話内容(母音、子音など)に依存する。
【0013】本発明によれば、yについて、すぐ後の増幅vにおいて歪みのない信号を供給する、入力信号xからの中間値が、計算される。この目的のために、入力信号xの動的応答は、当該シナリオに応じた値へ圧縮されなければならない。必要な圧縮度、または信号の圧縮に必要な閾値は、xの信号内容および設定された増幅vに依存する。圧縮のタイプは、個々に定義できる。
【0014】本発明による方法の好ましい変形形態は、f(cf)を、入力信号xおよび一定の増幅値vに応じて計算される動的増幅係数(dynamic amplification factor)cfの関数であるとして、中間値yをy=x*f(cf)から形成する変形形態である。
【0015】中間値の構成については、すぐ後の、cfによる乗算での過大な変調に起因する歪みを避けるために、入力信号xが増幅vに応じて、ある値まで減少される。
【0016】この方法の変形形態のさらなる発展形態によれば、短時間平均値sam(x)を入力信号xから形成し、v≦1では、動的増幅係数cfをcf=1/v、として計算し、v>1では、動的増幅係数cfをcf=1/(v*sam(x))、として計算し、中間値y=x*f(cf)を各場合においてそこから形成することを実現する。
【0017】現在の増幅係数cfを計算するのに短時間平均値sam(x)を使用することで、事実上歪みのないレベル制御が容易になる。
【0018】個々のサンプル値は、固定的に考慮され、ほとんど同じ程度の増幅で処理される。これによって、可聴信号形式の歪みが回避され、同時に、システムは非常にめまぐるしくレベル変動に適応する。
【0019】システムは、個々のセクションについて安定しているように見えるが、なお依然として、めまぐるしいシステム変動が実際上聞こえずに修正されていることもある。この理由は、耳に適応するsamの平均化(sam−averaging)の使用である。
【0020】二段抽出された補助値をもつシステムでは、他の条件付動作がないため、このアプローチがより簡略になる。
【0021】この変形形態の簡略化により、出力信号yを、v<1のときに、入力信号xおよび増幅値vから直接計算し、y=v*xとなり、そうでない場合、cf=1/(v*sam(x))
となり、そこから出力信号y=x*f(cf)をそれぞれの場合に形成することを実現する。
【0022】過大変調の危険がない場合、出力信号を、直接xおよびvから計算できる。この手順の利点は、増幅値v<1の場合に信号の影響が発生しないことである。
【0023】上で説明した方法の変形形態の他のさらなる発展形態では、短時間平均値sam(x)を入力信号xから形成し、abs(x)≧1/vでは、動的増幅係数cfをcf=1/vとして計算し、abs(x)<1/vでは、動的増幅係数を|n|∈N≠0の場合、cf=1/(v*sam(x)
として計算し、そこから出力信号y=x*f(cf)をそれぞれの場合に形成することを実現する。このように、比較的広い制限内で本発明による方法により、補償の程度を自由に定義することができる。
【0024】このさらなる発展形態の特に簡単な実施態様では、指数n=1が選択される。
【0025】本発明による方法の他の特に好ましい実施形態では、関数f(cf)は、それが動的増幅係数cfのフィルタリング、特に平滑化を生じるように選択される。
【0026】この実施形態の特に効果的で容易に扱えるさらなる発展形態では、関数f(cf)は、cfに対する一次の再帰的フィルタである。
【0027】平滑化は、過大な変調が行われない場合すべてにおいて効果的であり、また歪み要因を減少させる。
【0028】特に、このさらなる発展形態では、入力信号xを、各場合に、等間隔の時間ステップTで、サンプリング周波数f=1/Tで、時間kにおいてサンプリングし、時間定数τ<tmaxでは、as=1−bs=1−e−T/τ時間定数τ>tminでは、al=1−bl=1−e−T/τとして【0029】
【数3】

に従って、関数f(cf)を平滑化された増幅値cg(k)として計算するように、さらに改善ができる。
【0030】大きな動的ジャンプの場合には、この状態依存のフィルタリングが結果的に過大変調の素早い抑制を行うことになり、一方、通常状態につては、平滑化フィルタの時間機能が耳に適合され、歪みのない再生を実現する。
【0031】また、それは平滑化された動的増幅値cgを計算する方法の副関数が計算容量を節約するためにfより低いサンプリング周波数を使用して計算される場合にも有利である。
【0032】音響的に十分な時間応答を達成するために、対応する時間制限値がtmax≦1msおよびtmin≧60ms、好ましくはtmin≧65msとして有利に選択される。
【0033】代替のさらなる発展形態では、関数f(cf)は、cfに関して以下を含む。
積分f(cf)=∫cf*dtまたは、cfにわたって、【数4】

【0034】特に好ましい方法の変形形態は、短時間平均値sam(x)が心理音響法則に従って人の耳の聴覚に適合するものである。
【0035】他の方法の変形形態では、入力信号xを、各場合に、等間隔の時間ステップTで、サンプリング周波数f=1/Tで、時間kにおいてサンプリングし、短時間平均値sam(x(k))を以下の式に従って計算することが有利である。
【数5】

【0036】ただし、時間定数τ<tmaxでは、as=1―βs=1−e−T/τ時間定数τ>tminでは、al=1−βl=1−e−T/τ時間制限値はやはりtmax≦1msおよびtmin≧60ms、好ましくはtmin≧65msとして選択されることが好ましい。
【0037】また、本発明の範囲には、上で説明の、本発明による方法をサポート/実行するためのサーバユニット、プロセッサモジュール、およびゲートアレイモジュール、ならびに当該方法の実行のためのコンピュータプログラムが含まれる。その方法は、ハードウェア回路としても、またはコンピュータプログラムの形でも実現できる。現在、高出力DSPのためにのソフトウェアプログラミングは、新しい道具として好まれ、既存のハードウェアベース上のソフトウェアを変更することで、追加機能がより簡単に実現できる。しかし、方法は、たとえば、TC端末または電話システム内でハードウェアモジュールとしても実現できる。
【0038】本発明のさらなる利点は、説明および図面から明らかにされよう。また、上で参照される特徴および以下で参照される特徴は、本発明によれば、個別に、またはあらゆる組合せで一緒に使用できる。図に示し説明される実施形態は、最終仕様としては理解されるべきでなく、むしろ本発明を説明する例示的なものとして役に立つ。
【0039】本発明は、図面内に示され、説明的な実施形態の形で詳細が説明される。
【0040】
【発明の実施の形態】本発明による方法の目的は、伝送動力学の制限が存在するすべての適用例において、オーディオ信号、特に人の音声信号の動的応答を制限または低減することである。
【0041】したがって、小さなラウドスピーカによる、または限られた電源電圧をもつ端末(バッテリー稼動装置)内での音声信号の歪みのない再生は、限られた変調レンジでのみ可能である。しかし、たとえば、雑音で満ちた環境にあって、それでもなお小さな音節が聴こえるためには、システムが発することができるよりも大きな音の大きさレベルが必要なことがたびたびある。しかし、これは動的レンジを低減することによってのみ可能である。
【0042】図1aに本発明の原理を示す。ここで出力信号y(k)は、式(1)に従って、以下のように計算される。
y(k)=v*y(k) (1)
(k)は、動力学的に低減した入力信号で、式(2)に従って以下のように計算される。
【数6】

【0043】また、式(2)における条件付き決定は、より早く行える。したがって、決定が式(1b)と同様に行われ、それによってy(k)が以下のように単純化され、可能な限り最良の信号対雑音比が実現できる。
【数7】

(k)=x(k)*f(cf) (2b)
【0044】y(k)につき、要求される増幅で歪みなしに増幅できる、動的に制御された信号が計算される。動力学的な圧縮は、式(3)に従って、以下のように計算できる平均化した圧縮比cf(m)で達成される。
【数8】

【0045】インデックスmは、この値が二段抽出できることを示す。cf(m)の平均化は、以下の式(4)に示すように達成できる。
【数9】

【0046】2つの時間定数が使用される。係数asおよびbsは、短時間定数を表し、alおよびblは、長時間定数を表す。
【0047】図2aに、v=1およびv=10のときの本発明の運用のモードを示す。およそ−35dBからの曲がりがはっきりと示され、そこから信号圧縮が入力レベルの増加に伴って大きくなる。
【0048】図3aに、時間信号における本発明の運用のモードを示す。音声信号の静かな音節をいまなおはっきりと増幅できるが、一方でラウド信号の歪みが圧縮によって防がれている。
【0049】図1bに、上で説明のハードクリッパ原理を示す。
【0050】図2bに、v=1およびv=10のときのハードクリッパの効果を示す。ここで、−20dBにおいて強い歪みがすでに発生している。
【0051】最後に、図3bに、時間信号の場合におけるハードクリッパの効果を示す。
【出願人】 【識別番号】391030332
【氏名又は名称】アルカテル
【出願日】 平成13年10月4日(2001.10.4)
【代理人】 【識別番号】100062007
【弁理士】
【氏名又は名称】川口 義雄 (外5名)
【公開番号】 特開2002−182700(P2002−182700A)
【公開日】 平成14年6月26日(2002.6.26)
【出願番号】 特願2001−308293(P2001−308293)