トップ :: G 物理学 :: G10 楽器;音響




【発明の名称】 音声データ変換処理方法及びそのための装置
【発明者】 【氏名】高根澤 康記

【要約】 【課題】ディジタル信号のデータ送受信において、音声データについてのロックモードとアンロックモードのフレーム内サンプル数の規定に合致するような変換処理をすること。

【解決手段】映像のフレーム毎に任意のサンプル数を持つ音声データを含んでいる入力データを所定のフレームシーケンスに対してフレーム毎に規定のサンプル数を有する音声データに変換する音声データ変換処理方法であって、入力データを取り込むメモリ手段13と前記メモリ手段を制御するメモリ制御手段15とを用いて、隣接するフレーム境界の音声サンプルを前記隣接するフレーム間にて受け渡しを行ってフレーム当りのサンプル数を規定の数に合わせ込むこと。
【特許請求の範囲】
【請求項1】 映像のフレーム毎に任意のサンプル数を持つ音声データを含んでいる入力データを所定のフレームシーケンスに対してフレーム毎に規定のサンプル数を有する音声データに変換する音声データ変換処理方法であって、前記入力データを取り込むメモリ手段と前記メモリ手段を制御するメモリ制御手段とを用いて、隣接するフレーム境界の音声サンプルを前記隣接するフレーム間にて受け渡しを行ってフレーム当りのサンプル数を規定の数に合わせ込むことを特徴とする音声データ変換処理方法。
【請求項2】 映像のフレーム毎に任意のサンプル数を持つ音声データを含んでいる入力データを所定のフレームシーケンスに対してフレーム毎に規定のサンプル数を有する音声データヘ変換する音声データ変換処理方法であって、前記入力データの単位ブロックに対して、それぞれデータ補間又はデータ切り捨てにより音声データの加工を順次行うことによって規定のサンプル数に変換することを特徴とする音声データ変換処理方法。
【請求項3】 請求項1に記載の音声データ変換処理方法において、前記メモリ制御手段は、前記入力データが特定のフォーマットにより構成されていることを利用して、書き込みと読み出しのアドレス制御を行うことを特徴とする音声データ変換処理方法。
【請求項4】 請求項1、2又は3に記載の変換処理方法において、ディジタルインターフェースからの入力データにおける補助データについても変換処理後の音声データに合わせて所定の内容に書き換えることを特徴とする音声データ変換処理方法。
【請求項5】 請求項1、2又は3に記載の変換処理方法において、ディジタルインターフェースからの入力データの補助データから音声のサンプリング周波数、モード種別、フレーム当りのサンプル数を含む情報を得て、変換処理の内容を切り替えることを特徴とする音声データ変換処理方法。
【請求項6】 送受信されるデータから音声データの部分だけ抜き出す音声データ抽出手段と、前記抽出された音声データの補助データから音声データがアンロックモードであるかロックモードであるかを検出するとともに当該フレームにおける音声データのサンプル数を含む情報を得る検出手段と、前記補助データから得た情報によるモードと変換すべきモードとの間でフレーム毎のサンプル数に差異があることを利用して音声データの処理を行う音声データ処理手段と、前記音声データ処理を行ったデータを元の入力データに対して置き換えていくデータ置換手段と、補助データの情報に基づいて置換データを採用するか元の入力データを採用するかを選定する判定手段と、を備えたことを特徴とする音声データ変換処理装置。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、映像と音声を有するディジタルデータを扱う機器において、そのデータを、ディジタルインターフェースを介して他の機器と送受信を行う装置に関するものである。
【0002】
【従来の技術】近年、映像及び音声信号をディジタル化して実質的に劣化させることなく記録/再生するディジタルビデオカセットテープレコーダが民生用機器として普及してきている。これは、DVフォーマットと呼ばれ、HDディジタルVCR協議会により規格化されている。記録データは、1フレーム単位に処理され、磁気テープヘの記録のため、これをトラックと呼ばれる単位に分割する。高能率符号化されたビデオ信号とシャッフリングと呼ばれるフレーム単位でのサンプルの並び替えを施したオーディオ信号及びサブコードとそれぞれ誤り訂正用の符号をつけた形で記録される。
【0003】図7にオーディオデータにおける1トラック分の記録フォーマットを示す。ここで、図中のAAUXはオーディオデータの補助データとして付加されているものであり、PC0からPC4までの5バイトのデータで成り立ち、PC0にそのAAUXがどういう種類のデータをPClからPC4に含むものかを区別するヘッダが入っており、この5バイトを1パックと称し、1トラック中に9パックある。その中身はそのフレームにおけるオーディオデータのフレーム当りのサンプル数、サンプリング周波数及び記録年月日などの情報を記録したデータである。AAUX0のデータ内訳を図5に示しておく。
【0004】また、このDVフォーマットのデータをマルチメディアデータ転送のために規格化されたIEEE1394シリアルインターフエース(以下、1394I/Fと称する)を用いて伝送することも一般化されてきている。1394I/Fを介して送受信されるビデオデータ・オーディオデータ等は、記録時は誤り訂正符号付加前、再生時は誤り訂正による修整後のデータ(77バイト)が使われ、これにヘッダ(3バイト)を追加したDIFブロックと呼ばれる80バイトのブロックデータの集まりとして扱われ、図6に示す150個のDIFブロックでDIFシーケンスを形成しており、これが1トラック分のデータとなり、NTSCではDIFシーケンス10個で1フレームのデータとなる。また、図6の下方にオーディオデータのDIFブロック(80バイト)の内容について示してある。
【0005】ところで、DVフォーマットにはオーディオの記録形式としてロックモードとアンロックモードがある。ロックモードとは、ビデオ信号とオーディオ信号の相対位相を保った状態で記録されるもので、1フレーム当りのサンプル数が規格上決まっており、例えば、NTSCの48KHz2CHモードでは5フレームシーケンスで処理され、先頭フレームが1600、以降の4フレームが1602サンプルになるように記録される。32KHz(2CH,4CH)モードでは15フレームシーケンス処理で先頭と8番目のフレームは1066、それ以外は1068のサンプルが入るように決められている。
【0006】ロックモードは、主に業務用のディジタルVTR等で採用されている。一方、アンロックモードは、家庭用として使用される目的で設けられたもので、ビデオ信号とオーディオ信号の相対関係は保証されず、フレーム当りのサンプル数も例えば、NTSC・48KHzでは1620から1580サンプルの間を取るようにその範囲が定められているのみである。実際、民生DVCでは、アンロックモードでの記録方式が広く採用されている。
【0007】
【発明が解決しようとする課題】ここで、1394I/F等のディジタルインターフェースを介してデータの送受信を行うとき、受信側が上記ロックモードオーディオでの記録再生を行う装置の場合、送信データがアンロックモードであるとそのままでは記録が出来ないという問題が発生する。また、アンロックモードのデータを受信してロックモードにて記録するような場合もデータの変換が必要となる。
【0008】このようにアンロックからロックモードヘのデータ変換を行う装置として、特開平11−317916号公報に示される装置のように、音声データのデインターリーブ後にサンプルレート変換処理を行うものがあるが、回路が複雑・大規模になってしまう。
【0009】本発明の目的は、映像と音声のディジタル信号のデータ送受信において、音声データについてのロックモードとアンロックモードにおけるフレーム内サンプル数の規定に合致するような変換処理を工夫ある手段と手法を用いて簡易に実行することにある。
【0010】
【課題を解決するための手段】前記課題を解決するために、本発明は主として次のような構成を採用する。
【0011】映像のフレーム毎に任意のサンプル数を持つ音声データを含んでいる入力データを所定のフレームシーケンスに対してフレーム毎に規定のサンプル数を有する音声データに変換する音声データ変換処理方法であって、前記入力データを取り込むメモリ手段と前記メモリ手段を制御するメモリ制御手段とを用いて、隣接するフレーム境界の音声サンプルを前記隣接するフレーム間にて受け渡しを行ってフレーム当りのサンプル数を規定の数に合わせ込む音声データ変換処理方法。
【0012】また、前記音声データ変換処理方法において、前記メモリ制御手段は、前記入力データが特定のフォーマットにより構成されていることを利用して、書き込みと読み出しのアドレス制御を行う音声データ変換処理方法。
【0013】また、映像のフレーム毎に任意のサンプル数を持つ音声データを含んでいる入力データを所定のフレームシーケンスに対してフレーム毎に規定のサンプル数を有する音声データヘ変換する音声データ変換処理方法であって、前記入力データの単位ブロックに対して、それぞれデータ補間又はデータ切り捨てにより音声データの加工を順次行うことによって規定のサンプル数に変換する音声データ変換処理方法。
【0014】
【発明の実施の形態】本発明の実施形態に係る音声データ変換処理方法について図面を用いて以下説明する。本実施形態ではDVフォーマットデータに対する処理の例を挙げて詳細に説明する.図1は、本発明の実施形態に係る音声データ変換処理方法に関する回路構成例を示したものである。図1において、11の1394I/Fを介して前記DIFシーケンスのデータが入力される。入力データは、図6にあるようにヘッダやビデオ信号等も含んでいるため、オーディオデータ部分を図1のAUDIOデータ抽出回路12によりDIFブロックのヘッダ等の情報により抜き出す。回路の規模も考慮し、AAUXを除くオーディオデータのみフレームメモリ13に順次記録していき、AAUXについては処理上必要となるAAUX0のデータのみAAUX検出回路14に保持しておく。
【0015】ここで、AAUX0は図5に示すヘッダPC0が「50(h)」のデータであり、図中PClにあるLFは、ロックモード時は「0」、アンロックでは「1」を示し、同じくPClのAF SIZEにはそのフレームのサンプル数を導くためのデータが入っている。サンプル数は、サンプリング周波数(図中PC4のSMP)やNTSCやPAL等のフィールド周波数の違い(図中PC3の50/60)によって決まっている。
【0016】上記AAUX0からの情報により導き出された、そのフレームのサンプル数とロックモードで必要とされるサンプル数の差分を求め、音声データのフレーム間前後の有効サンプルデータにおいて、ロックモードのサンプル数に対して多い場合にはその差分だけ有効なサンプルデータを次のフレームの方へ移し、少ない場合にはその分だけ次のフレームのデータから補充するという処理を行っていく。
【0017】ここで、有効サンプルデータとはAAUX0から得たサンプル数分までのそのフレーム内で持っていたサンプルデータを示す。このサンプルのフレーム間の移動を行っていくためにもう1フレーム程オーディオデータは必要となるので、フレームメモリ13は2フレーム分用意し、交互に書きこみ、読み出しを行い、使用する。ここで、フレームメモリ13にはテープ記録時のシャッフリング処理の施されたデータ並びのまま書き込む。
【0018】NTSC48KHzの場合を例にとると、図8に示すような形でメモリに記録されている。説明のために横のデータ並びの塊をシンクポジション(SP)、その2バイト単位のまとまりをバイトポジション(BP)とし、シンクブロック9個単位(SP0からSP8)でまとめたものをトラックナンバー(TN)とし、合わせて図示しておく。CH2のデータも同様な並びでトラックナンバーがNTSCではTN5からTN9を持つ所に違いがある(CH2のデータでは、TNが図中カッコ内の値となる)。
【0019】ここで、図8の横並びのシンクブロック1つ(72バイト)が図6にて説明しているDIFブロック1つから抜き出したオーディオデータに対応し、DIFブロックの転送順序は、この図8の上から順に行われていたものと対応する。また、NTSCではTN0からTN9まで順に転送される。即ち、図8をメモリに置き換えて説明すると、抽出したオーディオデータは図8の上から順にメモリに書き込んでいくと考えてよい。
【0020】次に、AAUX0からのサンプル数の情報を元に前述したロックモードのサンプル数に合わせるようにサンプルのフレーム間の移動を行うのであるが、それにはシャッフリング規則を考慮してアドレス制御を行うことで効率の良い処理が可能となる。例えば、ロックモードの並びに対して1サンプルだけデータが少ないフレームは、次のフレームにおける最初のサンプルを持ってきて合わせこみ、最初のサンプルを抜いた次のフレームについては、読み出すシンクブロックの順序を変えて2番目のサンプルの入ったシンクブロックを先頭とすることと抜いたサンプルのあったシンクブロックは右隣のデータのBPが繰り上がり、そのシンクの先頭データとする処理が入る。この前のフレームに1サンプルだけ渡してしまったフレームの読み出し手順を図10に示す。
【0021】図10は、図8を元のメモリのデータ並びとして、それを基準に作成している。詳しく説明すると、1サンプル(D0)だけ前のフレームに移動したことにより、TN2、SP3におけるDlのデータのあるシンクブロックがこのフレームの先頭のデータとなり、そのトラック内でSP4、SP5、…SP8、SP0、SPl、SP2とTN2のSPを一巡するように読んでいくとDIFシーケンスにおける最初のトラックの音声データを取ることができる。
【0022】同様にして次のトラックのDIFデータは本来D3の含まれるデータで始まるので、1つ増やしたD4から始まるシンクブロックの含まれるTN3をSP3から始めてSPを順にそのTN内で一周りする形で読んでいく。3トラック目は、D7の含まれるトラックのデータであり、TN4、SP3のD7を先頭に読み出していく。このようにしてサンプルの抜けた分だけ読み出すアドレスをシンクブロック単位で変えることで対処していく。
【0023】ここで、抜いたサンプルD0のあったTN0、SP0のシンクはバイトポジションをずらし、つぎのBPlのデータ(D45)がそのシンクブロックの最初のサンプルとして読み出すことで対応する。このシンクブロックは変換後のデータでは、D44のデータが入ったブロックとして処理される。尚、BPを前倒しすることで図10の注2のようなデータの埋まらないメモリブロックができるが、元々ここの部分のデータは本処理においては、無効部分であるので特に処理は必要としない。このようにして、サンプルを前のフレームに渡すことで、減ったサンプルの分だけ、読み出すシンクのアドレスの順番を変え、シンク内のBPも抜けた個所については、前倒ししていくことで、サンプルの移動を行う。
【0024】また、このフレームの持っていたAAUX0から得たサンプル数については、今の場合だとサンプル数を前のフレームに渡すために、既に1つ抜いていることに注意して処理しなければならない。
【0025】逆に、ロックモードヘの置き換えサンプル数よりもメモリ内にあるサンプル数のほうが多い場合には、余ったサンプルデータは次のフレームに移す作業を行う。ここで、前のフレームが1つだけサンプルが多かった場合に、次のフレームのアドレス処理はどのようになるかについて、前述のように図8を元のメモリのデータ並びとして、その内容を描いた図11を用いて説明する。
【0026】余った前のフレームのサンプルが移ってきたことにより、移ってきたサンプルがフレームの最初のサンプルとなり、既存のサンプルは全体として、順番が1つ増えることになる。移動してきたサンプルは、フレーム内で一番後ろのサンプルを持つこととなるD44の含まれるシンクブロック(TN3,SP8)の先頭に入ることで、このシンクブロックがフレームの先頭データ(変換後にD0の並びとして処理されるシンクブロック)となり、DIFシーケンスデータとしてTN3をSP8、SP6、SP7、SP0、…SP5の順で読み出すことになる。
【0027】次のトラックは余りがなければD3からであるので、一つ前のD2の含まれるTN4、SP6からとなり、順にSPを一周りする形で読み出され、3トラック目はTN0、SP6のD5を先頭として始まる。このようにして、読み出すデータが1サンプル分ずれることを考慮してシンクブロック毎にアドレス制御をかけていくことで、サンプルデータの入れ替え処理ができる。
【0028】尚、前のフレームのサンプルが入ったシンクブロックの最後のデータは、このフレームのデータとして読み出されることは無くなるが、本処理上は有効データであれば、位置的には当然次のフレームに移される部分のデータであるので、問題は無い。ここでもAAUX0から取得したサンプル数については、このケースでは、その数より1サンプル多いものとして処理することになる。このような処理が図1のアドレス制御回路15において行われて、ロックモードに合わせた形で有効なサンプルデータがフレームメモリから読み出されていく。
【0029】ここでは例として1サンプルだけずれた場合を挙げて説明したが、過不足となるサンプル数はフレーム毎に変化し、その値は積算されていくため、それによってアドレスをずらす幅は変わっていくが本質的な処理内容はほぼ変わらない。
【0030】一方、元のDIFデータは図1の遅延メモリ17でオーディオデータ部分と同じだけ同期管理のため遅延させている。
【0031】次に、アドレス制御によりロックモードに対応した所定のサンプル数に合わせこまれつつ、フレームメモリから読み出されたオーディオデータとAAUX置換回路16により、図5のPClのLFを「0」とAF SIZEの値をロックモードの所定のサンプル数に対応した値に変更が加えられたAAUX0のデータは、図1のデータ置換装置19において、遅延メモリ17を通った元のDIFシーケンスデータの該当するDIFブロック部(図6のA0からA8)に対して置き換え処理が施される。こうして、アンロックのオーディオを含むDIFシーケンスデータがロックモードのオーディオを含んだDIFシーケンスデータに変換される。ただし、アンロック判定回路18により、元のDIFデータが既にロックモードのデータであると判定された場合には、置き換え処理は行わず、そのまま遅延メモリ17を通ってきた元のDIFデータが採用され、出力される。
【0032】図2にこの回路を使ってオーディオデータのサンプル数をアンロックからロックモードに変換したサンプル合わせ込みの様子をNTSC/48KHzの場合を例に示しておく。
【0033】図3には、本発明の実施形態に係る音声データ変換処理方法に関する他の回路構成例を示したものである。オーディオデータの抽出部分までは、図1の処理と同様となる。取り出されたオーディオのDIFデータは、そのフレームのサンプル数に関係なくロックモードヘの変更に必要な所定のサンプル数分のみ有効データとして採用し、それ以外はオーディオエラーコードに置き換える。この処理は順次行われる。
【0034】具体的には、ロックモードヘの変更のための所定のサンプル数より少ないフレームのデータは、実際の有効サンプル数を超えた部分についてオーディオエラーコードで埋める処理を行い、逆にサンプル数の多いフレームは超えてしまった分については、入れ替えるAAUX0のサンプル情報により、無効データとみなされるので特別な処理は必要無い。その模様を図9に示す。
【0035】更に、AAUX0のデータから算出されるサンプル数を確認しておき、サンプル数がロックモードで必要とするものより多いフレームが出力された場合は、次のフレームでの先頭のサンプルをエラーコードに置き換える。これらのデータの加工処理を図3のデータ制御回路34にて行う。
【0036】ここで、元の有効サンプル数が多い場合は、有効サンプルを途中で切ってしまう事になり、次のフレームのサンプルとが不連続になってしまい、そのままではノイズ発生の問題があるので、先頭サンプルをエラーコードで置き換える事で、再生時に補間等による処理によるノイズの低減を予め施しておく。
【0037】こうしてサンプルのオーディオエラーコードヘの置き換え処理等を終えたデータは、ロックモードのオーディオデータとして変更したAAUX0データとともに、元のDIFデータに対してデータ置換回路37によって置き換え処理を施される。この際に、元のDIFデータについては、オーディオデータの処理系が簡単な回路構成となるので、フレーム単位で遅らせる必要もなく、小規模の遅延回路35でのタイミングの合わせ込みでデータの同期は取れる。このように比較的簡単かつ小規模な回路構成でアンロックモードオーディオデータのロックモードヘの変換処理が可能となる。この場合もアンロック判定回路36により、元のDIFデータが既にロックモードのデータであった場合には、遅延回路35を通ってきた元のDIFデータの方を出力データとする。
【0038】図4にこの回路で処理されるオーディオサンプル数の様子をNTSC/48KHzの場合を例として示す。
【0039】以上説明したように、本発明の実施形態では、入力データを取り込むメモリ手段とそのメモリ制御手段を用いて音声データを変換処理する1つとして、オーディオデータをフレームメモリに保持し、読み出し時のアドレス制御によって、サンプルをフレーム間に渡って移動させることでサンプル数をロックモードの所定の数に合わせ込む方法を採用する。
【0040】また、フレームメモリを使わない方法として、ロックモードに合わせたサンプル分のみ有効となるようにエラーコードを利用したデータの加工をDIFブロック毎に順次行っていく方法も採用できる。この方法では、元の音声データに対して加工を施すことが頻繁に発生すると予測され、音声自体の劣化は上述したメモリを使用した方法に比べると大きいが、データを順次加工していくので、データ保持や位相合わせのためのフレームメモリ等を必要とせず、比較的小規模な回路で構成できるという点で有効である。
【0041】
【発明の効果】本発明によれば、DVフォーマットにより記録されているフレーム毎のサンプル数が確定されていないアンロックモードのオーディオデータがディジタルインターフェースにて送信されてきた場合に、これを所定のフレームシーケンスに応じてフレーム毎にそのサンプル数が決まっているロックモードのオーディオデータに変換することがメモリのアドレス制御もしくはデータの加工等を用いることで実現可能となる。
【出願人】 【識別番号】000005049
【氏名又は名称】シャープ株式会社
【出願日】 平成13年1月16日(2001.1.16)
【代理人】 【識別番号】100111914
【弁理士】
【氏名又は名称】藤原 英夫
【公開番号】 特開2002−215190(P2002−215190A)
【公開日】 平成14年7月31日(2002.7.31)
【出願番号】 特願2001−7720(P2001−7720)