トップ :: G 物理学 :: G10 楽器;音響




【発明の名称】 音楽信号処理装置
【発明者】 【氏名】伊達 俊彦

【氏名】小川 理子

【氏名】小林 良輔

【氏名】平田 智美

【要約】 【課題】入力される音楽データの内容に応じた音質を得ることが可能な音楽信号処理装置を提供する。

【解決手段】特徴量検出部311は、入力される音楽データの特徴量を導出する。導出された特徴量は、ジャンル情報決定部312により楽曲のジャンルを示すジャンル情報に変換される。パラメータ決定部313は、ジャンル情報に基づいて、音響処理部314からの出力音質を調整する音響処理パラメータを決定する。決定された音響処理パラメータに従い、音響処理部314は、入力される音楽データに対して、所定の音響処理を行う。所定の音響処理が行われた音楽データは、再生部315により再生される。以上により、音楽信号処理装置は、入力される音楽データの内容に応じた音質を得ることができる。
【特許請求の範囲】
【請求項1】 音楽データに所定の音響処理を行う音楽信号処理装置であって、入力される入力音楽データの音響特性を分析し、分析結果を出力する分析部と、前記分析部による分析結果に応じて、前記所定の音響処理による出力音質を調整する音響処理パラメータを決定するパラメータ決定部と、前記パラメータ決定部により決定された音響処理パラメータに従い、前記入力音楽データに対して前記所定の音響処理を行う音響処理部とを備える、音楽信号処理装置。
【請求項2】 前記分析部は、前記分析結果として、前記入力音楽データの内容についての特徴を示す特徴量を検出する特徴量検出部と、前記特徴量検出部により検出された特徴量を、当該特徴量と異なる指標であり、人間がより理解しやすい指標により表現する中間データを生成する中間データ生成部とを含み、前記パラメータ決定部は、前記中間データ生成部により生成された前記中間データに基づいて、前記音響処理パラメータを決定することを特徴とする、請求項1に記載の音楽信号処理装置。
【請求項3】 前記中間データは、前記前記入力音楽データが分類されるジャンルを示すジャンル情報であることを特徴とする、請求項2に記載の音楽信号処理装置。
【請求項4】 前記中間データは、楽曲の音質についてユーザの心理量を示す感性表現値であることを特徴とする、請求項2に記載の音楽信号処理装置。
【請求項5】 楽曲の音質についてユーザの心理量を示す感性表現値の入力をユーザから受け付けるユーザ入力部をさらに備え、前記パラメータ決定部は、前記ユーザ入力部に入力された感性表現値と、前記中間データ生成部により生成されたジャンル情報とに基づいて、前記音響処理パラメータを決定することを特徴とする、請求項3に記載の音楽信号処理装置。
【請求項6】 前記ユーザ入力部は、前記中間データ生成部により生成されたジャンル情報が示すジャンルに応じて、異なるタイプの前記感性表現値の入力を受け付けることを特徴とする、請求項5に記載の音楽信号処理装置。
【請求項7】 前記音響処理部は、前記入力音楽データに対してデータ圧縮処理を行う音声圧縮エンコーダであり、前記音声圧縮エンコーダからの出力をデコードし、デコード済みデータを生成するデコーダと、前記入力音楽データの音響特性と前記デコード済みデータの音響特性とを比較し、それによって前記音響処理パラメータを修正すべき周波数帯域を検出する比較部とをさらに備え、前記パラメータ決定部は、前記比較部により検出された周波数帯域に基づいて、当該周波数帯域に対応する前記音響処理パラメータを修正することを特徴とする、請求項1に記載の音楽信号処理装置。
【請求項8】 音楽データに所定の音響処理を行う音楽信号処理方法であって、入力される入力音楽データの音響特性を分析し、分析結果を出力する分析ステップと、前記分析ステップの分析結果に応じて、前記所定の音響処理による出力音質を調整する音響処理パラメータを決定するパラメータ決定ステップと、前記パラメータ決定ステップで決定した音響処理パラメータに従い、前記入力音楽データに対して前記所定の音響処理を行う音響処理ステップとを備える、音楽信号処理方法。
【請求項9】 前記分析ステップは、前記分析結果として、前記入力音楽データの内容についての特徴を示す特徴量を検出する特徴量検出ステップと、前記特徴量検出ステップで検出された特徴量を、当該特徴量と異なる指標であり、人間がより理解しやすい指標により表現する中間データを生成する中間データ生成ステップとを含み、前記パラメータ決定ステップは、前記中間データ生成ステップで生成された前記中間データに基づいて、前記音響処理パラメータを決定することを特徴とする、請求項8に記載の音楽信号処理方法。
【請求項10】 前記中間データは、前記入力音楽データが分類されるジャンルを示すジャンル情報であることを特徴とする、請求項9に記載の音楽信号処理方法。
【請求項11】 前記中間データは、楽曲の音質についてユーザの心理量を示す感性表現値であることを特徴とする、請求項9に記載の音楽信号処理方法。
【請求項12】 楽曲の音質についてユーザの心理量を示す感性表現値の入力をユーザから受け付けるユーザ入力ステップをさらに備え、前記パラメータ決定ステップは、前記ユーザ入力ステップで入力された感性表現値と、前記中間データ生成ステップで生成したジャンル情報とに基づいて、前記音響処理パラメータを決定することを特徴とする、請求項10に記載の音楽信号処理方法。
【請求項13】 前記ユーザ入力ステップは、前記中間データ生成ステップで生成したジャンル情報が示すジャンルに応じて、異なるタイプの前記感性表現値の入力を受け付けることを特徴とする、請求項12に記載の音楽信号処理方法。
【請求項14】 前記音響処理ステップは、前記入力音楽データに対してデータ圧縮処理を行い、それによって圧縮済みデータを生成し、前記圧縮済みデータをデコードし、デコード済みデータを生成するデコード済みデータ生成ステップと、前記入力音楽データの音響特性と前記デコード済みデータの音響特性とを比較し、それによって前記音響処理パラメータを修正すべき周波数帯域を検出する比較部ステップとをさらに備え、前記パラメータ決定ステップは、前記比較ステップで検出した周波数帯域に基づいて、当該周波数帯域に対応する前記音響処理パラメータを修正することを特徴とする、請求項8に記載の音楽信号処理方法。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、音楽信号処理装置に関し、より特定的には、入力音声データの音質的特徴に対応した音声データを出力する音響信号処理システムに関する。
【0002】
【従来の技術】従来より、音声データを音響信号処理して処理済み音声データを出力する音楽信号処理装置には、グラフィックイコライザー、コンプレッサー、トーンコントロールと呼ばれる音質制御装置や、リバーブ、ディレイ、フランジャーと呼ばれる音響効果装置や、クロスフェード、ノイズリダクションと呼ばれる音声データ編集装置等がある。これらは、業務用音楽制作スタジオから民生用音響再生機器まで幅広く普及している。また、近年では、音楽流通形態の変化に応じて、音声データ圧縮エンコーダ、電子すかしデータエンベッダ等の装置も普及しつつある。以上のような音楽信号処理装置は、音楽制作会社の制作担当者、演奏家、音楽を愛好するホビーユーザ等によって、音質調整、表現創作手段、後工程の(帯域制限などに対応する)ための前処理等の目的で利用されている。
【0003】図20は、従来の一般的な音楽信号処理装置の構成を示すブロック図である。図20において、音楽信号処理装置は、入力部91と、音響処理部92とを備えている。入力部91は、ユーザの指示により、音響処理部92における処理の条件となるパラメータを、音響処理部92に出力する。音響処理部92は、入力部91から出力されたパラメータに従い、予め定められた処理アルゴリズムにより入力データを処理し、処理済みデータを出力する。以上のように、音楽信号処理装置は、ユーザが入力部91を用いてパラメータを操作することにより、出力音声データの音質を調整することができる。
【0004】なお、特開平8−298418号公報に開示されているように、音楽信号処理装置の音質を調整するために、音質評価語として一般的に使用されている表現語を用いる装置が提案されている。これは、装置利用者の感性を、音響再生機器の音質評価語として一般的に使用されている表現語を用いて入力し、グラフィックイコライザーのFIRフィルタを設定するものである。これにより、音響処理の知識や経験の少ない一般ユーザでも、音質の調整を容易に行うことができる。
【0005】
【発明が解決しようとする課題】従来の音楽信号処理装置では、出力音質が適当でないとユーザが判断した場合、ユーザ自身が音質を調整するためのパラメータを設定し直すことにより、適当な出力音質を得ることとしている。
【0006】ここで、上記のような音楽信号処理装置において処理の対象となる音楽データは、その内容によって、適当と考えられる処理が変化する性質のものである。例えば、音楽データの内容によっては、低域部分を強調するように音響処理が行われることが適当である場合もあれば、高域部分を強調するように音響処理が行われることが適当である場合もある。
【0007】従って、従来の音楽信号処理装置においては、入力されるデータが別のものになれば、ユーザが一度設定したパラメータであっても、必ずしも最適なパラメータとはならない場合がある。以上より、従来の音楽信号処理装置においては、入力される音楽データの内容に応じた音響処理を行うことができなかった。
【0008】それ故に、本発明の目的は、入力される音楽データの内容に応じた音質を得ることが可能な音楽信号処理装置を提供することである。
【0009】
【課題を解決するための手段および発明の効果】第1の発明は、音楽データに所定の音響処理を行う音楽信号処理装置であって、入力される入力音楽データの音響特性を分析し、分析結果を出力する分析部と、分析部による分析結果に応じて、所定の音響処理による出力音質を調整する音響処理パラメータを決定するパラメータ決定部と、パラメータ決定部により決定された音響処理パラメータに従い、入力音楽データに対して所定の音響処理を行う音響処理部とを備える。
【0010】上記第1の発明によれば、入力音楽データの音響特性の分析結果に応じて、出力される音楽データの音質が変化するように、音響パラメータを設定することができる。従って、分析結果に応じて音質を変化させることができるので、入力される音楽データの内容に応じた音質を得ることが可能となる。
【0011】第2の発明は、第1の発明に従属する発明であって、分析部は、分析結果として、入力音楽データの内容についての特徴を示す特徴量を検出する特徴量検出部と、特徴量検出部により検出された特徴量を、特徴量と異なる指標であり、人間がより理解しやすい指標により表現する中間データを生成する中間データ生成部とを含み、パラメータ決定部は、中間データ生成部により生成された中間データに基づいて、音響処理パラメータを決定する。
【0012】上記第2の発明によれば、入力音楽データの分析結果である特徴量を、人間が理解しやすい指標に変換してから、音響処理パラメータを決定する。ここで、特徴量に基づき音響処理パラメータを決定するには、変換ルールを作成する必要がある。従って、特徴量を人間が理解しやすい指標に変換することにより、特徴量を直接音響処理パラメータに変換する場合に比べ、変換ルールを作成することが容易になる。
【0013】第3の発明は、第2の発明に従属する発明であって、中間データは、入力音楽データが分類されるジャンルを示すジャンル情報であることを特徴とする。
【0014】上記第3の発明によれば、特徴量から音響処理パラメータを得る際に用いられる中間データとして、ジャンル情報が用いられる。ここで、入力音楽データの楽曲のジャンルが同じであるか、または類似する場合、入力音楽データに適した音響処理の条件は類似すると考えられる。従って、楽曲のジャンルに応じて音響処理の条件を決定すれば、適切な音響処理パラメータを容易に決定することができる。すなわち、中間データとしてジャンル情報を用いることにより、特徴量から音響処理パラメータを得るための変換ルールの作成が容易になる。
【0015】第4の発明は、第2の発明に従属する発明であって、中間データは、楽曲の音質についてユーザの心理量を示す感性表現値であることを特徴とする。
【0016】上記第4の発明によれば、特徴量から音響処理パラメータを得る際に用いられる中間データとして、感性表現値が用いられる。ここで、入力音楽データについての感性表現値が同じであるか、または類似する場合、入力音楽データに適した音響処理の条件は類似すると考えられる。従って、感性表現値に応じて出力音質を決定すれば、適切な音響処理パラメータを容易に決定することができる。すなわち、中間データとして感性表現値を用いることにより、特徴量から音響処理パラメータを得るための変換ルールの作成が容易になる。
【0017】第5の発明は、第3の発明に従属する発明であって、楽曲の音質についてユーザの心理量を示す感性表現値の入力をユーザから受け付けるユーザ入力部をさらに備え、パラメータ決定部は、ユーザ入力部に入力された感性表現値と、中間データ生成部により生成されたジャンル情報とに基づいて、音響処理パラメータを決定する。
【0018】上記第5の発明によれば、音響処理パラメータは、入力音楽データの分析結果と、ユーザからの入力に基づいて決定される。このように、ユーザの入力を音響処理パラメータの決定に反映させることにより、ユーザの所望する音質をより正確に再現することができる。
【0019】第6の発明は、第5の発明に従属する発明であって、ユーザ入力部は、中間データ生成部により生成されたジャンル情報が示すジャンルに応じて、異なるタイプの感性表現値の入力を受け付ける。
【0020】上記第6の発明によれば、入力音楽データの楽曲のジャンルに応じて、ユーザの入力する感性表現値の種類が異なる。楽曲のジャンルが異なれば、楽曲の音質を表す適切な表現およびその表現の意味は異なるものとなる。従って、入力音楽データの楽曲のジャンルごとに異なる音質についての感性表現値を用いることにより、ジャンルに応じた表現を用いて、ユーザは入力を行うことができる。よって、ユーザは、ジャンルに応じた適切な表現を用いて音質調整を行うことができるので、より所望の音質を得ることが容易になる。
【0021】第7の発明は、第1の発明に従属する発明であって、音響処理部は、入力音楽データに対してデータ圧縮処理を行う音声圧縮エンコーダであり、音声圧縮エンコーダからの出力をデコードし、デコード済みデータを生成するデコーダと、入力音楽データの音響特性とデコード済みデータの音響特性とを比較し、それによって音響処理パラメータを修正すべき周波数帯域を検出する比較部とをさらに備え、パラメータ決定部は、比較部により検出された周波数帯域に基づいて、周波数帯域に対応する音響処理パラメータを修正する。
【0022】上記第7の発明によれば、入力データの音響特性と、音声圧縮後の出力データの音響特性とを比較することにより、出力音質を修正すべき周波数帯域が検出される。また、検出された周波数帯域に基づいて、音響処理パラメータが設定し直される。音響処理が音声圧縮エンコーダである場合、音質が劣化することが問題となる場合があるが、音響処理パラメータを修正することにより、音声圧縮エンコーダによる音質劣化を軽減することができる。
【0023】第8の発明は、音楽データに所定の音響処理を行う音楽信号処理方法であって、入力される入力音楽データの音響特性を分析し、分析結果を出力する分析ステップと、分析ステップの分析結果に応じて、所定の音響処理による出力音質を調整する音響処理パラメータを決定するパラメータ決定ステップと、パラメータ決定ステップで決定した音響処理パラメータに従い、入力音楽データに対して所定の音響処理を行う音響処理ステップとを備えている。
【0024】上記第8の発明によれば、入力音楽データの音響特性の分析結果に応じて、出力される音楽データの音質が変化するように、音響パラメータを設定することができる。従って、分析結果に応じて音質を変化させることができるので、入力される音楽データの内容に応じた音質を得ることが可能となる。
【0025】第9の発明は、第8の発明に従属する発明であって、分析ステップは、分析結果として、入力音楽データの内容についての特徴を示す特徴量を検出する特徴量検出ステップと、特徴量検出ステップで検出された特徴量を、特徴量と異なる指標であり、人間がより理解しやすい指標により表現する中間データを生成する中間データ生成ステップとを含み、パラメータ決定ステップは、中間データ生成ステップで生成された中間データに基づいて、音響処理パラメータを決定する。
【0026】上記第9の発明によれば、入力音楽データの分析結果である特徴量を、人間が理解しやすい指標に変換してから、音響処理パラメータを決定する。ここで、特徴量に基づき音響処理パラメータを決定するには、変換ルールを作成する必要がある。従って、特徴量を人間が理解しやすい指標に変換することにより、特徴量を直接音響処理パラメータに変換する場合に比べ、変換ルールを作成することが容易になる。
【0027】第10の発明は、第8の発明に従属する発明であって、中間データは、入力音楽データが分類されるジャンルを示すジャンル情報であることを特徴とする。
【0028】上記第10の発明によれば、特徴量から音響処理パラメータを得る際に用いられる中間データとして、ジャンル情報が用いられる。ここで、入力音楽データの楽曲のジャンルが同じであるか、または類似する場合、入力音楽データに適した音響処理の条件は類似すると考えられる。従って、楽曲のジャンルに応じて音響処理の条件を決定すれば、適切な音響処理パラメータを容易に決定することができる。すなわち、中間データとしてジャンル情報を用いることにより、特徴量から音響処理パラメータを得るための変換ルールの作成が容易になる。
【0029】第11の発明は、第8の発明に従属する発明であって、中間データは、楽曲の音質についてユーザの心理量を示す感性表現値であることを特徴とする。
【0030】上記第11の発明によれば、特徴量から音響処理パラメータを得る際に用いられる中間データとして、感性表現値が用いられる。ここで、入力音楽データについての感性表現値が同じであるか、または類似する場合、入力音楽データに適した音響処理の条件は類似すると考えられる。従って、感性表現値に応じて出力音質を決定すれば、適切な音響処理パラメータを容易に決定することができる。すなわち、中間データとして感性表現値を用いることにより、特徴量から音響処理パラメータを得るための変換ルールの作成が容易になる。
【0031】第12の発明は、第8の発明に従属する発明であって、楽曲の音質についてユーザの心理量を示す感性表現値の入力をユーザから受け付けるユーザ入力ステップをさらに備え、パラメータ決定ステップは、ユーザ入力ステップで入力された感性表現値と、中間データ生成ステップで生成したジャンル情報が示すジャンルとに基づいて、音響処理パラメータを決定する。
【0032】上記第12の発明によれば、音響処理パラメータは、入力音楽データの分析結果と、ユーザからの入力に基づいて決定される。このように、ユーザの入力を音響処理パラメータの決定に反映させることにより、ユーザの所望する音質をより正確に再現することができる。
【0033】第13の発明は、第12の発明に従属する発明であって、ユーザ入力ステップは、中間データ生成ステップで生成したジャンル情報が示すジャンルに応じて、異なるタイプの感性表現値の入力を受け付ける。
【0034】上記第13の発明によれば、入力音楽データの楽曲のジャンルに応じて、ユーザの入力する感性表現値の種類が異なる。楽曲のジャンルが異なれば、楽曲の音質を表す適切な表現およびその表現の意味は異なるものとなる。従って、入力音楽データの楽曲のジャンルごとに異なる音質についての感性表現値を用いることにより、ジャンルに応じた表現を用いて、ユーザは入力を行うことができる。よって、ユーザは、ジャンルに応じた適切な表現を用いて音質調整を行うことができるので、より所望の音質を得ることが容易になる。
【0035】第14の発明は、第8の発明に従属する発明であって、音響処理ステップは、入力音楽データに対してデータ圧縮処理を行い、それによって圧縮済みデータを生成し、圧縮済みデータをデコードし、デコード済みデータを生成するデコード済みデータ生成ステップと、入力音楽データの音響特性とデコード済みデータの音響特性とを比較し、それによって音響処理パラメータを修正すべき周波数帯域を検出する比較部ステップとをさらに備え、パラメータ決定ステップは、比較ステップで検出した周波数帯域に基づいて、周波数帯域に対応する音響処理パラメータを修正する。
【0036】上記第14の発明によれば、入力データの音響特性と、音声圧縮後の出力データの音響特性とを比較することにより、出力音質を修正すべき周波数帯域が検出される。また、検出された周波数帯域に基づいて、音響処理パラメータが設定し直される。音響処理が音声圧縮である場合、音質が劣化することが問題となる場合があるが、音響処理パラメータを修正することにより、音声圧縮による音質劣化を軽減することができる。
【0037】
【発明の実施の形態】図1は、本発明の第1の実施形態に係る音楽信号処理装置の構成を示すブロック図である。図1において、音楽信号処理装置は、音楽データ入力部1と、ユーザ入力部2と、演算部4と、音声出力部4と、表示部5とを備えている。
【0038】音楽データ入力部1は、音楽信号処理装置における音響処理の対象となる音楽データを、演算部3に入力する。音楽データ入力部1は、音楽データを予め格納しておいてもよいし、ネットワークを介して他の機器と通信可能である場合には、他の機器から通信によって音楽データを取得するようにしてもよい。ユーザ入力部2は、ユーザの指示に従って、音楽データの処理を行うために必要なデータを入力する。演算部3は、CPU、メモリ等により構成され、音楽データ入力部1から入力されてくる入力音楽データに対して所定の音響処理を行う。本実施形態において、所定の音響処理とは、入力データをフォーマット変換しデータ圧縮を行う処理である。すなわち、演算部3は、音声圧縮エンコーダの機能を有する。演算部3の詳細については、図2に説明されている。音声出力部4は、スピーカー等により構成され、演算部3により処理された音楽データを音に変換して出力する。表示部5は、表示装置等により構成され、音楽データ処理において用いられるデータの表示等を行う。
【0039】図2は、図1に示す演算部3の詳細な構成を示すブロック図である。図2において、演算部3は、特徴量検出部311と、ジャンル情報決定部312と、パラメータ決定部313と、音響処理部314と、再生部315とを備えている。以下、各部の詳細について説明するとともに、演算部3の動作を説明する。
【0040】特徴量検出部311は、音楽データ入力部1から入力される入力音楽データの音響特性の分析を行う。具体的には、特徴量検出部311は、入力音楽データから、特徴量を検出する。特徴量とは、音楽データの内容についての特徴を示すものであり、本実施形態では、テンポ、基本ビートおよび平均音数である。以下、特徴量検出部311において行われる音響特性分析処理の詳細を説明する。
【0041】図3は、図2に示す特徴量検出部311において行われる音響特性分析処理の流れを示すフローチャートである。まず、特徴量検出部311は、入力音楽データに対して離散フーリエ変換(DFT)を行う(ステップS11)。次に、特徴量検出部311は、ステップS11におけるDFTにより算出されたスペクトラムに基づき、立ち上がり成分の検出を行う(ステップS12)。立ち上がり成分とは、DFTにより算出されたスペクトラム上において、エネルギー成分が所定のレベル以上となる部分をいう。次に、特徴量検出部311は、ステップS12において検出した立ち上がり成分に基づき、平均音数を算出する(ステップS13)。平均音数は、単位時間における立ち上がり成分の数を平均化することにより算出される。
【0042】ステップS13の後、特徴量検出部311は、ステップS12において検出した立ち上がり成分に基づき、入力信号のエネルギー成分の繰り返し周期を算出する(ステップS14)。具体的には、特徴量検出部311は、入力信号の自己相関を求め、相関係数のピーク値を算出する。ピーク値とは、相関係数の大きさが所定のレベル以上となる場合の遅延時間を表すものである。さらに、特徴量検出部311は、ステップS14において算出したピーク値に基づき、入力信号のビート構造を解析し、基本ビートを決定する(ステップS15)。具体的には、特徴量検出部311は、上記のピーク値のレベルの高低のパターンに基づき、入力信号のビート構造を解析する。
【0043】ステップS15の後、特徴量検出部311は、ステップS14において算出したピーク値から、ピーク値の繰り返し周期を求め、テンポを求めるための候補値を算出する(ステップS16)。さらに、特徴量検出部311は、ステップS16において算出された候補値の内、予め決められた範囲内の値を選出し、テンポの値を決定して(ステップS17)、処理を終了する。以上の処理により算出されたテンポ、基本ビートおよび平均音数は、ジャンル情報決定部312に出力される。
【0044】ジャンル情報決定部312は、特徴量検出部311により検出された特徴量から、中間データを導出する。中間データとは、特徴量と異なる指標であり、人間がより理解しやすい指標により入力音楽データの内容を表現するものである。具体的には、ジャンル情報決定部312は、特徴量検出部311により検出された特徴量、すなわち、テンポ、基本ビートおよび平均音数に基づいて、ジャンル情報を決定する。本実施形態において、ジャンル情報とは、ジャンル名とパターン番号からなる情報である。より具体的には、ジャンル情報決定部312は、まず、予め用意されている複数のジャンル名の中から、ジャンル名を決定する。さらに、ジャンル情報決定部312は、各ジャンル名ごとに用意されている複数のパターン番号の中から、パターン番号を決定する。ジャンル名およびパターン番号の決定は、ジャンル情報決定部312において予め用意されている特徴量/ジャンル名変換テーブルおよび特徴量/パターン番号変換テーブルを参照することにより行われる。以下、特徴量/ジャンル名変換テーブルおよび特徴量/パターン番号変換テーブルについて説明する。
【0045】図4は、図2に示すジャンル情報決定部312において予め用意されている特徴量/ジャンル名変換テーブルの一例を示す図である。ここで、図4において、BPM、FB、ARは、それぞれ、テンポ、基本ビート、平均音数を意味する。図4のように、特徴量/ジャンル名変換テーブルは、各特徴量についての条件と、条件が満たされる場合に決定されるジャンル名とを対応付けるものである。また、図4において、ポップス、ロック、スローバラード、ユーロビートは、それぞれ、ジャンル名を示す。例えば、入力された各特徴量がBPM=120、FB=0.8、AR=100である場合、ジャンル名はロックに決定される。なお、図4においては、ジャンル名としてポップス、ロック、スローバラード、ユーロビートを例示しているが、ジャンル名は、これらに限らない。
【0046】図5は、図2に示すジャンル情報決定部312において予め用意されている特徴量/パターン番号変換テーブルの一例を示す図である。図5のように、特徴量/パターン番号変換テーブルは、ジャンル名および特徴量についての条件と、条件が満たされる場合に決定されるパターン番号とを対応付けるものである。なお、図5においては、パターン番号を決定するための特徴量として、テンポが用いられる。ジャンル情報決定部312は、ジャンル名を決定した後、特徴量/パターン番号変換テーブルを参照することにより、パターン番号を決定する。例えば、上記の例のように、ジャンル名がロックで、BPM=120である場合、パターン番号は2に決定される。以上のように決定されたジャンル情報、すなわち、ジャンル名およびパターン番号は、パラメータ決定部313に出力される。
【0047】なお、本実施形態において、パターン番号は、テンポに基づいて決定されたが、他の実施形態においては、テンポ以外の特徴量に基づいて決定されてもよい。また、パターン番号は、複数の特徴量に基づいて決定されてもよい。また、本実施例においては、ジャンル情報は、ジャンル名およびパターン番号の2段階に分けて区分されたものであったが、区分の仕方は上記に限らない。ジャンル情報は、例えば、ジャンル名のみによって表されてもよいし、パターン番号のみによって表されてもかまわない。
【0048】パラメータ決定部313は、ジャンル情報決定部312による分類に従い、音響処理パラメータを決定する。具体的には、パラメータ決定部313は、ジャンル情報決定部312により決定されたジャンル情報に基づき、音響処理パラメータを決定する。音響処理パラメータとは、音響処理部314による処理が行われた後の出力データの音質を調整するパラメータである。ここで、前述のように、本実施形態においては、演算部3において行われる所定の音響処理は、データ圧縮処理である。すなわち、音響処理部314は、音声圧縮エンコーダの機能を有する。また、音響処理パラメータは、音声圧縮エンコーダにおいて音質を調整するために用いられるエンコードパラメータである。さらに、本実施形態においては、エンコードパラメータとして、スケールファクタバンドの値を用いる。具体的には、スケールファクタバンドの値を示す4つのエンコードパラメータを、それぞれ、asb、bsb、csb、dsbと表し、パラメータ決定部313は、それぞれの値を決定する。ここで、音響処理パラメータの決定は、パラメータ決定部313において予め用意されているジャンル情報/パラメータ変換テーブルを参照することにより行われる。以下、ジャンル情報/パラメータ変換テーブルについて説明する。
【0049】図6は、図2に示すパラメータ決定部313において予め用意されているジャンル情報/パラメータ変換テーブルの一例を示す図である。図6のように、ジャンル情報/パラメータ変換テーブルは、ジャンル名およびパターン番号と、音響処理パラメータの値とを対応付けるものである。ここで、図6において、asb、bsb、csb、dsbは、音響処理パラメータとして用いられるスケールファクタバンドを示す。また、図6において、asb〜dsbの値がない欄は、値が設定されないことを示す。例えば、ジャンル名がロックで、パターン番号が2である場合、各音響処理パラメータは、それぞれ、asb=5、bsb=3、csb=11,13、dsb=34,36に決定される。ここで、csbおよびdsbでそれぞれ2つの値が決定されるのは、予め定められた2つのスケールファクタバンドの値を設定するためである。以上のように決定された音響処理パラメータは、音響処理部314に出力される。
【0050】音響処理部314は、パラメータ決定部313により決定された音響処理パラメータに従い、音響処理を行う。なお、前述のように、本実施形態において、音響処理部314は、音声圧縮エンコーダである。従って、音響処理部314は、入力音楽データをデータ圧縮して、圧縮したデータを出力音楽データとして出力する。再生部315は、音響処理部314からの出力音楽データを再生する。具体的には、再生部315は、音声出力部4に出力音楽データを音に変換させて出力させる。
【0051】次に、本発明の第2の実施形態について説明する。第2の実施形態において、装置全体の構成は、図1に示す第1の実施形態と同様であるので、以下の説明では図1を援用することとし、装置全体の図示を省略する。
【0052】図7は、第2の実施形態に係る音楽信号処理装置の演算部3の詳細な構成を示すブロック図である。図7において、演算部3は、特徴量検出部321と、感性表現値決定部322と、パラメータ決定部323と、音響処理部324と、再生部325とを備えている。なお、第2の実施形態では、感性表現値決定部322およびパラメータ決定部323の動作が第1の実施形態と異なっている。従って、以下において、感性表現値決定部322およびパラメータ決定部323の動作を中心に、演算部3の動作を説明する。なお、本実施形態において、音響処理部324は、第1の実施形態と同様、音声圧縮エンコーダであるとする。また、音響処理パラメータは、エンコードパラメータであり、第1の実施例と同じものを用いる。
【0053】特徴量検出部321は、音楽データ入力部1から入力された入力音楽データから、特徴量を検出する。感性表現値決定部322は、特徴量検出部321により検出された特徴量から、中間データを導出する。具体的には、感性表現値決定部322は、特徴量検出部321により検出された特徴量に基づいて、感性表現値を決定する。感性表現値とは、感性表現、すなわち、音質を表すために一般的に用いられる語句に対して、その語句により表現される音質についてユーザの心理量を数値により表現したものである。本実施形態においては、感性表現として、低音の豊かさ度、低音のしまり度、ボーカルの明瞭度および高音の空気感度が用いられる。感性表現値の決定は、感性表現値決定部322において予め用意されている特徴量/感性表現値変換テーブルを参照することにより行われる。以下、特徴量/感性表現値変換テーブルについて説明する。
【0054】図8は、図7に示す感性表現値決定部322において予め用意されている特徴量/感性表現値変換テーブルの一例を示す図である。図8のように、特徴量/感性表現値変換テーブルは、各特徴量についての条件と、条件が満たされる場合に決定される各感性表現値とを対応付けるものである。ここで、図8において、A〜Dは、それぞれ、低音の豊かさ度、低音のしまり度、ボーカルの明瞭度、高音の空気感度という感性表現を意味する。例えば、入力された特徴量が、BPM=110、FB=0.7、AR=95である場合、感性表現値は、A=1、B=2、C=3、D=3に決定される。以上のように決定された各感性表現値は、パラメータ決定部323に出力される。
【0055】パラメータ決定部323は、感性表現値決定部322により決定された感性表現値に基づき、音響処理パラメータを決定する。本実施形態において、音響処理パラメータの決定は、パラメータ決定部323において予め用意されている感性表現値/パラメータ変換テーブルを参照することにより行われる。以下、感性表現値/パラメータ変換テーブルについて説明する。
【0056】図9は、図7に示すパラメータ決定部323において予め用意されている感性表現値/パラメータ変換テーブルの一例を示す図である。図9のように、感性表現値/パラメータ変換テーブルは、感性表現値と、音響処理パラメータとを対応付けるものである。図9において、A〜Dは、それぞれ、低音の豊かさ度、低音のしまり度、ボーカルの明瞭度、高音の空気感度を意味する。また、図9において、第1の実施形態と同様、asb、bsb、csb、dsbは、音響処理パラメータとして用いられるスケールファクタバンドを示す。また、本実施形態においては、1つの感性表現が、1つの音響処理パラメータに対応している。例えば、感性表現値が、A=1である場合、音響処理パラメータは、asb=4に決定される。さらに、各感性表現値が、B=2、C=3、D=3である場合、音響処理パラメータは、それぞれ、bsb=3、csb=11、14、dsb=34、37に決定される。以上のように決定された音響処理パラメータは、音響処理部324に出力される。
【0057】なお、本実施形態においては、各音響処理パラメータは、それぞれ、1種類の感性表現値に基づいて決定されるものであった。ここで、他の実施形態においては、各音響処理パラメータは、複数の感性表現値に基づいて決定されるものであってもよい。
【0058】音響処理部324は、パラメータ決定部323により決定された音響処理パラメータに従い、音響処理を行う。なお、前述のように、本実施形態において、音響処理部324は、音声圧縮エンコーダである。従って、音響処理部324は、入力音楽データをデータ圧縮して、圧縮したデータを出力音楽データとして出力する。再生部325は、音響処理部324からの出力音楽データを再生する。
【0059】次に、本発明の第3の実施形態について説明する。第3の実施形態においても、装置全体の構成は、図1に示す第1の実施形態と同様であるので、以下の説明では図1を援用することとし、装置全体の図示を省略する。
【0060】図10は、第3の実施形態に係る音楽信号処理装置の演算部3の詳細な構成を示すブロック図である。図10において、演算部3は、特徴量検出部331と、ジャンル情報決定部332と、パラメータ決定部333と、音響処理部334と、再生部335とを備えている。なお、第3の実施形態では、ジャンル情報決定部332およびパラメータ決定部333の動作が第1の実施形態と異なっている。従って、以下において、ジャンル情報決定部332およびパラメータ決定部333の動作を中心に、演算部3の動作を説明する。なお、本実施形態において、音響処理部334は、第1の実施形態と同様、音声圧縮エンコーダであるとする。また、音響処理パラメータは、エンコードパラメータであり、第1の実施例と同じものが用いられる。
【0061】特徴量検出部331は、音楽データ入力部1から入力された入力音楽データから、特徴量を検出する。ジャンル情報決定部332は、特徴量検出部331により検出された特徴量に基づき、ジャンル名を決定する。本実施形態においては、ジャンル情報決定部332は、ジャンル名のみを決定し、パターン番号の決定を行わない。すなわち、本実施形態において、ジャンル情報は、ジャンル名のみからなる。ジャンル名の決定は、ジャンル情報決定部332において予め用意されている特徴量/ジャンル名変換テーブルを参照することにより行われる。本実施形態における特徴量/ジャンル名変換テーブルは、図4に示す第1の実施形態における特徴量/ジャンル名変換テーブルと同様のテーブルである。以上のように決定されたジャンル名は、パラメータ決定部333に出力される。
【0062】パラメータ決定部333は、ジャンル情報決定部332からの入力があった場合、ユーザに対して感性表現値の入力を要求する。具体的には、パラメータ決定部333は、表示部5に各感性表現の入力を促す表示を表示させる。ユーザ入力部2は、ユーザの指示に従い、感性表現値を入力する。パラメータ決定部333は、ジャンル情報決定部332により決定されたジャンル名と、ユーザ入力部2から入力された感性表現値とに基づいて、音響処理パラメータを決定する。音響処理パラメータの決定は、パラメータ決定部333において予め用意されているジャンル名・感性表現値/パラメータ変換テーブルを参照することにより行われる。以下、ジャンル名・感性表現値/パラメータ変換テーブルについて説明する。
【0063】図11は、図10に示すパラメータ決定部333において予め用意されているジャンル名・感性表現値/パラメータ変換テーブルの一例を示す図である。図11のように、ジャンル名・感性表現値/パラメータ変換テーブルは、ジャンル名および感性表現値と、音響処理パラメータの値とを対応付けるものである。ここで、図11において、asb、bsb、csb、dsbは、音響処理パラメータとして用いられるスケールファクタバンドを示す。また、図11において、asb〜dsbの値がない欄は、値が設定されないことを示す。例えば、ジャンル情報決定部332から入力されるジャンル名がポップスであり、ユーザ入力部2から入力される感性表現値が、A=2、B=1、C=3、D=2である場合、音響特性パラメータは、asb=5、bsb=2、csb=11、14、dsb=34、36に決定される。以上のように決定された音響処理パラメータは、音響処理部334に出力される。
【0064】音響処理部334は、パラメータ決定部333により決定された音響処理パラメータに従い、音響処理を行う。なお、前述のように、本実施形態において、音響処理部334は、音声圧縮エンコーダである。従って、音響処理部334は、入力音楽データをデータ圧縮して、圧縮したデータを出力音楽データとして出力する。再生部335は、音響処理部334からの出力音楽データを再生する。
【0065】なお、本実施形態において、感性表現は、ジャンル名ごとに感性表現の種類を変えてもよい。
【0066】なお、本実施形態においては、各音響処理パラメータは、それぞれ、1種類の感性表現値に基づいて決定されるものであった。ここで、他の実施形態においては、各音響処理パラメータは、複数の感性表現値に基づいて決定されるものであってもよい。
【0067】次に、本発明の第4の実施形態について説明する。第4の実施形態においても、装置全体の構成は、図1に示す第1の実施形態と同様であるので、以下の説明では図1を援用することとし、装置全体の図示を省略する。
【0068】図12は、第4の実施形態に係る音楽信号処理装置の演算部3の詳細な構成を示すブロック図である。図12において、演算部3は、特徴量検出部341と、ジャンル情報決定部342と、処理帯域決定部343と、パラメータ決定部344と、音響処理部345と、再生部346とを備えている。なお、第4の実施形態では、特徴量検出部341、処理帯域決定部343およびパラメータ決定部344の動作が第1の実施形態と異なっている。従って、以下において、特徴量検出部341、処理帯域決定部343およびパラメータ決定部344の動作を中心に、演算部3の動作を説明する。なお、本実施形態において、音響処理部334は、第1の実施形態と同様、音声圧縮エンコーダであるとする。
【0069】特徴量検出部341は、音楽データ入力部1から入力される入力音楽データから、特徴量を検出する。また、本実施形態においては、特徴量検出部341は、音楽データ入力部1から入力される入力音楽データに基づき、入力音楽データのサンプリング周波数を検出する。検出された入力音楽データのサンプリング周波数は、処理帯域決定部343およびパラメータ決定部344に出力される。
【0070】ジャンル情報決定部342は、特徴量検出部341により検出された特徴量に基づき、ジャンル名を決定する。本実施形態においては、ジャンル情報決定部342は、ジャンル名のみを決定し、パターン番号の決定を行わない。すなわち、本実施形態においては、ジャンル情報は、ジャンル名のみからなる。ジャンル名の決定は、ジャンル情報決定部342において予め用意されている特徴量/ジャンル名変換テーブルを参照することにより行われる。本実施形態における特徴量/ジャンル名変換テーブルは、図4に示す第1の実施形態における特徴量/ジャンル名変換テーブルと同様のテーブルである。以上のように決定されたジャンル名は、処理帯域決定部343に出力される。
【0071】処理帯域決定部343は、ジャンル情報決定部342からの入力があった場合、ユーザに対して感性表現値の入力を要求する。具体的には、処理帯域決定部343は、表示部5に各感性表現値の入力を促す表示を表示させる。ユーザ入力部2は、ユーザの指示に従い、感性表現値を入力する。ユーザ入力部2からの入力があった場合、処理帯域決定部343は、ジャンル情報決定部342により決定されたジャンル名と、特徴量検出部341により検出された入力音楽データのサンプリング周波数と、ユーザ入力部2から入力された感性表現値とに基づき、処理帯域を決定する。ここで、処理帯域とは、音響処理の対象となる周波数帯域をいう。なお、処理帯域は、処理帯域の中心周波数によって表現される。ここで、処理帯域の決定は、処理帯域決定部343において予め用意されている感性表現値/処理帯域変換テーブルを参照することにより行われる。以下、感性表現値/処理帯域変換テーブルについて説明する。
【0072】図13は、図12に示す処理帯域決定部343において予め用意されている感性表現値/処理帯域変換テーブルの一例を示す図である。図13のように、感性表現値/処理帯域変換テーブルは、ジャンル名、感性表現値およびサンプリング周波数と、処理帯域とを対応付けるものである。図13において、A〜Dは、感性表現を意味する。本実施形態において、A〜Dは、第2の実施形態と同様に、それぞれ、低音の豊かさ度、低音のしまり度、ボーカルの明瞭度、高音の空気感度を意味する。また、図13において、Fsは、入力音楽データのサンプリング周波数を表す。例えば、ジャンル名がロックで、Fs=44.1(kHz)、A=2、B=1、C=2、D=3である場合、処理帯域は、0.055、0.08、1.0、1.2、11、13(kHz)に決定される。なお、これらの数値は、処理帯域の中心周波数を示す。以上のように決定された処理帯域は、パラメータ決定部344に出力される。
【0073】パラメータ決定部344は、特徴量検出部341により検出された入力音楽データのサンプリング周波数と、処理帯域決定部343により決定された周波数帯域とに基づいて、音響処理パラメータを決定する。ここで、前述のように、音響処理部345は、第1の実施形態と同様、音声圧縮エンコーダであるので、本実施形態において用いられる音響処理パラメータは、エンコードパラメータである。ただし、本実施形態において用いられるエンコードパラメータは、第1〜第3の実施形態において用いられたasb〜dsbとは異なるものである。asb〜dsbと区別するため、本実施形態において用いられるエンコードパラメータを、esbと表す。音響処理パラメータの決定は、パラメータ決定部344において予め用意されている処理帯域/パラメータ変換テーブルを参照することにより行われる。以下、処理帯域/パラメータ変換テーブルについて説明する。
【0074】図14は、入力データのサンプリング周波数ごとに決められた、スケールファクタバンドと入力データの周波数との対応関係を示す図である。図14において、Fsは、入力データのサンプリング周波数を表し、SFBは、スケールファクタバンドを表す。図14のように、スケールファクタバンドと入力データの周波数との対応関係は、入力データのサンプリング周波数により変化する。図14に示す対応関係を用いて、パラメータ決定部344において用いられる処理帯域/パラメータ変換テーブルは作成される。
【0075】図15は、図12に示すパラメータ決定部344において予め用意されている処理帯域/パラメータ変換テーブルの一例を示す図である。図15のように、処理帯域/パラメータ変換テーブルは、入力音楽データのサンプリング周波数および処理帯域決定部343により決定された処理帯域と、音響処理パラメータであるスケールファクタバンド(esb)の値とを対応付けるものである。図15において、処理帯域の欄に示される数値は、処理帯域の中心周波数を示す。また、図15において、Fsは、入力音楽データのサンプリング周波数を示す。
【0076】図15において、処理帯域の中心周波数は、処理帯域決定部343から入力された処理帯域の中心周波数に近い方の中心周波数が選択され、処理帯域決定部343から入力された処理帯域の中心周波数が中間値である場合、値が小さい方の中心周波数が選択される。例えば、入力音楽データのサンプリング周波数が44.1(kHz)で、処理帯域の中心周波数が225(Hz)である場合、音響処理パラメータは、esb=2に決定される。なお、処理帯域決定部343から入力された処理帯域の中心周波数が複数である場合、複数のスケールファクタバンドの値が決定される。以上のように決定された音響処理パラメータは、音響処理部345に出力される。
【0077】音響処理部345は、パラメータ決定部344により決定された音響処理パラメータに従い、音響処理を行う。なお、前述のように、本実施形態において、音響処理部345は、音声圧縮エンコーダである。従って、音響処理部345は、入力音楽データをデータ圧縮して、圧縮したデータを出力音楽データとして出力する。再生部346は、音響処理部345からの出力音楽データを再生する。
【0078】なお、第1〜第4の実施形態において、音響処理部が音声圧縮エンコーダである場合について説明したが、音響処理部は上記に限るものではない。音響処理部は、例えば、グラフィックイコライザー、コンプレッサー、トーンコントロール、ゲインコントロール、リバーブ、ディレイ、フランジャーもしくはノイズリダクション等のような音質補正処理、クロスフェード等のような波形編集処理、または、電子すかしデータエンベッダ等のような音声埋め込み処理を行うものであってもよい。
【0079】また、第1〜第4の実施形態においては、音響処理パラメータは、音声圧縮エンコーダにおいて音質を調整するために用いられるスケールファクタバンドであったが、音響処理パラメータは上記に限るものでない。例えば、音声圧縮エンコーダの音響処理パラメータとして、ブロックスイッチにおけるロングショート判断閾値、量子化部の割り当て方法、ビットリザーバ、トーン成分の判定条件、左右チャンネル相関判定閾値等を用いてもよい。さらに、音響処理部345が音声圧縮エンコーダ以外の場合には、例えば、フィルタの種類(ローパスフィルタ、ハイパスフィルタ、バンドパスフィルタ等)、グラフィックイコライザーの定数(Q、中心周波数、dB)、ゲイン、量子化ビット数、サンプリング周波数、チャンネル数、フィルタ帯域、残響時間、遅延時間、直接音間接音パワー比率、または、ウォーターマーク埋め込みの程度(深さ、頻度)等を音響処理部の音響処理パラメータとして用いてもよい。
【0080】次に、本発明の第5の実施形態について説明する。第5の実施形態においても、装置全体の構成は、図1に示す第1の実施形態と同様であるので、以下の説明では図1を援用することとし、装置全体の図示を省略する。
【0081】図16は、第5の実施形態に係る音楽信号処理装置の演算部3の詳細な構成を示すブロック図である。図16において、演算部3は、特徴量検出部351と、パラメータ決定部352と、音声圧縮エンコーダ353と、デコーダ354と、出力音響特性検出部355と、比較部356と、再生部357とを備えている。以下、各部の詳細について説明するとともに、演算部3の動作を説明する。
【0082】特徴量検出部351は、音楽データ入力部1から入力される入力音楽データから、特徴量を検出する。本実施形態における特徴量は、入力音楽データのサンプリング周波数である。特徴量検出部351により検出された特徴量は、パラメータ決定部352へ出力される。また、特徴量検出部351は、DFTを行うことにより周波数帯域ごとの短時間平均パワー値を検出し、比較部356へ出力する。
【0083】入力音楽データが最初に演算部3に入力された場合、上記のように特徴量検出部351からパラメータ決定部352へ特徴量が出力される。この場合、パラメータ決定部352は、予め定められている既定値を、音響処理パラメータとして決定する。ここで、本実施形態における音響処理パラメータは、第4の実施形態におけるesbで示されるスケールファクタバンドである。パラメータ決定部352が最初に音響処理パラメータを決定した後、比較部356から入力があった場合、パラメータ決定部352は、特徴量検出部351からの入力と、比較部356からの入力とに基づき、音響処理パラメータを修正する。音響処理パラメータの修正は、パラメータ決定部352において予め用意されている処理帯域/パラメータ変換テーブルにより行われる。第5の実施形態において用いられる処理帯域/パラメータ変換テーブルは、図15に示す処理帯域/パラメータ変換テーブルと同様のものである。以上のように決定または修正された音響処理パラメータは、音声圧縮エンコーダ353へ出力される。
【0084】音声圧縮エンコーダ353は、パラメータ決定部352から音響処理パラメータが出力される度に、出力された音響処理パラメータに従い、データ圧縮処理を行う。音声圧縮エンコーダ353によりデータ圧縮された出力音楽データは、再生部357およびデコーダ354へ出力される。
【0085】デコーダ354は、音声圧縮エンコーダ353が出力音楽データを出力する度に、音声圧縮エンコーダ353から出力された出力音楽データをデコードする。出力音響特性検出部355は、デコーダ354が出力音楽データをデコードする度に、デコーダ354からの出力に基づき、出力音楽データの音響特性を検出する。具体的には、出力音響特性検出部355は、DFTにより周波数帯域ごとの短時間平均パワー値を検出し、比較部356へ出力する。
【0086】比較部356は、特徴量検出部351および出力音響特性検出部355から入力される短時間平均パワー値を比較する。図17は、図16に示す比較部356における処理の流れを示すフローチャートである。以下、図17を参照して比較部356の動作を説明する。
【0087】まず、比較部356は、特徴量検出部351から、入力音楽データの短時間平均パワー値を入力する(ステップS21)。次に、比較部356は、出力音響特性検出部355から、デコードされた出力音楽データの短時間平均パワー値を入力する(ステップS22)。次に、比較部356は、入力音楽データおよび出力音楽データについての、周波数帯域ごとの短時間平均パワー値の差分を計算する(ステップS23)。さらに、比較部356は、計算の結果に基づき、上記の差分が所定レベル(例えば、1dB)以上となる周波数帯域が検出されたか否かを判断する(ステップS24)。所定レベルは、比較部356において予め定められている。
【0088】ステップS24において、上記の差分が所定レベル以上となる周波数帯域が検出されない場合、比較部356は、処理を終了する。一方、上記の差分が所定レベル以上となる周波数帯域が検出された場合、比較部356は、検出された周波数帯域をパラメータ決定部353に出力する(ステップS25)。ステップS25の後、比較部356は、ステップS22の処理に戻り、出力音響特性検出部355からの入力を待つ。比較部356は、ステップS24において上記の差分が所定レベル以上となる周波数帯域が検出されなくなるまで、ステップS22〜ステップS25の処理を繰り返す。以上により、比較部356により検出された周波数帯域は、パラメータ決定部353に出力される。
【0089】再生部357は、最初に音声圧縮エンコーダ353から出力音楽データを受けたとき、音楽データの再生を開始する。また、再生部357は、2回目以降に音声圧縮エンコーダ353から出力音楽データを受けたとき、再生中である音楽データを更新する。
【0090】以上のように、第5の実施形態では、出力音楽データが入力音楽データと大きく異なる周波数帯域を検出し、それによって音響処理パラメータを修正する。音響処理が音声圧縮エンコーダである場合、音質が劣化することが問題となる場合があるが、上記のように音響処理パラメータを修正することにより、音声圧縮エンコーダによる音質劣化を軽減することができる。
【0091】なお、以上第1〜第5の実施形態では、テーブルを用いて、ジャンル名、パターン番号、感性表現値、音響処理パラメータおよび処理帯域を導出した。ここで、他の実施形態においては、変換テーブルの代わりに、計算式を用いる形態であってもよい。
【0092】また、他の実施形態においては、各変換テーブルの内容は、ユーザ入力部2を用いることにより自由に変更される形態であってもよい。これにより、再生された音楽がユーザの所望の音質とは異なる場合、ユーザは、所望の音質を得ることができるように変換テーブルの内容を変更することが可能となる。さらに、第2の実施形態のように感性表現値を用いる場合、ユーザは、希望する音質を正確に再現するように、また、容易に変換テーブルの設定を行うことができる。
【0093】また、以上第1〜第5の実施形態において、音響処理部または音声圧縮エンコーダに音楽データが入力される前に、前処理を行う構成であってもよい。前処理は、音響処理部または音声圧縮エンコーダに入力される音楽データに対して行われる。例えば、音声圧縮エンコーダでの音声圧縮時に、エネルギーレベルの高い帯域により多くのビット割り当てを行い、音楽的に重要な部分の音質劣化を防ぐことを目的とする場合に、前処理が行われる。具体的な前処理の方法として、任意の周波数以上または任意の周波数以下の周波数成分についてエネルギーレベルを削減したり、位相成分を除去したり、ダイナミックレンジを圧縮する方法が考えられる。例えば、コントラバスマリンバのように低音域成分に偏った器楽曲が入力音楽データである場合、前処理として予めローパスフィルタを通すことが考えられる。
【0094】以上第1〜第5の実施形態において、音楽信号処理装置は、ユーザにより音質を調整できる構成であってもよい。図18は、第1の実施形態の演算部3の変形例を示す図である。18において、演算部3は、特徴量検出部361と、ジャンル情報決定部362と、パラメータ決定部363と、音響処理部364と、再生部365と、再生データ補正部366とを備えている。なお、図18と図2との違いは、再生データ補正部366のみであるので、ここでは異なる部分のみを説明する。
【0095】図19は、図18に示す再生データ補正部366において行われる処理の流れを示すフローチャートである。図19の処理は、再生部によるデータ再生が開始されることにより開始される。まず、再生データ補正部366は、ユーザに対して音質の補正の必要があるかどうかを質問する(ステップS31)。ステップS31の処理は、表示部5に上記の質問を表示させることにより行われる。ユーザは、表示部5に表示された質問に対して、補正の要否をユーザ入力部2により入力する。次に、再生データ補正部366は、ユーザ入力部2からの入力に基づき、補正が必要か否かを判断する(ステップS32)。ステップS3において、補正の必要がないと判断される場合、再生データ補正部366は処理を終了する。
【0096】一方、ステップS32において、補正の必要があると判断される場合、再生データ補正部366は、再生部により再生されているデータを読み込み、データのヘッダ部の内容を読み取る(ステップS33)。ここで、音響処理部から出力され、再生部により再生されるデータのヘッダ部には、テンポ、ビート、リズム、周波数パターン、および、ジャンル情報等、再生する楽曲の音響特性を表すデータが含まれている。次に、再生データ補正部366は、ステップS3において読み取ったヘッダ部の内容を表示する(ステップS34)。すなわち、再生データ補正部366は、ヘッダ部の内容である音響特性を表すデータを、表示部5により表示させる。ここで、ユーザは、再生部により再生されている実際の音と、表示部5により表示された内容とに基づき、ユーザ入力部2を用いて補正内容の指示を入力する。例えば、ユーザは、試聴している音と、表示部5の表示内容から、低音域を補足する必要があると判断した場合、所定の周波数帯域についてレベルを変更する指示を入力する。
【0097】次に、再生データ補正部366は、ユーザ入力部2からの入力に従い、再生部により再生されているデータの音質を補正する(ステップS35)。ステップS35の処理の後、再生データ補正部366は、ステップS31の処理に戻り、ステップS32において補正の必要がないと判断されるまで、上記のステップS31〜ステップS35の処理を繰り返す。
【0098】なお、以上の説明では、音楽信号処理装置がユーザにより音質を調整できる構成を、第1の実施形態の変形例として説明したが、第2〜第5の実施形態においても、図18に示す再生データ補正部を設けることにより、図19と同様の処理を行うことができる。
【出願人】 【識別番号】000005821
【氏名又は名称】松下電器産業株式会社
【出願日】 平成13年11月1日(2001.11.1)
【代理人】 【識別番号】100098291
【弁理士】
【氏名又は名称】小笠原 史朗
【公開番号】 特開2002−215195(P2002−215195A)
【公開日】 平成14年7月31日(2002.7.31)
【出願番号】 特願2001−336685(P2001−336685)