| 【発明の名称】 |
複数機器の音声制御システム |
| 【発明者】 |
【氏名】大内 淳
【氏名】小澤 芳男
|
| 【要約】 |
【課題】使用者の発声方向を検出することによって、制御対象となる機器の認識率を高めることのできる複数機器の音声制御システムを提供する。
【解決手段】制御対象となる機器80,82,84と、空間内の複数箇所に配置され、使用者の音声を検出するマイクロホン20,22,24と、各マイクロホンが検出した音声データを集める集音手段30と、集音手段に入力された音声データの内容を解析する音声認識手段40と、集音手段に入力された音声データの大きさから、使用者の発声方向を検出する分布分析手段50と、音声認識手段によって解析された音声データの内容と、分布分析手段によって解析された使用者の発声方向に基づいて、制御対象となる機器と操作内容を決定する推論手段60と、推論手段により決定された機器と操作内容に基づいて、制御対象となる機器に制御信号を発する機器制御手段70と、を具える。 |
【特許請求の範囲】
【請求項1】 制御対象となる複数の機器(80)(82)(84)と、空間内の複数箇所に配置され、使用者の音声を検出する複数のマイクロホン(20)(22)(24)と、各マイクロホン(20)(22)(24)が検出した音声データを集める集音手段(30)と、集音手段(30)に入力された音声データの内容を解析する音声認識手段(40)と、集音手段(30)に入力された音声データの大きさから、使用者の発声方向を検出する分布分析手段(50)と、音声認識手段(40)によって解析された音声データの内容と、分布分析手段(50)によって解析された使用者の発声方向に基づいて、制御対象となる機器(82)と操作内容を決定する推論手段(60)と、推論手段(60)により決定された機器(82)と操作内容に基づいて、制御対象となる機器(82)に制御信号を発する機器制御手段(70)と、を具えることを特徴とする複数機器の音声制御システム。 【請求項2】 分布分析手段(50)は、マイクロホン(20)(22)(24)から集音手段(30)に入力された音声データの振幅を比較し、使用者の発声方向を検出する請求項1に記載の複数機器の音声制御システム。 【請求項3】 音声認識手段(40)は、マイクロホン(20)(22)(24)から集音手段(30)に入力された音声データのうち、最も振幅の大きい音声データの内容を解析する請求項1又は請求項2に記載の複数機器の音声制御システム。 【請求項4】 使用者の発する音声には、制御対象となる機器名と操作内容が含まれる請求項1乃至請求項3の何れかに記載の複数機器の音声制御システム。 【請求項5】 使用者の発する音声には、制御対象となる機器の操作内容のみが含まれ、音声認識手段(40)にて操作内容が解析され、分布分析手段(50)にて制御対象となる機器(82)が特定される請求項1乃至請求項3の何れかに記載の複数機器の音声制御システム。 【請求項6】 制御対象となる機器(80)(82)(84)は、台所用器具である請求項1乃至請求項5の何れかに記載の複数機器の音声制御システム。
|
【発明の詳細な説明】【0001】 【発明の属する技術分野】本発明は、音声により遠隔から複数の機器を操作することのできる音声制御システムに関するものであり、具体的には音声認識率を高めることのできる音声制御システムに関するものである。 【0002】 【従来の技術】使用者の発した音声に基づいて、複数の機器の操作を行なう音声制御システムが知られている。この種音声制御システム(90)は、図6に示すように、1つのマイクロホン(91)を通じて検出した使用者の音声を集音手段(92)に集め、音声認識手段(93)で解析し、その解析結果に基づいて機器制御手段(94)によって、対象となる機器(95)(96)(97)を操作するものである。音声認識手段(93)には、予め操作対象となる機器(95)(96)(97)の名称と操作内容を記憶させておき、入力された音声データと、記憶されているデータとのパターンマッチングにより、制御する機器の特定と操作内容が特定される。 【0003】 【発明が解決しようとする課題】上記音声制御システムは、雑音の多い環境、例えば台所などでは、音声の認識が困難であり、上手く機能しないことがあった。また、マイクロホン(91)は、集音率を高めるため、使用者が身につけておく必要があった。また、従来の音声認識手段(93)では、予め特定使用者の音声パターンを記憶させる必要があり、さらに、記憶された特定使用者以外の音声では認識率が大きく低下してしまう問題があった。 【0004】本発明の目的は、使用者の発声方向を検出することによって、制御対象となる機器の認識率を高めることのできる複数機器の音声制御システムを提供することである。 【0005】 【課題を解決するための手段】上記課題を解決するために、本発明の複数機器の音声制御システム(10)は、制御対象となる複数の機器(80)(82)(84)と、空間の複数箇所に配置され、使用者の音声を検出する複数のマイクロホン(20)(22)(24)と、各マイクロホン(20)(22)(24)が検出した音声データを集める検出する集音手段(30)と、集音手段(30)に入力された音声データの内容を解析する音声認識手段(40)と、集音手段(30)に入力された音声データの大きさから、使用者の発声方向を検出する分布分析手段(50)と、音声認識手段(40)によって解析された音声データの内容と、分布分析手段(50)によって解析された使用者の発声方向に基づいて、制御対象となる機器(82)と操作内容を決定する推論手段(60)と、推論手段(60)により決定された機器(82)と操作内容に基づいて、制御対象となる機器(82)に制御信号を発する機器制御手段(70)と、を具える。 【0006】 【作用及び効果】使用者が、制御対象となる機器(82)に向かって、機器(82)の名称と操作内容を発声すると、音声は複数位置に配置された各マイクロホン(20)(22)(24)によって集音され、音声データは、各マイクロホン(20)(22)(24)から集音手段(30)に送信される。集音手段(30)は、各マイクロホン(20)(22)(24)からの音声データを、音声認識手段(40)と分布分析手段(50)に送信する。音声認識手段(40)は、受信した音声データの内容を解析し、制御対象となる機器(82)と操作内容を特定する。また、分布分析手段(50)は、受信した音声データに基づいて、使用者の発声方向を解析し、使用者がどの機器に向かって発声したかを特定する。推論手段(60)は、前記音声認識手段(40)にて解析された音声データと、分布分析手段(50)にて解析された発声方向の両方のデータに基づいて、制御対象となる機器(82)を特定し、また、操作内容を特定する。機器制御手段(70)は、推論手段(60)にて決定された機器(82)と操作内容に基づいて、制御対象となる機器(82)に操作内容に応じた制御信号を発して、機器(82)を操作する。 【0007】本発明では、使用者の発する音声の内容だけでなく、発声方向を検出して、制御対象となる機器を特定するから、音声データの認識率を向上させることができる。使用者は、マイクロホンを身につける必要がなく、また、マイクロホンの存在を意識せずに、制御したい機器の方向に向かって発声を行なえばよいから、操作が非常に簡単である。また、雑音の多い場所、例えば台所などで、操作命令にノイズが入っても、分布分析手段(50)によって機器の特定を行なうことができるから、音声認識の精度向上を図ることができる。さらに、複数のマイクロホンを使用することにより、集音率の向上を達成でき、音声認識精度の向上が達成される。 【0008】 【発明の実施の形態】本発明の音声制御システム(10)は、図1に示すように、複数のマイクロホン(20)(22)(24)(26)と、該マイクロホン(20)(22)(24)(26)に電気的に接続された集音手段(30)と、集音手段(30)に電気的に接続された音声認識手段(40)及び分布分析手段(50)と、音声認識手段(40)及び分布分析手段(50)に電気的に接続された推論手段(60)と、推論手段(60)に電気的に接続された機器制御手段(70)と、機器制御手段(70)に電気的に接続された制御対象となる複数の機器(80)(82)(84)から構成される。なお、本明細書では、説明の便宜上音声認識手段、分布分析手段等の名称を付けているが、ソフト上で処理を行なうこともできる。 【0009】なお、以下では、本発明を図2に示す台所(88)に適用した実施例について説明し、制御対象となる機器として、流し(80)、ガスコンロ(82)及び電子レンジ(84)を例に挙げ、各機器には、表1に示す操作内容の制御を行なうものとする。 【0010】 【表1】
【0011】マイクロホン(20)(22)(24)(26)は、台所(88)の天井、床又は壁面に、使用者(100)の作業空間を取り囲むように複数配置される。図示の実施例では、マイクロホン(20)(22)(24)(26)を円周上に等間隔に配置している。各マイクロホン(20)(22)(24)(26)は、台所(88)内の音を集音し、集音された音は、集音手段(30)に送られる。例えば、使用者(100)がガスコンロ(82)の方向に向かって、「ガスコンロ、強」という操作命令を発声したときには(図3のステップ1)、各マイクロホン(20)(22)(24)が集音する音声の大きさは、図4に示すように、ガスコンロ(82)に近い位置に配備されたマイクロホン(22)が最大となる。 【0012】集音手段(30)は、マイクロホンが集音した音声データを集める。なお、集音手段(30)等の以下の制御手段は、台所(88)内の適所に配置される。集音手段(30)は、例えば、各マイクロホンごとに集音された音声データの振幅(図4参照)を夫々測定し(図3のステップ2)、最大振幅となるマイクロホン(22)の音声データを音声認識手段(40)に送信する(ステップ3)。また、各マイクロホン(20)(22)(24)(26)の音声データの振幅は、分布分析手段(50)に送られる(ステップ4)。 【0013】音声認識手段(40)には、予め制御対象となる機器名と操作内容の音声パターンが夫々入力されており、最大振幅のマイクロホン(22)の音声データとのパターンマッチング等の公知の音声認識技術によって、制御対象となる機器の特定と、操作内容の特定を行なう(ステップ3)。 【0014】具体的には、音声認識手段(40)では、操作命令に含まれる機器名と操作内容を、記憶されている機器名と操作内容の音声パターンとパターンマッチングし、機器名と操作内容の識別率を算出する。例えば、「ガスコンロ、強」という操作命令に対して、音声認識手段(40)での音声識別率が、表2のようである場合、機器名と操作内容の各音声識別率を乗じて、どの機器名と操作内容の組合せが、使用者の発した命令に近いかを、表3に示すように算出してポイント化する。 【0015】 【表2】
【0016】 【表3】
【0017】上記により算出された「操作命令(機器名と操作内容の組合せ)」と「ポイント」は、推論手段(60)へ送信される。 【0018】分布分析手段(50)は、機器名の認識率を高めるために、使用者がどの機器に向かって発声したのか、使用者の発声方向を特定する(図3のステップ4)。具体的には、各マイクロホン(20)(22)(24)(26)からの音声データを、例えば、図4に示すような波形データとして受信する。分布分析手段(50)は、受信した各音声データの最大振幅を測定して、二乗平均などにより使用者の発声した方向の確率を算出する。例えば、各マイクロホン(20)(22)(24)の最大振幅が図4に示すように、順に10dB、20dB、12dB、また、マイクロホン(26)(26)(26)の最大振幅が夫々3dBであったとする。この場合、使用者が各機器(80)(82)(84)の方向を向いている確率は、二乗平均を用いて、表4に示すように算出することができる。 【0019】 【表4】
【0020】上記により算出された「機器名」と「確率」は、推論手段(60)へ送信される。 【0021】推論手段(60)は、音声認識手段(40)で算出された「機器名と操作内容の組合せ」の「ポイント」(ステップ3)と、分布分析手段(50)で算出された「機器名」の「確率」(ステップ4)を、ファジィ理論などを利用して結合する(図3のステップ5)。具体的には、共通する機器名のポイントと確率を乗じて、表5に示すように、ポイント化する。 【0022】 【表5】
【0023】推論手段(60)は、各ポイントの比率から「機器名」と「操作内容」の推論結果とする。具体的には、表6に示すように、全てのポイントの総和を分母とし、各ポイントを分子として推論結果の確率を算出する。 【0024】 【表6】
【0025】推論手段(60)で算出された推論結果のうち、最も確率の高い機器名と操作内容の組合せについて、予め定められた閾値と比較し、確率が閾値よりも高ければ、その機器名と操作内容を機器制御手段(70)に送信する。確率が閾値よりも低い場合には、送信は行なわない。なお、この場合、音や光などにより、操作命令が認識されなかったことを表示するようにしてもよい。 【0026】機器制御手段(70)は、推論手段(60)から送信された機器名と操作内容とを含む操作命令を受信し、制御対象となる機器に、操作内容に対応した操作信号を送信する(図3のステップ6)。上記の実施例の場合、「ガスコンロ」に「強」(火力を強める)という操作内容を送信する。 【0027】制御対象となる機器(上記の場合、ガスコンロ(82))は、受信した操作信号中の操作内容に基づいて、その操作を実行する。 【0028】使用者(100)が、流し(80)や電子レンジ(84)の方向を向いて操作命令を発声した場合も、上記と同様に機器の選択と操作内容の決定が行なわれる。なお、使用者(100)が、これら機器(80)(82)(84)とは別の方向、例えば、図2の矢印とは逆の方向を向いて、操作命令を発声した場合には、マイクロホン(26)(26)(26)の何れかの音声データが最大振幅となるから、分布分析手段(50)で算出される機器(80)(82)(84)の方向を向いている確率は低くなる。従って、たとえ操作命令が音声認識手段(40)にて高い識別率で識別されても、推論手段(60)にて算出される推論結果は低いものとなり、操作命令が機器制御手段(70)に送信されることはない。 【0029】上記実施例によれば、使用者は、マイクロホン(20)(22)(24)(26)の位置を気にすることなく、制御したい機器に向けて、機器名と操作内容とを発声するだけで、その発声方向及び発声された機器名との両方によって機器の選択が行なわれるから、機器の認識率の向上を図ることができる。 【0030】なお、上記実施例では、使用者は、機器名と操作内容とを発声するようにしているが、機器名は、分布分析手段(50)によって決定することができるから、使用者が、制御したい機器に向けて、操作内容のみを発声することにより、発声方向から機器を選択し、操作内容のみを音声認識して、機器の操作を行なうこともできる。 【0031】この場合、音声認識手段(40)による操作内容の認識率(上記表2の右側参照)と、分布分析手段(50)による発声方向からの特定された機器の確率(上記表4参照)を、推論手段(60)で乗じて、各ポイントの比率から「機器名」と「操作内容」の推論結果の確率を算出し、最も確率の高い機器名と操作内容の組合せについて、予め定められた閾値と比較し、上記と同様に、その機器名と操作内容を機器制御手段(70)に送信して、機器を制御すればよい。 【0032】上記実施例によれば、使用者の発声する命令は、操作内容のみで済むから、操作命令の簡素化を図り、音声制御システム(10)の使いやすさを向上できる。 【0033】上記実施例の説明は、本発明を説明するためのものであって、特許請求の範囲に記載の発明を限定し、或は範囲を減縮する様に解すべきではない。又、本発明の各部構成は上記実施例に限らず、特許請求の範囲に記載の技術的範囲内で種々の変形が可能である。 【0034】マイクロホン(20)(22)(24)は、図5に示すように、制御対象となる機器(80)(82)(84)に夫々取り付けてもよい。また、制御対象となる機器の種類は、上記実施例に限定されず、また、本発明の音声制御システムの適用空間も台所に限定されない。
|
| 【出願人】 |
【識別番号】000001889 【氏名又は名称】三洋電機株式会社
|
| 【出願日】 |
平成12年9月20日(2000.9.20) |
| 【代理人】 |
【識別番号】100066728 【弁理士】 【氏名又は名称】丸山 敏之 (外2名)
|
| 【公開番号】 |
特開2002−91491(P2002−91491A) |
| 【公開日】 |
平成14年3月27日(2002.3.27) |
| 【出願番号】 |
特願2000−284613(P2000−284613) |
|