トップ :: G 物理学 :: G10 楽器;音響




【発明の名称】 音声認識方法及びその装置
【発明者】 【氏名】小沼 知浩

【氏名】井上 剛

【氏名】遠藤 充

【氏名】齋藤 夏樹

【氏名】石田 明

【氏名】木村 達也

【要約】 【課題】本発明は、認識精度を保ちつつ計算量を効果的に削減可能な音声認識方法及びその装置を提供することを目的とする。

【解決手段】音素や音節などの音声単位の連結で表現され、単語間の接続ルールによって入力音声の長さに従い展開される仮説に対応する音響モデルと、入力音声とを照合し認識スコアを得、その認識スコアの高い少なくとも1個の仮説を残しながら入力音声に近い候補を認識結果として出力する音声認識装置において、単語内では似た発音のスコアの高い仮説は単語終端まで、仮説数によらず精密に計算を行うことで認識精度を保ち、単語終端では、後続単語が接続することによる仮説数の増大を避けるために、仮説数による絞り込みを行い、認識精度を保ちつつ計算量を効果的に削減可能な音声認識方法及びその装置を提供することができる。
【特許請求の範囲】
【請求項1】 音素や音節などの音声単位の連結で表現され、単語間の接続ルールによって入力音声の長さに従い展開される仮説に対応する音響モデルと、入力音声とを照合し認識スコアを得、その認識スコアの高い少なくとも1個の仮説を残しながら入力音声に近い候補を認識結果として出力する音声認識方法において、入力された音声の特徴量をフレーム単位で抽出する特徴量抽出ステップと、現処理フレームが単語終端か単語内かを判別し、前記判定が単語終端ならば単語終端の仮説を記憶するか否かを判定し、単語内ならば単語内の仮説を記憶するか否かの判定をするステップと、前記記憶すると判定された仮説を記憶するステップと、前記記憶された仮説を仮説が単語内ならば単語を表現する音声単位を伸長し、単語終端ならば単語間の接続ルールにより次に続く単語を結合し、仮説を展開する制御を行う制御ステップと、前記入力音声から抽出されたフレーム特徴量と前記展開された仮説の音響モデルのフレーム特徴量との類似度を計算するステップと、前記類似度と前フレームまでの仮説の認識スコアとから、認識スコアの演算を行う演算ステップと、前記仮説と前記認識スコアを新しい仮説として登録するステップと、前記フレーム単位の処理を入力音声の終端まで続け認識スコアの高い少なくとも1個の仮説を入力音声に近い認識結果として出力するステップとを有することを特徴とする音声認識方法。
【請求項2】 記憶するか否かの判定は、単語内仮説を記憶するか否かの判定の基準を類似度のスコアとし、単語終端仮説を記憶するか否かの判定の基準を仮説の個数としたことを特徴とする請求項1記載の音声認識方法。
【請求項3】 音素や音節などの音声単位の連結で表現され、単語間の接続ルールによって入力音声の長さに従い展開される仮説に対応する音響モデルと、入力音声とを照合し認識スコアを得、その認識スコアの高い少なくとも1個の仮説を残しながら入力音声に近い候補を認識結果として出力する音声認識装置において、入力された音声の特徴量をフレーム単位で抽出する特徴量抽出手段と、現処理フレームが単語終端か単語内かを判別し、前記判定が単語終端ならば単語終端の仮説を記憶するか否かを判定し、単語内ならば単語内の仮説を記憶するか否かの判定をする単語終端判定手段と、前記記憶すると判定された仮説を記憶する仮説記憶手段と、前記記憶された仮説を仮説が単語内ならば単語を表現する音声単位を伸長し、単語終端ならば単語間の接続ルールにより次に続く単語を結合し、仮説を展開する制御を行うサーチ制御手段と、前記入力音声から抽出されたフレーム特徴量と前記展開された仮説の音響モデルのフレーム特徴量との類似度を計算する類似度計算手段と、前記類似度と前フレームまでの仮説の認識スコアとから、認識スコアの演算を行うサーチ演算手段と、前記仮説と前記認識スコアを新しい仮説として登録する単語仮説登録手段と、前記フレーム単位の処理を入力音声の終端まで続け認識スコアの高い少なくとも1個の仮説を入力音声に近い認識結果として出力する認識結果出力手段とを有することを特徴とする音声認識装置。
【請求項4】 単語終端判定手段は、単語内仮説を記憶するか否かの判定の基準を類似度のスコアとし、単語終端仮説を記憶するか否かの判定の基準を仮説の個数としたことを特徴とする請求項3記載の音声認識装置。
【請求項5】 音素や音節などの音声単位の連結で表現され、単語間の接続ルールによって入力音声の長さに従い展開される仮説に対応する音響モデルと、入力音声とを照合し認識スコアを得、その認識スコアの高い少なくとも1個の仮説を残しながら入力音声に近い候補を認識結果として出力する音声認識するためにコンピュータを、入力された音声の特徴量をフレーム単位で抽出する特徴量抽出手段と、現処理フレームが単語終端か単語内かを判別し、前記判定が単語終端ならば単語終端の仮説を記憶するか否かを判定し、単語内ならば単語内の仮説を記憶するか否かの判定をする単語終端判定手段と、前記記憶すると判定された仮説を記憶する仮説記憶手段と、前記記憶された仮説を仮説が単語内ならば単語を表現する音声単位を伸長し、単語終端ならば単語間の接続ルールにより次に続く単語を結合し、仮説を展開する制御を行うサーチ制御手段と、前記入力音声から抽出されたフレーム特徴量と前記展開された仮説の音響モデルのフレーム特徴量との類似度を計算する類似度計算手段と、前記類似度と前フレームまでの仮説の認識スコアとから、認識スコアの演算を行うサーチ演算手段と、前記仮説と前記認識スコアを新しい仮説として登録する単語仮説登録手段と、前記フレーム単位の処理を入力音声の終端まで続け認識スコアの高い少なくとも1個の仮説を入力音声に近い認識結果として出力する認識結果出力手段、として機能させるための音声認識プログラム。
【請求項6】 音素や音節などの音声単位の連結で表現され、単語間の接続ルールによって入力音声の長さに従い展開される仮説に対応する音響モデルと、入力音声とを照合し認識スコアを得、その認識スコアの高い少なくとも1個の仮説を残しながら入力音声に近い候補を認識結果として出力する音声認識するためにコンピュータを、入力された音声の特徴量をフレーム単位で抽出する特徴量抽出手段と、現処理フレームが単語終端か単語内かを判別し、前記判定が単語終端ならば単語終端の仮説を記憶するか否かを判定し、単語内ならば単語内の仮説を記憶するか否かの判定をする単語終端判定手段と、前記記憶すると判定された仮説を記憶する仮説記憶手段と、前記記憶された仮説を仮説が単語内ならば単語を表現する音声単位を伸長し、単語終端ならば単語間の接続ルールにより次に続く単語を結合し、仮説を展開する制御を行うサーチ制御手段と、前記入力音声から抽出されたフレーム特徴量と前記展開された仮説の音響モデルのフレーム特徴量との類似度を計算する類似度計算手段と、前記類似度と前フレームまでの仮説の認識スコアとから、認識スコアの演算を行うサーチ演算手段と、前記仮説と前記認識スコアを新しい仮説として登録する単語仮説登録手段と、前記フレーム単位の処理を入力音声の終端まで続け認識スコアの高い少なくとも1個の仮説を入力音声に近い認識結果として出力する認識結果出力手段、として機能させるための音声認識プログラムを記録したコンピュータ読み取り可能な記憶媒体。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、一般の産業用、家庭用等の電気機器に搭載される音声認識技術に関し、特に音声認識の認識率向上を図る音声認識方法及び装置に関するものである。
【0002】
【従来の技術】音声認識システムの一例として、「Hermann Ney: Data Driven Search Organization for Continuous Speech Recognition (IEEE TRANSACTIONS ON SIGNAL PROCESSING Vol.40 No.2 p272 1992)」が参照される。
【0003】この音声認識システムは、図5の処理フローに示すステップを入力音声のフレームに同期して処理を行い、入力音声の終端まで実行することによって、入力音声に近い仮説を認識結果として得るものである。このような方法を用いるサーチをフレーム同期ビームサーチと呼ぶ。
【0004】ステップ1:i番目のフレームの仮説はone-pass search アルゴリズムを用いて、i+1番目のフレームに展開する。仮説が単語内ならば単語を表現する音声単位を、単語終端ならば単語間接続ルールにより次に続く単語を結合しその最初の音声単位を伸長する。i番目のフレームの仮説は消去され、i+1番目の仮説だけが記憶される。
【0005】ステップ2:i+1番目のフレームに展開された仮説のうち、最も累計スコアの高い仮説を基準として、そのスコアより一定の閾値以内のスコアを持つ仮説のみを記憶する。それ以外の仮説は消去する。これを候補の絞り込みといい、絞り込みにより、仮説の数が指数関数的に増加し計算不可能となることを避けている。
【0006】ステップ3:処理すべきフレームiに1を加える。
【0007】なお、フレーム同期ビームサーチにおいて高い精度で仮説の評価を行う音声認識方法として例えば特開平8−6588号公報には、フレーム同期ビームサーチにいて時刻tの仮説のスコアを、時刻に対する正規化を行うために、全仮説に共通の尤度関数を差し引くことにより行っており、正規化されたスコアの最大値と各仮説の正規化されたスコアにより一定の閾値以内の仮説を記憶するものである。
【0008】
【発明が解決しようとする課題】しかしながら、上述した従来の音声認識システムにおいては、単語内の仮説も単語終端の仮説も、最も累計スコアの高い仮説を基準として、そのスコアより一定の閾値以内のスコアを持つ仮説のみを記憶するため、単語終端で後続単語候補が多数接続可能となり、仮説数の大幅な増大をまねき、効率的な絞り込みが行われず計算が困難な状態に陥るという課題があった。
【0009】したがって、本発明は、上記課題に鑑みてなされたものであって、その目的はフレーム同期ビームサーチにおいて、単語内では似た発音のスコアの高い仮説は単語終端まで、仮説数によらず精密に計算を行うことで認識精度を保ち、単語終端では、後続単語が接続することによる仮説数の増大を避けるために、仮説数による絞り込みを行い、認識精度を保ちつつ計算量を効果的に削減可能な音声認識方法及びその装置を提供することにある。
【0010】
【課題を解決するための手段】この課題を解決するために本発明は、音素や音節などの音声単位の連結で表現され、単語間の接続ルールによって入力音声の長さに従い展開される仮説に対応する音響モデルと、入力音声とを照合し認識スコアを得、その認識スコアの高い少なくとも1個の仮説を残しながら入力音声に近い候補を認識結果として出力する音声認識装置において、入力された音声の特徴量をフレーム単位で抽出する特徴量抽出手段と、現処理フレームが単語終端か単語内かを判別し、前記判定が単語終端ならば単語終端の仮説を記憶するか否かを判定し、単語内ならば単語内の仮説を記憶するか否かの判定をする単語終端判定手段と、前記記憶すると判定された仮説を記憶する仮説記憶手段と、前記記憶された仮説を仮説が単語内ならば単語を表現する音声単位を伸長し、単語終端ならば単語間の接続ルールにより次に続く単語を結合し、仮説を展開する制御を行うサーチ制御手段と、前記入力音声から抽出されたフレーム特徴量と前記展開された仮説の音響モデルのフレーム特徴量との類似度を計算する類似度計算手段と、前記類似度と前フレームまでの仮説の認識スコアとから、認識スコアの演算を行うサーチ演算手段と、前記仮説と前記認識スコアを新しい仮説として登録する単語仮説登録手段と、前記フレーム単位の処理を入力音声の終端まで続け認識スコアの高い少なくとも1個の仮説を入力音声に近い認識結果として出力する認識結果出力手段とを備える。
【0011】本発明は、仮説を記憶するか否かの判定を、現処理フレームが単語終端か単語内かを判別し、前記判定が単語終端ならば単語終端の仮説を記憶するか否かを判定し、単語内ならば単語内の仮説を記憶するか否かの判定をするようにしたものである。
【0012】また、その判定基準を、単語内仮説を記憶するか否かの判定の基準を類似度のスコアとし、単語終端仮説を記憶するか否かの判定の基準を仮説の個数としたものである。
【0013】
【発明の実施の形態】本発明の請求項1に記載の発明は、音素や音節などの音声単位の連結で表現され、単語間の接続ルールによって入力音声の長さに従い展開される仮説に対応する音響モデルと、入力音声とを照合し認識スコアを得、その認識スコアの高い少なくとも1個の仮説を残しながら入力音声に近い候補を認識結果として出力する音声認識方法において、入力された音声の特徴量をフレーム単位で抽出する特徴量抽出ステップと、現処理フレームが単語終端か単語内かを判別し、前記判定が単語終端ならば単語終端の仮説を記憶するか否かを判定し、単語内ならば単語内の仮説を記憶するか否かの判定をするステップと、前記記憶すると判定された仮説を記憶するステップと、前記記憶された仮説を仮説が単語内ならば単語を表現する音声単位を伸長し、単語終端ならば単語間の接続ルールにより次に続く単語を結合し、仮説を展開する制御を行う制御ステップと、前記入力音声から抽出されたフレーム特徴量と前記展開された仮説の音響モデルのフレーム特徴量との類似度を計算するステップと、前記類似度と前フレームまでの仮説の認識スコアとから、認識スコアの演算を行う演算ステップと、前記仮説と前記認識スコアを新しい仮説として登録するステップと、前記フレーム単位の処理を入力音声の終端まで続け認識スコアの高い少なくとも1個の仮説を入力音声に近い認識結果として出力するステップとを有することにより、認識精度を保ちつつ計算量を効果的に削減できるという作用を有する。
【0014】請求項2に記載の発明は、請求項1記載の音声認識方法において、記憶するか否かの判定は、単語内仮説を記憶するか否かの判定の基準を類似度のスコアとし、単語終端仮説を記憶するか否かの判定の基準を仮説の個数としたことにより、単語内では似た発音のスコアの高い仮説は単語終端まで、仮説数によらず精密に計算を行うことで認識精度を保ち、単語終端では、後続単語が接続することによる仮説数の増大を避けるために、仮説数による絞り込みを行い、認識精度を保ちつつ計算量を効果的に削減であるという作用を有する。
【0015】請求項3に記載の発明は、音素や音節などの音声単位の連結で表現され、単語間の接続ルールによって入力音声の長さに従い展開される仮説に対応する音響モデルと、入力音声とを照合し認識スコアを得、その認識スコアの高い少なくとも1個の仮説を残しながら入力音声に近い候補を認識結果として出力する音声認識装置において、入力された音声の特徴量をフレーム単位で抽出する特徴量抽出手段と、現処理フレームが単語終端か単語内かを判別し、前記判定が単語終端ならば単語終端の仮説を記憶するか否かを判定し、単語内ならば単語内の仮説を記憶するか否かの判定をする単語終端判定手段と、前記記憶すると判定された仮説を記憶する仮説記憶手段と、前記記憶された仮説を仮説が単語内ならば単語を表現する音声単位を伸長し、単語終端ならば単語間の接続ルールにより次に続く単語を結合し、仮説を展開する制御を行うサーチ制御手段と、前記入力音声から抽出されたフレーム特徴量と前記展開された仮説の音響モデルのフレーム特徴量との類似度を計算する類似度計算手段と、前記類似度と前フレームまでの仮説の認識スコアとから、認識スコアの演算を行うサーチ演算手段と、前記仮説と前記認識スコアを新しい仮説として登録する単語仮説登録手段と、前記フレーム単位の処理を入力音声の終端まで続け認識スコアの高い少なくとも1個の仮説を入力音声に近い認識結果として出力する認識結果出力手段とを有することにより、認識精度を保ちつつ計算量を効果的に削減できるという作用を有する。
【0016】請求項4に記載の発明は、請求項3記載の音声認識装置において、単語終端判定手段は、単語内仮説を記憶するか否かの判定の基準を類似度のスコアとし、単語終端仮説を記憶するか否かの判定の基準を仮説の個数としたことにより、単語内では似た発音のスコアの高い仮説は単語終端まで、仮説数によらず精密に計算を行うことで認識精度を保ち、単語終端では、後続単語が接続することによる仮説数の増大を避けるために、仮説数による絞り込みを行い、認識精度を保ちつつ計算量を効果的に削減であるという作用を有する。
【0017】請求項5に記載の発明は、音素や音節などの音声単位の連結で表現され、単語間の接続ルールによって入力音声の長さに従い展開される仮説に対応する音響モデルと、入力音声とを照合し認識スコアを得、その認識スコアの高い少なくとも1個の仮説を残しながら入力音声に近い候補を認識結果として出力する音声認識するためにコンピュータを、入力された音声の特徴量をフレーム単位で抽出する特徴量抽出手段と、現処理フレームが単語終端か単語内かを判別し、前記判定が単語終端ならば単語終端の仮説を記憶するか否かを判定し、単語内ならば単語内の仮説を記憶するか否かの判定をする単語終端判定手段と、前記記憶すると判定された仮説を記憶する仮説記憶手段と、前記記憶された仮説を仮説が単語内ならば単語を表現する音声単位を伸長し、単語終端ならば単語間の接続ルールにより次に続く単語を結合し、仮説を展開する制御を行うサーチ制御手段と、前記入力音声から抽出されたフレーム特徴量と前記展開された仮説の音響モデルのフレーム特徴量との類似度を計算する類似度計算手段と、前記類似度と前フレームまでの仮説の認識スコアとから、認識スコアの演算を行うサーチ演算手段と、前記仮説と前記認識スコアを新しい仮説として登録する単語仮説登録手段と、前記フレーム単位の処理を入力音声の終端まで続け認識スコアの高い少なくとも1個の仮説を入力音声に近い認識結果として出力する認識結果出力手段、として機能させるための音声認識プログラムをコンピュータで実行することにより、認識精度を保ちつつ計算量を効果的に削減できるという作用を有する。
【0018】請求項6に記載の発明は、音素や音節などの音声単位の連結で表現され、単語間の接続ルールによって入力音声の長さに従い展開される仮説に対応する音響モデルと、入力音声とを照合し認識スコアを得、その認識スコアの高い少なくとも1個の仮説を残しながら入力音声に近い候補を認識結果として出力する音声認識するためにコンピュータを、入力された音声の特徴量をフレーム単位で抽出する特徴量抽出手段と、現処理フレームが単語終端か単語内かを判別し、前記判定が単語終端ならば単語終端の仮説を記憶するか否かを判定し、単語内ならば単語内の仮説を記憶するか否かの判定をする単語終端判定手段と、前記記憶すると判定された仮説を記憶する仮説記憶手段と、前記記憶された仮説を仮説が単語内ならば単語を表現する音声単位を伸長し、単語終端ならば単語間の接続ルールにより次に続く単語を結合し、仮説を展開する制御を行うサーチ制御手段と、前記入力音声から抽出されたフレーム特徴量と前記展開された仮説の音響モデルのフレーム特徴量との類似度を計算する類似度計算手段と、前記類似度と前フレームまでの仮説の認識スコアとから、認識スコアの演算を行うサーチ演算手段と、前記仮説と前記認識スコアを新しい仮説として登録する単語仮説登録手段と、前記フレーム単位の処理を入力音声の終端まで続け認識スコアの高い少なくとも1個の仮説を入力音声に近い認識結果として出力する認識結果出力手段、として機能させるための音声認識プログラムを記録したコンピュータ読み取り可能な記憶媒体から音声認識プログラムをコンピュータにインストールして実行することにより、認識精度を保ちつつ計算量を効果的に削減できるという作用を有する。
【0019】以下、本発明の実施の形態について、図面を用いて説明する。
【0020】(実施の形態1)図1は、本発明の実施の形態1における音声認識装置の構成図の一例を示す図である。
【0021】図1において、101は入力されたアナログ信号の音声からデジタル信号に変換するA/D変換装置、102はデータやプログラムを記憶する主記憶装置、103はプログラムに従ってデータを処理しする情報処理装置、104は認識対象の単語を表現する音素や音節などの音声単位の音響的特徴をモデル化した複数フレームから構成される音響モデル、105は認識対象の単語間の接続ルールを記述した言語モデル、106はデータやプログラムを格納している外部記憶装置であり、161は外部記憶装置106上にありA/D変換装置101によってアナログ音声からデジタル信号に変換された入力音声から音声の特徴量を抽出する特徴量抽出プログラム、162は外部記憶装置106上にあり仮説が単語内か単語終端かを判定するプログラム、163は外部記憶装置106上にあり164は認識スコアにより仮説を記憶するか否かを判定する単語内仮説記憶判定プログラムと、165は仮説の個数により仮説を記憶するか否かを判定する単語終端仮説記憶判定プログラムからなる仮説記憶判定プログラム、166は外部記憶装置106上にあり仮説記憶判定プログラムで記憶すると判定された仮説を記憶するプログラム、167は外部記憶装置106上にあり仮説を仮説が単語内ならば単語を表現する音声単位を伸長し、単語終端ならば言語モデル105に記述された単語間の接続ルールにより次に続く単語を結合し、仮説を展開するフレーム同期ビームサーチの仮説の展開制御を行うサーチ制御プログラム、168は外部記憶装置106上にあり特徴量抽出プログラム161から出力された入力音声のフレーム単位の特徴量と音響モデル104との類似度を計算する類似度計算プログラム、169は外部記憶装置106上にあり類似度計算プログラム168により計算された類似度と前フレームまでの仮説の認識スコアとから認識スコアを計算するフレーム同期ビームサーチ演算プログラム、170は外部記憶装置106上にあり仮説と計算された認識スコアを登録する仮説登録プログラム、171は外部記憶装置106上にありフレーム同期ビームサーチを入力音声の終端まで続け認識スコアの高い出力可能な仮説を認識結果として出力する認識結果出力プログラム、107は認識結果出力プログラム171の認識結果出力プログラムからの結果を出力する出力装置から構成されている。
【0022】図2は、音声認識装置の処理手順を表すフローチャートであり、このフローチャートを用いて、音声認識装置の処理手順を説明する。図中Sは各処理ステップを表し、各処理ステップは図1の特徴量抽出プログラム161〜認識結果出力プログラム171に対応するものである。
【0023】まず、入力されたアナログ信号の音声をデジタル信号にA/D変換する(S21)。単語と認識スコアからなる仮説の初期集合を記憶する(S22)。図3に示すように単語と認識スコアからなる仮説の初期集合を記憶する(S22)。図3では、アアコン、アイシャドウ、アクセサリ、アクセス、アサガオ、イカスミという6つの単語301と認識スコア302の初期値を記憶した例である。
【0024】デジタル信号に変換されたの入力音声から特徴量をフレーム単位に抽出する(S23)。仮説が現在単語内の音声単位を処理しているのか単語終端の音声単位を処理しているのかの判定を行う(S24)。仮説の現処理フレームが単語終端ではなく単語内だった場合、最も認識スコアの高い単語内の仮説を基準として、その認識スコアより一定の閾値以内の認識スコアを持つ単語内の仮説のみに絞り込む(S25)。仮説が単語終端である場合、認識スコアの高い順に仮説を選択し、仮説の個数により仮説を絞り込む(S26)。絞り込まれた仮説が単語内ならば単語を表現する音声単位を伸長し、単語終端ならば単語間の接続ルールにより次に続く単語を結合し、新しい仮説として展開する(S27)。
【0025】処理ステップS24からS27までの処理進行について図4を用いて説明する。図4では、単語内の仮説の判定基準である最大認識スコアからの一定の閾値以内を3、単語終端の仮説の判定基準である認識スコア上位2位までとして、○内の数値は求められた認識スコアとして説明する。
【0026】図4でS22によって登録された6つの単語に対してフレーム単位の処理を行い、時刻tでは認識スコアの値により単語仮説イカスミの認識スコアが閾値以下になってしまうので、イカスミ以外の5つの単語が登録され処理が続けられる。このときの、最大認識スコアが12であり、その閾値は12−3=9となる。時刻t+t1時刻では、単語仮説アイシャドウの認識スコアが閾値以下になってしまうので、アアコン、アクセサリ、アクセス、アサガオが記憶され処理が続けられる。時刻t+t3では、アアコン、アクセス、アサガオの3つの単語が終端になり、アクセス、アサガオ、アアコンの順位になりアアコンは上位2位からもれ、アクセス、アサガオが記憶され処理が続けられるというフレーム同期ビームサーチ制御を行う。
【0027】展開した仮説に対して、入力音声の特徴量と音響モデル104から類似度を計算し、さらに前フレームまでの仮説の認識スコアとから新しい認識スコアを計算するというフレーム同期ビームサーチ演算を行う(S28)。ここでは、認識スコアは、類似度と前フレームまでの仮説の認識スコアを加算して求めている。展開された仮説を新たな認識スコアとともに記憶する(S29)。
【0028】終了判定条件が満たされるまで、上記S23からS29までのフレーム単位の処理過程を繰り返す(S30)。
【0029】終了判定条件が満たされた時に残っていた仮説の集合から認識スコアの高い出力可能な仮説を認識結果として出力する(S31)。
【0030】
【発明の効果】したがって、本発明によれば、フレーム同期ビームサーチにおいて、単語内では似た発音のスコアの高い仮説は単語終端まで、仮説数によらず精密に計算を行うことで認識精度を保ち、単語終端では、後続単語が接続することによる仮説数の増大を避けるために、仮説数による絞り込みを行い、認識精度を保ちつつ計算量を効果的に削減可能な音声認識方法及びその装置を提供することができる。
【出願人】 【識別番号】000005821
【氏名又は名称】松下電器産業株式会社
【出願日】 平成13年1月23日(2001.1.23)
【代理人】 【識別番号】100097445
【弁理士】
【氏名又は名称】岩橋 文雄 (外2名)
【公開番号】 特開2002−215187(P2002−215187A)
【公開日】 平成14年7月31日(2002.7.31)
【出願番号】 特願2001−14160(P2001−14160)