| 【発明の名称】 |
医用診断装置 |
| 【発明者】 |
【氏名】古曳 孝明
【氏名】井桁 嘉一
【氏名】宮本 麻里子
|
| 【要約】 |
【課題】術者が入力した言葉を認識できなかった場合でも、迅速かつ安全に音声による操作ができる医用診断装置。
【解決手段】音声入力手段と、制御手段制御用の言葉を登録しておく音声記憶手段と、前記制御手段制御用の言葉を判別する音声認識手段と、この音声認識手段で判別した言葉を対応する制御指令に変換して入力する指令変換手段と、前記音声認識手段で認識できなかった場合は、最も類似した音声データを記憶されている音声データの中から抽出し、この抽出した音声データが先に前記音声入力手段から入力した音声データであるかを確認するための音声データを作成し、この音声データを言葉に変換しこの言葉を音声発生手段から発生して、前記抽出した音声データが先に前記音声入力手段から入力した音声データであることを確認してから、上記抽出した音声データで装置各部を操作する。 |
【特許請求の範囲】
【請求項1】 操作手段からの各種指令に応じて装置各部を作動させる制御手段と、音声(言葉)を電気信号変換して出力(音声データ)する音声入力手段と、予め決められた前記制御手段制御用の言葉(音声データ)を登録しておく音声記憶手段と、前記音声入力手段からの音声データと前記音声記憶手段に記憶されている音声データとを比較し、前記制御手段制御用の音声データのうちどれに該当するかを判別する音声認識手段と、この音声認識手段で判別した音声データを制御指令に変換する指令変換手段と、この指令変換手段の出力信号で装置各部を操作する医用診断装置において、前記音声認識手段で認識できなかった音声データに類似した音声データを前記音声記憶手段に記憶されている音声データの中から抽出する類似音声データ抽出手段と、この抽出した音声データが先に前記音声入力手段から入力した音声データであるかを確認するための音声データを作成する確認用音声データ作成手段と、この音声データを言葉に変換しこの言葉を発生する音声発生手段とを備え、前記抽出した音声データが先に前記音声入力手段から入力した音声データであることを確認し、前記抽出した音声データで装置各部を操作することを特徴とする医用診断装置。
|
【発明の詳細な説明】【0001】 【発明の属する技術分野】本発明は、X線撮影装置やX線CT装置,磁気共鳴イメージング装置,超音波診断装置等の医用診断装置の操作手段に手を触れることがなく音声による操作を可能とした医用診断装置に係り、特に術者が入力した音声を認識できなかった場合でも、迅速かつ安全に音声による操作ができる医用診断装置に関する。 【0002】 【従来の技術】医用診断装置では、近年IVR(インターベンショナルラジオロジー)というX線透視下における治療法が盛んに行われるようになってきた。この治療では、術者は手を清潔下においているため、操作器に触ることが出来ず、第3者に操作を依頼するなどの方法をとっている。しかし、それでは術者の意志がよく伝わらず、操作に時間もかかることから改善が望まれていた。そこで、これを改善する方法が特開平8−229028に開示されている。この方法は、操作対象の機器と操作内容に応じた言葉、すなわち操作コマンドを予め決めておき、これを自分の音声で登録し、その音声を特定話者対応音声認識装置に記憶しておく。装置を起動し、音声入力操作が可能な状態になると、術者は音声入力装置のマイクロフォンに向かって操作コマンドを入力する。音声認識装置は入力された操作コマンドを認識し、このコマンドを制御装置で解読して、支持器や患者テーブル,モニタ等の機器の動作設定を行い、それぞれの機器へ制御指令を送って各機器を操作するものである。 【0003】この方法により、術者は手を使わずに装置を操作することができるようになる。 【0004】 【発明が解決しようとする課題】しかし、特定話者対応と言えども、術者が発生した音声が100%認識できるとは言えない。入力した音声パターンが、予め登録されている音声パターンと微妙に異なる場合、つまり完全に音声パターンが一致しない場合は、認識しない側に装置が働く場合が多い。 【0005】このため、認識できなかった場合は、機器動作が全く行われないか、あるいは術者の意図とは全く異なる動作をすることが考えられる。機器が全く動作しない場合は、術者は再度繰り返して音声を入力しようとする。 しかし、相手が機械であるため、術者の意志が通じなくなり、術者は苛立ちを覚えることになる。術者にとっては、音声を入力すれば、即機器が動作するものと思っているため、操作が続行できないのは、術者の心理面を含め、特に緊急時には問題である。 【0006】また、異なる動作をすることは、操作をやり直すこととなるばかりではなく、安全性においても問題が生じる。つまり、従来の方法では、特に認識できなかった状態において、術者と機械との間のコミュニケーションを図るための配慮に欠けており、これでは音声を使うことによる効果が薄れる。 【0007】本発明の目的は、音声で操作する医用診断装置において、特に術者が入力した音声を認識できなかった場合でも、術者に心理的ストレスを与えることなく、迅速かつ安全に音声による操作ができる医用診断装置を提供することにある。 【0008】 【課題を解決するための手段】上記目的は、操作手段からの各種指令に応じて装置各部を作動させる制御手段と、音声(言葉)を電気信号変換して出力(音声データ)する音声入力手段と、予め決められた前記制御手段制御用の言葉(音声データ)を登録しておく音声記憶手段と、前記音声入力手段からの音声データと前記音声記憶手段に記憶されている音声データとを比較し、前記制御手段制御用の音声データのうちどれに該当するかを判別する音声認識手段と、この音声認識手段で判別した音声データを制御指令に変換する指令変換手段と、この指令変換手段の出力信号で装置各部を操作する医用診断装置において、前記音声認識手段で認識できなかった音声データに類似した音声データを前記音声記憶手段に記憶されている音声データの中から抽出する類似音声データ抽出手段と、この抽出した音声データが先に前記音声入力手段から入力した音声データであるかを確認するための音声データを作成する確認用音声データ作成手段と、この音声データを言葉に変換しこの言葉を発生する音声発生手段とを備え、前記抽出した音声データが先に前記音声入力手段から入力した音声データであることを確認し、前記抽出した音声データで装置各部を操作することによって達成される。上記類似音声データ抽出手段は、上記音声認識手段で認識できなかった音声データと上記記憶手段に記憶されている音声データとの差を求め、この差がある規定値以内であるかを判断し、規定値以内の場合は類似音声データであるとして抽出する。上記確認用音声データ作成手段は、前記類似音声データ抽出手段で抽出した類似音声データが先に音声入力手段から入力した言葉であるかどうかを術者に確認するための言葉、例えば前記類似音声データに「ですか」の言葉に対応する音声データを付加した音声データを作成する。 【0009】上記音声発生手段は、前記確認用音声データ作成手段で作成した音声データを言葉に変換する音声合成手段と、この音声合成手段で作成した言葉を発生するスピーカとから成る。このように構成された医用診断装置は、音声認識手段で認識できなかった音声データと最も類似している音声データを類似音声データ抽出手段で音声記憶手段に記憶されている音声データの中から抽出し、この抽出した音声データが先に音声入力手段から入力した言葉であるかどうかを確認するために確認用の音声データを確認用音声データ作成手段で作成し、音声発生手段から前記確認用音声データを言葉に変換してこれを発生する。この言葉を術者が聞いて、この言葉が術者が先に音声入力手段から入力した言葉である場合は、術者はその旨の言葉を音声入力手段より入力し、この言葉を音声認識手段で認識して前記抽出した音声データを指令変換手段で機器の操作指令に変換して装置各部の操作を行う。したがって、音声入力手段から入力した言葉が多少あいまいな言葉でも認識できるようになるので、認識率が一段と向上し、音声入力による操作の操作性の向上及び信頼性の向上に大きく寄与するものである。 【0010】 【発明の実施の形態】以下、図面を参照して本発明の実施例を説明する。図2は、本発明の一実施形態(実施例)示す図で、本発明による音声操作手段を循環器X線検査装置に用いた場合を例示している。図2において、1は患者,2は患者を寝載する前後,左右,上下などの方向に動くテーブル,3はテーブルなどを操作する操作器,4はX線を制御するフットスイッチ,21はイメージングインテンシファイヤ(以下、I.I.という)22とX線管23を支持する支持機構,24はI.I.25とX線管26を支持する支持機構,28はX線像を観察するモニタで、これらは検査室に設置されている。I.I.22,25は、撮影している箇所の視野を広げたり、画像を大きくしたりするために、上下させることができる。検査中には、このI.I.の上下動作を行うことがある。 【0011】支持機構21に支持された撮影系と支持機構24に支持された撮影系の組み合わせにより、多方向からの位置決めが容易となり、錯綜走行する血管群の中から目標とする血管を選択しX線透視画像を得ることができる。透視は、フットスイッチ4を操作して行う。 【0012】術者41は、そのX線透視画像を常に観察しながらカテーテル操作(図示せず)を行う。そのX線透視画像は、術者41がフットスイッチ4を操作して照射の信号を出し、図3に示す通り、その照射信号を受けてX線管よりX線が照射され、患者の身体を透過したX線をI.I.22で受像し、受像した信号は、A/D変換器55でデジタル信号に変換され画像処理部56に送られる。送られてきた画像信号は、コントラスト,ガンマ特性変換などの画像処理が行われ、階調処理する表示階調処理部57に送られる。階調処理が済むとデジタル画像信号は、D/A変換器58によりアナログ信号に変換され、モニタ28に表示される。 【0013】上記位置決めが終了すると、造影剤を上記カテーテルを通して血管内に注入し、撮影、例えばシネカメラ45によるフィルム撮影を行う。上記循環器X線検査装置は、2台の撮影系の支持機構,患者テーブル,I.I.,画像表示など、術者自信が自分の思い通りに動作させたい装置がたくさんある。この動作を術者自身の音声を通して動作させるシステムについて図2を用いて説明する。 【0014】このシステムは、音声を入力するマイクロフォン(音声入力装置)5と、操作対象機器やこの機器の動作を設定する言葉の音声データを予め記憶,登録しておく音声記憶部と前記マイクロフォン5より入力された音声データと前記音声記憶部に登録されている音声データとを比較し、一致する音声データを検索してこの音声データが前記入力された音声データであることを認識する音声認識部とからなる音声解析装置6と、この音声解析装置6で認識した音声データを上記循環器装置の装置各部の操作信号に変換する指令変換装置7と、この指令変換装置7で変換された操作信号で各機器の動作設定を行うシステム動作制御装置8と、上記音声入力装置5より入力した音声データが上記音声解析装置6の音声記憶部に記憶されている音声データと一致しない場合は、上記検索した音声データが上記入力した音声データとどの程度類似しているかを判断し、最も類似している音声データを抽出する類似音声データ抽出装置9と、この類似音声データ抽出装置9により抽出した音声データの言葉が先に上記マイクロフォン5より入力した言葉と同じ言葉であるかを術者に確認するための確認用の音声データを作成する確認用音声データ作成装置10と、この装置で作成した確認用の音声データを言葉に変換する音声合成装置11aと前記確認用の言葉を発生するスピーカ11bとから成る音声発生装置11とで構成される。 【0015】このような構成の音声操作システムを用いて各機器の操作は以下のようにして行う。先ず、機器を操作する術者41は操作する機器やこの機器の動作設定指令に対応した言葉をマイクロフォン(音声入力装置)5より音声解析装置6に入力する。音声解析装置6の記憶部には操作する機器やこの機器の動作設定を行う指令に対応した言葉(音声データ)を予め登録しておき、前記マイクロフォン5より入力した音声データと一致する音声データを前記音声解析装置6の音声認識部で比較,認識し、一致した音声データを指令変換装置7に伝達して、前記音声データを機器の操作信号に変換する。そして、この変換した操作信号をシステム動作制御装置8に送り、各機器の動作設定を行い装置各部を操作する。上記音声認識部で前記マイクロフォン5より入力した音声データと上記登録しておいた音声データとが一致する音声データが検索できなかった場合は、上記マイクロフォン5より入力した言葉の音声データと上記登録しておいた言葉の音声データとの差がある決められた範囲以内にある音声データを類似音声データ抽出装置9で抽出し、この抽出した音声データが術者が先に入力した音声データであるかどうかを術者に確認するための確認用の言葉に対応する音声データを確認用音声データ作成装置10で作成し、この音声データの言葉を音声合成装置11aで作成し、この言葉をスピーカ11bより発生して術者に確認を求める。術者は、前記スピーカから発した確認用の言葉が先に入力した言葉と判断した場合は、その旨の言葉をマイクロフォン5より入力し、これを音声解析装置6で解析して先に入力した言葉(音声データ)に応じた機器の操作を行う。 【0016】上記マイクロフォン5より入力した言葉の音声データと前記登録しておいた言葉の音声データとの差がある決められた範囲以外にある場合には、音声認識できないものとして再度音声入力する等の方法をとる。図1に上記音声入力操作の詳細フローチャートを示す。 【0017】(1)操作する機器及びこの機器の動作設定内容に対応する予め音声解析装置6の音声記憶部に記憶してある言葉をマイクロフォン5より入力する。 【0018】(2)音声解析装置6は、前記入力された言葉の音声データ(ステップ70)と、音声記憶部に記憶してある音声データとを比較し(ステップ71,ステップ72)、一致する音声データを検索する(ステップ73)。 【0019】(3)一致した音声データを検索した場合は、これを音声認識部で「どのような機器のどのような動作設定か」を解析する(ステップ74)。 【0020】(4)上記(3)で解析した音声データを指令変換装置7に送り、操作する機器の動作設定信号に変換する(ステップ75)。 【0021】(5)上記の指令変換装置7で変換した動作設定信号をシステム動作制御装置8に送り(ステップ76)、前記動作設定信号に対応した操作対象機器の動作設定を行い、機器を操作する(ステップ77)。 【0022】(6)一方、上記(2)で検索した結果、一致する音声データが見つからなかった場合は、上記入力した音声データ(音声入力データ)とこの音声入力データに類似している音声記憶部の音声データ(類似音声データ)とを類似音声データ抽出装置9で比較する(ステップ78)。 【0023】(7)前記音声入力データと類似音声データとの差が規定値以内であるかどうかを判断する(ステップ79)。 【0024】(8)規定値以内の場合は、前記「音声入力データ」に「ですか」の音声データを付加し、この音声データを確認用音声データ作成装置10で作成し(ステップ80)、これを音声発生装置11の音声合成装置11aで言葉に変換してスピーカ11bより前記言葉を発生して術者にこの言葉は先に音声入力装置5から入力した言葉であるかどうかの確認を求める。 【0025】(9)術者は、先に入力した言葉である場合は、その旨の言葉、例えば「OK(オーケー)」を音声入力装置5より入力し、これと音声記憶部に記憶してある「OK」とを比較して(ステップ72,83)、先に入力した言葉と同じであると判断した場合は、この言葉を解析するステップ74に進み、以下(3)〜(5)の処理を行い、入力した言葉に応じた機器の動作設定を行い、各機器を操作する。 【0026】(10)上記(9)で、術者が先に入力した言葉でない旨の言葉、例えば「NO(ノー)」を音声入力装置5より入力し、これと音声記憶部に記憶してある「NO」とを比較して先に入力した言葉でないと判断した場合(ステップ72,83)、及び上記(7)で規定値以内に入っていなかった場合は、認識できなかったものと判断して(ステップ84)、次の音声入力を待つか、又は音声認識失敗であることをスピーカ11bより発生するか、あるいはモニタ29に表示する(図示省略)等により術者に報知する。ただし、このようなケースはほとんどなく、予め登録されているどの言葉とも全く異なる(つまり、音声パターンの類似度が、登録されているどの音声に対しても異なるということ)ということはほとんどない。 【0027】図1の実施例では、類似音声データ抽出装置9と確認用音声データ作成装置10を音声解析装置6と独立としたものとして説明したが、前記類似音声データ抽出装置9及び確認用音声データ作成装置10の機能はソフトウェアで処理できるので、これらは前記音声解析装置6のハードウェアを用いて前記ソフトウェアで処理することも可能である。 【0028】すなわち、類似音声データ抽出装置9と確認用音声データ作成装置10は音声解析装置6に含めるようにしても良い。 【0029】 【発明の効果】以上、説明したように本発明によれば、術者が機器動作を指令する言葉が、予め登録されている音声データと完全に一致しなかった場合に、予め登録されている全音声データと比較していく過程において、音声パターンの類似度が最も近いものを抽出し、その抽出した音声データの言葉が先に入力した言葉かどうかを術者に確認してから操作するようにしたので、多少あいまいな言葉が入力されても認識できるので、認識率が一段と向上し、音声入力による機器操作の操作性及び信頼性が大きく向上するという効果がある。
|
| 【出願人】 |
【識別番号】000153498 【氏名又は名称】株式会社日立メディコ
|
| 【出願日】 |
平成10年6月25日(1998.6.25) |
| 【代理人】 |
|
| 【公開番号】 |
特開2000−5158(P2000−5158A) |
| 【公開日】 |
平成12年1月11日(2000.1.11) |
| 【出願番号】 |
特願平10−193625 |
|