| 【発明の名称】 |
音声信号の再生装置 |
| 【発明者】 |
【氏名】堀 克弥
【氏名】大久保 仁
|
| 【要約】 |
【課題】記録メディアとして半導体メモリを使用した音声信号の再生装置において、特定の記録部分を簡単に、かつ、素早く再生できるようにする。
【解決手段】所定の単語の音声をマイクロフォン11に入力したとき、その音声を音声認識回路31により認識する。この認識結果をキーワードとしてメモリ15に記録されている音声信号を検索する。この検索の結果を、LCD23にリスト形式に表示する。この表示された検索の結果のうちの1つを選択したとき、その選択した検索の結果に対応する部分からメモリ15の再生を開始する。 |
【特許請求の範囲】
【請求項1】マイクロフォンと、このマイクロフォンの出力信号の供給される音声認識回路と、表示素子とを有し、所定の単語の音声を上記マイクロフォンに入力したとき、その音声を上記音声認識回路により認識し、この認識結果をキーワードとして記録メディアに記録されている音声信号を検索し、この検索の結果を、上記表示素子にリスト形式に表示し、この表示された検索の結果のうちの1つを選択したとき、その選択した検索の結果に対応する部分から上記記録メディアの再生を開始するようにした音声信号の再生装置。 【請求項2】請求項1に記載の音声信号の再生装置において、上記検索の結果が複数ある場合に、上記再生を開始したのち、この再生を中止したときには、上記複数の検索の結果における他の1つが選択されるようにした音声信号の再生装置。 【請求項3】請求項1あるいは請求項2に記載の音声信号の再生装置において、上記キーワードとなった認識結果の文字列を、上記表示素子に表示するようにした音声信号の再生装置。 【請求項4】請求項1〜請求項3に記載の音声信号の再生装置において、上記記録メディアが不揮発性の半導体メモリであるようにした音声信号の再生装置。 【請求項5】文字の入力手段と、表示素子とを有し、上記入力手段により所定の文字列を入力したとき、その入力した文字列ををキーワードとして記録メディアに記録されている音声信号を検索し、この検索の結果を、上記表示素子にリスト形式に表示し、この表示された検索の結果のうちの1つを選択したとき、その選択した検索の結果に対応する部分から上記記録メディアの再生を開始するようにした音声信号の再生装置。
|
【発明の詳細な説明】【0001】 【発明の属する技術分野】この発明は、音声信号の再生装置に関する。 【0002】 【従来の技術】音声信号の記録再生装置として、フラッシュメモリなどの不揮発性の半導体メモリに、音声信号を記録再生するものがある。そして、この半導体メモリに音声信号を記録再生する場合には、メカニカルな機構や可動部分を使用しないので、どの記録部分の音声であっても、瞬時に再生を開始することができる。 【0003】 【発明が解決しようとする課題】ところが、特定の部分から再生を開始するには、まず、その再生を開始するべき部分を探し出す必要がある。そして、その探し出す方法として、早送りと再生とを短時間ずつ交互に繰り返すことにより、記録された音声を断片的に再生して目的とする部分を探し出す方法、あるいは数倍速程度の早送り再生を行いながら、その再生された音声をモニタして目的とする部分を探し出す方法がある。 【0004】しかし、前者の方法は、操作が煩雑であり、目的とする部分を探し出すためには、かなりの手間がかかる。また、後者の方法は、早送り再生の速度を速くすると、それだけ音声が不明瞭になるので、目的とする部分の音声を聞き逃しやすくなり、遅くすると、検索に時間がかかってしまう。 【0005】さらに、記録時に、必要になるであろう部分に、インデックス信号(マーカー信号)を打ち込んでおく方法もあるが、この方法の場合には、インデックス信号を打ち込んでいない部分を探し出すことはできない。 【0006】この発明は、以上のような問題点を解決しようとするものである。 【0007】 【課題を解決するための手段】この発明においては、例えば、マイクロフォンと、このマイクロフォンの出力信号の供給される音声認識回路と、表示素子とを有し、所定の単語の音声を上記マイクロフォンに入力したとき、その音声を上記音声認識回路により認識し、この認識結果をキーワードとして記録メディアに記録されている音声信号を検索し、この検索の結果を、上記表示素子にリスト形式に表示し、この表示された検索の結果のうちの1つを選択したとき、その選択した検索の結果に対応する部分から上記記録メディアの再生を開始するようにした音声信号の再生装置とするものである。したがって、ユーザの発声した音声をキーワードとして記録内容が検索され、その検索結果がリスト形式に表示され、そのリストの中から再生位置が選択される。 【0008】 【発明の実施の形態】図1は、この発明による記録再生機の一例を示し、この装置においては、記録メディアとして不揮発性の半導体メモリを使用する場合である。 【0009】そして、記録時には、マイクロフォン11からのアナログ音声信号が、入力アンプ、フィルタおよびA/Dコンバータ回路などにより構成された入力処理回路12に供給されてデジタル音声信号に変換され、このデジタル音声信号がエンコーダ回路13に供給されて例えばMP3方式によりデータ圧縮され、このデータ圧縮された信号が、メモリコントローラ14に供給されて不揮発性の半導体メモリ15に書き込まれていく。 【0010】また、再生時には、メモリコントローラ14によりメモリ15からデジタル音声信号が読み出され、この読み出された信号が、デコーダ回路16に供給されてもとのデジタル音声信号にデコードされ、このデコードされた信号が、D/Aコンバータ回路、フィルタおよび出力アンプなどにより構成された出力処理回路17に供給されてもとのアナログ音声信号に変換され、この信号がスピーカ18に供給される。 【0011】さらに、システム制御回路としてマイクロコンピュータ21が設けられる。このマイクロコンピュータ21は、プログラムを実行するCPU211、各種のプログラムの書き込まれたROM212、ワークエリア用のRAM213および周辺回路とのインターフェイス回路(図示せず)などを有している。そして、マイクロコンピュータ21からメモリコントローラ14にコマンド(およびパラメータ)が供給されると、メモリコントローラ14により、メモリ15に対する書き込み、読み出しおよびそれらのアドレスが制御され、上記のようにデジタル音声信号の書き込みあるいは読み出しが実現される。 【0012】さらに、マイクロコンピュータ21には、入力操作部として各種の操作キー(操作スイッチ)22が接続されるとともに、表示素子として例えばLCD23が接続される。そして、操作キー22の操作にしたがってマイクロコンピュータ21からメモリコントローラ14に所定のコマンドが供給され、メモリ15に対する書き込みあるいは読み出し、すなわち、音声の記録あるいは再生が実行される。また、この記録時および再生時、メモリ15のアドレスが経過時間に換算され、その経過時間がLCD23に表示される。 【0013】そして、メモリ15に記録された音声のうち、ユーザの指定した部分から再生を開始できるようにするため、特にこの発明においては、以下のように構成される。すなわち、音声認識回路31が設けられ、入力処理回路12およびデコーダ回路16に接続されるとともに、その認識結果がマイクロコンピュータ21に供給される。 【0014】また、マイクロコンピュータ21のROM212には、CPU211の実行するプログラムの一部として、例えば図2に示すようなルーチン100が用意される。このルーチン100は、ユーザの発声した音声をキーワードとしてメモリ15に記録されている音声を検索し、目的とする記録位置を探し出すためのものであり、その詳細については後述する。なお、図2においては、ルーチン100は、この発明に関係する部分だけを抜粋して示している。 【0015】このような構成において、メモリ15には、例えば、図4に示すように音声が記録されているとする。すなわち、記録時間にして7分35秒の位置に音声「ABC△△」が記録され、10分25秒の位置に音声「ABC○○」が記録され、18分42秒の位置に音声「ABC××」が記録されているとする。なお、記録時間の位置は、再生時間の位置でもあり、メモリ15のアドレスに対応する。また、音声「ABC○○」の記録位置から再生を開始したいものとする。 【0016】そして、この記録再生機が停止状態にあるとき、操作キー22のうちの検索キーを操作すると、CPU211の処理がルーチン100のステップ101からスタートし、次にステップ102において、例えば図3Aに示すように、LCD23には、キーワードの入力を促す画面が表示され、キーワードの入力待ちとなる。この場合、キーワードは、再生をしたい記録区間に含まれている単語あるいは再生をしたい記録区間の先頭部分に位置する単語である。 【0017】今の場合は、単語「ABC○○」の記録位置から再生を開始したい場合なので、マイクロフォン11に向かって「ABC」と発声する。すると、この単語「ABC」の音声信号が、マイクロフォン11から入力処理回路12を通じて音声認識回路31に供給されて認識され、この認識結果がマイクロコンピュータ21に検索のキーワードとして供給される。 【0018】すると、マイクロコンピュータ21の処理はステップ103に進み、キーワードの確認のため、例えば図3Bに示すように、「キーワードは“ABC”です」が表示されるとともに、メモリ15の記録内容に対する検索が開始される。すなわち、メモリ15の内容がその先頭位置〔0分0秒〕から高速で読み出され、デコーダ回路16に供給されてデジタル音声信号にデコードされるとともに、そのデコードされた音声信号が音声認識回路31に供給されて認識され、その認識結果がマイクロコンピュータ21に供給される。こうして、マイクロコンピュータ21において、マイクロフォン11により入力された音声信号をキーワードとして、メモリ15から読み出されてくる音声信号が検索される。なお、この検索は、ワードスポッティングで行うことができる。 【0019】そして、今の場合、キーワードが「ABC」であり、メモリ15の記録内容が図4のとおりなので、検索が〔7分35秒〕の記録位置まで進むと、音声「ABC△△」が見つかるが、すると、この〔7分35秒〕が検索結果としてRAM213に記憶される。そして、その後も検索が続行され、今の場合、記録位置〔10分25秒〕、〔18分42秒〕も検索結果としてRAM213に追加して記憶される。 【0020】そして、検索がメモリ15の記録内容の最後まで進むと、それで検索を終了し、処理はステップ104に進み、このステップ104において、ステップ103によりRAM213に記憶された検索結果、今の場合、〔7分35秒〕、〔10分25秒〕、〔18分42秒〕が、図3Cに示すように、LCD23にリスト形式に表示される。また、このとき、第1番目の検索結果の行には、カーソル231が表示される。 【0021】続いて、処理はステップ105に進み、このステップ105において、検索結果の選択待ちとなり、操作キー22のうちのカーソルキーを操作すると、カーソル231が検索結果の配列方向に移動する。なお、検索結果が、LCD23に一度に表示できる行数よりも多いときには、カーソルキーを操作すると、表示されたが検索結果がスクロールされる。 【0022】そして、LCD23に表示された検索結果のうち、〔10分25秒〕の検索結果が目的とする記録位置と思われる場合には、〔10分25秒〕の行にカーソル231を移動させ、操作キー22のうちの決定キーを操作する。 【0023】すると、処理はステップ106に進み、メモリ15の記録内容のうち、ステップ105で選択および決定した検索結果の時間位置、今の場合、〔10分25秒〕の記録位置から読み出しを開始するように、マイクロコンピュータ21からメモリコントローラ14にコマンドが出され、したがって、メモリ15の記録内容のうち、〔10分25秒〕の記録位置から再生が開始され、その音声がスピーカ18から出力される。また、このとき、LCD23には、例えば図3Dに示すように、メモリ15における再生位置が再生経過時間として表示される。 【0024】さらに、メモリ15からの再生が開始されると、CPU211の処理はステップ107に進み、キー入力待ちとなる。そして、処理がステップ107に進んでから所定の時間内に操作キー22のどれかが操作されると、処理はステップ107からステップ108に進み、メモリコントローラ14にコマンドが供給されてメモリ15からの音声の再生はいったん停止され、その後、処理はステップ104に戻る。 【0025】したがって、例えば図3Cに示すように、LCD23には、再びステップ103における検索の結果がリスト形式に表示され、その検索結果を選択できる状態となる。したがって、検索結果の選択を誤ったときには、目的とする検索結果が得られるまで、すなわち、目的とする内容が再生されるようになるまで、ステップ105、107の入力を繰り返せばよいことになる。 【0026】また、ステップ107においてキー入力待ちのとき、キー操作をしないうちに所定の時間が経過すると、処理はステップ107からステップ109に進み、このルーチン100を終了する。ただし、このとき、ステップ106により開始された再生は継続している。 【0027】したがって、ステップ105により選択した検索結果が目的とする内容の場合には、そのまま何もキー操作をしないでいれば、その目的とする内容が継続して再生される。 【0028】なお、キーワードを間違えるなどして検索結果が得られないときには、ステップ104において、例えば「該当する記録はありません」の文字列がLCD23に表示され、ルーチン100を終了する。 【0029】こうして、上述の記録再生機によれば、■ ユーザの発声した音声をキーワードとして記録内容を検索する。 ■ 検索結果を例えば図3Cに示すように、リスト形式で表示する。 ■ そのリストの中から再生位置を選択する。 ようにしているので、目的とする記録部分を素早く、かつ、簡単に探し出して再生することができる。 【0030】例えば、キーワードに該当する単語が1か所にしか記録されていないときには、ステップ105で決定キーを押せば、あとは何も操作する必要がない。また、キーワードに該当する単語が複数の位置に記録されていても、それらを選択するだけであり、目的とする記録部分を簡単に探し出して再生することができる。 【0031】さらに、記録位置のリストを表示する場合、例えば図3Cに示すように、リストには、記録位置の時間も示すようにしているので、例えば、会議が始まって10分ぐらいのときの発言だったのように、目的とする記録位置のおよその時間位置がわかっている場合には、その記録位置をより素早く探し出すことができる。 【0032】なお、上述においては、ステップ103において検索結果をRAM213に記憶するとき、記録時間の状態で記憶するとしたが、メモリ15のアドレスを記憶するとともに、ステップ104において検索結果が表示するとき、その記憶しておいたアドレスを記録時間に変換して表示することもできる。 【0033】また、ステップ105により選択した検索結果が目的とするものではないときには、ステップ107からステップ108に進むが、複数の検索結果があるときには、前回選択した検索結果の次の検索結果を選択してステップ106に進むようにすることもできる。 【0034】さらに、上述においては、入力操作部が操作キー22の場合であるが、ジョグダイヤルなどとすることもできる。また、上述においては、検索時のキーワードが、マイクロフォン11から入力した音声であるが、操作キー22を操作して入力した文字(文字コード)とすることもできる。さらに、上述においては、記録メディアが不揮発性メモリ15であるが、メモリカード(不揮発性メモリを、所定のパッケージに収納して本体機器に対して着脱自在としたメディア)、テープカセット、MDなどとすることもできる。 【0035】〔この明細書で使用している略語の一覧〕 A/D:Analog to DigitalCPU:Central Processing UnitD/A:Digital to AnalogLCD:Liquid Crystal DisplayMD :Mini DiscMP3:MPEG-1/Audio Layer 3RAM:Random Access MemoryROM:Read Only Memory【0036】 【発明の効果】この発明によれば、目的とする記録部分を素早く、かつ、簡単に探し出して再生することができる。
|
| 【出願人】 |
【識別番号】000002185 【氏名又は名称】ソニー株式会社
|
| 【出願日】 |
平成12年9月11日(2000.9.11) |
| 【代理人】 |
【識別番号】100091546 【弁理士】 【氏名又は名称】佐藤 正美
|
| 【公開番号】 |
特開2002−91493(P2002−91493A) |
| 【公開日】 |
平成14年3月27日(2002.3.27) |
| 【出願番号】 |
特願2000−274781(P2000−274781) |
|