トップ :: G 物理学 :: G10 楽器;音響




【発明の名称】 情報処理装置
【発明者】 【氏名】鉄本 秀夫

【要約】 【課題】ホームページ情報を音声化する際に、文字の大きさ等によって表現されている情報の欠落を防止する。

【解決手段】呼受け付け手段1aは、ユーザからの電話機3による呼を受け付ける。音声認識手段1bは、電話機3から送信されてきたユーザの音声を認識する。ホームページ情報取得手段1cは、音声認識手段1bによって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得する。テキスト情報抽出手段1dは、ホームページ情報に含まれているテキスト情報を、ブロック単位で抽出する。属性情報抽出手段1eは、テキスト情報抽出手段1dによって抽出された各ブロックの属性情報を抽出する。音声化順序決定手段1fは、属性情報抽出手段1eによって抽出された各ブロックの属性情報に応じて、各ブロックの音声化の順序を決定する。音声化手段1gは、音声化順序決定手段1fの決定結果に基づいて、各ブロックに含まれるテキストを音声化する。
【特許請求の範囲】
【請求項1】 マークアップ言語で記述されたホームページ情報を読み込んでユーザに提供する処理を行う情報処理装置において、ユーザからの電話機による呼を受け付ける呼受け付け手段と、前記電話機から送信されてきたユーザの音声を認識する音声認識手段と、前記音声認識手段によって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得するホームページ情報取得手段と、前記ホームページ情報に含まれているテキスト情報を、ブロック単位で抽出するテキスト情報抽出手段と、前記テキスト情報抽出手段によって抽出された各ブロックの属性情報を抽出する属性情報抽出手段と、前記属性情報抽出手段によって抽出された各ブロックの属性情報に応じて、各ブロックの音声化の順序を決定する音声化順序決定手段と、前記音声化順序決定手段の決定結果に基づいて、各ブロックに含まれるテキストを音声化する音声化手段と、を有することを特徴とする情報処理装置。
【請求項2】 前記属性情報は、文字のフォントサイズを示す情報であることを特徴とする請求項1記載の情報処理装置。
【請求項3】 前記属性情報は、各ブロックに含まれるテキストの文字数であることを特徴とする請求項1記載の情報処理装置。
【請求項4】 マークアップ言語で記述されたホームページ情報を読み込んでユーザに提供する処理をコンピュータに機能させるプログラムを記録したコンピュータ読み取り可能な記録媒体において、コンピュータを、ユーザからの電話機による呼を受け付ける呼受け付け手段、前記電話機から送信されてきたユーザの音声を認識する音声認識手段、前記音声認識手段によって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得するホームページ情報取得手段、前記ホームページ情報に含まれているテキスト情報を、ブロック単位で抽出するテキスト情報抽出手段、前記テキスト情報抽出手段によって抽出された各ブロックの属性情報を抽出する属性情報抽出手段、前記属性情報抽出手段によって抽出された各ブロックの属性情報に応じて、各ブロックの音声化の順序を決定する音声化順序決定手段、前記音声化順序決定手段の決定結果に基づいて、各ブロックに含まれるテキストを音声化する音声化手段、として機能させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項5】 マークアップ言語で記述されたホームページ情報を読み込んでユーザに提供する処理をコンピュータに機能させるプログラムにおいて、コンピュータを、ユーザからの電話機による呼を受け付ける呼受け付け手段、前記電話機から送信されてきたユーザの音声を認識する音声認識手段、前記音声認識手段によって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得するホームページ情報取得手段、前記ホームページ情報に含まれているテキスト情報を、ブロック単位で抽出するテキスト情報抽出手段、前記テキスト情報抽出手段によって抽出された各ブロックの属性情報を抽出する属性情報抽出手段、前記属性情報抽出手段によって抽出された各ブロックの属性情報に応じて、各ブロックの音声化の順序を決定する音声化順序決定手段、前記音声化順序決定手段の決定結果に基づいて、各ブロックに含まれるテキストを音声化する音声化手段、として機能させることを特徴とするプログラム。
【請求項6】 マークアップ言語で記述されたホームページ情報を読み込んでユーザに提供する処理を行う情報処理装置において、ユーザからの電話機による呼を受け付ける呼受け付け手段と、前記電話機から送信されてきたユーザの音声を認識する音声認識手段と、前記音声認識手段によって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得するホームページ情報取得手段と、前記ホームページ情報に含まれている所定の情報を、他の情報に置換する置換手段と、前記置換手段によって情報の置換がなされたホームページ情報を音声化する音声化手段と、を有することを特徴とする情報処理装置。
【請求項7】 前記置換手段は、テキスト情報以外の所定の情報を、テキスト情報に置換し、前記音声化手段は、前記置換手段によって置換されたテキスト情報を音声化する、ことを特徴とする請求項6記載の情報処理装置。
【請求項8】 前記置換手段は、音声情報以外の所定の情報を、音声情報に置換し、前記音声情報を再生する再生手段を更に有する、ことを特徴とする請求項6記載の情報処理装置。
【請求項9】 前記置換手段は、前記ホームページ情報と1対1に対応する管理情報を読み出し、その管理情報に応じて置換処理を実行することを特徴とする請求項6記載の情報処理装置。
【請求項10】 マークアップ言語で記述されたホームページ情報を読み込んでユーザに提供する処理をコンピュータに機能させるプログラムを記録したコンピュータ読み取り可能な記録媒体において、コンピュータを、ユーザからの電話機による呼を受け付ける呼受け付け手段、前記電話機から送信されてきたユーザの音声を認識する音声認識手段、前記音声認識手段によって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得するホームページ情報取得手段、前記ホームページ情報に含まれている所定の情報を、他の情報に置換する置換手段、前記置換手段によって情報の置換がなされたホームページ情報を音声化する音声化手段、として機能させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項11】 マークアップ言語で記述されたホームページ情報を読み込んでユーザに提供する処理をコンピュータに機能させるプログラムにおいて、コンピュータを、ユーザからの電話機による呼を受け付ける呼受け付け手段、前記電話機から送信されてきたユーザの音声を認識する音声認識手段、前記音声認識手段によって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得するホームページ情報取得手段、前記ホームページ情報に含まれている所定の情報を、他の情報に置換する置換手段、前記置換手段によって情報の置換がなされたホームページ情報を音声化する音声化手段、として機能させることを特徴とするプログラム。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は情報処理装置に関し、特に、マークアップ言語で記述されたホームページ情報を読み込んでユーザに提供する処理を行う情報処理装置に関する。
【0002】
【従来の技術】近年、インターネットの拡張とコンテンツの充実に伴い、種々の情報をネットワークからダウンロードして利用することが可能となりつつある。
【0003】
【発明が解決しようとする課題】ところで、インターネットを利用するには、例えば、パーソナルコンピュータを購入し、インターネット接続サービスを提供するいわゆるプロバイダと契約する必要があるため、ある程度の出費が必要である。また、パーソナルコンピュータの操作にある程度習熟している必要があるため、全ての人が簡易に利用できる状況にあるとは言い難い。
【0004】特に、インターネットでは視覚的な情報が主であるため、視覚に障害を有する者や、弱視者にとっては必ずしも実用性が高い情報源であるとは言い難い側面がある。
【0005】そこで、このような問題を解決するために、例えば、ホームページに記載されたテキスト情報を音声合成により音声化し、電話回線を通じてユーザの電話機から出力する方法も提案されている(特開平10−164249号公報参照)。
【0006】しかしながら、ホームページに掲載されている情報は、例えば、フォントの大きさなどによって、その重要度等が示されているが、テキストを単に音声化しただけではこれらの情報が喪失されてしまうという問題点があった。
【0007】また、視覚のみに依存する情報(例えば、画像等)が表示されている場合、その画像に関する情報は完全に喪失されてしまうという問題点があった。本発明はこのような点に鑑みてなされたものであり、インターネット上に存在する情報を、可能な限り情報量を減少させることなく音声化することを可能とする情報処理装置を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明では上記課題を解決するために、図1に示す、マークアップ言語で記述されたホームページ情報を読み込んでユーザに提供する処理を行う情報処理装置1において、ユーザからの電話機3による呼を受け付ける呼受け付け手段1aと、前記電話機3から送信されてきたユーザの音声を認識する音声認識手段1bと、前記音声認識手段1bによって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得するホームページ情報取得手段1cと、前記ホームページ情報に含まれているテキスト情報を、ブロック単位で抽出するテキスト情報抽出手段1dと、前記テキスト情報抽出手段1dによって抽出された各ブロックの属性情報を抽出する属性情報抽出手段1eと、前記属性情報抽出手段1eによって抽出された各ブロックの属性情報に応じて、各ブロックの音声化の順序を決定する音声化順序決定手段1fと、前記音声化順序決定手段1fの決定結果に基づいて、各ブロックに含まれるテキストを音声化する音声化手段1gと、を有することを特徴とする情報処理装置が提供される。
【0009】ここで、呼受け付け手段1aは、ユーザからの電話機3による呼を受け付ける。音声認識手段1bは、電話機3から送信されてきたユーザの音声を認識する。ホームページ情報取得手段1cは、音声認識手段1bによって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得する。テキスト情報抽出手段1dは、ホームページ情報に含まれているテキスト情報を、ブロック単位で抽出する。属性情報抽出手段1eは、テキスト情報抽出手段1dによって抽出された各ブロックの属性情報を抽出する。音声化順序決定手段1fは、属性情報抽出手段1eによって抽出された各ブロックの属性情報に応じて、各ブロックの音声化の順序を決定する。音声化手段1gは、音声化順序決定手段1fの決定結果に基づいて、各ブロックに含まれるテキストを音声化する。
【0010】また、マークアップ言語で記述されたホームページ情報を読み込んでユーザに提供する処理を行う情報処理装置において、ユーザからの電話機による呼を受け付ける呼受け付け手段と、前記電話機から送信されてきたユーザの音声を認識する音声認識手段と、前記音声認識手段によって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得するホームページ情報取得手段と、前記ホームページ情報に含まれている所定の情報を、他の情報に置換する置換手段と、前記置換手段によって情報の置換がなされたホームページ情報を音声化する音声化手段と、を有することを特徴とする情報処理装置が提供される。
【0011】ここで、呼受け付け手段は、ユーザからの電話機による呼を受け付ける。音声認識手段は、電話機から送信されてきたユーザの音声を認識する。ホームページ情報取得手段は、音声認識手段によって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得する。置換手段は、ホームページ情報に含まれている所定の情報を、他の情報に置換する。音声化手段は、置換手段によって情報の置換がなされたホームページ情報を音声化する。
【0012】
【発明の実施の形態】以下、本発明の実施の形態を図面を参照して説明する。図1は、本発明に係る情報処理装置の動作原理を説明する原理図である。この図に示すように、本発明に係る情報処理装置1は、呼受け付け手段1a、音声認識手段1b、ホームページ情報取得手段1c、テキスト情報抽出手段1d、属性情報抽出手段1e、音声化順序決定手段1f、および、音声化手段1gによって構成されている。
【0013】呼受け付け手段1aは、ユーザからの電話機3による「呼」を受け付ける。音声認識手段1bは、電話機3から送信されてきた音声を認識する。ホームページ情報取得手段1cは、音声認識手段1bによって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得する。
【0014】テキスト情報抽出手段1dは、ホームページ情報に含まれているテキスト情報を、ブロック単位で抽出する。属性情報抽出手段1eは、テキスト情報抽出手段1dによって抽出された各ブロックの属性情報を抽出する。
【0015】音声化順序決定手段1fは、属性情報抽出手段1eによって抽出された各ブロックの属性に応じて、それぞれのブロックの音声化の順序を決定する。音声化手段1gは、音声化順序決定手段1fの決定結果に基づいて、各ブロックに含まれるテキストを音声化し、公衆網2を介して電話機3に送信する。
【0016】なお、情報処理装置1は、公衆網2を介して電話機3に接続されている。公衆網2は、電話機3と情報処理装置1との間で音声信号を授受する。電話機3は、ユーザの発話を対応する電気信号に変換し、公衆網2を介して情報処理装置1に送信する。
【0017】インターネット4は、情報処理装置1とサーバ5との間でテキスト、画像、音声等の情報を伝送する。サーバ5は、WEBサーバであり、例えば、HTML等のマークアップ言語で記述されたホームページ情報を、情報処理装置1からの要求に応じて送信する。
【0018】次に、以上の原理図の動作について説明する。いま、ユーザが電話機3のハンドセットをオフフックし、情報処理装置1に付与された電話番号に対して発呼したとすると、公衆網2を介して発呼信号が情報処理装置1に対して送り届けられる。
【0019】呼受け付け手段1aは、電話機3からの呼を受け付ける。その結果、電話機3と情報処理装置1との間で通信回線が閉結され、これらの間で通信が可能になる。
【0020】このようにして通信回線が閉結された後、電話機3側のユーザが、例えば、「○×社のホームページへ接続」のように発話すると、この音声信号は公衆網2を介して音声認識手段1bに送り届けられる。
【0021】音声認識手段1bは、音声認識処理によりこの発話内容が、○×社のホームページへの接続要求であることを認知し、ホームページ情報取得手段1cにその旨を通知する。
【0022】ホームページ情報取得手段1cは、インターネット4を介して○×社のホームページ情報(例えば、HTMLによって記述された情報)を、サーバ5から取得する。
【0023】テキスト情報抽出手段1dは、ホームページ情報取得手段1cが取得したホームページ情報に含まれているテキスト情報を、ブロック単位で抽出する。例えば、取得した○×社のフロントページ(アクセス時に最初に表示されるページ)が3つのブロック(例えば、タイトル、メニュー、概要説明)から構成されている場合には、それぞれのブロックが個別に抽出される。
【0024】属性情報抽出手段1eは、テキスト情報抽出手段1dが抽出した各ブロックの属性情報を抽出する。ここで、属性情報とは、そのブロックの文字のフォントのサイズ、文字数、または、含まれているハイパーリンクの個数等であり、属性情報抽出手段1eは、各ブロックからこれらの属性情報を抽出する。
【0025】音声化順序決定手段1fは、属性情報抽出手段1eによって抽出された各ブロックの属性情報を参照し、それぞれのブロックの音声化の順序を決定する。例えば、音声化順序決定手段1fは、フォントのサイズが大きい順に各ブロックの音声化順序を決定する。即ち、サイズが大きいフォントで表示されている内容は、重要度が高いと推定されるので、フォントサイズが大きい順に音声化を行う。
【0026】音声化手段1gは、音声化順序決定手段1fによって決定された音声化順序に従って、ブロックを音声化する。その結果、いまの例では、フォントサイズが大きい順(例えば、タイトル、概要説明、メニューの順)に各ブロックが音声化されることになる。
【0027】音声化されたテキスト情報は、公衆網2を介して電話機3に伝送されるので、ユーザは、アクセス要求を行ったホームページに含まれているテキスト情報を、その重要度に応じた順序で聞くことができる。
【0028】以上に説明したように、本発明に係る情報処理装置によれば、インターネット上に存在するホームページ情報を、ユーザからの音声による要求に応じて取得し、取得したホームページに含まれているテキスト情報をブロック単位で抽出し、それぞれのブロックの属性情報に応じた順序で音声化するようにしたので、ユーザは、ホームページに含まれている情報をその重要度に応じた順序で聞くことが可能となる。
【0029】なお、以上の原理図では、フォントのサイズに応じてブロックの音声化順序を決定するようにしたが、例えば、ブロックに含まれているテキストの文字数に応じて音声化順序を決定することも可能である。
【0030】次に、本発明の実施の形態について説明する。図2は、本発明の実施の形態の構成例を示す図である。この図において、電話機10は、ユーザ側に設置され、ユーザの発話内容を対応する電気信号に変換し、公衆網11を介して情報処理装置12に送信するとともに、情報処理装置12から送信されてきた音声信号を、対応する音声に変換して出力する。
【0031】情報処理装置12は、公衆網11を介して電話機10から発呼がなされた場合には電話機10との間で通信回線を閉結し、ユーザからの音声による要求に応じたホームページ情報をサーバ17から取得し、所定の処理を施した後、音声化し、電話機10に対して送信する。
【0032】インターネット16は、サーバ17と情報処理装置12の間で、例えば、HTTP(Hyper Text Transfer Protocol)により、テキスト、画像、音声等からなるホームページ情報を送受信する。
【0033】サーバ17は、WEBサーバであり、HTML等で記述されたホームページ情報を記録しており、情報処理装置12からの要求に応じて、該当するページを読み出して提供する。
【0034】図3は、図2に示す情報処理装置12の詳細な構成例を示す図である。この図に示すように、情報処理装置12は、大別して、電話機10との間の処理を行う音声応答部13、ホームページ情報をダウンロードする制御を行うブラウジング部14、および、ダウンロードしたホームページ情報を解析するHTML解析部15によって構成されている。
【0035】ここで、音声応答部13は、音声認識部13a、ダイアル認識部13b、および、音声合成部13cによって構成されている。音声認識部13aは、電話機10からの音声信号を認識し、電話操作解析部14aに認識結果を通知する。
【0036】ダイアル認識部13bは、電話機10のダイアルが操作された場合には、その操作内容を認識し、電話操作解析部14aに通知する。音声合成部13cは、音声再生制御部14bの制御に従い、出力部15dから供給されるテキスト情報を該当する音声信号に変換し、公衆網11を介して電話機10に対して送信する。
【0037】また、ブラウジング部14は、電話操作解析部14a、音声再生制御部14b、ハイパーリンク制御部14c、および、同一URL内制御部14dによって構成されている。
【0038】電話操作解析部14aは、ユーザが音声またはダイアル操作によって行った要求を解析し、その解析結果を音声再生制御部14b、ハイパーリンク制御部14c、および、同一URL内制御部14dに通知する。
【0039】音声再生制御部14bは、音声合成部13cによる音声合成処理を制御する。ハイパーリンク制御部14cは、サーバ17に対して所定のホームページ情報の送信を要求する。
【0040】同一URL内制御部14dは、同一のホームページ内において、所定の行から次の行への移動や、他の段落への移動等を制御する。また、HTML解析部15は、構成要素解析部15a、バリアフリーHTML解析部15b、置換部15c、および、出力部15dによって構成されている。
【0041】構成要素解析部15aは、ホームページ情報の構成要素を解析する。バリアフリーHTML解析部15bは、ホームページ情報に拡張されたHTMLとしてのタグが含まれている場合にはこれを解析し、解析結果を構成要素解析部15aに通知する。
【0042】置換部15cは、ホームページ情報に含まれている所定の情報を、他の情報によって置換する処理を実行する。出力部15dは、構成要素解析部15aおよび置換部15cから供給されたホームページ情報を、音声合成部13cに対して供給する。
【0043】次に、本発明の実施の形態の動作について説明する。図4は、情報処理装置12が電話機10からの呼を受けて回線を閉結し、所定の処理を実行した後、回線を閉結するまでの処理の流れを説明するフローチャートである。このフローチャートが開始されると、以下の処理が実行される。
[S1]情報処理装置12は、ユーザからの呼を受けた(着呼した)場合には、ステップS2に進み、それ以外の場合には同一の処理を繰り返す。
[S2]電話操作解析部14aは、例えば、ユーザがダイアルを操作することにより送信されたパスワードを受信し、正当なユーザであるか否かのユーザ認証を行う。
【0044】なお、この認証処理は、省略することも可能である。
[S3]音声認識部13aがユーザの音声を入力した場合にはステップS4に進み、それ以外の場合には同一の処理を繰り返す。
[S4]音声認識部13aは、受信した音声の認識処理を実行する。
[S5]ブラウジング部14は、ステップS4における認識結果に該当する処理を実行する。なお、具体的には、所定のホームページへの接続要求がなされた場合には、ハイパーリンク制御部14cが該当するホームページのダウンロードを実行する。
[S6]情報処理装置12は処理を終了するか否かを判定し、終了する場合にはステップS7に進み、それ以外の場合にはステップS3に戻って同様の処理を繰り返す。
【0045】例えば、ユーザが電話機10のハンドセットをオンフックして通信回線を切断したか否かを判定し、切断した場合には処理を終了するとして、ステップS7に進む。
[S7]情報処理装置12は、電話機10との間に閉結された通信回線を切断する処理を実行する。
【0046】以上の処理によれば、ユーザが電話機10を介して発話した内容や、ダイアルの操作内容に応じた処理を、情報処理装置12に実行させることが可能となる。次に、図5を参照して本発明の第1の実施の形態の動作について説明する。本発明の第1の実施の形態では、ホームページ情報に含まれているテキスト情報を、ブロック単位で抽出し、各ブロックの属性情報に応じた順序で、それぞれのブロックを音声化する。このフローチャートが開始されると、以下の処理が実行される。
[S20]ハイパーリンク制御部14cは、ユーザが音声によって要求した所定のホームページ情報を、サーバ17に要求する。
【0047】例えば、ハイパーリンク制御部14cは、ユーザからの要求に応じて、図6に示すようなホームページ情報をサーバ17から取得するように要求する。なお、この例では、3つのセルからなる表がウィンドウ50の表示領域50aに表示されており、左端のセルは上下2つのセルに更に分割されている。また、左端の上側のセル50bには「選挙公示、立候補者者1400人」が表示されており、その下のセル50cには「選挙が公示された。午後4時・・・」が表示されている。中央のセルには、画像が表示され、また、右端のセル50dには、メニュー項目が列記されている。
【0048】[S21]構成要素解析部15aは、ハイパーリンク制御部14cの要求に応じて送信されてきたホームページ情報を入力し、タグによって囲繞された要素としてのエレメントに展開する。なお、エレメントはHTML文書における意味のかたまりを示し、また、エレメントは階層構造を有しているので、適当な階層によってHTML文書を分割した場合には、各エレメントはブロックと等しくなる。
【0049】図7は、図6に対応するHTML文書の一例を示す図である。この図に示すように、図6に示すホームページに対応するHTML文書は、属性を示すタグとテキスト情報とが組み合わされて形成されている。
【0050】構成要素解析部15aは、このようなホームページ情報を、エレメント毎に展開する。ここで図6の例では、「選挙公示、立候補・・・」と、「選挙が公示された。午後4時・・・」と、「●南北首脳会談・・・」とがそれぞれ異なるセルに格納されているので、別個のエレメントと認識される。
[S22]構成要素解析部15aは、全エレメントに対する処理が完了したか否かを判定し、完了した場合には処理を終了する。また、それ以外の場合には、ステップS23に進む。
[S23]構成要素解析部15aは、HTML文書に含まれているタグを解析する。
【0051】即ち、構成要素解析部15aは、それぞれのエレメントに属するタグに埋め込まれているフォントサイズ等の属性情報を解析する。具体的には、図6に示すタイトル「選挙公示、立候補・・・」の場合では、図7の第6行目に示すように、そのフォントサイズは、6(font size=”6”)であるので、これが取得される。
[S24]構成要素解析部15aは、それぞれのエレメントに含まれているテキストを解析する。
【0052】即ち、構成要素解析部15aは、それぞれのエレメントに含まれているテキストを解析し、その文字数等を取得する。
[S25]構成要素解析部15aは、ステップS23およびステップS24の解析結果に応じて、そのエレメントの読み上げ順位を決定し、エレメントテーブルに格納する。ここで、図6の例では、タイトル「選挙公示、立候補者・・・」のフォントサイズが“6”で最大であるので、このタイトルの順位が“1”となる。また、テキスト「選挙が公示された。午後4時・・・」およびメニュー「●南北首脳会談・・・」のフォントサイズは、それぞれ“3”,“2”であるので、それぞれの順位は“2”,“3”となる。
【0053】図8は、図6に示すホームページに対応するエレメントテーブルの一例である。この例では、図6の例を構成する各エレメントが、順位とともに格納されている。例えば、第1番目の項目は、図6の左上のタイトル「選挙公示、立候補者・・・」に対応しており、その順位は“1”とされている。
【0054】以上の処理により、ホームページ情報を構成するエレメントに対して、そのエレメントに含まれるテキスト情報の属性に応じた読み上げ順序が付与される。このようにして生成されたエレメントテーブルは、テキストデータとともに、出力部15dを介して音声合成部13cに供給される。
【0055】音声合成部13cは、エレメントテーブルを参照し、供給されたテキストデータを音声化する処理を実行する。いまの例では、エレメントテーブルにおいて順位が“1”である、図6に示す左端のセル50bのタイトルである「選挙公示、立候補・・・」が最初に音声化される。続いて、その下のセル50cの「選挙が公示された。午後4時現在・・・」が音声化され、最後に右端のセル50dの「●南北首脳会談・・・」が音声化されることになる。
【0056】以上に説明したように、本発明の実施の形態によれば、ホームページを構成するテキスト情報を、ブロック(エレメント)単位で分割し、それぞれのブロックに含まれているテキスト情報の属性に応じて、音声化の順番を決定するようにしたので、重要な情報を優先して音声化することが可能となる。
【0057】なお、以上の実施の形態では、フォントサイズを基準にして、各ブロックの音声化順序を決定するようにしたが、例えば、ブロックに含まれているテキストの文字数その他を基準にするようにしてもよい。
【0058】また、以上の実施の形態では、表のセルに含まれているテキスト情報を1つのブロック(エレメント)として扱うようにしたが、このような方法のみならず、例えば、隣接して配置されているテキスト情報は、1つのブロックとみなすようにしてもよい。
【0059】次に、本発明の第2の実施の形態について説明する。図9は、本発明の第2の実施の形態の動作を説明するフローチャートである。なお、第2の実施の形態の構成は、第1の実施の形態の場合と同様であるのでその説明は省略する。
【0060】このフローチャートが開始されると、以下の処理が実行される。
[S40]ハイパーリンク制御部14cは、ユーザが音声によって要求した所定のホームページ情報を、サーバ17から取得するように要求する。
【0061】例えば、ハイパーリンク制御部14cは、ユーザからの要求に応じて、図10に示すようなホームページ情報をサーバ17から取得するように要求する。なお、この例では、タイトル「今週のヒットチャート」が表示されるとともに、ヒットチャートにランクインした曲名と歌手の名前が第1位から第4位まで表示されている。
[S41]構成要素解析部15aは、ハイパーリンク制御部14cの要求に応じて送信されてきたホームページ情報を入力し、タグによって囲繞された要素としてのエレメントに展開する。
【0062】即ち、構成要素解析部15aは、図11に示すような対象となるホームページのHTML文書を取得し、このHTML文書に含まれているエレメント(タグによって囲繞された構成要素)を抽出し、エレメントテーブルを生成する。
【0063】図12は、生成されたエレメントテーブルの一例を示す図である。この例では、各エレメントに含まれているデータが、エレメント番号、サイズ、属性等と共に格納されている。
[S42]置換部15cは、構成要素解析部15aから解析結果を受け取るとともに、図示せぬ記憶部から該当するファイル置換テーブルを読み込む。
【0064】ここで、ファイル置換テーブルとは、ホームページに含まれている情報を他の情報に置換したり、ホームページに含まれている情報に新たな情報を付加するためのテーブルであり、図13にその一例を示す。この例では、図12に示す各エレメントに対応する曲が記録されたファイルのファイル名がエレメント番号に対応付けて格納されている。例えば、エレメント番号「ELE001」に対応する置換データは、「grand_son.mp3」であり、そのファイル形式は拡張子から「MP3」形式であることが分かる。
[S43]置換部15cは、ファイル置換テーブルを参照し、該当するエレメントのデータを置換する。
【0065】例えば、第1番目のエレメントの場合では、エレメントに含まれているデータ「1位 GRAND SON・・・」が、MP3形式の音楽データであるgrand_son.mp3に置換される。なお、置換せずに、MP3形式のファイルを付加することも可能である。
[S44]音声合成部13cは、置換がなされたホームページ情報の供給を受け、テキスト情報を音声化するとともに、置換によって新たに付加された音楽データがある場合には、その音楽データを再生する。
【0066】従って、以上の処理によって置換がなされた図10に示すホームページを音声化した場合、先ず、ウィンドウ60の表示領域60aに表示されている「今週のヒットチャート」が発話された後、ヒットチャートの第1位から第4位にランクインしている曲が順に再生されることになる。
【0067】なお、以上の実施の形態では、エレメントに含まれる一部のデータを音楽データに置換するようにしたが、置換せずにエレメントの末尾に音楽データを付加するようにしてもよい。そのような構成によれば、「1位 GRAND SON浅田明」が発話された後、音楽ファイル「grand_son.mp3」が再生されることになる。
【0068】また、以上の実施の形態では、ホームページ単位でファイル置換テーブルを準備し、サーバからホームページ情報が取得された場合には、該当するファイル置換テーブルを取得して置換処理を行うようにしたが、置換対象となるデータを、HTMLの拡張タグによって指示するようにしてもよい。
【0069】例えば、HTMLのタグを拡張してバリアフリータグ<BF>を定義し、このタグに対して追加しようとするファイルのファイル名を埋め込んでおくようにしてもよい。なお、このようにして埋め込まれたバリアフリータグは、通常のブラウザで閲覧する場合には、無意味なタグとして無視されるが、ポータルとしての情報処理装置12に対して、例えば、バリアフリーHTML解析部15bを具備しておき、このバリアフリーHTML解析部15bにより、バリアフリータグ<BF>を解析するようにすることもできる。
【0070】更に、以上の実施の形態では、テキスト情報を音声情報に置換するようにしたが、例えば、画像情報を直接音声情報に置換したり、画像情報を該当するテキスト情報(例えば、その画像を説明するテキスト情報)に置換し、音声合成部13cによって音声化するようにしてもよい。
【0071】最後に、上記の処理機能は、コンピュータによって実現することができる。その場合、情報処理装置が有すべき機能の処理内容は、コンピュータで読み取り可能な記録媒体に記録されたプログラムに記述されており、このプログラムをコンピュータで実行することにより、上記処理がコンピュータで実現される。コンピュータで読み取り可能な記録媒体としては、磁気記録装置や半導体メモリ等がある。市場へ流通させる場合には、CD−ROM(Compact Disk Read Only Memory)やフレキシブルディスク等の可搬型記録媒体にプログラムを格納して流通させたり、ネットワークを介して接続されたコンピュータの記憶装置に格納しておき、ネットワークを通じて他のコンピュータに転送することもできる。コンピュータで実行する際には、コンピュータ内のハードディスク装置等にプログラムを格納しておき、メインメモリにロードして実行する。
【0072】
【発明の効果】以上説明したように本発明では、マークアップ言語で記述されたホームページ情報を読み込んでユーザに提供する処理を行う情報処理装置において、ユーザからの電話機による呼を受け付ける呼受け付け手段と、電話機から送信されてきたユーザの音声を認識する音声認識手段と、音声認識手段によって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得するホームページ情報取得手段と、ホームページ情報に含まれているテキスト情報を、ブロック単位で抽出するテキスト情報抽出手段と、テキスト情報抽出手段によって抽出された各ブロックの属性情報を抽出する属性情報抽出手段と、属性情報抽出手段によって抽出された各ブロックの属性情報に応じて、各ブロックの音声化の順序を決定する音声化順序決定手段と、音声化順序決定手段の決定結果に基づいて、各ブロックに含まれるテキストを音声化する音声化手段と、を有するようにしたので、ホームページ情報を音声化する際に、文字の大きさ等の属性によって表現されているホームページ上の情報を、発話順序によって表すことが可能となる。
【0073】また、マークアップ言語で記述されたホームページ情報を読み込んでユーザに提供する処理を行う情報処理装置において、ユーザからの電話機による呼を受け付ける呼受け付け手段と、電話機から送信されてきたユーザの音声を認識する音声認識手段と、音声認識手段によって所定のホームページにアクセスする要求がなされたことが認識された場合には、対応するホームページ情報を取得するホームページ情報取得手段と、ホームページ情報に含まれている所定の情報を、他の情報に置換する置換手段と、置換手段によって情報の置換がなされたホームページ情報を音声化する音声化手段と、を有するようにしたので、例えば、画像情報を該当する音声情報に置換することにより、ホームページ情報を音声化する際に、情報の欠落を防止することができる。
【出願人】 【識別番号】000005223
【氏名又は名称】富士通株式会社
【出願日】 平成13年6月13日(2001.6.13)
【代理人】 【識別番号】100092152
【弁理士】
【氏名又は名称】服部 毅巖
【公開番号】 特開2002−91473(P2002−91473A)
【公開日】 平成14年3月27日(2002.3.27)
【出願番号】 特願2001−178781(P2001−178781)