トップ :: G 物理学 :: G06 計算;計数




【発明の名称】 音声合成システムとその方法
【発明者】 【氏名】殖栗 俊明

【氏名】相澤 道雄

【要約】 【課題】伝送可能なデータ量を示す許容量を登録しておき、その許容量の範囲内で送信されるデータに基づいて音声を再生する。

【解決手段】クライアント・サーバ型の通信を行って受信した情報を基に音声を再生する音声合成システムであって、クライアント200からの指示に従ってインターネットにアクセスしてホームページの情報を獲得するサーバ100であって、サーバ100は、ホームページの情報の中の更新された更新情報を新規情報検出部14で抽出し、ユーザ情報データベース11に、そのクライアントに送信するデータの伝送許容データ量が格納されていると、今回送信しようとしている更新情報のデータ量を基に伝送許容データ量と比較して、その更新情報をそのクライアントに送信可能かどうかを判断して送信するように動作する。
【特許請求の範囲】
【請求項1】 クライアント・サーバ型の通信を行って受信した情報を基に音声を再生する音声合成システムであって、クライアントからの指示に従ってインターネットにアクセスしてホームページの情報を獲得するサーバであって、前記サーバは、前記ホームページの情報の中の更新された更新情報を抽出する抽出手段と、クライアントに送信するデータの許容量を、各クライアントに対応して格納する格納手段と、前記抽出手段で抽出された前記更新情報を前記クライアントに送信する送信手段と、前記格納手段に格納された前記許容量に応じて前記送信手段による送信を制御する制御手段とを有し、前記クライアントは、前記送信手段により送信された前記更新情報を受信する受信手段と、前記受信手段により受信した前記更新情報を基に音声を生成する音声生成手段と、を有することを特徴とする音声合成システム。
【請求項2】 前記許容量は、所定時間内で送信するデータ量を規定することを特徴とする請求項1に記載の音声合成システム。
【請求項3】 前記許容量は、1回の送信で送信するデータ量を規定することを特徴とする請求項1に記載の音声合成システム。
【請求項4】 前記制御手段は、前記更新情報のデータ量を計算する計算手段と、前記計算手段により計算された前記データ量と前記許容値とを比較する比較手段とを有し、前記データ量が前記許容値よりも小さい場合に前記送信手段により前記更新情報を送信するように制御することを特徴とする請求項1又は3に記載の音声合成システム。
【請求項5】 更に、前記制御手段は、前記計算手段により計算されたデータ量の累積値を求める手段を有し、前記累積値と前記許容値とを比較して前記送信手段により前記更新情報を送信するか否かを決定することを特徴とする請求項1又は2に記載の音声合成システム。
【請求項6】 前記サーバは、前記更新情報をWAVEデータで送信することを特徴とする請求項1乃至5のいずれか1項に記載の音声合成システム。
【請求項7】 前記サーバは、前記更新情報を表音テキストデータで送信することを特徴とする請求項1乃至5のいずれか1項に記載の音声合成システム。
【請求項8】 前記サーバは、前記更新情報をテキストデータで送信することを特徴とする請求項1乃至5のいずれか1項に記載の音声合成システム。
【請求項9】 クライアント・サーバ型の通信を行って受信した情報を基に音声を再生する音声合成方法であって、クライアントからの指示に従ってインターネットにアクセスしてホームページの情報を獲得するサーバにおいて、クライアントに送信するデータの許容量を、各クライアントに対応して格納しておき、クライアントの指示に応じてアクセスして得たデータの量を計算し、前記許容量に応じて前記データを当該クライアントに送信するかどうかを判定し、前記クライアントでは、送られてきた前記データを受信し、その受信した前記データを基に音声を生成することを特徴とする音声合成方法。
【請求項10】 前記許容量は、所定時間内で送信するデータ量を規定することを特徴とする請求項9に記載の音声合成方法。
【請求項11】 前記許容量は、1回の送信で送信するデータ量を規定することを特徴とする請求項9に記載の音声合成方法。
【請求項12】 前記サーバは、前記更新情報をWAVEデータで送信することを特徴とする請求項9乃至11のいずれか1項に記載の音声合成方法。
【請求項13】 前記サーバは、前記更新情報を表音テキストデータで送信することを特徴とする請求項9乃至11のいずれか1項に記載の音声合成方法。
【請求項14】 前記サーバは、前記更新情報をテキストデータで送信することを特徴とする請求項9乃至11のいずれか1項に記載の音声合成方法。
【請求項15】 請求項9乃至14のいずれか1項に記載の音声合成方法を実施するプログラムを記憶したことを特徴とするコンピュータにより読取り可能な記憶媒体。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、例えばインターネット等を介して受信した情報を基に音声信号を再生する音声合成システムとその方法に関するものである。
【0002】
【従来の技術】従来より、パーソナルコンピュータ(クライアント:PC)等によりサーバ(proxy server)を介してインターネットのホームページにアクセスし、そこから得られた情報を、そのサーバを介してクライアント側で取得することが良く行われている。
【0003】この場合、サーバはユーザにより指定されたURLを用いてホームページにアクセスし、そのホームページに含まれているHTMLファイルを取得してクライアントに送信する。そのクライアントは、サーバより取得したHTMLファイルを画面上に表示し、そこに記憶されている映像やテキスト等を画面上に表示することができる。
【0004】この表示に際して、ホームページの内容を音声に変換して読み上げる技術があり、このような技術を実現するホームページ読み上げソフトウェアを使用することにより、ユーザが指定したホームページの内容を音声で聞くことができる。このホームページ読み上げソフトウェアによれば、ホームページの内容を先頭から末尾まで全て聞くことができる。
【0005】またインターネットにおける情報提供手段として、PointCastのようなPush型の情報提供システムが注目されている。このシステムの特徴としては、Webブラウザに代表されるように、文字や画像などの視覚的な閲覧を基礎としている。
【0006】
【発明が解決しようとする課題】上記システムにおいて、クライアントからの要求によりアクセスしたホームページ等の内容を全てクライアントに通知すると、その伝送されるデータ量が非常に多くなってしまい、それにより通話料金がかさむという問題がある。
【0007】本発明は上記従来例に鑑みてなされたもので、各クライアントに対して送信可能な許容量を登録しておき、その許容量以内で送信されるデータに基づいて音声を再生する音声合成システムとその方法を提供することを目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するために本発明の音声合成システムは以下のような構成を備える。即ち、クライアント・サーバ型の通信を行って受信した情報を基に音声を再生する音声合成システムであって、クライアントからの指示に従ってインターネットにアクセスしてホームページの情報を獲得するサーバであって、前記サーバは、前記ホームページの情報の中の更新された更新情報を抽出する抽出手段と、クライアントに送信するデータの許容量を、各クライアントに対応して格納する格納手段と、前記抽出手段で抽出された前記更新情報を前記クライアントに送信する送信手段と、前記格納手段に格納された前記許容量に応じて前記送信手段による送信を制御する制御手段とを有し、前記クライアントは、前記送信手段により送信された前記更新情報を受信する受信手段と、前記受信手段により受信した前記更新情報を基に音声を生成する音声生成手段とを有することを特徴とする。
【0009】上記目的を達成するために本発明の音声合成方法は以下のような工程を備える。即ち、クライアント・サーバ型の通信を行って受信した情報を基に音声を再生する音声合成方法であって、クライアントからの指示に従ってインターネットにアクセスしてホームページの情報を獲得するサーバにおいて、クライアントに送信するデータの許容量を、各クライアントに対応して格納しておき、クライアントの指示に応じてアクセスして得たデータの量を計算し、前記許容量に応じて前記データを当該クライアントに送信するかどうかを判定し、前記クライアントでは、送られてきた前記データを受信し、その受信した前記データを基に音声を生成することを特徴とする。
【0010】尚、前記更新情報は、新たに追加された新規情報、及び更新された情報をも含むものとする。
【0011】又前記許容量は、所定時間(例えば1日,1週間、1月、1年等)内で送信するデータ量を規定する値、又は1回の送信で送信するデータ量を規定する値である。
【0012】
【発明の実施の形態】以下、添付図面を参照して本発明の好適な実施の形態を詳細に説明する。
【0013】[実施の形態1]本実施の形態の特徴としては、クライアント・サーバ型のシステムを構築して音声合成処理をサーバとクライアントに振り分け、クライアントとして、例えばモバイル機器などのように規模の小さなコンピュータにシステムを搭載することを可能にし、更に、ホームページの更新された新規情報をPush型でユーザに音声で通知することにより、効果的に情報を提供する点にある。更に本実施の形態では、サーバから各クライアントに伝送するデータ量を、各クライアントに応じて設定された送信許容データ量の範囲内とする事を特徴としている。
【0014】図1は、本発明の一実施の形態に係る通信システムの構成を示すブロック図である。
【0015】図において、100は例えばプロキシ・サーバ(Proxy Server)等のサーバ、200はクライアントである。クライアント200は、サーバ100に各種URLを登録しておき、サーバ100は所定時間毎に、或はクライアントからのコマンドに応じて、そのURLを使用してインターネットのホームページにアクセスし、そこから得られた情報を、対応するクライアントに送信することができる。
【0016】まず最初にサーバ100の構成を説明する。
【0017】11はユーザ情報データベースで、各クライアントがアクセスしたいURLを、それぞれ対応するクライアントから受取って、それら各クライアントに対応して記憶している。サーバ100は、ユーザ情報データベース11に記述されたURLに定期的にアクセスしてHTMLファイルを取得する。新規情報検出部14は、その取得したHTMLファイルが、以前取得してコンテンツデータベース12に記憶されている同じHTMLファイルと比較して、新たに追加された新規情報、或は更新されている更新データがあるかどうかを判断する。そして、もし新規情報(更新データ)があれば、そのデータを新規情報データベース13に保存する。また、この取得したHTMLファイルをコンテンツデータベース12に保存する。15は新規情報送信部で、クライアントより送信されたデータを基に処理を行い、新規情報データベース13に入っている該当する新規情報を、対応するクライアントに送信する。17は伝送量監視部で、ユーザ情報データベース11に、クライアントに伝送するデータ量を示す伝送許容データ量が設定されていれば、そのクライアントへ通知する新規情報(更新データ)の伝送量を監視し、その設定されている伝送量を超えた時点で新規情報(更新データ)の通知を中止するように動作する。
【0018】次にクライアント200の構成について説明する。
【0019】16は新規情報受信部で、サーバ100の新規情報送信部15から送信された新規情報を受信する。21は音響出力部で、サーバ100から受信したWAVE形式のデータ、或はクライアント200で作成した音響信号に基づいて音声や音楽などを出力する。
【0020】図2は本実施の形態に係るユーザ情報データベース11のデータ例を示す図である。
【0021】このユーザ情報データベース11の設定項目としては、以下の9つの項目がある。
【0022】・ユーザ名 (クライアントを特定する。図では“nihon”)
・パスワード (図では“tarou”)
・通知モード (図では、モード“2”)
・URL・伝送制限量(1日、1月、1回当たりの最大伝送許容データ量)
ここでは1回当りの最大伝送許容データ量が1000バイト、1日当りの最大伝送許容データ量が50000バイト、そして1月当りの最大伝送許容データ量が1,000,000バイトに設定されている。
【0023】・総伝送量(1日、1月当たりのデータ伝送量の合計)
ここでは、この時点での1日の伝送データ量の合計(総伝送量)が20,000バイト、1月の伝送データ量の合計(総伝送量)が400,000バイトになっている。
【0024】なお、上記のURLは複数設定することができ、また伝送許容データ量は1日、1月、1回のそれぞれに設定できるものとする。また、この伝送許容データ量は省略することもできる。
【0025】図3は、本発明の実施の形態に係るクライアント200のハードウェア構成の概略を示すブロック図である。
【0026】図において、31はCPUで、RAM32に記憶された後述する手順を実現するプログラムに従って動作する。32はRAMで、上記プログラムの動作に必要な記憶領域を提供するとともに、ディスク装置34からロードされたアプリケーション・プログラムを記憶している。33はROMである。34はディスク装置で、各種プログラムがインストールされており、その実行に際してRAM32に転送されて格納される。35は出力部で、作成された音声を出力するスピーカや、更にはプリンタ等を備えてもよい。36は、回線を介してサーバ100との間で各種データをやり取りするネットワーク・インターフェース部である。37は表示部で、例えばCRTや液晶等を備えている。38は入力部で、キーボードやマウスなどのポインティングデバイスを備え、オペレータの操作により各種データを入力するのに使用される。39は上記の各構成を接続するバスである。
【0027】次に図4のフローチャートを参照して、本実施の形態1に係るサーバ100の新規情報送信部15の動作を説明する。この図4は、本実施の形態1に係るサーバ100による新規情報送信処理を示している。
【0028】まずステップS411で、クライアント200の新規情報受信部16から送信されてくるデータ(アカウント、パスワード)を抽出し、ユーザ情報データベース11を参照して、該当するユーザであるかを確認する。次にステップS412に進み、ステップS411のアカウントに該当するユーザが登録したURLのリストをユーザ情報データベース11から取り出し、その取り出したURLに基づいて、新規情報データベース13の該当するURLに新規情報があるかどうかを判断し、無ければ処理を終了するが、ある場合にはステップS414に進む。ステップS414では、その新規情報(テキスト情報)を言語処理して表音テキストを作成する。ここで表音テキストとは、アクセントやポーズを記述した音声を表す文字である。次にステップS415に進み、その表音テキストを音響処理してWAVE形式のデータを作成してステップS416に進む。ステップS416では、そのWAVEデータの送信を行うか否かを判定し、送信可能と判定した場合はS417に進み、その作成したWAVE形式のデータをクライアント200に送信する。一方、ステップS416で送信不可と判定した場合は、そのまま処理を終了する。
【0029】図5は、図4のステップS416のデータ送信可能判定処理を示すフローチャートである。
【0030】まずステップS51で、これからクライアント200に送信しようとしているデータの伝送データ量を計算する。そしてステップS52に進み、ユーザ情報データベース11に記憶されている、そのクライアントに対応する総伝送量(1日)と総伝送量(1月)のそれぞれに、ステップS51で計算した伝送量を加算してステップS53に進む。なお、これら総伝送量(1日)、総伝送量(1月)の値は、伝送量監視部17がそれぞれ1日ごと、1月ごとに“0”にリセットする。次にステップS53に進み、ステップS51で計算した伝送データ量と1回当りの伝送許容データ量とを比較する。ここで(伝送データ量)≦(1回当りの伝送許容データ量)であればステップS54へ移り、それ以外の場合は、そのデータを、そのクライアントに送信するのは不可と判定して処理を終了する。
【0031】ステップS54では、その日、1日の総伝送量と1日当りの最大伝送許容データ量とを比較する。ここで(1日の総伝送量)≦(1日当りの伝送許容データ量)の場合はステップS55に進み、それ以外の場合はデータ送信不可と判定して処理を終了する。そしてステップS55では、1月の総伝送量と1月当りの伝送許容データ量とを比較する。ここで(1月の総伝送量)≦(1月当りの伝送許容データ量)の場合は、前述のステップS415で作成されたWAVEデータを送信可能と判定して処理を終了するが、それ以外の場合はデータ送信不可と判定して処理を終了する。
【0032】以上説明したように本実施の形態1によれば、各クライアントが、例えば1回、1日,1月当りといったように、サーバからクライアントに伝送するデータ量を規定する伝送許容データ量を登録しておくことにより、サーバからクライアントに送られるデータの伝送量が多くなりすぎて通話料金が嵩むという問題を解決できる。
【0033】尚、本実施の形態1では、サーバ100でテキストからWAVEデータへの言語処理、音響処理を行うので、クライアントでは受信したWAVEデータをそのまま再生でき、読み上げ性能を向上させることができる。よって、この実施の形態1は、規模の小さな(処理能力の低い)クライアントに向いている。
【0034】[実施の形態2]次に本発明の実施の形態2について説明する。この実施の形態2では、サーバ100からクライアント200に伝送するデータを、前述の実施の形態1のWAVEデータでなく、表音形式のデータとしている。
【0035】図6は、本実施の形態2に係るサーバ100による新規情報送信処理を示すフローチャートである。
【0036】まずステップS421で、クライアント200の新規情報受信部16から送信されてくるデータ(アカウント、パスワード)を分離し、該当するユーザであるかを確認してステップS422に進み、ステップS421のアカウントに該当するURLを取り出してステップS423に進む。ステップS423では、新規情報データベース13の該当するURLに新規情報(更新データ)があるかどうかを判断し、ある場合にはステップS424に進み、その新規情報を言語処理して表音テキストを作成してステップS425へ移る。ステップS425では、前述の図5のフローチャートと同様に、データ送信を行うか否かを判定し、送信可と判定した場合はステップS426に進み、ステップS424で作成した表音テキストをクライアント200に送信する。又ステップS425で送信不可と判定した場合は処理を終了する。
【0037】以上説明したように本実施の形態2によれば、前述の実施の形態1の効果に加えて、サーバで言語処理を行って表音テキスト形式でクライアントに送信するので、サーバからクライアントに送信するデータ量を少なくできる。尚、この場合は、クライアントで表音テキストから音響信号を生成するので比較的規模の大きな(処理能力の高い)クライアントに向いている。
【0038】[実施の形態3]次に本発明の実施の形態2について説明する。この実施の形態2では、サーバ100からクライアント200に伝送するデータを、前述の実施の形態1,2のようにWAVEデータや表音テキストデータではなく、元のテキストデータとしている。
【0039】図7は、本実施の形態3に係るサーバ100による新規情報送信処理を示すフローチャートである。
【0040】まずステップS431で、クライアント200の新規情報受信部16から送信されてくるデータ(アカウント、パスワード)を分離し、該当するユーザであるかを確認してステップS432に進み、ステップS431のアカウントに該当するURLを取り出してステップS433に進む。ステップS433では、新規情報データベース13の該当するURLに新規情報(更新データ)があるかどうかを判断し、ある場合にはステップS434に進み、前述の図5のフローチャートと同様に、そのクライアントにデータ送信を行うことができるか否かを判定し、送信可と判定した場合はステップS435に進み、元のテキストデータをクライアント200に送信する。又ステップS434で送信不可と判定した場合は処理を終了する。
【0041】以上説明したように本実施の形態3によれば、前述の実施の形態1,2の効果に加えて、テキストデータをクライアントに送信するので、サーバからクライアントへの送信データ量を少なくできる。
【0042】この場合、クライアントではテキストデータから表音テキストデータを作成し、更にWAVEデータを作成して音声を再生するので、規模の大きな(処理能力の高い)クライアントに向いている。
【0043】尚、上記実施の形態においては、各部を同一の計算機上で構成する場合について説明したが、これに限定されるものではなく、複数の計算機上で実現してもよい。
【0044】また、上述の実施の形態は、それぞれ独立に説明したが本発明はこれに限定されるものでなく、それぞれ独立に実施されても、或はそれぞれ組み合わされて実施されてもよい。
【0045】なお、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても達成される。
【0046】この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
【0047】プログラムコードを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることが出来る。
【0048】また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOSなどが実際の処理の一部または全部を行い、その処理によって前述した実施の形態の機能が実現される場合も含まれる。
【0049】更に、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。
【0050】以上説明したように本実施の形態によれば、予め各クライアント毎に、所定時間内(例えば1日、1月、1回当たりなど)に送信する最大伝送許容データ量を登録しておくことにより、サーバからクライアントに伝送するデータ量が多くなりすぎて通話料金が嵩むという事態を防止できる。
【0051】
【発明の効果】以上説明したように本発明によれば、伝送可能なデータ量を示す許容量を登録しておき、その許容量の範囲内で送信されるデータに基づいて音声を再生することができる。
【出願人】 【識別番号】000001007
【氏名又は名称】キヤノン株式会社
【出願日】 平成13年4月16日(2001.4.16)
【代理人】 【識別番号】100076428
【弁理士】
【氏名又は名称】大塚 康徳 (外3名)
【公開番号】 特開2002−312282(P2002−312282A)
【公開日】 平成14年10月25日(2002.10.25)
【出願番号】 特願2001−117370(P2001−117370)