トップ :: G 物理学 :: G06 計算;計数




【発明の名称】 意思伝達方法及び意思伝達システム
【発明者】 【氏名】鎌田 幹夫

【要約】 【課題】コンピュータによる意思伝達システムを構築する際の障害を無くし、情報表現をパラレルな情報に対応可能にして冗長性の削減と情報の記述もれを無くし、論理演算能力の有効活用をも可能とし、意思伝達の際の普遍性を高める。

【解決手段】送信側では送信側独自の言語で表した意思伝達内容を言語入力装置22に入力する。入力された言語は、自動翻訳器24により多言語に共通する文章構造体として表したコード情報に変換される。この文章構造体を構成する際には、意思伝達内容に対応したコード情報を複数関連付けると共に、当該文章構造体を解析して冗長度及び論理的矛盾を除去した形態に変換する。一方、受信側では、情報媒体2よりコード情報として伝送されてくる送信側からの意思伝達内容を、文章構造体から受信側独自の言語に変換する自動翻訳器25により、受信側独自の言語に変換される。
【特許請求の範囲】
【請求項1】 送信側では送信側独自の表現形態で表した意思伝達内容を多言語に共通する文章構造体として表したコード情報に変換し、受信側では上記コード情報として伝送されてくる送信側からの意思伝達内容を上記文章構造体に基づいて受信側独自の表現形態に変換する意思伝達方法であって、上記文章構造体を構成する際には、上記意思伝達内容に対応したコード情報を複数関連付けると共に、当該文章構造体を解析して冗長度及び論理的矛盾を除去した形態に変換することを特徴とする意思伝達方法。
【請求項2】 送信側独自の表現形態で表された意思伝達内容を入力する入力手段と、上記入力手段により入力された意思伝達内容を多言語に共通する文章構造体として表したコード情報に変換する送信側変換手段と、上記送信側変換手段により変換されたコード情報を出力する出力手段とを有する送信側端末装置と、上記送信側端末装置の出力からコード情報が出力される通信媒体と、上記通信媒体を介して送信側端末装置から伝送されてくるコード情報を受信する受信手段と、上記受信手段により上記コード情報として受信した送信側からの意思伝達内容を上記文章構造体に基づいて受信側独自の表現形態に変換する受信側変換手段と、上記受信側変換手段により変換された送信側からの意思伝達を受信側独自の表現形態で出力する出力手段とを有する受信側端末装置とを備えてなり、上記送信側端末装置の送信側変換手段は、文章構造体を構成する際に、上記意思伝達内容に対応したコード情報を複数関連付けると共に、当該文章構造体を解析して冗長度及び論理的矛盾を除去した形態に変換することを特徴とする意思伝達システム。
【請求項3】 上記送信側端末装置から送信側独自の表現形態で表された意思伝達内容を上記多言語に共通する文章構造体として表したコード情報に変換して、上記伝達媒体を介して接続された複数の受信側端末装置に伝送することを特徴とする請求項2記載の意思伝達システム。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、例えば自動翻訳器などに好適な意思伝達方法及び意思伝達システムに関する。
【0002】
【従来の技術】異種言語間の意思伝達は、一般に通訳者、翻訳者を介して行われる。また、異種言語が使用されるデータ通信のネットワークを介して意思伝達を行う場合において、例えば、インターネットなどを介する場合には、受信側の通信端末に自動翻訳器(翻訳ソフトウエア等も含む)を用いて行われている。
【0003】なお、この明細書において言語とは、音声または文字を手段とする日本語、英語等の自然言語のみならず、人の思想、意思または感情等を伝達する手段すべてを含むものとする。例えば、ダイアグラム、手話、点字、モールス信号、シンボル(図形、音など)、記号及びグラフィックス、アニメーション、ロボットの動作なども含むものとする。また、自動翻訳とは、通訳者、翻訳者などの人間を介して行わない、一の言語から同一の意味内容の他の言語への変換をいうものとする。
【0004】以下、従来のデータ通信の分野における異種言語間の意思伝達システムの一例を添付図面を用いて説明する。
【0005】図6は、使用言語の異なるユーザー間において、従来の通信端末と通信媒体を介してユーザー間の意思伝達を行う意思伝達システムの構成の一例を示している。
【0006】この図6において、意思伝達システム101は、使用言語Aのユーザー111が使用する通信端末103と、使用言語Bのユーザー112が使用する通信端末104と、使用言語Cのユーザー113が使用する通信端末105と、使用言語Dのユーザー114が使用する通信端末106と、各通信端末103、104、105、106の通信の媒介する通信媒体102とを備える。
【0007】ユーザー111は、言語Aを使用し、言語の異なる他のユーザーと意思伝達を行う。また、ユーザー112は言語B、ユーザー113は言語C、ユーザー114は言語Dをそれぞれ使用し他のユーザーと意思伝達をする。
【0008】通信端末103は、ユーザー111から入力された言語Aを、通信可能な言語データに変換し通信媒体102に供給する。ここで、通信可能な言語データとは、例えばアスキーコード等である。
【0009】また、通信端末103は、他の言語を使用するユーザーの通信端末104、105、106から供給されたそれぞれの言語データを受信し、ユーザー111に言語Aで出力する。
【0010】通信媒体102は、通信端末から供給された言語データを他の通信端末に転送可能なものであって、その転送手段は問わない。
【0011】図7は、従来の通信端末の構成図である。通信端末103は、言語入力装置122と、言語出力装置123と、スイッチ回路124と、言語BからAへ言語を変換する自動翻訳器125と、言語CからAへ言語を変換する自動翻訳器126と、言語DからAへ言語を変換する自動翻訳器127と、モデム121とを備える。
【0012】言語入力装置122は、ユーザー111が伝達したい意思を言語Aにより入力する装置である。一般にこの入力装置122にはキーボードが使用される。入力された言語は、ディジタル情報である言語データに変換されてモデムに供給される。
【0013】自動翻訳器125は、モデムから供給された言語Bの言語データを言語Aの言語データに変換する自動翻訳器である。自動翻訳器126、127は、同様に言語C、Dから言語Aに変換する自動翻訳器である。
【0014】スイッチ回路124は、他の通信端末から受信する言語B、C、Dに基づき、図示しないCPU等により切り換えられる。
【0015】従って、モデム121から供給された言語データの種類により、自動翻訳器125、126、127のいずれかがスイッチ回路124により選択され、選択された自動翻訳器により言語Aの言語データに変換される。
【0016】自動翻訳器125、126、127から供給された言語データは言語出力装置123に供給され、言語出力装置123により言語Aが出力される。言語出力装置123は、他のユーザーから伝達された意思を言語Aにより出力する装置である。一般にこの言語出力装置123はディスプレイ(CRT)が使用される。
【0017】モデム121は、情報媒体102と通信端末103のデータ通信を仲介する変復調器である。
【0018】また、通信端末104、105、106は通信端末103と自動翻訳器の部分が、それぞれのユーザーの使用言語に言語を変換している点で異なるが、その他の構成は同じである。
【0019】また、上記従来例の意思伝達システムにおいては、意思伝達を行うユーザーがすべて異なる言語を使用している場合を示している。しかしながら、意思伝達を行うユーザーに同種言語を使用するユーザーが含まれている場合においては、通信端末103は、モデム121から自動翻訳器を介さず言語出力装置123に言語データを供給する無翻訳端末を備える。例えば、使用言語Aであるユーザー111が、他のユーザーと言語Aにより意思伝達を行う場合である。係る場合、通信端末103のスイッチ回路124は、前記無翻訳端末を選択する。この結果、モデム121は、受信した言語Aの言語データをそのまま言語出力装置123に供給する。言語出力装置123は、供給された言語Aのデータに基づきユーザー111に言語Aの言語出力をする。
【0020】なお、上述データ通信の分野における異種言語間の意思伝達システムは、一般に翻訳ソフトウエアを備えたパーソナルコンピュータ(以下 パソコンという。)を通信端末として使用し、電話回線等の公衆回線や専用線を通信媒体としたネットワークであるインターネットやパソコン通信等の場などで実現されている。
【0021】
【発明が解決しようとする課題】ところで、象形文字に見られるように、言語はそもそも実在の対象物をシンボル化した記号によって構成されていた。かつての言語は、このような素朴な記号故に、高い普遍性を有していたと言える。その後、社会の発展に伴い、そのシンボルはより抽象化、特殊化、習慣化するという方向で発展し、それぞれの言語圏内の人々にとっての非常に高度なコミュニケーションツールとして出来上がっていった。しかしながら、その結果として、かつての言語が有していた本来の普遍性は大きく失われてしまっている。
【0022】近年、国際交流が盛んになるにつれ、この非普遍性が国際コミュニケーションの大きな障害となっている。いかに言語情報が電子化され、インターネット上で通信されたとしても、従来の言語を用いた情報媒体そのものは、極論すれば単なるキャラクタ(character)の羅列にすぎない。すなわち、それ自身、単独では意味を持たず、用いられた言語の文法、辞書を活用して始めてその意味を生じるのである。したがって、ある言語についてそれとは異なる言語圏の人々にとっての情報量は、無いと言ってよい。
【0023】以上の事実は、例えば前述の図6や図7に示したような自動翻訳器を備えた意思伝達システム(自動翻訳システム)を構築する際に、顕著な障害として現れる。すなわち、例えば言語Aから他の言語Bへの変換(翻訳)に当たっては、先ず言語Aによって記述された文章(その具体的実体は、前記アスキーコードのようなコンピュータ上のあるコードの集合である)を、言語Aに関する文法及び辞書を活用することによってその意味を推定し、その意味を基に言語Bに関する文法及び辞書を活用することによって言語Bによる表現を得る。しかしこの時、言語Aで記述されたコードの集合から、その意味を正確に推定することは極めて難しく、これが自動翻訳システム(意思伝達システム)を構築する際の大きな障害となっている。これは、まさに、「コンピュータ上の情報の具体的実体であるところのコードが、それ単独では意味を有していない」ということに起因している。
【0024】以上は、異なる2言語間の自動翻訳システム(意思伝達システム)を例に挙げているが、言語以外のいかなる情報表現を用いた場合でもその状況は変わらない。すなわち、何らかの手段(例えば、日本語、英語、ブロックダイアグラム、手話、アニメーションなど)で表現された情報を、他の情報に変換する意思伝達システムを構築する場合の大きな障害は、上述のように「コンピュータ上の情報の具体的実体であるところのコードが、それ単独では意味を有していない」ということに起因している。
【0025】また、言語表現では、何らかの情報要素を論理的に結びつけ、最終的には時間的にシリアルな形態で出力することになる。これは、そもそも言語が、時間的な流れのなかで出来上がったためである。したがって、その言語をそのまま筆記した場合であっても、当該言語表現が時間的にシリアルな形態に対応しているため、その論理構造がシリアルであることに変わりはない。従来のコンピュータ上の情報表現も基本的にはこのようなシリアルな形態に対応している。しかしながら、情報そのものは本質的にシリアルであるわけではない。すなわち、実際の情報はむしろパラレルに起こっているものの方が多く、従来のコンピュータ上の情報表現では、それを無理矢理シリアルな形態で表現するために、多大な努力が払われ、しかも冗長度が増し、また十分に記述し得ない情報も発生している。
【0026】さらに、コンピュータ上に記録された情報は、本来、コンピュータの論理演算能力によって、より有益な形態に変換し得るものである。しかしながら、前述したように、「コンピュータ上の情報の具体的実体であるところのコードが、それ単独では意味を有していない」が故に、記録された情報の意味を推定することそのものが難しくなっている。その結果、実際上、コンピュータの論理演算能力を活用することができない。
【0027】そこで、本発明はこのような状況に鑑みてなされたものであり、コンピュータによって意思伝達を行うためのシステムを構築する際の障害を無くし、また、コンピュータ上の情報表現をパラレルな情報に対応可能にして冗長性の削減と情報の記述もれを無くし、さらに、コンピュータの論理演算能力の有効活用をも可能とし、コンピュータによる意思伝達の際の普遍性を高めることができる意思伝達方法及び意思伝達システムを提供することを目的とする。
【0028】
【課題を解決するための手段】本発明の意思伝達方法は、送信側では送信側独自の表現形態で表した意思伝達内容を多言語に共通する文章構造体として表したコード情報に変換し、受信側ではコード情報として伝送されてくる送信側からの意思伝達内容を文章構造体に基づいて受信側独自の表現形態に変換するものであって、文章構造体を構成する際には、意思伝達内容に対応したコード情報を複数関連付けると共に、当該文章構造体を解析して冗長度及び論理的矛盾を除去した形態に変換することにより、上述した課題を解決する。
【0029】また、本発明に係る意思伝達システムは、送信側独自の表現形態で表された意思伝達内容を入力する入力手段と、当該入力された意思伝達内容を多言語に共通する文章構造体として表したコード情報に変換する送信側変換手段と、当該変換されたコード情報を出力する出力手段とを有する送信側端末装置と、送信側端末装置の出力からコード情報が出力される通信媒体と、通信媒体を介して送信側端末装置から伝送されてくるコード情報を受信する受信手段と、当該受信した送信側からの意思伝達内容を文章構造体に基づいて受信側独自の表現形態に変換する受信側変換手段と、当該変換された送信側からの意思伝達を受信側独自の表現形態で出力する出力手段とを有する受信側端末装置とを有してなり、送信側変換手段は、文章構造体を構成する際に、意思伝達内容に対応したコード情報を複数関連付けると共に、当該文章構造体を解析して冗長度及び論理的矛盾を除去した形態に変換することにより、上述した課題を解決する。
【0030】すなわち、本発明に係る自動翻訳器は、一のユーザーの使用する所定の言語から文章構造体に変換すると共に、複数のコード情報を互いに関連付ける体系を作る。また、文章構造体から一のユーザーの使用する所定の言語に変換する。
【0031】ここで文章構造体とは、どの言語においても存在する文法構造を共通化したものであり、その表現は、単語、絵、シンボルをダイヤグラム風に配置したものであってもかまわない。
【0032】
【発明の実施の形態】以下、本発明の好ましい実施の形態について、図面を参照しながら説明する。
【0033】本発明では、コンピュータによる意思伝達において、言語が本来持っていた普遍性という重要な性質を取り入れ、情報媒体とそれ自身が明確な意味を持つ新しい意思伝達システムを構築している。これは、コンピュータによる究極の世界共通言語とも言えるものである。
【0034】先ず、本発明の説明を分かり易くするために、一般的なコンピュータ上の電子情報が有する意味について述べることにする。
【0035】例えば「このアイデアは、素晴らしい。」という日本語を例に挙げて説明する。
【0036】上記日本語表現は、一般的なコンピュータ上ではある種の約束に基づいてコード化される。そのコードとして16進表現では、次のコード列のようになる。
【0037】”82 b1 82 cc 83 41 83 43 83 66 83 4182 cd 81 43 91 66 90 b0 82 e7 82 b582 a2 81 44”これらは、二つ一組で日本語の一つのキャラクタと対応している。このコード列が、意味を発生するには、以下の3つのプロセスが必要である。
【0038】第1のプロセスでは、コード表に従い、対応したキャラクタを決定する。これによりワード(word)が決定し、センテンス(sentence)が決定する。
【0039】第2のプロセスでは、辞書に相当するデータベースにより、各ワードの意味を検索する。
【0040】第3のプロセスでは、文法に従って、センテンスを解釈する。
【0041】コンピュータ内の処理である第1のプロセスは、単にセンテンスの決定が行われるだけであり、このコード列が意味を生じるのは、それ以降のプロセス(第2,第3のプロセス)すなわち人間が行うプロセスによってである。つまり、これらのコード列単独では意味を持っていない。実際、上記第1のプロセスで決定された日本語のキャラクタを日本語圏以外の人に表示しても、何の意味も生じないことは明らかである。
【0042】これに対して、本発明では、コンピュータが扱う電子情報の要素そのものを、直接意味(意思伝達内容)と対応させるようにしている。
【0043】すなわち、上述同様の「このアイデアは、素晴らしい。」という日本語を例に挙げて説明すると、当該日本語表現の文章のうち、「この」、「アイデア」、「は」、「素晴らしい」、という意味に対してそれぞれ特有のコードを定義する。当該特有のコードとして、「この」に”3e”を、「アイデア」に”f5”を、「は」に”83”を、「素晴らしい」に”2b”を対応つけるとする。したがって、「このアイデアは、素晴らしい。」は”3e,f5,83,2b”となる。なお、ここで注意すべき点は、「は」に対応する”83”というコードは、日本語のキャラクタであるところの「は」に対応しているのではなく、記号で言うところの「=」、英語で言うならば「is」といった意味に対応していることである。他のコードについても同様である。文法に相当する”コード間の関連”についての決まり(後述参照)を設ければ、上記コード列”3e,f5,83,2b”は、「このアイデアは、素晴らしい。」という意味に一意に対応する。すなわち、コンピュータ上の電子情報そのものが意味を持つのである。前述の一般的なコンピュータにおけるコード列(”82 b1 82 cc 83 41 8343 83 66 83 41 82 cd 81 43 91 66 90b0 82 e7 82 b5 82 a2 81 44”)が単なるキャラクタの羅列にしか対応していなかったことと比べ、根本的な違いである。
【0044】以下、非常に簡単なモデルを用いて、本発明の説明を段階的に行っていく。ここで取り上げるモデルは、説明用の極めて小さなものである。また、情報媒体を結びつけるところの文章構造体については、先ず初めに通常の文章体系に相当するところのシリアル形式のものについて述べ、その後、パラレルに拡張したものの説明を行う。
【0045】先ず、本発明の意思伝達を実現するための「意味対コード変換表」について説明する。
【0046】本実施の形態の「意味対コード対応表」は、世界共通のものであり、あらゆるワードに相当するものをコード化してなる。図1には、非常に簡略化した「意味対コード変換表」の一例として日本語コード表を示す。
【0047】この図1において、コード表1は、ワードを名詞、動詞、形容詞、・・・などの品詞に分類するものであり、例えば、”動詞”には”001”のコードを、”形容詞”には”010”のコードを、”副詞”には”011”のコードを、”疑問詞”には”100”のコードを、”感嘆詞”には”101”のコードを、”前置詞”には”110”のコードを、”名詞”には”111”のコードを対応付けている。
【0048】コード表2は、動詞に対する時制を過去、過去進行、現在完了、・・・などに分類するものであり、例えば、”過去”には”001”のコードを、”過去進行”には”010”のコードを、”現在完了”には”011”のコードを、”現在”には”100”のコードを、”現在進行”には”101”のコードを、”未来”には”110”のコードを、”未来進行”には”111”のコードを対応付けている。
【0049】ここで、コード表1の分類はさらに階層化することができる。例えば、「名詞¥生物¥動物¥キリン」のようにである。しかし、ここでの説明では、階層化を簡略化した例に留める。
【0050】例えば名詞のコードは、コード表3のようにさらに単語毎に分類される。このコード表3において、例えば、「飛行機」には”001”のコードを、「鳥」には”010”のコードを、「とんぼ」には”011”のコードを、「私」には”100”のコードを、「キリン」には”101”のコードを、「地球」には”110”のコードを、「海」には”111”のコードを対応付けている。
【0051】以下同様であり、コード表4には動詞をさらに単語毎に分類した例を示し、このコード表4において、例えば、「ぶつかる」には”001”のコードを、「飛ぶ」には”010”のコードを、「壊れる」には”011”のコードを、「流れる」には”100”のコードを、「捕らえる」には”101”のコードを、「見る」には”110”のコードを、「走る」には”111”のコードを対応付けている。
【0052】コード表5は、形容詞をさらに単語毎に分類したものであり、例えば、「軽い」には”001”のコードを、「きれいな」には”010”のコードを、「重い」には”011”のコードを、「大きい」には”100”のコードを、「長い」には”101”のコードを、「青い」には”110”のコードを、「鋭い」には”111”のコードを対応付けている。
【0053】コード表6は、副詞をさらに単語毎に分類したものであり、例えば、「急に」には”001”のコードを、「美しく」には”010”のコードを、「素早く」には”011”のコードを、「強く」には”100”のコードを、「静かに」には”101”のコードを対応付けている。
【0054】上述のようにして、必要な意味情報を全てコード化する。ただし、この階層化は、一つの例であり、全く別の方法で階層化してもかまわない。極端な場合としては、階層化しないコード変換方式もあり得る。もちろん、階層化したほうが実用的であると思われる。
【0055】上記図1のコード表は日本語コード表であるが、その他の言語、例えば英語コード表は図2に示すようなものとなる。この図2において、CODE Table1(コードテーブル1)は、図1のコード表1と同じ例を英語表記にて挙げた品詞のコード表を表しており、以下同様に、CODE Table2(コードテーブル2)は、図1のコード表2と同じ例を英語表記にて挙げた時制のコード表を、CODE Table3(コードテーブル3)は、図1のコード表3と同じ例を英語表記にて挙げた名詞の単語分類コード表を、CODE Table4(コードテーブル4)は、図1のコード表4と同じ例を英語表記にて挙げた動詞の単語分類コード表を、CODE Table5(コードテーブル5)は、図1のコード表5と同じ例を英語表記にて挙げた形容詞の単語分類コード表を、CODE Table6(コードテーブル6)は、図1のコード表6と同じ例を英語表記にて挙げた副詞の単語分類コード表を、それぞれ表している。
【0056】ここで、上述したような「意味対コード変換表」を用いた場合において、例えば、「きれいな鳥が、飛行機にぶつかった。」という日本語の文章が意味する内容について考えてみる。この内容を本発明実施の形態では以下のような文章構造体として表現する。
【0057】S:[きれい→鳥][ぶつかる/過去][飛行機]
上記Sは一つのまとまった意味を持つ文章構造体であり、S:はこれ以下がその内容であることを表す。[ ][ ][ ]はそれぞれの順で、文章で言うところの主語、述語、目的語に対応する。→は当該→の左側が右側を修飾することを表す。つまり、→の左側には形容詞や副詞が、右側には名詞や動詞が位置する。/は動詞に対する時制を追加することを表す。
【0058】以上のように文章構造体を定義してゆくことによって、いかなる言語で表現されたものでも、その内容をこの文章構造体として書き表すことが可能になる。
【0059】このような文章構造体に対して実際の文章を入力する際には、[ ]内が空欄の一般的な文章構造体を用意しておき、その空欄を埋めて行くようにする。ここで、[ ]内に入力されるべき内容は文字である必要はなく、例えば絵であったりしてもよく、何れのものを入れるかは、本実施の形態のコンピュータによる意思伝達システムがデータベースとして持っているものの中から選択することになる。なお、本実施の形態のコンピュータによる意思伝達システムの構成については後述する。上記例は一つの例であるが、文章のコンテンツが非常に分かり易い形式で表現されたものが、本発明でいう文章構造体である。
【0060】本実施の形態のコンピュータによる意思伝達システムに対して上記入力された情報は、前述したようなコード表によるコード化によって適当なディジタル情報に変換されることになる。この情報を受け取る側も同等のコード体系を所有し、そのコードをもって意味を認識することができる。また、当該情報を受け取った側の出力は、前記文章構造体にと同じ形式でもよいし、それを何らかの言語に直したもの、ダイアグラム、手話、点字、モールス信号、シンボル(図形、音など)、アニメーション、ロボットの動作など、その他何でもよい。例えば、”001”というコードが日本語でいう「象」に対応しているとすると、日本語圏の意思伝達システムの自動翻訳器では”001”の文字に「象」と「象の絵」を対応させておき、英語圏の意思伝達システムの自動翻訳器では”001”のコードに文字の「elephant」と「象の絵」を対応させておくようにする。
【0061】このような世界共通のコード体系によって、情報の意味そのものがやり取りされることになる。一度このような表現にしてしまえば、いかなる言語にも翻訳することは容易である。
【0062】より具体的に説明すると、前記「きれいな鳥が、飛行機にぶつかった。」という文章を、前記文章構造体に変換し、さらに前述の図1の日本語コード表に従って変換すると、以下のようになる。
【0063】
S:[形容詞>きれい→名詞>鳥] [動詞>ぶつかる/過去] [名詞>飛行機]
010 010 111 010 001 001 001 111 001ここで、「きれい」は形容詞であるため、前記図1の日本語コード表のコード表1から形容詞のコード”001”が得られ、当該形容詞を分類するコード表5から「きれい」のコード”010”が得られる。また、「鳥」は名詞であり、前記コード表1から名詞のコード”111”が得られ、当該名詞を分類するコード表3から「鳥」のコード”010”が得られる。また、「ぶつかる」は動詞であり、前記コード表1から動詞のコード”001”が得られ、当該動詞を分類するコード表4から「ぶつかる」のコード”001”が得られ、さらにその動詞の時制としてコード表2から過去のコード”001”が得られる。同様に、「飛行機」についてはコード表1から名詞のコード”111”が得られ、名詞を分類するコード表3からは「飛行機」のコード”001”が得られる。
【0064】すなわちこの変換例では、次の約束を取り決めている。
【0065】(1)各々の情報はバイナリ3桁で表現される。したがって、読み取る際には、三つずつデータを読み取ってゆくことになる。
【0066】(2)先ず、名詞、動詞などの区別が示され、その次にその具体的実態が書かれる。
【0067】(3)左から順に、主語、述語、目的語の三つのブロックに分かれている。ただし、上記の表記では、その境目が判らないので、主語・述語、述語・目的語の間に、表で使われていないコード”000”を配置する。
【0068】(4)動詞の後には、必ず時制を決定するコードがつながる。
【0069】このような取り決めにより、上記「きれいな鳥が、飛行機にぶつかった。」という文章を変換した最終的な表現(コード列)は、以下のようになる。
【0070】”010 010 111 010 000 001 001 001 001000 111 001”なお、この例では、便宜上、3桁おきにスペースを入れ、読み易くしてあるが、実際のコード列にはスペースがない。このようなコード列が、コンピュータ上の情報単位となる。
【0071】次に、図3には、上述した日本語コード表を用いて、上記「きれいな鳥が、飛行機にぶつかった。」の文章をコード列に変換する場合の、本実施の形態の意思伝達システムにおける処理の流れのフローチャートを示す。
【0072】先ず、入力された文章を文節に区切り、助詞等を削除する(ステップS1)。入力された日本語は「きれい」、「鳥」、「飛行機」、「ぶつかる」の4つの単語に分割される。
【0073】区切られた単語は、前記図1に示したコード表1から品詞のコードとコード表3、4、5、6から単語のコードが配置される(ステップS2)。すなわち前述したように、形容詞の「きれい」には”010”と”010”のコードが対応づけられる。名詞の「鳥」には”111”と”010”が対応づけられる。名詞の「飛行機」には”111”と”001”が対応づけられる。動詞の「ぶつかる」には”001”と”001”が対応づけられる。
【0074】形容詞、副詞は被修飾語の前に配置され、動詞の後ろには時制コードが配置される(ステップS3)。「ぶつかった」は過去形であるため時制のコード表2から”001”が配置される。
【0075】各コードは、主語、述語、目的語のブロックに分割され配置される(ステップS4)。主語は前述したように[形容詞>きれい→名詞>鳥]となり、コードは”010 010 111 010”である。述語は[動詞>ぶつかる/過去]となり、コードは”001 001 001”である。目的語は[名詞>飛行機]となり、コードは”111 001”となる。
【0076】各ブロックの間に表で使用されていないコード”000”を配置する(ステップS5)。従って、「きれいな鳥が、飛行機にぶつかった。」という文章を変換したコード列(”010 010 111 010 000 001 001001 001 000 111 001”)が得られる。
【0077】一方、コード列からその意味を読み出す例を、以下に説明する。ここでは、コード列として以下のものを例に挙げる。
【0078】”010 100 111 010 000 011 011 001 101001 000 010 110 111 011”このコード列に対して、前記図1の日本語コード表を参照すると、以下のような構造を読み取ることができる。
【0079】
S:[形容詞>大きい→名詞>鳥] [副詞>素早く→動詞>捕らえる/過去]
010 100 111 010 000 011 011 001 101 001 [形容詞>青い→名詞>とんぼ]
000 010 110 111 011すなわち、上記文章構造体の左から、主語を表すコードのうちの最初のコード”010”は図1のコード表1から形容詞を表していることが分かり、その次のコード”100”は形容詞を分類した図1のコード表5から「大きい」を表していることが分かる。次のコード”111”はコード表1から名詞を表し、その次のコード”010”は当該名詞を分類したコード表3から「鳥」であることが分かる。次のコード”000”は境目を表している。次に、述語を表すコードの最初のコード”011”についてはコード表1から副詞が、コード”011”については副詞を分類するコード表6から「素早く」が、コード””001”についてはコード表1から動詞が、コード”101”については動詞を分類するコード表4から「捕らえる」が、コード”001”については動詞に続く時制のコード表2から過去が求められる。次のコード”000”は境目を表している。次に、目的語を表すコードのうちの最初のコード”010”についてはコード表1から形容詞が、コード”110”については形容詞の分類コード表5から「青い」が、コード”111”についてはコード表1から名詞が、コード”011”については名詞の分類コード表3から「とんぼ」が得られる。
【0080】上記文章構造体を、日本語に訳せば、「大きな鳥が、青いとんぼを、素早く捕らえた。」となる。英語の場合も同様にして前記図2の英語コード表を用いて変換を行えば、「A big bird cought a blue dragonfly quickly」の文章が得られることになる。
【0081】次に、本発明にかかる文章構造体をパラレルに拡張したものの説明を行う。
【0082】本発明にかかる意思伝達システムでは、コンピュータにて電子情報を扱うという特質を生かし、複雑なコンテンツをより簡単な情報形態に収める手段を有している。
【0083】言語表現では、何らかの情報要素を論理的に結びつけ、最終的には、時間的にシリアルな形態で出力する。それを筆記したとしても、時間的にシリアルな形態に対応しているからには、その論理構造としてシリアルであることに変わらない。
【0084】しかしながら、情報そのものは、本質的にシリアルであるわけではない。実際の情報は、むしろパラレルに起こっているものの方が多いし、それを無理矢理シリアルな形態で表現するために、従来は多大な努力が払われ、また十分に記述し得ないことも多々あった。
【0085】このため、本発明では、「情報要素をシリアルな形態に組み上げたもの」に限定せず、これら情報要素を複雑に関連付ける手法を採用している。これによって、通常のシリアル表現における冗長性を取り除くことができ、情報を圧縮できるばかりか、複雑な情報を簡便に取り扱うことも可能にしている。
【0086】本実施の形態の手法を、以下の文章構造体の例(前述の例)を挙げて説明する。
【0087】
S:[きれい→鳥]「ぶつかる/過去][飛行機]
ここでは、当該文章構造体に、以下の情報(文章構造体)が付加されるとする。
【0088】
S:[飛行機][急に→飛ぶ/過去][ ]
S:[飛行機][は][ジェット機]
S:[飛行機][乗せる/過去][大統領]
S:[鳥][食べる/過去完了][カブトムシ]
これらの付加情報(付加する文章構造体)を、あくまでもシリアル表現で書き足していくことは可能であるが、それでは情報が重複し、情報要素間の相対関係が分かり難くなってしまう。
【0089】そこで、本実施の形態の手法では、これら文章構造体を以下のようにダイアグラム化して記述するようにしている。
【0090】
┌[食べる/過去完了][カブトムシ]
S:[きれい→鳥][ぶつかる/過去][飛行機]
└[急に→飛ぶ/過去][ ]
└[は][ジェット機]
└[乗せる/過去][大統領]
これらダイアグラム化された文章構造体は、最終的に前述したシリアルの場合と同様にコード化されるが、これには単に、上記ダイアグラム例中の┌や└などの結合記号を定義し、例えば「鳥」などのオブジェクトについての番号等を指定するようにする。このように、複数の文章構造体をダイアグラム化したことによって、冗長性が無く、各オブジェクトの関連が明快となる。さらに、上記┌や└などの結合記号によって関連付けられるオブジェクトは、上記例の「鳥」のような意味媒体だけではなく、文章構造体でもよい。例えば、「上記文章構造体:Sは、不確実である。」という内容も、簡単に記述できることは明らかでる。同様にして、より複雑なオブジェクトの集合が作成できる。また、本発明の最終表現は、このダイアグラムのようなものであっても良いし、またこれから論理的に複数の文書を演算し、出力してもよい。
【0091】次に、図4には、本発明に係る意思伝達を行う意思伝達システムの構成の一例を示す。
【0092】この図4において、本実施の形態の意思伝達システム1は、例えば、使用言語Aのユーザー11が使用する通信端末3と、使用言語Bのユーザー12が使用する通信端末4と、使用言語Cのユーザー13が使用する通信端末5と、使用言語Dのユーザー14が使用する通信端末6と、各通信端末3、4、5、6の通信を媒介する通信媒体2とを備える。
【0093】ユーザー11は、言語Aを使用し言語の異なる他のユーザと意思伝達を行う。また、ユーザー12は言語B、ユーザー13は言語C、ユーザー14は言語Dをそれぞれ使用し他のユーザーと意思伝達を行う。
【0094】通信端末3は、ユーザー11から入力された言語Aを、前述したような文章構造体のコード列に変換し通信媒体2に供給する。また、通信端末3は、他の言語を使用するユーザーの通信端末4、5、6から供給されたそれぞれの文章構造体のコード列を受信し、ユーザー11に言語Aで出力する。通信媒体2は、通信端末から供給された言語データを他の通信端末にデータを転送可能なものであって、本実施の形態においては例えば有線によるものとする。
【0095】図5には、この発明に係る通信端末3の一構成例を示す。
【0096】この図5において、通信端末3は、言語入力装置22と、言語出力装置23と、言語Aの文章を前記文章構造体のコード列へ変換する自動翻訳器24と、文章構造体のコード列を言語Aの文章へ変換する自動翻訳器25と、モデム21とを備える。
【0097】ユーザー11は、他のユーザーに伝達する意思を言語Aにより言語入力装置22に入力する。一般にこの入力装置22はキーボードが使用される。入力された言語は、言語データに変換されて自動翻訳器24に供給される。
【0098】自動翻訳器24は、言語Aの言語データを前記文章構造体のコード列に変換し、変換したコード列をモデム21に供給する。
【0099】モデム21は前記コード列を通信媒体2を介し、他のユーザーであるユーザー12、ユーザー13、ユーザー14に送信する。モデム21は、情報媒体2と通信端末3のデータ通信を仲介する変復調器である。
【0100】一方、ユーザー11が他ユーザから伝達された意思を受信する場合においては次のようになる。通信媒体2を介して送信された前記文章構造体のコード列をモデム21が受信する。モデム21は、受信した文章構造体コード列から言語データに変換する自動翻訳器25に供給する。
【0101】自動翻訳器25は、モデムから供給された文章構造体の言語データを、言語Aの言語データに変換する。言語Aの言語データは、言語出力装置23に供給される。
【0102】言語出力装置23は、他のユーザーから伝達された意思を言語Aにより出力する装置である。一般にこの言語出力装置23はディスプレイが使用される。自動翻訳器25から供給された言語Aの言語データは言語出力装置23に供給され、言語出力装置23により言語Aが出力される。
【0103】言語出力装置23により言語Aにより出力された結果、他ユーザから伝達された意思がユーザ11に伝わることとなる。
【0104】また、通信端末4、5、6は通信端末3と自動翻訳器の部分が、それぞれのユーザーの使用言語が異なる点で違うが、その他の構成は同じである。
【0105】上記実施の形態の意思伝達システム1は、情報媒体を通信する言語データが前記文章構造体となるため、通信端末の翻訳器において、一つの言語と文章構造体との対応を行うだけでよく、翻訳が容易となり、構成が簡易になる。
【0106】なお、本発明に係る意思伝達システムにおいて使用される言語は、日本語や英語などの自然言語に限られない。例えば、その言語が手話であれば上述通信端末3の入出力装置22、23を手話による入出力装置を使用すれば実現可能である。また、入出力装置にグラフィカル・ユーザー・インターフェイス(GUI)を備えればグラフィックスによる意思伝達が可能である。
【0107】グラフィカル・ユーザー・インターフェイス(GUI)を用いる場合として、例えば、上述した文章構造体コードに対応した複数枚の画像を準備し、ユーザーに伝えたい文章の単語を表す画像を指定させることにより、通信端末上で文字を用いずに意思を伝達することが可能となる。更に、出力装置側では、送られてきた文章構造体のコード列をそれに対応した画像で表示することにより、視覚的に理解可能な意思伝達を行うことができる。なお、文章構造体は、主語、述語および目的語毎にブロック化されているので、出力装置における出力を容易に動画像化することが可能である。
【0108】また、情報媒体2はこの実施の形態においては、有線のデータ通信媒体を示しているが、本発明にあってはこの例に限られない。例えば、無線通信、データ記憶媒体(フロッピーディスク等)の交換によるもの、パソコン通信、LAN等も含むものとする。
【0109】さらに、本発明では、各々のオブジェクトが複雑に関連した情報そのものが媒体となっている。それらの情報は、本実施の形態の意思伝達システムの自動翻訳器を構成する計算機(コンピュータ)内で、論理的に演算され、より良い出力形式に変換される。例えば、重複した情報のチェック、時系列順への並べ直し、論理的矛盾を指摘する(例えば「aはbよりも強い」「bはaよりも強い」という情報を発見し、これを指摘する)ことが可能である。このように、本実施の形態の意思伝達システムによれば、情報媒体そのものの整理、合理化、簡素化等が容易に実行できる。これは、例えば従来の文書作成装置(いわゆるワードプロセッサ)がスペルチェック程度しかできないのと比較すると、その意味に立ち入れるという意味で革新的である。
【0110】また、本発明実施の形態の意思伝達システムでは、様々な入出力装置が使用できる。すなわち、本実施の形態の意思伝達システムは、言語(文字、音声)、ダイアグラム、手話、点字、モールス信号、シンボル(図形、音など)、アニメーション、ロボットの動作などの様々な入出力形態に対応可能である。言い換えると、情報媒体そのものが明確な意味を持っているため、これら異なる表現間の変換が極めて容易である。例えば、コンピュータ上のウインドウに絵などを貼り付けるような入力装置を作れば、どんな人でも容易に情報媒体を作成することが可能になる。例えば、日本語が理解できない人であっても、本実施の形態の意思伝達システムのようなインターフェースを用意すれば、全く文字を使わずに、その人が表現したい内容をインプットし、このコード体系の情報とすることができる。一旦、入力されれば、それから日本語やスライドショウなどで、他の人が容易にその内容を理解することができる。これは、ある種の翻訳器とも言える。このような多様性を用いれば、言語取得の教育機器など、実に様々な応用が考え得る。
【0111】
【発明の効果】以上の説明で明らかなように、本発明は、送信側では送信側独自の表現形態で表した意思伝達内容を多言語に共通する文章構造体として表したコード情報に変換し、受信側ではコード情報として伝送されてくる送信側からの意思伝達内容を文章構造体に基づいて受信側独自の表現形態に変換するものであって、文章構造体を構成する際には、意思伝達内容に対応したコード情報を複数関連付けると共に、当該文章構造体を解析して冗長度及び論理的矛盾を除去した形態に変換することにより、例えばコンピュータによって意思伝達を行うためのシステムを構築する際の障害を無くし、また、コンピュータ上の情報表現をパラレルな情報に対応可能にして冗長性の削減と情報の記述もれを無くし、さらに、コンピュータの論理演算能力の有効活用をも可能とし、コンピュータによる意思伝達の際の普遍性を高めることができる。
【0112】すなわち、本発明においては、全ての情報表現が使用でき、異なる表現間の変換が極めて容易である。また、情報表現を通常の言語に限定せず、ダイアグラム、手話、点字、モールス信号、シンボル(図形、音など)、アニメーション、ロボットの動作などに拡張することができる。情報媒体そのものが明確な意味を有しているため、その変換が非常に容易である。このように、様々な表現手段を用いることができるので、障害者、文盲、高齢者、幼児などに理解し易い情報となる。例えば、コンピュータ上のウインドウに絵などを貼り付けるような入力装置を作れば、どんな人でも容易に意味情報を作成することが可能になる。障害者、幼児、高齢者などでコミュニケーションが不可能であった人でも、このシステムによって情報を発信することが可能になる。
【0113】また、本発明においては、正確且つ簡便な翻訳システムが実現できる。この意味媒体情報は、いかなる言語にも容易に変換できる。したがって、自動翻訳の機能を持つ。多数の言語について翻訳システムを作ることを想定すると、従来の自動翻訳システムでは二種の言語の組み合わせに対し一つ必要となる。究極的には、世界中に数百はあるであろう言語全ての組み合わせ(すなわち数万から数十万種類)のシステムを作り上げなければならない。厳密には、言語数(N)に対して、N(N−1)/2個となる。本方式では、僅かにN個で済む。翻訳システムにおいて革新的な技術となり得る。
【0114】また、本発明においては、情報の圧縮が可能となる。送信、受信する両方が、コード表という情報を事前に保持していることによって、情報媒体の物理的な要領を低減させることができる。さらに、通常のシリアルな形態に起因する冗長性を排除することによる圧縮もなされている。
【0115】また、本発明によれば、情報の伝達を高速に実現できる。情報媒体から解釈するまでのプロセスが簡便なので、最終的に人々が内容を理解するまでの時間が短縮される。緊急な情報については、非常に価値がある点である。
【0116】さらに、本発明によれば、情報形態の変換が可能である。情報構造を解析し、その冗長性や矛盾を発見し、その情報構造そのものをより扱い易い形態に変換することができる。
【0117】以上述べたように、本発明は、従来の電子情報体系を根本的に革新するものであり、異種情報表現手法間の壁を取り除くことによって、世界中のあらゆる人々に強力なコミニュケーション手段を提供することができる。
【出願人】 【識別番号】000002185
【氏名又は名称】ソニー株式会社
【出願日】 平成9年(1997)9月8日
【代理人】 【弁理士】
【氏名又は名称】小池 晃 (外2名)
【公開番号】 特開平11−85758
【公開日】 平成11年(1999)3月30日
【出願番号】 特願平9−243103