トップ :: G 物理学 :: G06 計算;計数




【発明の名称】 文字の自動認識方法とその文字を表示した用紙及びその用紙を使用した送信方法とその装置
【発明者】 【氏名】松村 勝己

【氏名】八束 純司

【目的】
【構成】
【特許請求の範囲】
【請求項1】 背景色に対し異なる発色により表記される文字を画像センサーにより自動認識する方法において、文字を構成する領域を文字の横または縦方向に1/ 8単位に8分割し、文字の種類毎に、人間の眼で容易に判別認識できる範囲で、その1/8の単位領域を、一つ以上組み合わせて背景色にし、前記発色により表現された文字形状を、光学読み取り装置で読み取り1/ 8単位の発色データに変換し、1/ 8単位領域の横または縦方向発色比率を高め、各1/ 8単位内を発色の有無のいずれかに規格化し、得られた8ビットのデータにより前記文字を認識するようにしたことを特徴とする文字の自動認識方法。
【請求項2】 背景色に対し異なる発色により文字が表記され光学読み取り装置に入力される用紙において、文字を構成する領域を文字の横または縦方向に1/ 8単位に8分割し、文字の種類毎に、人間の眼で容易に判別認識できる範囲で、その1/8の単位領域を、一つ以上組み合わせて前記背景色にし、残された前記発色部分により文字が表現されるようにしたことを特徴とする光学読み取り装置に入力される用紙。
【請求項3】 背景色に対し異なる発色により表記される文字の領域を文字の横または縦方向に1/ 8単位に8分割し、文字の種類毎に、人間の眼で容易に判別認識できる範囲で、その1/8の単位領域を、一つ以上組み合わせて背景色にし、前記発色により文字を表現し、この文字により相手の通信回線番号を用紙に印字し、この用紙を光学読み取り装置で読み取り、前記各文字について1/ 8単位の発色データに変換し、1/ 8単位領域の横または縦方向発色比率を高め、各1/ 8単位内を発色の有無のいずれかに規格化し、得られた8ビットのデータにより前記文字を認識して前記通信回線番号を特定し、この番号に従って通信回線を制御して当該番号の相手局と接続しデータ通信をするようにしたことを特徴とする送信方法。
【請求項4】 通信回線を介し相手局と接続してデータ通信を行う送信装置において、背景色に対し異なる発色により表記される文字を横または縦方向に1/ 8単位に8分割し、文字の種類毎に、人間の眼で容易に判別認識できる範囲で、その1/8の単位領域を、一つ以上組み合わせて前記背景色にし、残された前記発色部分により表現した文字列が印字された用紙と、この用紙を読み取り文字信号を出力する光学読み取り装置と前記文字信号を前記各文字について1/ 8単位の発色データに変換し、1/ 8単位領域の横または縦方向発色比率を高め、各1/ 8単位内を発色の有無のいずれかに規格化し、得られた8ビットのデータにより前記文字を認識する認識回路と、これら認識された文字に従って前記通信回線の番号を特定し、この番号に従って通信回線を制御して当該番号の相手局と接続する通信制御回路とからなることを特徴とする送信装置。
【発明の詳細な説明】【0001】
【発明の属する技術分野】この発明は、文字の自動認識方法とその文字を表示した用紙及びその用紙を使用した送信方法とその装置に関する。
【0002】
【従来の技術】ファクシミリ通信が普及したが、その操作は複雑である。操作手順は機械によって異なり、送信先のダイヤル操作は短縮コード登録等で簡単になっているが、その操作は使い慣れた者に限定される。操作手順は緊急時には煩わしく、もっと簡単にならないかと思う。また身体に障害を持つ者や高齢者には利用できない場合も少なくない。原稿を作成し、ファクシミリ等の端末(パソコンがファクシミリ機能を持つケースが増加し、将来多数を占めるものと想定し、端末と一般的に称した。)に向かって送信操作をする時、通信内容によっては、記入様式を定型化でき、送信先も原稿によって決まるものが沢山ある。具体的にはチケット予約、通信販売の申込みや、アンケート回答、健康相談等の問診回答等であるが、このようなものは原稿をパンフレットや雑誌や新聞広告の中に折り込んだり、印刷して事前に配布することができるものが大多数である。
【0003】一方文字を機械装置で自動認識させようという試みは、近年急速に進歩している。自動認識の確率が最も高く実用化されているのはバーコードであるが、人間が認識できないので文字を併記している。さて、次に自動認識の確率が高いのは特定の機械で印刷された文字の特徴を自動認識するOCR(光学的文字読み取り機)である。マークシート記入とマークリ−ダはOCRと同じ位の認識率であり、普及している。手書き文字の自動認識も研究され、一部で実用化されつつあるが、まだ数%の誤りを人間が介入して、補正しているのが現状である。
【0004】しかもこれらの実用例はいずれも実施効果が限定される分野のものであり、本発明の動機に対しての解決策としては高価過ぎる欠点をもっている。本発明は、電話番号の自動ダイヤルを目的とするもので、長期の保管を前提に定型原稿の種類を人間が判読できて、文字パターンの一部が消えたり、汚れたり、余分な線が入ったりしても、汎用低価格ファクシミリ程度の端末で、自動認識が容易で、安価な印刷文字表記はないかと考えたものである。
【0005】
【発明が解決しようとする課題】特定の文字パターンを低価格ファクシミリ端末用に開発し、汎用英数字記号を人間が読み取れる範囲で図形化し、カメラや走査式センサにより、自動認識し易いように符号化する。
【0006】
【課題を解決するための手段】用紙上の文字の形状を、光学読み取り装置で読み取り1/ 8単位の発色データに変換し、1/ 8単位領域の横または縦方向発色比率を高め、各1/ 8単位内を発色の有無のいずれかに規格化し、得られた8ビットのデータにより前記文字を認識するようにした。用紙上の文字形状が、所定の間隔をもって並んでいるものを文字列となし、その文字列には、上下と左右に文字列の開始及び終了を示すマークとを所定の規則により組み合わせ、画像として記録する。ファクシミリ送信原稿の一部分に予め送信先電話またはファクシミリのダイヤル番号または送信先が特定される原稿識別コードを特定の文字パターンで印刷しておき、当該原稿をファクシミリ端末等のイメージ走査部に挿入するだけで、ファクシミリ端末等を構成するコンピューターのプログラムで、上記送信先ダイヤル番号を自動認識し、通信回線を操作して、ファクシミリ送信を行なって、通信装置のファクシミリ等を無操作で送信できるようにした。特に、定型原稿のファクシミリ送信が無操作で行なえる。
【0007】
【発明の実施の形態】文字や記号の認識を一般的に定義すると、所定の平面領域を構成する色差のある点の行列集合として、人間の眼に明暗のある画像として取り込まれ、人間の脳に記憶された文字パターンと比較照合され、表意が伝達される。文字サイズを縦横24×24ドット(絵素、点)の2次元で表現する場合について説明する。
【0008】文字サイズの24×24ドットの文字域というのは、文字を表す点の行列数であり、例えば、背景が白色の文字域で、所定の位置の点を黒色で発色し(埋めて)、白色を残した文字域内の色差で文字パターンを表すようにしている。図19は記号「*」の文字域を拡大したものを示し、上方にある横方向の数字0、1、2、3・・・23、24はドット番号を示し、ここで24という数字の意味は、8と3の公倍数として意味を持っている。左方縦方向の数字7、6・・・2、1、0は空白用のライン番号を示し、右方の数字14、18、0、24、18、14等は各行ドットについて黒発色したドットの総数を示している。例えば、数字24は1行ドットの全ドットが発色するものとなる。
【0009】文字の大きさは、横は、8列X3ドット=24ドットで、実長では8ドット/mmなら横3mmとなり、縦は、8(行)ライン×3ドット=24ドットで、実長では8ライン/mm なら横と同じ縦3mmとなる。文字域が正方形3mmX3mmで、普通の人間が読める最も小さい文字サイズに相当する。情報量としては、8ビット=1バイトから、3mm×3mmの画像は、3バイトで表現可能ワープロの外字登録サイズと同じとなる。
【0010】次に、記号「※」を本願に従って表示する場合について詳しく説明する。背景が一般紙の白の文字域で、発色を黒のドットにして、記号※は黒のドットが連続して表示すべき所を、横方向に、番号0、1、2・・・6、7の各ラインに8等分して、空白ライン部分を割り当てる。図19では1/ 8の単位領域のうち、ライン5とライン2の2単位が空白ラインとなり、意図的に黒のドットの連続が途切れた図形化した記号となっている。
【0011】この基本案の横方向分割の利点は、汚れや文字パターンの欠落は縦方向に発生確率が高く、空白行の認識精度が高くなる。(後述で証明される)
横方向文字列に対し、文字間隔と直角方向に文字の空白行がくるので、人間の眼で見た認識が容易である。文字の形状が明朝体やゴジック体に比べ太めにイビツなのは、空白行に対し、そうでない行の黒ドット数を多めに確保し、空白行に汚れによる黒認識ドット数が増えてもその差を確保できるようにした。また、正規の黒ドットが消えて欠落しても空白と識別できる余裕を持たせるようにした。
【0012】このように表記された記号及び文字列は人間が容易に読み取り判別できるもので一般に保存または利用できる。必要によりその文字列を機械に自動認識させる場合には、画像センサーにより自動認識させるが、この場合読み取った画像に部分的な汚れや欠落があっても、文字列を自動認識できる確率は極めて高い特徴がある。
【0013】次に、図形化した登録記号、自動認識記号「GAIOコード」の一覧を図21、図22に示す。左の縦欄に数字0から9、主要記号※から#、アルファベットAからZと、これらの対応位置に登録記号を、右上の横軸に空白ライン番号7から0を示す。各文字や記号を表わす矩形単位領域のフォントを横にスライスする形で8分割し、その1/8単位の分割領域を3個以内で、人間が容易に認識できる範囲で空白にし、どこを空白にするかを各文字5等について、図21、図22の空白ライン相当位置に○で示した。
【0014】さて、図21の記号「※」では、ライン5とライン2の欄に○印がついており、これは図19のドット構成と一致している。一般に空白ラインは、最大3ラインを1組とし、これを文字認識マークと以下定義する。各文字について、○印のついている位置が文字認識マークになり、背景色の白ドットで埋められ、それ以外のラインは14ドット以上の黒ドットが存在する。この場合2組の文字認識マーク(空白ライン)が記号「※」の表示には挿入されている。図21、図22の空白ライン挿入一覧表は、上記の説明を各文字・記号に適用したものであり、図19から各数字等のドット構成が容易に推定できる。
【0015】文字認識マークの特徴は、カメラや走査式センサによる自動認識が簡単で、容易にハード化できる。記号表示領域の大きさ、傾き、および空白ラインの位置認識だけすればよい。空白ラインは、8分割された領域の内、文字・記号毎に空白と定義された部分である。汚れや、部分的な欠落にも強く、高い自動認識率が得られるが、英数字と特定の記号表記に限定し、また任意の大きさで表現できる。
【0016】さて、図21の横欄の空白ライン番号の区域は文字領域の上下方向を図19のように8等分した位置を示すもので、図19を参考に空白ラインの文字領域に対する位置が理解できる。文字高さ3mmの場合、24ドット/8=3ドットの空白行を1単位行として、空白ライン領域と定義する。文字高さ5mmの場合、40ドット/8=5ドットの空白行が空白ライン領域ととなる。
【0017】どの位置に空白ラインを設けるかの組み合わせは次の範囲で定義可能である。図21、図22は文字高さ3mmの場合を代表的な記号と数字と大文字アルファベットの合計43文字について示す。
【0018】空白ライン位置のこれ以上の組み合わせは、目視での文字認識が困難になる。図21、図22の案は基本案であり、複数の案の一つではなく、他に無限に考えられる案の内の一つの意味である。例えば、この案を横方向分割とすれば、案2は縦方向分割案が考えられ、また案1を各文字についての空白行設定の一つの案とすれば、同じ案でも案2、案3は無限に存在する。なお、数字・記号・英文字に限定しているのは、電話番号認識を目的とした動機による。
【0019】次に、単位文字について文字認識マーク(空白ライン)判断基準について説明する。イメージセンサで画像を読み込んだ場合、期待通りの画像データが読み込まれることはまずありえない。読み込むタイミングにより、ドット単位(文字単位より小)1ラインの読み込み誤差が発生、読み込む用紙のバックグランド状態等によるゴミの発生、または文字の欠け等が発生する。このような誤差、ゴミ、文字欠けが発生しても誤認識することなく処理を行うための方法を以下に詳述する。
【0020】第1段階のゴミ削除機能について、以下ラインはドット単位とする。まず、認識用文字データを見てもわかるように、空白ライン(黒ドット数が0)以外のラインは最低でも14ドット以上の黒ドットが存在する。従って、1ラインの黒ドット数が、14ドット未満の時は、空白ラインと認識してもかまわないが、後記の第2段階の文字欠け補正機能とのからみで、黒ドット数が10ドット未満のラインを空白ラインとして、黒ドット数を0クリアし、即ち、10ドット未満を0に減算規格化する。この減算規格化機能を使用することにより、約1mm幅以下であれば不要な黒ドットが付加したゴミ・データが発生しても誤認識することがなくなる。
【0021】第2段階の文字欠け補正機能について、第1段階のゴミ削除機能の逆機能で、黒ドット抜けによる文字欠け等の補正を行う機能である。ゴミ削除機能が10ドット未満の黒ドットを0クリアするのに対して、逆に10ドット以上の黒ドットを24ドット(全部発色)と拡張し、即ち、10ドット以上を24ドットに増算規格化する。この増算規格化機能を使用することにより、約0.5mm幅以下の文字欠けならば、誤識を防止することができる。
【0022】第3段階の認識機能について、1/8単位領域の3ライン毎の合計で最終認識を行う。第1、第2の機能を使用したライン・データでは、空白ラインを含まないラインの3ラインの黒ドット合計は72(24X3)ドット、空白ラインを1ライン含んだ場合でも3ラインの合計は、48(24X3)ドットあり、どちらの場合でも30ドット以上の黒ドット数が確保できるため、1ラインの読み込み誤差が発生しても、問題なく文字認識が可能である。
【0023】次に本願デザインの文字を認識する方法を判読が最も困難な記号[※]のドット発色の標準型が図19である、正常な形状の場合とゴミが付着した場合や欠け部分がある場合について具体的に図4乃至図15に従って説明する。[※]については、読み取りライン誤差、1mm幅ゴミあり、0.5mm幅の文字欠けが発生しても上記第1〜第3機能を使用することにより、文字フラグ状態が[24H]から変化がないことで正確に認識することを証明する。さて、ゴミ・データというのは画像処理上、この場合認識率を低下させるような画像に混入する不要データを示す。その例としては次のようなものがある。文字どおり原稿に髪の毛ようなゴミが付着して読み取られる場合、原稿に書き込みを行なってしまった場合、原稿を折り畳んだ為にスキャナーで読んだ時に黒い線が入った場合、文字欠けは文字の印刷が摩擦や折り畳みにより消える他、センサーの劣化等によって発生する。
【0024】まず図4はゴミや欠けのないノーマル・パターンを示している。即ち、読み込み誤差が、発生しなかった場合のパターンである。上から各3ラインづつの黒ドット合計数により30ドット以上黒ドットが存在する場合は、文字フラグをOFFとし、30ドット未満の場合はONにする。このパターンでのフラグの状態は[24H]である。また図中の[→]で黒ドット数が変更されているのは、ゴミ削除機能または文字欠け補正機能により9ドット以下を0に、10ドット以上を24にそれぞれ規格化することを示す。
【0025】図5は、読み込み誤差が、1ライン下ズレ、ゴミなし、文字欠けなしパターンである。読み込み誤差が、1ライン下にズレが発生した場合のパターンである。上から各3ラインづつの黒ドット合計数により30ドット以上黒ドットが存在する場合は、文字フラグをOFF、30ドット未満の場合はONにする。このパターンでのフラグの状態は、[24H]である。また図中の[→]で黒ドット数が変更されているのは、ゴミ削除機能ま たは文字欠け補正機能により9ドット以下を0、10ドット以上を24にすることを示す。
【0026】図6は、読み込み誤差1ライン上ズレ、ゴミなし、文字欠け無し、即ち、単に1ライン上にズレが発生した場合のパターンである。上から各3ラインづつの黒ドット合計数により30ドット以上黒ドットが存在する場合は、文字フラグをOFFに、30ドット未満の場合はONにする。このパターンでのフラグの状態は、[24H]である。また図中の[→]で黒ドット数が変更されているのは、ゴミ削除機能または文字欠け補正機能により9ドット以下を0に、10ドット以上を24にすることを示す。
【0027】図7は、読み込みライン・ズレなし、1mm幅ゴミあり、文字欠けなしパターンである。即ち、読み込みライン誤差が発生しなかった場合あり、1mm幅のゴミ・データが右上から左下へ入っているパターン・データである。上から各3ラインづつの黒ドット合計数により30ドット以上黒ドットが存在する場合は、文字フラグをOFFに、30ドット未満の場合はONにする。このパターンでのフラグの状態は[24H]である。また図中の[→]で黒ドット数が変更されているのは、ゴミ削除機能または文字欠け補正機能により9ドット以下を0に、10ドット以上を24にすることを示す。
【0028】図8は、読み込み1ライン下ズレ、1mm幅ゴミあり、文字欠けなしパターンである。即ち、読み込みライン誤差が、1ライン下にズレが発生した場合あり、1mm幅のゴミ・データが 右上から左下へ入っているパターン・データである。上から各3ラインづつの黒ドット合計数により、30ドット以上黒ドットが存在する場合は、文字フラグをOFFに、30ドット未満の場合はONにする。このパターンでのフラグの状態は、[24H]である。また図中の[→]で黒ドット数が変更されているのは、ゴミ削除機能または文字欠け補正機能により9ドット以下を0、10ドット以上を24にすることを示す。
【0029】図9は 読み込み1ライン上ズレ、1mm幅ゴミあり、文字欠けなしで、即ち、読み込みライン誤差が、1ライン上にズレが発生した場合であり、1mm幅のゴミ・データが右上から左下へ入っているパターン・データである。上から各3ラインづつの黒ドット合計数により、30ドット以上黒ドットが存在する場合は、文字フラグをOFFに、30ドット未満の場合はONにする。このパターンでのフラグの状態は、[24H]である。また図中の[→]で黒ドット数が変更されているのは、ゴミ削除機能または文字欠け補正機能により9ドット以下を0に、10ドット以上を24にすることを示す。
【0030】図10は読み込みライン・ズレなし、ゴミなし、0.5mm幅文字欠けあり、即ち、読み込み誤差が、発生しなかった場合であり、文字データの右側0.5mm幅でデータが欠けているパターンである。上から各3ラインづつの黒ドット合計数により、30ドット以上黒ドットが存在する場合は、文字フラグをOFFに、30ドット未満の場合はONにする。このパターンでのフラグの状態は[24H]である。また図中の[→]で黒ドット数が変更されているのは、ゴミ削除機能または文字欠け補正機能により9ドット以下を0に、10ドット以上を24にすることを示す。
【0031】図11は読み込み1ライン下ズレ、ゴミなし、0.5mm幅文字欠けあり、即ち、読み込み誤差が1ライン下にズレが発生した場合であり、文字データの右側0.5mm幅でデータが欠けているパターンである。上から各3ラインづつの黒ドット合計数により、30ドット以上黒ドットが存在する場合は、文字フラグをOFFに、30ドット未満の場合はONにする。このパターンでのフラグの状態は、[24H]である。また図中の[→]で黒ドット数が変更さ、ているのは、ゴミ削除機能または文字欠け補正機能により9ドット以下を0に、10ドット以上を24にすることを示す。
【0032】図12は読み込み1ライン上ズレ、ゴミなし、0.5mm幅文字欠けあり、即ち読み込み誤差が、1ライン上にズレが発生した場合であり、文字データの右側0.5mm幅でデータが欠けているパターンである。上から各3ラインづつの黒ドット合計数により30ドット以上黒ドットが存在する場合は、文字フラグをOFFに、30ドット未満の場合はONにする。このパターンでのフラグの状態は、[24H]である。また図中の[→]で黒ドット数が変更されているのは、ゴミ削除機能または文字欠け補正機能により9ドット以下を0に、10ドット以上を24にすることを示す。
【0033】図13は読み込みライン・ズレなし、1mm幅ゴミあり、0.5mm幅文字欠けあり、即ち、読み込みライン誤差が発生しなかった場合あり、1mm幅のゴミ・データが右上から左下へ入っていて、中央に0.5mm幅の文字欠けは発生しているパターン・データである。上から各3ラインづつの黒ドット合計数により30ドット以上黒ドットが存在する場合は、文字フラグをOFFに、30ドット未満の場合はONにする。このパターンでのフラグの状態は[24H]である。また図中の[→]で黒ドット数が変更されているのは、ゴミ削除機能または文字欠け補正機能により9ドット以下を0に、10ドット以上を24にすることを示す。
【0034】図14は読み込み1ライン下ズレ、1mm幅ゴミあり、0.5mm幅文字欠けあり、即ち、読み込みライン誤差が、1ライン下にズレが発生した場合あり、1mm幅のゴミ・データが右上から左下へ入っていて、中央に0.5mm幅の文字欠けは発生しているパターン・データある。上から各3ラインづつの黒ドット合計数により30ドット以上黒ドットが存在する場合は、文字フラグをOFFに、30ドット未満の場合はONにする。このパターンでのフラグの状態は、[24H]である。また図中の[→]で黒ドット数が変更されているのは、ゴミ削除機能または文字欠け補正機能により9ドット以下を0に、10ドット以上を24にすることを示す。
【0035】図15は読み込み1ライン上ズレ、1mm幅ゴミあり、0.5幅文字欠けあり、即ち、読み込みライン誤差が1ライン上にズレが発生した場合であり、1mm幅のゴミ・データが右上から左下へ入っていて、中央に0.5mm幅の文字欠けが発生しているパターン・データである。上から各3ラインづつの黒ドット合計数により30ドット以上黒ドットが存在する場合は、文字フラグをOFFに、30ドット未満の場合はONにする。このパターンでのフラグの状態は、[24H]である。また図中の[→]で黒ドット数が変更されているのは、ゴミ削除機能または文字欠け補正機能により9ドット以下を0に、10ドット以上を24にすることを示す。
【0036】さて、図20は、図21、図22に示した登録記号から所定の文字等を選択し、文字列 ”GAIO 0988−53−0387>1246”を用紙に印刷したものである。文字列上方の2本のバーと文字列下方の1本のバーは用紙をファクシミリ端末等に挿入する場合に、方向の正逆を判断するためのものである。図20の文字列 ”GAIO 0988−53−0387>1246”のうち文字列 ”・・・0988−53−0387・・・”はファクシミリ番号を示している。このようなファクシミリ番号を、図4乃至図15で説明した方法で認識し、電文用紙を自動発信するようにした。
【0037】本願の登録記号を用いたファクシミリの自動発信用の用紙のフォーマットについて、図1、図2について説明する。文字認識を行うための、文字記述フォーマット及び、文字ライン・フォーマットを図1に示す。用紙1に印刷された上部第1ライン21は85バイト×3ドットラインからなり、背景色の白に対し黒くベタ発色されている。その下には背景ライン22が85バイト×3ドットラインとして、背景の白色が残される。
【0038】その下に、上部第1ライン21と同様な上部第2ライン23が85バイト×3ドットラインで印刷される。また、その下には背景ライン22と同様な第2背景ライン24が85バイト×3ドットラインとして、背景の白色が残される。背景ライン24の下に、文字列25が、85バイト×24ドットライン(上記各ライン3ドットと同一幅で省略縮小して示す)で印刷され、文字列25が図20のファクシミリ番号を含む、宛先登録ッコードである。
【0039】その下には背景ライン24と同様な第3背景ライン26が85バイト×3ドットラインとして、背景の白色が残される。更に、その下に上部第2ライン23と同様な下部ライン27が85バイト×3ドットラインで印刷される。図1ではこれら各ライン21、22、23、24、26、27は拡大して示してある。下部ライン27の下方は電文用の余白であり、この余白に伝達したい情報を記載する。
【0040】次に、図2に文字列25の文字記述フォーマットを示す。文字列25はスタートマーク28、複数の文字データ30、エンドマーク29から構成され、スタートマーク28は左端に印刷されている。スタートマーク28は幅16ドット×縦24ドットラインで、中間の各文字データ30は図19と同じ、幅24ドット×縦24ドットラインで、文字間には幅8ドット×縦24ドットラインの空白、文字間隔が介在する。右端のエンドマーク29も幅16ドット×縦24ドットラインで、スタートマーク28と同形である。複数の文字データ(欄)30には図21、図22の各文字等が適宜印字される。
【0041】図18に図1の自動発信用の用紙1の具体例を示す。ファクシミリ番号を含む文字列25の下方の電文用余白には、印刷によるデータ書き込みパターンが設けられている。次に、この自動発信用の用紙1を入力する通信網の全体構成について図16で説明する。
【0042】通信装置T1、T2、T3等が公衆電話回線網6を介し遠方の通信装置 T11、T12 、T13 等と接続可能である。これら通信装置T1、T11等は互いに送信局にも受信局にもなり得る双方向装置である。通信装置T1等を送信局とし、通信装置 T11等を受信局とすると、送信局は通知文書を作成・発信する通信端末で、ハ゜ソコンモテ゛ム内臓) や、ファクシミリ装置等からなり、受信局は文書を受信し、装着した紙に受信情報を出力可能なフ゜リンター付きハ゜ソコン(モテ゛ム内臓) やファクシミリ装置等から構成する。
【0043】図17において、個々の通信装置T1、T11等は用紙1を読み取るイメージセンサ7、CPU8、メモリ9、モデム10、プリンタ11、回線制御装置12から構成されている。CPU8は中央演算装置であり、メモリ9に格納されているプログラムに従って、図21、図22の登録記号の認識を実行する。モデム10は、CPU8からのデータを通信データ形式に変換し、回線制御装置12は、通信回路を制御し公衆電話回線網6とのデータの転送を制御する。
【0044】プリンタ11は、感熱型の用紙に印字するもので、受信時に画像データを印字する。CPU8はメモリ9に格納されているプログラムに従って、定型原稿であるかどうかを判別し、定型原稿の場合には送信先を原稿から読み取り、送信先に自動ダイヤルし、ファクシミリ送信を実行する機能を持つ。図18に本願のファクシミリ用紙の例を示す。用紙1の上方には図20の宛先登録コード31が印刷され、福祉関連の伝達データが記載されている。
【0045】ファクシミリ用紙1の文字認識方法について説明する。図1でフォ−マット文字列を画像としどのように表現するかを説明する。図1は文字は横8ドットライン/mm、縦8ドットライン/mmの画像密度では、縦合計 42ラインであるから縦 5.25mm、横合計85バイト横 85.00mm相当である。20文字を85mmの幅に表記できる。
【0046】ここで使用するA4スキャナーは画像センサの一種で、汎用のファクシミリを意識したもので、制約条件ではない。A4スキャナーの主走査方向とは横文字列に対し、横方向の走査方向を示すものである。1728ドットは8ドットXライン/mmのスキャナーで216mm幅の走査によって得られる線画像の単位であり、縦方向の副走査n行と合わせて矩形画像が得られる。図17の画像用のメモリ9にはこの1,728ドット×n行分のデータが格納されている。このデータは黒か白かの2値化されたデータで、紙の汚れや、文字が薄くなった場合でも一定の濃さで白か黒かを判別したものである。
【0047】次に文字認識方法について図3のフローチャートに従って説明する。発信用の用紙1をスキャナ(イメージセンサ)7で読み込み、画像データをメモリ9に記憶した後で、CPU8が処理を行なう。用紙サイズがA4のスキャナ7で主走査方向1728ドット(dot )で画像メモリ9に、図1、図18の用紙1の画像が格納されていると仮定して認識フローを下記に記述する。
【0048】ステップS1では、上部第1ライン21、または下部ライン27を、即ち85バイト(680ト゛ッ)の連続した全黒データをサーチする。ステップS2では、当データが存在しない場合は、認識対象の文字領域がないものとして、ステップS14に進みライン無し存在エラーとする。メモリ9の先頭位置からサーチし、120ライン(約30mm)チェックしても存在しなかった場合は、文字認識を中止する。読み込み方向は正逆両方向に可能であるが、どちらの場合にも1番始めに黒データとして、読み込まれる位置に記載する必要がある。ステップS3では、上部第2ライン23をサーチする。即ち、ステップS1でサーチした第1ラインから3ライン(誤差を考慮する)下の第2ラインをサーチする。
【0049】ステップS4では、このラインが存在する場合は、ステップS5に進み文字認識方向は正方向となり、存在しない場合は、ステップS15に進み認識方向は逆方向となる。ここで、画像センサ(スキャナ)7の主走査方向に対して、画像の横方向が一致しているとは限らず、用紙1が傾いて入力されていることを前提に記述している。85バイトの連続した全黒データという数字は、1例であって、文字列の大きさによって決定する。図1の例では85バイトの連続した全黒データということになる(ある傾斜をもって連続している場合を含めて判定する)。
【0050】正方向というのはスキャナーに対し最初に上部第1ライン21が来るように読み込んだ場合であり、読み取り原稿の挿入方向が逆になったら逆方向である。逆方向に原稿を挿入しても、自動認識することを目的とした機能である。ステップS6では、検出したラインから全体の傾き係数を幾何学的演算により実行する。ステップS1でサーチした上部第1ラインから傾き係数を演算する。ここで出た係数は、後記の文字列(ライン)25(85バイト×24ライン)を認識バッファ(メモリ9)にコピーする時に、使用する。
【0051】ステップS7では、文字列25のスタートマーク28をサーチする。即ち、上部第2ライン23または、下部ライン27から3ライン(誤差を考慮する)下に存在するスタートマーク28をサーチする。このマーク28は、文字列25の先頭にあり各文字位置30を認識するために使用する。ステップS8では、全文字列25のデータをメモリ9にコピーする。ステップS7では、検出したスタートマーク28からエンドマーク29まで106バイトX24ライン分のデータを認識作用のためにメモリ9にコピーする。コピーする時に、ステップS6で演算した傾き係数をを使用し、傾きをなくした状態でコピーし、文字間の位置を示すオフセットテーブルを作成し記憶する。
【0052】ステップS9では、オフセットテーブルから文字位置オフセット値を取得する。オフセット値Xiは図2の場合、i文字目について次式で求める、即ち、Xi=(8+24)i−(32−16−8)=32i−8となる。図2の文字間隔8ドットは、スタートマーク28から文字30の間、文字30と文字30の間、文字30とエンドマーク29の間にあり、文字検出の目標となっている。ステップS10では、黒ドットを3ライン毎に合計する。文字は3バイト(24ドット)X24ラインで構成され、文字認識は文字認識マーク(空白ライン)の位置により行なう。文字認識マークが3ドットラインで構成されているので、0ラインから3ラインの黒ドットデータの合計を求める。
【0053】但し、ゴミデータを除去する目的から3ラインの黒ドットを合計する前に、1ライン毎に前述した増減の規格化を行なう。ステップS11では、1行の最終文字、20番目まで、終了したか確認し、全文字終了まで、ステップS9からステップS11を繰り返す。ステップS12では、黒ドット数の合計に従って、前述したフラグを作成する。ステップS13では、フラグから文字等を、即ち図21、図22の一覧表からフラグを文字等に変換して認識する。フラグテーブルには正方向と逆方向のものが予め用意される。宛先登録コードは、原稿の先頭に印刷されているが、末尾でも良い。
【0054】
【発明の効果】本発明によれば、数字0〜9、記号#※−<>/およびアルファベットA〜Zは印字ドットでは上から下まで全てつながっているものを、強制的にある部分に横方向(主走査)に一定の幅の空白を設けて表現する。文字認識に付いて、認識確率を高める工夫したので、0〜9までの数字と、#※−<>/等の記号をイメージセンサで読み込み機械によって認識することがが容易であり、なおかつ人間の目で見てその数字、記号を容易に認識できる程度であり、そのままでも使用できる。この空白部分は文字等毎に異なるようにし、この空白部分により文字を認識を行う。従って文字の形状は認識しないためゴミに対して誤認識するおそれが少なく、パターン・マッチング方法等に比べて処理速度が速くなる。但し、空白行にて認識を行うため、文字の形状を横方向に広く大きくし、なおかつ空白行を入れるため、多少文字の形状がいびつである。CPUによる認識方法では、削除機能または文字欠け補正機能により9ドット以下を0、10ドット以上 を24にする。定型原稿を用意し、ファクシミリ端末等に原稿の一部を画像認識する機能を追加するので、操作する人は誰でもよく、唯原稿の入れ方だけ判れば、原稿を挿入するだけで相手に発信できる。火災や事故の緊急時には、予め最寄りの消防署から配布された定型原稿に、自己の住所や目印の建物等を記入した地図等を記載しておけば、119に電話するよりも早くて、確実な情報伝達が可能になる効果が期待できる。またダイヤルミスが無くなり、予約や問診回答では、紙に書いた物が残るので、情報が正確になり、通信時間が短くなる効果がある。更に、定型原稿をファクシミリで受信し、再送信することも可能となる。例えば、定型原稿は予め用意する必要があるが、沢山になると分類・整理・整頓が煩わしいという問題が発生する。このような時に、必要なときに送信先に対し電話で宛名付きの定型原稿を要求し、ファクシミリで送られた出力用紙には、送信先ダイヤル番号または送信先が特定される原稿識別コードを特定の文字パターンが印刷出力されるので、それをそのまま定型原稿として使用することができる。遠隔地に居て、送信先のダイヤル番号等を問い合わせ確認する必要のない便利な機能となる。
【出願人】 【識別番号】591266814
【氏名又は名称】ガイオ・テクノロジー株式会社
【出願日】 平成7年(1995)7月24日
【代理人】 【弁理士】
【氏名又は名称】八嶋 敬市
【公開番号】 特開平9−34997
【公開日】 平成9年(1997)2月7日
【出願番号】 特願平7−187345