トップ :: H 電気 :: H04 電気通信技術




【発明の名称】 スキャンシステム、スキャン装置及びデータ処理方法
【発明者】 【氏名】松井 佑馬

【要約】 【課題】スキャンデータの処理を効率的に行うことができるようにすることを目的とする。

【構成】スキャン装置は、スキャンに係る処理を行うスキャン処理手段と、処理に関する設定情報が記述されているスキャン設定ファイルに基づいて、スキャンデータ中の指定領域を文字又は画像として認識する認識手段と、サーバへの命令要求及び認識手段において指定領域ごとに認識されたデータをサーバに送信する送信手段と、を有し、サーバは、スキャン装置から送信された命令要求及びデータを受信する受信手段と、受信手段において受信された命令要求を解釈する解釈手段と、受信手段において受信されたデータを各データベースへ登録する登録手段と、を有することによって課題を解決する。
【特許請求の範囲】
【請求項1】
スキャン装置と、前記スキャン装置とネットワークを介して通信可能なサーバとを有するスキャンシステムであって、
前記スキャン装置は、
スキャンに係る処理を行うスキャン処理手段と、
処理に関する設定情報が記述されているスキャン設定ファイルに基づいて、スキャンデータ中の指定領域を文字又は画像として認識する認識手段と、
前記サーバへの命令要求及び前記認識手段において前記指定領域ごとに認識されたデータを前記サーバに送信する送信手段と、
を有し、
前記サーバは、
前記スキャン装置から送信された命令要求及びデータを受信する受信手段と、
前記受信手段において受信された前記命令要求を解釈する解釈手段と、
前記受信手段において受信された前記データを各データベースへ登録する登録手段と、
を有することを特徴とするスキャンシステム。
【請求項2】
前記スキャン装置は、前記サーバへの命令要求を生成する生成手段を更に有することを特徴とする請求項1に記載のスキャンシステム。
【請求項3】
スキャンに係る処理を行うスキャン処理手段と、
処理に関する設定情報が記述されているスキャン設定ファイルに基づいて、スキャンデータ中の指定領域を文字又は画像として認識する認識手段と、
ネットワークを介して通信可能なサーバに対する命令要求を生成する命令要求生成手段と、
前記命令要求生成手段において作成された命令要求及び前記認識手段において前記指定領域ごとに認識されたデータを前記サーバに送信する送信手段と、
を有することを特徴とするスキャン装置。
【請求項4】
前記スキャン設定ファイルを読み込む読込手段を更に有することを特徴とする請求項3に記載のスキャン装置。
【請求項5】
前記スキャン設定ファイルには、
前記スキャンデータ中の領域を指定して画像として認識するか、文字として認識するかの記述と、
認識後の各データに対して行う処理の記述と、
複数の処理をまとめて一連の処理の流れを組み立てる記述と、
がされており、前記読込手段は、各記述を読み込むことを特徴とする請求項4に記載のスキャン装置。
【請求項6】
スキャン装置と、前記スキャン装置とネットワークを介して通信可能なサーバとを有するスキャンシステムにおけるデータ処理方法であって、
前記スキャン装置が、
スキャンに係る処理を行うスキャン処理工程と、
処理に関する設定情報が記述されているスキャン設定ファイルに基づいて、スキャンデータ中の指定領域を文字又は画像として認識する認識工程と、
前記サーバへの命令要求及び前記認識工程において前記指定領域ごとに認識されたデータを前記サーバに送信する送信工程と、
を有し
前記サーバが、
前記スキャン装置から送信された命令要求及びデータを受信する受信工程と、
前記受信工程において受信された前記命令要求を解釈する解釈工程と、
前記受信工程において受信された前記データを各データベースへ登録する登録工程と、
を有することを特徴とするデータ処理方法。
【請求項7】
スキャン装置におけるデータ処理方法であって、
スキャンに係る処理を行うスキャン処理工程と、
処理に関する設定情報が記述されているスキャン設定ファイルに基づいて、スキャンデータ中の指定領域を文字又は画像として認識する認識工程と、
ネットワークを介して通信可能なサーバに対する命令要求を生成する命令要求生成工程と、
前記命令要求生成工程において作成された命令要求及び前記認識工程において前記指定領域ごとに認識されたデータを前記サーバに送信する送信工程と、
を有することを特徴とするデータ処理方法。
【請求項8】
前記スキャン設定ファイルを読み込む読込工程を更に有することを特徴とする請求項7に記載のデータ処理方法。
【請求項9】
前記スキャン設定ファイルには、
前記スキャンデータ中の領域を指定して画像として認識するか、文字として認識するかの記述と、
認識後の各データに対して行う処理の記述と、
複数の処理をまとめて一連の処理の流れを組み立てる記述と、
がされており、前記読込工程では、各記述を読み込むことを特徴とする請求項8に記載のデータ処理方法。
【請求項10】
請求項6乃至9の何れか1項に記載のデータ処理方法をコンピュータに実行させることを特徴とするプログラム。
【請求項11】
請求項10に記載のプログラムを記憶したコンピュータ読み取り可能な記憶媒体。

【発明の詳細な説明】【技術分野】
【0001】
本発明は、スキャンシステム、スキャン装置及びデータ処理方法に関する。
【背景技術】
【0002】
スキャンしたデータに対して処理を施すことが可能なスキャン装置が存在する。また、スキャン装置がネットワークに接続されてネットワーク上のサーバを用いた処理を行う場合、スキャン時の設定としてスキャン画像データの転送先と、転送先での処理とを記述することが可能なシステムが知られている(例えば、特許文献1参照)。
【0003】
【特許文献1】特開2000−270148号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら従来の技術ではスキャン画像データ全体をサーバ側に転送し、サーバ側のみで処理を行っているので次のような問題が存在する。
【0005】
即ち、文書中の特定の領域に対する、より粒度の細かい処理を指定することができない問題があった。また、スキャン装置とサーバとの間で情報をやり取りしながら連携した処理を行うことができない問題もあった。
【0006】
例えば、大量の定型帳票をスキャンして、そのデータをネットワーク上のデータベースに格納したい場合を考える。この場合、定型帳票のある領域はOCRにかけてテキストをデータベース上のあるテーブルに格納し、定型帳票の別のある領域は画像データとしてデータベース上の別のテーブルに格納することが従来の技術はできなかった。
【0007】
また別の例として、帳票上に印鑑を押す領域があり、その印鑑が予め登録されている印鑑と合致した場合のみ、帳票を正しいものと認識して、スキャン装置がその後の処理を続けられるようにしたい場合がある。このような場合、スキャン装置とサーバとの間で、処理の連携が必要となるが、従来の技術では実現することができなかった。
【0008】
本発明はこのような問題点に鑑みなされたもので、スキャンデータの処理を効率的に行うことができるようにすることを目的とする。
【課題を解決するための手段】
【0009】
そこで、本発明は、スキャン装置と、前記スキャン装置とネットワークを介して通信可能なサーバとを有するスキャンシステムであって、前記スキャン装置は、スキャンに係る処理を行うスキャン処理手段と、処理に関する設定情報が記述されているスキャン設定ファイルに基づいて、スキャンデータ中の指定領域を文字又は画像として認識する認識手段と、前記サーバへの命令要求及び前記認識手段において前記指定領域ごとに認識されたデータを前記サーバに送信する送信手段と、を有し、前記サーバは、前記スキャン装置から送信された命令要求及びデータを受信する受信手段と、前記受信手段において受信された前記命令要求を解釈する解釈手段と、前記受信手段において受信された前記データを各データベースへ登録する登録手段と、を有することを特徴とする。
【0010】
係る構成とすることにより、例えば、定型帳票に対して帳票中の任意の領域を指定してサーバと連携してデータ処理を行うことができる。よって、スキャンデータの処理を効率的に行うことができるようにすることができる。
【0011】
また、本発明は、スキャン装置、データ処理方法、プログラム及び記憶媒体としてもよい。
【発明の効果】
【0012】
本発明によれば、スキャンデータの処理を効率的に行うことができるようにすることができる。
【発明を実施するための最良の形態】
【0013】
以下、本発明の実施形態について図面に基づいて説明する。
【0014】
<実施形態1>
図1は、スキャンシステムのシステム構成を示す図である。本実施形態では、ユーザ104が、スキャン装置101を用い、ネットワーク103を介してASPのサーバ102とやり取りしながら、定型帳票のデータを処理するワークフローを構築する場合を例に説明を行う。ここで、ASPとは、Application Service Providerの略である。
【0015】
スキャン装置101は、ユーザ操作受付部105と、スキャン処理部106と、領域ごとのデータ認識及び処理部107と、サーバへの命令要求生成部108と、命令要求及びデータ送信部109と、ユーザ通知部110と、を備える。また、111は、スキャン設定ファイルであり、スキャンデータ中の任意の領域に対してスキャン装置101と、サーバ102と、の連携した処理を記述することができる。より具体的に説明すると、スキャン設定ファイル111には、スキャンデータ中の領域を指定して画像として認識するか、文字として認識するかの記述がなされている。また、スキャン設定ファイル111には、認識後の各データに対して行う処理の記述がなされている。また、スキャン設定ファイル111には、複数の処理をまとめて一連の処理の流れを組み立てる記述がなされている。
【0016】
スキャン装置101は、スキャン設定ファイル111の記述に基づいて、スキャンデータ中の指定領域を画像として認識するか、文字として認識するか判断する。そして、スキャン装置101は、判断結果に応じて、スキャンデータ中の指定領域を画像又は文字として判断する。そして、スキャン装置101は、画像又は文字に係るデータをサーバ102のデータベースへ登録するためのクエリを作成し、このクエリと画像又は文字に係るデータとをサーバ102に送信する。
【0017】
サーバ102は、クエリと画像又は文字に係るデータとを受信する。そして、サーバ102は、クエリを解釈し、画像又は文字に係るデータをデータベース等に保存する。
【0018】
なお、図1では、説明の簡略化のため、スキャンシステムに含まれるサーバとして、サーバ102を1つだけ示しているが、スキャンシステムに含まれるサーバは複数であってもよい。
【0019】
図2は、スキャン機能を備えた複合機(MFP)等のスキャン装置101の内部構成を表した図である。図2においてスキャン装置201は、次に述べるような要素から構成されている。
【0020】
CPU202は、スキャン装置101全体を制御する中央処理装置である。RAM203は、プログラムやデータを一時的に記憶するランダムアクセスメモリーである。ハードディスク207は、プログラムやデータを永続的に記憶するストレージである。CPU202が、プログラム等をハードディスク207から読み出して実行することにより、図1に示した機能及び/又は後述するフローチャートに係る処理の一部を行う。
【0021】
ネットワークインターフェース208は、ネットワークを通じて外部とやり取りをするためのアダプタである。204は、操作パネル等外部から装置への入力装置である。205は、印刷等、装置から外部への出力装置である。206は、画面等の表示装置である。
【0022】
図2に挙げたような構成要素は、装置によって一部を備えていなかったり他の要素を備えていたりすることはあるが、一般的なコンピュータに見られるものである。
【0023】
図3は、サーバの一例のハードウェア構成図である。図3に示されるように、サーバは、ハードウェア構成として、入力装置11と、表示装置12と、記録媒体ドライブ装置13と、ROM15と、RAM16と、CPU17と、インターフェース装置18と、HD19と、を含む。
【0024】
入力装置11は、サーバの操作者が操作するキーボード及びマウス等で構成され、サーバに各種操作情報等を入力するのに用いられる。表示装置12は、サーバの操作者が利用するディスプレイ等で構成され、各種情報(又は画面)等を表示するのに用いられる。インターフェース装置18は、サーバをネットワーク等に接続するインターフェースである。
【0025】
サーバの機能等に係るプログラムは、例えば、CD−ROM等の記録媒体14によってサーバに提供されるか、ネットワーク等を通じてダウンロードされる。記録媒体14は、記録媒体ドライブ装置13にセットされ、プログラムが記録媒体14から記録媒体ドライブ装置13を介してHD19にインストールされる。なお、プログラムは、始めからHD19等にインストールされていてもよい。
【0026】
ROM15は、サーバの電源投入時に最初に読み込まれるプログラム等を記録する。RAM16は、サーバのメインメモリである。CPU17は、必要に応じて、HD19よりプログラムを読み出して、RAM16に格納し、プログラムを実行することで、サーバの機能の全て又は一部を提供する。また、HD19は、プログラム以外に、例えばデータベース等を格納する。
【0027】
図3に挙げたような構成要素は、装置によって一部を備えていなかったり他の要素を備えていたりすることはあるが、一般的なコンピュータに見られるものである。
【0028】
図4は、本実施形態のスキャンシステムで処理の対象となる定型帳票の一例を示した図である。図4の例では、定型帳票301は、認証画像領域302と、帳票項目領域303と、帳票画像領域304と、から構成されている。認証画像領域302は、印鑑のような、画像による認証に用いられる。帳票項目領域303は、OCRをかけてテキストデータとして認識した上でASP上のデータベースに登録される。帳票画像領域304は、画像ファイルとしてASP上のデータベースに登録される。
【0029】
図5は、本実施形態のスキャンシステムにおける全体的な処理の流れを示すフローチャートである。ステップS401において、スキャン装置は、スキャンデータの切り出しを行う。この処理は、予めスキャン設定ファイルにおいて矩形領域が指定されているので、それに従って、スキャン装置が、元のスキャンデータから指定された矩形画像データを切り出す処理である。
【0030】
ステップS402において、スキャン装置は、定型帳票中の認証画像を用いた認証処理を行う。この処理は、スキャン装置が、帳票中の印鑑のような認証画像が予め登録されたものと一致するか否かを判断することにより、帳票の正当性を確認する処理である。なお、この認証処理を外部のサーバ上で行ってもよい。
【0031】
認証が失敗した場合には、ステップS405において、スキャン装置は、エラー表示を行う。そして、図5に示す処理を終了する。認証が成功した場合には、例として、ステップS403において、スキャン装置は、帳票中の項目をOCRにかけたデータをASP上のデータベースに登録する作業を行う。また、続いて、ステップS404において、スキャン装置は、帳票中の画像領域をデータとしてASP上のデータベースに登録する作業を行う。これらの処理の詳細については後述する。
【0032】
またステップS403のデータベースと、ステップS404のデータベースとは同一ASP上の異なるデータベースであってもよいし、そもそもそれぞれが異なるASP上のデータベースであってもよい。
【0033】
図6は、帳票中の項目をASP上のデータベースに登録する処理の一例を示すフローチャートである。ステップS501において、スキャン装置は、帳票中の指定領域の文字認識処理を行う。この処理によって帳票中の記入項目をテキストデータとして取り出すことができる。
【0034】
ステップS502において、スキャン装置は、スキャン設定ファイルの記述に応じて、ASPのデータベースへ帳票項目データを登録するためのクエリを組立てる処理を行う。ステップS503において、スキャン装置は、SOAP/HTTPのようなWebサービスのプロトコルを用いて、Webサービスのインターフェースを持つASPに対してクエリの送信処理を行う。ステップS504において、ASP側で、受信したクエリに基づいて、データベースへのデータ登録処理を行う。
【0035】
図7は、帳票中の画像領域をデータとしてASP上のデータベースに登録する処理の一例を示すフローチャートである。ステップS601において、スキャン装置は、スキャンデータから切り出した帳票中の画像領域を画像ファイルとして保存する処理を行う。
【0036】
ステップS602において、スキャン装置は、スキャン設定ファイルの記述に応じて、ASPのデータベースへ帳票画像データを登録するためのクエリを組立てる処理を行う。ステップS603において、スキャン装置は、SOAP/HTTPのようなWebサービスのプロトコルを用いて、Webサービスのインターフェースを持つASPに対してクエリの送信と、画像ファイルのアップロードとの処理を行う。ステップS604において、ASP側で、受信したクエリに基づいて、画像ファイルをデータベースへ登録するデータ登録処理を行う。
【0037】
図8は、スキャン装置からASP上のデータベースへの登録方法を説明するための図である。スキャン装置701は、ネットワーク702を介してASP703に対し、SOAP等のWebサービスのプロトコルでデータを送信する。ASP側ではWebサービスAPI704からデータを受信し、受信データに応じて内部のデータベース705へとデータの登録を行う。
【0038】
<実施形態2>
実施形態1ではスキャンシステムの構成やスキャンシステムにおける全体の処理の流れを説明したが、実施形態2ではスキャン設定ファイルの記述とそれに基づいた処理について説明する。
【0039】
図9は、スキャン設定ファイルの記述例を示す図である。図9では設定ファイルはXMLで記述されている例を示している。以下、図9に示される設定ファイルにおける主な要素について説明する。
【0040】
要素areaは、帳票上の領域を表し、属性としてunitは、長さの単位を、x及びyは、矩形領域の左上の頂点座標を、width及びheightは、それぞれ矩形領域の幅と高さとを表している。また、属性typeは、対象領域を画像として認識するか文字として認識するかの種類を、formatは、ファイルとして保持する際のフォーマットを指定する。
【0041】
要素taskは、処理の1つのまとまりを表す。属性nameは、タスクの名前を、属性dependsは、そのタスク実行の前提条件となるタスク名を指定する。タスクの例として801で要素verifyは、実施形態1における画像認証の処理を表している。
【0042】
802では要素insertは、実施形態1におけるASPのデータベースへのレコード追加処理を表している。属性urlは、WebサービスのURLを、属性dbは、登録対象のデータベースを表す。また、803で要素uploadは、実施形態1における画像ファイルのアップロード処理を表している。
【0043】
insertの場合と同じく、属性urlは、WebサービスのURLを、属性dbは、登録対象のデータベースを表す。その他の要素、setField、setID、setFile等はASPへデータ登録を行うためのクエリを組立てるのに必要となる情報を指定するためのものである。なお、setFieldやsetIDの属性としてgeneratekey="true"と記述されている箇所があるが、これは1回のスキャン処理を通じて共通で一意なキーを生成して設定するという処理を表している。
【0044】
次に設定ファイルが読み込まれて処理が行われる流れを、802のinsertタスクの場合を例にとって説明する。task要素のdepends属性でタスクverifyが指定されているので、タスクinsertはタスクverifyが正しく終了していないと実行されない。つまり認証処理が成功していれば引き続き次のinsert処理がスキャン装置によって実行されるが、失敗しているとエラーが通知されて処理はそこで終了してしまう。
【0045】
処理が実行される場合にはinsert命令に基づいてスキャン装置によってASPサーバへのデータ登録処理が行われる。ここではWebサービスを提供するASP"http://someASP.com/service"のデータベース"customer"に対してクエリを組立てて送信することでデータ登録が行われる。
【0046】
データ登録のクエリは、setField命令によってデータベース上の特定のフィールドにセットしたい値を指定していくことで組立てられる。いま処理対象領域のarea要素ではtype属性がtextとなっているので、指定された帳票上の領域がOCRにかけられて具体的な値がテキストデータとしてスキャン装置によって取り出される。
【0047】
結局insertタスクとしてはOCRによる文字認識、クエリの組立、ASPサーバへのクエリ送信という一連の処理が自動的に行われてデータベースに必要な情報が登録される。
【0048】
以上のように、スキャン設定ファイルでは、定型的な帳票に対してどの領域のデータを使ってどのような処理をどのような流れで自動的に実行したいかという内容を記述することができる。
【0049】
<その他の実施形態>
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(又は記憶媒体)を、システム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(又はCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
【0050】
また、コンピュータが読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を行う。その処理によって上述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0051】
更に、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって上述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0052】
本発明を前記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
【0053】
以上、上述した各実施形態によれば、スキャンの際にスキャンデータ中の領域を指定して領域毎に固有の処理を行うことができる。また、また、サーバ側だけでなくスキャン装置側でもデータの処理を行って両者を連携可能とすることができる。よって、スキャンデータの処理を効率的に行うことができるようにすることができる。
【0054】
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【図面の簡単な説明】
【0055】
【図1】スキャンシステムのシステム構成を示す図である。
【図2】スキャン機能を備えた複合機等のスキャン装置101の内部構成を表した図である。
【図3】サーバの一例のハードウェア構成図である。
【図4】本実施形態のスキャンシステムで処理の対象となる定型帳票の一例を示した図である。
【図5】本実施形態のスキャンシステムにおける全体的な処理の流れを示すフローチャートである。
【図6】帳票中の項目をASP上のデータベースに登録する処理の一例を示すフローチャートである。
【図7】帳票中の画像領域をデータとしてASP上のデータベースに登録する処理の一例を示すフローチャートである。
【図8】スキャン装置からASP上のデータベースへの登録方法を説明するための図である。
【図9】スキャン設定ファイルの記述例を示す図である。
【符号の説明】
【0056】
101 スキャン装置
102 サーバ
111 スキャン設定ファイル
【出願人】 【識別番号】000001007
【氏名又は名称】キヤノン株式会社
【出願日】 平成18年7月28日(2006.7.28)
【代理人】 【識別番号】100090273
【弁理士】
【氏名又は名称】國分 孝悦


【公開番号】 特開2008−35240(P2008−35240A)
【公開日】 平成20年2月14日(2008.2.14)
【出願番号】 特願2006−206722(P2006−206722)