| 【発明の名称】 |
文書処理装置 |
| 【発明者】 |
【氏名】岩田 伸夫
|
| 【要約】 |
【課題】処理対象となる文書データとその処理内容を指示する指示データとを含む処理情報がメタ言語等によるものであっても、その処理情報を処理する際にメモリ容量を大量に消費してしまうことを回避する。
【解決手段】文書データと指示データとを含む処理情報を取得した場合に、その処理情報を解析して所定形式の内部データに展開するとともに、その処理情報の中から文書データを抽出し、文書データを抽出した後の内部データを第一格納手段に格納し、抽出した文書データについては前記第一格納手段とは別の第二格納手段に格納する。 |
【特許請求の範囲】
【請求項1】 処理対象となる処理対象データおよび当該処理対象データの処理内容を指示する指示データを含む処理情報を取得する取得手段と、前記取得手段が取得した処理情報を解析して所定形式の内部データに展開する展開手段と、前記取得手段が取得した処理情報の中から当該処理情報に含まれる処理対象データを抽出する抽出手段と、前記展開手段が展開した内部データ中に前記抽出手段が抽出した処理対象データとの関連付け情報を付加する関連付け手段と、前記抽出手段により処理対象データが抽出され、かつ、前記関連付け手段により関連付け情報が付加された後の内部データを格納する第一格納手段と、前記第一格納手段とは別に前記抽出手段により抽出された処理対象データを格納する第二格納手段とを備えることを特徴とする文書処理装置。 【請求項2】 前記取得手段は、構造化された要素によって構成された処理情報を取得するものであり、前記抽出手段は、前記構造化された要素のうちのタグ情報またはタグに含まれる属性情報に基づいて処理対象データを抽出するものであることを特徴とする請求項1記載の文書処理装置。 【請求項3】 前記取得手段が取得した処理情報に含まれる処理対象データのデータ量を認識するデータ量認識手段と、前記データ量認識手段での認識結果に基づいて当該処理情報に含まれる処理対象データを前記第一格納手段に格納させるか前記第二格納手段に格納させるかを選択する選択手段とを備えることを特徴とする請求項1または2記載の文書処理装置。 【請求項4】 前記取得手段が構造化された要素によって構成された処理情報を取得する場合に、当該取得手段が取得した各要素のデータ量を計測するデータ量計測手段を備えるとともに、前記第二格納手段は、前記抽出手段により抽出された処理対象データのみならず、前記データ量計測手段により計測されたデータ量が所定量を超える要素をも格納するものであることを特徴とする請求項1,2または3記載の文書処理装置。
|
【発明の詳細な説明】【0001】 【発明の属する技術分野】本発明は、例えばコンピュータ装置、プリンタ装置、ファクシミリ装置またはデータ格納装置のように、処理対象である文書データを受け取ってこれに所定処理を行う文書処理装置に関するものである。 【0002】 【従来の技術】一般に、文字や画像を含む文書についての電子的な文書データは、その文書データの処理内容(例えば処理の方法)を指示する指示データと共に授受されることが多いが、これらを授受する手法としては以下の二つが広く知られている。 【0003】一つは、画像ファイルの記録に使用されるフォーマットであるTIFF(Tagged Image File Format)等に画像等を含む文書データ格納し、その付加情報に処理内容に関する指示データを格納するものである。例えば、TIFF形式の場合、付加情報は、IFD(Image File Directory)に格納される。通常、IFDには、解像度や圧縮方法等の画像に関する属性が格納されるが、例えば印刷部数指定や両面印刷等の処理方法に関する情報を格納するために使用することも可能である。 【0004】他の一つは、米国アドビシステムズ(Adobe Systems)社のポストスクリプト(PostScript)に代表されるページ記述言語(Page Description Language;PDL)中に文書データを含めるものである。この場合には、印刷部数指定や両面印刷等の処理方法に関する情報も、画像等を含む文書データと同様に、PDLで表現される。 【0005】ところで、近年では、情報機器間でデータを授受する汎用的な手段として、XML(eXtensible Markup Language)が普及し始めている。XMLは、言語を定義するための言語であり、一般にメタ言語と呼ばれている。メタ言語としては、SGML(Standard Generalized Markup Language)と呼ばれるものが広く利用されているが、XMLはそのSGMLをより簡略化したものである。したがって、XMLに従って記述されたデータを処理することは、SGMLに従って記述されたデータを処理することに比べて容易となる。例えば、インターネット文書の記述言語として広く普及しているHTML(Hyper Text Markup Language)はSGMLに準拠した言語であるが、近年では、その処理を容易化し、携帯電話等の処理能力の低い機器でインターネット文書を表示可能とすることを狙ったXHTML(eXtensible Hyper Text Markup Language)も提案されている。このように、XMLは、処理が比較的簡単であるため、文書を表現する言語のためのメタ言語として使用されるにとどまらず、EDP(Electronic Data Processing)と呼ばれる電子的手段によるデータ処理や、EDI(Electronic Data Interchange)と呼ばれる電子取引で用いられる情報処理用のデータの表現手段等にも利用されつつある。 【0006】以上のように、XMLが情報処理用のデータとして使用されるようになったため、コンピュータ装置等に対しては、XMLで表現されたデータを処理するためのXMLパーザと呼ばれるソフトウェアが提供されている。XMLパーザとは、XMLで表現されたデータを、コンピュータ装置等で処理可能な形式の内部データに変換するものである。さらには、XMLパーザによって生成される内部データを参照または操作するために、DOM(Document Object Model)と呼ばれるAPI(Application Program Interface)も提案されている。 【0007】これらのことから、上述した文書データとその指示データとを併せて授受する手法についても、XMLを適用することが容易に想定される。しかも、XMLを適用した場合には、TIFF形式やPDL対応の場合に比べて、データ処理に対する汎用性が高まる。すなわち、TIFF形式やPDL対応の場合のように、処理すべきデータと処理を行う機種との間のマッチングが大きな問題になるといったこともない。この点からも、上述のようにXMLの適用が広まることが予想される。 【0008】 【発明が解決しようとする課題】しかしながら、文書データとその指示データとがXMLで表現されている場合には、汎用的なXMLパーザを使用して処理し内部データに変換するため、その内部データにデータ量の大きい画像部分等が含まれていると、その処理にあたって画像部分が大量にメモリ容量を消費してしまうことになる。特に、仮想記憶機能を搭載した装置では、このようなデータがメモリに出力されると、他のデータがディスクにスワップアウトされてしまうため、装置全体の処理効率の低下を招いてしまうおそれがある。 【0009】つまり、従来の技術では、文書データとその指示データとがXMLに代表される汎用性の高いメタ言語によるものであると、データ量の大きい画像部分等によって大量にメモリ容量を消費してしまう可能性があり、結果として装置コスト低下への障害や処理効率低下の要因等になってしまうおそれがある。 【0010】そこで、本発明は、文書データとその指示データとが汎用性の高いメタ言語による場合であっても、画像部分等によって大量にメモリ容量を消費してしまうことのない文書処理装置を提供することを目的とする。 【0011】 【課題を解決するための手段】本発明は上記目的を達成するために案出された文書処理装置で、処理対象となる処理対象データおよび当該処理対象データの処理内容を指示する指示データを含む処理情報を取得する取得手段と、前記取得手段が取得した処理情報を解析して所定形式の内部データに展開する展開手段と、前記取得手段が取得した処理情報の中から当該処理情報に含まれる処理対象データを抽出する抽出手段と、前記展開手段が展開した内部データ中に前記抽出手段が抽出した処理対象データとの関連付け情報を付加する関連付け手段と、前記抽出手段により処理対象データが抽出され、かつ、前記関連付け手段により関連付け情報が付加された後の内部データを格納する第一格納手段と、前記第一格納手段とは別に前記抽出手段により抽出された処理対象データを格納する第二格納手段とを備えることを特徴とする。 【0012】上記構成の文書処理装置によれば、取得手段が取得した処理情報については、展開手段がその処理情報を解析して所定形式の内部データに展開するので、その内部データを基にすれば、処理情報が例えばメタ言語によるものであっても、その処理情報に含まれる処理対象データを指示データに従いつつ処理することが可能になる。しかも、その処理にあたって、抽出手段が処理情報から抽出した処理対象データについては、第一格納手段に格納される内部データとは別に、第二格納手段に格納される。ここで、第一格納手段としては、高速処理に適した記憶装置で、例えばコンピュータ装置等のメモリとして用いられるものが、また第二格納手段としては、第一格納手段とは異なる大容量の記憶装置が考えられる。したがって、例えば処理対象データがデータ量の大きい画像部分を含む文書データであっても、これを抽出手段が処理情報から抽出すれば、内部データを格納する第一格納手段の容量を大量に消費してしまうのを回避し得るようになる。 【0013】 【発明の実施の形態】以下、図面に基づき本発明に係る文書処理装置について説明する。ただし、ここでは、本発明を文書データの印刷処理を行うプリンタ装置に適用した場合を例に挙げて説明する。 【0014】先ず、本発明を適用したプリンタ装置が用いられるシステム構成について説明する。図1は、プリンタ装置が動作するシステム構成の概略図である。図例のように、本実施形態で説明するプリンタ装置1は、LAN(Local Area Network)2を経由して、クライアント装置3と接続している。ただし、LAN2は、例えばインターネット等の広域ネットワークであってもよい。また、クライアント装置3は、例えばコンピュータ装置からなり、プリンタ装置1に対して文書データの印刷要求を発行するものであるが、その印刷要求をXMLに従って記述されたデータによって発行するものとする。したがって、プリンタ装置1では、LAN2を介して、クライアント装置3から文書データを含む文書印刷要求(XML準拠のもの)を受信するとともに(図中矢印A参照)、受信した文書印刷要求を解析してその受付応答結果をクライアント装置3へ返信し(図中矢印B参照)、その後に受信した文書印刷要求の内容に従って文書データを印刷出力するようになっている。 【0015】次いで、以上のようなシステムにおいて用いられるプリンタ装置のハードウェア構成について説明する。図2は、本実施形態で説明するプリンタ装置のハードウェア構成を示すブロック図である。図例のように、プリンタ装置1は、少なくとも、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、LANインタフェース14と、ハードディスク部15と、プリンタインタフェース16とを備えている。 【0016】このようなハードウェア構成により、プリンタ装置1では、電源投入後、CPU11がROM12に格納された所定プログラムを実行する。ここで実行される所定プログラムによって使用されるデータ領域は、RAM13上のアドレスに割り当てられており、初期化時にRAM13上複写される。また、ここで実行される所定プログラムのスタックおよび作業データもRAM13に割り当てられる。また、その所定プログラムは、LANインタフェース14を介して、LAN2に接続された他のネットワーク機器(例えばクライアント装置3)と通信する。また、その所定プログラムは、通信により得られたコマンドに従い、受信したデータを一旦ハードディスク部15にスプールする。さらにその所定プログラムは、スプールされたデータを読み出しながら画像形成(デコンポーズ)し、コマンドに従いプリンタインタフェース16を介して図示しないプリンタエンジンに送出し、そのプリンタエンジンに印刷出力させる。つまり、プリンタ装置1では、CPU11がROM12内の所定プログラムを実行することにより、クライアント装置3からの文書印刷要求を処理する際に必要となる各機能が実現される。 【0017】続いて、CPU11でのプログラム実行により実現されるプリンタ装置1の機能構成(ソフトウェア構成)について詳しく説明する。図3は、本実施形態で説明するプリンタ装置の機能構成を示すブロック図である。図例のように、プリンタ装置1は、通信部21、XML解析部22、内部データ格納部23、文書データ格納部24、展開部25、ビットマップデータ格納部26および出力部27としての機能を備えている。 【0018】通信部21は、クライアント装置3からの文書印刷要求、さらに詳しくは、印刷出力の対象となる文書データおよびその文書データの処理内容(印刷部数、編集処理等)を指示する指示データを含む処理情報を、文書印刷要求として取得するものである。 【0019】XML解析部22は、通信部21が取得した処理情報を解析し、所定形式の内部データ、すなわちプリンタ装置1内で処理可能な形式の内部データに展開するものである。さらに、XML解析部22は、処理情報の解析結果に基づいて、その処理情報の中から文書データを抽出するものである。 【0020】内部データ格納部23は、XML解析部22により展開された内部データを一時的に格納するものである。ただし、内部データ格納部23では、内部データの格納を、例えばRAM13を用いて行うようになっている。 【0021】文書データ格納部24は、XML解析部22により抽出された文書データを一時的に格納するものである。ただし、文書データ格納部24では、文書データの格納を、例えばハードディスク部15を用いて行うようになっている。 【0022】展開部25は、XML解析部22により抽出された文書データをビットマップデータに展開するものである。ただし、展開部25は、文書データからビットマップデータへの展開を、XML解析部22により展開された内部データを参照しつつ行うようになっている。これにより、展開部25では、ビットマップデータへの展開にあたって、例えば、拡大/縮小、Nアップ(1ページの用紙に縮小した複数ページ分の画像を並べる)等の編集処理を行うことが可能となる。 【0023】ビットマップデータ格納部26は、展開部25により展開されたビットマップデータを一時的に格納するものである。 【0024】出力部27は、展開部25により展開されたビットマップデータを、プリンタインタフェース16を介してプリンタエンジンに送出し、記録用紙上への画像形成(印刷出力)を行わせるものである。ただし、このとき、出力部27は、XML解析部22により展開された内部データを参照しつつ、プリンタエンジンに対する制御情報を得る。これにより、出力部27では、プリンタエンジンでの印刷出力にあたって、用紙サイズの選択、両面印刷の有無指示、印刷部数の指定、ステープル処理等を行うことが可能となる。 【0025】ここで、このような機能構成のうちの通信部21が、クライアント装置3から取得する処理情報について詳しく説明する。クライアント装置3からは、LAN2を経由して、印刷出力すべき文書データと、その文書データの処理内容(印刷部数、編集処理等)を指示する指示データとが、処理情報として送られてくる。ただし、その処理情報は、XMLに従って記述されたデータ(以下「XMLデータ」という)により表現されている。 【0026】図4には、XMLデータの一具体例を示す。図例のように、XMLデータ30は、“<”で始まる開始タグと、“</”で始まる終了タグとが、入れ子状に構成されている。また、XMLデータ30は、開始タグとこれに対応する終了タグとの間を一つの要素とすると、その構造化された要素の組み合わせによって構成されている。したがって、XMLデータ30は、最も外側が一つのタグ(開始タグおよび終了タグ)で括られているとともに、要素によっては、開始タグと終了タグとの間に、別の要素またはコンテントと呼ばれる文字列を含んでいる。 【0027】なお、通信部21が取得するXMLデータ30には、クライアント装置3からの印刷要求(ジョブ)に関する指示データ31と、そのジョブの状態通知に関する指示データ32と、そのジョブによって印刷出力すべき文書データ33と、が含まれているものとする。 【0028】続いて、このようなXMLデータ30をXML解析部22が展開した後の内部データについて詳しく説明する。図5は、内部データの構造の一具体例を示す概念図である。図例のように、内部データ40は、XMLデータ30の入れ子構造に対応して、木構造を構成している。すなわち、XMLデータ30における最も外側のタグが、内部データ40における木構造の最上位の節に対応する。また、XMLデータ30を構成する各要素は、図中における楕円部分に相当する。ただし、図中において、開始タグと終了タグとの間に位置する各コンテントは、「PCDATA」と記した矩形によって表している。 【0029】なお、内部データ40には、XMLデータ30と同様に、ジョブに関する指示データ41と、そのジョブの状態通知に関する指示データ42とが含まれているが、後述する理由により、そのジョブによって印刷出力すべき文書データ自体については含まれていない。 【0030】次に、以上のように構成されたプリンタ装置1における処理動作例について説明する。特に、ここでは、XML解析部22が行う処理動作を中心に説明を行う。図6は、本実施形態で説明するプリンタ装置での処理動作の一例を示すフローチャートである。 【0031】プリンタ装置1では、通信部21がクライアント装置3からLAN2を介して送られてきたXMLデータを取得すると、XML解析部22がそのXMLデータについての解析を開始する。 【0032】XMLデータの解析にあたっては、先ず、XML解析部22は、内部データの木構造の階層レベルについて、現在の階層レベルを「0」、すなわち最上位を示す値に設定する(ステップ101、以下ステップを「S」と略す)。そして、通信部21からXMLデータを順次受け取って解析し(S102)、その受け取ったデータ部分が開始タグであるか否かを判定する(S103)。 【0033】判定の結果、開始タグを検出すれば(S103:Yes)、XML解析部22は、内部データ中における木構造の現在の階層レベルに、タグ情報に相当する要素を追加した後(S104)、その現在の階層レベルに「1」を加算する(S105)。つまり、XML解析部22は、受け取ったXMLデータのデータ部分を、内部データの木構造を構成する各要素(図5中の楕円部分)に展開する。 【0034】このとき、処理した開始タグが文書データについてのもの、すなわち例えば“<document−data>”であった場合には(S106:Yes)、XML解析部22は、その文書データを出力するファイルの格納箇所の割り当てを行う(S107)。つまり、その文書データを文書データ格納部24に格納させるにあたっての格納箇所、例えばURL(Uniform Resource Locator)を特定する。 【0035】さらに、XML解析部22は、割り当てたファイルを内部データ中の文書データタグに対応する要素に関連付ける(S108)。この関連付けは、内部データ中の文書データタグの要素として、文書データが出力されるファイル名に関する情報を付加することによって行う(図5中の43参照)。ただし、文書データを識別し得る情報であれば、ファイル名に関する情報以外の他の識別情報(例えば個別ID)を付加するようにしてもよい。 【0036】そして、XML解析部22は、このような通信部21からのXMLデータの受け取りおよび解析を(S109)、コンテントが終了するまで、すなわち終了タグを検出するまで継続して行い、コンテントが終了すると(S110:Yes)、そのコンテント、すなわちXMLデータに含まれる文書データ部分を、先に割り当てた文書データ格納部24内の格納箇所へファイル出力する(S111)。 【0037】ただし、受け取ったデータ部分が開始タグでなければ(S103:No)、XML解析部22は、続いて、そのデータ部分が終了タグであるか否かを判定し、終了タグであれば(S112:Yes)、内部データの木構造の現在の階層レベルを「1」減算する(S113)。その結果、現在の階層レベルが「0」より大きければ(S114)、XML解析部22は、さらに後続するXMLデータについての読み出し処理を繰り返す(S102〜S114)。一方、現在の階層レベルが「0」の場合には(S114:No)、最も外側のタグが閉じられたことになるので、処理を終了する。 【0038】また、データ部分が開始タグでもなく(S103:No)、終了タグでもなかった場合には(S112:No)、XML解析部22は、そのデータ部分を内部データの木構造中におけるコンテントとして内部データ格納部23へ送出して格納させる(S115)。 【0039】このような処理動作をXML解析部22が行うことによって、通信部21が取得したXMLデータについては、プリンタ装置1で処理可能な形式の内部データに展開されるので、その内部データを基にすれば、展開部25がその内部データを参照しつつビットマップデータへの展開を行ったり、出力部27がその内部データを参照しつつプリンタエンジンでの印刷出力を制御情報したりすることが可能となる。つまり、クライアント装置3から取得するのが例えばメタ言語によるXMLデータであっても、そのXMLデータに含まれる文書データを指示データに従いつつ印刷出力処理することが可能になる。 【0040】また、例えばメタ言語によるXMLデータを取得することから、XML解析部22として、XMLパーザと呼ばれる汎用的なソフトウェアを用いることができ、その取得データを処理する上での汎用性が高まる。すなわち、TIFF形式やPDL対応の場合のように、処理すべきデータと処理を行う機種との間のマッチング、すなわちクライアント装置3とプリンタ装置1とのマッチングが大きな問題になるといったこともない。 【0041】しかも、XML解析部22が上述したような処理動作を行えば、取得したXMLデータを処理するのにあたって、XMLデータに含まれる文書データについては、内部データ格納部23に格納される内部データとは別に、文書データ格納部24に格納される。ここで、内部データ格納部23は高速処理に適したRAM13を用いて内部データを格納する一方、文書データ格納部24は大容量のハードディスク部15を用いて文書データを格納する。そのため、文書データがデータ量の大きい画像部分等を含んでいても、RAM13の容量を大量に消費してしまうことがなくなる。つまり、RAM13の容量を大量に消費することによる弊害(例えば、装置コストの上昇や処理効率の低下等)を未然に回避し得るようになる。 【0042】その上、文書データを内部データとは別に文書データ格納部24に格納させる場合であっても、XML解析部22は、その文書データをXMLデータから抽出する際に、内部データ中に文書データとの関連付け情報を付加するので、文書データと内部データとの対応関係が不明確になってしまうことがない。つまり、RAM13の消費容量の削減を図りつつ、文書データの印刷出力制御の的確化が実現できるようになる。 【0043】特に、XML解析部22は、例えばタグ“document−data”といった、XMLデータを構成するタグの種類(タグ情報)に基づいて、そのXMLデータ中に含まれる文書データであるか否かの判断を行い、その文書データの抽出を行っているので、その抽出を的確かつ確実に行うことができる。 【0044】なお、以上に説明した処理動作例では、タグ“document−data”を判断し、そのタグ内の文書データを文書データ格納部24に格納させるように判断したが、他のタグを判断するようにしても良い。また、タグ中の属性や属性値等を判断するようにしても良い。さらに、属性を判断する場合であれば、例えば<document−data store>といったように、“store”という属性が書かれていれば、文書データ格納部24に格納させるようにしても良い。この場合、タグが“document−data”タグに限り、store属性が書かれたタグのみを対象としても良いし、タグが“document−data”タグに限らず、store属性が書かれたタグ全てを対象にするようにしても良い。また、<document−data size=“20000”>のようなタグを入力し、size属性に示された値を基に判断するようにしても良い。 【0045】次に、XML解析部22が行う処理動作の他の例について説明する。図7は、本実施形態で説明するプリンタ装置での処理動作の他の例を示すフローチャートである。 【0046】ここで説明する他の例においても、XMLデータの解析にあたって、XML解析部22は、先ず、内部データの木構造の現在の階層レベルを、最上位を示す値である「0」に設定する。さらに、ここでは、階層レベルの設定と同時に、内部データに出力済のコンテントのデータ量の計測値をゼロに設定する(S201)。その後、XML解析部22は、通信部21からXMLデータを順次受け取って解析し(S202)、その受け取ったデータ部分が開始タグであるか否かを判定する(S203)。 【0047】判定の結果、開始タグを検出すれば(S203:Yes)、XML解析部22は、内部データ中における木構造の現在の階層レベルにタグ情報に相当する要素を追加した後(S204)、その現在の階層レベルに「1」を加算する(S205)。つまり、XML解析部22は、受け取ったXMLデータのデータ部分を、内部データの木構造を構成する各要素(図5中の楕円部分)に展開する。また、XML解析部22は、内部データにおける出力済コンテントのデータ量の計測値を、「0」にリセットする(S206)。 【0048】ただし、読み出した部分が開始タグでなく(S203:No)、終了タグであった場合には(S207:Yes)、XML解析部22は、内部データ中の木構造の現在の階層レベルを「1」減算する(S208)。その結果、現在の階層レベルが「0」より大きければ(S209)、XML解析部22は、さらに後続するXMLデータについての解析処理を繰り返す(S202〜S209)。一方、現在の階層レベルが「0」の場合には(S209:No)、最も外側のタグが閉じられたことになるので、処理を終了する。 【0049】また、読み出した部分が開始タグでもなく(S203:No)、終了タグでもなかった場合には(S207:No)、XML解析部22は、そのデータ部分を内部データの木構造中におけるコンテントとして内部データ格納部23へ送出して格納させる(S210)。このとき、XML解析部22は、送出したコンテントのデータ量を計測値に加算する(S211)。 【0050】ここで、データ量の計測値が、予め設定されている基準値に達しなければ(S212:No)、XML解析部22は、再び上述した解析処理を繰り返して行う(S202〜S212)。 【0051】ただし、データ量の計測値が基準値に達した場合には(S212:Yes)、XML解析部22は、その計測値が基準値に達したデータ部分を出力するファイルの格納箇所の割り当てを行う(S213)。つまり、そのデータ部分を文書データ格納部24に格納させるにあたっての格納箇所を特定する。 【0052】さらに、XML解析部22は、割り当てたファイルを内部データ中の対応する要素に関連付け(S214)、既に内部データ格納部23へ送出済の該当コンテントを文書データ格納部24に移動させる(S215)。なお、このときの関連付けは、先に説明した処理動作例の場合と同様にして行えばよい。 【0053】その後、XML解析部22は、このような通信部21からのXMLデータの受け取りおよび解析を(S216)、コンテントが終了するまで(S217)、すなわち終了タグを検出するまで継続して行い、そのコンテント、すなわちXMLデータに含まれる文書データ部分を、先に割り当てた文書データ格納部24内の格納箇所へファイル出力する(S218)。そして、コンテントが終了すると(S217:Yes)、XML解析部22は、上述したステップ(S203)に戻る。ここで、コンテントが終了した場合、終了タグまたは開始タグが検出されることになるので、コンテントのデータ量の計測値はゼロにリセットされる(S206)。 【0054】このような処理動作をXML解析部22が行うことによって、プリンタ装置1ででは、先に説明した処理動作例の場合と同様に、文書データによるRAM13の容量の大量消費を抑制でき、その大量消費による弊害(例えば、装置コストの上昇や処理効率の低下等)を未然に回避し得るようになる。 【0055】ただし、ここで説明した処理動作例においては、データ量が予め設定された基準値以上のデータ部分について、XML解析部22がそのデータ部分を文書データ格納部24に格納させている。つまり、XML解析部22によるデータ量の認識結果に基づいて、一定のデータ量以上のものは文書データ格納部24に格納されるが、文書データであっても一定のデータ量未満のものは内部データ格納部23に格納されることになる。したがって、RAM13の容量の大量消費を招かない範囲で文書データもそのRAM13内に格納されるので、より一層の処理効率の向上が期待できる。 【0056】さらに、ここで説明した処理動作例においては、データ量と基準値との比較を行うべく、通信部21から受け取ったXMLデータの各データ部分のデータ量をXML解析部22が計測しているので、その計測結果が基準値以上のデータ部分については、文書データ格納部24に格納されることになる。したがって、文書データ格納部24には、文書データのみならず、データ量が基準値以上の要素(指示データ等)も格納されようになり、RAM13の容量の大量消費による弊害をより一層確実に回避し得るようになる。 【0057】ただし、データ量の計測は必ずしも行う必要はなく、例えばタグ中の属性にデータ量に関する情報が含まれていれば、これを基にデータ量を認識することも考えられる。 【0058】以上に説明した実施形態では、プリンタ装置1がXMLデータを取得して、そのXMLデータについての印刷出力処理を行う場合を例に挙げて説明したが、例えばSGMLに準拠したHTMLデータのように、文書データとその指示データとが汎用性の高いメタ言語によるものであれば、全く同様に適用することが可能である。 【0059】また、上述した実施形態では、本発明をプリンタ装置1に適用した場合を例に挙げて説明したが、処理対象となる文書データを受け取ってこれに所定処理を行うものであれば、他の文書処理装置であっても、全く同様に適用することが可能である。他の文書処理装置としては、文書データの作成、編集、閲覧等を行うコンピュータ装置、文書データの送受信を行うファクシミリ装置、文書データの記憶蓄積および管理を行うデータ格納装置等が挙げられる。 【0060】 【発明の効果】以上のように、本発明に係る文書処理装置は、処理情報に含まれる処理対象データを抽出し、これをその処理情報を展開した後の内部データとは別に格納するので、処理情報が例えばメタ言語による場合であっても適切な処理が可能であるのに加えて、その処理に必要となるメモリ容量を処理対象データが大量に消費してしまうことがなくなる。したがって、特に仮想記憶機能を搭載した装置においては、データのスワップアウトを抑制できるので、装置全体の処理効率の低下を抑えられる。また、メモリ容量の削減も可能になることから、装置コストの低減が容易となる。
|
| 【出願人】 |
【識別番号】000005496 【氏名又は名称】富士ゼロックス株式会社
|
| 【出願日】 |
平成12年10月27日(2000.10.27) |
| 【代理人】 |
【識別番号】100086298 【弁理士】 【氏名又は名称】船橋 國則
|
| 【公開番号】 |
特開2002−132751(P2002−132751A) |
| 【公開日】 |
平成14年5月10日(2002.5.10) |
| 【出願番号】 |
特願2000−327973(P2000−327973) |
|