トップ :: G 物理学 :: G06 計算;計数




【発明の名称】 文書間差異反映方法および文書間差異反映プログラムを記録した記録媒体
【発明者】 【氏名】高木 香佳栄

【要約】 【課題】従来の文書間差異抽出方法は、内容が少し異なる複数文書を管理しているような場合に、1つの文書に対して行った修正を他の文書に反映させるという用途には使用できない。

【解決手段】差異摘出手段12は、第一の文書と第二の文書との間の差異を抽出し、抽出された差異部分と第一の文書とを組み合わせたものを差異データの記憶部13に格納する。また、差異摘出手段12は、差異摘出の前に差異摘出条件を編集者から入力させる。差異データ適用手段16は、差異データ編集手段14が入力した差異部分を第一の文書に適用して第1の文書記録部100に内容を更新する。また、履歴採取手段17は、差異データの記憶部13に格納された差異部分を入力して、履歴データの記憶部18に保存する。
【特許請求の範囲】
【請求項1】 基準となる文書と他の文書との差異を抽出し、抽出した差異を用いて前記基準となる文書を更新する文書間差異反映方法。
【請求項2】 特定の差異を抽出する/しないの条件を入力し、入力された条件に従って、基準となる文書と他の文書との差異を抽出する請求項1記載の文書間差異反映方法。
【請求項3】 抽出した差異のうち選択された差異のみを用いて、前記基準となる文書を更新する請求項1または請求項2記載の文書間差異反映方法。
【請求項4】 追加された部分と差異のマークとが基準となる文書に付加された文書を差異データとして記憶する請求項3記載の文書間差異反映方法。
【請求項5】 記憶されている差異データを提示し、提示した差異データが修正された場合には、記憶されている差異データも同様に修正し、差異データにもとづいて基準となる文書を更新する請求項4記載の文書間差異反映方法。
【請求項6】 複数文書間の差異を抽出し、抽出した差異を文書に反映させる文書間差異反映プログラムを記録した記録媒体において、前記文書間差異反映プログラムは、基準となる文書と他の文書との差異を抽出し、抽出した差異を用いて前記基準となる文書を更新することを特徴とする文書間差異反映プログラムを記録した記録媒体。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、異なる文書間の差異部分を検出し、その差異にもとづいて文書を編集する文書間差異反映方法および文書間差異反映プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】文書の履歴管理を容易化したり文書編集を容易化する等の目的で、異なる文書間の差異部分を検出することが、コンピュータ等のデータ処理装置を用いて行われている。例えば、特開平7−334574号公報には、差分情報から所定の文書を作成するために、2つの文書間の差異部分を抽出する技術が開示されている。特開平9−319632号公報には、改訂前後の文書の差分情報を抽出し、差分情報と改訂前の文書のみを保存して、差分情報と改訂前の文書とを用いて改定後の文書を再現する方法が開示されている。
【0003】また、国際公開(WO)95/34039号公報には、編集前の文書を第一の文書とし編集後の文書を第二の文書とし、第一の文書と第二の文書との差分情報を抽出して編集処理の効率を向上させる方法が記載されている。図7は、WO95/34039号公報に記載された文書間差分文字列抽出装置の構成を示すブロック図である。図7において、第一の文書記録部100には第一の文書が記憶され、第二の文書記録部200には第二の文書が記憶される。この公報に記載された例では、第二の文書は、第一の文書に対して編集が施されたものである。文書分割部101は、第一の文書を所定の単位に分割し既分割文書記憶部102に保存する。所定の単位は例えば単語である。そして、差分抽出部103は、既分割文書記憶部102内の既分割文書と第二の文書とを比較し、差異部分を抽出する。
【0004】WO95/34039号公報には、さらに、差分抽出部103における差異抽出方法を補正できる例が記載されている。例えば、差分抽出部103が、第一の文書におけるある部分の”100円”と第二の文書における対応部分の”200円”との差異として、「”100”が”200”に変更」という差異情報を出力した場合に、差異情報を「”100円”が”200円”に変更」という情報に補正する。すると、第一の文書と第二の文書の以後の部分において、”100円”と”200円”との差異情報として「”100円”が”200円”に変更」という情報が差分抽出部103から出力される。
【0005】このような差異情報の出力は、第一の文書を編集して第二の文書を作成する作業を行っているときには便利である。編集者は、差分抽出部103の出力によって編集済み箇所を直ちに特定でき、しかも、差分抽出部103から出力される差異情報は、比較的文脈に沿った情報になっているからである。しかし、このような差異抽出方法は、第一の文書と第一の文書を編集して得られた第二の文書とがある場合に、差分にもとづいて、基準となった第一の文書も修正するような作業に適用することはできない。この方法は、あくまでも第一の文書を基準にして第二の文書を作成する際に用いられる方法であり、第一の文書を修正は、すなわち第二の文書の作成を意味するからである。
【0006】
【発明が解決しようとする課題】以上のように、従来の文書間差異抽出方法は、第一の文書と第二の文書との差異部分を抽出するものの、抽出された差異にもとづいて基準文書であった第一の文書を修正する概念を含んでいない。よって、従来の文書間差異抽出方法は、例えば、内容が少し異なる複数文書を管理しているような場合に、1つの文書に対して行った修正を他の文書に反映させるという用途には使用できない。また、例えば、第一の文書と第二の文書との間で、必要があって同じ意味の言葉を違う表現で表しているような場合に、従来の文書間差異抽出方法では、そのような箇所も差異として抽出してしまい文書編集等の効率化を阻害してしまう。
【0007】そこで、本発明は、抽出された差異にもとづいて、1つの文書に対して行った修正を他の文書に容易に反映させることができるとともに、同じ意味の言葉を違う表現で表しているような箇所を差異として抽出しないようにすることができる文書間差異反映方法および文書間差異反映プログラムを記録した記録媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明による文書間差異反映方法は、基準となる文書と他の文書との差異を抽出し、抽出した差異を用いて基準となる文書を更新するように構成される。文書間差異反映方法は、特定の差異を抽出する/しないの条件を入力し、入力された条件に従って基準となる文書と他の文書との差異を抽出するように構成されていてもよい。また、抽出した差異のうち選択された差異のみを用いて基準となる文書を更新するように構成されていてもよい。さらに、追加された部分と差異のマークとが基準となる文書に付加された文書を差異データとして記憶するように構成されていてもよい。そして、記憶されている差異データを提示し、提示した差異データが修正された場合には記憶されている差異データも同様に修正し、差異データにもとづいて基準となる文書を更新するように構成されていてもよい。
【0009】本発明による文書間差異反映プログラムを記録した記録媒体は、基準となる文書と他の文書との差異を抽出し、抽出した差異を用いて基準となる文書を更新するプログラムを記録したものである。
【0010】
【発明の実施の形態】以下、本発明の実施の形態を図面を参照して説明する。図1は、本発明による文書間差異反映方法を実行する装置を示すブロック図である。図1において、第一の文書記録部100には第一の文書が記憶され、第二の文書記録部200には第二の文書が記憶される。差異摘出手段12は、第一の文書と第二の文書との間の差異を抽出し、抽出された差異部分と第一の文書とを組み合わせたものを差異データの記憶部13に格納する。また、差異摘出手段12は、差異摘出の前に差異摘出条件を編集者から入力させる。
【0011】差異データ編集手段14は、ディスプレイに差異部分を明示して表示するとともに、編集者が入力装置に入力した第一の文書に反映させる差異部分を入力する。差異データ適用手段16は、差異データ編集手段14が入力した差異部分を第一の文書に適用して第1の文書記録部100に内容を更新する。また、履歴採取手段17は、差異データの記憶部13に格納された差異部分を入力して、履歴データの記憶部18に保存する。
【0012】差異摘出手段12、差異データ編集手段14、差異データ適用手段16および履歴採取手段17のディスプレイと入力装置以外の部分は、コンピュータ等のデータ処理装置の記憶装置に記憶されたソフトウェアで実現される。それらのソフトウェアは、例えば、CD−ROM等の記憶媒体からデータ処理装置にロードされる。なお、各手段が用いるディスプレイおよび入力装置は、データ処理装置に接続されているディスプレイおよび入力装置である。
【0013】次に、動作について図2のフローチャートを参照して説明する。ここでは、第一の文書と第二の文書は、内容がほとんど同じであるが、目的が異なるために用語等が異なっている文書であるとする。第一の文書は第一の文書記録部100にあらかじめ記憶され、第二の文書は第二の文書記録部200にあらかじめ記憶される。そして、第一の文書を基準にして第二の文書との差異部分を抽出するにあたって、差異摘出手段12は、差異摘出条件を編集者に入力させる(ステップS11,S12)。
【0014】差異摘出条件は、その条件に当てはまったときにのみ差異として摘出させる条件、または、差異として摘出させない条件である。例えば、ある言葉がある特定の言葉に置換されているときには摘出しないとする条件が指定された場合は、その置換を差異として摘出しない。なお、編集者が条件入力を行わない場合は、全て差異を摘出する。
【0015】次に、差異摘出手段12は、第一の文書の記憶部100と第二の文書の記憶部200の内容の差異を抽出する。その際、ステップS12で指定された条件で差異の抽出を行う(ステップS21)。そして、第一の文書のデータに差異データを組み合わせたものを差異データの記憶部13に格納する(ステップS22)。
【0016】さらに、差異データ編集手段14は、差異摘出手段12が抽出した差異を第一の文書に反映させるか否か編集者に選択させる。すなわち、差異データ編集手段14は、例えば差異データの記憶部13に格納されている差異データをディスプレイに表示する。編集者は、ディスプレイに表示された差異データにおける各差異のうち第一の文書に反映させるものを選択する。また、第一の文書に反映させる差異を必要ならば修正する。そして、差異データ編集手段14は、編集者の入力に応じて、差異データの記憶部103に格納されている差異データを更新する(ステップS31,S32)。
【0017】履歴採取手段17は、編集者が履歴変更指示をデータ処理装置に入力すると、変更履歴データを保存する(ステップS41,S42)。すなわち、差異データの記憶部103の記憶内容にもとづいて、差異部分のうち選択された部分、編集者によって修正された部分およびその前後何語かを修正履歴データとして採取し、履歴データの記憶部108に格納する。その際、履歴データを、日付、ページ、その他の付加情報とともに保存してもよい。
【0018】差異データ適用手段16は、編集者が第一の文書の更新指示をデータ処理装置に入力すると(ステップS51)、差異データの記憶部103に格納されている差異データを入力する。この差異データは、差異部分のうち編集者によって選択された部分および編集者によって修正された部分が明示されたデータである。差異データ適用手段16は、差異データを用いて、第一の文書の記憶部100の内容を更新する(ステップS52)。
【0019】以上のようにして、第一の文書における第二の文書との差異部分が抽出され、抽出された差異で第一の文書が更新される。ここで、差異データ抽出時に、編集者の指定によって、検出する差異および検出しない差異が選択される。第一の文書と第二の文書との間で、必要性があって同じ意味の言葉を違う表現で表している場合などには、何等の処理も行わないと差異データにその言葉が多数出現する可能性がある。しかし、ここでは必要のない差異は検出しないように選択できるので、そのような不都合は生じない。また、従来は、ほとんど同じではあるが少し内容が異なる文書を複数管理している場合に、1つの文書に対して行った修正を他の文書にも反映させるには文書ごとに手動で修正を加える必要があり修正もれも起こりやすかった。しかし、この実施の形態によれば、他の文書への修正反映が容易になるとともに、修正もれが起こりにくくなる。
【0020】次に、図3〜図6の説明図を参照して具体例について説明する。図3に示すように、第一の文書の一部301が”AAA BBB DDD EEE”であり、第二の文書の一部302が”AAA CCC DDD”であったとする。その場合、差異データの一部303として、”AAA BBB CCCDDD EEE”の”BBB”と”EEE”に削除マーク、”CCC”に追加マークが加えられたものが格納される。
【0021】差異データの一部303は、第一の文書の一部301を基準に第二の文書の一部302と比較した場合に、追加、削除があった語句にマークが付されたものである。追加マークおよび削除マークとして、各文書中に現れにくい任意のマークが使用される。
【0022】図4に示すように、差異摘出条件401が、”BBB”から”CCC”への置換は摘出しないという条件であったとする。すると、図3に示された例と同じ箇所を比較していた場合に、差異データの一部404として、”AAA BBBDDD EEE”の”EEE”に削除マークが加えられたものが格納される。つまり、”BBB”の削除マーク、”CCC”および”CCC”の追加マークは加えられない。このように、差異摘出条件が設定されると、差異データの作成時に、条件に当てはまる差異は抽出されない。なお、差異摘出条件を、抽出すべきものを特定する条件とすることもできる。
【0023】次に、差異摘出条件のもとに摘出された差異データの選択方法について説明する。図5に示すように、差異データの記憶部13に格納された差異データの一部501が、”AAA BBB CCC DDD EEE”の”BBB”と”EEE”に削除マーク、”CCC”に追加マークが加えられたものであるとする。差異データ編集手段14は、差異データの一部501をディスプレイに表示する。なお、この段階では、図5における斜線部分は表示されない。
【0024】編集者が、入力装置から第一の文書に反映したい部分を指定すると、例えば、差異データ編集手段14が、選択後のマーク部分を反転するなどの処理で画面上で判別できるようにする。図5に示された例のように、差異データが”AAABBB CCC DDD EEE”の”BBB”と”EEE”に削除マーク、”CCC”に追加マークが加えられたものである場合に、編集者が”EEE”の削除マークのみを選択したとする。すると、”EEE”の削除マークが例えば反転表示される(図5では斜線で示す。)。
【0025】そして、差異データ編集手段14は、選択されなかった”BBB”の削除マークを外し、選択されなかった”CCC”を除外し、選択された”EEE”の削除マークがそのまま残るように差異データを更新する。”CCC”は第二の文書において追加されたものであり、編集が選択しなかったということは、第一の文書に”CCC”を追加しないということを意味する。すなわち、元々の第一の文書に”CCC”は存在せず、かつ、追加を行わないので、”CCC”は第一の文書に対して全く編集対象にならない。そこで、差異データから除外される。
【0026】ここで、編集者が第一の文書の更新指示をデータ処理装置に入力したとする。すると、差異データ適用手段16は、差異データの記憶部103に格納されている差異データを入力する。そして、差異データ適用手段16は、差異データに従って第一の文書記録部100の内容を変更する。この例では、第一の文書の一部が、第一の文書への反映結果502に示されているように”AAA BBB DDD”となる。つまり、”EEE”が削除されたものになる。また、”BBB”の削除マーク、”CCC”の追加マークは無視されたことになる。文書変更の具体的な方法については、選択した後で選択した部分のみ差異を反映しない様に一括して変更するなど差異データとマークと選択を活用したさまざまな方法がある。
【0027】編集者が履歴変更指示をデータ処理装置に入力すると、履歴採取手段17は、変更履歴データを保存する。この例では、差異データの記憶部13には、選択された”EEE”の削除の情報が記憶されているので、修正履歴データとして”EEE”の削除が履歴データの記憶部108に格納される。
【0028】次に、第一の文書および選択された変更の内容を編集する方法について説明する。図6に示すように、差異データが”AAA BBB CCC DDD EEE”の”BBB”と”EEE”に削除マーク、”CCC”に追加マークが加えられたものであり、全てのマークが差異反映の対象として選択済みであるとする。”BBB”と”EEE”は削除されるので、”AAA”,”CCC”,”DDD”のみ編集が可能である。
【0029】この文字列に編集者が追加、削除、更新等を加えることができる。例えば、差異データ編集手段14によってディスプレイに表示されている内容に対して、編集者は、入力装置から文字列の変更を行う。図6に示すように、”AAA”を”ABA”に変更し、”CCC”を”CBC”に変更したとする。すると、差異データ編集手段14は、差異データの記憶部13に格納されている差異データにおいて、”AAA”を”ABA”に更新し、”CCC”を”CBC”に更新する。
【0030】ここで、編集者が第一の文書の更新指示をデータ処理装置に入力したとする。すると、差異データ適用手段16は、差異データの記憶部103に格納されている差異データを入力する。そして、差異データ適用手段16は、差異データに従って第一の文書記録部100の内容を変更する。この例では、差異データにおいて、”BBB”と”EEE”に削除マークが付され、”AAA”が”ABA”に更新され、”CCC”が”CBC”に更新されている。従って、第一の文書記録部100内の該当部分は、図6における第一の文書への反映結果602に示すように、”ABA CBC DDD”となる。このように、差異データの記憶部103に格納される差異データは、第一の文書に追加文字列と差異のマークが付加されたものであるから、差異データ自身の編集が可能である。そして、編集された差異データにもとづいて第一の文書を変更することもできる。
【0031】
【発明の効果】以上のように、本発明によれば、文書間差異反映方法および記録媒体に記録された文書間差異反映プログラムを、基準となる文書と他の文書との差異を抽出し、抽出した差異を用いて基準となる文書を更新するように構成したので、内容はほとんど同じであるが一部が少し異なる複数文書を管理しているような場合に、1つの文書に対して行った修正を他の文書に対しても容易に反映できる効果がある。また、特定の差異を抽出する/しないの条件を入力し、入力された条件に従って基準となる文書と他の文書との差異を抽出するように構成した場合には、必要があって同じ意味の言葉を違う表現で表しているようなときに、そのような表現を差異として抽出せず、基準となる文書の更新が効率化される効果がある。
【出願人】 【識別番号】000164449
【氏名又は名称】九州日本電気ソフトウェア株式会社
【出願日】 平成10年(1998)5月8日
【代理人】 【弁理士】
【氏名又は名称】岩壁 冬樹
【公開番号】 特開平11−327972
【公開日】 平成11年(1999)11月30日
【出願番号】 特願平10−142153