| 【発明の名称】 |
高可用性システム |
| 【発明者】 |
【氏名】前田 俊博
|
| 【要約】 |
【課題】高可用性システムとしてより高可用性を向上する。
【解決手段】複数の処理装置1a、1b、1c、1d上に複数の仮想マシン7a,7b,7c,7dを設け、かつ、これら仮想マシン7a,7b,7c,7dそれぞれ任意の機能を一対一に配置する。トランザクション管理部5は、処理装置1a、1b、1c、1dのうち、いずれかの処理装置をマスタマシンとして、マスタマシンにより、仮想マシン7a,7b,7c,7dの実行を制御する。高可用性処理部6は、マスタマシンに設定された処理装置に障害が発生した場合は、マスタマシンを代替するためのバックアップマシンに割り当てられた処理装置に切替制御を行う。 |
【特許請求の範囲】
【請求項1】 複数の処理装置からなる高可用性システムであって、前記複数の処理装置上に複数の仮想マシンを設け、かつ、当該複数の仮想マシンにそれぞれ任意の機能を一対一に配置すると共に、前記複数の処理装置のいずれかの処理装置をマスタマシンとして、当該マスタマシンにより、前記複数の仮想マシンの実行を制御するトランザクション管理部と、前記複数の処理装置において、前記マスタマシンに設定された処理装置に障害が発生した場合は、前記マスタマシンを代替するためのバックアップマシンに割り当てられた処理装置に切替制御を行う高可用性処理部とを備えたことを特徴とする高可用性システム。
|
【発明の詳細な説明】【0001】 【発明の属する技術分野】本発明は、高可用性システム、特にトランザクション管理ソフトウェアと高可用性ソフトウェアの連携させた高可用性システムに関する。 【0002】 【従来の技術】従来よりシステムの利用できる状態を高める高可用性システムに関する技術が知られている。ここで、高可用性(High Availability)とは、「システムが何らかの障害により停止してしまった場合でも、できるだけシステムとしての復旧を早くすることができる度合い」即ち、システムが利用できる状態の度合いをいう。従来、このような高可用性システムとしては、現時点で機能を提供しているマシン(主系)と現時点では機能を提供せず待機しているマシン(従系)の2台より構成し、これら2台のマシンが高可用性ソフトウェアを実行し、主系で以上が発生した場合は従系において機能を提供するように切り替えていた。 【0003】 【発明が解決しようとする課題】しかしながら、上記のような従来の高可用性システムでは、系切り替えが発生した場合のダウンタイムが長いという問題点があった。 【0004】 【課題を解決するための手段】本発明は、前述の課題を解決するため次の構成を採用する。 〈構成1〉複数の処理装置からなる高可用性システムであって、複数の処理装置上に複数の仮想マシンを設け、かつ、複数の仮想マシンにそれぞれ任意の機能を一対一に配置すると共に、複数の処理装置のいずれかの処理装置をマスタマシンとして、マスタマシンにより、複数の仮想マシンの実行を制御するトランザクション管理部と、複数の処理装置において、マスタマシンに設定された処理装置に障害が発生した場合は、マスタマシンを代替するためのバックアップマシンに割り当てられた処理装置に切替制御を行う高可用性処理部とを備えたことを特徴とする高可用性システム。 【0005】 【発明の実施の形態】以下、本発明の実施の形態を具体例を用いて詳細に説明する。 《具体例》 〈構成〉図1は、本発明の高可用性システムの具体例を示す構成図である。図のシステムは、複数の処理装置1a、1b、1c、1dがネットワーク(LAN)2を介して接続され、ネットワーク上で一つのシステムとして存在している。尚、本具体例では処理装置として4台の場合を示しているが、5台以上の処理装置がネットワーク2に接続される構成であってもよい。また、処理装置1a、1bにはディスク装置3が、処理装置1c、1dにはディスク装置4がそれぞれ接続されている。ディスク装置3は、処理装置1aまたは処理装置1bで使用可能であり、必要に応じて切り替え可能である。また、ディスク装置4も、同様に、処理装置1cまたは処理装置1dで使用可能でかつ切り替え可能である。 【0006】処理装置1a、1b、1c、1dには、共通のトランザクション管理部5および高可用性処理部6が設けられており、また、各処理装置1a、1b、1c、1dには、それぞれ仮想マシン7a,7b,7c,7dが設けられている。これら仮想マシン7a,7b,7c,7dは、機能A、機能B、機能C、機能Dに一対一に対応してこれらの機能を実現するための仮想マシンである。 【0007】トランザクション管理部5は、いずれかの処理装置をマスタマシンとして、このマスタマシンにより複数の処理装置間にまたがった分散トランザクション処理を管理したり、1台の処理装置内に同一プロセスを複数実行するといったトランザクションの管理を行う機能部であり、仮想マシン7a,7b,7c,7dの起動・実行の管理を行う機能を有している。高可用性処理部6は、マスタマシンに設定されている処理装置に障害が発生した場合、マスタマシンを代替するためのバックアップマシンに割り当てられた処理装置に切替制御を行う機能部である。 【0008】図2は、処理装置1a、1bでの機能配置の一例を示す説明図である。通常の運用状態において、処理装置1aはマスタマシンに設定され、かつ、仮想マシン7a,7bが配置され、そのうち仮想マシン7aを使用する。ここで、マスタマシンとはシステム全体を管理し、機能の起動、停止のコマンドを受け付けるためのマシンであり、トランザクション管理部5は、このマスタマシンにより、各仮想マシン7a,7b,7c,7dの実行を制御する。仮想マシン7aでは機能Aを実現し、関連するデータとトランザクションログをディスク装置3の領域3aに格納する。 【0009】処理装置1bはバックアップマシンに設定され、仮想マシン7a,7bが配置され、そのうち仮想マシン7bを使用する。バックアップマシンとは、マスタマシンがダウンした場合に管理機能を代替できる唯一のマシンである。仮想マシン7bでは機能Bを実現し、関連するデータとトランザクションログをディスク装置3の領域3bに格納する。 【0010】〈動作〉図3は、本具体例の高可用性システムの動作を示すフローチャートである。マスタマシンである処理装置1aがマシンダウンとなった場合、高可用性処理部6がこれを検出する(ステップS1)。マシンダウンが検出されると、高可用性処理部6は、実行されている仮想マシン7aのデータとトランザクションログを移行する(ステップS2)。即ち、通常は処理装置1aからのみアクセスされている領域3aのデータとトランザクションログを、処理装置1bからアクセスするように変更する。これにより、ディスク装置3の領域3aに含まれるデータ・トランザクションログが処理装置1aから処理装置1bへと移行する。 【0011】また、高可用性処理部6は、ネットワークアドレスをバックアップマシンである処理装置1bに移行する(ステップS3)。即ち、機能Aを提供している外部へのネットワークアドレスが処理装置1aに割り当てられていたのを処理装置1bへと移行する。これにより、ネットワークアドレスは元のままで機能の配置を行うことができる。 【0012】その後、高可用性処理部6は、処理装置1bをバックアップマシンからマスタマシンに昇格させるための処理を行う。トランザクション管理部5はこれを受けてバックアップマシンをマスタマシンに代替する(ステップS4)。そして、トランザクション管理部5は、仮想マシン7aを処理装置1b上で起動すると共に、トランザクションをリカバリする(ステップS5)。即ち、領域3a上のトランザクションログとデータに基づいて未完了のトランザクションに対してコミット/アボートの指示を行う。以上の処理により、システムとしての復旧処理が完了する(ステップS6)。 【0013】〈効果〉以上のように、具体例によれば、複数の処理装置1a、1b、1c、1d上に、それぞれ任意の機能を実現するための複数の仮想マシン7a,7b,7c,7dを設け、かつ、トランザクション管理部5と高可用性処理部6とを設けるようにしたので、複数の処理装置にまたがり、分散トランザクションを行うような大規模なシステムにおいても、障害時のダウンタイムをより短くすることが可能である。また、具体例では、機能と仮想マシンとが一対一に対応して設けられているため、機能群の資源(データ、トランザクションログ、ネットワークアドレス、プロセス、IPC(interprocess communication facilities))を複数の仮想マシン間で移行することができる。また、この構成では、一方の仮想マシンの配置は他方の仮想マシンの配置に依存しないため、切り替え元のマシンのプロセス資源、IPC資源の初期化を容易に行うことができる。 【0014】更に、上記具体例では複数の処理装置に同一の機能を実現する仮想マシンをそれぞれ配置するようにしたので、従来のような処理装置の系切り替えの場合よりもダウンタイムを短くすることができる。 【0015】尚、上記具体例では処理装置1a、1b、1c、1dに対して機能A、B、C、Dがそれぞれ対応するよう構成したが、必ずしも処理装置と機能が一対一に対応する必要はなく、トランザクション管理部5の管理により複数の処理装置で同一の機能が実現されるよう構成したり、あるいは1台の処理装置に同一の機能が複数配置されるよう構成してもよい。例えば、同一の処理装置内に同一の機能を実現する仮想マシンを複数配置するようにすれば、その機能に関する障害が発生した場合は、更に短いダウンタイムで運用継続が可能である。
|
| 【出願人】 |
【識別番号】000000295 【氏名又は名称】沖電気工業株式会社
|
| 【出願日】 |
平成12年7月10日(2000.7.10) |
| 【代理人】 |
【識別番号】100082050 【弁理士】 【氏名又は名称】佐藤 幸男
|
| 【公開番号】 |
特開2002−24048(P2002−24048A) |
| 【公開日】 |
平成14年1月25日(2002.1.25) |
| 【出願番号】 |
特願2000−207816(P2000−207816) |
|