トップ :: G 物理学 :: G06 計算;計数




【発明の名称】 障害情報の掲載方法およびプロバイダ設備
【発明者】 【氏名】片桐 智明

【氏名】久保田 浩

【要約】 【課題】利用者に障害情報を迅速かつ正確に提供する【解決手段】 サービスデスクサーバが各装置の故障内容を示すトラブルチケット情報TCを受け取るとインシデント情報Xを生成し(t0)、これに続いてトラブルチケット情報TCに基づいて障害テーブルを検索し障害サービス名を読み出す(t1)。これにより、故障内容が障害サービス名に変換される。サービスデスクサーバはテンプレートに障害サービス名を埋め込んで掲載文データhtml1、html2を生成し、これを第1および第2Webサーバに転送する(t2)。第1および第2Webサーバは掲載文データhtml1、html2に基づいて障害情報をWeb上に掲載する。したがって、人の手によらず、障害情報を自動的に知らせることができる。

【解決手段】サービスデスクサーバが各装置の故障内容を示すトラブルチケット情報TCを受け取るとインシデント情報Xを生成し(t0)、これに続いてトラブルチケット情報TCに基づいて障害テーブルを検索し障害サービス名を読み出す(t1)。これにより、故障内容が障害サービス名に変換される。サービスデスクサーバはテンプレートに障害サービス名を埋め込んで掲載文データhtml1、html2を生成し、これを第1および第2Webサーバに転送する(t2)。第1および第2Webサーバは掲載文データhtml1、html2に基づいて障害情報をWeb上に掲載する。したがって、人の手によらず、障害情報を自動的に知らせることができる。
【特許請求の範囲】
【請求項1】 通信網を介して接続される端末に各種のサービスを提供するためのプロバイダ設備において、サービスの提供に障害が発生した場合に障害情報をウエブ上に掲載する障害情報の掲載方法であって、前記プロバイダ設備を構成する各装置のうち管理対象となる複数の装置について故障を検知して故障情報を生成し、前記故障情報に基づいて、少なくとも提供されるサービスのうち障害が発生するサービス種別を予め定められた規則に従って特定し、予め用意されたテンプレートデータに特定されたサービス種別を当てはめて掲載文データを生成し、生成された掲載文データに基づいてウエブ上に前記障害情報を自動掲載することを特徴とする障害情報の掲載方法。
【請求項2】 前記サービス種別と前記故障情報から抽出した事項とを前記テンプレートデータに当てはめることにより前記掲載文データを生成することを特徴とする請求項1に記載の障害情報の掲載方法。
【請求項3】 複数種類の前記掲載文データを生成し、生成された各掲載文データを複数の通信網を介してウエブ上に前記障害情報として各々自動掲載することを特徴とする請求項2に記載の障害情報の掲載方法。
【請求項4】 通信網を介して接続される端末に各種のサービスを提供するためのプロバイダ設備において、サービスの提供に障害が発生した場合に障害情報をウエブ上に掲載する障害情報の掲載方法であって、前記プロバイダ設備を構成する各装置のうち管理対象となる複数の装置について故障を検知して故障情報を生成し、前記故障情報に基づいて、提供されるサービスのうち障害が発生するサービス種別および復旧予定時刻を予め定められた規則に従って特定し、予め用意されたテンプレートデータに特定されたサービス種別および復旧予定時刻を当てはめて掲載文データを生成し、生成された掲載文データに基づいてウエブ上に前記障害情報を自動掲載することを特徴とする障害情報の掲載方法。
【請求項5】 通信網を介して接続される端末に各種のサービスを提供するためのプロバイダ設備において、サービスの提供に障害が発生した場合に障害情報をウエブ上に掲載する障害情報の掲載方法であって、前記プロバイダ設備を構成する各装置のうち管理対象となる複数の装置について故障を検知して故障情報を生成し、前記故障情報に基づいて、前記障害情報を自動掲載するか否かを判定し、自動掲載すると判定した場合には、前記故障情報に基づいて、少なくとも提供されるサービスのうち障害が発生するサービス種別を予め定められた規則に従って特定し、特定されたサービス種別を前記障害情報としてウエブ上に自動掲載し、自動掲載しないと判定した場合には、入力画面に表示して障害が発生するサービス種別を入力するように促し、入力されたサービス種別を前記障害情報としてウエブ上に掲載することを特徴とする障害情報の掲載方法。
【請求項6】 前記故障情報は、故障が発生した装置を識別するためのノード情報を有することを特徴とする請求項1、4または5のうちいずれか1項に記載した障害情報の掲載方法。
【請求項7】 前記故障情報は、故障が発生した装置を識別するためのノード情報と、当該装置において異常が発生したアプリケーションを識別するためのアプリケーション情報とを含み、前記規則によって、前記ノード情報および前記アプリケーション情報と、少なくとも障害が発生するサービス種別とが対応付けられていることを特徴とする請求項1、4または5のうちいずれか1項に記載した障害情報の掲載方法。
【請求項8】 通信網を介して接続される端末に各種のサービスを提供するためのプロバイダ設備において、サービスの提供に障害が発生した場合に障害情報をウエブ上に掲載する障害情報の掲載方法であって、前記プロバイダ設備を構成する各装置のうち管理対象となる複数の装置について故障を検知して、故障が発生した装置を識別するためのノード情報と、当該装置において異常が発生したアプリケーションを識別するためのアプリケーション情報とを含む故障情報を生成し、生成された故障情報に基づいて、前記ノード情報、前記アプリケーション情報、障害が発生するサービス種別および復旧予定時間を必要に応じて予め記憶した記憶内容を検索し、この検索結果によって、サービス種別および復旧予定時間が特定された場合には、当該サービス種別および故障発生時刻に復旧予定時間を加算して得た復旧予定時刻を前記障害情報としてウエブ上に自動掲載することを特徴とする障害情報の掲載方法。
【請求項9】 前記検索結果によって、サービス種別のみが特定された場合には、当該サービス種別を第1障害情報としてウエブ上に自動掲載するとともに復旧予定時刻を入力するように促し、復旧予定時間が入力されると、前記サービス種別および入力された復旧予定時刻を第2障害情報としてウエブ上に掲載することを特徴とする請求項8に記載の障害情報の掲載方法。
【請求項10】 前記プロバイダ設備を構成する各装置のうち管理対象となる複数の装置は、複数のサーバと複数のネットワーク機器であることを特徴とする請求項1、4、5または8のうちいずれか1項に記載した障害情報の掲載方法。
【請求項11】 通信網を介して接続される端末に各種のサービスを提供するためのプロバイダ設備において、前記プロバイダ設備を構成する装置のうち管理対象となる複数の装置について、稼働状態を監視して、故障が発生した装置を識別するノード情報を含む故障情報を生成する監視手段と、前記ノード情報と障害が発生するサービス種別とを予め対応付けて記憶する記憶手段と、前記故障情報に基づいて前記記憶手段から前記サービス種別を読み出し、予め用意された掲載文テンプレートに読み出された前記サービス種別を埋め込んで掲載文データを生成する掲載文データ生成手段と、生成された掲載文データに基づいて障害情報をウエブ上に掲載する掲載手段とを備えることを特徴とするプロバイダ設備。
【発明の詳細な説明】【0001】
【発明の属する技術分野】本発明は、通信網を介して接続される端末に各種のサービスを提供するためのプロバイダ設備、および、そのサービスの提供に障害が発生した場合に障害情報をウエブ上に掲載するのに好適な障害情報の掲載方法に関する。
【0002】
【従来の技術】インターネットの普及に伴い、近年では家庭のパーソナルコンピュータを用いてインターネットに接続されているサーバにアクセスしたり、電子メールによる通信が可能となっている。また、パーソナルコンピュータの替わりに、携帯電話に接続した携帯端末を用いて、インターネット接続や電子メールを利用できるサービスも普及している。インターネット等の通信網を介したサービスは、急速に拡大しており、個人の生活においても必要不可欠なものとなりつつある。
【0003】このような通信サービスシステムにおいて、サービスプロバイダの設備に故障が発生すると、利用者は特定のサービスを受けることができなくなる。このため、障害情報をサービスプロバイダのホームページに掲載して利用者の便宜を図ることが行われている。
【0004】障害情報の掲載にあっては、システム管理者は、プロバイダ設備を構成するどの装置に故障が発生したか、故障の程度はどのようなものであるかを総合的に勘案して、提供しているサービスの中から障害が発生するサービスを特定する。次に、システム管理者は、当該サービスに障害がある旨の掲載文を作成し、これをホームページにアップロードして障害情報を公開している。
【0005】
【発明が解決しようとする課題】しかし、このような手法では、システム管理者は、常時、システム全体を構成する各装置の動作状況を監視する必要がある。また、各装置がシステム全体でどのような機能を果たしており、それが故障した場合にどのようなサービスに障害が発生するかを把握していなければならない。このため、従来の方法では、システム管理者の負担が過大になるといった問題があった。
【0006】また、障害が発生してから障害情報の公開までの過程は、人の手によって行われるため、障害情報がホームページに掲載されるまでには相当の時間を要する。このため、直ちに障害情報を知りたいという利用者の要求に応えることができないといった問題があった。
【0007】くわえて、一旦、障害が発生した場合、利用者の最大の関心事は、いつサービスが復旧されるかにあるが、サービスの復旧予定時刻はシステム全体を熟知していないと判断することができないので、システム管理者が人の手によってホームページに掲載しているのが現状である。したがって、直ちに復旧予定時刻を知りたいという利用者の要求に応えることができないといった問題があった。
【0008】本発明は、上述した事情に鑑みてなされたものであり、利用者に障害情報を迅速かつ正確に提供することを目的とする。より具体的には、障害が発生して利用することができないサービス種別や復旧予定時刻をWeb上に自動的に掲載することを目的とする。
【0009】
【課題を解決するための手段】上述した課題を解決するため、本発明に係わる障害情報の掲載方法にあっては、通信網を介して接続される端末に各種のサービスを提供するためのプロバイダ設備において、サービスの提供に障害が発生した場合に障害情報をウエブ上に掲載するものであって、前記プロバイダ設備を構成する各装置のうち管理対象となる複数の装置について故障を検知して故障情報を生成し、前記故障情報に基づいて、少なくとも提供されるサービスのうち障害が発生するサービス種別を予め定められた規則に従って特定し、予め用意されたテンプレートデータに特定されたサービス種別を当てはめて掲載文データを生成し、生成された掲載文データに基づいてウエブ上に前記障害情報を自動掲載することを特徴とする。この場合、前記サービス種別と前記故障情報から抽出した事項とを前記テンプレートデータに当てはめることにより前記掲載文データを生成することが望ましい。また、複数種類の前記掲載文データを生成し、生成された各掲載文データを複数の通信網を介してウエブ上に前記障害情報として各々自動掲載するようにしてもよい。
【0010】また、本発明に係わる障害情報の掲載方法にあっては、通信網を介して接続される端末に各種のサービスを提供するためのプロバイダ設備において、サービスの提供に障害が発生した場合に障害情報をウエブ上に掲載するものであって、前記プロバイダ設備を構成する各装置のうち管理対象となる複数の装置について故障を検知して故障情報を生成し、前記故障情報に基づいて、提供されるサービスのうち障害が発生するサービス種別および復旧予定時刻を予め定められた規則に従って特定し、予め用意されたテンプレートデータに特定されたサービス種別および復旧予定時刻を当てはめて掲載文データを生成し、生成された掲載文データに基づいてウエブ上に前記障害情報を自動掲載することを特徴とする。
【0011】また、本発明に係わる障害情報の掲載方法にあっては、通信網を介して接続される端末に各種のサービスを提供するためのプロバイダ設備において、サービスの提供に障害が発生した場合に障害情報をウエブ上に掲載するものであって、前記プロバイダ設備を構成する各装置のうち管理対象となる複数の装置について故障を検知して故障情報を生成し、前記故障情報に基づいて、前記障害情報を自動掲載するか否かを判定し、自動掲載すると判定した場合には、前記故障情報に基づいて、少なくとも提供されるサービスのうち障害が発生するサービス種別を予め定められた規則に従って特定し、特定されたサービス種別を前記障害情報としてウエブ上に自動掲載し、自動掲載しないと判定した場合には、入力画面に表示して障害が発生するサービス種別を入力するように促し、入力されたサービス種別を前記障害情報としてウエブ上に掲載することを特徴とする。ここで、前記故障情報は、故障が発生した装置を識別するためのノード情報を有することが好ましい。さらに、前記故障情報は、故障が発生した装置を識別するためのノード情報と、当該装置において異常が発生したアプリケーションを識別するためのアプリケーション情報とを含み、前記規則によって、前記ノード情報および前記アプリケーション情報と、少なくとも障害が発生するサービス種別とが対応付けられていることが好ましい。
【0012】また、本発明に係わる障害情報の掲載方法にあっては、通信網を介して接続される端末に各種のサービスを提供するためのプロバイダ設備において、サービスの提供に障害が発生した場合に障害情報をウエブ上に掲載するものであって、前記プロバイダ設備を構成する各装置のうち管理対象となる複数の装置について故障を検知して、故障が発生した装置を識別するためのノード情報と、当該装置において異常が発生したアプリケーションを識別するためのアプリケーション情報とを含む故障情報を生成し、生成された故障情報に基づいて、前記ノード情報、前記アプリケーション情報、障害が発生するサービス種別および復旧予定時間を必要に応じて予め記憶した記憶内容を検索し、この検索結果によって、サービス種別および復旧予定時間が特定された場合には、当該サービス種別および故障発生時刻に復旧予定時間を加算して得た復旧予定時刻を前記障害情報としてウエブ上に自動掲載することを特徴とする。ここで、前記検索結果によって、サービス種別のみが特定された場合には、当該サービス種別を第1障害情報としてウエブ上に自動掲載するとともに復旧予定時刻を入力するように促し、復旧予定時間が入力されると、前記サービス種別および入力された復旧予定時刻を第2障害情報としてウエブ上に掲載してもよい。くわえて、前記プロバイダ設備を構成する各装置のうち管理対象となる複数の装置は、複数のサーバと複数のネットワーク機器であることが望ましい。
【0013】次に、本発明に係わるプロバイダ設備は、通信網を介して接続される端末に各種のサービスを提供するための設備であって、前記プロバイダ設備を構成する装置のうち管理対象となる複数の装置について、稼働状態を監視して、故障が発生した装置を識別するノード情報を含む故障情報を生成する監視手段と、前記ノード情報と障害が発生するサービス種別とを予め対応付けて記憶する記憶手段と、前記故障情報に基づいて前記記憶手段から前記サービス種別を読み出し、予め用意された掲載文テンプレートに読み出された前記サービス種別を埋め込んで掲載文データを生成する掲載文データ生成手段と、生成された掲載文データに基づいて障害情報をウエブ上に掲載する掲載手段とを備えることを特徴とする。
【0014】
【発明の実施の形態】以下、本発明の一実施形態について、図面を参照しつつ説明する。
<1.通信サービスシステムの構成>図1は、通信サービスシステムの主要構成を示すブロック図である。この図に示すように、通信サービスシステムは、プロバイダ設備A、第1通信網NET1、第2通信網NET2、通信端末MS1、MS2、…、パーソナルコンピュータPC1、PC2、…を備えている。
【0015】第1通信網NET1は、例えば、無線通信網である。また、各通信端末MS1、MS2、…は、例えば、携帯電話で構成されており、それらには携帯端末PDA1、PDA2、…が接続されている。携帯端末PDA1、PDA2、…は、小画面の表示部を備えている。ここで、携帯端末PDA1、PDA2、…は、WWWブラウザを備えており、通信端末MS1、MS2、…を介してWWW(WorldWide Web)にアクセスできるようになっている。なお、通信端末MS1、MS2、…自体にWWWブラウザを搭載し、WWWにアクセスできるようにしてもよい。この場合には、通信端末MS1、MS2、…の表示部にホームページが表示されることになる。一方、第2通信網NET2は、例えば、ISDNや公衆電話網等の固定網である。また、各パーソナルコンピュータPC1、PC2、…は、大画面のモニタとモデム等の通信装置を備えている。
【0016】この通信サービスシステムは、第1通信網NET1を介して接続される携帯端末PDA1、PDA2、…に対して、インターネット接続サービス、電子メールサービス、コンテンツサービス等の各種サービスを提供するとともに障害情報を提供する。一方、この通信サービスシステムは、第2通信網NET2に接続されるパーソナルコンピュータPC1、PC2、…に対して、インターネット接続サービスを提供するものではなく、障害情報のみを報知する。したがって、利用者は、携帯端末PDA1、PDA2、…またはパーソナルコンピュータPC1、PC2、…によって、障害情報を知ることができる。
【0017】障害情報の詳細については、後述するが、障害情報には少なくとも利用することができなくなっているサービスの種別(障害サービス名)が含まれている。また、通信端末MS1、MS2、…に報知される障害情報は、パーソナルコンピュータPC1、PC2、…に報知される障害情報より簡略化されている。これは、通信端末MS1、MS2、…では障害情報が小画面の表示部に表示される一方、パーソナルコンピュータPC1、PC2、…では障害情報が大画面のモニタに表示されることを考慮したものである。
【0018】次に、プロバイダ設備Aは、稼働監視サーバ10、サービスデスクサーバ20、認証端末30、データベースサーバ40、第1Webサーバ50、第2Webサーバ60を備えている。これらのサーバは、サービスデスクサーバ20を中心にスター状にローカルエリアネットや専用回線で接続されている。これらのうち、第1Webサーバ50は、通信端末MS1、MS2、…に対して障害情報を提供するための装置であり、第2Webサーバ60はパーソナルコンピュータPC1、PC2、…に対して障害情報を提供するための装置である。また、サービスデスクサーバ20はサーバ管理者によって管理され、認証端末30は障害情報の掲載について権限を有するシステム管理者によって管理される。
【0019】さらにプロバイダ設備Aは、認証サーバ71、メールサーバ72、コンテンツサーバ73、課金サーバ74、ネットワーク機器75を備えており、これらの装置は稼働監視サーバ10に接続されている。なお、上述したデータベースサーバ40、第1Webサーバ50および第2Webサーバ60も図示せぬ接続線を介して稼働監視サーバ10接続されている。
【0020】認証サーバ71は、通信端末MS1、MS2、…からのアクセス要求に対して、それらから送信されてくる利用者IDおよびパスワードに基づいて、利用者の正当性を認証し、正規な利用者についてのみアクセス要求を許可する。また、メールサーバ72は、POP3(post office protocol verion)やIMAP4(internet message access protocol 4)に従って、電子メールの授受を行うための装置である。これにより、各携帯端末PDA1、PDA2、…は電子メールサービスを受けることが可能となる。また、コンテンツサーバ73は、各種のコンテンツを格納している。コンテンツとしては、例えば、音楽データの配信サービス、株価や金利といった経済ユースの配信サービス等がある。これらのサービスには、無料のものもあれば有料のものもある。課金サーバ74は、利用者が有料サービスの提供を受けた場合に、当該利用者に対して課金を行う装置である。これらのサーバは地理的に1箇所に配置されているのではなく、離れた位置に分散されて配置されており、サーバ間は専用回線等で接続されている。ここで、図1に示すネットワーク機器75は、サーバ間を接続するルータ、ブリッジ、スイッチハブおよび交換機等の各種の通信設備の総称である。
【0021】次に、稼働監視サーバ10は、監視プログラムを実行して、各サーバおよびネットワーク機器75の稼働状況を常時監視している。具体的には、管理対象となる装置が稼働状況や故障等を示すイベント情報を発行し、これを稼働監視サーバ10に通報する。イベント情報には、単なる稼働状況を示すもの、サービスに支障はないものの放置すればやがてはサービス停止にいたるもの、さらにはサービス停止に直結するもの等があり、その重要度は千差万別である。稼働監視サーバ10は、イベント情報を集約するとともに重要度が高いものを選別し、これを故障内容を示すトラブルチケット情報TC(故障情報)として発行する。
【0022】図2は、分散されて配置されている各サーバおよびネットワーク機器と稼働監視サーバ10との関係の一例を示す図である。図2に示すプロバイダ設備は、第1〜第4サイトST1〜ST4を備えており、第1サイトST1内に稼働監視サーバ10が配置されている。そして、各第1〜第4サイトST1〜ST4には複数の管理対象ノードがあり、各管理対象ノードにはサーバやネットワーク機器が配置されている。以下の説明では、これらの装置がイベント情報を発行する機能をエージェント機能と称し、稼働監視サーバ10がトラブルチケット情報TCを発行する機能をマネージャー機能と称することにする。
【0023】このエージェント機能とマネージャー機能によって、少なくとも以下の機能が実現される。第1に、しきい値モニタ機能が実現される。これは、管理対象となるサーバについて、予め設定したリソース値を定期的に監視するものであり、例えば、ファイルシステム容量やRUNキューの数が対象となる。リソース値がしきい値の範囲外であった場合には、エージェント機能によってイベント情報が発行され、これが稼働監視サーバ10に通知されることになる。
【0024】第2に、ログファイル監視機能が実現される。これは、予め監視対象として設定されたログファイルを定期的に走査して、予め設定された条件と一致する部分を監視するものである。条件に合致するログファイルの内容は、イベント情報として稼働監視サーバ10に通知されることになる。
【0025】第3に、メッセージ送信機能が実現される。これは、各サーバがアプリケーションプログラムを実行している途中で、予め定められた条件を満たした場合に、イベント情報を発行して、アプリケーションプログラムが正常に動作しているか否かを監視するものである。
【0026】第4に、故障通知機能が実現される。これは、ネットワーク機器に故障が発生した場合に、ネットワーク機器がイベント情報を発行するとともに、これを稼働監視サーバ10で認識するものである。
【0027】次に、トラブルチケット情報TCは、故障発生時刻、管理対象ノードを特定するノード情報、アプリケーションを特定するアプリケーション情報、MSG情報、およびオブジェクト名を示すオブジェクト情報を含んでいる。MSG情報は、システム開発者が予め定めた故障内容の種別を示すものであって、アプリケーション、OS、ネットワーク機器といったものがある。
【0028】次に、サービスデスクサーバ20は、障害情報報知プログラムを実行し、障害情報を利用者に知らせるために2種類の掲載文データhtml1、html2を自動的にあるいは半自動的に生成し、第1Webサーバ50と第2Webサーバ60に各々送信するようになっている。ただし、第1Webサーバ50に送信する掲載文データhtml1は、第2Webサーバ60に送信する掲載文データhtml2よりも簡略化されている。また、障害情報報知プログラムには、ノード情報、アプリケーション情報、MSG情報、オブジェクト情報、障害サービス名、および復旧予定時間を対応付ける障害テーブルTBLが含まれている。すなわち、障害テーブルTBLには、故障内容に対応付けられる障害サービス名および復旧予定時間が格納されている。以下のの説明では、この対応付けをルールと称する。また、障害サービス名とは、何等かの障害が発生し、利用者が利用することができないサービスの名称である。
【0029】掲載文データhtml1、html2の生成方法の詳細については後述するが、その概要は、トラブルチケット情報TCに基づいて、障害テーブルTBLを検索して障害サービス名および復旧予定時間を特定し、これを予め用意された掲載文テンプレートに埋め込むことによって掲載文データhtml1、html2を生成するものである。
【0030】上述した障害テーブルTBLには、トラブルチケット情報TCと障害サービス名および復旧予定時間とが対応付けられて格納されているが、総てのトラブルチケット情報TCに対して障害サービス名および復旧予定時間が対応付けられているわけではなく、故障内容と障害サービス名の関係が対応付けられていないものや、故障内容と障害サービス名については対応付けられているが復旧予定時刻までは対応付けられていないものもある。
【0031】プロバイダ設備Aを構成する各装置は多岐に渡り、各装置は相互に関連しながら動作している。このため、ある装置が故障したとしても、他の装置が故障した装置の機能を補ってサービスの提供を継続できる場合もある。一方、他の装置に故障した装置の処理を代行する機能があっても、他の装置が重い負荷を処理してる間は、実際に代行することができずサービスの提供を継続できない場合もある。
【0032】そこで、障害テーブルTBLには、故障内容と障害サービス名および復旧予定時間との因果関係が明確であって規則化できたルールが格納されている。障害テーブルTBLにトラブルチケット情報TCに対応するルールが格納されていない場合には、この障害情報報知プログラムは、サービスデスクサーバ20に入力画面を表示して障害サービス名、復旧予定時刻を入力するように促し、さらに認証端末30に認証画面を表示してこれらを反映させた障害情報の掲載を承認するように促し、承認が得られた後、生成した掲載文データhtml1、html2を第1Webサーバ50および第2Webサーバ60に各々送信する。認証端末30は、障害情報の掲載権限を有するシステム管理者が認証を与えるために用いられる。
【0033】また、データベースサーバ40には、通信サービスシステムを構成する各装置の情報、予備装置の配備に関する情報、障害履歴情報、規則化されているルール等が格納されている。ここで、障害履歴情報は、トラブルチケット情報TC、障害サービス名、故障発生時刻情報および復旧時刻情報等を含んでおり、これらの情報は、サービスデスクサーバ20からの要求に応じて検索することができるようになっている。サービスデスクサーバ20の管理者は、復旧予定時間が不明な場合に、データベースサーバ40にアクセスして、同様の事例を検索し過去の復旧時間を知ることができる。これにより、管理者は現在の復旧予定時間を容易に予測することが可能となる。
【0034】<2.通信サービスシステムの動作>次に、通信サービスシステムを構成するサーバやネットワーク機器に故障が発生した場合の動作について説明する。図3は、プロバイダ設備が障害情報を報知する動作を示すフローチャートである。
【0035】まず、稼働監視サーバ10は、各種サーバやネットワーク機器から送信されるイベント情報を受信して、これに基づいてトラブルチケット情報TCを生成し、これをサービスデスクサーバ20に送信する(S1)。
【0036】サービスデスクサーバ20は、トラブルチケット情報TCを受信すると、インシデント情報Xを生成する(S2)。インシデント情報Xは、障害が発生した場合に一連の処理を管理する管理データであり、障害情報のWeb上での掲載を停止すると消滅するようになっている。したがって、インシデント情報Xが存在する限り、障害の発生について何等かの処理が必要であることが分かる。また、インシデント情報Xは、障害対応の一連の処理が進むにつれて、各種の情報と関連づけが行われるようになっている。この例では、トラブルチケット情報TC、障害サービス名、復旧予定時刻等との関連づけが行われる。ただし、インシデント情報Xが生成された時点では、トラブルチケット情報TCとのみ関連づけが行われているだけで、他の情報との関連づけは行われていない。
【0037】次に、サービスデスクサーバ20は、障害情報の自動掲載に該当するか否かを判定する(S3)。具体的には、トラブルチケット情報TCに基づいて、ルールが格納されている障害テーブルTBLを検索して、障害サービス名の出力があるか否かによって判定する。障害サービス名が出力された場合には、障害情報の自動掲載に該当する場合であり、一方、障害サービス名が出力されなかった場合には、障害情報の自動掲載に該当しない場合と判定する。
【0038】例えば、図2に示す第3サイトST3の管理対象ノードN1に配置される装置がメールサーバ72であり、また、管理対象ノードN2に配置される装置がルータ751である場合を想定する。この例のルータ751が故障すると、メールサーバ72にアクセスすることができず、メールサービスが利用できなくなることは明らかである。このため、障害テーブルTBLには、「N2」を示すノード情報と障害サービス名として「メールサービス」が対応付けられて格納されている。ここで、ルータ751が故障すると、サービスデスクサーバ20は、受信したトラブルチケット情報TCに基づいて障害テーブルTBLを検索し、障害サービス名として「メールサービス」を得ることになる。したがって、ステップS3での判定結果はYESとなり、障害情報の自動掲載処理が行われることになる。
【0039】この自動掲載処理において、サービスデスクサーバ20は、障害テーブルTBLから障害サービス名とともに復旧予定時間が出力されたか否かを判定し(S4)、復旧予定時間が出力された場合には、障害発生時刻に復旧予定時間を加算して復旧予定時刻を生成し、これをインシデント情報Xと関連付ける(S5)。
【0040】この後、サービスデスクサーバ20は、複数の掲載文テンプレートの中から所定のものを選択する(S6)。掲載文テンプレートとしては、携帯端末に障害情報を表示するために用いられる第1報携帯端末用テンプレートT1mおよび第2報携帯端末用テンプレートT2mと、パーソナルコンピュータに障害情報を表示するために用いられる第1報PC用テンプレートT1pおよび第2報PC用テンプレートT2pが予め用意されている。図4に、各テンプレートの内容を示す。この図において、「$」で囲まれた「$障害サービス名$」、「$復旧予定時刻$」等はインシデント情報Xに関連づけられる情報に基づいて埋め込まれる文言である。ステップS6を実行する際には、インシデント情報Xに障害サービス名と復旧予定時刻が関連づけられているので、サービスデスクサーバ20は、第2報携帯端末用テンプレートT2mと第2報PC用テンプレートT2pとを選択する。
【0041】次に、サービスデスクサーバ20は、障害サービス名および復旧予定時刻を第2報携帯端末用テンプレートT2mと第2報PC用テンプレートT2pとに埋め込んで掲載文データhtml1、html2を生成し、これらを第1および第2Webサーバ50,60に送信する(S7)。
【0042】この後、第1および第2Webサーバ50,60は掲載文データhtml1、html2をWeb上にアップロードして障害情報をWeb上で公開する(S8)。これにより、プロバイダ設備Aを構成する装置に何等かの故障が発生した場合、当該故障に対応する掲載ルールが存在するならば、障害情報がWeb上に自動掲載されることになる。したがって、人の手を介することなく障害情報を生成でき、何等かの故障が発生しても障害情報を迅速かつ正確に利用者に報知することが可能となる。さらに、公開される障害情報には単なる故障装置の名称ではなく障害サービス名が含まれているから、一般の利用者に利用できなくなっているサービスを分かり易く知らせることが可能となる。くわえて、復旧予定時刻も併せて公開されるので、利用者は停止サービスが利用可能となる大まかな時刻を知ることができる。
【0043】次に、障害テーブルTBLから障害サービス名とともに復旧予定時間が出力されなければ、ステップS4の判定結果はNOとなり、ステップS9に進む。ここで、サービスデスクサーバ20は、障害サービス名をインシデント情報Xに関連付ける。次に、サービスデスクサーバ20は、掲載文テンプレートの中から第1報携帯端末用テンプレートT1mおよび第1報PC用テンプレートT1pを選択する(S10)。次に、サービスデスクサーバ20は、障害サービス名を第2報携帯端末用テンプレートT2mと第2報PC用テンプレートT2pとに埋め込んで掲載文データhtml1、html2を生成し、これらを第1および第2Webサーバ50,60に送信し、故障情報をWeb上に掲載させる(S11)。このように掲載ルールによって障害サービス名のみが特定される場合には、とりあえず障害サービス名を含む障害情報を第1報として自動的にWeb上に掲載するので、一般の利用者に利用できなくなっているサービスを迅速に知らせることが可能となる。
【0044】次に、サービスデスクサーバ20は、付属するモニタに復旧予定時刻の入力画面を表示して、サービスデスクサーバ20の管理者にその入力を促す(S12)。そして、復旧予定時刻が入力されると、サービスデスクサーバ20は、インシデント情報と復旧予定時刻とを関連付ける(S13)。この後、サービスデスクサーバ20は、インシデント情報Xに基づいて、関連づけられている故障状況および復旧予定時刻を含む画面を認証端末30に表示させ、システム管理者に対して障害情報の掲載について認証するように促す。システム管理者は、認証端末30を操作してサービスデスクサーバ20から送られてきた復旧予定時刻について認証することもできるし、あるいは、自ら復旧予定時刻を入力してこれを認証することもできる。さらに、第2報の障害情報の掲載について取り止める旨を入力することもできる。システム管理者が自ら入力した復旧予定時刻はサービスデスクサーバ20に送信され、サービスデスクサーバ20は、これに基づいてインシデント情報Xに受信した復旧予定時刻を関連付ける。
【0045】次に、サービスデスクサーバ20は掲載が認証されたか否かを判定し(S14)、認証されなかった場合には障害情報の掲載を中止する一方(S15)、認証された場合にはステップS6に進んで、ステップS6からステップS8までの処理を実行する。これにより、復旧予定時刻を含む障害情報がWeb上で公開されることになる。このように、予め定められたルールによって、障害サービス名を特定することができかつ復旧予定時刻を特定できない場合であっても、障害サービス名を含む障害情報をWeb上に直ちに自動掲載する一方、復旧予定時刻については人の手によって入力された後に第2報として掲載するようにしたので、利用者に利用できないサービスを迅速に知らせることができ、さらに、復旧予定時刻が確定した時点で復旧予定時刻も知らせることができる。
【0046】次に、ステップS3において自動掲載に該当しないと判定された場合、すなわち、障害テーブルTBLにトラブルチケット情報TCに対応するルールが格納されていない場合には、ステップS16に進み、サービスデスクサーバ20は、付属するモニタに障害サービス名と復旧予定時刻の入力画面を表示して、サービスデスクサーバ20の管理者にその入力を促す(S16)。
【0047】そして、障害サービス名と復旧予定時刻とが入力されると、サービスデスクサーバ20は、インシデント情報Xに障害サービス名と復旧予定時刻とを関連付ける(S17)。この後、サービスデスクサーバ20は、インシデント情報Xに関連づけられた故障状況と、障害サービス名および復旧予定時刻とを含む画面を認証端末30に表示させ、システム管理者に対して障害情報の掲載について認証するように促す。システム管理者は、認証端末30を操作してサービスデスクサーバ20から送られてきた障害サービス名および復旧予定時刻について認証することもできるし、あるいは、障害サービス名または復旧予定時刻の少なくとも一方を入力してこれを認証することもできる。さらに、障害情報の掲載について取り止める旨を入力することもできる。システム管理者が自ら入力した障害サービス名または復旧予定時刻はサービスデスクサーバ20に送信され、サービスデスクサーバ20は、これに基づいてインシデント情報Xの関連づけを更新する。
【0048】この後、上述したステップS14に進んで、サービスデスクサーバ20は掲載が認証されたか否かを判定し(S14)、認証されなかった場合には障害情報の掲載を中止する一方(S15)、認証された場合にはステップS6に進んで、ステップS6からステップS8までの処理を実行する。これにより、掲載ルールが無い場合であっても、障害情報をWeb上に掲載することができる。
【0049】例えば、プロバイダ設備Aにおいて、新たなサーバを追加することにより新たなサービスが追加され、自動掲載のルールが障害テーブルTBLに格納されていない場合が該当する。このように新サービスを導入した当初は、想定外のトラブルも発生するので、実際の運用で得られた経験をルールに反映させことが望ましい。本実施形態によれば、障害テーブルTBLにトラブルチケット情報TCと障害サービス名や復旧予定時間を追加するだけで、新たなルールを追加することができるので、システムの拡張に対しても柔軟に対応することが可能である。
【0050】次に、障害情報の自動掲載についてより具体的に説明する。ここでは、図2に示す通信サービスシステムにおいて、第4サイトST4の管理対象ノードN3に配置される装置がコンテンツサーバ73であり、管理対象ノードN4に配置される装置が課金サーバ74であるものとする。また、コンテンツサーバ73は音楽データの有料配信サービスを行っている。そして、当該配信サービスに伴う課金処理を課金サーバ74の音楽配信課金アプリケーションで行っており、この音楽配信課金アプリケーションに異常が発生したものとする。なお、以下の説明では音楽配信課金アプリケーションをAP1で示すことにする。
【0051】図5は、サービスデスクサーバ20における処理の一例を示す図である。この図に示すように、音楽配信課金アプリケーションに異常が発生すると、稼働監視サーバ10が故障を検知して、トラブルチケット情報TCを発行する。このトラブルチケット情報TCを構成するノード情報はN3を指示し、また、そのアプリケーション情報はAP1を指示する。
【0052】時刻t0において、サービスデスクサーバ20がトラブルチケット情報TCを受け取ると、サービスデスクサーバ20はインシデント情報Xを生成する。次に、時刻t1において生成したインシデント情報Xに関連づけられるトラブルチケット情報TCに基づいて、障害テーブルTBLを検索する。障害テーブルTBLに、N3およびAP1に対応付けられて、音楽配信サービスが障害サービス名として格納されている一方、復旧予定時刻が格納されていないものとすれば、読み出された障害サービス名をインシデント情報Xに関連付ける。そして、時刻t2において、サービスデスクサーバ20は第1報携帯端末用テンプレートT1mおよび第1報PC用テンプレートT1pに障害サービス名を埋め込んで、掲載文データhtml1、html2を生成し、これを第1Webサーバ50および第2Webサーバ60に転送する。
【0053】この場合、第1Webサーバ50にアクセスした携帯端末PDA1には図6(A)に示す画面が表示される一方、第2Webサーバ60にアクセスしたパーソナルコンピュータPC1には図6(B)に示す画面が表示される。これらの画面を比較すると、パーソナルコンピュータPC1の表示画面の方が「音楽配信課金アプリケーションに故障により」といった障害原因に関する情報が記載されており、より詳細な情報を提供している。これは、携帯端末PDA1では、表示画面の面積が小さいため、文字数に制限があるからである。すなわち、本実施形態においては、同一のソースに基づいて、利用端末の形態に応じた障害情報を個別に生成することが可能である。
【0054】次に、時刻t3において、サービスデスクサーバ20は、付属のモニタに復旧予定時刻を入力するように促す画面を表示する。そして、サービスデスクサーバ20の管理者が復旧予定時刻を入力すると、サービスデスクサーバ20は、インシデント情報Xに復旧予定時刻を関連付ける。そして、時刻t4において、サービスデスクサーバ20は、認証端末30に対してWeb掲載の認証を求め、時刻t5において認証が得られると、第2報携帯端末用テンプレートT2mおよび第2報PC用テンプレートT2pに障害サービス名および復旧予定時刻を埋め込んで、掲載文データhtml1、html2を生成し、これを第1Webサーバ50および第2Webサーバ60に転送する。これにより、利用者は第2報をWeb上で知ることが可能となる。
【0055】そして、復旧作業によって音楽配信課金アプリケーションAP1が正常に動作するようになった後、サービスデスクサーバ20の管理者が、時刻t6において復旧時刻を入力するとともに障害履歴をWebに掲載させる指示を入力すると、サービスデスクサーバ20は復旧時刻をインシデント情報Xに関連付けるとともに、障害履歴の掲載文データを生成し、第1Webサーバ50および第2Webサーバ60に転送する。第1Webサーバ50および第2Webサーバ60は、障害履歴の掲載文データに基づいて障害履歴情報の目次ページを更新するとともに、障害履歴情報をWeb上に掲載する。
【0056】この後、サービスデスクサーバ20の管理者が、時刻t7においてインシデント情報Xのステータスを閉じる指示を入力するか、あるいは、障害情報のWeb掲載を停止する指示を入力すると、障害情報のWeb掲載停止指示が第1Webサーバ50および第2Webサーバ60に転送され、障害情報のWeb掲載が終了する。
【0057】なお、上述した実施形態においてデータベースサーバ40は通信サービスシステムに関する障害履歴を含む総ての情報を格納しているが、トラブルチケット情報TCと実際の復旧時間との関係を知識ベースとして記憶しておき、そこからルールを自動的に抽出するようにしてもよい。そして、抽出したルールに基づいて、障害テーブルTBLに復旧予定時間を自動的に追加したり、あるいは格納されている復旧予定時間を更新するようにしてもよい。この変形例によれば、通信サービスシステムの運用期間が長くなるほど、知識ベースに蓄積される情報量が多くなり、より正確な復旧予定時間を利用者に知らせることが可能となる。
【0058】
【発明の効果】上述したように本発明に係る発明特定事項によれば、各装置の故障情報に基づいて、障害が発生するサービス種別を予め定められた規則に従って特定し、テンプレートデータに特定されたサービス種別を当てはめて掲載文データを生成し、これをウエブ上に障害情報として自動掲載するようにしたので、利用者に障害情報を迅速かつ正確に提供することができる。
【出願人】 【識別番号】392026693
【氏名又は名称】株式会社エヌ・ティ・ティ・ドコモ
【識別番号】399117110
【氏名又は名称】日本ヒューレット・パッカード株式会社
【出願日】 平成12年10月2日(2000.10.2)
【代理人】 【識別番号】100098084
【弁理士】
【氏名又は名称】川▲崎▼ 研二 (外2名)
【公開番号】 特開2002−108728(P2002−108728A)
【公開日】 平成14年4月12日(2002.4.12)
【出願番号】 特願2000−302782(P2000−302782)