|
|
【発明の名称】 |
判別方法 |
| 【発明者】 |
【氏名】鷲澤 輝芳 |
【課題】判別分析を行うとき、判別効率を低下させずに変数の数を減少させる方法を提供する。
【解決手段】N個のインデクス集合に対してN−1個の要素を持つ部分集合族を生成する工程と、それぞれの部分集合に対して判別効率を計算する工程と、判別効率が最大の部分集合をN−1個のインデクス集合として採用し、N個のインデクス集合と置き換える工程と、要求仕様が満足されたかどうかを判定する工程とで構成される判別分析法であり、判別効率をKLDで計算することを特徴とする。 |
【特許請求の範囲】
【請求項1】 d個の変数により表現されるサンプルx=(x(1),x(2),...,x(d))Tと、それが属するクラス番号yのN個の組{(xj,yj)|j=1,...,N}に対して、N個の変数からN-1個の変数の全ての組み合わせを生成する工程1と、該全てのN-1個の変数で表現される該クラスのパラメタを推定する工程2と、該工程2で推定されたパラメタを用いて任意の2つのクラス間の相違度を算出する工程3と、該任意の2つのクラス間の相違度より全てのクラスの分布に対する相違度を算出する工程4とより構成され、該工程1から該工程4は、Nがdから1個ずつ減少させ予め設定された値になるまで繰り返す事を特徴とするデータ判別方法であり、該工程3は、任意の2個のクラス間の相違度をKullback-Leiblerダイバージェンスを用いて算出し、該工程4は,クラスmとクラスnの間の相違度を(m,n)成分とする行列の行列式として算出することを特徴とするデータ判別方法。 【請求項2】 上記工程2は、最尤推定法を用いてパラメタを推定する事を特徴とする、請求項1に記載のデータ判別方法。
|
【発明の詳細な説明】【技術分野】 【0001】 複数の異なる対象を観測した結果として得られたデータから各対象を特徴付けるパラメタを推定し、今後該複数の対象が混在した現象を観測して得られるデータがどの現象から得られたものかを判別する技術であり、パターン分類・認識全般に関する。 【背景技術】 【0002】 判別分析は測定等によって得られたサンプルベクトルを分類するために必須の技術である。2値変数に対する判別分析は非特許文献1で紹介されている以下の13個の従来技術が存在する。 1 線形判別方法 1.1 独立2値モデル(independent binary model (IBM) ) 独立な2値変数に対する方法であり,独立性の仮定は現実的でない。 【0003】 1.2 線形判別関数 ( linear discriminant function (LDF) ) 同じ分散共分散行列を持つ多次元正規分布に対して有効な方法。 【0004】 1.3 ロジスティック判別( logistic discrimination ) セミパラメトリック法.条件付き確率にロジスティック関数を仮定することによって,密度推定の手間を省いた。 【0005】 1.4 混合整数プログラミング ( Mixed integer programming (MIP) ) 2 次判別方法 2.1 2次判別関数( quadratic discriminant function (QDF) ) 異なる分散共分散行列を持つ多次元正規分布に対して最適な分類方法はSmithのQDFである。 【0006】 2.2 2次の対数線形モデル( 2nd order log-linear model (LLM) ) contingency tableの分析としてよく知られている対数線形モデル 2.3 2次のBahadurモデル( 2nd order Bahadur model (Bahadur ) ) 3 最近接判別方法 3.1 Hillの近接予測方法( Hill's kNN-Hills ) 適応的重み付け近接予測方法 4 他のノンパラメトリック判別方法 4.1 カーネル予測方法 4.2 Fourier方法 4.3 多重パーセプトロンニューラルネット 4.4 学習ベクトル量子化ニューラルネット ただし、上記全ての方法は判別効率を向上させるために変数選択を行うためのものではない。 【0007】 特許文献1では判別効率を向上させるために、逐次的に判別部分空間を選択する技術が開示されている。これによって、N回目までに選択された判別部分空間で判別できなかった部分集合の一部がN+1回目に選択された判別部分空間で判別可能となる。 【0008】 非特許文献2及び非特許文献3では、平均が異なり(μi, μj) 、分散共分散行列Vが同じ確率密度分布間の相違度を表わす量として(式01)で与えられる判別効率Dij(Mahalanobis Distance)を用いて変数選択する技術を開示している。 【0009】 (式01) Dij = (μi-μj)TV-1(μi-μj) 一方、二つの異なる確率密度関数間の相違度を計る量として、Kullback-Leiblerダイバージェンス(KLD)が知られている(非特許文献4等を参照)。 【特許文献1】特開平5−143636号公報 【非特許文献2】OK. Asparouknov, WJ. Krzanowski, “A comparison of discriminant procedures for binary variables,” Computational Statistics & Data Analysis, 38, pp.139-160 (2001). 【非特許文献3】永田,棟近:“多変量解析法入門,”サイエンス社(2001). 【非特許文献4】柳井,高根:“新版 多変量解析法,”朝倉書店(1987). 【非特許文献5】坂井 利之:“パターン認識の理論,”情報科学講座E.19.1,共立出版(1967). 【発明の開示】 【発明が解決しようとする課題】 【0010】 しかしながら従来技術には以下に述べるような課題があった。 【0011】 特許文献1に開示の技術は判別部分空間として全ての説明変数が張る空間の超平面として与えられるので、この判別部分空間から判別に寄与しない説明変数を特定することは困難であった。 【0012】 また非特許文献2及び非特許文献3に記載の変数選択技術は比較する分布の分散共分散行列が同じであると仮定しており、分散共分散行列が異なる場合には適用できなかった。 【課題を解決するための手段】 【0013】 上記課題を解決するために、本発明では、d個の変数により表現されるサンプルx=(x(1),x(2),…,x(d))Tと、それが属するクラス番号yのN個の組{(xj,yj)|j=1,…,N}に対して、N個の変数からN-1個の変数の全ての組み合わせを生成する工程1と、該全てのN-1個の変数で表現される該クラスのパラメタを推定する工程2と、該工程2で推定されたパラメタを用いて任意の2つのクラス間の相違度を算出する工程3と、該任意の2つのクラス間の相違度より全てのクラスの分布に対する相違度を算出する工程4とより構成され、該工程1から該工程4は、Nがdから1個ずつ減少させ予め設定された値になるまで繰り返す事を特徴とするデータ判別方法であり、該工程3は、任意の2個のクラス間の相違度をKullback-Leiblerダイバージェンスを用いて算出し、該工程4は、クラスmとクラスnの間の相違度を(m,n)成分とする行列の行列式として算出することを特徴とするデータ判別方法を提供し、特に、該工程3において、分散共分散行列が異なる2つの確率密度分布間の相違度を、非特許文献4で開示されている(式02)のKLDで算出する。 【0014】 (式02)KLDij = (1/2)tr{(Vi-Vj)(Vj-1-Vi-1)}+(1/2)tr{(Vi-1-Vj-1)(μi-μj)(μi-μj)T} 上式中、tr{}は行列のトレースを表わす。KLDを用いることによって、平均ベクトル、分散共分散行列のどちらも異なる確率密度関数の相違度が比較できるようになった。 【0015】 ちなみに(式01)で与えられるMahalanobis Distanceは、分散共分散行列が 等しい2つの分布間のKLDであることが非特許文献4に示されている。 【0016】 また、クラス数が2を超える場合の相違度を算出するために工程4において、上記工程3で計算されたKLDを(i,j)成分とする行列を形成する。 【0017】 【数1】
【0018】 (式03)で与えられる行列の行列式、或いはトレースを相違度として算出する。 【発明の効果】 【0019】 以上説明したように、本発明によれば、簡単な方法で、所望の要求仕様満たす判別部分空間を得る事が出来た。 【発明を実施するための最良の形態】 【0020】 実施例1の処理の流れ図を図1に、構成図を図2に示す。図中、201はCPU、202は表示装置、203は入力装置、204は1次記憶装置、205は2次記憶装置、206は通信装置、207はバスラインである。 【0021】 本発明における工程は,プログラムとして予め2次記憶装置205に格納されており、入力装置203、或いは通信装置206等からのコマンド入力によって、1次記憶装置にロードされ、実行されるものである。 【0022】 図中、101ではN個のインデクスからN-1個のインデクスの全ての組み合せを生成する。例えばN=3のときは以下の3通りである。 【0023】 (式04) {(1,2), (1,3), (2,3)} 組み合せの数は一般にNCN-1=Nである。 【0024】 Nは初期値として与えられた変数の数dが設定される。 【0025】 102では(式04)のように与えられたインデクスの組み合せに対応した変数が張る部分空間での各クラスのパラメタ(平均ベクトルμi及び分散共分散行列Vi)を推定する.推定方法として、「柴田:“確率・統計,”理工系の基礎数学」等に最尤推定法が開示されている。 【0026】 103では上記パラメタを用いて(式02)でKLDを算出する。 【0027】 104では上記KLDを用いて(式03)でKLD行列を構成し、KLD行列式或いはトレースを算出する。 【0028】 105では最大のKLDを持つインデクスの組を部分空間の基底として採用する。例えば(式04)のうち、(1,3)が最大のKLDを持つなら、変数2を棄却し、変数1と3が張る部分空間を判別に供する空間とする。 【0029】 以下、予め定められた要求条件を満たすまで、101から105を繰り返す。ここで要求条件とは、例えば以下のものが考えられる。 【0030】 1.部分空間の次元を指定する。 【0031】 2.KLDの値を指定する。 【図面の簡単な説明】 【0032】 【図1】本発明の実施例1の流れ図である。 【図2】本発明の構成図である。
|
| 【出願人】 |
【識別番号】000001007 【氏名又は名称】キヤノン株式会社
|
| 【出願日】 |
平成17年10月11日(2005.10.11) |
| 【代理人】 |
【識別番号】100090538 【弁理士】 【氏名又は名称】西山 恵三
【識別番号】100096965 【弁理士】 【氏名又は名称】内尾 裕一
|
| 【公開番号】 |
特開2007−108854(P2007−108854A) |
| 【公開日】 |
平成19年4月26日(2007.4.26) |
| 【出願番号】 |
特願2005−296486(P2005−296486) |
|