305 マハラノ距離予測プログラム

  • 印刷

マハラノ距離予測プログラムは、多変量データにおいて基準データのマハラノ距離から、予測データのマハラノ距離を計算し、どのデータが外れ値になるかを予測するときに使用します。


サンプルデータ


設定画面

アドイン接続後、メニューから「マハラノビス予測」をクリックすると、次のように設定画面が表示されます。

基準データの行列範囲:

サンプルデータでは「基準データ」に当たる青色の部分をマウスでドラッグして、範囲選択します。
なおデータ行列は最大で、200列(変数)×500行以内です。

予測データの行列範囲:

サンプルデータでは「予測データ」に当たるオレンジ色の部分をマウスでドラッグして、範囲選択します。
なおデータ行列は最大で、200列(変数)×50行以内です。

予測データの行とラベル:

範囲選択をした中にデータラベルを含んでいる場合は、「共にあり」をマウスでクリックして選択します。

出力先:

結果を出力させたい最初のセルをマウスでクリックして、選択します。

図表示:

結果から、併せてグラフを表示させたい場合は、「あり」をマウスでクリックして、選択します。

設定が済んだら、「開始」ボタンをクリックします。
基データとして範囲選択をした次の位置から、赤色で予測値を出力します。
「中止」ボタンをクリックすると、操作を中止します。


出力結果


参考

処理のポイントは、マハラノビス距離を求めることです。
基準データと予測データそれぞれについて以下の計算をします。まずは基準データについて求めます。

(1)まず基準データを標準化します。

        ↓標準化した基準データ = (データ-平均値)/標準偏差

(2)標準化した基準データの相関係数行列を求めます。

(3)相関係数行列の逆行列を求めます。

(4)次に示す関係式を使ってマハラノビス距離を計算します【B】。

マハラノビス距離=標準化した基準データ【A】*相関係数行列の逆行列*【A】の転置行列/変数の個数

【B】行列の1行目*【A】の置換行列の乗算を行い、(変数が4のため)結果を4で割ると、 次に示すマハラノビスの距離が得られます。

上の表で、最大値はH項目の1.778です。
従って、このH項目の「1.778」が、外れ値の基準、つまり閾(しきい)値となります。

次に予測データについても同様な計算を行います。
結果は次の通りです。

この表のx2項目のマハラノビス距離は基準閾値より大きいので、外れ値と判断します。


アドインプログラム販売価格: ¥2,000.-(税込) 
※販売のみを行っております。ご質問対応等のサポート及び改変は承っておりません

ご注文はこちらから。別途、注文フォームが開きます。


VBAソースコード販売価格: ¥60,000.-(税込)
※コードの内容は、上記標準版の内容の通りです
※サポート・ご質問の対応・改変のご依頼を承ることはできかねます

VBAソースコードのご注文はこちら


デモンストレーション用 Excel形式マクロファイル ダウンロード