マハラノ距離予測プログラムは、多変量データにおいて基準データのマハラノ距離から、予測データのマハラノ距離を計算し、どのデータが外れ値になるかを予測するときに使用します。
アドイン接続後、メニューから「マハラノビス予測」をクリックすると、次のように設定画面が表示されます。
基準データの行列範囲:
サンプルデータでは「基準データ」に当たる青色の部分をマウスでドラッグして、範囲選択します。
なおデータ行列は最大で、200列(変数)×500行以内です。
予測データの行列範囲:
サンプルデータでは「予測データ」に当たるオレンジ色の部分をマウスでドラッグして、範囲選択します。
なおデータ行列は最大で、200列(変数)×50行以内です。
予測データの行とラベル:
範囲選択をした中にデータラベルを含んでいる場合は、「共にあり」をマウスでクリックして選択します。
出力先:
結果を出力させたい最初のセルをマウスでクリックして、選択します。
図表示:
結果から、併せてグラフを表示させたい場合は、「あり」をマウスでクリックして、選択します。
設定が済んだら、「開始」ボタンをクリックします。
基データとして範囲選択をした次の位置から、赤色で予測値を出力します。
「中止」ボタンをクリックすると、操作を中止します。
処理のポイントは、マハラノビス距離を求めることです。
基準データと予測データそれぞれについて以下の計算をします。まずは基準データについて求めます。
(1)まず基準データを標準化します。
↓標準化した基準データ = (データ-平均値)/標準偏差
(2)標準化した基準データの相関係数行列を求めます。
(3)相関係数行列の逆行列を求めます。
(4)次に示す関係式を使ってマハラノビス距離を計算します【B】。
マハラノビス距離=標準化した基準データ【A】*相関係数行列の逆行列*【A】の転置行列/変数の個数
【B】行列の1行目*【A】の置換行列の乗算を行い、(変数が4のため)結果を4で割ると、 次に示すマハラノビスの距離が得られます。
上の表で、最大値はH項目の1.778です。
従って、このH項目の「1.778」が、外れ値の基準、つまり閾(しきい)値となります。
次に予測データについても同様な計算を行います。
結果は次の通りです。
この表のx2項目のマハラノビス距離は基準閾値より大きいので、外れ値と判断します。
動作環境 |
日本語版Windows用 日本語版Microsoft Excel2003以降(推奨)が快適に動作するパソコン。 |
アドイン接続方法・ ソフトウェア使用許諾 |
※Excel2016・2019も右側の「Excel2007・2010・2013用」をお選びください |
マクロが実行できないときにご確認ください |
https://faq.mypage.otsuka-shokai.co.jp/app/answers/detail/a_id/314030
当商品のような、インターネットからダウンロードしたExcelのファイルについて、マクロが実行できない仕様になっているようです。 マクロを有効化する方法が記されています。お試しください。 |
※カスタマイズは対応不可となりました(2019年1月)