コンピュータは働きたくて、いつもウズウズしています!   Data + Automation = Datamation
TEXT_SIZE

608 決定木分析プログラム

決定木プログラムは、説明変数及び目的変数が、名義尺度や順序尺度の時、
変数の情報指標を計算し、目的変数を的確に分類する説明変数の選択の様子を
明らかにする時に使用します。
なおこのプログラムは、「可能性を考慮した決定木構築アルゴリズム」(※)を基に、Excel VBAで作成しています。
(※)2003/03:火の国シンポジウム:九州工業大学 和田 稔/平田耕一/原尾政輝(2014年1月現在リンク切れ)


サンプルデータ


設定画面

アドイン接続を終え、メニューの「決定木分析」をクリックすると、次のように、設定画面が表示されます。

説明変数の範囲指定:

説明変数にあたるデータの範囲をマウスでドラッグして選択します。
サンプルデータでは青色部分を範囲選択します。
データラベル(変数名)を含めて範囲選択してください。
なお説明変数は最大で100変数まで分析可能です。

→ 100変数を超える処理に関する可否・料金を問い合わせる(問い合わせフォームへ)

目的変数の範囲指定:

目的変数にあたるデータの範囲1列をマウスでドラッグして選択します。
サンプルデータではオレンジ色の部分を範囲選択します。
データラベル(変数名)を含めて範囲選択してください。

出力先の指定:

出力を開始したいセルを1か所マウスでクリックして選択します。

説明変数内での制限要素数:

最後の分岐数をいくつにするか、数字を入力して設定します。
最大50まで指定できます。

分析終了条件の細分化行数:

最後の分岐のデータ行数を何行にするかを設定します。

中間出力:

中間結果を同時に出力させる場合は、「有」をマウスでクリックして選択します。

展開図作成:

展開図を出力結果と同時に出力させる場合は、「有」をマウスでクリックして選択します。

設定が済んだら、「開始」ボタンをクリックします。
「中止」ボタンをクリックすると、操作を中止します。


出力結果

中間出力を「有」とした場合の出力結果は、次のようになります。


参考

分析方法は以下のとおりです。

A.項目選択のための情報指標の計算

1.情報量の計算

目的変数の情報量DI

Σ-(pk/nj)*log(pk/nj)
pk=要素数
nj=レコード数

説明変数(属性)の情報量Dj

-Σ((pj/nj)*Σ(pi/pj)*log(pi/pj))
pj=属性での要素数
nj=属性のレコード数
pi=属性の要素の中の目的変数の要素数

2.利得の計算

属性の利得
DI-Dj

3.分割情報量(SPL)

Σ-(pj/nj)*log(pj/nj)

4.利得比

分割情報量/利得

5.非純粋性(GI,GJ)

DIの非純粋性GI

1-Σ(pk/nj)*(pk/nj)

属性の非純粋性Gj

Σ((pj/nj)(1-Σ(pi/pj)*(pi/pj)))

6.GINI指標

GI-Gj

B.項目の選択基準

分割判断基準=利得比の大きい説明変数(属性)から順次選択しパスを作成する。

C.カテゴリの区間数の制限

要素の昇順を考慮した度数の累積割合を算定し、要素単位で度数を考慮して、制限区間の範囲に割り付ける。
制限数=3の時は、設定範囲数=3とする。

変換結果を出力

例)
a1 → a1
a1 → a1
b1 → a1
b2 → b2
b3 → b2
c1 → b2
c2 → b2

D.数量の区間数の制限

小さい数字順に並べる。
制限区間数の範囲に割付ける。
ただし同じ数量がある場合は、小さい方の範囲に含ませる。
制限数=3の時は、設定範囲数=3とする。
境界数字で変換結果を出力
境界の表現は次の通り。

<=nnn
<nnn<=
nnn<

ただし、nnnは境界の(小+大)/2で表わす。

E.分割する最小のレコードの処理

全レコード*割合の整数より、分割するレコード数が少ない場合は、この範囲以下の分割処理は行わない。

F.目的変数の処理

1)カテゴリの場合は、種類と、その個数を出力

2)数量の場合は、個数とその合計を出力
  即ち、決定木と回帰木の両方の処理ができる。
 


2014/04/01~価格: ¥12,960.-
キャンペーン価格: ¥10,710.- (2014/03/31ご注文送信分まで)

ご注文はこちらから。別途、注文フォームが開きます。


デモンストレーション Excel形式マクロファイル ダウンロード

●販売価格について●

諸般の事情により、上記に表示されている販売価格について、次のように取り扱っております。
ご不便をおかけしております。

2014/03/31(月)までの販売価格を4/1(火)以降も継続。

●販売価格改訂時期や内容については、また別途お知らせ致します。

▲デモンストレーション用Excelマクロファイルをダウンロード▲

  • ダウンロード後、HDD内の任意の場所で解凍してご利用下さい。
  • Windows ZIP形式の圧縮ファイルです。ダウンロード後ダブルクリックすると、Excelマクロ形式のファイルが展開されます。
  • ご使用にあたり、Windows(R)版 Microsoft(R) Excel(R)97以降(Excel2000以降推奨)のバージョンで、Excelが通常動作できる程度のRAMとHDD容量が必要です。また、分析ツールが稼動することが必要です。「分析ツール-VBA」をアドイン接続させて下さい。
    なおExcel2007以降の場合、バージョンにより、動作が対応していない場合がございます。
    予めご了承ください(MicrosoftにてVBAの仕様が変更になったため)。
  • ファイルを開く際は、「マクロを有効にする」を選択して表示してください(Excel2003までの場合)。Excel2007以降の場合は、ファイルを開いたときに「セキュリティの警告」と「コンテンツの有効化」ボタンが表示された場合は、「コンテンツの有効化」ボタンをクリックしてください。
    「オプション」の「セキュリティセンター」の「マクロ」メニューで、マクロを無効にしている場合は、このように表示されることがあります。
  • 本ソフトウエアの営利目的の譲渡を禁じます。本ソフトウエアに対する解析、リバースエンジニアリング、逆アセンブル、修正等は一切禁止します。
  • 本ソフトウエアの導入によって生じた損害等につきましては、著作権者は一切の責任を負い兼ねます。また、本ツールのご使用に基づく解析経過や結果におきましては、ご自身のリスクと判断でご活用下さい。解析結果及び直接の損害・不便のほか、第三者の不便等一切の責任を負いかねます。予めご了承下さい。
  • ファイルのアップロードの時点で、出来る限りのウィルス対策を施しておりますが、アップロード後に発見されたウィルス等により、検知できない場合がございます。ご使用前には、ご自身の責任と費用負担において、必ずウィルスチェックを行ってください。

以上の項目に同意いただける場合は、ダウンロードを実行してください。
同意いただけない場合、ダウンロードはご遠慮ください。何卒ご了承お願いいたします。

▲動作環境・アドイン接続方法など▲

動作環境

日本語版Windows用 日本語版Microsoft Excel2003以降(推奨)が快適に動作するパソコン。
Excelのアドイン「分析ツール-VBA」のアドイン接続を必ず行い、マクロを使用可能にして下さい。
その他は、Microsoft Excelの仕様に基づきます。

なおMicrosoft社によるサポートが終了したバージョンのExcelを使用したときのいかなる障害・損害・不便などにおきましては、当方では責任を負いかねます。
予めご了承ください。

Microsoft社「Windows XP および、Office 2003 のサポート終了についてのご案内
http://www.microsoft.com/ja-jp/windows/lifecycle/sp3eos.aspx

アドイン接続方法・
ソフトウェア使用許諾

addman03     addman07     get adobe_reader


カスタマイズのご用命は、お問い合わせフォームからどうぞ

なおソースコードは、ここでご案内している標準版の内容になります。

お支払方法・納品方法などについては……

特定商取引に関する法律に基づく表記をご覧ください。

Excel用アドインプログラム