判別分析のソースを表示
←
判別分析
移動先:
案内
、
検索
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
要求した操作を行うことは許可されていません。
このページのソースの閲覧やコピーができます。
'''判別分析'''(はんべつぶんせき)は、事前に与えられているデータが異なるグループに分かれることが明らかな場合、新しいデータが得られた際に、どちらのグループに入るのかを判別するための基準(判別関数)を得るための手法。 判別関数には超平面・[[直線]]による線型判別関数(linear discriminant function)と、非線型の場合には超曲面・[[曲線]]による[[マハラノビス距離|マハラノビス汎距離]](Mahalanobis' generalized distance)による非線型判別関数とがある。 3つ以上のグループの判別も可能である。これは重判別分析(multiple discriminant analysis)や正準判別分析と呼ばれる。 判別式の妥当性は、誤判別率などで評価できる。適した[[変数選択]]と判別方法にもとづいて分析することが必要であり、判別式(のみならず[[変数選択]])の妥当性を検証する手法として、元のデータから1つだけ外して判別(モデル)式を得、外したデータを新たなデータとして適用した際に妥当な結果が得られるかを検証する、1つとって置き法(leave-1-out)などが一般に用いられる。 [[入学試験|入試]]を具体例に取ると、個々の受験生は、各群に属する個々の入試得点により、合格・不合格という2群に分けられる。学校側で明確な基準を設ける場合、たとえば英語で100点満点中70点を合否ラインにした場合、生徒の合否は得点が70点を境に分かれることとなるが、合否基準が非公開な場合や、その年度によって、合格者の平均点も変動することは周知である。 このような教師データが存在する場合(予備校などでは自己採点結果などから、相当に精度の高い標本を有しており、これを教師データとして扱うことは相応に妥当と考えられる)、判別分析により、過去の受験生の点数実績と合格実績から、合否の基準を計算によって求めることができる。 ==分析法== 線型判別関数 (''y=a<sub>1</sub>x<sub>1</sub>+a<sub>2</sub>x<sub>2</sub>+…+a<sub>n</sub>x<sub>n</sub>+a<sub>0</sub>'') の求め方を以下に示す。 #第一群、第二群についてそれぞれ平方和・積和を求める。 #:''W<sub>ii</sub>=''Σ(''x<sub>i</sub>-x'')<sup>2</sup>,''W<sub>ij</sub>=''Σ(''x<sub>i</sub>-x'')(''x<sub>j</sub>-x'') #第一群と第二群の平方和・積和を、同じ2変数について足し、[[自由度]]N1+N2-2で除す。 #:''S<sub>ij</sub>=''(''W<sub>ij</sub>''(第一群)''+W<sub>ij</sub>''(第二群))/(N1+N2-2) #''S<sub>ij</sub>''を、その''i''行''j''列に対応させて分散共分散行列''S''とし、各変数にかかる係数をn行1列に並べた行列を''A''、第一群の各変数の平均値から第二群の各変数を引いた数''x<sub>i</sub>''(第一群)-''x<sub>i</sub>''(第二群)をn行1列に並べた行列を''X''とすると以下の式が成り立つ。 #:''SA=X'' ゆえに ''A=S''<sup>-1</sup>''X'' #これにより各変数にかかる係数を求めることができる。 #:定数項は、''a<sub>0</sub>=''-1/2[''a<sub>1</sub>''{''x<sub>1</sub>''(第一群平均値)''+x<sub>1</sub>''(第二群平均値)}''+…+a<sub>n</sub>''{''x<sub>n</sub>''(第一群平均値)''+x<sub>n</sub>''(第二群平均値)}] #判別得点''y''が正のとき第一群、負のとき第二群と判別される。 #:変数が標準化されていれば、係数の大きさは、そのままその変数が判別に与える影響の大きさである。 #:変数が定性的な場合は、[[ダミー変数]]を用いる。 #::''y=a<sub>11</sub>x<sub>11</sub>+a<sub>12</sub>x<sub>12</sub>+…a<sub>21</sub>x<sub>21</sub>+a<sub>22</sub>x<sub>22</sub>+…a<sub>n1</sub>x<sub>n1</sub>+a<sub>n2</sub>x<sub>n2</sub>+…a<sub>0</sub>'' #:ここに、''x<sub>ij</sub>'':''x<sub>i</sub>''のj番目のカテゴリーに反応するとき1、しないとき0。 == 関連項目 == * [[固有顔]] * [[線型分類器]] {{DEFAULTSORT:はんへつふんるい}} [[Category:統計学]] [[Category:数学に関する記事]] [[Category:分類アルゴリズム]] [[Category:分析]] [[Category:消費者行動]] [[Category:マーケティング]] [[Category:心理検査]]
判別分析
に戻る。
案内メニュー
個人用ツール
ログイン
名前空間
ページ
議論
変種
表示
閲覧
ソースを表示
履歴表示
その他
検索
案内
メインページ
コミュニティ・ポータル
最近の出来事
新しいページ
最近の更新
おまかせ表示
sandbox
commonsupload
ヘルプ
ヘルプ
井戸端
notice
bugreportspage
sitesupport
ウィキペディアに関するお問い合わせ
ツール
リンク元
関連ページの更新状況
特別ページ
ページ情報