平均への回帰のソースを表示
←
平均への回帰
移動先:
案内
、
検索
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
要求した操作を行うことは許可されていません。
このページのソースの閲覧やコピーができます。
'''平均への回帰'''(へいきんへのかいき、または'''平均回帰'''、'''回帰効果''')とは、1回目の試験結果が偏っていた(特別に良かった、悪かったなど)対象について2回目の試験結果(時間的には逆でもよい)を調べると、その平均値は1回目の測定値よりも1回目全体の平均値に近くなるという[[統計学]]的現象をいう。 [[回帰分析]]の語源となったが、これとは異なる概念である。 == わかりやすい例 == 生徒たちが中間試験と期末試験を受けるとしよう。 中間試験で特別に高得点だった生徒たちに注目して調べると、(たぶん期末試験でも得点は高い方だろうが)一般に中間試験のときよりは平均に近い(平均からの偏差がより小さい)結果になる。それは、中間試験で働いた「幸運」(偶然)が、期末試験では必ずしも働かなかったからである。 逆に、期末試験で特別に高得点だった生徒たちについて調べても、中間試験での平均からの偏差は期末試験のそれより一般に小さい。 また、特別に低い得点の生徒たちで調べても同じ傾向が見られる。 == 歴史 == 回帰とは元来、生物データから見出された現象であり、その最初は[[フランシス・ゴルトン]]により[[1877年]]に発表された種子の重量に関する結果である。ゴルトンは7組のスイートピーの種子(種子の重量は組により異なるが、組の中では同じにした)を栽培し比較したところ、以下のことを見出した: # 子世代の種子重量は親世代と同じく正規分布に従い、また子世代種子の平均直径を親の平均直径に対してプロットすると直線に近い関係がある(現在でいう[[線形回帰]]が適用できる)。 # しかし、子の平均直径は親の直径と比較すると、より全体の平均直径に近づく傾向がある(回帰)。 彼は初めこの直線の[[勾配]]を「復帰係数coefficient of reversion」と呼んだ(いわゆる先祖帰りのような生物的現象と考えた)。その後この効果は生物的なものでなくデータの扱いの結果であることを発見し、その名を「回帰係数coefficient of regression」と変更した。この結果は「有利な形質をもつ個体が生存して子孫を残し、代を重ねるごとにその形質は顕著になる」という当時の[[進化]]に関する考えと矛盾するように見えて注目された。実際にはこの種子の大きさは[[遺伝]]による部分より[[偶然]]的変動が大きかったということである。彼はさらに研究を重ね、[[1888年]]に「相関co-relation」という言葉を使い、これを表す定数([[相関係数]])に"r" という字を用いた。 また、このような研究をヒトにも適用し、たとえば様々な分野の天才を調べ、彼らの子はほとんど常に親より平均に近くなることを見出した。さらに定量的で客観的な方法として、父親と息子の身長を比較し、やはり特別に高身長の父親でも、特別に低身長の父親でも、息子たちの身長は父親たちの身長より平均に近くなることを見出した。 == 普遍性 == 平均への回帰は普遍的な統計現象で生物や遺伝とは関係ない。また時間経過とも関係ない。特別高身長の人たちの「父親」の身長は、息子たちの身長より平均に近い。全体の身長の分布は、父親世代も息子世代も同じである。 == 数学的説明 == ''X'' と ''Y'' をいずれも[[正規分布]](平均0、分散1)に従うランダム変数とし、これらの[[相関係数]]を''r'' とする。|''r''| <= 1である。正規分布の性質から、''X'' の値が決まっている場合の''Y'' の期待値は''X'' に比例する、すなわち ''E[Y|X]=rX'' 。ここで|''r''| < 1であるから、''Y'' の期待値は''X'' の観察値よりも0に近い。一般の[[確率分布]]についても同様の結果が得られる。 これは、2変数の相関が小さくなる(|''r''|が小さくなる)ほど、平均への回帰は顕著になる、ということを示している。つまり現在、相関を分析する方法として[[回帰分析]]、線形回帰などという言葉が用いられるが、'''元来の意味での「回帰」は、むしろ「相関が低い」ことを表している'''のである。 == 回帰に関する誤解 == [[回帰の誤謬]](regression fallacies)とは、平均回帰に気づかずにデータの収集と解釈を行い、さも科学的根拠があるような誤った結論(改善効果があった、悪化が見られる、等)を出してしまうことをいう。 有名な例には統計学者Horace Secristの著書“The Triumph of Mediocrity in Business”(ビジネスにおける平凡さの勝利、1933年)がある。ここでは「競合するビジネスの利益率には時間平均に近づく傾向がある」という「経営学の法則」を示すために、膨大なデータを集めたが、実際のところ平均回帰の一例(あるいは盛者必衰の理?)を示したにすぎない。 よくありがちな誤謬には次のようなものがある。ある薬が成績を増すかどうかをテストしたい。まず生徒にテストをさせ、点数が最下位10%だった生徒たちに薬を与え、再度別のテストをさせる。すると平均成績が顕著に上がったという結果が得られる。しかしこれは薬の効果について何もいったことにならない。この例では薬なしの比較対照実験も可能だが、そこでも同じことが起きるだろう。 == 関連項目 == * [[回帰分析]] * [[重回帰分析]] * [[ロジスティック回帰]] * [[優生学]] [[Category:統計学|へいきんへのかいき]] [[Category:数学に関する記事|へいきんへのかいき]]
平均への回帰
に戻る。
案内メニュー
個人用ツール
ログイン
名前空間
ページ
議論
変種
表示
閲覧
ソースを表示
履歴表示
その他
検索
案内
メインページ
コミュニティ・ポータル
最近の出来事
新しいページ
最近の更新
おまかせ表示
sandbox
commonsupload
ヘルプ
ヘルプ
井戸端
notice
bugreportspage
sitesupport
ウィキペディアに関するお問い合わせ
ツール
リンク元
関連ページの更新状況
特別ページ
ページ情報