tsuyukusa's blog

心理学あたりのあれやこれや

値の推測 統計学のウソ?

授業時のコメントシートで統計的推測についての質問がありました。

 
20人くらいで行う実験で母集団の値(平均値)を推測するといった話を授業で行いました。
 
統計は最強の学問とかの本の刊行の一方、「統計学のウソ」といった本も刊行されていて、「これは40%」とかいうのがいかにいいかげんかといったことが書かれていた。その関係は? というものでした。
 
授業の途中でもいったように、社会調査の推定の絶対的な値の必要性と、ものごとの関連性や比較に焦点をあてる心理学は異なるといった話をもう一度せざるを得ません。
 
統計学のウソが書かれた背景は怪しいあるいはいいかげんな社会調査やテレビのちょっとした調査、視聴率、数の少ない電話調査などの問題があります。
 
これの問題はつまり「絶対的な値の推定に興味があって(内閣支持率のように)、そのため、その確度を挙げるためにはできるだけ多数のサンプルが必要であり、そうでないと信頼区間が広くなりすぎて意味のある点推定ができないからです。
つまり、サンプルが少ない、あるいは偏っていると、こちら40%、こちら50%といっても実はどっちが本当に高いかは分かりません。数字に大した意味がなくなります。
 
これに対して実験などの20人といったサンプルはその文化の代表という観点のサンプルですが、絶対的な値の推定に興味はありません。授業で述べたように課題遂行のつまようじ何本積んだかなんてどうでもいいんです。
 
それよりも前から見ていると積みにくく、後ろから見ているときの方が本数が多かった。これが重要です。 比較です。 だから、何本かはどうでもいいけど、現れた「差」が信頼できるかどうか。それを統計的検定するわけですね。1%有意有意差があればそういった差が100回実験したら99回の確度で、つまり個々の本数のぶれ、誤差を超越して、A条件の方が何本だろうとほぼ常にB条件の値を上回るのだという推定が重要です。そういった推定ならば20人vs20人で十分できるし、むしろ少数で差が検出できた場合の方が「差が大きい」「差が安定している」わけで、200人vs200人で有意差があるのは当たり前でむしろ意味のない微々たる絶対値の差しかないときまで有意になってしまう。したがって、実験で1水準100人のデータをとるのは卑怯なあるいは妥当でないやり方であり、現在はある程度きまった値の効果量を検出する期待のもとでは、危険率1%では何名程の実験参加者で実験をしたらいいか逆算ができますし、国際的科学論文ではそれが推奨されています。大きすぎるデータは無用ってことです。 まぁ小さすぎるのも困りますが。
 ねらいは「関係」「差」の検出。 絶対的な値はどうでもいいからです。