08 4月 2016
二項検定について【応用編】|Excel(エクセル)で学ぶデータ分析ブログ
この記事では二項検定について応用例を元に紹介しています。
※二項検定の基本的な考え方は下記の記事をご覧ください。
→基本編へ
→実践編へ
二項分布の基礎編ではサイコロの確率を利用して説明をしました。
ただ、実生活ではあまりサイコロを利用する機会がありませんので
もう少し違った情報を使って二項検定を紹介したいと思います。
多数決の検証
例えばとあるグループにある決議をしてもらった結果、下記のような結果となりました。
賛成 | 反対 | 合計 |
---|---|---|
24 (52.2%) |
22 (47.8%) |
46 (100%) |
賛成多数のため、多数決の原理に則ってその議案は採択されました。
しかしこの結果は1人が反対を唱えれば同数、2人が反対を唱えれば反対多数となる微妙なラインです。
果たして本当に「賛成多数」といえるのでしょうか。
統計学的に賛成多数は何人から?
統計学的に「有意な差」で賛成多数となれば、きっと誰も文句は言いません。
賛成と反対の発生率はそれぞれ1/2ずつなので、明らかに結果が賛成に寄る(反対者が少ない)場合を考えてみます。
C列のデータは累積確率分布といいます。
一般的にはこの値が5%以下であれば「有意な差」として評価されることが多いですが
今回は反対数が17人以下(賛成29人以上)を統計学的に賛成多数と評価してみてはいかがでしょうか。
ちなみに先ほどの結果を男女比でクロス集計してみました。
賛成 | 反対 | 合計 | |
---|---|---|---|
男性 | 22 (84.6%) |
4 (15.4%) |
26 (100%) |
女性 | 2 (10%) |
18 (90%) |
20 (100%) |
合計 | 24 (52.2%) |
22 (47.8%) |
46 (100%) |
男女によって賛成と反対の比率が大きく異なります。
いったい、どんな議案を採決したのでしょうか。