豊橋市議の長坂です。
表紙だけが懐かしい、すぐ挫折した大学教科書です。


さて、先週末に愛知県知事選挙がありました。
予想通り、投票が終わる20時に当確(当選確実)が出ました。

「まだ開票すらしてないのに、どうして…」

と思う方がいらっしゃるかもしれません。
それが統計です。



※以下、もしかしたら不正確な部分があるかもしれません。もし統計にお詳しい方で間違いを見つけた方いらっしゃいましたら、速やかに訂正するので、ご教授いただければ幸いです。

まずは世論調査(選挙前の情勢調査や、選挙期間の出口調査含む)について、こちら。
各種の世論調査はどれも1500~2000人を対称に行っている。そしてなぜか,5000人を対称とした世論調査も,8000人で調べた世論調査も存在しない(はずである)。1億人の意見を調べようとすれば2000人の意見を調べたらもうそれで十分だかららしい(略)なぜ2000人でいいかと言うと,そういう計算式と言うか統計処理方法があるからである。
http://www.wound-treatment.jp/next/wound225.htm 
でもこれが許されるのは、ある程度の「誤差」を許容しているから。
逆に言えば、世論調査と大きく違う投票結果が出ることもあります(低い可能性だけれども)

では、この「誤差」をどのくらいに設定しているかというと、この1500~2000人では、±2.5%。
つまり、世論調査結果がAさん60%、Bさん40%なら実際は、前後2.5%広げて
  • Aさん:62.5%~57.5%
  • Bさん:42.5%~37.5%
の誤差は許容する、ということです。
それでもこの場合、Aさんの最低値57.5%とBさんの最高値42.5%を比べても、明らかにAさんが高いので、Aさんの「当確」となります。

けれども調査結果が、Aさん52%、Bさん48%だと、
  • Aさん:54.5%~49.5%
  • Bさん:50.5%~46.5%
となって、もしかしたらAさん(49.5%)を、Bさん(50.5%)が上回っている可能性が十分にあるので、簡単に「当確」を出しません。

このあたりの数字を報道機関も選挙中には出せないので「リード」「やや先行」などの曖昧な言葉で記事にします。

あくまで目安ですが、この図がわかりやすいです。

先行、横一線、伸び悩む―選挙情勢の報道用語|政治山
https://seijiyama.jp/article/news/nws20141212-002.html 


では、どうして市議選では当確が出せないか。
先ほどの許容誤差 ±2.5%がポイントです。
190204_150423_163138
例えば、前回の豊橋市議選挙では42人が立候補しました。
そして「安全ライン」と言われたが3000票。
また最高でも過去に6000票を超えた候補はいません(補選除く)

有権者が約30万人であるため、3000票は1%です。
また投票率が50%であるため、もし世論調査をするとこんな感じに。
  • 投票に行かない:50%
  • Aさんに入れる:1%前後
  • Bさんに入れる:1%前後
  • Cさんに入れる:1%前後…
という結果になります。しかし、許容誤差が±2.5%」あるため、
  • 投票に行かない:52.5~47.5%
  • Aさんに入れる:3.5%前後~0%
  • Bさんに入れる:3.5%前後~0%
  • Cさんに入れる:3.5%前後~0%…
となります。
つまり、40人も候補がいる選挙では、許容誤差 ±2.5% は大き過ぎるのです!



「じゃあ、許容誤差を小さくすればよくない?」

はい、その通りです。
例えば±300票くらいの誤差であれば、それなりに(上位半分18人くらいは)当確が出せるかもしれません。
有権者が30万人のため±300票は、±0.1%の誤差に相当します。

許容誤差 ±2.5% で1,500人ほどで十分でした。
では、±0.1% の場合に必要な調査人数は
 ・
 ・
 ・

228,593人!!※

30万人中、約23万人をする調査なんて、とてもとても無理です。
(※母集団300,000人、信頼率95%、係数1.96で計算)



そんなわけで、市議選では事前の世論調査も行われず、
本当に「蓋を開けるまでわからない」となります。

こわっ。。。

では!


(ご参考)
適切なサンプリング数とは?アンケートサンプル数の決め方
 https://www.web-research.net/column/article25/
アンケートのサンプルサイズ ~アンケートに必要な人の数を予測しましょう~
 https://jp.surveymonkey.com/mp/sample-size/ 
アンケートに必要な回答者数の計算
 https://help.surveymonkey.com/articles/ja/kb/How-many-respondents-do-I-need
母比率の区間推定における必要なサンプルサイズの計算フォーム | ブログ | 統計WEB
 https://bellcurve.jp/statistics/blog/14347.html 
付表 サンプルサイズ表(標本の大きさ)sample size
 https://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/samplesizetab.html 
(エクセル)サンプル数の決定
 http://www.shuwasystem.co.jp/books/1110/1110-X/sample.xls