参院選の選挙結果を恐ろしいほど高い精度で予測していた「Yahoo! JAPANビッグデータレポート」がすごい

テレビの出口調査による予測よりずっと前に選挙結果をピタリと予想した人達がいた。Yahoo!Japanのビッグデータレポートチームである。そう、流行りのビッグデータだ。

出口調査結果から開票前に大勢が判明する最近の選挙速報番組

第23回参院選は7月21日投開票が行われた。大方の予想通り、自民党が単独過半数を占める一方、民主党は獲得議席数が結党以来最少となり、参院で与党が少数の「ねじれ国会」が解消されることとなった。選挙結果には驚きの少なかった今回の選挙だが、民放NHK各局が行う選挙速報番組には驚きを覚えた方もいらっしゃったかもしれない。最近の選挙速報番組では、開票に応じて当確が発表されるのではなく、投票終了の20時の時点で出口調査に基づく予測に基づいて、多くの当確が発表されている。これは、20時ギリギリに投票しそのまま帰宅するとほぼ結果が分かる、ということになる。「自分の票が物理的に開票されている感」を感じることができず、一票の重みを感じる機会が少なくなってしまう一因にもなるかもしれない。しかし、テレビの出口調査による予測よりずっと前に選挙結果をピタリと予想した人達がいた。Yahoo!Japanのビッグデータレポートチームである。そう、流行りのビッグデータだ。

出口調査よりずっと前に選挙結果を予測していたYahoo!ビッグデータレポートが驚くべき高い精度だった

「ビッグデータが導き出した参議院選挙の議席予測」Yahoo!Japanビッグデータレポートと称された議席予測だ。昨年12月の衆議院選挙の予測結果から、「Yahoo!検索」データなどのネット上の動きと、実際の得票数の間に高い相関があることが判明し、それらをベースに今回の議席予測を行ったものだ。「相関モデル」と「投影モデル」という2つの異なる分析予測モデルで行われた選挙結果予測は、7月4日に行われ、その後何度か修正が加えられる形で最終予測が7月19日に発表されている。この議席予測を本日未明に発表された当選結果と照らし合わせてみると、驚くべき精度であったことが判明した。

選挙区の議席予測は、民主党が若干伸び悩んだことを除いてほぼ予測通り

Yahoo!Japanの予想と実際の当選者数の政党毎比較を見ていただくのが早いだろう。20130722-senkyo-bigdata-sen Yahoo!の予想では、民主党13名と予測していたところ、実際は伸び悩み10名になっている。その分、予想では0名だったその他政党・無所属の候補者が増えている。東京選挙区では、経済界からの推薦なども多く知名度の高かった民主党の鈴木寛候補を押さえて、無所属の山本太郎氏が当選しているが、その典型だろう。その他、自民党が予想より1名少なく、みんなの党が1名多いことを除けば全て的中している。

比例区での議席予測でも、公明党が若干予想以上に得票したこと以外はほぼ的中

130722-senkyo-bigdata-hirei 比例区においてもその精度は非常に高い。公明党が予想より2名多く当選した分、その他の政党・無所属の候補者が2名少なく見えるが、その他は、自民党と共産党の1名増減以外全て的中している。ビッグデータと聞くと、デジタルデータのみを対象としネットユーザーの意見が多く反映されると思われがちだが、このYahoo!Japanのビッグデータレポートでは、高齢者の投票の多い選挙結果をぴたりと当てていることに大変驚く。※Yahoo!Japanの議席予測は、7月19日修正版(最終版)の投影モデルを採用した。 ※実際の当選結果は、Yahoo!Japanみんなの政治の選挙結果を参考にした。

データを結果予測だけでなく戦略に反映できる時代は来るか?

ここまでの精度で選挙結果が予測されてしまうと、有権者はますます「自分で考えて貴重な一票を投票しよう」という気が失せてしまうかもしれない。今回の選挙戦では初めてインターネットを活用した選挙運動が解禁された。多くの候補者がTwitterやブログ、Facebookなどを利用した政策の主張を行っていた。だが、ほとんどの候補者は、有権者の投票行動を分析・予測しながらの選挙活動は行っていなかったようだ。このような分析データを各党の選挙事務所でリアルタイムに解析し、単純に投票意向だけでなく、「何故その党/候補者に投票しようと思うのか?」までを深堀できるようなデータ収集・分析を行うことで、新たな選挙戦略の立案が可能になるはずだ。もちろん、世論に阿れば良い、ということではない。有権者が何を考え、誰に投票しようとしているのか。データを用いてリアルタイムに把握し、「自身が本当に訴えたいことが届いているのか?」「どのようないい方がもっとも伝わるのか?」を定量的に検証し、その後の選挙活動に反映させていく、というデータドリブンな選挙活動が徐々に可能になってきている。次回の選挙に向けての大きな示唆となるのではないだろうか。あなたの地元は何位?参院選候補者のTwitter利用率都道府県ランキング。|デジタルマーケティングジャーナル