ヤフー株式会社

第24回参議院選挙の議席数予測を振り返る(後編)

こんにちは、「Yahoo! JAPANビッグデータレポート」チームです。

今回のレポートは、第24回参院選の投開票後に発表した「第24回参議院選挙の議席数予測を振り返る(前編)」の続きとなります。今回予測と結果にそれなりの乖離が見られたため、議席数を予測するために利用した、過去の分析結果から導き出された6つの前提条件が崩れたのか、だとするとどのような変化が起こったのかについて検証、深掘りを行いました。

前提条件と実際の結果の比較検証

前提1:公示日から投票日前日までのネット上の注目度は、政党の得票数に直接的に相関する

議席数予測において、もっとも重要な要素なのがこの前提1の条件です。第一回目のビッグデータレポートで公開したこの条件が今回の選挙にも当てはまっているのかを確認しました。

その結果、図1に見るとおり、自民党と共産党が相関を表す回帰直線から大きく乖離していることがわかりました。

(図1)2016参院選の得票率と注目度の関係

2016参院選の得票率と注目度の関係の画像

資料:
「Yahoo!検索」データ、選挙結果データ

本来は2013年参院選のグラフのようにすべてのプロットが直線上か誤差のほとんどない近い位置に並ぶという結果になるはずでしたが、比例区・選挙区ともに自民党と共産党が大きく乖離しました。

(図2-A)主要政党における得票率と注目度の関係の推移:比例区

比例区での主要政党における得票率と注目度の関係の推移の画像

資料:
「Yahoo!検索」データ、選挙結果データ

(図2-B)主要政党における得票率と注目度の関係の推移:選挙区

選挙区での主要政党における得票率と注目度の関係の推移の画像

資料:
「Yahoo!検索」データ、選挙結果データ

その傾向は前回の2014年衆院選の時にも若干見られていましたが、今回の2016年参院選ではさらに大きく広がっており、この前提条件とのズレが予測を困難にしたことがわかりました。

前提2:ネット上の注目度が政党の得票にどの程度つながるかは、一部の例外を除き党ごとに一定である

一部の例外政党を除き、各政党のネット注目度がどの程度得票数につながるかは一定であるという前提条件は果たしてどうでしょうか。

(図3)自民、共産以外の主要政党のつながりやすさの予測と結果

(主要政党のつながりやすさの平均値=1.0とした指数)

自民、共産以外の主要政党のつながりやすさの予測と結果の画像

資料:
「Yahoo!検索」データ、選挙結果データ

図3に見るとおり、自民党、共産党、公明党を除いた主要政党はほぼ一定であり、大きなズレは見られませんでした。そのため、つながりやすさの予測値と選挙結果の間にも大きな相違はありませんでした。ただし、民進党の選挙区でのつながりやすさは下がる予想をしていましたが結果は横ばいとなり、これが選挙区における民進党の議席数を過少に予測した一因となりました。

前提3:前提2で表したつながりやすさは、自民党が上昇傾向に、共産党が下降傾向にある

(図4)自民と共産のつながりやすさの予測と結果

(主要政党のつながりやすさの平均値=1.0とした指数)

自民と共産のつながりやすさの予測と結果の画像

資料:
「Yahoo!検索」データ、選挙結果データ

自民党と選挙区の共産党については、図4に見るとおり、今回の選挙でも前提条件通りの傾向が確認されました。しかし、自民党の比例区においては結果は予測以上に上昇をし、選挙区では予測ほどは伸びない結果となりました。選挙区の共産党についても同様に、下降傾向を盛り込んだ予想をしましたが、結果は予想以上に下がりました。

(図5)政党別にみた注目度の得票へのつながりやすさ

(主要政党のつながりやすさの平均値=1.0とした指数)

政党別にみた注目度の得票へのつながりやすさの画像

資料:
「Yahoo!検索」データ、選挙結果データ ※公明党は別ロジック(前提4)で予測しているため割愛

結果、図5のように自民党の上昇傾向、共産党の下降傾向は予測に盛り込んでいたものの、その上昇・下降度合いについてズレが生じた結果となりました。

前提4:公明党の得票率はネット上の注目度に影響されず、一定幅の中で周期的に変動する

前回の2014年衆院選の振り返りレポートで発見したこの前提は、今回の選挙にも当てはまったのかも見てみました。

(図6)公明党の得票率の予測と結果:比例区

(単位:%)

比例区での公明党の得票率の予測と結果の画像

資料:
選挙結果データ

図6のとおり、比例区の予測値15.3%に対して結果は13.5%となり、周期性からのズレが発生しましたがゆらぎの範囲内には収まったため、サンプル数が増えていくほど精度が高まりそうです。

(図7)公明党の得票率の予測と結果:選挙区

(単位:%)

選挙区での公明党の得票率の予測と結果の画像

資料:
選挙結果データ

図7のとおり、選挙区は予測値4.7%に対して結果7.5%と大きく乖離し、揺らぎの範囲からも外れる結果となりました。しかし、選挙区に関しては今回新たな発見がありました。

(図8)公明党の選挙区における候補者数と得票率の関係

公明党の選挙区における候補者数と得票率の関係の画像

資料:
選挙結果データ

参院選の選挙区では、公明党の候補者数と得票率の間に高い相関(R=0.99)があることがわかりました。これはつまり、選挙区で候補者を擁立すればその擁立人数に比例して選挙区の総得票数に占める公明党の得票率も増えるという公明党の強い組織力を示しています。プロットした点もほぼ一直線上に並んでおり、興味深い発見といえます。

前提5:投票日までの注目度の盛り上がり度合いは党によって一定である

公示日以降の注目度の盛り上がり度合いは、2014年衆院選では予測とほぼ合致した条件です。今回の選挙でも合致したのかを検証しました。

(図9)公示後注目度の盛り上がり度の予測と結果

(各党の公示前注目度=100とする指数)

公示後注目度の盛り上がり度の予測と結果の画像

資料:
「Yahoo!検索」データ、選挙結果データ

チャートから見てもわかるとおり、この前提条件は今回の参院選でもほぼ合致しました。全体の傾向としては、共産党以外は盛り上がりが予測よりも若干上回りましたが、共産党だけは逆に予測よりも少し下回っていました。これも選挙区における共産党の過剰予測の要因となりました。

前提6:予測の基準としている選挙と比べて公示後の注目度にズレがあった場合は、基準としている選挙と同水準の注目度になるようベースラインを補正する必要がある

最後の前提はベースライン補正です。2014年衆院選の注目度を基準にして、ベースラインを補正して適用しました。

(図10)ベースライン補正値の予測と結果

(主要6政党の注目度計)

ベースライン補正値の予測と結果の画像

資料:
「Yahoo!検索」データ

結果として、予測で実行した補正の値は実際に必要だった補正値と大きな乖離がなかったことがわかりました

振り返りのまとめ

また、前提条件以外のところでも注目すべき点がありました。それは、選挙区の一人区の予測値と選挙結果との比較です。

(図11)2016.7参院選選挙区予測の一致率

2016.7参院選選挙区予測の一致率の画像

資料:
「Yahoo!検索」データ、選挙結果データ、 接戦の定義:当落の得票率の差が10%未満

図11に見るとおり、自民党が当選した一人区の一致率は95%と高い値となりましたが、一方で野党連合勝利となった選挙区の一致率は18%に留まりました。これが今回の選挙区予測のズレの3分の2に該当します。また、一人区で野党連合が勝利した選挙区は得票数でみても接戦が多かったこともわかっており、それも予測が難しかった一因でした。野党連合という形態に対する予測方法や、接戦が予想される場合の予測方法についての課題がみえてきました。

以上が、第24回参院選の議席数予測レポートの振り返りになります。
前提条件の振り返りでは、前提条件そのものがずれてしまっているものと合致しているものがあることがわかりました。その中でも主として前提3の変化に伴い、選挙予測の基礎となっている前提1にズレが生じていることが予測値に大きな影響を与える結果となっていることがわかりました。 これは、総じて言えば自民安定政権での信頼度の向上、共産党の支持層の変化を数量的に示していると言えます。また、公明党の立候補者数と得票の関連は組織としての強さを示しています。
このように、Yahoo! JAPANビッグデータレポートではさらなる仮説検証を続ける中で、新たなデータ視点での知見を提供していければと考えております。

追加レポート慶應義塾大学学生予測と結果について

過去のレポートにて報告させていただきましたが、今回の議席数予測では慶應義塾大学の学生にも参加していただきましたので、その結果を見てみましょう。

(図12)2016参院選学生チーム予測と結果比較

2016参院選学生チーム予測と結果比較の画像

資料:
「Yahoo!検索」データ、選挙結果データ

図12に見るとおり、比例区では自民党の予測値が実際の選挙結果より少なめ、共産党は多めになり、選挙区では公明党を少なめに、共産党を多めに予測していました。また、全体の結果では共産党が16議席の予測に対して実際の選挙結果は6議席と10議席多く、また公明党は8議席の予測に対して14議席と6議席少ない数値となっていましたが、自民党や民進党など他の政党については予測値と実際の選挙結果との乖離はほとんどありませんでした。

なお、これらの議席数予測数値の算出手法については、取り組んだ学生が提出した数値の平均値を採用しており、図13のとおり各人のズレは大きかったものの、平均化によって実際の値に近づいたことがわかりました。

(図13)学生チーム 比例予測の分布

(25名分)

学生チームによる比例予測の分布の画像

資料:
「Yahoo!検索」データ、選挙結果データ

とはいえ、今回始めて実施した学生による予測は全体一致率91%と高い一致となりました。今後もこのような取り組みを続けて、ビッグデータに親しんでもらう活動を続けていきたいと考えています。

今後もデータの持つ魅力をさらにお伝えすべく、ビッグデータレポートチームではさまざまなレポートを発信してまいります。今後ともよろしくお願いいたします。