ヤフー株式会社

ビッグデータで首長選挙は予測可能か?
-堺市長選での試み-

こんにちは、「Yahoo! JAPANビッグデータレポート」チームです。

Yahoo! JAPANが保有するさまざまなビッグデータを用いた活用事例を紹介する本レポート、今回のテーマは「首長選挙」です。

「Yahoo! JAPANビッグデータレポート」では、2012年12月の衆議院選挙2013年7月の参議院選挙それぞれにおいて分析レポートを公開しました。
特に参議院選挙では獲得議席数予測に挑戦し、「投影モデル」と呼ばれる手法にて導き出された予測獲得議席数と、実際の獲得議席の一致率は92%となりました。

そこで、ビッグデータレポートチームではその結果を踏まえて、ビッグデータから国政選挙だけでなく市区長を選出する「首長選挙」も予測することが可能なのでは?との疑問を解決するべく、今回の取り組みを行いました。

■首長選挙は国政選挙と同じアプローチで予測できるか?

まずは国政選挙である参議院選挙の予測時に使った政党ベースのモデルが、そのまま首長選挙にも当てはまるのかを検討しました。
もし同様に使えるであれば、同じモデルを当てはめるだけで多くの首長選挙を予測できるようになるはずです。

比較のポイントは2つ。

  • 候補者に支持政党がついている割合が十分高いか
  • 首長選挙において候補者を支持(推薦、支持、支援すべて含む)する政党がある場合、政党別の検索量と得票数に相関があるか

参議院選挙時の予測から、政党名などの検索数と得票数には高い相関関係があることが判明しています。
よって、同じモデルが使えるかどうかは、上記2つのポイントが首長選挙でも当てはまるかどうかが重要となります。

まずは、候補者に支持政党がついている割合が十分高いかを調査してみました。(図1)

(図1)候補者が党員、もしくは推薦・支持・支援がある割合

(%)

候補者が党員、もしくは推薦・支持・支援がある割合の図

資料:
各種選挙報道データ、2010年以降の計15回の政令指定都市の市長選結果

2013年の参議院選挙を例にとると、国政選挙の候補者の9割は党員であったり政党の支持があるものの、首長選挙では5割の候補者にしか政党の支持がついておらず、政党ベースのみのモデルでは予測が困難なことがわかりました。

とは言うものの、候補者に支持政党がついていた場合、国政選挙の時と同様に政党別の検索量と得票数に相関があるのかについても確認をしました。(図2)
以下、注目度としての検索量は各選挙の公示期間を対象として分析しています。

(図2)政党別の検索量と得票率の相関

政党別の検索量と得票率の相関図

資料:
「Yahoo!検索」データ、2010年以降の政令指定都市 市長選選挙15回分の結果

上の通り、政令指定都市における過去15回の首長選挙から、候補者支持政党関連の検索量と得票率の関係をみたところ、国政選挙と同様に正相関ではありますがバラつきが大きくモデルのベースとしては活用が困難なことがわかりました。

以上により、首長選挙に国政選挙の予測アプローチをそのまま適用するのは困難であると判断し、新しい検討が必要であるとの結論に至りました。

■候補者の検索量と得票率の関係

次に候補者ベースの注目度(ここでは検索量)と得票率の関係性を調査しました。
“検索量が増えるほど得票につながっている”強い相関がみられれば、それに基づいた予測モデルを作ることが可能になるからです。
2010年以降に行われた政令指定都市の市長選挙について、過去15回分の結果を検証しました。(図3)

(図3)候補者別検索量と得票率の相関

候補者別検索量と得票率の相関図

資料:
「Yahoo!検索」データ、2010年以降の政令指定都市 市長選選挙15回分の結果

すると、ここでも確かに正の相関が現れたものの、ばらつきの幅が広いためこちらのアプローチも予測モデルとしてダイレクトに使うことは難しいとの結果になりました。

■首長選挙予測の新しいアプローチ

以上の検討を踏まえ、国政選挙とは違うアプローチからの検討を行うため、首長選挙においてよく見られる傾向をまずは調査しました。
過去の首長選挙を調べてみると、同じ首長が何期にもわたって務めている場合が多く、選挙の際も市長がそのまま市長選に出馬する事例が多く見られました。
そこで、首長選挙における現職候補者(現市区長など)と新人候補者(非現職)の違いに注目して検証を実施しました。

(図2)で紹介した「政党別の検索量と得票率の相関」のグラフを、現職と新人という分け方で見たところ、(図4)のようになりました。

(図4)現職・新人別の支持政党検索量と得票率の相関

現職・新人別の支持政党検索量と得票率の相関図

資料:
「Yahoo!検索」データ、2010年以降の政令指定都市 市長選選挙15回分の結果

すると、まばらな分布となった新人候補者と比べて現職候補者のほうには明らかによりまとまった分布、すなわちより高い相関が現れました。

では、実際に現職候補者はどれぐらいの当選率なのでしょうか。
それを見たのが下の(図5)です。

(図5)現職の出馬率と当選率

(%)

現職の出馬率と当選率の図

資料:
各種選挙報道データ、2007年以降の計33回の政令指定都市の市長選結果

2007年以降の計33回の政令指定都市の市長選挙結果を見ると、73%の首長選挙において現職候補者が存在し、その中の75%が当選していました。
一方、現職候補者が出馬したにもかかわらず新人が勝った選挙はわずか10%しかないため、現職候補者は新人に比べて7.5倍も当選しやすかったということがわかります。

また、参考までに調べてみると現在の政令指定都市において、3/4の市長が2期以上を務めていることもわかりました。(図6)

(図6)政令指定都市の現市長の任期数

(%)

政令指定都市の現市長の任期数の図

資料:
各種選挙報道データ

しかし、実際に新人が勝った選挙も存在する以上、逆転的な選挙がどういう時に起こるのかを見極めないと、首長選挙の予測できません。
そこで新人が当選するために、現職候補者と比べてどれほど高いネット上の注目があれば当選するのかをみてみました。
具体的には、ネット上の注目を調べるための“相対的注目度”を「新人候補関連の検索量÷現職候補関連の検索量」と定義し、それに伴う得票率との関係を調べることで、現職候補の注目度に対して、新人候補の注目度が何倍以上あれば、当選につながるのかを調べました。(図7)
なお、堺市長選挙(公示日9月15日、選挙日9月29日)の9月23日現在での予測に用いるためデータの対象期間は各選挙の公示後9日間、ただし公示期間が9日未満のものはすべての公示期間を対象に分析を行いました。

(図7)新人候補の相対的注目度と得票率

(相対的注目度=新人関連の検索量÷現職関連の検索量)

新人候補の相対的注目度と得票率の図

資料:
「Yahoo!検索」データ、2010年以降の政令指定都市 市長選選挙15回分+2009年の現職出馬の市長選選挙のうち5回分の結果

この結果から、新人候補は現職候補に比べ相対的注目度が1.3倍以上あれば当選しやすい傾向に、3倍以上あればほぼ当選するとの検証結果が得られました。
また逆に、調査対象となった15回分の政令指定都市市長選挙とそれ以外で現職候補が新人に敗れた人口の多い都市の首長選挙5回分では1.3倍未満で新人が勝った事例がないこともあわせて判明しました。

■9月29日の堺市長選挙を予測する

では、上記の検討に基づき、政令指定都市である大阪府堺市で9月29日に行われる市長選挙を予測してみたいと思います。
こちらは維新の会の候補が当選するかどうかで大きく注目を浴びている選挙でもあります。
現在の市長は「竹山修身」氏。
今回の選挙でも立候補しており、現職候補者と新人の相対的注目度に基づき検討しうるため、そちらを使用して予測してみたいと思います。(図8)(図9)

(図8)堺市長選挙 候補者関連の公示後検索量

(指数)2013年9月23日現在

堺市長選挙における候補者関連の公示後検索量の図

資料:
「Yahoo!検索」データ、2013年9月15日~9月23日

(図9)堺市長選挙 新人候補の相対的注目度

(相対的注目度=新人関連の検索量÷現職関連の検索量)2013年9月23日現在

堺市長選挙における新人候補の相対的注目度の図

資料:
「Yahoo!検索」データ、2010年以降の政令指定都市 市長選選挙15回分+2009年の現職出馬の市長選選挙のうち5回分の結果

上に見る通り、現在のところ現職である「竹山修身」氏は維新側の新人西林氏よりも注目度が高く、(図7)のデータに基づくと現職側の竹山氏が当選と予測できます。
ちなみに、上記は9月23日までのデータで分析していますが、9月25日までの検索量でも0.7でしたので現時点で傾向は変わらずと言えます。
果たしてこのアプローチが本当に結果に合致するかどうか、9月29日の結果を楽しみに待ちたいと思います。

■今後の課題

今回は現職候補者をベースとした予測モデルのレポートをお届けしましたが、今後の課題として現職が立候補しない場合の予測方法も検討する必要があります。
もしも今回のアプローチが使えるものだと判断しうる場合、現職が立候補しない場合の予測方法も確立できれば、国政選挙と首長選挙の両選挙予測をカバーできることとなり、Yahoo! JAPANが持つビッグデータ活用の可能性が大きく広がると期待しています。

今後とも、引き続き「Yahoo! JAPANビッグデータレポート」をよろしくお願いいたします。

10月9日追加レポート

堺市長選挙の予測を振り返って

こんにちは、「Yahoo! JAPANビッグデータレポート」チームです。

2013年9月29日に大阪府堺市において市長選挙が行われました。
大阪維新の会が訴える「大阪都構想」の是非が焦点となった話題性の高い選挙でしたが、「Yahoo! JAPANビッグデータレポート」ではそれに先立ち、ビッグデータから首長選挙の予測が可能か、さらにその結果を堺市長選挙に当てはめるとどう予測されるか、についての取り組みを行ったレポートを公開いたしました。
その中で、堺市長選挙はデータより「竹山修身」氏が当選であると導き出しました。

実際の選挙結果はどうだったのでしょうか?

堺市長選挙の結果、新人の西林克敏氏をおさえて現職の竹山修身氏が当選し、ビッグデータレポートでの予測と同じ結果になりました。
なお、新人候補の相対的注目度と得票率のグラフにおいて、選挙後に西林氏の結果をプロットしてみると次の位置となりました。(図10)

(図10)堺市長選 新人候補の相対的注目度と得票率

(相対的注目度=新人関連の検索量÷現職関連の検索量)

資料:
「Yahoo!検索」データ(対象期間:全公示期間) 、2010年以降の政令指定都市 市長選選挙15回分+2009年の現職出馬の市長選選挙のうち5回分の結果

予測時は公示日から9日間のデータを使用しましたが、公示日から2週間分の最終データを用いた場合も当選が難しいエリアに位置していたことがわかりました。

「Yahoo! JAPANビッグデータレポート」チームではこれからもデータを積み重ねてさらに精度の高い予測ができるように取り組んでまいりますので、引き続きよろしくお願いいたします。