ヤフー株式会社

ビッグデータで首長選挙は予測可能か?
第二弾 -神戸市・川崎市長選での試み-

こんにちは、「Yahoo! JAPANビッグデータレポート」チームです。

Yahoo! JAPANが保有するさまざまなビッグデータを用いた活用事例を紹介する本レポート、今回は「首長選挙」予測の第二弾です。
9月27日に更新した「ビッグデータで首長選挙は予測可能か? -堺市長選での試み-」では首長選挙を予測するに当たっての重要な要素である「現職が引き続き首長選挙に出た場合」という点に着目して過去の事例との検証を行い、9月29日に投開票が行われた堺市長選挙(現職候補が出馬)を予測しました。
その結果、堺市長選の選挙結果と「Yahoo! JAPANビッグデータレポート」の予測は一致し、現職候補であった竹山修身氏が当選しました(堺市長選挙の予測を振り返って)。
しかし、すべての首長選挙が予測できるようになったわけではありません。
前回レポートでは「現職が引き続き首長選挙に立候補している」という条件下での検証でしたが、実際の首長選挙では「現職が次の首長選挙に立候補しない」場合もあります。
いわゆる、「全候補者新人」の選挙です。

そこで今回は、過去の首長選挙のうち「現職が出ない」場合を検証して、10月27日に投開票をむかえる神戸市と川崎市の首長選挙予測に取り組みました。
この二つの選挙は、それぞれ現職が出馬しない首長選挙になります。

■検索量と得票量の関係を検証する

まず「現職が出ない場合」の過去の選挙において、候補者関連の検索ワードの検索量(以下、候補者の検索量)と、各候補者が獲得した得票数をそれぞれ指数化し、その相関を見てみました。
データは2009年以降に政令指定都市を含む人口の多い市で行われた12回分の首長選の選挙結果です。 (図1)

(図1)新人のみ選挙における候補者の検索量と得票率の相関

新人のみ選挙における候補者の検索量と得票率の相関図

資料:
「Yahoo!検索」データ(対象期間:全公示期間) 、2009年以降の政令指定都市その他の市長選選挙で現職が出馬しなかった12回分の結果

すると(図1)の通り相関係数が0.85と、高い相関が見られました。
つまり、新人のみが立候補する選挙においては、候補者(相対的検索量)別の注目度と得票数に強いつながりが見られました。

次に、上記条件に加えて候補者に支持政党(推薦、支援、支持すべて含む)がついていた場合にどうなるのかもみてみました。 (図2)

(図2)新人のみ選挙における候補者+支持政党の検索量と得票率の相関

新人のみ選挙における候補者+支持政党の検索量と得票率の相関図

資料:
「Yahoo!検索」データ(対象期間:全公示期間) 、2009年以降の政令指定都市その他の市長選選挙で現職が出馬しなかった12回分の結果
※支持政党の検索量については国政選挙時期とかぶる場合は除外

結果、候補者のみの注目度に基づく時よりも、わずかながらさらに高い相関となり、候補者+支持政党の検索量と得票率の予測において有益なデータであるとの結果が得られました。(図2)

■後継指名について考える

次に後継指名についての検討をしてみました。

「現職が立候補しない新人のみの選挙」とはいえ、本当の意味での新人ばかりではありません。
候補者によっては現職の後を継ぐかたちで指名を受けたり、後継者というポジションで選挙に出馬する人もいます。
それらの要素が当選率に影響を与えている場合、後継指名をうけている候補者に何かしらの傾向が出ると考え、検証を行いました。 (図3)

(図3)新人のみ選挙 後継指名ありなし別 当選率

(%)

新人のみ選挙で後継指名ありなし別の当選率の図

資料:
2009年以降の政令指定都市その他の市長選選挙で現職が出馬しなかった12回分の結果

後継指名がある候補者は56%が当選する一方、後継指名がない候補者は18%の当選率となっており、後継指名のある新人候補は、ない候補者に比べて3.1倍当選しやすいということがわかりました。

■注目度1位の候補は当選しやすいのか?

最後に、注目度1位が与える影響を考慮してみました。
各選挙の候補者リストの中で、候補者の検索量のみ、または候補者+支持政党の検索量が最も多かった候補者を注目度1位と定めて、2位以下と分けて検証しました。 (図4)

(図4)新人のみ選挙における 注目度別当選率

(%)

新人のみ選挙における注目度別当選率の図

資料:
「Yahoo!検索」データ(対象期間:全公示期間) 、2009年以降の政令指定都市その他の市長選選挙で現職が出馬しなかった12回分の結果
※支持政党の検索量については国政選挙時期とかぶる場合は除外

(図4)に見る通り候補者+支持政党を合わせた注目度が1位だった候補者は、調査対象の12の選挙すべてにおいて当選していました。
また候補者のみの場合も注目度1位の候補者は67%が当選するなど、注目度が1位であることと選挙結果との間に強いつながりを見て取れる結果となりました。

■神戸市、川崎市の市長選挙を予測する

以上の検証結果より、後継指名は当選率を上げることがわかりましたが、注目度による検証結果を用いた手法のほうが、さらに予測の精度がよくなるため、その手法を使って10月27日に投開票が予定されている神戸市と川崎市の選挙の予測検証を行いました。
神戸市および川崎市で注目度1位となった候補者は以下となります(10月21日までのデータによる)。 (図5)

(図5)神戸市・川崎市の候補者+政党別 注目度

(指数)2013年10月21日現在

神戸市・川崎市の候補者+政党別注目度の図

資料:
「Yahoo!検索」データ、公示後9日間対象 *後継指名あり **現職市長の応援あり

「Yahoo! JAPANビッグデータレポート」は、神戸市、川崎市の結果を上記のように予測しました。
これらの選挙結果が、我々の予測と一致した場合、「国政選挙」「首長選挙(現職立候補あり)」に続き「首長選挙(現職立候補なし)」についても予測めどが立つことになるため、選挙結果が楽しみです。

今後とも、引き続き「Yahoo! JAPANビッグデータレポート」をよろしくお願いいたします。

11月18日追加レポート

神戸市・川崎市長選挙の予測を振り返って

こんにちは、「Yahoo! JAPANビッグデータレポート」チームです。

2013年10月23日に公開した「ビッグデータで首長選挙は予測可能か? 第二弾 -神戸市・川崎市長選での試み-」において、ビッグデータを用いて「現職候補が出ない場合」の首長選挙の予測を行いました。
このレポートでは、10月27日に投開票が行われた神戸市・川崎市長選に当てはめた際、神戸市は「久元きぞう」氏、川崎市は「ひでしま善雄」氏が当選との結果を導き出しました。

果たして、実際の選挙結果はどうだったのでしょうか?(図1)

(図1)神戸市・川崎市の候補者+政党別 注目度

(指数)2013年10月26日現在

神戸市・川崎市の候補者+政党別注目度の図

資料:
「Yahoo!検索」データ、公示後14日間対象 *後継指名あり **現職市長の応援あり

神戸市長選の結果は、候補者関連+支持政党関連による注目度で一位だった久元きぞう氏が当選し、当ビッグデータレポートでの予測と同じ結果になりました。
しかし、川崎市長選では当選を予測していたひでしま善雄氏ではなく、3候補者中もっとも注目度が低かった「福田のりひこ」氏が僅差ながら当選し、予測とは違った結果となりました。

そこで、なぜ福田氏の当選を予測することができなかったのか、考察を試みました。

まずは、7月に行われた参院選・東京都選挙区における山本太郎氏(「ビッグデータ参院選議席予測を振り返る」参照)のように、予測公開から選挙直前までの期間において福田氏の注目度が急激に伸びていたのではないか、という視点で検証を行いました。(図2)

(図2)川崎市の候補者別注目度 日別推移

(指数)2013年10月26日現在

川崎市の候補者別注目度の日別推移の図

資料:
「Yahoo!検索」データ、公示後14日間対象

しかし、(図2)を見てわかるとおり、選挙直前の注目度は3候補とも同じように上昇していて差が無く、選挙直前データからは福田氏の当選を予測できなかったことがわかりました。

次に、SNS上での注目度から予測が可能だったのかについて検証してみました。(図3)

(図3)川崎市の候補者別 twitter投稿数

(指数)2013年10月26日現在

川崎市の候補者別のtwitter投稿数の図

資料:
Yahoo!リアルタイム検索データ、公示期間14日間対象

しかしTwitter上での投稿数を見ても、検索量による注目度と同じくひでしま氏が福田氏を上回っていました。
そのため、このデータからも福田氏の当選を予測することは困難であることがわかりました。
今回の川崎市長選は、従来の予測モデルとは異なる、新しいパターンの登場だったと言えます。

最後に、すでに公開している注目度と当選率の関連性について、神戸市・川崎市の結果を反映してみました。(図4)

(図4)神戸市・川崎市の候補者+政党別 注目度新人のみ選挙における 注目度別当選率

(%)神戸市・川崎市の結果を反映

神戸市・川崎市の候補者+政党別の注目度新人のみ選挙における注目度別当選率の図

資料:
「Yahoo!検索」データ(対象期間:全公示期間) 、2009年以降の政令指定都市その他の市長選選挙で現職が出馬しなかった14回分の結果

※支持政党の検索量については国政選挙時期とかぶる場合は除外

その結果、依然として候補者+支持政党関連の注目度で1位だった候補は9割以上が当選しており、引き続き注目度と選挙結果には強いつながりがあることがわかりました。
今回の川崎市長選は、従来のデータからは予測が難しい事例であり、「Yahoo! JAPANビッグデータレポート」チームにとっても新たな課題となりました。
このような過去の事例に当てはまらない「新しい風」を予測分析時に考慮することは非常に困難ですが、データ活用の可能性をさらに追求するべく、前向きに取り組んでいきたいと思います。
また、神戸市・川崎市の予測および以前の参院選予測でもある割合でズレが生じたとおり、データ活用による分析は何らかの過去のパターンに基づく予測に過ぎず、必ずしもすべてが一致するものではありません。
そして、我々の分析や予測結果はあくまで参考情報であり、投票そのものの重要性が高いということは変わりません。

これからも、「Yahoo! JAPANビッグデータレポート」をよろしくお願いいたします。