ヤフー株式会社

ビッグデータが導き出した参議院選挙の議席予測

こんにちは、「Yahoo! JAPANビッグデータレポート」チームです。

今回は7月21日に投票を控える参議院選挙についての分析をご報告いたします。
実施した分析とはズバリ、“「比例区」および「選挙区」での政党別獲得議席数予測”です。
昨年12月「衆議院議員選挙とYahoo!検索の驚くべき関係」という「Yahoo! JAPANビッグデータレポート」を公開しましたが、その分析結果から「Yahoo!検索」データなどのネット上の動きと、実際の得票数の間に高い相関があることがわかりました。
そこで、「Yahoo! JAPANビッグデータレポート」チームでは、前回の結果を元にしたモデルと、さらに前回とは異なるアプローチのモデルも加えて参議院選挙の投票前に獲得議席数を予測するという試みを行いました。

二種類の予測方法

予測の方法は二種類。どちらもYahoo! JAPANが持つビッグデータの代表である「Yahoo!検索」のデータを使用して実施しました。

一つ目の予測方法は「相関モデル」です(図1左)。

これは前回の衆議院選挙レポートの結果を元にして分析を行い、各政党ごとの得票への繋がりやすさを補正した上で、特定期間における検索量から得票数を推定するものです。

二つ目の予測方法は「投影モデル」です(図1右)。

これは過去の選挙事例を元に、公示日前後における検索量の変化を増加率としてスコア化し、今回の公示前の検索数を用いて得票数の推定をしたものです(図5参照)。
最後に「相関モデル」「投影モデル」の両モデルから推定した得票数を元にそれぞれの議席数を試算しました。なお、二つの予測で使用した検索キーワードは検索キーワード群の中から各政党意図を表すキーワードを抽出し、かつ特定の政党にデータ量が偏らないよう考慮し使用しました。

図1 予測モデル

そして、それぞれの予測方法と検索データを用いて2013年の参議院選挙結果を予測してみました。なお、今回の予測に用いたデータの集計対象期間は5月28日〜6月21日になります。

比例区の議席予測は自民優勢か?

まずは第23回参議院選挙「比例区」の予測です。
比例区の定数は48議席。獲得議席数の内訳を「相関モデル」「投影モデル」の二種類の方法からそれぞれ予測しました(図2)。予測獲得議席数の配分はドント方式によって割り振りを行っています。

図2 2013年7月参院選比例区予測 2013年7月4日現在

資料:
「Yahoo!検索」データ

結果、自民党が14もしくは18議席、公明党が両方7か8議席となり、与党獲得議席数は22か25議席という結果になりました。
また民主党は8と9議席、維新の会は5と8議席となっています。

選挙区の議席予測は自民圧勝の様相

次は「選挙区」の予測です。こちらは地域別の検索データを元に、同じ予測モデルを用いて各都道府県の予測を抽出したものです。
結果は以下の通りとなりました。

相関モデル(図3)

図3 2013年7月の参院選選挙区予測の相関モデル(地図はトップ当選予想政党による区分) 2013年7月4日現在

資料:
「Yahoo!検索」データ

投影モデル(図4)

図4 2013年7月の参院選選挙区予測の投影モデル(地図はトップ当選予想政党による区分) 2013年7月4日現在

資料:
「Yahoo!検索」データ

自民党の獲得議席予想は「相関モデル」では45議席、「投影モデル」では49議席となり、特に「投影モデル」のほうでは47都道府県中、45の選挙区で自民が得票数1位の予測となるなど、圧勝と言っていいほどの結果となりました。
公明党はどちらも4議席、民主党が11か13議席となっています。
特徴的なところとして、千葉県はどちらの予測も民主党が得票数1位に、また全国では維新の会は4もしくは8議席とモデルによって予測が分かれるかたちになりました(図3、図4:維新の会はその他の内数)。

次に、もっとも多い5議席が割り当てられている注目の東京都の内訳を、投影モデルのほうで見てみましょう(図5)。

図5 東京5議席の予測内訳(投影モデルのケース) 2013年7月4日現在

資料:
「Yahoo!検索」データ

自民党は東京都から2人を擁立していますが、候補者による得票予測値を検索量で割り振った結果、投影モデルでは2議席の獲得となっていますが、相関モデルでは1議席の獲得となり、それぞれ異なる結果となりました。民主党は元々2人を擁立していたことで当初の予測では獲得議席0とみていましたが、公示日直前に1人に変更されたことで当選の予測となりました。

以上の予測結果から、「比例区」「選挙区」の合計獲得議席数は次のようになりました(図6)。

図6 2013年7月の参院選結果予測(議席数、計121議席=比例区+選挙区) 2013年7月4日現在

資料:
「Yahoo!検索」データ

「相関モデル」、「投影モデル」ともに自民党、公明党を合わせた与党で過半数を獲得、特に「投影モデル」では自民党だけで過半数を占める67議席獲得の予測となり自民党優勢との結果に。また、獲得議席数2位は民主党となる見込みです。

過去の選挙との比較

これら「比例区」と「選挙区」を合わせた総獲得議席の予測結果を、3年前の第22回参議院選挙の結果と比較してみました(図7)。

図7 3年前の参院選結果と今回予測の比較(議席数、計121議席=比例区+選挙区) 2013年7月4日現在

資料:
「Yahoo!検索」データ

前回の参院選では比例区と選挙区あわせて44議席を獲得した民主党でしたが、5月28日〜6月21日のデータを用いた予測結果は「相関モデル」が22議席減、「投影モデル」は25議席減と、大きく議席数を減らす形となっています。一方、自民党、公明党は、ともに議席数が増加するとみています。

次に、昨年実施された第46回衆議院選挙結果と比較してみました(図8)。

図8 2012年12月の衆院選結果と2013年7月の参院選予測の比較(%) 2013年7月4日現在

資料:
「Yahoo!検索」データ

衆院選と参院選では総議席数が異なるため、議席数全体を100%とした時の割合としています。両方の予測モデルともに、自民党は衆院選の時の勢いがやや落ち着き、公明党がその分伸びています。また、衆院選で3位だった維新の会は、今回の参議院選挙では議席獲得比率の両方の予測モデルで4位になる見込みとなりました。なお、議席数がもっとも読めない政党が維新の会です。民主党は議席獲得比率はやや増えるとみています。

参議院総勢力で自公は過半数越えの予測

さらに、これらの結果を踏まえて、参議院議会全体の勢力図がどうなるかを予測しました(図9)。

図9 参議院議員の政党別議員数予測(非改選も含めた計242議席の内訳) 2013年7月4日現在

資料:
「Yahoo!検索」データ、参議院ホームページ

※7月23日追加更新:参院選後予測の数字に関して山崎正昭氏を他(無所属)から自民党所属として集計の修正を行った

今回の予測では、自民公明の与党合計獲得議席数が「相関モデル」では129議席、「投影モデル」では136議席となり、どちらも参議院の議員定数242の過半数を占める結果になり、衆議院と参議院ともに与党が過半数を占めると予測されます。

以上が、Yahoo! JAPANのもつビッグデータから導き出された今回の参議院選挙の第一次予測分析です。
こちらの分析に用いたデータは5月28日〜6月21日の検索データを使用した予測になりますのでご注意ください。
今後も引き続き選挙前まで、予測のアップデートと変化の発表を行っていく予定です。

「Yahoo! JAPANビッグデータレポート」では数々のビッグデータを利用して、話題の事象に関するレポートを今後も報告していく予定です。これからも楽しみつつご覧いただければ幸いです。

7月12日追加レポート

参議院選挙の議席予測結果 第二弾

こんにちは、「Yahoo! JAPANビッグデータレポート」チームです。

7月8日に「比例区」および「選挙区」の政党別獲得議席数の予測第一弾を公開しました。今回は新しい期間のデータを用いて同じ予測を行った結果を報告をいたします(7月12日現在)。
なお、第一弾の分析に用いたデータの集計対象期間は5月28日〜6月21日でしたが、今回の分析のデータ集計対象期間は6月16日〜7月3日(ただし6月23日〜6月28日は都議選結果による影響を考慮して除外)となります。

では、まず比例区の第二弾の予測結果を、第一弾の予測結果と比較して見ていきます(図10)。

図10 2013年7月参院選比例区の予測(議席数、比例区48議席) 2013年7月12日現在

資料:
「Yahoo!検索」データ

最新の予測では「相関モデル」「投影モデル」ともに公明党が第一弾の予測から獲得議席減、自民党、民主党、維新の会の獲得議席は変わらないという結果になりました。

続いて選挙区の予測結果ですが、以下の通りとなりました。

相関モデル(図11)

図11 2013年7月参院選選挙区予測:相関モデル(地図はトップ当選予想政党による区分) 2013年7月12日現在

資料:
「Yahoo!検索」データ

投影モデル(図12)

図12 2013年7月参院選選挙区予測:投影モデル(地図はトップ当選予想政党による区分) 2013年7月12日現在

資料:
「Yahoo!検索」データ

まずは「相関モデル」を見てみます。前回の予測(図3)で民主党が得票数1位だった福島県は、今回の予測では自民党が1位となりました。一方、徳島県は、自民党に変わって民主党が得票数1位に。京都府は、得票数2位が維新の会から自民党に変わるなどした結果、自民党は第一弾の予測より1議席増の46議席、維新の会が1議席減の7議席という結果になりました。
次に「投影モデル」を見てみると、自民党の東京での獲得議席予測が2議席から1議席に。大阪での得票数1位が公明党から維新の会に変わるなどした結果、自民党が第一弾の予測から1議席減の48議席、民主党が1議席増の12議席などとなりました。

これらの結果より、今回の第二弾予測の「比例区」と「選挙区」の合計獲得議席は次の通りです(図13)。

図13 2013年7月参院選結果予測(議席数、計121議席=比例区+選挙区) 2013年7月12日現在

資料:
「Yahoo!検索」データ

自民党は「相関モデル」で60議席、「投影モデル」では66議席という予測結果に、また公明党はどちらも10議席と第一弾予測に比べて議席を減らす形に。民主党は「投影モデル」で1議席増の20議席になるなど、各党で1〜2議席の変化が現れました。

最後に参議院議員の政党別議員数予測です(図14)

図14 参議院議員の政党別議員数予測(非改選も含めた計242議席の内訳) 2013年7月12日現在

資料:
「Yahoo!検索」データ、参議院ホームページ

※7月23日追加更新:参院選後予測の数字に関して山崎正昭氏を他(無所属)から自民党所属として集計の修正を行った

前回と同様、最新の予測結果でも自公連立(現与党)の過半数越えは変わらず、構成比率も「投影モデル」で自公連立が1%減というほぼ同じ結果となりました。

以上が6月16日〜7月3日(ただし6月23日〜6月28日は都議選結果による影響を考慮して除外)のデータを用いて分析を行った第二弾の予測結果になります。
公示期間のデータを用いた最終的な予測結果は来週発表いたしますので、ぜひご覧いただければと思います。

7月19日追加レポート

参議院選挙の議席予測結果 最終版

こんにちは、「Yahoo! JAPANビッグデータレポート」チームです。

これまで「Yahoo! JAPANビッグデータレポート」では、「比例区」および「選挙区」の政党別獲得議席数の予測を第一弾、第二弾と2回にわたって公開してきました。今回は公示日以降の7月4日〜7月16日のデータを用いて分析した選挙前最後の予測結果を報告いたします。

まず、比例区の最終予測結果と、第一弾からの予測の変化推移を見ていきます(図15)。

図15 2013年7月参院選比例区予測(議席数、比例区48議席) 2013年7月19日現在

資料:
「Yahoo!検索」データ

第二弾までは「相関モデル」と「投影モデル」の獲得議席数に差がありましたが、公示日以降のデータを用いて予測を行った結果では、両モデルとも非常に近い結果となりました。自民党はどちらも19議席の獲得、公明党は.どちらも5議席、自公あわせて24議席というのが最終予測値となっています。民主党は7議席か8議席、維新はどちらも6議席の獲得予測となります。

続いて選挙区の最終予測結果ですが、以下の通りとなりました。

相関モデル(図16)

図16 2013年7月参院選選挙区予測:相関モデル(地図はトップ当選予想政党による区分) 2013年7月19日現在

資料:
「Yahoo!検索」データ

投影モデル(図17)

図17 2013年7月参院選選挙区予測:投影モデル(地図はトップ当選予想政党による区分) 2013年7月19日現在

資料:
「Yahoo!検索」データ

「投影モデル」の予測では、これまでは予測方法を「公示日前後における検索量の変化を増加率としてスコア化し、今回の公示前の検索数を用いて得票数の推定」としていました。今回は「公示日後から特定期間までの検索量の変化を増加率としてスコア化して、今回のデータ集計期間の検索数から得票数を推定」に変更いたしました。

選挙区の予測結果も、比例区の最終予測結果と同様に、「相関モデル」と「投影モデル」の獲得議席数が非常に近い結果となりました。都道府県別の詳細では獲得議席が異なるものの、全73議席の内訳ではどちらも自民党が48議席、公明党が4議席、民主党が13議席という同じ予測結果に。ただ、維新の会は「相関モデル」が4議席、「投影モデル」が2議席、みんなの党は「相関モデル」が1議席、「投影モデル」が3議席と、議席数に差が出る結果となりました。
都道府県別に見てみると、京都府は「相関モデル」では自民党が1位、「投影モデル」では共産党が1位と異なる結果に。また注目の東京都は4位までは両モデルとも同じ結果ですが、5位が「相関モデル」では維新の会、「投影モデル」ではみんなの党が議席を取るという予測になっています。

以上の結果より、「Yahoo! JAPANビッグデータレポート」が予測した最終的な「比例区」と「選挙区」の合計獲得議席は次の通りです(図18)。

図18 2013年7月参院選結果予測(議席数、計121議席=比例区+選挙区) 2013年7月19日現在

資料:
「Yahoo!検索」データ

前回まで「相関モデル」と「投影モデル」で異なっていた自民党の獲得議席数ですが、最終的にはどちらも67議席とまったく同じ数字になりました。公明党も同様にどちらも9議席、民主党は20議席か21議席、維新の会は8議席か10議席、共産党はどちらも7議席。みんなの党だけは両モデルで差がはっきりと分かれ、「相関モデル」では4議席、「投影モデル」では7議席という予測結果になりました。

最後に、参議院議員の政党別議員数の最終予測結果です(図19)。

図19 参議院議員の政党別議員数予測(非改選も含めた計242議席の内訳) 2013年7月19日現在

資料:
「Yahoo!検索」データ、参議院ホームページ

※7月23日追加更新:参院選後予測の数字に関して山崎正昭氏を他(無所属)から自民党所属として集計の修正を行った

自公連立(現与党)は両モデル共に過半数を超える55%の議席を獲得。一方で、民主党は現在の86議席から62議席か63議席まで議席数を減らすとの予測結果となりました。

以上が公示日以降の7月4日〜7月16日のデータを用いて分析を行った最終予測結果となります。
Yahoo! JAPANが持つビッグデータを使用してこのような分析を行ってみましたが、実際の結果とどう結びつくのか我々も非常に注目しています。

また、Yahoo! JAPANでは「Yahoo!みんなの政治」にて「参議院選挙2013」という特集ページを提供しています。候補者情報や政党情報などを確認できますのでぜひご覧ください。

「Yahoo! JAPANビッグデータレポート」ではYahoo! JAPANが持つ数々のビッグデータを利用して、話題の事象に関するレポートを今後も報告していく予定です。これからもよろしくお願いいたします。