ヤフー株式会社

ビッグデータも自然現象の法則から逃れられないという一つの発見

こんにちは、「Yahoo! JAPANビッグデータレポート」チームです。

今回も前回のレポートに引き続き「Yahoo! JAPAN 研究所」から、興味深い発見をご紹介したいと思います。

べき乗則とは?

皆さんは「べき乗則(べきじょうそく)」という言葉をご存知でしょうか。
「ある観測量Yが別の観測量Xのべき乗に比例する(Y=aXk)」という関係のことで、言葉にすると難しく感じますが、社会生活・自然界において実は馴染みの深いものでもあります。

例えば、日本の市区町村の人口を多い順に上位1,000を並べると以下のようなグラフになります。

(図1)日本の市区町村人口ランキング上位1,000

日本の市区町村人口ランキング上位1,000の図

資料:
平成22年度国政調査

人口の多い市町村はわずかで、ほとんどの市町村はわずかな人口差のなかで並んでいることがわかります。このような分布をべき乗則、またはべき分布と呼びます。

これは一部に限った現象ではなく、ショッピングサイトの売り上げと売れ筋ランキングの分布や、円の面積における自乗比例の法則など、自然界におけるさまざまなものに当てはまる面白い分布なのです。

また、べき乗則にはグラフの両辺を対数にとることで、線形がほぼ直線になるという特長があります 。まずは、先ほどの人口ランキングのグラフの横軸を対数に変換してみると次のようなグラフになります。

(図2)日本の市区町村人口ランキング上位1,000(片対数)

日本の市区町村人口ランキング上位1,000(片対数)の図

資料:
平成22年度国政調査

このように横軸を対数化することでなだらかな弧を描く分布が現れました。さらに縦軸も対数化してみます。

(図3)日本の市区町村人口ランキング上位1,000(両辺対数)

日本の市区町村人口ランキング上位1,000(両辺対数)の図

資料:
平成22年度国政調査

ほぼすべての点が直線上に乗るという面白い結果が現れました。これはつまり、個々人は自由な意思で住む場所を決定しているにも関わらず、集団としては一定の法則に支配されているとも捉えることができます。そして、このような「べき乗則」は社会生活・自然界においてよく見られるという特徴があります。本来複雑なはずの自然現象を簡単な数式(Y=aXk)で表すことができるということは、その現象を科学的に分析する際に大いに役立ちます。

ウェブ検索とべき乗則の関係

本コラム冒頭でお伝えした興味深い発見とは、この「べき乗則」が、Yahoo!検索で検索されるキーワードと検索数の分布にも当てはまるというものです。

縦軸を検索数、横軸をキーワード別の検索数ランキング上位1万位までのグラフを描くと次のようになります。

(図4)検索キーワードの検索数月間ランキング上位10,000

検索キーワードの検索数月間ランキング上位10,000の図

資料:
「Yahoo!検索」データ, 2016年3月分

では、さらに検索数ランキングを10万位まで増やしてPC・スマホ・タブレットとデバイス別に集計したデータを用意し、両辺に対数をとってみると次のようなグラフとなります。

(図5)デバイス別の検索数月間ランキング上位100,000(両辺対数)

デバイス別の検索数月間ランキング上位100,000(両辺対数)の図

資料:
「Yahoo!検索」データ, 2016年3月分

マイナスの傾きの直線上にほぼすべての点が乗るという美しい結果となりました。 これは1日、1カ月、1年間で実施してもほぼ同じ結果を得られることから、検索キーワードの検索量は「べき乗則」が当てはまるということが言えそうです。

(図6)集計期間別の検索数ランキング上位100,000(両辺対数)

集計期間別の検索数ランキング上位100,000(両辺対数)の図

資料:
「Yahoo!検索」データ, 2015年年間、7月月間および7月1日のデータ

そして、面白いことに特定のカテゴリなどを抽出しても同様の結果を得られることもわかりました。
例えば「日本の女優」リストを用いて検索数の上位1000人で同様の分布を作成してみたところ次のような結果になりました。

(図7)2016年2月の女優名検索数ランキング上位1,000

2016年2月の女優名検索数ランキング上位1,000の図

資料:
「Yahoo!検索」データ

これらの結果を受け、インターネットとリアルな社会と繋がりを「べき乗則」を用いることで示すことができました。

「べき乗則」とは社会生活や自然現象のなかでよく現れる現象であり、インターネットという現実世界とはかけ離れた印象のある世界においてもこの法則が成り立つということは、インターネットの世界は現実世界と似ているという査証になるのではということが興味深い発見ですね。

これからもYahoo!ビッグデータレポートではデータの面白い発見などがありましたらお伝えしていく予定です。お楽しみに。