ヤフー株式会社

インフルエンザだけじゃない!?
ビッグデータと流行性感染症との関係

「Yahoo! JAPANビッグデータレポート」では、昨冬の2013年1月23日に「Yahoo!検索から見えた今年のインフルの猛威」および、6月17日に「【追加報告】Yahoo!検索から見えた今年のインフルの猛威」と題したレポートを公開いたしました。

そのレポートでは、インフルエンザの定点報告数(以下、インフルエンザ患者報告数)と「インフルエンザ」の検索数には、高い相関が存在すること、さらには、都道府県別検索分布を分析することで、今どこでインフルエンザが流行しているのか、拡大途中なのか収束に向かっているかなどを可視化したマップを発表いたしました。

あれから時間がたち、再び冬の季節が、そしてインフルエンザのシーズンがやってきました。今冬のインフルエンザの状況をビッグデータから紐解いてみたいと思います。

■「インフルエンザ」よりもインフルエンザ患者報告数と結びつく検索キーワード

前回のレポートでは、インフルエンザ患者報告数と「インフルエンザ」の検索数の推移には非常に近しい関連性があると報告いたしました。
その後、調査を続けた結果「インフルエンザ」よりもインフルエンザ患者報告数の推移に近いキーワードが見つかりました。
それは、名前はあかせませんが、ある治療薬の名称です。(図1)

(図1)インフルエンザ患者報告数と関連キーワード検索数の推移

(指数: 期間最大値=100 )

インフルエンザ患者報告数と関連キーワード検索数の推移の図

資料:
国立感染症研究所、Yahoo!検索

インフルエンザ患者報告数と「インフルエンザ」の検索数との相関が高いことは以前からわかっていましたが、そのキーワードよりも今回見つかった某インフルエンザ治療薬の検索数の方が、さらに相関が高いということがわかりました。
この3年間の「某治療薬」検索数と患者報告数との相関は、「インフルエンザ」の0.893を上回る、「0.934」となっています。(図2)

(図2)インフルエンザ患者報告数と「某治療薬」検索数との相関

(指数: 期間最大値=100 )

インフルエンザ患者報告数と某治療薬検索数との相関図

※2010年第36週から2013年48週目まで

資料:
国立感染症研究所、Yahoo!検索

特に年単位(各年の30週~翌年29週まで)で見てみると、2012年にいたっては「インフルエンザ」では0.94でしたが、当該治療薬の場合、相関係数0.990という驚くほど高い一致を見せました。

(図3)インフルエンザ患者報告数と「某治療薬」検索数との相関(年度別)

(指数: 期間最大値=100 )

年度別のインフルエンザ患者報告数と某治療薬検索数との相関図

※各年度第30週目から翌年29週目まで(2010年のみ第36週目から)

資料:
国立感染症研究所、Yahoo!検索

つまり、インフルエンザの今の状況を見るには、「某治療薬」の検索数を分析するとおおむね把握できるということがわかりました。しかし、今年の状況は上の図で見るとおり、まだ初期段階です。
2013年のインフルエンザの広がりの状況については最後に詳細をご報告いたします。

■「ノロウイルス」もビッグデータから流行がわかる!?

さて、インフルエンザとビッグデータとの関連を調べる中で、もうひとつの興味深い発見がありました。
インフルエンザと同様に手ごわい感染症である「ノロウイルス」についても、その流行状況を推測できそうということです。

ノロウイルスは今年すでに急激な感染拡大によって、集団食中毒のニュースも連日流れており、東京都福祉保健局では12月5日に流行警報を出すなど、まさに今警戒すべき状況となっています。

そんなノロウイルスですが、ノロウイルス定点報告数(以下、ノロウイルス患者報告数)の推移に高い連関を持つあるキーワードが見つかりました。
それは「嘔吐下痢症」です。(図4)

(図4)ノロウイルス患者報告数と「嘔吐下痢症」検索数の推移

(指数: 期間最大値=100 )

ノロウイルス患者報告数と嘔吐下痢症検索数の推移の図

資料:
国立感染症研究所、Yahoo!検索

こちらは2009年から直近までの「嘔吐下痢症」の検索数推移とノロウイルス患者報告数の推移ですが、これだけの長期間にもかかわらず、相関係数は0.878と高い一致を見せております。(図5)

(図5)ノロウイルス患者報告数と「嘔吐下痢症」検索数との相関

(指数: 期間最大値=100 )

ノロウイルス患者報告数と嘔吐下痢症検索数との相関図

※2009年第1週から2013年第47週まで

資料:
国立感染症研究所、Yahoo!検索

なお、「嘔吐下痢症」とはウイルスによる感染性胃腸炎の総称であり、ノロウイルスだけをさす言葉ではありませんが、このような高い相関が現れたことは興味深いです。

「嘔吐下痢症」の直近一週間の都道府県別検索分布と見てみると次のようになります。(図6)

(図6)「嘔吐下痢症」の都道府県別検索分布

(2013年12月11日~12月17日の1週間)

嘔吐下痢症の都道府県別検索分布の図

資料:
Yahoo!検索

ご覧の通り、九州を中心とした西日本、および関東エリアからの検索が多い傾向にあります。
「嘔吐下痢症」の検索数は直近1週間(12月9日~12月15日)で先週比1.19倍とさらに伸びてきており、今まさに最大限の警戒が必要な時期となっています。

さらに、インフルエンザやノロウイルス以外にも、手足口病の患者報告数と「手足口病」の検索数、水疱瘡(みずぼうそう)と「水疱瘡」の検索数には高い連関が見られることがわかりました。(図7)(図8)

(図7)手足口病患者報告数と「手足口病」検索数の推移

(指数: 期間最大値=100 )

手足口病患者報告数と手足口病検索数の推移の図

資料:
国立感染症研究所、Yahoo!検索

(図8)水疱瘡患者報告数と「水疱瘡」検索数の推移

(指数: 期間最大値=100 )

水疱瘡患者報告数と水疱瘡検索数の推移の図

資料:
国立感染症研究所、Yahoo!検索

■今年のインフルエンザは?

最後に今年のインフルエンザの状況を発表します。
毎年この季節になると、厚生労働省より発表される「インフルエンザの流行シーズン入り」のニュースを耳にするかと思います。
厚生労働省は、「インフルエンザに関する報道発表資料」にて毎週発表されている定点あたりの報告数が1.0人を越えると、流行シーズン入りを宣言します。

もっとも新しい平成25年第49週(12月2日~12月8日)のデータでは、定点あたりの報告数が0.67人となっており、前週の0.44人から増加しています。
昨年の定点あたりインフルエンザ患者報告数のピーク値は42.62人を記録しましたが、そこと比較するとまだまだ値も小さく、インフルエンザはいったん感染に勢いがつくと加速度的に増えていったり気候にも左右されるため、この定点報告数がどのタイミングで1.0を超えるかを検索数から正確に予測するのは難しいのですが、「某治療薬」の直近の検索数は比較的落ち着いており、さらに、厚生労働省の定点報告数が0.1を超えた第45週以降の患者報告数の伸びを検索数に置き換えて現時点の患者報告数に当てはめてみても、第50週(12月9日~12月15日)は0.8(人/地点)となり1に到達していないため、急激な感染の拡大は今のところまだ発生していないと見ています。
また、「某治療薬」よりも検索データ量の多い「インフルエンザ」の検索数を用いて、直近1週間の都道府県別の検索分布で見てみると、九州地域からの検索が増えつつある様子が見えてきており、気になるところです。(図9)(図10)

(図9)2013年のインフルエンザ患者報告数と「某治療薬」検索数

2013年のインフルエンザ患者報告数と某治療薬検索数の図

資料:
国立感染症研究所、Yahoo!検索

(図10)「インフルエンザ」の都道府県別検索分布

(2013年12月11日~12月17日の1週間)

インフルエンザの都道府県別検索分布の図

資料:
Yahoo!検索

今後も本格的にインフルエンザが流行した場合、昨冬同様のインフルエンザマップを随時公開していく予定です。
どうぞ、よろしくお願いいたします。