こんにちは、ヤフービッグデータレポートチームです。
約2年間にわたり猛威をふるいつづけ、日本はもとより世界を一変させた新型コロナウイルス(以下コロナ)は、多くの人の日常生活にも多大な影響を与えました。
特に大きな影響を受けたものの一つに「旅行」があります。
みなさんの中にも、コロナの流行以降ほとんど旅行に行かなくなった、という人も多いのではないでしょうか?
そして、その影響を大きく受けているのが観光産業、旅行業界に働く人々です。2020年にはGotoトラベルといった支援策なども行われましたが、度重なる緊急事態宣言やまん延防止等重点措置により、旅行やお出かけの機会が戻ってきていないのが実情です。
しかし、ここにきてワクチン接種の浸透などにより、以前に比べて明らかに日常生活を取り戻す動きが出てきており、今後迎える旅行シーズンに向けて明るい兆しが見えるようになってきました。
では、旅行や観光に関する人々の動きについて、ヤフーが保有するビッグデータからリアルタイムにとらえることは可能なのでしょうか? ビッグデータを見てみた結果をお送りします。
旅行者数を把握できる検索キーワードとは
旅行・観光する人を捉えるためには、それを正確に捉えた正解データが必要になります。そこで今回は「観光庁」が公開している「宿泊旅行統計調査」を利用します。

この統計調査には、主に国内・海外からの宿泊旅行に関するさまざまなデータが公開されています。このデータとヤフーの検索データと相関をとることで、検索行動からリアルタイムに近い宿泊旅行者の動きを捉えることができないかを実施してみます。
まずは「宿泊旅行統計調査」で公開されているデータを、2017年1月から2021年10月までの宿泊者数(月次)データと、その期間の膨大な検索キーワードの検索数推移との間で相関係数を計算し、相関係数が高くなる検索キーワードを探し出してみました。
なお、ここで定義する「国内旅行者数」とは、宿泊旅行統計調査における調査対象宿泊施設のうち宿泊目的割合が「観光目的の宿泊者が50%以上」の宿で、かつ外国人の同利用を除いた述べ人数を宿泊の伴う国内旅行者として使用しています。
出力されたデータを見たところ、高い相関を持つ興味深いキーワードが相当数現れました。いくつか代表的なキーワードを紹介します。
一つ目が「旅行 持ち物」です。


集計対象期間:2017年1月から2021年10月まで
推移の重ね合わせや散布図からもわかる通り、とても強い相関がみられることがわかります。相関係数も0.94となっています。
「旅行 持ち物」と検索する人が増えれば旅行者が増える、一見当たり前のようなことですが、指標と連動する最適な言葉やアクションを人力で見つけるのはとても難しいため、このように一気に計算して相関をとり抽出する手法は広く応用することができます。
それでは、別の検索キーワードをもう一つ見てみましょう。次はお土産に関するキーワードです。


集計対象期間:2017年1月から2021年10月まで
全国の都道府県にお土産がありますが、「岐阜 土産」がもっとも国内の宿泊旅行者数と強く連動していることがわかりました。これもおもしろい発見です。
ほかの都道府県と土産との組み合わせもおおむね連動する傾向がありますが、なかでも「大阪 土産」や「岡山 土産」も同様に相関係数が高い傾向にありました。
紹介しなかったキーワードの中には、具体的な観光地名や駅名などもあり、これらのデータを追いかけることで、リアルタイムに近いかたちで国内の観光者数の大きな動きを把握できる可能性が見えてきました。
日帰り旅行と連動する検索キーワードは?
次に日帰り旅行も見ていきましょう。日帰りは宿泊しないので「宿泊旅行統計調査」は使用できません。そこで、同じく観光庁から公開されている「旅行・観光消費動向調査」を使用し、日帰り旅行における消費金額の推移から相関係数を計算してみました。
ここで定義する「国内日帰り旅行消費金額」とは、「旅行・観光消費動向調査」の「国内旅行-旅行消費額」の中の「日帰り旅行-観光・レクリエーション」の項目を使用しています。
キーワードの抽出を行ってみると、こちらも大変おもしろい検索キーワードが相当数現れたので、いくつか紹介したいと思います。
検索キーワード「江ノ電 観光」との比較です。


集計対象期間:2017年1月から2021年10月まで
こちらもグラフ、散布図共にきれいな連動をしています。国内全体の日帰り旅行の消費動向を追いかけるには江ノ電を利用した観光への関心を見るとわかるかもしれない、という発見はとてもおもしろいですね。
それ以外に「横浜 イベント」「横浜 観光」といった横浜に関するものなど、日帰り旅行の消費金額は一部地域への関心と高く相関していることもわかってきました。
出張者数を推測するヒントは、東京駅のあの施設が鍵?
一方、宿泊旅行統計調査には旅行目的だけでなく、ビジネス目的の宿泊者数のデータもあります。前出の「宿泊旅行統計調査」で宿泊目的割合が「観光目的の宿泊者が50%以下」の述べ宿泊者数を、ビジネス目的の「国内出張者数」と定義して集計を行いました。
こちらも相関の高い検索キーワードを見てみると、旅行者とは違う傾向が見て取れ、とてもおもしろい結果となりました。
まずは国内旅行者でも見た「土産」に関するキーワードです。


集計対象期間:2017年1月から2021年10月まで
先ほど国内宿泊旅行者との相関が高い検索キーワードとして「岐阜 土産」を紹介しましたが、ビジネスだと「神戸 お土産」の検索数がとても強く、相関係数もほぼ1に近い、0.96という値となりました。また「新神戸駅」の検索数推移との相関係数もr=0.95と高く、日本全体の出張者数の傾向が神戸から見えてくる、という可能性は大変興味深いです。
別の観点では、旅行目的では「土産」と検索しているのに、出張では「お土産」と言葉が使い分けられている点も注目です。
また、ほかにも注目すべき検索キーワードとして東京駅のある施設の検索数と出張者数に強い相関があることもわかりました。


集計対象期間:2017年1月から2021年10月まで
これも言われてみればという検索キーワードです。出張の新幹線に乗る前に一服という行動が透けて見えるようです。つまり、東京駅の喫煙所での人数が増えていると、出張者が増える傾向にあり、ひいては国内景気の回復のバロメーターにもつながるかもしれませんね。
なお、宿泊旅行統計調査には宿泊施設別の項目もあり、たとえばビジネスホテルのみといったデータも存在します。各項目詳細にデータを出していくときりがないため、ピックアップしてご紹介すると、ビジネスホテル宿泊者数と相関が高いキーワードとして次のようなものがあります。

こちらの結果も因果関係をイメージしやすいですね。相関係数もとても高く、これらの駅のラーメン屋さんが混んでいる光景を見かけたら、日本全国のビジネスホテルがとてもよく稼働しているのかもしれませんね。
最新の状況は?
では最後に、今日紹介したデータの最新検索数について、その傾向をご紹介します。ここまでに紹介したデータは検索数も月次データを使用していましたが、検索数は日々生成されていますので、もっと細かい単位で追いかけることが可能です。ここでは週次単位での推移をご紹介したいと思います。
宿泊旅行者数を推定するための代表例として紹介した「旅行 持ち物」と、「宿泊出張者数」を推定するための代表例として紹介した「神戸 お土産」の検索数推移を見てみましょう。


集計対象期間:2017年1月1日から2022年6月16日まで
推移波形をみると、やはり今年に入りオミクロン株の第6派の影響が大きく、どちらの検索数推移も大きく落ち込んでいましたが、矢印で示した通り、ここにきて上向きの兆しも見えます。
また、もう一つの傾向として、緊急事態宣言などのたびに落ち込んでいた検索数の谷(底)が徐々に切りあがってきていることもポイントだと言えそうです。
このまま、旅行者や出張者数が回復傾向となることを期待したいと思います。
今後も、新型コロナに関するレポートをお届けする予定です。Yahoo! JAPANビッグデータレポートをよろしくお願いいたします。