ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社のコーポレートサイトはこちらです。
当ページに記載されている情報は、2023年9月30日時点の情報です。

企業情報

2022.12.23

位置情報の研究を通じてサービスをより便利に ユーザーの「理解」から「超理解」へ

画像

カーナビや地図アプリの経路案内など、「位置情報」を活用したサービスにより、私たちの生活がより便利になっています。
今回は、この位置情報の研究に取り組んでいるYahoo! JAPAN研究所の坪内に、この研究をどのように進めてきたか、そして研究を通じて実現したい「ユーザーの超理解」の考え方について聞きました。

坪内 孝太(つぼうちこうた)
Yahoo! JAPAN研究所 上席研究員。2012年3月まで東京大学でオンデマンド交通システムの研究に従事。2012年4月よりYahoo! JAPAN研究所上席研究員、データサイエンティスト。Yahoo! JAPAN研究所では人の行動ログ(位置情報、検索ログ、買い物履歴、センサーデータなど)に着目したデータ解析の研究に従事している。 2010年に東京大学にて博士(環境学)の学位を取得。

山奥で自然とふれあいながら暮らし、研究を続ける
7年前から、福井の山奥で暮らしています。鶏を飼い、猟をしたり、お米を育てたりも。
自然の中で生活するようになり、論文がこれまで以上に書けるようになりました。研究をしていると考え続ける時間が長いので、他のことで少しでもストレスを感じると妨げになってしまうのかもしれません。考えてみたら、海外の研究所は山の中にあることも多いですよね。

毎日7時から仕事を始めて、遅くても4時には必ず一度仕事を終えるようにしています。22時までは一切PCに触らず、子どもと過ごして、子どもが寝たらまた仕事を再開(海外とのオンライン会議など)するというサイクルです。どんなに煮詰まっていても、どんなにやることがあっても、逆にどんなに研究がうまくいっていても、必ず終えます。しっかりメリハリをつけて働くことは重要だと思います。

位置情報が活用される用途

1)経路案内、交通情報、混雑情報

  • スマホの現在地に基づいて最適な経路案内がわかる
  • 近隣の商業施設や公園の営業時間・混雑状況がわかる

2)位置情報に基づいた検索候補や通知

  • 近隣にあるレストランなどの情報がわかる

3)自分の位置情報を共有

  • 家族や友人の位置情報を知る(子どもや高齢者の見守りなど安全・防犯の用途も)

4)緊急電話や通報

  • 火災・消防などの緊急電話を発信することで、位置情報を共有
  • スマートウォッチでは所有者が転倒や病気などによって動けない状態だと認識された場合、緊急通報する機能が提供されているものも

位置情報と検索データをひもづけることでより便利なサービスに

研究は、大学教授や研究室の方と一緒に進めることが多く、論文で発表した内容を社内でも発表して、その技術をヤフーのサービスに生かすというスタイルです。
特に力を入れて取り組んでいるのは、位置情報や検索ログなど、人の行動ログの解析です。

他社にもユーザから位置情報を受け取りサービスしているアプリはたくさんあります。そのような会社では「その会社のアプリユーザーの方々がどのように動いたのか」はわかります。
ですが、ヤフーではユーザーの同意を前提に、位置情報と検索データをYahoo! JAPAN IDにひもづけられるので、「どのように動いたか」に加えて、「どういう人(考え、ニーズを持っている)か」まで知ることが可能です。
「この位置情報の動き方の人が、こういう検索をこのときにしている」というデータを解析できる点が、ヤフーならではの強みだと感じています。

※位置情報について:
同意いただいたユーザーのパーソナルデータは、位置情報利用同意を得ているユーザーのみのデータを利用しています。
サービスなどの提供、改善、ご利用状況などの調査、分析を目的に、プライバシーを配慮して個人を特定できない状態で利用させていただきます。
パーソナルデータの活用について

この研究は「その人がどこにいて、そこで何を検索していたか」を組み合わせることで、意味を持ちます。その逆の「普段どういう検索をしている人が、今ここに集まっている」もおもしろい研究になります。
「位置情報の研究」とはどういうものなのか、もう少し具体的に説明すると、「東京・紀尾井町オフィスの付近には何時ごろに何人いるのか」を位置情報だけでうまくパターン化してあげることです。たとえば、毎週13時から14時の間に紀尾井町オフィス付近の人数をずっと記録していくことで、今週も13時から14時にこのくらいの人数がいるのではないかとだいたい推測できますよね。

私が研究しているのは、その推測をいかに正確にやるかというものです。そのときに、これまでは時間だけ見ていたところを、天気という要素も入れてみよう、最近どういうイベントがあったかを入れてみよう、というように条件や状況を増やしていくことで、より正確に推定でき、さらにパターン化できるようになっていきます。

ただ、位置情報を曜日や時間、天候などの外的条件だけでモデル化(※1)するのは限界があります。そこで、この場所に集まってくると予想される人を検索データで「色付け」することで、「人が何人くらいいる」という内容から、「どのような人が来ているのか」までわかります。これは、同じ「100人の人」が来ていても、いつもは20代男性が多かったところ、今日はなぜか40代女性が多く来ている、というようなことです。

さらに、検索データを使うことで、「20代男性」「40代女性」という属性以上の、たとえば「ペットについて多く調べている人」など、どういう考え方、趣味趣向の人が集まっているのかがわかってきます。そのように、「今この場所に集まっている100人がどんな人か」わかれば、位置情報を利用したマーケティングに使えるのではないかと考えています。

※1 モデル化:
収集したデータをもとに、データと処理の流れを図式化したもの

「データを取る」と考えると、どうしても、年齢や性別、会社員か、などの方向に意識がいきがちかもしれません。ですが「20代の会社員が多い」とわかっても、「この人たちに何を売ればいいのか」はわかりませんよね。「20代の会社員はこういうもの」という正解のない、価値観がより多様になっている今は、年齢も生物学的な性別も、その人を真に理解するためには関係なくなっていると思います。

それより、その人が男性的な考え方を持った人なのか、女性的な考え方を持った人なのか、きのう徹夜した人なのか、などの情報の方が、このエリアに集まっている人はどんな人なのかを知るときには役立ちます。
たとえば、「ここに寝不足気味の人が集まっている」とわかれば、コーヒーの看板を置いたら効果があるのではないかと推測できますよね。

このように、私たちが解析したデータを反映した、ヤフー・データソリューションの「DS.INSIGHT Place」というサービスがあります。これは、ヤフーの位置情報・検索データを元に、特定エリアの人口動態や特徴検索などを可視化したものです。

DS.INSIGHT Placeとは

「指定した店舗や施設」への来訪者の特徴がわかる
店舗、施設単位で調査対象を指定し、その来店者情報から、既存店舗の改善や、新規施策の立案、新規出店計画の分析ができます。また、競合店舗や他業界の店舗来訪者の属性なども知ることができます。
「特定エリア」にいる人を分析できる
指定したエリアに「居住している」または「滞在している」人々はどのような属性か、どんなキーワードを検索しているか、どこから来ているのか(来訪元)などがわかります。
DS.INSIGHT Place

約7年前から、自然豊かな福井の山奥で暮らしている

より正確な位置情報を得るために

検索で特定のキーワードが何回検索されたかを調べるために用いるのは、検索回数を数えるシンプルな方法です。位置情報についても、以前はこれと同じように、ヤフーに集まる位置情報の「このエリアにログが落ちている回数」を数えていました。ですが、これだと正確な「人の動き」にはなりません。

スマホの位置情報はその人が動いたときにはじめて落ちるため、自宅など一カ所にずっといてほとんど動かない人の場合、1点も落ちません。たとえば、宅配の人は移動し続けているので位置情報のログは1日何万点落ちる場合もありますが、私のように決まった場所でリモートワークをしているような人では1日1点、落ちるか落ちないか。つまり、同じ位置情報1点の重みが人の動き方やライフスタイルによって全然違います。
また、AndroidとiOSでも場合によっては、AndroidがiOSの何百倍も位置情報の点の落ちる数が多くなります。そのため、ただログの数だけ数えた場合、Androidを利用している宅配の人、タクシーの運転手などの数がはるかに多くなってしまう可能性があります。

位置情報を正確に得てサービスに生かしていくためには、一人ひとりのデータを見て、「この人は普段どれぐらいの頻度で点が落ちる人」ということまで考え、Androidを利用していて移動し続けている宅配の人でも、iPhoneを利用していてほぼ移動していないオフィスワーカーの人でも、同じ数のデータが落ちるようにする必要がありました。

宅配の人は移動しているので位置情報が多く落ちるが、リモートワークの人はほとんど落ちない

移動し続けている宅配の方と、ずっと同じ場所で仕事をしている人の位置情報を等しくするために、移動情報をどのように処理しているのか説明します。
宅配の人の位置情報は10分間に何点も落ちますが、ずっと自宅で仕事をしている私の場合は1時間前に一度落ちたら、次に落ちるのは3時間後です。この、点が落ちていない間を埋めることで、位置情報としてカウントできるようにする必要があります。ただ、実際のデータはないので、ここを推測して埋めていきます。逆に、宅配の人のように移動し続けている人は点が多すぎるので、間引く必要があります。

一人ひとりのログから1日の行動軌跡を予測し10分ごとにスライスしていくことで、全員同じ点数になります。たとえば簡単なやり方としては、「2時間前にここに点が落ちた、5時間前にここに点が落ちた」と2点の位置情報がわかっていれば、「3時間前はどこか」は、だいたいこのあたりだろうと推測できるのではないでしょうか。
具体的には、朝8時に自宅にいて、9時に東京・紀尾井町オフィスにいたとしたら、その間の8時半くらいにはその中間地点の○○駅周辺にいるだろうと推測するようなイメージです。

8時と9時に位置情報が落ちたら、その間の8時半には通勤経路の駅にいると予測できる

2020年4月に提供を再開したYahoo! MAPの「混雑レーダー」は、この研究内容を反映しています。
参考)Yahoo! MAP、エリアやターミナル駅周辺の混雑度を表示する「混雑レーダー」を再び提供(プレスリリース)

この研究を進める際には「カチカチ調査(椅子に座って人や車の数をカチカチと数える)」を実施しました。研究結果で計算した特定エリアの人数と、このカチカチ調査でわかった正解データ(人数)とを比べてみると、最初は全然違いました。それを正解データに近づけていくために研究を続けました。
あのときに地道な調査をしたからこそ、今、ヤフーは位置情報データを現実のものに近づけることができている、と自信を持って言えると思っています。

位置情報の予測モデルの難しさ

このカチカチ調査にいかに計算結果を近づけるか、から始まり、次に位置情報のパターンを作りました。これは、たとえば「月曜日の10時にこの場所に何人いるか」を予測するものです。どうしたらロバスト性(※2)のある頑強な混雑の予測モデルにできるか検討しました。
※2 ロバスト性:
さまざまな外部の影響によって影響されにくい性質のこと

最初は今から1時間後の混雑状況もわからないため、まず過去の似たような状況から「今日は天気が悪い。今は火曜日の13時台だから、火曜日の14時台はこうなるだろう」というような予測モデルをつくっていきます。それをどのように機械学習させたら、正しく1時間後の予測をできるようになるかを、位置情報だけからひたすら考えたというのが次のステップでした。

さらに、別のデータを組み合わせることでわかることはないかと考えました。最近では、コロナの患者数がどこでどれくらい増えそうかを、検索データを使って予測しました。
コロナになって熱が出た人は、「熱が出た」「発熱」などと検索することが多いと思います。この「コロナリスク」をユーザーに割り当て、この人たちがどう動いたか調べることで、どの地域がコロナのリスクが高いか推測できないかと考えました。
発症している人たちが移動して、どんな人とどこですれ違ったかを計算し、「1週間後にはこのあたりがホットスポットになるのではないか」と推測、実際にどうなったか確認するという研究にも取り組みました。

参考)
厚生労働省との協定締結を踏まえ、位置情報、検索・購買履歴のビッグデータ分析を新型コロナウイルス感染症対策に役立てる取り組みを開始(プレスリリース)
厚生労働省とヤフーは「新型コロナウイルス感染症のクラスター対策に資する情報提供に関する協定」を締結しました(厚労省)

ヤフーのサービスに「加速度センサー」を取り入れたい

最近は、加速度センサー(※3)などの「位置以外のことがわかるセンサー」をヤフーのサービスに取り入れることで、より良い機能を実装できないか、という研究に力を入れています。
※3 加速度センサー:
単位時間当たりの速度変化である加速度を計測することで物体の傾きや動き、振動、衝撃などがわかる

位置情報では「動いている」ことはわかりますが、そのときに乗っているのが車なのか自転車なのかまではわかりません。でも、加速度センサーを使うことで、何に乗って移動しているのか、または走っているのか歩いているのかまでわかります。それらのデータから「この人はよく走る人だ」「この人はよくバスを使う人だ」などがわかるので、よく走る人、よくバスを使う人に向けたレコメンデーションが可能になります。

ただ、位置情報を使ったサービスや広告でよくいわれる「自分にぴったりの広告が表示される」などは、「少し気持ち悪い」と感じる人もいるかもしれません。ですが、センサーデータでは、「自分のことをわかられていて気持ち悪い」以上に深くユーザーのことがわかるようになります。

たとえば、スマートウォッチをつけていたら「心臓が悪くないですか」と表示され、病院に行ってみたら本当に心臓に問題を抱えていた、という知人がいました。このように、自分ではわからなかったことに早めに気づいたことで命が助かった、ということもあります。
ヤフーのサービスに置き換えて考えてみると、もしその方が「胸が痛い」と検索していたら、そのデータを使って、その人がまだはっきりとはわかっていないこと(心臓に問題があるかもしれない)を伝え、病院に行くことを促すようなことができるかもしれません。

つまり、自分がすでにわかっていること(「犬が好き」など)を改めて伝えられても「(知られていて)気持ち悪い」ですが、自分でもわかっていない自分のことがわかったら、それは「その人にとって必要な、いい情報」となると考えています。
さきほどのスマートウォッチで心臓が悪いことに気づけた方のように、自分では「わからない自分」のことがわかったら、「気持ち悪い」を超えて、感動につながると思います。むしろ、そこまで持っていかないと、ユーザーの「知られて気持ち悪い」という感覚はずっと消えないのではないでしょうか。

「知られていて気持ち悪い」を超えた例としてわかりやすいのがカーナビです。カーナビでは細かな単位で位置情報をとっていますが、みなさんが使う理由は、自分の知らない道を案内してくれるからだと思います。最寄り駅まで、職場までなど、すでに知っている道だったらカーナビは使わないですよね。
また、Yahoo!天気アプリの「雨雲レーダー」は、雨雲の接近を知らせてくれます。この雨雲の接近も、自分ではわからないことで、知ることで雨宿りをしたり、傘を持っていたりする行動につなげられ、便利になるので、位置情報をオンにしてくださっている方が多くいらっしゃいます。

目の前に豊かな自然が広がっている自宅のデスク。机の上には、研究に使うスマートフォンやセンサーが何台も並んでいる

スマホから得られるデータをもとに ユーザーの「超理解」を目指す

スマホでは位置情報以外の加速度や傾き、気圧、明るさも取れます。それらのデータを長期的に取ってモデル化していけば、他のログではわからないことがわかるようになるはずです。それらをヤフーのサービスで活用できれば、よりユーザーのことを理解できるようになり「知られて気持ち悪い」を超えた「ユーザーの超理解」につながると考えています。

この「ユーザーの超理解」という言葉は私の造語で、研究テーマとして設定しているものです。
一言で「ユーザーを理解する」といっても、さきほどの例のように「この人は犬が好き」とわかった上で犬に関連した広告を表示しても、それは合ってはいますが、若干の気持ち悪さがどうしても残ると思います。

でも、ユーザーが自分では絶対にわからないけれど、知るととても助かることや命を守れることを伝える「ユーザーの超理解」までいけば、それは気持ち悪さを超えて「わかってくれて助かった、ありがとう」と感じてもらえるサービスになるのではないでしょうか。そのようなサービスを、今後は実現していきたいですね。
そのためにも、研究の段階で「このセンサーをこう使う」という解析例を準備し、それをどのように生かすかをサービス担当者に考えてもらう。それがうまくつながれば、ヤフーのサービスはほかにないものになり、一歩「ユーザーの超理解」に近づけるのではないかと思っています。

アイガモ農法(アイガモに害虫や雑草を食べてもらうことで、農薬や除草剤を使わない農法)で米作り

【関連リンク】

このページの先頭へ