インタビュー 坪内 孝太 メインビジュアル

KOTA TSUBOUCHI

坪内 孝太

目指すは世界におけるトップカンファレンスでの論文採択とユーザーの“超”理解

2010年入社

Yahoo! JAPAN研究所

ミッションは、トップ学会に論文を通すこと

研究職を探していて、Yahoo! JAPAN研究所を知って入社しました。選んだ理由は単純で「N数」、つまりデータのサンプル数が多かったからです(笑)。圧倒的に大量のデータを用いて研究できるところが魅力でした。

Yahoo! JAPAN研究所に入る前には「オンデマンド交通」の研究をしていました。乗客の要望に合わせて最適なルートを定めてバスを運行する仕組みで、中でもバスの運行に伴って得られるデータの解析に興味を持っていました。乗客がいつ乗っていつ降りるのか。どの地域からどこのショッピングセンターに向かっているのか。データから見えてくるものはたくさんあります。バスで外出することがお年寄りの健康増進に役立っていることを発見したり、地域の未来を考えたりできました。

私が所属しているYahoo! JAPAN研究所では、世界中で1番目から3番目のランクにあたるような、いわゆる「トップカンファレンス」に論文を通すことが研究者のミッションの1つとして与えられています。「論文が何本通るか」が成果なので基準がはっきりしています。私もこれまでトップカンファレンスに論文を何本か通すことができました。Yahoo! JAPANの大量のデータを活用して研究できますし、研究者のキャリアとしてお勧めできる職場です。

位置情報が分かれば、多くのことが分かる

インタビューに答える 坪内 孝太

私の研究テーマは「コンテキストアウェアネス」です。特にセンサーデータや位置情報の研究に積極的に取り組んでいます。私は、この分野のトップカンファレンスに論文を通し、継続的に発表し続けています。

スマートフォンの登場で、活用できるデータの種類と幅が大きく変わりました。昨今ユーザーは、パソコンの前でウェブを閲覧する回数よりも、スマートフォンを使う回数の方が多いのではないでしょうか。パソコンとスマホで何が違うかというとセンサーデータです。位置情報、明暗、モーション(動き)、そうしたデータにより、ユーザーがいつどこからアクセスしているかが分かります。

特に力を入れて取り組んでいるのが位置情報です。位置情報を活用することによって、「日本国内のある地域に来週の今頃は何人いるか」を予測できます。また、実家に帰省する人と、旅行に出かける人との行動パターンの違いも見分けられます。ユーザーの状況に応じて、スマホ上で閲覧しているニュース記事の表示を変えることも可能です。

このような取り組みにおいては、プライバシーの保護も大事な課題です。データのオブファスケーション(難読化)などによって、ユーザーを特定できないようにします。

研究テーマとして見ると、センサーデータへの取り組みはこれまでのウェブのログ解析とは次元が違うと感じています。今まで解析に使っていたデータに加えて位置情報を利用し、そこに機械学習を適用すると、従来よりはるかに良い精度が出ます。感覚的な例え話ではありますが、検索サービスの解析ではユーザーの「頭の中」しか見えていなかったのが、位置情報が加わることで「体の輪郭」がそこに合体します。そうすることで、ユーザーがよりはっきりと見えてきます。

研究のゴールは、これは私の造語ですがユーザーの“超”理解です。例えば「ヤフーがあなたのことをよく理解することで、非常に快適なインターネット環境を提供します」といったイメージですね。

ヤフーにおいてのデータ解析に助言

ビジネスとは無縁に、研究ばかりに没頭しているかというと、そうでもありません。例えば社内でセミナーを開き、新しいデータ解析の手法を紹介したりもします。すると「このデータ解析手法を使いたい」と言ってくれる人がたくさんいます。新しいアルゴリズムで広告クリック率の予測精度を向上できて、その結果として年間何億円の売上高向上を達成できたとか、そういった話を聞くこともあります。実際に手を動かしているのは事業部の皆さんですので、私の直接の成果ではないのですが、ビジネスに少しでも貢献できていると思うとやはり気持ちがいいですね。

また、ヤフーでは大量データの分析に基づいた「Yahoo! JAPANビッグデータレポート」を提供しています。その中のいくつかは、アドバイザーとして解析手法をお手伝いしてきました。簡単な分析しかしていないのですが、実は驚くべき結果が出ています。例えば、インフルエンザが流行した時には、インフルエンザに関連する検索ワードの「波」がインフルエンザ罹患者数と驚くほどよく一致しました。検索ワードの時系列解析で、インフルエンザの流行の予測ができてしまったんですね。

先日は、2016年4月に起きた熊本地震のデータの分析をお手伝いしました。震災で人々がどう行動するかが如実に反映されていて、改めて「データってすごい」と思わされました。

こうした取り組みは興味深い内容なのですが、解析手法やロジックに特別な新規性があるわけではないので研究論文の題材になることは少ないです。とはいえ現実世界をよく反映したデータの解析は面白く、私も興味を持って参加させていただいています。

インタビューに答える 坪内 孝太

ヤフーでは優秀なエンジニアと協力できる

大学、大学院での研究生活とヤフーで違うことのひとつが、役割分担がしっかりしていて、自分の役割に集中できることです。東京大学時代に取り組んでいたオンデマンド交通の研究では、なにもかも自分でやらないといけませんでした。データ管理も自分でするし、知財も自分で書く、案内チラシを作って、地元の区民館などで説明会を開催することまでやっていたんですね。ヤフーではデータ解析に集中して研究できます。例えばセキュリティの専門チーム、知財の専門チームは別にいて、専門家にお願いできるので、自分の研究に集中して取り組めます。自分にとってはやりやすい環境です。

それに、現場の優秀なエンジニアと協力しながら作業を進められます。私はデータ解析は得意ですが、実装の部分、例えば大量のデータを取得して格納する仕組みを作ることについては専門外です。社内には、私よりもずっと得意なエンジニアがいます。今まで3日かかったデータ集計を3時間に短縮してくれたりしました。ありがたいですし、一緒に仕事をしていて楽しいですね。

ヤフーは大量のデータを用いて研究できるので面白いし、優秀なエンジニアと協力して取り組めます。「キャリアプラン、次にどうする?」と聞かれたら「研究者として脂が乗っているうちはここにいます!」と答えますね。

  • 2016年8月時点の情報となります。