linotice

linotice

2021.07.30

ヤフーのデータサイエンティストが語る仕事の醍醐味──ユーザーと広告主の両方を満足させるデータ分析とは?

画像
「Yahoo!ニュース」や「ヤフオク!」など、ヤフーのサービスにはさまざまな広告が掲載されています。広告の配信効率を向上させる仕組みはアドテクノロジー(アドテク)と呼ばれ、ヤフーでは機械学習を活用し、広告主と消費者の双方の満足度を高めるための技術開発が日々行われています。
今回は、ヤフーにおける膨大なデータサイエンスの知見を活用し、広告サイエンス領域に関わる3名のデータサイエンティストに、仕事の醍醐味を語ってもらいました。

プロフィール

堤 良介
テクノロジーグループサイエンス統括本部サイエンス2本部 サイエンス4部 (リーダー)
サービス改善+アプライ領域
2013年に新卒で大手製造業の会社に入社。研究部門で製造ライン、製品向けの機械学習技術の研究開発に従事し、2018年に中途入社。現在は、ディスプレイ広告向けの機械学習モデルの開発に従事し、チームリーダーも務める。
十枝 菜穂子
テクノロジーグループサイエンス統括本部サイエンス2本部 サイエンス5部
アプライ領域
2018年新卒入社。入社以来、広告サイエンス領域のPDCA高速化やサービス安定性向上の業務に携わる。
佐藤 晃矢
テクノロジーグループサイエンス統括本部サイエンス2本部 分析室
分析領域
2020年に新卒入社。入社時より、広告関連事業のデータ分析業務に従事。
干場 未来子(インタビュアー)
ピープル・デベロップメント統括本部 コーポレートPD本部
マーケティングソリューション事業で営業、エデュケーション、プロダクトマーケティング、マーケティングチームなどを経て、2016年に人事へ異動し、採用ブランディングを担当。

広告のオークション入札にAI導入し、効果を倍増させる

堤良介さんが転職したのは2018年。前職は大手製造業の研究開発部門で、ものづくりの自動化や自社製品に搭載する機械学習のアルゴリズムを開発していた異色の経歴の持ち主です。
現在は、Yahoo! JAPANのディスプレイ広告における配信プラットフォームを高度化するために機械学習モデルの開発を行うチームのリーダーを務めています。 ディスプレイ広告とは、Yahoo! JAPANのトップページや広告の掲載枠があるウェブサイトやアプリに表示される、画像や動画付きの広告で、広告主が広告出稿の目的に合わせて運用することが可能です。

「広告配信における重要な指標の一つに、広告を見たユーザーが実際に行動に移したかどうかを表すコンバージョンというものがあります。たとえば商品購入や資料請求などですね。 この獲得率であるコンバージョン率(CVR)の予測にも機械学習技術が使われています。こうしたCVRの予測や、オークション入札の自動化などを通してディスプレイ広告の使い方をより効率化していくことが、私たちのミッションです。 また、CVRを予測するうえで必要となる、ユーザーの年齢や性別をさまざまなデータから推測するデモグラフィック推定モデルを開発するのも私たちのチームの仕事です。

より精緻なデータモデルを作るためには、やはりデータをどんな形でモデルに学習させるのかというところが、工夫のポイントです。 ヤフーがもつさまざまなデータのなかから、ユーザーを理解するために重要なデータはどれなのか、これを探すところから始め、そのデータをモデルに入れ、予測の性能を上げていくプロセスを何度も繰り返します」(堤さん)

▲テクノロジーグループサイエンス統括本部サイエンス2本部 堤 良介
堤さんたちのチームがいま最も力を入れているのが、オークション入札の自動化です。

「ユーザーのターゲット設定や、ユーザーへの広告配信における入札価格の設定は、以前までは手動でチューニングしていました。しかし、いまは機械学習モデルを用いて自動化しています。やはりこちらのほうが予測の精度が高い。これを広告主にもっと広く使ってもらうために、さらに性能改善を進めていく予定です」(堤さん)

サイエンティストの解析業務を支えるデータエンジニアリング

一方、十枝菜穂子さんの役割は、データサイエンティストたちが、開発業務に専念できる環境や基盤を整備すること。データエンジニアリングと呼ばれる領域です。

たとえば広告データサイエンスでは数多くのチームが、それぞれ開発した機械学習モデルについて効果検証を行っています。A/Bテストと呼ばれるものですが、十枝さんはそのテスト結果をわかりやすくグラフで可視化するツールの開発、運用を担当しています。

「モデルをサーバーにアップする前に、新規開発のモデルが正しく配置されているかどうかをチェックする必要があるのですが、チーム内のメンバーが誰でもチェックできる仕組みやツールを私たちが作りました。 モデル開発者たちが自分で作ることもできるのですが、そればかりに時間がとられていると、肝心のデータ解析に割く時間がなってしまいます。そこで私たちがデータエンジニアリングのサポートをしているわけです」(十枝さん)

▲テクノロジーグループサイエンス統括本部サイエンス2本部 十枝 菜穂子
ヤフーは100以上の多様なサービスを展開しており、そこで得られるデータはマルチビッグデータと呼ばれています。しかし、これまではサービスごとに保存されているデータの形式が異なることなどのいくつかの課題があったため、サービスをまたいで利用することが難しかった。たとえば、EC領域のデータを広告の領域で使うといったことは簡単ではありませんでした。

そこで、サービスを横断してどのデータも簡単に利用できるようにする新しいプロジェクトが、いまヤフー全体で進行中です。

「データの連携や活用の仕組みは整備されてきましたが、データ量が多すぎるために、データセットの全容を誰も把握できていない状態なのです。そこで私たちのチームは、データセットを整理し、それぞれの領域において適切なデータがすぐにわかるようなツールの開発に着手しました。
まだ検討段階ではありますが、実現できたらうれしいですね。各サービスの担当者たちが喜ぶ姿を想像しながら懸命に進めています(笑)」(十枝さん)

データの全社最適化。“駆け込み寺”としての分析室の役割

ヤフーでは昨年まで、各サービスにデータサイエンティストが在籍し、サービス向上のためそれぞれがデータの分析を行っていました。 しかし今年、全社のデータを最適化するという方針のもと、全社を横断したデータサイエンティストのチーム、分析室が誕生したのです。その分析室に在籍する一人が佐藤晃矢さんです。

分析室のビジョンとミッションにはそれぞれ、「ヤフーの各事業の意思決定に欠かせない存在になる」「データ分析を通じて全社の課題を解決する」を掲げています。

▲テクノロジーグループサイエンス統括本部サイエンス2本部 佐藤 晃矢
具体的には、各部署から舞い込むさまざまな案件について相談を受けて解決に導くこと。

「先日の事例を紹介します。AppleのiPhoneにはIDFA(Identifier for Advertisers=広告識別子)というデバイスIDが搭載されています。個人情報を特定することなく、ユーザー行動の識別に使われるものです。 広告主はこのIDを使ってアプリ内のユーザー行動を計測し、カスタマイズした広告を配信し、マーケティング施策を講じていました。
ところが、2020年6月にAppleはiOS14以降、IDFAの取得形式を変更することを発表。IDFAを取得するには、事前にユーザーから許諾をもらう必要が出てきました。 ユーザーのプライバシーを保全するのが目的ですが、これまでIDFAに依存していた広告の計測方法は根本から見直しを迫られることになったのです。
分析室に寄せられたのは、『IDFAが簡単に使えなくなったら、広告の売り上げにどの程度影響を与えるかを調査してほしい』『別の方法で計測した場合、広告効果はどの程度になるかを見積もってほしい』といったリクエスト。こういった相談に応えるのが私たちの役割です。
ほかにもテスト結果の分析支援など多岐にわたります。」(佐藤さん)

データサイエンティストは誰と協業しながら仕事をしているのか

データサイエンティストは、所属部署の垣根を越えて連携することが多い。たとえば十枝さんのチームが進めるA/Bテスト自動化ツールの開発では佐藤さんが新たなデータ取得のための指標を追加していたり、堤さんのチームが実装した機械学習モデルの保守で問題が発生すれば十枝さんが助っ人に乗り出したりなど、柔軟に対応しています。

「佐藤さんの分析室とも最近、広告オークションの自動入札システムの機能改善にあたって連携しました。このシステム自体は私たちのチームが作っているのですが、改善したシステムをサービス側にどう使ってもらうか、全体を見据えた課題はなにかといったことは分析チームにお願いしました」と堤さん。

サイエンス部自体が、ほかの部門と連携して動くこともあります。

「ディスプレイ広告(運用型)を例にすると、まずサービスマネージャーが、関係者や経営トップと相談しながらサービス戦略を決めます。その戦略をもとに、プロジェクトマネージャーが中心となってプロダクトの企画を進め、企画がある程度固まったらいよいよ、広告配信プラットフォームの開発チームとわれわれサイエンスのチームが協力して開発を開始します。 ヤフーのデータサイエンティストは、サービス戦略を成功させるために、会社の各部署と連携しながら機動的に動くことが求められますね」(堤さん)

デジタルマーケティングは学び続ける姿勢が大切な領域

ところで、今回お話を聞いた3人は、全員理系とのこと。機械学習のアルゴリズムやロジックを考えることが得意な3人が、まったくの別領域ともいえるデジタルマーケティングの世界に足を踏み入れるのに、苦労などはなかったのでしょうか。

「デジタルマーケティングは専門用語や社内用語が多いのですが、これらは社内用語集を読んで覚えました。アルファベット順に並べてあって、随時更新される虎の巻。あとは実務で徐々に身につけていったという感じですね」(十枝さん)

「私は前職がメーカーだったので、インターネット業界の知識はまったくありませんでした。なかでもアドテクは蓄積されている情報が多いですし、新しい概念や技術もどんどん登場する。ヤフーのなかでも非常に複雑な領域だと思います。 しかしだからこそ、マーケターとの会話についていけるように否が応でも勉強しなければならないので(笑)、とても成長できているという実感があります」(堤さん)

「広告サイエンスの領域は、OSのアップデートで仕様が変わってしまうような、外からの影響を受けやすく、変化が多い世界です。たとえば、iOS15のアップデートでは、端末側のIPアドレスの取得さえ難しくなるという情報もあります。 IPアドレスをベースにしたユーザー特性把握ができなくなるかもしれない。そうした変化をたえずウォッチしながら、その制約を超える技術を開発していかなくてはならない。常に学び続ける姿勢が大事な領域だと思いますね」(佐藤さん)

▲ピープル・デベロップメント統括本部 コーポレートPD本部 干場 未来子

学生時代の研究や前職の仕事は、いまにどう役立っているのか

十枝さんは情報科学部の学生時代からデータの可視化を専門に勉強していました。膨大なデータをどのようなグラフで表示すれば、みる人に理解してもらいやすいのか。その研究のためには多種多様な大規模のデータセットが必要ですが、「ヤフーにはそれがあった」ことが入社の動機なのだとか。

「グループ会社のインターンシップへの参加経験からも、ユーザーサイドから見たアドテクの運用について、少しは知識がありました」(十枝さん)

現在の部署への配属は偶然ですが、膨大なデータを取り扱って、それを「見える化」したいという学生時代からの関心は、大いに満たされているといいます。

一方、佐藤さんは大学院の博士後期課程で、バレーボールにセンサーを取り付けて選手のパフォーマンスを計測する研究のほか、IDセンサーを装着した人同士の接触情報から感染症の広がり方をシミュレーションする研究をしていました。

「広告サイエンスとは直接つながってはいませんが、データをもとに人間の行動を予測するという点は同じです。しかも分析室で扱うデータは学生時代とは比べものにならないほど大きい。解析プロセスを1サイクル回すだけでも、1台のコンピューターでは足りず、しかも数時間かかってしまう。 だからこそ、面白い。とても楽しくやらせてもらっています」(佐藤さん)

堤さんは、第一子が生まれるタイミングでヤフーに転職。東京から実家に近い大阪へのUターン転職で、現在は大阪オフィスの所属です。

「機械学習は前職に入ってから始めたものですが、関西でその経験を生かせる仕事を探しているときにヤフーと出合いました。ヤフーは昔からデータが主役で、データ活用は当たり前。今後もそれに命を賭けている。 この先、データサイエンティストとして仕事を続けるのなら、メーカーよりもヤフーのほうが、優秀な人材と一緒に仕事をしながら、自分のスキルも向上させることができるんじゃないか、と考えたのです」(堤さん)

さらに、「子育てしながらゆとりをもって仕事をしたい」人も安心して仕事ができるよう、多様な制度が充実していることも、入社の決め手になったといいます。

制約や競合があるからこそ、私たちがチャレンジする意味がある

最後にこれからの目標と、ヤフーのデータサイエンティストに興味をもつ人たちへのメッセージをいただきました。

堤さんは現在、チームリーダーを務めているので、テクノロジーだけでなく、マネジメントスキルを身につけることを自分の課題としてあげました。

「ヤフーには上長と部下が週に1回、1対1でさまざまなことを話し合う『1on1ミーティング』があります。上長には、部下を導くコーチングのスキルが求められるので、これをさらに伸ばしてゆきたいですね。 これもプロジェクトマネジメントスキルの一つといえます。ヤフーのデータサイエンティストは向上心の旺盛な人たちばかりだから、彼らの将来の夢を実現するためにも、リーダーがやらなければならないことは多いですね」(堤さん)

十枝さんは、自分が専門としているデータの可視化技術をさらに深めるとともに、周辺領域に知識を広めたいと考えています。

「サイエンス領域で最近関心が高まっている、データエンジニアリング領域におけるDevOpsやMLOps(機械学習やディープラーニングのライフサイクルを管理するための実践手法)のスキル習得に取り組み始めています。 自ら領域を決めてしまうのはもったいないですし、ヤフーにはそういった新しいことへの挑戦を応援してくれる雰囲気があります」(十枝さん)

佐藤さんがこれから強化したいと考えているのは、「相手がどういう課題を感じているのか、それを引き出す力」だという。

「私の分析室は部署外からさまざまなリクエストを受けて、それを解決する立場。ただ、リクエストを出す側も最初から課題が明確なわけではない。だからこそ、相手がなにを課題としているかを明確に聞き出す力がもっと必要だと思っています」(佐藤さん)

それぞれ課題感をもちながらも、データにまつわる仕事は楽しいと、3人は異口同音に語ります。それはこれからヤフーでデータサイエンスに関わろうとする人に向けての言葉でもありました。

「ヤフーはLINEとの経営統合やPayPayブランドの拡大など、事業として新たな局面に入っています。私たちが扱うデータはこれからますます質的・量的に拡大する。これをベースに、利用者のプライバシーを担保しながら、より効果の高い広告ビジネスを展開するという方向に向かっています。 制約や競合があるからこそ、私たちがチャレンジする意味もある。チャレンジしたい人にとってはいい職場だと思いますよ」(堤さん)

「変化の激しい広告テクノロジーの領域だからこそ、その変化を楽しめる人にとってはワクワクする毎日が待っていると思います」(佐藤さん)

「いまヤフーでは、事業拡大の動きとともに、それを支える機械学習のプラットフォームが急速に整えられてきています。新しい技術で基盤を再構築するということが、全社的に進められている最中です。だからこそ、これからヤフーに入ろうとする人には『いまが“入り時”、いいタイミング!』っていいたいですね (笑)」(十枝さん)

この記事を読んでヤフーのデータサイエンティストに興味をもっていただいた方は、ぜひ下記より本職種の詳細をご確認ください。


採用情報 公式SNSアカウント

このページの先頭へ