企業情報

2021.04.22

「データサイエンティスト」「データアナリスト」「データ可視化エンジニア」ヤフーのデータ人材とは

「データサイエンティスト」「データアナリスト」「データ可視化エンジニア」ヤフーのデータ人材とは

企業には日々膨大な量のデータが積み上げられており、それらを活用するための役割を担っているのが「データサイエンティスト」や「データアナリスト」「データ可視化エンジニア」です。 今回は、ヤフーにおけるデータ分析の担当者がどのような業務を行っているのか、データ分析の面白さ、データを活用するために心がけていることなどを聞きました。

画像
左から、データアナリストの衣目 麻里、データ可視化エンジニアの田村 健、データサイエンティストの田中 祐介。(田村は大阪オフィスからZoomで参加)

現在の業務内容:
衣目:
「ヤフーのビッグデータを分析してクライアント企業の課題解決のヒントや答えになるようなものをレポートとして納品しています。
主にクライアント企業向けの分析を行っていますが、自社(ヤフー)サービス向けの分析業務や、データアナリスト育成のための業務にも関わっています」
衣目の主な分析レポート:コロナの感染拡大による生活ニーズへの波及効果をビックデータで分析

田村:
「ヤフーのデータ量は、テラバイト(1,000ギガバイト)とかペタバイト(1,948,576ギガバイト)の規模です。それらのデータにアクセスしてユーザー数を集計するだけでも、そのための分析スキルがないとかなり難しいです。そのため、誰でもサービスの企画や改善などに必要なデータを簡単に見られるように、データを可視化するツールを開発しています。また、普段はあまりデータに直接触れない業務を担当している人のサポートも行っています」
田村の主な分析レポート:新機能「時系列キーワード」からみる緊急事態宣言下での興味関心の変化

田中:
「ヤフーユーザーの検索データやPV、位置情報や購買データなどのデータを1つに集約し、機械学習を利用してユーザーに対するインサイトを抽出したり、機械学習を活用したソリューションを開発したりしています」
田中の主な分析レポート:これからのデータ分析~ヤフーの行動ビッグデータとifsのマーケティング・フレームの融合で定量的に「兆し」をつかむ~

データを「残す」から「活用する」へ

衣目:
私がデータのインフラエンジニアとして入社した当時は、まだ「ビッグデータ」という言葉もなく、とにかくデータをカウントし、しっかり残すことだけで精いっぱいで、まだ、データを活用して何かをするという雰囲気ではありませんでした。
常に「データの1行たりとも無駄にしてはならない、正しくカウントせねばならない」という使命感で業務を行っていました。当時の上長の名言に「ログの1行、血の一滴」というものがあったくらいです。

2008年ごろ、検索機能に「iPhone」と入力すると「iPhone価格」が候補として表示されるような仕組みが導入されたのを見て、検索のログデータをこんな風にサービスに活用できるのか! と感動したのを覚えています。この頃からヤフーでも、蓄積されたデータを使って新しいビジネスの企画やサービスの改善を考えるようになってきました。
まず、広告と検索のデータの活用が先陣を切り、それを他のサービスも追いかけ、それに伴って私たちのようにデータ分析を行う人材も一気に増えました。私も、このときに広告や検索のデータが活用されるシーンに触れたことをきっかけに、「データを残す」のではなく「データを分析する」方へと興味がうつっていき、分析を主な業務にしていきました。

今では全社的にデータ整備や分析環境の構築、ノウハウ共有も進んでおり、新しく入社された方でもある程度の学習で簡単に社内のビッグデータにアクセスできます。興味深いデータや施策に効果的なデータは社内でツール化もされていますので、以前に比べて格段にデータが身近になったと感じますし、データ活用も活発になり、それが当たり前の領域に近づいているように思います。

データアナリストとデータサイエンティストの違い

衣目:
データアナリスト・データサイエンティストに求められるスキルは、ビジネス力、エンジニアリング力、サイエンス力の3つで構成されていると言われています。
この3つすべてに長けている人は少なく、特にこの分野に長けている、という意味でデータアナリスト、データサイエンティストと呼ばれているのだと思います。

データアナリストはデータの分析結果をもとにビジネス課題を解決するための提案を行うことが多く、データサイエンティストはデータ分析用のアルゴリズムの実装や予測モデルの構築を主に行うことが多いためサイエンス、エンジニアリング寄り、という違いが一番わかりやすい点ではないでしょうか。

画像
出典:データサイエンティスト協会

1)データサイエンティスト
田中:
データサイエンティストの方が、情報処理とか統計などの技術を使って全部に幅広く分析していくようなイメージでしょうか。
データを分析する前の処理、いわゆるデータの加工も一からやりますし、データ加工したものに対して科学的な手法を適用した結果発見した知見を伝えるところまで担っています。

2)データアナリスト
衣目:
サイエンティストはロジックの段階からの開発やプログラミング処理までも担うことが多いのに対して、アナリストは要件ヒアリング・課題抽出・提案などビジネス側を強く意識しながら分析したり、時にはサイエンティストとビジネスの両者をつなぐ役割のような働きをしたりすることもあります。
もちろん明確な切り分けがあるわけではないため、その人その人によって強みが違うと思います。

3)データ可視化エンジニア
田村:
理論と実践でいうと、データサイエンティストが理論で、データエンジニアが実践、でしょうか。
私の担当しているデータ可視化ツールの開発というのもデータエンジニアの1つの仕事、という位置づけです。他にはレコメンドエンジンや広告配信システムの開発やデータベースの構築、といったものもデータエンジニアの領域に入ります。
アドホックに分析(※)する、というのと、それをシステムとして稼働させるというのはまた違った技術になります。さまざまな制約の中で、精度の高いものをシステムに落とし込んでいくのが仕事です。
※アドホック分析 アドホックとは「限定目的のため」「その場限りの」という意味。長期的な定常調査や分析とは異なり、必要に応じて必要なだけ行う単発的な分析法のこと。

データ分析に必要なスキルとは

衣目:
私がデータ分析に関わるようになった当時は、ビジネスサイドのニーズをくみ取って要件に落として分析する人がまだあまりいませんでした。そのため、サービスの企画担当者と話せるような知識を得たり、相手がやりたいことをしっかりヒアリングしたりするスキルを意識しました。

具体的には、企画担当者から「データを活用してこんなことをしたい」と言われたときに、「できる」「できない」と伝えるだけではなく、「どういう目的のためにデータを活用したいのか」を聞いた上で「こうしたらできるかもしれない」とか「こうしたほうがいいのではないか」などを答えるようにしていました。また、できない場合は必ず代替案を提案しましたし、できる場合でも必ず追加の提案をすることを心がけました。

データ分析の機会が増えることで、データアナリストとしての経験やスキル向上につながっていくと考えているので、気軽にデータ活用の相談をしてもらえるように相談してくれた担当者のニーズに寄り添うことを意識していました。

田村:
たとえば、世の中で起きていることについても、「本当にそうなのかな?」と反対側の目線や立場から考えてみる、というのも大切かもしれないですね。「データを見て自分で確かめたい」という気持ちが強い人がデータ分析には向いているような気がします。
スキルを身につけるために努力する、という定義が勉強することだとすると、好奇心やデータから真実を知りたい、という姿勢については、頑張っただけでは得られるものではないのではないかという結論に至っています。

田中:
データを分析、課題解決するための手段として、具体的には統計・機械学習・データ分析のスキル、そしてスキルと解決したい課題を結びつける発想が必要です。
つまりは、解決したい課題や・物事に好奇心を持ち、スキルを学び続け、その両方をつなげる発想力が必要なのですが、これは誰にでも簡単に身につけられることではなく、まず課題解決志向・好奇心をどう育むかということが大切だと思います。

画像

データ分析の面白さ、データを活用するために心がけていること

田村:
データを見るのが好きで、それによって「事実を知る」ことが好きだというのが一番大事だと思っています。データを通して世の中のことや人のことがわかっていく瞬間がとても面白いです。
データは、文字列や数字などの変化ですが、そこを読み解いたときに「こういう傾向があるかもしれない」というように、何かが見えてくると楽しいんです。それは、何か新しい発見があった時だけではなくて、「やっぱりそうだった」ということが、自分や周りの人が思っているだけではなく、「データからわかった事実としてそれが見えるよね」と確認できる瞬間が面白いなと思います。

また、データ分析に関わる業務では常に何か新しいチャレンジをしています。私は主に社内向けのツールを開発しているため、外部に関わる内容を特に意識していて、たとえば、検索データだけではなく他領域の可視化をやってみるとか、マネジメント業務に挑戦する、Twitterでデータ分析について発信するなどです。そこから新たな気づきが得られることも多いですね。

田中:
たとえばデータ分析で、「〇〇を買っている人はどういう人か」を見るケースがあります。ヤフーのデータでいうと、たとえばテレビを買っている人がこういう検索をしているとか、こういう属性、こういう年齢・性別の人だということがわかります。この例でいうと、おそらくテレビを買っている人は事前に型番とか値段とか調べているのではないかと思って、調べてみたらやはりそういう動きをしていました。
それが自分の思った仮説通りでも楽しいし、仮説と違っても楽しい。どちらの結果になっても面白いです。

このような仮説の参考にするため、テレビ東京の「WBS(ワールドビジネスサテライト)」を毎日見ています。世の中の事例やビジネスを知り、世の中の課題や今起きていることに対して、「ヤフーのデータを使ったら社会の課題に対してどういうことができるだろうか、解決できるだろうか」と考えるのが習慣になっています。
また、ビジネスカンファレンス、MarkeZine Dayなど、他社の事例を聞けるカンファレンスにも積極的に参加しています。

衣目:
2人が言うように、データ分析やビッグデータは、「こんなことがわかるんだ!」という新しい発見は1~2割ぐらいで、残りの8~9割ぐらいは「まあそうだよね」という、新しい発見ではなく既知の事象を裏付けする結果です。それらもきちんと数字で証明されるところに面白さがあると思います。

たとえば「加湿器」について調べている人と聞いてイメージするものは、
・家の中の乾燥対策、喉のケアを意識している人
・お肌の乾燥を気にされている女性
・風邪やインフルエンザ対策で湿度をキープしたい方
などではないでしょうか?

これらの結果もデータ分析で出てきますし、さらに深掘りをすると、「赤ちゃんがいる部屋に使いたいけどアロマが心配で調べている人」や「観葉植物のために買おうとしている人」などの想像していなかったニーズも出てきます。
同様のアウトプットを集めるために実際に人に会ってインタビューするには人数の限界がありますが、データを分析するとかなり網羅的に発見できるというメリットがあります。

アナリストの仕事は、クライアントや担当サービスごとにアサインされ1人でやることが多いため、他のアナリストの分析手法や、社外の事例などを意識的に見ています。また、ずっと1人で考えているとワンパターンになってしまいそうなので、検討している内容について、他のアナリストやサイエンティスト、エンジニアに「壁打ち」をしてもらうようにしています。

画像

データ関連業務の魅力、これから挑戦したいこと

田村:
昔は検索や広告のデータだけだったものが、位置情報や購買系のデータも増えてきたので、データに関わる仕事でも、扱っているものがどんどん新しくなり、量が増えるだけでなく種類も増えて変化しています。
データ可視化ツールと社内外向けに開発していますが、社内向けに関しては利用者との距離がとても近いので、直接フィードバックをもらえるので、そのフィードバックが社外向けのツールにも生かされることも多いです。また、ツールを使ってこんな事例ができました、という話を聞けるという点も、とてもやりがいがあります。

これまで10年ぐらい、社内向けの課題解決に取り組んできました。今後は、現在進めている社外に向けてのデータでの課題解決を、しっかりやっていきたいと思います。

田中:
店舗の出店計画を作るモデルを作ってみたいですね。新しい店舗をどういうところに建てればいいのか、Yahoo!の検索クエリと位置情報と決済データを使って、どこに建てれば一番売り上げが高くなるのかっていうのを作ってみたいと思っています。
先日ある俳優さんが「自分の代表作を残したい」と言っていたのですが、その言葉が胸に残りました。私も、ヤフーのデータサイエンティストとして、「〇〇のデータといえば田中祐介」と言われるような代表作を残したいです。

また、人が「美しい」「これはきれいだ」などと思ったときには、おそらく脳波がいろいろな動きをしますよね。でも、たとえば同じグラフを見ても、自分はきれいだと思っていても他の人から見ると汚いと言われることがあると思います。でも、脳波のデータがあれば、そこに正解が見いだせるのではないかと。他にも絵画などの芸術や音楽などについても、そんな風に新しい発見ができるようになるかもしれません。

衣目:
データを軸にして、サービスもできるし広告もできるしインフラもできるしという意味で、同じ「データ」に関わっていても常に変化があり、飽きることがありません。
分析結果の表現方法も、新しい提案方法や可視化方法があり、ペルソナをつくったり、価値観軸で表現してみたりと、見せ方や分析のやり方をいくらでも自分で考えられる点も魅力です。

データは課題解決などのアシスト的なポジションが多いですが、分析の次の段階のデータによって検討した施策へのコミットまで責任を持って取り組みたいという気持ちがあります。
また、データを分析し活用する前段階である、データのクレンジングや要件の調整、分析プロセスの管理などもとても重要です。私はその仕事をデータアナリストの一部と考えていますが、分析という一端だけでなくそういう業務の重要性を伝えることで、そのような業務を担当している人に憧れを持って、将来の仕事として目指す人を増やす活動もしていきたいです。

最後に、このインタビューを読んでくださっている方の中には、データアナリストではない方やまだ積極的に自社の業務にデータ活用を取り入れていない方もいらっしゃるかもしれません。
もし、「ビッグデータに触れてみたい」「どういう可能性があるか見てみたい」「データアナリストやサイエンティストと一緒に課題を解決してみたい」と感じたり、そうはいってもビッグデータを用意するのも扱うのもなかなか難しいと感じたりすることがあれば、ヤフー・データソリューションで公開している分析レポートや事例紹介などもあわせて見ていただけるとうれしいです。

【関連リンク】

このページの先頭へ