ヤフーのインターンシップ(エンジニア編)

ヤフーのインターンシップ(エンジニア編)

学生のみなさんに実際の業務を体験してもらう、ヤフーのインターンシップ。学年を問わず募集しています。

今回は、学生時代にインターンシップに参加し、現在ヤフーで働いているエンジニア2名に、当時の印象に残っていることなどを聞きました。
(左から内藤、谷川、高橋)

<エンジニア>
・高橋 文彦:2015年新卒。ビッグデータ分析のインターンに参加。
・谷川 奈穂:2016年新卒。大阪のサイエンス本部のインターンに参加。

<インタビュアー>
・内藤  汐美:人事として新卒採用を担当。2016年4月中途入社。

内藤:
お二人の学生時代の話を少し聞かせてください(^^

高橋:
大学時代はネットワーク処理を学んでいて、「複雑ネットワーク」というTwitterのフォロワー関係などのネットワークについての関係性を見る研究をしていました。
複雑ネットワークを研究しているうちに、もう少しコアな情報があるのは文章だと思い、さらに深い部分まで研究したいと思ったので、大学院では自然言語処理を学びました。

谷川:
私は大学にデータサイエンスに強い学部があったのでそこで研究をしていました。
毎年、データ解析コンペ(経営科学系研究部会連合協議会データ解析コンペティション)に参加もしていましたね。
大学では「非負行列因子分解」(※2)について学びました。

※2  非負行列因子分解
(Non-negative Matrix Factorization、略してNMF)。 非負値行列を2つの非負値行列に分解するアルゴリズム。もとの行列が持つ潜在的要素を明確に示すことができる。

大学の研究室では、大学院に行く人はサーベイ論文を卒業論文として書くことが決まっていたので、非負行列因子分解における目的関数や更新式についてまとめました。
大学院では、共同研究として、企業にあるコピー機(複写機)内の部品を一定期間内に交換するかどうかを判別する判別器を作成しました。

image

(谷川 奈穂:2016年新卒)

内藤:
ヤフーのインターンでは、どんなことをしましたか?

高橋:
参加したコースは、データ分析のコースで、Yahoo!知恵袋のデータ分析をしました。
メンターの方がいろいろなデータを用意してくれていて、その中から使いたいものを選ぶこともできました。メンターの方が「こういう課題をやってみたら」と提案してくれたり、一緒に「どんなことをしたい?」「何する?」などと相談できたので、やりながらできそうなことを探っていった感じでした。

谷川:
大阪のインターンでは、実際にHadoop(オープンソースのミドルウエア)を使って、蓄積されたクリックログを抽出して分析を行いました。
具体的には、ユーザがある言葉について調べるとき、パソコン、携帯、タブレットなどの媒体によって違いがあるのかを、対応分析によって可視化しました。例えば、20代の女性が Facebook、YouTubeについて検索するときは、パソコンよりも携帯をよく使っていることなどがわかり、これはヤフーのデータだからこそ得られた知見でした。 

内藤:
お二人は、どうしてヤフーのインターンに参加しようと思ったんですか? 参加してみてヤフーの印象は変わりましたか?

高橋:
大量なデータがある企業というのが一番の理由ですが、就職を考えたときに、どんな会社なのか、どんな風に仕事をしているのかを知る良い機会になると思ったからです。
ヤフーは大量なデータがある企業なので、言語処理を生かせそうだと思い応募しました。実際、 会社でさわれる生のデータは、かなり複雑で規模も膨大だと思いました!

参加する前は、すごく真面目な、怖い? 会社だと思っていました。社員とはオンラインでの面接だったのですが、面接だからと思ってスーツを着て臨んだら、メンターさんに「そんなにキチンとした服装じゃなくてよかったのに」と笑われました(^^;

インターンシップの期間中にわからないことがあったら、すぐ聞ける環境だったのはありがたかったです。
メンターの方が、分析をするために必要な準備をしてくださっていたので、データを分析することに注力できました。

image

(高橋 文彦:2015年新卒)

谷川:
私も、ヤフーは堅い会社だろうと思っていました。大阪のインターンシップに参加したのですが、途中でお菓子が登場して(笑)
「食べながらやっていいんですか!」とビックリしました。

また、「子どもを産んでからも、エンジニアとしてずっと働けるのかな?」という不安があったので、実際に出産してから働いている東京オフィスの社員の方たちとテレビ会議をつないでお話を聞く時間をつくっていただきました。
「自然体で仕事を続けていけそう」と感じたことを覚えています。

内藤:
インターンシップに参加したことで、その後の研究内容の変化などありましたか?

谷川:
インターンシップに参加するまでは、R言語で開発することが多かったのですが、インターンシップに参加後、Pythonで開発するようになりました。カスタマイズしやすいなどのメリットがあるので、やはりPythonを使った方がいいんだなと思い……それまで進めていた研究もPythonでやり直しました。

内藤:
今、お二人がどんな仕事をしているのか教えてください!

高橋:
データ&サイエンスソリューション統括本部のサイエンス本部で、データ分析や開発をしています。自然言語処理分野を研究開発をする部署にいて、今は主に、検索システムの改善を行っています。
検索で必要な索引を作成する時には、検索対象の文章を単語ごとに区切る必要があります。これを「形態素解析」(※1)という方法で行い、検索の精度をあげる研究開発をしています。

※形態素解析:
文を意味のある単語に区切り、品詞や内容を判別する、コンピューターによる自然言語処理技術の一つ。
形態素とは、文の要素のうち、意味を持つ最小の単位のこと。

言葉の区切りは、結構あいまいなので、例えば「アイスクリーム」は「アイス | クリーム」にも「アイスクリーム」にも分けられます。この場合「アイス」で検索してもアイスクリームの検索結果が出てきた方がいいので、できるだけ細かい単位の「アイス」と「クリーム」で分けます。

内藤:
なるほど!
いくら細かくした方がいいといっても、「アイ」だけだったら意味がわからないので(笑)、「アイス」までにしておこう、とかそういうことですね。
意味が伝わるように言葉を細かくしていくというか。

image

(インタビュアーの 内藤  汐美)

高橋:
そんな感じですね。
大学の時にも自然言語処理の研究をしていたのですが、ヤフー入社後もその研究がしたかったので、今やりたいことができていて楽しいです! 入社1年目で、言語処理学会で研究発表もできました。

内藤:
谷川さんはどんなことをしていますか?

谷川:
今は新卒社員向けの研修中で、Yahoo!ニュースアプリのミニチュア版を開発し、起動画面にニュースを30件表示するという課題に取り組んでいます。表示する30件のニュースのうち10件を、自分たちのグループで考えたアルゴリズムで表示してみる、という内容です。
現在は、公益性が広いニュースを掲出するためのアルゴリズムを考えていますが、公益性と言っても10代から60代までの幅広い年齢の方々が見ているので、さまざまな定義が考えられます。なので、自分たちでゴールを決めて、それに合わせたニュースを表示するための開発を行っているところです。

内藤:
最後に、インターシップへの参加を検討している学生のみなさんに向けて一言お願いします!

高橋:
ヤフーにはとにかく膨大なデータがあるので、データ分析をもっとやってみたいと思っている人にはとても有意義なインターンシップになると思います。

谷川:
いろいろな面で刺激的です! 会社内の雰囲気も実際に来てみないとわからないことが多いと思いますので、ぜひ一度参加してみてほしいです。
社員みんなが楽しんでやっている雰囲気など、実際にその場にいるからこその魅力を感じられると思います!

image

現在、今年のサマーインターンの受付を開始しています。

<黒帯インターンシップ(9コース)>
専門性に優れたエキスパート人財、ヤフーの「黒帯」たちが監修するプログラム。
インターンを通して黒帯から直接技術を学べます。

<サービス開発/デザイン体験インターンシップ(5コース)>
Yahoo! JAPANのサービス作りの根底にある「課題解決」を体験できます。社員と一緒ににサービスの開発、デザインの手法やノウハウを学ぶことができます。

<障がい者学生向けインターンシップ(1コース)>
ヤフーで活躍している障がいのある社員との交流や社内見学、複数部署での業務体験を通じ、企業で働くイメージを持っていただけます。

学生のみなさんのご応募をお待ちしています!(^^