インタビュー 小林 隼人 メインビジュアル

HAYATO KOBAYASHI

小林 隼人

AI・言語処理領域におけるブレイクスルーの実現

2013年入社

Yahoo! JAPAN研究所

Yahoo! JAPAN研究所で、言語処理の研究を行う

前職でも、電機メーカーで製品レビューテキストの分析手法を研究していましたが、研究対象データとしてヤフーの膨大なデータを活用したいと考え入社しました。入社以来、Yahoo! JAPAN研究所に所属しながら、言語処理や機械学習に関する基礎技術とそのサービス応用について研究しています。研究所では、好きな研究は自由に行えますし、研究論文を書いて発表することも推奨されています。私のミッションは先端領域への挑戦ですが、ACL*などのトップコンファレンスで論文が採択されて講演したときは、私の研究成果が認められたことに、とてもやりがいを感じました。

また、実際の開発で貴重な経験が得られることもあります。たとえば、いわゆるゲーミフィケーションの発想で、音声アシストの会話型ボイスエージェントアプリへ「しりとり」機能を持たせる開発なども手がけました。その際には、通常のアプリに「しりとり」モジュールを追加することでユーザーの応答率や継続率が高まることを、身を持って知ることができました。

ヤフーの持つ日本最大級のデータを活用し、言語処理の研究を推進

インタビューに答える 小林 隼人

言語処理が私のメインテーマですが、現在は言語データを実数空間へマッピングし統計的に処理することで、検索機能の向上や広告のCTR予測、文書要約機能など多彩なサービスに活用できないかという最先端の研究を行っています。研究対象となるタスクやデータが社内にたくさんあるというのは、研究者にとっては幸せな環境だなとあらためて感じます。前職では、まずデータの収集から始める必要があったり、開発した技術の応用先がなかなか見つからなかったりと研究開発以前に壁があったのですが、今は研究開発に集中できています。特にヤフーには日本最大級のデータがそろっているので、簡単なモデルを適用しても良い性能を出せることが多いです。半分はデータの力ですが、良い結果が出るとやりがいにつながるので仕事が楽しくなります。

言語処理で扱うテキストデータは人が作ったものですが、それが大量に集まるとどこかに法則性が生まれ、人工物なのに自然界の法則にマッチしているところがとても面白いと感じます。

ヤフーの持つ膨大なデータと計算資源を活用し、言語処理にブレイクスルーを

AIは将来的にたいへん重要なテーマです。しかし、言語処理の分野では、画像・音声処理ほどの大きなブレイクスルーはまだありません。まずは、Yahoo! JAPAN研究所に所属する利を生かし、ヤフーが持つ膨大なデータと計算資源を活用することで、サービス向けの特定タスクでのブレイクスルーを目指したいです。最近では、ディープラーニングの研究も進んでいますので、そういった技術を応用して、自然なテキストを自動生成するサービスの実現に向けて研究しているところです。 また、研究発表については今後も継続してプレゼンスを高めていき、当該分野を世界的にリードしていきたいです。

将来的には、言語の世界だけに閉じず、画像や音声、その他のライフログ的な情報も統合して活用することで、より汎用的な知能に近づくのではないかと考えています。

  • 2016年8月時点の情報となります。