エンジニア

End-to-End 音声認識のプロダクト化へ向けた研究開発

募集は終了しました

プログラム概要

日程

8月22日(月)~9月30日(金)の間
※稼働日は週3日以上、原則20営業日
※ただし、実際の稼働日は参加決定後にシフトを調整します。

開催場所

ご自宅等からリモートにてご参加いただきます(リモート就業のためのネットワーク環境はご自身でご準備いただきます)。

プログラム内容

【概要】
ヤフーでは独自の音声認識エンジン「YJVOICE」を開発・運用しており、そこで生じる実用的な課題の解決に取り組んでいます。
本コースでは、次世代の音声認識手法として近年注目を集めているEnd-to-Endモデル(音声をテキストに変換するニューラルネットワーク)をYJVOICEに導入する際の課題解決に取り組みます。

【内容(例)】
テーマはメンターと相談のうえ決定します。
例えば下記のようなテーマを想定しています。
・End-to-Endモデル(Attention-based Encoder Decoder、RNN-Transducer、CTC)を用いた音声認識の精度改善
・Self-supervised learningのEnd-to-End音声認識への応用
・End-to-End モデルによる音声からテキストと関連情報の同時抽出(例:音声認識と言語理解の同時実行)

参考:

プレエントリー締め切り

2022年6月6日(月)23:59

エントリーシート締め切り

2022年6月8日(水)15:00

必要な経験/スキル

・音声認識または関連分野での研究開発経験
・基礎的なプログラミングスキル(Python、シェルスクリプト)
・Linux環境での開発経験
・PyTorchを用いてDeepLearningモデルの学習、評価を行った経験

あると望ましい経験/スキル

・Kaldi/ESPnet/fairseqなどを用いた音声認識の学習、評価の経験
・Attention-based Encoder Decoder、RNN-Transducer、CTCを利用した音声認識手法の知識
・系列モデリングのためのニューラルネットワークの知識(Transformer、BERT など)
・Dockerを利用した開発経験

報酬等

・給与:時給1,500円
・就業時間:原則10:00~18:45(休憩1時間を含む)
 ※ただし、実際の就業時間は参加決定後シフトを調整します
・PC貸与(就業開始時に各種設定後発送いたします)

選考

ステップ1

プレエントリー

エントリー期限:
6月6日 23:59

ステップ2

エントリーシート提出
コーディングテスト受験

受験案内:
5月20日~
受験期限:
6月8日 15:00

ステップ3

オンライン面接

(6月末~7月上旬)

ステップ4

選考結果ご連絡

(7月中旬~下旬)

注意事項

・参加コースのご希望はエントリーシートにてご選択ください(複数選択可)。
・第1希望のコースから優先的に選考させていただきますが、応募者多数の場合は第2希望以下のコースにご参加いただく可能性があります。
・インターンシップは就業体験を目的としておりますので、18歳以上30歳以下の現在在学中(高校生を除く)の方以外の方のご応募はご遠慮ください。
・日本国内での就労資格がない方はご参加いただくことができません。

採用情報 公式SNSアカウント

このページの先頭へ