YJVOICE 注目技術を活用した音声認識エンジンの精度改善

募集は終了しました

プログラム概要

日程

8月31日（月）～9月8日（火）、9月14日（月）～9月30日（水）の土日祝を除く平日にて、参加者の予定と受入部署のスケジュールを踏まえて個別に調整いたします（就業日数10日間程度）。

プログラムの都合により、参加必須の日時を設定することがあります。

手続き等のため上記期間以外に就業いただく可能性もあります（対象の方へ別途ご連絡いたします）。

開催場所

ご自宅等からリモートにてご参加いただきます。

リモート就業のためのネットワーク環境はご自身でご準備いただきます。

開催時期の状況により、一部日程にて、紀尾井町オフィス（東京都千代田区）またはその他の弊社拠点にお越しいただく可能性もあります（交通費や宿泊費は弊社規定により支給いたします）。

インターンシップ期間中に一度もオフィス訪問ができなかった場合は、別途インターンシップ期間外でオフィス見学の機会を設ける予定です。

プログラム内容

【概要】
ヤフーでは独自の音声認識エンジン"YJVOICE"を開発しています。
本コースでは、次世代の音声認識手法として近年注目を集めているend-to-endモデルのプロダクト化にあたって重要な2つの課題の解決に取り組みます。
1つ目は逐次入力される音声に対し逐次文字列を出力するオンライン化、2つ目は雑音環境下での音声認識率の向上です。

【内容（例）】
ESPnetを用いた、 Transformer、RNN-TransducerやCTCといったモデルの改良、オンライン化や雑音環境下での精度改善

プレエントリー締め切り

2020年7月3日（金）12:00

エントリーシート締め切り

2020年7月6日（月）12:00

プレエントリー後にご案内させていただく「マイページ」からエントリーシートをご提出いただきます。

必要な経験/スキル

・音声信号処理に関する基本的な知識
・基礎的なプログラミングスキル（Python、シェルスクリプト）
・Linux環境での開発経験
・PyTorchを用いてDLモデルの学習、評価を行った経験

あると望ましい経験/スキル

・ESPnetを用いたE2E音声認識の学習、評価を行った経験
・RNN-Transducer、CTCを利用した音声認識手法の知識
・Transformerなど最新のsequence-to-sequenceモデルの知識

報酬等

・給与：時給1,300円（10,075円/日）。一日の就業時間は10:00〜18:45（休憩1時間含む）。
・PC貸与（就業開始時にオフィスにて貸与、または各種設定後郵送いたします）。

選考

ステップ1

プレエントリー
～7月3日

ステップ2

エントリーシート提出
コーディングテスト受験
受験案内：6月下旬～
受験期限：7月6日

ステップ3

オンライン面接
7月中旬～7月末

ステップ4

選考結果ご連絡
8月上旬

注意事項

・参加コースのご希望はエントリーシートにてご選択ください（複数選択可）。
　第1希望のコースから優先的に選考させていただきますが、応募者多数の場合は第2希望以下のコースにご参加いただく可能性があります。
・インターンシップは就業体験を目的としておりますので、18歳以上30歳以下の現在在学中（高校生を除く）の方以外の方のご応募はご遠慮ください。
・日本国内での就労資格がない方はご参加いただくことができません。

採用情報公式SNSアカウント