キャリア

エンジニア部門

データベースエンジニア(DevOps/DBA/データエンジニア)

[東京]

Yahoo! JAPANのサービスを支える大規模データベース(RDB、NoSQL、DWH)の運用、開発を担当

業務内容

Yahoo! JAPANのデータベースには、膨大な量のデータを格納しており、サービスの成長とともに日々急速なペースで増大しています。
現在RDBは2,000 DB以上、NoSQLは10,000 node以上が必要となっており、多くのYahoo! JAPANのサービスで利用されています。
データウェアハウス基盤は日次で100万を越えるクエリが実行されています。
そして、利用サービスのクエリ、データ特性等、そのデータベースのユースケースはさまざまです。

これらのデータを事業に活用するための、下支えの基礎となる部門として、3つの領域で募集します。

<担当いただく領域>※担当領域および業務内容は、選考の過程で決定します。

【DevOps領域】
最大のミッションは、大規模なデータベース環境を安定的かつ効率的に運用することです。
また、各々のユースケースに対して、適切なチューニングや、SQL、テーブル設計のアドバイスも行います。
業務を通じて、DBaaS(Database as a Service)を自社で提供するための技術、スケールに対応するためのオペレーション自動化技術など、大規模なデータベースの運用に必要な技術を身につけながら、エンジニアとしての成長を感じることができます。
<主な業務内容>
・MySQL DBaaS、Cassandra DbaaS、OracleDBの構築、運用、パフォーマンス最適化
・データベースのバックアップ、リストアなどの運用自動化ツールの開発
・データベースの新バージョンや新機能の検証、導入
・大規模MySQLプラットフォームの検証、導入

【DBA(データウェアハウス)領域】
ミッションは、全社で横断利用可能な共通データセットを整備し、データウェアハウスとして提供することです。
多くの利用者を抱えるデータウェアハウス基盤を安定的かつ効率的に運用し、利用者が自由に分析できる計算能力を提供するため、種々の保守・運用作業、負荷対策(ワークロード管理、クエリチューニング)、利用者のサポート、新機能の検証、導入などを行います。
利用者と向き合い、コミュニケーションしながら業務に取り組むことで、大規模かつ処理量の多いデータウェアハウス基盤における運用やデータ管理のスキルを身に付け、データベースエンジニアとして成長することができます。
<主な業務内容>
・大規模データウェアハウス(Teradata)の保守・運用
・新機能検証、クエリーチューニングを含む負荷対策、障害対応
・ベンダコントロール、利用者サポート

【データエンジニア領域】
全社で横断利用可能な共通データセットの整備を行うことにより、利用者(サービス、機械学習など)のデータ活用による事業貢献を推進することがミッションです。
主にTalend等のETLツールを利用し、MySQL、Hive、Teradata、BigQueryなどさまざまなDBに格納されているデータを用いて、利用者のニーズに合わせたテーブルの設計やETLジョブの開発、保守・運用作業、利用サポートなどを行います。
各利用DBの特性と仕様を理解し、大規模なデータ処理を行うスキルを身に付けることで、データエンジニアとして成長することができます。
<主な業務内容>
・大規模データのテーブル設計、ETL開発、ETLジョブの保守・運用
・データの保守、運用
・データ利用者との要件定義、利用サポート

必要な経験/スキル

【DevOps領域】

  • Java、Python、Goのいずれかを利用したソフトウエアの開発、運用経験
  • データベースの運用経験、またはデータベーススペシャリストの資格
  • データベースの状況監視や最適なパフォーマンスチューニングの経験

【DBA(データウェアハウス)領域】

  • Teradata、Oracle、Redshift等のDBA役割経験
  • TeradataやExadata等アプライアンスの運用経験、またはRedshiftで複数インスタンスを統合に運用した経験

【データエンジニア領域】

  • SQLを用いたデータ操作を行う業務の経験
  • Java、Pythonのいずれかを利用したデータの加工経験
  • テーブル設計、データの保守・運用経験(バッチ処理を含む)

あると望ましい経験/スキル

【DevOps領域】

  • 大規模サービスの開発、運用経験
  • OSSの公開、コントリビュートの経験
  • OpenStackの運用経験
  • データベースオペレーション自動化の開発経験
  • ミッションクリティカルなシステム運用経験(パフォーマンスチューニング経験を含む)
  • ORACLE MASTER資格保有(12c)
  • クラウド/コンテナサービス利用経験(仮想化環境からのDB接続経験)
  • インフラ運用経験(NW/ストレージ)

【DBA(データウェアハウス)領域】

  • TBクラス、または数十億件のテーブルを扱うクエリーチューニング経験(データウェアハウス全体としては数10TB〜数PBのデータ量を想定)
  • Redshift等のクラウドネイティブなデータベース経験
  • Hadoopのクエリーエンジン経験(Hive、Presto、Spark等)
  • Talend等ETLツールやAmazon EMRを利用したデータ処理経験
  • Tableau等BIツールの利用に適したテーブル実装経験
  • プログラミング経験(SQL、python、Java、シェル等)

【データエンジニア領域】

  • データの組み合わせによる新規データの開発や、データ加工による利用効率化の経験
  • 大規模データのテーブル設計、運用経験
  • Hadoopのクエリーエンジン経験(Hive、Presto、Spark等)
  • Talend等のETLツールやAmazon EMRを利用したデータ処理経験
  • プラットフォームをまたいだデータ移動業務の経験

エンジニアが働く環境

  • Yahoo! JAPANは、多種多様なビッグデータを所有しています。100を超えるサービスから生み出される閲覧データ、クリックデータ、購買データなど、Yahoo! JAPANの持つマルチビッグデータを活用し、ユーザーのよりよい体験に役立てます。
  • PCはWindowsまたはMacから選択可能です。
  • エンジニアが開発業務に集中できるよう、省略すべき事務作業などは最小化しています。
  • 開発スタイルはチームによって異なりますが、アジャイル開発がメインです。開発手法としてはスクラムを採用しているチームが多いです。
  • ソースコードはGitHub Enterpriseで共有しています。Slack等のコミュニケーションツールを使用し、他チームのエンジニアともオンラインで気軽に情報交換などができます。
  • 執務室はフリーアドレス。対面でのコミュニケーションが生まれやすく、作業に集中しやすいよう工夫されたレイアウトです。
  • どこでもオフィス制度を利用して自宅等でのリモートワークが可能です。
  • コアタイムのないフレックスタイム制のため、早めに退社し、社外の勉強会やイベントなどに参加できます。
  • ユーザーに価値あるプロダクトをより多く届け、開発効率を上げるための手段としてCI/CDを重視しています。可能な限り自動化を進め、例えば、社内システム上において、ワンクリックでサーバーを立てられます。
  • サービスにおけるユーザーの動きや売上の推移などは全て可視化され、ほぼリアルタイムで見られます。ユーザーの声を定期的に収集し、サービス開発に生かしています。

エンジニアのキャリア

  • 自己申告型異動制度「ジョブチェン」や上長と1対1で行う「1on1ミーティング」を通じて、別サービスへの配置転換や職種変更など、ご自身の志向や身に付けたいスキル・経験に合わせ、キャリアを形成できる環境です。
  • マネジメントのキャリアはもちろん、優れたエキスパート人財に与えられる「黒帯制度」など、技術スペシャリストへの道もあります。

採用情報 公式SNSアカウント

このページの先頭へ