30年連続支援実績No.1!東証上場転職エージェント

← 一覧へ戻る

楽天

数千台規模GPU基盤でLLMを高速化!分散学習と推論最適化エンジニア募集

会社概要

Eコマース、決済サービス、金融サービス、モバイル、メディア、スポーツなど70を超えるサービスを展開し、日本では1億人、グローバルでは10億人を超える顧客基盤を有しています。AI&DataDivisionは、楽天グループのデータを活用してデータサイエンスとAIの取り組みを牽引し、最先端技術を用いた大規模フィールド実験のプラットフォームを構築しています。「データドリブンなメンバーシップカンパニーとしての楽天」という戦略的ビジョンのもと、複数の楽天グループ企業にまたがりデータとAI関連活動を拡大しています。配属先のGPUOptimizationDepartmentは、機械学習ワークロード向けに計算資源を高性能かつコスト効率よく活用するため、全社AIインフラの戦略管理、最適化、ガバナンスを担います。数千台規模のアクセラレータを含む大規模ハイブリッド基盤を監督し、オンプレミスとマルチクラウドにまたがる資源配分最適化、分散学習フレームワークの開発強化、推論性能の最適化、ビジネス要件に合わせた高可用な推論サービスの提供支援などを推進します。本ポジションはLLMの学習と推論をGPUクラスタ上で最大限に効率化し、学習時間短縮やGPU利用率向上、推論レイテンシ最小化を通じてAIインフラの効率改善とコスト削減に直接貢献します。GPU加速の学習推論最適化経験をお持ちの方は、スケールする基盤で成果を出しやすい環境です。

ポジション

分散学習および推論最適化エンジニア

職務内容

GPUクラスタ上でLLMの学習と推論ワークロードの性能、効率、スケーラビリティを最大化します。学習フレームワークと推論エンジンを深く最適化し、学習時間短縮、GPU利用率向上、推論レイテンシ低減を実現します。インフラチームと協働し、スケジューリングや資源配分、耐障害性を含む大規模学習ジョブの実行基盤を改善します。 <具体的な業務内容> ・LLM学習フレームワークの最適化によるGPU利用率最大化と学習時間短縮 ・分散学習ボトルネックのプロファイルと最適化NCCL課題CUDAカーネル効率通信オーバーヘッド対応 ・量子化や動的バッチングやKVキャッシュなどの推論最適化の実装とチューニング ・低レイテンシ高スループットなLLMサービングに向けた推論エンジン最適化 ・GPUクラスタのスケジューリング資源配分耐障害性の改善に向けたインフラチーム連携 ・学習スループットメモリ効率推論レイテンシを測定改善するベンチマークツール開発 ・mixtureofexpertsやspeculativedecodingなど最先端手法の調査と適用 ・学習推論ワークロードの性能効率スケーラビリティ改善の継続推進

応募要件

・4年制大卒以上 下記のいずれかに当てはまる方 ・GPU加速を用いた機械学習の学習と推論の最適化について3年以上の実務経験をお持ちの方。 ・大規模深層学習モデルまたはLLMにおける学習推論最適化の実務経験をお持ちの方。 ・PyTorchまたはDeepSpeedまたはFSDPまたはMegatronLMに関する深い知識と分散学習最適化の経験をお持ちの方。 ・量子化やプルーニングやKVキャッシュやcontinuousbatchingなどLLM推論最適化の知識をお持ちの方。 ・コンピュータサイエンスまたはエンジニアリングまたは関連分野の学士以上の学位をお持ちの方。

年収

経験・スキルを考慮し決定 ※平均年収約856万円(有価証券報告書参照)

勤務地

東京都

福利厚生

<勤務形態> ・裁量労働勤務 ・フレキシブルタイム勤務 ・時差勤務制度 ・在宅勤務制度 <福利厚生> ・社内公募制度 ・裁量労働制度 ・フレックスタイム制度 ・テレワーク在宅勤務 ・カフェテリアプラン ・育児介護休職制度 ・短時間勤務制度 ・社内託児所 ・搾乳室(マザーズルーム) ・ベビーシッター割引券 ・オープンファミリーデー ・ストックオプションプログラム ・従業員持株会 ・クラブ活動(Rakuten Official Club) ・楽天クリムゾンハウスサービス施設 ・フィットネスジム、ヘアサロン、ネイルサロン ・健康カウンセリングサービス ・リロケーションサポート ・従業員向け優待割引(引っ越し・語学学習等)


この求人を見た方におススメの関連求人

楽天

社内外のステークホルダーと協議し、事業拡大に貢献するデータ活用ソリューションを提案、POC や Ad hoc 分析、開発部門を巻き込んだソリューション開発など多種多様な施策を推進します。世界中から優秀...

サイバーエージェント

事業内容・課題を各エンジニアや責任者と議論して理解し、「事業で収集した大規模データ活用(配信における予測・最適化)」や、「AIを活用したクリエイティブの制作支援、最適化」等を適切な機械学習タスク設計を...

ソフトバンク

健康・医療データおよびそれらに関する情報を扱うシステムの企画、開発ならびにサービスの運用、保守、管理します。 【具体的な業務】 ・国産クラウドでのセキュアな情報蓄積基盤の実装とLLM基盤とのセキュアな...

GROWTH VERSE(グロースヴァース)

データ分析、AI、MA関連プロジェクトにおいて、顧客課題を深く理解し、解決策の設計と推進を担う役割です。大規模または複雑なプロジェクトをリードし、チームの成果最大化と円滑な遂行を実現します。 <具体的...

ジンズホールディングス

全体のデータを活用し、マーケティングや商品開発、営業などさまざまな領域の改善提案を行う役割です。データからビジネス全体をとらえ、顧客のインサイトを抽出し、機械学習モデルの構築を通じてビジネス拡大に貢献...

サイバーエージェント

■アドテクノロジー(広告配信)領域 以下のようなプロダクトでのアルゴリズム改善 ・広告のクリック率 / コンバージョン率などの予測モデル ・ダイナミックリターゲティング広告での商品レコメンデーション ...

楽天

マーケティング領域の社内AIアプリケーション事業において、主にデータインフラストラクチャ・データパイプラインの開発を担当いただきます。 又、一人の開発者として貢献するのみならず、開発チームにおけるテク...

楽天

楽天の広告最適化グループのプロダクトマネージャーとして、広告プロダクトのロードマップ策定から実行までをリードし、AIを活用した広告最適化を推進します。 <具体的な職務内容> ・プロダクトロードマップの...

楽天

広告計測やマーケティングリサーチの未来像を描き、AIやデータ基盤を活用し、広告効果測定を進化させる役割を担います。データ活用基盤の強化と新しい調査手法の開発を行います。 <具体的な職務内容> ・広告効...

楽天

社内ユーザー向けのクラウドサービス(Microsoft 365など)の導入・展開・改善を推進し、プロダクトの成功をリードします。 <具体的な職務内容> ・クラウドサービスの製品ロードマップを定期的に確...

企業カテゴリ
職種
待遇・制度
その他