
ソニーグループ
- 従業員数
- 111700人
- 業種
- 家電・AV機器 / ゲーム(情報・サービス) / 電気・電子機器 / 半導体・電子部品 / 金融
- 所在地
- 東京都港区港南1-7-1
- HP
- https://www.sony.co.jp/
27年就職:インターン・仕事体験
研究開発職
D01.AI & Machine Learning【R&D】
- 募集職種
- 研究開発職
- 対象資格
- 2027年修了見込みの方 学部, 修士, 博士
- 勤務予定地
- 東京都
- 備考
- ソニーシティ大崎
- 応募受付期間
- 2025年5月29日(木)~2025年6月9日(月)
- 実施期間
- 2025年8月25日(月)~2025年9月20日(土)
- 備考
- 8/25(月) ~9月20日(金)の2~4週間
- A. 最先端の生成 AI 技術(LLM、画像生成 AI、動画生成 AI、3D生成 AI 、音声対話システムなど)の応用研究開発を行う。 ソニーグループの多岐に渡るエンタテインメント領域(映画、アニメ、ゲーム、モビリティ、Location Based Entertainment、スポーツ など)の顧客価値を高め、新規事業領域を切り開く次世代の AI サービス/ソリューションを開発する。 B. ①画像認識 - 顔認識・人認識・物体認識・ハンド認識・シーン認識のコアアルゴリズム開発。Vision+Languageや基盤モデルを利用したマルチモーダル認識技術/ダウンストリームタスクやRaw画像認識、量子化やPruningなどのハードウェアに適した実装検討も含む。 カメラ、ロボット、スマートフォン、テレビなど多くの商品化実績あり。 ②クリエイションAI - 画像からの顔表情推定、顔画像生成、音声解析からのモーション生成(LipSync、全身)を、3DCGを用いて精緻な認識器として学習を実施。 VLM+LLMアーキテクチャによる動画像向けシーン記述モデルの開発。アニメ現場導入実績あり。 ③強化学習/深層強化学習によるロボティクス以外の事業課題の解決、事業応用に関する研究開発。 具体的には 1)3DCGキャラクタのモーション生成 2)ロボットのアーム制御 3)3DCG画像撮影の際の最適パラメータ探索など。 ④機械学習を活用した、ナビゲーション(屋内外)/マニピュレーション/言語指示解釈/モーション生成/強化学習 等ロボット(バーチャルエージェント含む)の行動学習、制御に関する研究開発。 C. ゲーム、音楽、映画領域への応用を想定した、音声・テキストの理解/生成技術の研究開発。 言語的/意味的な解析、音声認識、音声合成、大規模言語モデルと翻訳などの下流タスクへの応用技術開発 等"
- 求める経験、スキル、資格など
- A. [必要なスキル・経験] ・深層学習フレームワークの使用経験 (PyTorch など) ・Python を用いたコーディング能力 [あると望ましいスキル・経験] ・論文の記述からモデル・アルゴリズムの実装経験 ・研究論文の執筆経験(学会発表があればより望ましい) ・画像生成、動画生成、3D生成、LLM など生成 AI モデル/AI サービスの利用経験 ・大規模言語モデルを用いた音声対話システムの構築経験 B. [必要なスキル・経験] ・深層学習/強化学習/統計学習など機械学習の専門知識 ・C/C++/Python/MATLAB、DNNフレームワークのプログラミングスキル [あると望ましいスキル・経験] ・画像認識での機械学習応用 ・国際学会や海外の論文を理解するための英語・数学の能力 ・DNNの学習フレームワークの利用経験、コンパクト化(量子化、プルーニング、Distillationなど) ・3DCG、幾何学、LLM,VLMに関する研究、基盤モデルのダウンストリームタスク実装 ・強化学習を用いた物理シミュレーションでのモーション生成 ・深層強化学習アルゴリズムの実装経験 ・ロボットのマニピュレーション/ナビゲーション技術/言語IF C. [必要なスキル・経験] ・深層学習/強化学習/統計学習など機械学習の専門知識がある方 C/C++/Python/MATLAB、DNNフレームワークのプログラミングスキルのある方 [あると望ましいスキル・経験] ・音声・言語処理への機械学習応用に興味のある方 ・音声・言語領域の基盤モデルの開発・応用経験がある方 ・国際学会や海外の論文を理解するための英語・数学の能力がある方
- 関連する研究キーワード
- 自然言語処理 コンピュータビジョン ロボティクス 強化学習 深層学習 マルチモーダルAI 生成AI