ソニーグループ

従業員数: 111700人
業種: 家電・AV機器 / ゲーム（情報・サービス） / 電気・電子機器 / 半導体・電子部品 / 金融
所在地: 東京都港区港南1-7-1
HP: https://www.sony.co.jp/

企業情報募集情報

ソニーグループの他の募集情報

27年就職：インターン・仕事体験

研究開発職

D01.AI ＆ Machine Learning【R&D】

所要日数:2週間程度業務体験東京都

▼ 募集条件 ▼ スケジュール ▼ 実施概要

募集職種: 研究開発職

対象資格: 2027年修了見込みの方学部, 修士, 博士

勤務予定地: 東京都
備考: ソニーシティ大崎

応募受付期間: 2025年5月29日(木)~2025年6月9日(月)

実施期間: 2025年8月25日(月)~2025年9月20日(土)
備考: 8/25(月) ～9月20日(金)の2~4週間

仕事内容: A. 最先端の生成 AI 技術（LLM、画像生成 AI、動画生成 AI、3D生成 AI 、音声対話システムなど）の応用研究開発を行う。ソニーグループの多岐に渡るエンタテインメント領域（映画、アニメ、ゲーム、モビリティ、Location Based Entertainment、スポーツなど）の顧客価値を高め、新規事業領域を切り開く次世代の AI サービス/ソリューションを開発する。 B. ①画像認識 - 顔認識・人認識・物体認識・ハンド認識・シーン認識のコアアルゴリズム開発。Vision＋Languageや基盤モデルを利用したマルチモーダル認識技術/ダウンストリームタスクやRaw画像認識、量子化やPruningなどのハードウェアに適した実装検討も含む。カメラ、ロボット、スマートフォン、テレビなど多くの商品化実績あり。 ②クリエイションAI - 画像からの顔表情推定、顔画像生成、音声解析からのモーション生成(LipSync、全身)を、3DCGを用いて精緻な認識器として学習を実施。 VLM+LLMアーキテクチャによる動画像向けシーン記述モデルの開発。アニメ現場導入実績あり。 ③強化学習/深層強化学習によるロボティクス以外の事業課題の解決、事業応用に関する研究開発。具体的には 1)3DCGキャラクタのモーション生成 2)ロボットのアーム制御 3)3DCG画像撮影の際の最適パラメータ探索など。 ④機械学習を活用した、ナビゲーション(屋内外)/マニピュレーション/言語指示解釈/モーション生成/強化学習等ロボット(バーチャルエージェント含む)の行動学習、制御に関する研究開発。 C. ゲーム、音楽、映画領域への応用を想定した、音声・テキストの理解/生成技術の研究開発。言語的/意味的な解析、音声認識、音声合成、大規模言語モデルと翻訳などの下流タスクへの応用技術開発等"

求める経験、スキル、資格など: A. [必要なスキル・経験] ・深層学習フレームワークの使用経験 (PyTorch など) ・Python を用いたコーディング能力 [あると望ましいスキル・経験] ・論文の記述からモデル・アルゴリズムの実装経験・研究論文の執筆経験（学会発表があればより望ましい）・画像生成、動画生成、3D生成、LLM など生成 AI モデル/AI サービスの利用経験・大規模言語モデルを用いた音声対話システムの構築経験 B. [必要なスキル・経験] ・深層学習/強化学習/統計学習など機械学習の専門知識・C/C++/Python/MATLAB、DNNフレームワークのプログラミングスキル [あると望ましいスキル・経験] ・画像認識での機械学習応用・国際学会や海外の論文を理解するための英語・数学の能力・DNNの学習フレームワークの利用経験､コンパクト化(量子化、プルーニング、Distillationなど) ・3DCG、幾何学、LLM,VLMに関する研究、基盤モデルのダウンストリームタスク実装・強化学習を用いた物理シミュレーションでのモーション生成・深層強化学習アルゴリズムの実装経験・ロボットのマニピュレーション/ナビゲーション技術/言語IF C. [必要なスキル・経験] ・深層学習/強化学習/統計学習など機械学習の専門知識がある方 C/C++/Python/MATLAB、DNNフレームワークのプログラミングスキルのある方 [あると望ましいスキル・経験] ・音声・言語処理への機械学習応用に興味のある方・音声・言語領域の基盤モデルの開発・応用経験がある方・国際学会や海外の論文を理解するための英語・数学の能力がある方

関連する研究キーワード: 自然言語処理コンピュータビジョンロボティクス強化学習深層学習マルチモーダルAI 生成AI