
实习/见习
AI 估算 · 6k–12k
该岗位为研究实习,要求博士在读,具备大模型训练经验,薪资在实习岗位中属中上水平
作为多模态Pretrain研究实习生(音频方向),你将参与构建下一代音频基础模型和Omni多模态框架,专注于通用音频理解模型的研究与开发,探索语音、音乐、环境声音等多模态音频内容的统一理解建模方法,推动audio AI在理解、生成和交互场景中的技术突破
计算机科学、人工智能、电子工程等相关博士学历
模型架构与训练:负责通用音频理解模型设计与分布式训练优化,实现语音识别、情感分析、音频问答、音乐理解、声音事件检测等多任务统一建模
在 NeurIPS/ICML/ICASSP/ISMIR 等顶级会议发表论文
优点
缺点 / 挑战
前沿音频AI研究实习,技术成长空间大,但现场办公且WLB信息不明确
实习薪资相对固定,但米哈游福利较好,但JD未提及具体薪酬福利,薪资处于实习市场中上水平。
该岗位技术前沿,涉及AudioLLM和多模态等热点方向,有论文发表和开源贡献机会,成长性极强。
仅现场办公,未提及弹性工作或WLB,实习性质灵活度一般,但无明确加班信号。
音频AI在游戏、娱乐领域有广泛应用,技术创新有社会价值,但并非直接改善社会福祉。