Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

miHoYo logo
米哈游
语音/歌声生成实习生
立即应聘

语音/歌声生成实习生

发布于 大约 15 小时前

实习/见习

上海市
无经验要求
实习生
仅现场办公
硕士
研究与开发 (研发)
深度学习
PyTorch
TensorFlow
语音生成
TTS
Icassp
声码器
歌声合成
Omni模型

AI 估算 · 4k–8k

米哈游实习生薪资行业较高,岗位技术性强,参考市场实习薪资范围。

职位详情

关于这个职位

该职位是米哈游的语音/歌声生成实习生,主要参与语音生成算法(如TTS、歌声合成)和Omni模型的研究与应用,同时协助数据建设

你将接触前沿的语音生成技术,与顶尖团队合作,适合对语音方向有研究兴趣的硕士及以上学历同学

最低要求

硕士及以上学历,计算机、数学、通信等相关专业

具备良好的学习能力、逻辑思维能力、沟通协作能力
熟练使用Python和Pytorch/Tensorflow深度学习框架
熟悉以下至少一种,且有相应研发经验优先:
语音生成模型(如DITAR、VibeVoice、CosyVoice等)
语音omni模型(如StepAduio、KimiAudio等)
各类声码器(如Hifi-GAN,MelGAN,BigvGAN等)
有顶会论文(各类CCF-A会、ICASSP/INTERSPEECH等)优先

工作职责

Voice生成算法研究、应用,包括标准TTS / instruct TTS / multi-turn TTS / singing voice synthesis等

Omni模型算法研究、应用,包括Voice生成能力到omni模型的迁移,understanding-based voice generation等
参与数据建设的讨论, 包括标准规范制定&优化, 协助数据验收交付

AI 洞察

优缺点分析

优点

  • 岗位直接参与前沿语音生成和Omni模型研发,技术积累价值高
  • 实习生有机会发表论文或参与实际产品落地,简历含金量高
  • 语音生成领域进展快,需持续跟进最新论文和开源工作
  • 适合有语音研究方向、希望深入前沿技术并追求高质量实习经历的硕士或博士研究生

缺点 / 挑战

  • 米哈游作为头部游戏公司,技术氛围浓厚,资源丰富,项目有挑战性
  • 要求较高,硕士起步且有相关研究经验,竞争激烈
  • 实习期可能需快速出成果,工作压力与学习成本并存

角色解读

  • 深入语音生成前沿技术,积累研究经验,未来可转向语音算法工程师或研究科学家
  • 接触Omni模型等新方向,具备多模态能力后向AI研究员发展
  • 在米哈游项目落地经验可助攻大厂或继续深造读博
  • 研究并应用语音生成算法,包括TTS、歌声合成等,提升生成质量与多样性
  • 探索Omni模型,将语音生成能力迁移至多模态模型,实现理解驱动的语音生成
  • 参与数据建设,制定标注规范并验收数据,保障训练数据质量
  • 扎实的深度学习基础,熟练使用Python及PyTorch或Tensorflow
  • 熟悉至少一类语音生成模型、Omni模型或声码器,有实际研发经验
  • 良好的文献阅读和复现能力,有顶会论文经历更佳

申请策略

  • 申请时附上个人GitHub或项目作品集,展示实际动手能力
  • 关注米哈游技术博客或分享,了解公司技术栈和文化
  • 突出语音生成或相关深度学习项目的经历,如TTS、歌声合成、声码器项目
  • 重点列出与岗位相关的技能:Python、PyTorch、语音模型(如CosyVoice等)
  • 如有论文或开源贡献,务必展示,体现研究能力
  • 提前阅读并复现近期语音生成/Omni模型论文(如VibeVoice、StepAudio)
  • 熟悉常用声码器(HiFi-GAN)并尝试调优,掌握推理加速技术

面试指南

  • 先概述项目背景和目标,然后分模块讲解方法,最后总结结果和你的贡献
  • 对于比较性问题,从原理、性能、应用场景三方面对比
  • 评估类问题,列举常用指标(MOS、PESQ等),并说明其适用场景
  • 请详细介绍你做过的一个语音生成项目,包括模型架构、数据、结果
  • TTS中如何解决音色和韵律的多样性问题?
  • Omni模型与单独语音模型相比有何优劣势?
  • 如何评估语音生成质量?常用的客观和主观指标有哪些?
  • 如果让你设计一个新声码器,你会考虑哪些方面?

职位点评

66
综合评分

米哈游语音生成实习,前沿技术栈、高成长性,但薪资和WLB一般。

更适合这类人
最适合追求技术成长和前沿研究的学习者,对薪资和WLB要求不高。
表现最好
成长发展
相对薄弱
薪资福利
薪资福利45
成长发展95
工作生活55
使命价值70

薪资福利

45较低

实习生薪资相对有限,但米哈游提供餐补等福利,总体补偿性一般。

薪资信号未披露(AI估算:4K-8K/月)

成长发展

95较高

岗位聚焦前沿语音生成和Omni模型,技术成长空间极大,且有论文和项目经验积累。

技术前沿前沿/新兴技术
技术栈TTS、歌声合成、Omni模型、声码器、DITAR、CosyVoice
业务类型profit_center

工作生活

55较低

上海现场办公,实习生通常要求全职,但公司整体工作节奏可能较快,WLB中等偏下。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

米哈游以高品质游戏著称,语音生成技术可直接用于角色塑造,有较强使命感,但实习期较短。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 招聘HR(第三方编制)

    米哈游 · 上海市
    AI 估算 · 8k-15k
  • 资深美宣插画-星布谷地

    米哈游 · 上海市
    AI 估算 · 20k-40k
  • 多模态Pretrain研究实习生-audio方向

    米哈游 · 上海市
    AI 估算 · 6k-12k
  • 多模态算法工程实习生(audio方向)

    米哈游 · 上海市
    AI 估算 · 6k-12k
  • UGC内容安全专家

    米哈游 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • 上车体布置集成工程师-人机工程方向

    小米 · 南京市
    AI 估算 · 15k-25k
  • 智慧零售算法工程师

    腾讯 · 武汉市
    AI 估算 · 20k-35k
  • 混元Agent后训练算法工程师(北京/上海/深圳)

    腾讯 · 北京市
    AI 估算 · 35k-65k
  • 混元VLM 预训练数据算法工程师(北京/深圳/上海)

    腾讯 · 北京市
    AI 估算 · 25k-40k
  • 算法工程师-大模型

    中国平安 · 深圳市
    AI 估算 · 25k-45k

米哈游 的其他在招职位

  • 招聘HR(第三方编制)

    米哈游 · 上海市
    AI 估算 · 8k-15k
  • 资深美宣插画-星布谷地

    米哈游 · 上海市
    AI 估算 · 20k-40k
  • 多模态Pretrain研究实习生-audio方向

    米哈游 · 上海市
    AI 估算 · 6k-12k
  • 多模态算法工程实习生(audio方向)

    米哈游 · 上海市
    AI 估算 · 6k-12k
  • UGC内容安全专家

    米哈游 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • 上车体布置集成工程师-人机工程方向

    小米 · 南京市
    AI 估算 · 15k-25k
  • 智慧零售算法工程师

    腾讯 · 武汉市
    AI 估算 · 20k-35k
  • 混元Agent后训练算法工程师(北京/上海/深圳)

    腾讯 · 北京市
    AI 估算 · 35k-65k
  • 混元VLM 预训练数据算法工程师(北京/深圳/上海)

    腾讯 · 北京市
    AI 估算 · 25k-40k
  • 算法工程师-大模型

    中国平安 · 深圳市
    AI 估算 · 25k-45k