Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Baidu logo
百度
语音算法实习生(J84146)
立即应聘

语音算法实习生(J84146)

发布于 大约 4 小时前

实习/见习

北京市
无经验要求
实习生
仅现场办公
本科
深度学习
PyTorch
LLM
多模态
语音合成
ASR
TTS
Vits

AI 估算 · 4k–8k

一线大厂语音算法实习薪资具有竞争力,综合日薪约200-300元,按22个工作日估算月薪。

职位详情

关于这个职位

该职位是百度语音算法实习生,主要参与语音合成与理解的前沿研究,结合大模型范式构建新一代语音系统

你将有机会接触LLM-based TTS、端到端Speech2Speech等热门方向,并参与到实际业务落地中,是积累顶尖AI研发经验的绝佳机会

最低要求

计算机、人工智能、信号处理、通信、数学等相关专业,本科及以上学历

精通 Python/C/C++等编程语言,熟练使用 Pytorch进行深度学习模型开发
熟悉TTS、ASR等语音基础理论和算法,了解或使用过VITS/VALLE/FishSpeech/CosyVoice,有LLM理论和训练基础的优先

工作职责

实验最新语音合成、理解方案,并对其中的模块进行解耦和分析

结合大模型范式,参与研发语音Encodec、Decoder、多模态对齐等模块,构建LLM based TTS和端到端Speech2Speech系统
参与到具体的语言合成业务落地工作
参与语音大模型的评测及优化

优先资格

有语音合成等相关实际项目经验者优先

具备良好的沟通能力,对技术充满热情

AI 洞察

优缺点分析

优点

  • 百度作为AI巨头,语音技术底蕴深厚,实习经历含金量高
  • 直接参与LLM+语音等前沿方向,技术视野开阔,成长迅速
  • 团队资源丰富,有机会接触大规模数据和计算平台
  • 实习工作强度较大,可能需要应对项目紧急需求
  • 竞争激烈,需在有限时间内产出成果
  • 适合对语音技术有强烈兴趣、具备扎实深度学习基础、希望在大厂前沿团队快速提升的在校学生

缺点 / 挑战

  • 技术门槛较高,需同时掌握语音和大模型知识,学习曲线陡峭

角色解读

  • 实习期间可深入掌握语音+大模型前沿技术,积累项目经验
  • 表现优异者有机会转正为百度正式语音算法工程师,继续深耕语音方向
  • 未来可向语音算法专家、多模态AI研究员或技术管理方向发展
  • 实验最新的语音合成与理解算法,分析并优化各模块性能
  • 参与研发基于大模型的语音编解码、多模态对齐等核心模块,构建端到端语音交互系统
  • 将算法落地到实际的语音合成业务中,并负责语音大模型的评测与迭代
  • 扎实的编程基础:精通Python/C++,熟练使用Pytorch进行深度学习开发
  • 语音领域知识:熟悉TTS、ASR基本原理,了解VITS/VALL-E等主流模型
  • 大模型基础:有LLM理论和训练经验者优先,能够将大模型与语音技术结合

申请策略

  • 关注百度语音团队的技术博客或开源项目,在面试中展示了解
  • 准备一个完整的语音项目介绍,包括问题、方法、实验结果
  • 重点突出语音相关项目经验,如TTS、ASR或语音前端处理
  • 展示编程能力:Python/C++项目,Pytorch使用经验
  • 如有LLM相关项目或论文,务必提及
  • 提前熟悉VITS/VALL-E/FishSpeech等开源语音模型,理解基本原理
  • 学习LLM基础知识,了解Transformer、预训练范式等

面试指南

  • 先给出定义或流程,再结合实际项目细节,最后总结优缺点
  • 对于开放式问题,分层次回答,从基础到前沿,展现思考深度
  • 请简要介绍TTS的基本流程和常用模型
  • 你如何评估语音合成质量?有哪些指标?
  • 解释一下VITS模型的核心创新点
  • 如何将大语言模型与语音合成结合?请谈谈你的理解
  • 手写一段代码:实现一个简单的音频处理函数(如降采样)
  • 复习语音信号处理基础(傅里叶变换、滤波、特征提取等)

匹配度报告

65
综合匹配度

百度语音算法实习,前沿技术栈,成长空间极大,薪资一般。

适合人群
适合注重技术成长、希望接触前沿AI的求职者,对短期薪资要求不高。
最强匹配
成长发展匹配
最弱匹配
薪资福利匹配
薪资福利40
成长发展90
工作生活60
使命价值70

薪资福利匹配

40较低

实习薪资相对较低,但大厂通常有餐补、班车等隐形福利,整体补偿性一般。

薪资信号未披露(AI估算:4K-8K/月)

成长发展匹配

90较高

该职位聚焦语音+大模型前沿技术,提供难得的研发实践机会,成长空间极大。

技术前沿前沿/新兴技术
技术栈Python、C++、Pytorch、TTS、ASR、LLM、VITS、VALL-E、FishSpeech、CosyVoice
业务类型ambiguous

工作生活匹配

60中等

现场办公,互联网大厂通常有弹性工时,但实习可能需要较高出勤,WLB一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

语音技术改善人机交互,有较强实际应用价值,但社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • 服务商运营实习生(J95843)

    百度 · 北京市
    AI 估算 · 4k-6k
  • 前端实习岗(J72414)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 网盟产品运营实习生(J78749)

    百度 · 北京市
    AI 估算 · 3k-5k
  • 策略产品实习生(J81971)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 政策研究实习生(J91431)

    百度 · 北京市
    AI 估算 · 2k-4k

相似职位推荐

  • 商业化销售实习生(游戏)-【商业化】

    快手 · 上海市
    AI 估算 · 4k-6k

百度 的其他在招职位

  • 服务商运营实习生(J95843)

    百度 · 北京市
    AI 估算 · 4k-6k
  • 前端实习岗(J72414)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 网盟产品运营实习生(J78749)

    百度 · 北京市
    AI 估算 · 3k-5k
  • 策略产品实习生(J81971)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 政策研究实习生(J91431)

    百度 · 北京市
    AI 估算 · 2k-4k

相似职位推荐

  • 商业化销售实习生(游戏)-【商业化】

    快手 · 上海市
    AI 估算 · 4k-6k