Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Baidu logo
百度
语音合成算法实习工程师(TTS)(J85477)
立即应聘

语音合成算法实习工程师(TTS)(J85477)

发布于 大约 4 小时前

实习/见习

深圳市
无经验要求
实习生
仅现场办公
硕士
深度学习
PyTorch
SFT
语音合成
推理优化
大模型
TTS
ICL

AI 估算 · 4k–7k

百度深圳实习岗,硕士生,按日薪200-300折算,月薪约4-7K,与行业实习生水平相当

职位详情

关于这个职位

该职位是百度语音合成算法实习岗,主要参与语音合成大模型的研发与优化,包括模型结构设计、预训练ICL、微调SFT等,同时负责技术项目落地和推理性能优化

适合对语音合成前沿技术有热情、具备深度学习背景的硕士生,可以在百度平台积累大模型实战经验

最低要求

硕士及以上学历,计算机相关专业,有语音合成相关项目经验

熟悉Linux和python,熟练使用PyTorch等深度学习框架
沟通良好,对技术有热情,勤奋学习,积极向上

工作职责

参与研发语音合成大模型,包括但不限于模型结构优化、预训练ICL、微调SFT等工作

跟进语音合成方向相关前沿技术进展
参与百度海外多个产品的语音合成技术项目落地
负责语音合成大模型推理性能优化

优先资格

加分项:在interspeech、icassp等会议或期刊发表过论文,有语音类比赛获奖经历

AI 洞察

优缺点分析

优点

  • 百度大平台,技术积累深厚,实习经历含金量高
  • 参与语音大模型前沿研发,接触最新技术(ICL、SFT等)
  • 有落地场景,能将研究转化为实际产品,成就感强
  • 团队专业,可学习工业级工程经验和研究思路
  • 语音合成领域竞争激烈,需持续跟踪前沿动态
  • 适合对语音合成有浓厚兴趣、具备深度学习基础、希望接触大模型前沿技术的硕士生,特别是想进入百度或大厂AI岗位的求职者

缺点 / 挑战

  • 大模型研发对理论深度和工程能力要求较高,新手可能有门槛
  • 实习时间有限,需快速学习和产出,压力较大

角色解读

  • 实习表现优秀可转正,成为百度语音方向正式算法工程师
  • 深入参与大模型研发,未来可向语音算法专家或研究科学家方向发展
  • 积累工业级项目经验,后续可跳槽至其他大厂或创业公司
  • 参与语音合成大模型的研发,包括模型结构设计、预训练ICL和微调SFT,推动模型性能提升
  • 跟进语音合成前沿技术,如最新论文和开源项目,探索创新方案
  • 负责将模型落地到百度海外产品中,处理实际场景中的技术问题
  • 优化大模型推理性能,确保低延迟、高效率部署
  • 扎实的深度学习基础,熟悉PyTorch等框架,能独立实现和调试模型
  • 语音合成项目经验,了解TTS基本流程和常见模型(如Tacotron、FastSpeech、VITS等)
  • 良好的编程能力(Linux、Python),具备工程化思维
  • 阅读英文文献能力,有论文发表或比赛获奖经历更佳

申请策略

  • 在申请中展现对百度语音产品(如小度)的理解和兴趣
  • 提前了解百度在语音合成方面的公开论文和技术博客,面试时能展示匹配度
  • 重点突出语音合成相关项目经验,包括模型结构、训练流程、性能指标
  • 如有论文或比赛奖项,单独列出并简述贡献
  • 展示深度学习项目中的技术细节,如PyTorch使用、模型优化技巧
  • 强调对技术热情,比如个人博客、GitHub开源贡献
  • 如果有时间,可以自行实现一个TTS基线模型(如FastSpeech)并理解原理
  • 学习大模型相关技术,如Transformer、Diffusion模型等

面试指南

  • 用STAR法则(情境-任务-行动-结果)清晰描述项目经历,突出个人贡献
  • 对于技术原理问题,先给出核心概念定义,再结合例子说明,体现深度理解
  • 对于优化问题,从算法和工程两个层面给出思路,如模型剪枝、量化、算子融合等
  • 请介绍你过去做过的语音合成项目,遇到的最大技术挑战是什么?
  • 你知道大模型中的ICL和SFT吗?在语音合成中如何应用?
  • 如何优化语音合成模型的推理速度?请给出具体思路
  • Transformer在语音合成中的作用是什么?与传统RNN相比有何优势?
  • 你如何看待当前语音合成技术的发展趋势?

匹配度报告

61
综合匹配度

百度语音合成实习,前沿技术栈,学习价值高,但薪资和WLB一般

适合人群
最适合追求技术成长和前沿研究的求职者,对短期薪资和WLB要求不高
最强匹配
成长发展匹配
最弱匹配
薪资福利匹配
薪资福利35
成长发展90
工作生活50
使命价值70

薪资福利匹配

35较低

实习薪资处于市场平均水平,无额外福利承诺,经济补偿性一般

薪资信号未披露(AI估算:4K-7K/月)

成长发展匹配

90较高

技术栈前沿(大模型、ICL、SFT),学习机会丰富,职业发展潜力大

技术前沿前沿/新兴技术
技术栈语音合成、大模型、ICL、SFT、PyTorch、推理优化
业务类型ambiguous

工作生活匹配

50较低

现场办公,无明确WLB描述,互联网大厂实习通常有一定加班压力

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

语音合成在智能交互领域有广泛应用前景,能提升用户体验,具有一定社会价值

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • 服务商运营实习生(J95843)

    百度 · 北京市
    AI 估算 · 4k-6k
  • 前端实习岗(J72414)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 网盟产品运营实习生(J78749)

    百度 · 北京市
    AI 估算 · 3k-5k
  • 策略产品实习生(J81971)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 政策研究实习生(J91431)

    百度 · 北京市
    AI 估算 · 2k-4k

相似职位推荐

  • 大语言模型通用Agent研究工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 30k-60k

百度 的其他在招职位

  • 服务商运营实习生(J95843)

    百度 · 北京市
    AI 估算 · 4k-6k
  • 前端实习岗(J72414)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 网盟产品运营实习生(J78749)

    百度 · 北京市
    AI 估算 · 3k-5k
  • 策略产品实习生(J81971)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 政策研究实习生(J91431)

    百度 · 北京市
    AI 估算 · 2k-4k

相似职位推荐

  • 大语言模型通用Agent研究工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 30k-60k