Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
豆包大模型语音合成算法工程师-Data语音
立即应聘

豆包大模型语音合成算法工程师-Data语音

发布于 2 天前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
学历未注明
研究与开发 (研发)
PyTorch
强化学习
NeurIPS
自然语言处理
预训练
音频生成
语音合成
多模态模型
ACM竞赛

AI 估算 · 25k–45k

大厂核心算法岗,语音合成前沿方向,薪资竞争力强

职位详情

关于这个职位

该职位是字节跳动豆包大模型团队的核心算法岗,专注于语音合成及多模态模型的前沿研发

你将参与下一代人工智能技术的创新,推动语音、音乐、音频生成与理解等技术在业务场景中的落地应用
适合对AI研究有浓厚兴趣,希望在语音、NLP领域深耕的技术人才

最低要求

计算机科学/计算机工程/电子信息技术等相关专业

有自然语言处理、语音合成与识别、音乐生成等研究或者技术背景优先
有预训练技术,包括但不限于高效训练、强化学习,参与过研发音频、NLP相关的预训练模型及其下游应用者优先
熟练掌握PyTorch等深度学习框架,Python编程语言
发表过领域会议文章(NeurIPS、ICML、ICLR、ACL、Interspeech、ICASSP等)、相关经验或者ACM竞赛获奖者优先

工作职责

参与研发多模态模型等下一代人工智能核心技术

关注和推进技术在业务场景中的广泛应用,包括但不限于语言、音乐、语音、音频的生成与理解等
深入调研和关注音频/NLP/多模态等方向的前沿技术

AI 洞察

优缺点分析

优点

  • 技术前沿:参与多模态、语音合成等AI核心领域,紧跟行业最前沿
  • 平台优势:字节跳动拥有海量数据和丰富业务场景,技术落地机会多
  • 薪资优厚:大厂核心岗位,薪酬福利具有竞争力
  • 成长快速:团队技术氛围浓厚,能与优秀同事共同进步
  • 技术更新快:需要持续学习,保持对前沿技术的敏感度
  • 竞争激烈:岗位热门,招聘门槛高,需有扎实的科研或项目背景
  • 适合对AI研究充满热情、具备扎实的深度学习基础,并希望在语音、多模态领域深耕的技术型人才

缺点 / 挑战

  • 工作强度大:互联网大厂节奏快,可能面临较高的工作压力和加班

角色解读

  • 技术线:从算法工程师成长为技术专家,主导核心模块研发
  • 管理线:转向团队Leader或技术经理,带领团队攻克难题
  • 跨领域:向多模态、AI产品经理或AI架构师方向发展
  • 研发豆包大模型中的语音合成算法,优化模型效果与推理效率
  • 参与多模态模型的设计与训练,探索语音、文本、图像等模态的融合技术
  • 跟踪前沿技术,将最新研究成果(如高效训练、强化学习)应用于实际业务场景
  • 扎实的深度学习基础,熟练掌握PyTorch等框架
  • 熟悉语音合成、自然语言处理或相关领域,有预训练模型经验者优先
  • 良好的编程能力,精通Python
  • 具备科研能力,有顶会论文或竞赛获奖经历更佳

申请策略

  • 关注字节跳动Data团队的招聘动态,了解具体业务方向
  • 面试前准备一段关于多模态或语音合成的技术分享,展示深度思考
  • 突出语音合成、NLP或多模态相关的项目经验,尤其是模型训练和优化细节
  • 强调顶会论文、专利或ACM竞赛获奖等科研成果
  • 展示熟练使用PyTorch、Python的能力,可附GitHub链接
  • 如有预训练模型或强化学习相关经历,务必详细描述
  • 系统学习语音合成经典模型(如Tacotron、WaveNet)及最新进展
  • 熟悉高效训练技巧(混合精度、分布式训练等)和强化学习在NLP中的应用

面试指南

  • STAR法则:清晰描述项目背景、任务、行动和结果,突出技术难点与创新
  • 技术思维:讲清原理(Why)和应用场景(How),并结合自身经验给出具体方案
  • 批判性思考:主动讨论权衡与局限性,展现深度理解
  • 请介绍你之前参与过的语音合成或NLP项目,并说明你的贡献
  • 如何优化Transformer在语音合成中的推理速度?
  • 你如何理解多模态模型的训练难点?
  • 请解释预训练模型中的高效训练策略(如LoRA、FlashAttention)
  • 如果你面临模型效果与推理效率的权衡,你会如何决策?

职位点评

74
综合评分

大厂核心算法,前沿技术栈,薪资优厚,但工作强度较大。

更适合这类人
最适合重视技术成长和高薪资,能够接受高强度工作的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利

85较高

薪资具有竞争力,福利完善,大厂平台稳定,补偿性动机满足度高。

薪资信号偏高 (25K-45K/月)

成长发展

90较高

岗位技术前沿,涉及多模态与语音合成,成长空间大,能快速积累核心技能。

技术前沿前沿/新兴技术
技术栈多模态、语音合成、NLP、PyTorch、强化学习
业务类型ambiguous

工作生活

50较低

要求现场办公,未提及弹性工作,大厂通常加班较多,生活化动机满足度一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值

70中等

推动AI技术创新,有一定社会价值,但未明确使命感导向,行业前景好。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 税务合规专家

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 测试开发工程师-客服中台-北京

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 安全检测工程师-安全与风控

    字节跳动 · 杭州市
    AI 估算 · 20k-35k
  • 高级测试开发工程师-抖音

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 大模型训练存储系统专家-Seed

    字节跳动 · 杭州市
    AI 估算 · 50k-80k

相似职位推荐

  • 微信支付-大模型风控算法工程师

    腾讯 · 深圳市
    AI 估算 · 35k-60k
  • 魔方工作室-动作生成算法工程师-角色动画方向

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 运动健康算法工程师-实习-2027届

    小米 · 深圳市
    AI 估算 · 5k-8k
  • Principal Algorithm Engineer

    采埃孚 · 上海市
    AI 估算 · 50k-80k
  • Lead Engineer, Modeling & Simulation

    特灵 · 上海市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • 税务合规专家

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 测试开发工程师-客服中台-北京

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 安全检测工程师-安全与风控

    字节跳动 · 杭州市
    AI 估算 · 20k-35k
  • 高级测试开发工程师-抖音

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 大模型训练存储系统专家-Seed

    字节跳动 · 杭州市
    AI 估算 · 50k-80k

相似职位推荐

  • 微信支付-大模型风控算法工程师

    腾讯 · 深圳市
    AI 估算 · 35k-60k
  • 魔方工作室-动作生成算法工程师-角色动画方向

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 运动健康算法工程师-实习-2027届

    小米 · 深圳市
    AI 估算 · 5k-8k
  • Principal Algorithm Engineer

    采埃孚 · 上海市
    AI 估算 · 50k-80k
  • Lead Engineer, Modeling & Simulation

    特灵 · 上海市
    AI 估算 · 25k-40k