Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
音频算法工程师-抖音
立即应聘

音频算法工程师-抖音

发布于 大约 14 小时前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
学历未注明
机器学习
PyTorch
多模态
大模型
ASR
TTS
音频分类
声纹
音乐理解

AI 估算 · 30k–60k

高级音频算法岗,技术要求高,市场稀缺,字节跳动薪资有竞争力,15薪常见。

职位详情

关于这个职位

作为抖音音频算法工程师,你将负责短视频和直播场景中的音频理解与生成模型,涵盖ASR、TTS、对话大模型、声纹等前沿技术,并推动音频大模型在推荐和产品中的落地

该职位需要扎实的机器学习基础和编码能力,适合对音频技术有深入理解且热爱创新的人才

最低要求

具有扎实的机器学习基础,对音频技术、大模型有深入的理解,数理功底扎实,自学能力强

有扎实的编码能力,熟练使用相关机器学习框架和工程框架

工作职责

负责抖音短视频、直播等场景中的音频理解和生成模型能力建设,包括但不限于ASR、TTS、对话大模型、声纹、音乐理解、音频分类等

跟进前沿的音频大模型技术,负责音频基础模型的预训练和后训练,探索全模态模型建模方案
负责音频技术在抖音产品、推荐中的应用和落地,提升抖音短视频、直播的内容供给和分发体验

优先资格

在多模态大模型领域有经验,在短视频、图文算法领域有经验者优先

在语音、人工智能领域的会议和期刊,如ICASSP、Interspeech、NIPS、ICML、ICLR等发表过论文,或在相关竞赛中取得优异成绩者优先

AI 洞察

优缺点分析

优点

  • 拥抱前沿技术(音频大模型、多模态),紧跟行业趋势
  • 字节跳动大平台,海量数据和应用场景,技术影响力大
  • 薪资优厚,福利完善,职业发展通道清晰
  • 业务落地周期快,需要快速迭代和工程化能力
  • 竞争激烈,需要不断产出成果以保持竞争力
  • 适合对音频AI有浓厚兴趣、具备扎实数理和编码基础、渴望在高水平技术团队中快速成长的算法工程师

缺点 / 挑战

  • 技术深度要求高,持续学习压力大

角色解读

  • 技术深耕:成为音频算法领域的专家,主导核心技术突破
  • 架构演进:从算法模型到系统落地,转向技术架构师或技术负责人
  • 横向拓展:结合多模态和全模态,向AI全栈方向成长
  • 负责抖音音频理解和生成模型的研发,包括ASR、TTS、声纹识别等核心技术
  • 跟进音频大模型前沿,进行预训练和后训练,探索全模态模型架构
  • 将音频技术应用于短视频和直播的推荐与内容分发,提升用户体验
  • 扎实的机器学习基础,深入理解音频信号处理和大模型原理
  • 熟练使用PyTorch等框架,具备优秀的编码和工程能力
  • 有语音或AI领域论文发表或竞赛经验者优先

申请策略

  • 了解抖音产品中音频的应用场景,面试时结合具体案例
  • 关注字节跳动在音频AI领域的最新动态,准备相应的技术思考
  • 突出音频或语音相关项目经验,尤其是ASR、TTS、大模型等方向
  • 列出发表的论文或竞赛成绩,展示学术或竞赛能力
  • 强调机器学习框架的使用和工程化能力,如PyTorch、分布式训练
  • 补充多模态大模型知识,了解VLM、全模态模型架构
  • 加强音频信号处理基础,熟悉Wav2Vec、Whisper等开源模型
  • 实践端到端模型训练和部署,提升工程落地经验

面试指南

  • 结构化回答:先明确问题核心,再分步骤阐述技术方案,最后总结优缺点
  • 结合项目经验:用具体案例说明思路,突出难点和解决方案
  • 展现思考深度:不仅回答技术细节,还要体现对业务场景的理解
  • 请详细讲解Transformer在语音任务中的应用及其优缺点
  • 如何设计一个面向短视频场景的音频分类模型?
  • 你如何看待音频大模型的发展趋势?请举例说明
  • 请描述你实现过的ASR系统架构,包括数据、训练和部署
  • 如何平衡模型精度和推理速度在实时场景中的需求?

匹配度报告

70
综合匹配度

字节抖音音频算法岗,前沿技术、高薪高压、成长迅猛。

适合人群
适合追求技术深度和职业成长、愿意在高强度环境中快速迭代的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

字节跳动薪资待遇在行业处于领先水平,福利完善,但JD未明确具体薪资,需面议。

薪资信号面议 (30K-60K/月)

成长发展匹配

90较高

职位涉及前沿音频大模型技术,有丰富的数据和场景支撑,成长空间大。

技术前沿前沿/新兴技术
技术栈ASR、TTS、大模型、多模态、全模态、机器学习
业务类型profit_center

工作生活匹配

40较低

字节跳动工作强度较高,需要应对快速迭代和持续学习,但JD未提及加班情况。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

抖音产品影响数亿用户,音频技术能提升内容质量和用户体验,具有较强社会价值。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • Senior Analytical Scientist

    赫力昂 · 苏州市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • Senior Analytical Scientist

    赫力昂 · 苏州市
    AI 估算 · 25k-40k