字节跳动的音频算法工程师-抖音薪资是多少？

该职位薪资范围为 30k–60k（人民币/月）。

音频算法工程师-抖音的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

字节跳动的音频算法工程师-抖音有什么任职要求？

该职位要求学历未注明学历及中级经验工作经验。

字节跳动

音频算法工程师-抖音

立即应聘

音频算法工程师-抖音

发布于大约 2 个月前

普通员工/个人贡献者

北京市

中级经验

全职员工

仅现场办公

学历未注明

研究与开发 (研发)

Icassp

声纹

多模态

大模型

机器学习

深度学习

音乐理解

音频分类

ASR

AI 估算 · 30k–60k

抖音核心业务，算法岗位技术要求高，市场稀缺，薪资竞争力强。

职位详情

关于这个职位

该岗位是抖音音频算法工程师，核心职责是构建和优化音频理解与生成模型（如ASR、TTS、大模型等），并将前沿技术落地到短视频、直播场景中，提升用户体验

你需要扎实的机器学习基础和编码能力，并有持续学习前沿技术的热情

最低要求

具有扎实的机器学习基础，对音频技术、大模型有深入的理解，数理功底扎实，自学能力强

有扎实的编码能力，熟练使用相关机器学习框架和工程框架

工作职责

负责抖音短视频、直播等场景中的音频理解和生成模型能力建设，包括但不限于ASR、TTS、对话大模型、声纹、音乐理解、音频分类等

跟进前沿的音频大模型技术，负责音频基础模型的预训练和后训练，探索全模态模型建模方案

负责音频技术在抖音产品、推荐中的应用和落地，提升抖音短视频、直播的内容供给和分发体验

优先资格

在多模态大模型领域有经验，在短视频、图文算法领域有经验者优先

在语音、人工智能领域的会议和期刊，如ICASSP、Interspeech、NIPS、ICML、ICLR 等发表过论文，或在相关竞赛中取得优异成绩者优先

AI 洞察

优缺点分析

优点

身处字节跳动抖音核心部门，业务影响力大，项目资源充足
音频大模型是当前AI热点，技术前沿性强，个人成长迅速
薪资待遇优厚，福利完善（如三餐、健身房、期权等）
与顶尖算法工程师合作，学习氛围浓厚
工作强度大，互联网大厂节奏快，可能需要应对紧急项目
竞争激烈，内部晋升需要突出成果

缺点 / 挑战

技术迭代迅速，需要持续学习新知识，压力不小
适合对音频技术有浓厚兴趣、喜欢挑战前沿问题、有扎实算法基础和编码能力的技术型人才

角色解读

技术深度方向：成为音频算法专家，主导核心模型设计和优化，参与顶级会议发表
技术广度方向：转向多模态大模型或全模态研究，成为AI领域的综合型人才
管理方向：带团队负责音频算法方向，晋升为技术Leader或总监
负责音频理解和生成模型的研发，比如ASR、TTS、对话大模型等，支撑抖音短视频和直播场景
跟踪音频大模型前沿技术，进行预训练和后训练，探索全模态模型方案
将音频技术落地到产品中，优化推荐和内容体验，提升用户满意度
扎实的机器学习基础和深度学习框架使用经验（如PyTorch、TensorFlow）
对音频技术有深入理解，熟悉ASR、TTS、声纹等领域的经典方法和最新进展
强大的编码能力和工程能力，能够快速实现和部署模型
有顶会论文或竞赛经验优先，表明研究能力和创新潜力

申请策略

了解抖音产品的音频应用场景，在面试中能提出改进想法
关注字节跳动技术博客和开源项目，体现公司认同感
突出音频相关项目经验，尤其是ASR、TTS、大模型等
强调论文发表或竞赛获奖，证明研究能力
展示编码能力，GitHub项目或开源贡献
如果有短视频/直播相关算法经验，务必写明
深入学习音频大模型（如Whisper、VALL-E等）的原理和实现
熟悉多模态模型，如CLIP、BLIP等

面试指南

对于项目经历，用STAR法则（情境、任务、行动、结果）清晰陈述
对于技术原理问题，从经典方法到前沿进展，体现深度和广度
对于开放性问题，先结构化思考，再给出具体步骤，并注重落地性
请详细讲解你参与过的音频模型项目，难点和解决方案
如何设计一个高效的ASR系统？从声学模型到语言模型
对目前大模型（如GPT-4o）在音频领域的应用有什么看法？
如何评估和优化音频生成模型（如TTS）的质量？
编码题：实现一个Transformer的注意力机制，或处理音频特征

职位点评

综合评分

前沿音频大模型岗位，薪资高、成长快，但工作强度大、WLB差。

更适合这类人

适合追求技术成长和高薪、能接受高强度工作的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展90

工作生活40

使命价值70

薪资福利

80较高

字节跳动薪资在行业内属于顶尖水平，福利完善（如六险一金、免费三餐等），但JD未明确数字，视为市场水准偏上。

薪资信号未披露（AI估算：30K-60K/月）

成长发展

90较高

岗位涉及音频大模型前沿技术，有大量学习和成长机会，JD明确要求跟进前沿技术，属于前沿领域。

技术前沿前沿/新兴技术

技术栈ASR、TTS、大模型、多模态、预训练

业务类型profit_center

工作生活

40较低

字节跳动高强度工作文化，JD未提及WLB或远程，默认现场办公，加班较多，WLB较差。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

音视频算法改善数亿用户体验，社会价值较高，但JD未明确使命导向，行业属于互联网大厂，创新程度高。

行业发展高速增长赛道

社会影响正向社会影响力较高

创新程度积极采用新技术

Watch Jobs

音频算法工程师-抖音

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

软件技术规划SE/专家(手机海外方向)

AI Coding大模型/算法实习

Electrode

Process Engineering Intern

电池安全技师 Battery Safety Technician

字节跳动的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

软件技术规划SE/专家(手机海外方向)

AI Coding大模型/算法实习

Electrode

Process Engineering Intern

电池安全技师 Battery Safety Technician

音频算法工程师-抖音

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

软件技术规划SE/专家(手机海外方向)

AI Coding大模型/算法实习

Electrode

Process Engineering Intern

电池安全技师 Battery Safety Technician

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

软件技术规划SE/专家(手机海外方向)

AI Coding大模型/算法实习

Electrode

Process Engineering Intern

电池安全技师 Battery Safety Technician

字节跳动的其他在招职位

字节跳动的其他在招职位