
普通员工/个人贡献者
AI 估算 · 30k–60k
高级音频算法岗,技术要求高,市场稀缺,字节跳动薪资有竞争力,15薪常见。
作为抖音音频算法工程师,你将负责短视频和直播场景中的音频理解与生成模型,涵盖ASR、TTS、对话大模型、声纹等前沿技术,并推动音频大模型在推荐和产品中的落地
具有扎实的机器学习基础,对音频技术、大模型有深入的理解,数理功底扎实,自学能力强
负责抖音短视频、直播等场景中的音频理解和生成模型能力建设,包括但不限于ASR、TTS、对话大模型、声纹、音乐理解、音频分类等
在多模态大模型领域有经验,在短视频、图文算法领域有经验者优先
优点
缺点 / 挑战
字节抖音音频算法岗,前沿技术、高薪高压、成长迅猛。
字节跳动薪资待遇在行业处于领先水平,福利完善,但JD未明确具体薪资,需面议。
职位涉及前沿音频大模型技术,有丰富的数据和场景支撑,成长空间大。
字节跳动工作强度较高,需要应对快速迭代和持续学习,但JD未提及加班情况。
抖音产品影响数亿用户,音频技术能提升内容质量和用户体验,具有较强社会价值。