Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Kunlun Tech logo
昆仑万维
音频算法
立即应聘

音频算法

发布于 大约 2 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
深度学习
PyTorch
TensorFlow
音频信号处理
语音合成
声学建模
TTS
音频分离
情感合成

AI 估算 · 30k–55k

北京高级音频算法岗,TTS全链路经验稀缺,上市大厂薪资有竞争力,月薪3万起步。

职位详情

关于这个职位

该职位负责影视级音频智能处理,包括音频分离与情感语音合成

你将参与构建高精度音频分离算法,实现人声、伴奏、音效的精准剥离,并主导TTS系统研发,突破情感控制与细粒度音色建模
适合对音频技术和AI有浓厚兴趣、追求技术挑战的算法工程师

最低要求

学历与专业:硕士及以上学历,计算机科学、语音信号处理、声学、人工智能等相关专业

技术能力:精通音频信号处理与深度学习,熟练掌握 PyTorch/TensorFlow,具备音乐源分离(MSS)或语音增强实战经验
必须具有 TTS 全链路研发经验,熟悉声学模型及情感控制,掌握细粒度韵律建模或音色克隆技术
熟练掌握 Python/C++,具备大规模音频数据处理
具备良好的团队协作能力与跨部门沟通主动性,对音质敏感度高,能快速跟进语音合成与计算听觉领域的前沿进展,推动算法在影视工业化场景中的创新应用

工作职责

影视音频智能解构与分离:针对影视剧复杂声学场景(背景音乐、环境音效、多人对白、混响干扰),研发高精度音频分离算法,实现人声(Vocal)、伴奏(Accompaniment)、音效(SFX)的像素级剥离

构建音轨级语义标签体系(情绪标签、声纹身份、场景声学特征),为后期制作提供可编辑的多轨结构化素材
情感化语音合成与音色建模:主导 TTS(文本到语音)系统的架构设计与算法创新,重点突破情感可控合成与微粒度发声细节建模(如气息控制、语调转折、停顿韵律、方言口音)
搭建高质量影视级配音语料库,建立脚本-声学特征对齐的训练样本,持续迭代提升合成语音的自然度、表现力与角色适配性

AI 洞察

优缺点分析

优点

  • 聚焦影视级音频分离与情感合成,技术复杂度高,能快速积累核心算法经验
  • 昆仑万维作为上市大厂,资源丰富,项目落地场景明确,技术成果易转化为产品
  • 音频AI人才稀缺,该岗位方向有良好的职业前景和薪资议价能力
  • 需要同时掌握音频分离和语音合成两个子方向,技术覆盖面广,学习曲线陡峭
  • 影视音频场景复杂,对算法精度和鲁棒性要求极高,可能面临大量调优工作
  • 跨部门沟通频繁,需与产品、工程团队紧密协作,对个人沟通能力有要求

缺点 / 挑战

  • 适合对音频AI有热情、擅长深度学习且具备扎实信号处理基础的算法工程师,乐于挑战工业级复杂场景

角色解读

  • 向音频算法专家或技术负责人方向发展,主导核心算法研究
  • 横向拓展至多模态AI、计算机听觉等领域,或转入AI产品化方向
  • 在影视、游戏、元宇宙等场景中深化音频技术应用,成为行业稀缺人才
  • 研发高精度音频分离算法,将影视音频中的背景音乐、环境音效、人物对白等不同成分精准剥离
  • 主导文本到语音(TTS)系统的架构设计与算法创新,实现情感可控、细节丰富的语音合成
  • 构建影视级配音语料库,建立脚本与声学特征的对齐样本,持续优化合成语音的自然度与表现力
  • 精通音频信号处理与深度学习,熟练掌握 PyTorch/TensorFlow 等框架
  • 具备完整的 TTS 全链路研发经验,熟悉声学模型、情感控制及细粒度韵律建模
  • 熟练使用 Python/C++ 进行大规模音频数据处理,有音乐源分离或语音增强实战经验

申请策略

  • 准备一个音频分离或语音合成的demo,展示处理前后对比,更能体现技术实力
  • 面试前了解昆仑万维在影视AI方向的布局,思考如何将个人经验与公司业务结合
  • 突出TTS全链路项目经验,特别是情感控制、韵律建模或音色克隆方面的具体成果
  • 强调音乐源分离或语音增强方面的实战项目,使用量化指标(如SDR、PESQ)展示效果
  • 列举大规模音频数据处理经验,包括数据清洗、特征提取、模型训练等
  • 如果缺乏端到端TTS经验,可先学习开源TTS框架(如VITS、Tacotron2)并复现
  • 深入理解细粒度韵律建模,可研究ProsoSpeech、FastSpeech2等模型
  • 补充计算听觉领域前沿论文,关注ICASSP、Interspeech等会议的最新进展

面试指南

  • 对技术问题采用STAR原则(Situation-Task-Action-Result),先讲背景和目标,再讲具体方法和技术细节,最后用数据说明效果
  • 比较类问题先陈述各方法核心原理,再对比优缺点,最后可结合业务场景给出选择建议
  • 请详细描述你过去的一个TTS项目,包括模型架构、情感控制方法及最终效果
  • 音频分离常用方法有哪些?请比较U-Net、Demucs、Spleeter的原理与优缺点
  • 如何在TTS中实现情感可控?你有了解过哪些细粒度韵律建模技术?
  • 大规模音频数据处理中,如何保证数据质量和多样性?
  • 请谈谈你对语音合成中自然度和表现力平衡问题的理解
  • 复习音频信号处理基础如FFT、STFT、滤波器组,以及深度学习基础如Transformer、CNN、RNN

职位点评

72
综合评分

上市大厂音频算法岗,前沿技术栈,薪资有竞争力,但WLB一般。

更适合这类人
适合追求技术成长、希望在音频AI前沿领域深耕的求职者,对WLB要求不高。
表现最好
成长发展
相对薄弱
工作生活
薪资福利75
成长发展85
工作生活60
使命价值70

薪资福利

75中等

薪资具有竞争力,上市大厂福利较完善,但JD未明确薪资和具体福利,需面试确认。

薪资信号未披露(AI估算:30K-55K/月)

成长发展

85较高

技术前沿性强,涉及音频分离、情感合成等前沿领域,能够快速积累稀缺技能和项目经验,成长空间大。

技术前沿前沿/新兴技术
技术栈音频分离、情感语音合成、TTS、细粒度韵律建模、音色克隆
业务类型ambiguous

工作生活

60中等

仅现场办公,未提及弹性工作或WLB措施,且岗位可能涉及高强度攻关,WLB一般。

工作模式未明确
办公地点未明确
加班情况未提及(无法判断)

使命价值

70中等

影视AI技术具有创新性,能推动影视工业化,但社会影响力更多体现在娱乐产业,整体意义感中等偏上。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

昆仑万维 的其他在招职位

  • 海外增长策略产品

    昆仑万维 · 北京市
    AI 估算 · 25k-40k
  • 文案策划

    昆仑万维 · 广州市
    AI 估算 · 10k-18k
  • AI 社交-算法研究员/专家 - AIGC (NLP)

    昆仑万维 · 北京市
    AI 估算 · 30k-60k
  • 地编设计师

    昆仑万维 · 广州市
    AI 估算 · 10k-20k
  • Agent框架工程师

    昆仑万维 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • Product Engineer

    采埃孚 · 上海市
    AI 估算 · 12k-25k
  • Algorithm Engineer

    采埃孚 · 上海市
    AI 估算 · 20k-35k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • Senior R&D Engineer

    魏德米勒 · 苏州市
    AI 估算 · 20k-35k
  • 双电源开关研发结构工程师

    溯高美索克曼 · 杭州市
    AI 估算 · 15k-25k

昆仑万维 的其他在招职位

  • 海外增长策略产品

    昆仑万维 · 北京市
    AI 估算 · 25k-40k
  • 文案策划

    昆仑万维 · 广州市
    AI 估算 · 10k-18k
  • AI 社交-算法研究员/专家 - AIGC (NLP)

    昆仑万维 · 北京市
    AI 估算 · 30k-60k
  • 地编设计师

    昆仑万维 · 广州市
    AI 估算 · 10k-20k
  • Agent框架工程师

    昆仑万维 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • Product Engineer

    采埃孚 · 上海市
    AI 估算 · 12k-25k
  • Algorithm Engineer

    采埃孚 · 上海市
    AI 估算 · 20k-35k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • Senior R&D Engineer

    魏德米勒 · 苏州市
    AI 估算 · 20k-35k
  • 双电源开关研发结构工程师

    溯高美索克曼 · 杭州市
    AI 估算 · 15k-25k