大模型音频算法工程师
🤖 AI 估测:¥35K-60K
发布时间:28 天前
ℹ️关于这个职位
这是一个专注于大模型音频算法研发的前沿技术岗位
你将负责音效生成、编辑、声音分离等AIGC技术在音频领域的应用研究,并探索沉浸式音频、计算声学等先进技术
工作成果将直接落地于小米的汽车、手机、音箱等核心产品线,并有机会发表顶会论文或申请专利
✓工作职责
聚焦音效(V2A,T2VA,空间音频)生成、编辑、声音分离等大模型技术研究,涵盖多模态融合
探索和落地先进的音频处理与计算声学技术,解决复杂声学场景下的核心挑战
包括但不限于:沉浸式音频渲染、声源分离与增强、声场控制与个性化重放等
落地汽车、手机、音箱等小米应用场景,每年发表顶会论文1-2篇或申请专利2-3项
⭐最低要求
硕士及以上学历,计算机、人工智能、声学等相关专业
精通主流的音频生成模型框架(如Diffusion, Transformer, VAE等),并对AIGC领域的最新进展有深入的理解
具备将前沿算法落地到实际产品的完整项目经验,深刻理解模型训练、优化、部署的全链路流程
在音频/语音AIGC(如音效生成、音乐生成)领域有深入的研发经验
👍优先资格
熟悉以下一项或多项技术并有相关项目经验者优先:
空间音频与沉浸式体验技术(如Dolby Atmos, 3D Audio Rendering)
多扬声器重放技术(如声场控制、模拟声浪等)
在相关领域的顶级学术会议或期刊(如ICASSP, INTERSPEECH, NeurIPS, ICML等)发表过论文者优先
有高质量开源项目开发和贡献经验者优先