快手的音频大模型评测工程师-【可灵AI专项】薪资是多少？

该职位薪资范围为 30k–50k（人民币/月）。

音频大模型评测工程师-【可灵AI专项】的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求本科学历及中级经验工作经验。

🤖 AI 估测：¥30K-50K

发布时间：21 天前

这是一个专注于音视频生成大模型评测的工程师岗位

你将负责构建和演进评测体系，对音频生成模块及音视频一体化算法的效果进行深度评估与归因分析，驱动核心算法优化

不仅是评测执行者，更是评测体系的架构师，需要设计评测方案、构建行业领先的Benchmark，并参与自动化评测工具的开发

音视频一体化评测体系建设：

1）音频生成与音频理解相关算法、评测方法及评测指标体系具有深入理解，熟悉常见视频与音频质量评估方法，能够结合业务场景设计合理的评测方案

2）建立从底层算子（VAE, Latent Space）到上层生成效果的全链路评测标准

3）定义并量化音画同步性、语义关联度、音频美学表现力等关键维度

Benchmark 与方法论沉淀：

1）构建具有行业领先水平的音频生成 Benchmark，涵盖音乐、环境音、音效（SFX）及人声等

2）沉淀主客观结合的评测方法论，包括客观指标（FAD、KL Divergence、IS、CLAP Score）与专家级主观评价量表（MOS, MUSHRA）

深度诊断与归因分析：输出专业评测报告，深度分析，定位模型缺陷，如针对音频 VAE 压缩失真、音频扩散模型频谱缺失、相位扭曲等问题进行深度诊断，并给出改进建议

前瞻性调研与实验：持续跟踪 AIGC 领域（如 ElevenLabs、Suno、Stable Audio等）前沿技术动态，将行业最新的模型能力和技术路线转化为可落地的评测方案

评测工具与平台化驱动：参与或主导自动化评测工具与平台的开发，利用技术手段提升大规模音视频数据的评测效率，探索基于大模型的自监督评测（LLM-as-a-judge）等创新手段

专业功底：

1）本科及以上学历，有音频相关经验或学历：计算机、人工智能、数字媒体技术、录音工程、音乐制作、音响导演、音频编辑、音乐工程等专业优先

2）具备同期录音、后期混音、配乐制作或SDK声学调校、音质评价等相关领域的学习背景或实践经验，对音频质量的主客观评价有一定的了解

3）熟悉主观音质评价体系，对于各类音频的听评标准有敏感性，有金耳朵认证者优先

4）音/视频生成领域评测方法与指标体系有系统研究或实践经验，有音频类算法评测经验优先（包括TTS、文生音频、V2A、音视频一体化模型等），对常见算法模型及生成模型原理有较好理解，熟悉机器学习模型评估方法与指标，对音视频生成算法原理（如 Diffusion、Transformer、GAN）有较好理解

评测经验：

1）2年及以上算法评测或开发经验

2）有音频生成（TTS/AI 音乐/音效生成）或多模态（Video-to-Audio）评测经验者优先

3）具备良好的数据分析能力与数据化思维，能够通过实验结果进行系统分析并形成结论

工具与技术储备：

1）熟练掌握 Python，熟悉 PyTorch/TensorFlow，能够编写脚本进行大规模数据处理及模型推理

2）熟悉数字信号处理，能熟练使用音频分析工具

加分项：

1）熟悉影视剧音视频制作标准、制作流程，对于不同风格化内容有赏析能力的从业者优先，熟悉乐理，包括但不限于曲风、配器、编曲结构等基础知识，能够从理论的角度对音频内容进行分析和评价者优先

2）对大模型、多模态模型、AIGC技术保持持续关注和强烈兴趣，有实践经验者优先

音频大模型评测工程师-【可灵AI专项】

🤖 AI 估测：¥30K-50K

发布时间：21 天前