Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/智谱/AI 院--多模态音频团队--音频生成算法工程师(社招)
GLM logo
G
智谱 (GLM)

职位信息

北京市
中级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

语音识别PyTorchTensorFlow多模态语音合成大模型diffusionASRTTS
💡

核心评价

前沿AI音频算法岗,技术成长性极佳,薪资竞争力强,但工作地点和模式固定。

AI 院--多模态音频团队--音频生成算法工程师(社招)

🤖 AI 估测:¥35K-60K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个专注于多模态音频生成算法的工程师职位
你将负责在Agent场景下,进行音频理解与生成算法的研究、训练和应用落地,具体涉及上下文感知的语音识别、指令控制的语音合成以及全模态理解等前沿方向
同时,你还需要负责模型的大规模分布式训练和高性能推理优化

✓工作职责

负责agent场景下的多模态理解、生成算法研究、训练、应用,包括但不限于context-aware ASR、指令控制TTS、omni understanding等
负责模型的多机多卡训练、高性能推理等

⭐最低要求

硕士及以上学历,计算机、数学、通信等相关专业
具备良好的学习能力、逻辑思维能力、沟通协作能力
有三年及以上语音合成、语音识别算法经验,或三篇及以上顶会论文(各类CCF-A会、ICASSP/INTERSPEECH等)
熟练使用Python和Pytorch/Tensorflow深度学习框架
对以下至少一种熟悉并有相关经验:
1)语音大模型的框架&理论,包括但不限于Diffusion、Vall-E/SpearTTS/AudioLM、MusicLM
2)音频理解大模型/ASR大模型,包括但不限于qwen-audio、sensevoice、whisper等
3)熟悉omni多模态大模型,包括但不限于qwen-omni、mimo-omni、Step‑Audio、Covo‑Audio等

👍优先资格

有业务落地工程经验优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

智谱 的其他在招职位

  • 大模型交付工程师/架构师-北京

    智谱

    北京市 · 仅现场办公

  • 业务拓展实习生

    智谱

    北京市 · 仅现场办公

  • 安卓开发工程师

    智谱

    北京市 · 仅现场办公

  • MaaS-SRE/DBA

    智谱

    北京市 · 仅现场办公

  • 解决方案架构师-深圳

    智谱

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公