Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/智谱/AI院-GLM后训练团队-推理优化/推理Infra工程师(RL)
GLM logo
G
智谱 (GLM)

职位信息

北京市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorch性能分析NCCLGPU推理推理优化SGLangRL训练分布式通信
💡

核心评价

技术前沿、成长性极佳的大模型推理系统岗,薪资竞争力预期良好,但工作模式为现场办公。

AI院-GLM后训练团队-推理优化/推理Infra工程师(RL)

🤖 AI 估测:¥35K-60K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型推理系统优化的工程师职位
你将负责开发和优化基于SGLang的推理引擎,提升服务吞吐、降低延迟与成本,并保障线上稳定性
同时,你需要支持强化学习(RL)训练中的推理链路,与算法团队协作,将模型需求落地为高效、可维护的推理系统

✓工作职责

基于SGLang进行大模型推理引擎与服务侧开发,提升吞吐、降低时延与成本,保障线上稳定性
支持RL训练相关的推理链路,包括rollout生成、打分/奖励模型推理等,优化训练闭环效率与资源利用
建设推理侧的监控与性能分析能力,参与线上问题定位与故障处理
与算法/训练团队协作,将模型与训练需求落地到可运行、可维护的推理系统,并输出必要的技术文档

⭐最低要求

熟练使用Python/C++(至少一种),具备良好的工程能力与性能意识
熟悉GPU推理与常见深度学习框架(如 PyTorch),了解分布式通信与并行基本概念(NCCL 等)
了解并使用过SGLang(或能快速上手并承担核心模块开发与调优)
理解RL训练中推理侧的作用,能够与训练流程协同推进落地
具备线上系统排障能力,能通过日志/指标定位性能与稳定性问题

👍优先资格

有大模型推理系统、RLHF/RL 推理链路或训练-推理协同经验
有推理性能profiling、算子/运行时优化经验
有MoE模型优化经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

智谱 的其他在招职位

  • 大模型交付工程师/架构师-北京

    智谱

    北京市 · 仅现场办公

  • 业务拓展实习生

    智谱

    北京市 · 仅现场办公

  • 安卓开发工程师

    智谱

    北京市 · 仅现场办公

  • MaaS-SRE/DBA

    智谱

    北京市 · 仅现场办公

  • 解决方案架构师-深圳

    智谱

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公