Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/百度/大模型平台策略推理优化工程师(J97422)
Baidu logo
B
百度 (Baidu)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

PyTorch模型量化推理优化大模型vLLMTensorRT-LLM投机推理
💡

核心评价

百度核心AI平台的前沿技术岗,成长性极佳,薪资竞争力强,但需面对北京现场办公及可能的较高工作强度。

大模型平台策略推理优化工程师(J97422)

🤖 AI 估测:¥35K-60K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型推理性能优化的技术岗位
你将负责百度千帆MaaS平台的推理降本与效率优化策略,涉及量化、投机推理等前沿技术的落地,并建设相关的性能评测体系
核心目标是持续提升大模型推理效率,降低部署成本

✓工作职责

负责千帆MaaS平台级推理降本与效率优化策略设计与落地,并支持定制化推理性能优化
负责量化、投机推理(MTP / speculative decoding / Eagle)等训练–推理协同优化方案的设计与落地
负责建设大模型推理性能评测与收益评估体系
前沿技术落地:调研并落地大模型推理多维度优化技术,包括但不限于模型量化(INT4/INT8/FP8,含PTQ/QAT两种方式)、MTP投机推理优化、结构化剪枝与稀疏化等,持续提升推理效率与资源利用率,降低部署成本

⭐最低要求

教育背景:计算机、人工智能等相关专业本科及以上学历
编程功底:熟练掌握 Python、 PyTorch,具备扎实的数据结构与算法基础,具备良好的工程实现能力
大模型经验:熟悉 Transformer 模型结构与推理流程(prefill / decode / KV cache / attention),理解推理性能瓶颈及其与训练策略(量化、蒸馏、MTP)的关联

👍优先资格

参与过 vLLM / SGLang / TensorRT-LLM 等推理系统优化
有量化感知训练(QAT)或 MTP 训练 实践经验
熟悉 EAGLE / Medusa / MTP variants(如DeepSeek MTP、MiMo MTP) 等投机推理或高效推理方案
有大规模线上推理服务优化经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • Agent产品经理(J99599)

    百度

    北京市 · 仅现场办公

  • 开发测试工程师(实习生)(J99576)

    百度

    北京市 · 仅现场办公

  • Agent产品经理(J99563)

    百度

    北京市 · 仅现场办公

  • 平台产品经理(J99562)

    百度

    北京市 · 仅现场办公

  • Agent工程架构师(J99561)

    百度

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公