Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/百度/Summer Camp - 大模型平台策略推理优化实习生(J98029)
Baidu logo
B
百度 (Baidu)

职位信息

北京市
初级经验
实习生
仅现场办公
硕士
实习/见习

标签

PyTorch模型量化推理优化SGLangvLLMTensorRT-LLMKv Cache投机推理
💡

核心评价

百度核心AI平台实习,聚焦前沿大模型推理优化,技术成长性极佳,WLB信号不明确。

Summer Camp - 大模型平台策略推理优化实习生(J98029)

🤖 AI 估测:¥8K-15K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个在百度千帆MaaS平台从事大模型推理优化策略设计与落地的实习岗位
你将负责前沿的模型量化、投机推理等训练-推理协同优化方案,目标是持续降低大模型的推理成本并提升效率
适合对Transformer架构、推理框架优化有浓厚兴趣,并希望在大模型工程化领域深入探索的同学

✓工作职责

负责千帆MaaS平台级推理降本与效率优化策略设计与落地
负责量化、投机推理(MTP / speculative decoding / Eagle / DFlash)等训练–推理协同优化方案的设计与落地
前沿技术落地及创新:调研并落地大模型推理多维度优化技术,包括但不限于模型量化(INT4/INT8/FP8,含PTQ/QAT两种方式)、投机推理优化、结构化剪枝与稀疏化等
基于已有的推理方案提出创新性的改进,持续提升推理效率与资源利用率,降低部署成本

⭐最低要求

教育背景: 计算机、人工智能等相关专业硕士及以上学历
编程功底: 熟练掌握 Python、 PyTorch,具备扎实的数据结构与算法基础,具备良好的工程实现能力
大模型经验:熟悉 Transformer 模型结构与推理流程(prefill / decode / KV cache / attention)

👍优先资格

参与过 vLLM / SGLang / TensorRT-LLM 等推理系统优化,熟悉 vLLM/SGLang 等推理框架中的推理实现细节
熟悉 Eagle / Eagle3 / DFlash / Medusa 等投机推理或高效推理方案
有量化感知训练(QAT)或 MTP 训练 实践经验,有大规模线上推理服务优化经验
有大模型训练-推理协同优化方向上的论文或技术报告发表
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • Agent产品经理(J99599)

    百度

    北京市 · 仅现场办公

  • 开发测试工程师(实习生)(J99576)

    百度

    北京市 · 仅现场办公

  • Agent产品经理(J99563)

    百度

    北京市 · 仅现场办公

  • 平台产品经理(J99562)

    百度

    北京市 · 仅现场办公

  • Agent工程架构师(J99561)

    百度

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公