Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Baidu logo
百度
Summer Camp - Agentic RL /大模型平台策略推理优化实习生(J100476)
立即应聘

Summer Camp - Agentic RL /大模型平台策略推理优化实习生(J100476)

发布于 大约 8 小时前

实习/见习

北京市
无经验要求
实习生
仅现场办公
学历未注明
实习与临时职位
强化学习
LLM
大模型
SGLang
vLLM
PPO
Mtp
Grpo
Agentic

AI 估算 · 4k–7k

百度实习薪资在北京属于中上水平,该岗位涉及前沿技术,竞争力较强,月薪范围4000-7000元。

职位详情

关于这个职位

加入百度千帆团队,参与大模型平台策略推理优化和Agentic RL训练研究

你将接触到业界最前沿的投机推理加速方案(如MTP、Eagle3)以及真实业务场景下的多步长程agent任务,直接对齐业务效果,不做玩具实验
适合对LLM推理优化或强化学习有浓厚兴趣的同学

最低要求

课题一:希望同学对大模型的结构和推理过程有细致的理解

熟悉 vLLM/SGLang 等推理框架中的推理实现细节
了解主流的投机推理方案技术及实现原理
课题二:希望同学有扎实的强化学习理论基础,熟悉 PPO、GRPO等主流算法,熟悉大语言模型训练流程(SFT → RM → RL),有 RL实践经验,对agentic有系统性理解(工具调用、多步推理、ReAct/function calling)

工作职责

课题一:复现 Deepseek MTP/Mimo MTP/Eagle3/DFlash 等高效的投机推理加速方案,并提出改进方案或全新的投机推理加速方案,进一步加速平台上模型的推理效率

课题二:针对真实业务agent场景(如代码执行、工具调用、多轮对话决策等),构建agentic RL训练闭环,显著提升模型在复杂任务上的成功率与鲁棒性

AI 洞察

优缺点分析

优点

  • 百度千帆是业界领先的MAAS平台,团队技术实力强,能接触到真实业务场景
  • 课题前沿,聚焦大模型推理优化和Agentic RL,职业发展潜力大
  • 团队文化务实,不做玩具实验,成果直接落地,成就感强
  • 对技术基础要求高,需要同时具备LLM和RL背景,学习曲线陡峭
  • 大模型领域变化快,需要持续跟进最新论文和技术
  • 适合对LLM推理优化或强化学习有浓厚兴趣,具备扎实代码和理论基础,希望在大模型实战中快速成长的同学

缺点 / 挑战

  • 实习周期可能较短,需要在有限时间内产出成果,压力较大

角色解读

  • 优秀实习生可获得转正机会,留在百度千帆团队继续从事大模型优化工作
  • 深入理解大模型从训练到部署的全链路,未来可成长为AI系统优化专家或RL算法专家
  • 有机会接触业界最前沿的技术和场景,为后续求职顶尖AI公司积累核心竞争力
  • 参与大模型推理优化,复现并改进主流投机推理方案(如MTP、Eagle3),提升模型推理效率
  • 针对真实业务场景(如代码、工具调用)构建强化学习训练闭环,提升模型在复杂任务上的成功率
  • 与团队协作,将研究成果直接应用于百度千帆平台,实现业务效果的对齐
  • 扎实的深度学习基础,熟悉大模型结构和推理过程
  • 掌握主流RL算法(PPO、GRPO)及大模型训练流程(SFT→RM→RL)
  • 熟悉vLLM/SGLang等推理框架,了解投机推理技术原理

申请策略

  • 在申请材料中表达对百度千帆业务的了解,展示你对实际业务效果的关注
  • 准备一个简短的LLM优化或RL项目介绍,体现你的思考深度和动手能力
  • 突出你在LLM推理或RL方向的项目经验,特别是与投机推理、vLLM、PPO相关的实践
  • 展示你对主流推理框架(vLLM/SGLang)的熟悉程度,可附上GitHub项目或实验复现
  • 强调对agentic任务的理解,如tool calling、ReAct等
  • 如果对投机推理不熟,建议阅读DeepSeek MTP、Eagle3等论文并动手复现
  • 强化RL基础,吃透PPO和GRPO算法,并在开源LLM上实践RL训练流程

面试指南

  • 对于技术原理类问题,从基本概念出发,先给出定义,再展开细节,最后联系实际应用
  • 对于项目经验类问题,使用STAR法则(情境-任务-行动-结果),突出你的贡献和思考
  • 请解释一下投机推理的原理,以及MTP与常规自回归解码的区别
  • 描述PPO算法的核心思想,并说明如何在LLM中应用PPO?
  • 你如何理解Agentic RL?在工具调用场景中,如何设计reward函数?
  • vLLM中是如何实现连续批处理和内存管理的?
  • 请介绍你做过的一个LLM相关项目,遇到了什么挑战?
  • 复习LLM推理优化和RL的基础知识,确保能清晰解释关键概念

职位点评

66
综合评分

百度千帆大模型实习,技术前沿、成长极快,但需现场办公、WLB一般。

更适合这类人
最适合追求技术成长和前沿挑战的求职者,不太适合看重工作生活平衡或短期高薪的同学。
表现最好
成长发展
相对薄弱
工作生活
薪资福利60
成长发展95
工作生活40
使命价值70

薪资福利

60中等

实习薪资属于市场中等水平,百度作为大厂福利完善,但实习岗位稳定性较低,补偿性满足程度一般。

薪资信号未披露(AI估算:4K-7K/月)

成长发展

95较高

该岗位涉及最前沿的大模型推理优化和Agentic RL技术,团队技术氛围浓厚,成长空间极大,发展性满足程度很高。

技术前沿前沿/新兴技术
技术栈大模型、PPO、GRPO、vLLM、SGLang、MTP、投机推理、Agentic RL
业务类型profit_center

工作生活

40较低

实习生需现场办公,无远程选项,工作地点在北京百度大厦,生活成本高,且大模型优化可能需要高强度投入,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

百度千帆平台服务众多企业,技术优化能帮助客户降本增效,具有一定社会价值;AI行业高速增长,使命感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • Agent工程师(J100994)

    百度 · 深圳市
    AI 估算 · 20k-40k
  • 广告算法实习生(J100918)

    百度 · 深圳市
    AI 估算 · 5k-10k
  • 政企销售实习生(J100976)

    百度 · 北京市
    AI 估算 · 4k-7k
  • AI研发工程师(J100861)

    百度 · 北京市
    AI 估算 · 30k-50k
  • 财务分析师(J100973)

    百度 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • AI工程师-intern

    普华永道 · 成都市
    AI 估算 · 4k-7k
  • TAX Intern

    普华永道 · 成都市
    AI 估算 · 2k-3k
  • ABE Expert Intern

    普华永道 · 成都市
    AI 估算 · 2k-4k
  • 商业化欧莱雅组平台专家实习生

    小红书 · 上海市
    AI 估算 · 4k-7k
  • 耐消行业PM实习生

    小红书 · 上海市
    AI 估算 · 3k-5k

百度 的其他在招职位

  • Agent工程师(J100994)

    百度 · 深圳市
    AI 估算 · 20k-40k
  • 广告算法实习生(J100918)

    百度 · 深圳市
    AI 估算 · 5k-10k
  • 政企销售实习生(J100976)

    百度 · 北京市
    AI 估算 · 4k-7k
  • AI研发工程师(J100861)

    百度 · 北京市
    AI 估算 · 30k-50k
  • 财务分析师(J100973)

    百度 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • AI工程师-intern

    普华永道 · 成都市
    AI 估算 · 4k-7k
  • TAX Intern

    普华永道 · 成都市
    AI 估算 · 2k-3k
  • ABE Expert Intern

    普华永道 · 成都市
    AI 估算 · 2k-4k
  • 商业化欧莱雅组平台专家实习生

    小红书 · 上海市
    AI 估算 · 4k-7k
  • 耐消行业PM实习生

    小红书 · 上海市
    AI 估算 · 3k-5k