Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
顶尖应届-垂域Agentic大模型算法工程师-AI实验室
立即应聘

顶尖应届-垂域Agentic大模型算法工程师-AI实验室

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
无经验要求
全职员工
仅现场办公
博士
研究与开发 (研发)
PyTorch
强化学习
TensorFlow
多模态
大模型
知识注入
PPO
DPO
Grpo

AI 估算 · 25k–45k

博士应届,大模型前沿方向,小米AI实验室,薪资竞争力强。

职位详情

关于这个职位

该职位负责垂域Agentic大模型在工业、汽车质量等专业场景的落地与优化,包括知识注入、强化微调、多模态对齐等

你需要跟踪前沿技术,提升模型推理准确率,降低幻觉,并输出高质量技术文章
适合对LLM和Agent技术有深入研究且动手能力强的博士应届生

最低要求

博士,计算机,数学等相关专业,具备LLM,AIGC,深度学习,强化学习等相关专业知识,对主流大模型技术有一定了解及掌握

具备一定的AI工具使用能力,包括但不限于claude code,codex,Cursor等AI编程工具的使用
熟悉Agentic RL,Agentic Memory,Harness等主流技术研究方向,并在相关技术上有过探索及落地者优先
精通常用深度学习框架tensorflow、pytorch等,熟练掌深度学习优化技巧,了解大模型的预训练,指令微调,强化微调PPO,DPO,GRPO等,有大模型优化的实践经验者优先
对大模型行业应用落地有深入思考,追踪大模型前沿技术动态,并有比较强的动手实践能力,在顶会上有大模型相关paper者优先

工作职责

参与大模型在垂域的应用及垂域龙虾落地,包括垂域Agentic大模型的迭代优化,例如垂域知识注入,强化微调,多模态对齐,垂域harness优化,模型自进化等相关技术的模型优化

结合工业,汽车质量等专业场景,提升汽车Agentic大模型在垂域场景的推理准确率,降低幻觉,具备专家级的诊断及推理能力
跟踪前沿大模型技术进展,在相关业务场景上应用落地,以及持续迭代优化,同时输出高质量技术文章

AI 洞察

优缺点分析

优点

  • 处于大模型与Agent技术最前沿,技术积累含金量高
  • 小米AI实验室平台资源丰富,有工业级场景落地,研究与实践结合紧密
  • 博士应届起点高,薪酬和成长空间大
  • 大模型领域竞争激烈,技术迭代快,需要持续高强度的学习和产出
  • 适合对LLM和Agent有浓厚兴趣、具备扎实深度学习基础、希望在前沿领域快速成长的博士应届生

缺点 / 挑战

  • 工作地点在北京,现场办公,可能需要适应较大工作压力
  • 对动手能力和论文发表有较高要求,项目落地周期可能较长

角色解读

  • 从算法研究员成长为垂域大模型专家,主导核心技术突破
  • 可向AI技术经理或首席科学家方向发展,负责实验室技术战略
  • 有机会转向产品化落地,成为AI解决方案架构师
  • 负责垂域Agentic大模型的迭代优化,包括知识注入、强化微调、多模态对齐等模型优化工作
  • 结合工业和汽车质量场景,提升模型推理准确率,降低幻觉,实现专家级诊断能力
  • 跟踪大模型前沿技术,在业务中应用落地并持续优化,同时输出高质量技术文章
  • 扎实的深度学习和LLM理论基础,熟悉预训练、指令微调、PPO/DPO/GRPO等强化微调技术
  • 精通TensorFlow或PyTorch,具备模型优化实践经验
  • 熟悉Agentic RL、Agentic Memory等主流研究方向,并有探索或落地经验者优先
  • 具备使用AI编程工具(如Claude Code、Cursor)进行高效开发的能力

申请策略

  • 面试前深入了解小米AI实验室的业务方向,尤其是汽车AI应用
  • 准备1-2个自己主导的大模型优化案例,用数据展示效果提升
  • 突出大模型相关的项目经验,尤其是Agent、RL、多模态等方向的实际落地案例
  • 强调顶会论文发表或预印本,展示研究深度
  • 写明TensorFlow/PyTorch等框架的使用熟练度,以及PPO/DPO等模型的调优经验
  • 如果使用过AI编程工具(如Cursor),请单独列出
  • 系统学习Agentic RL和Harness评估框架,动手复现相关论文
  • 熟悉大模型推理优化技术(如vLLM、量化),提升工程能力

面试指南

  • 针对技术对比类问题,先明确概念定义,再阐述关键差异,最后结合自身经验举例
  • 对于开放性问题(如前景、挑战),采用“背景-问题-方案-总结”的结构,展现思考深度
  • 请详细描述你参与过的一个大模型微调项目,包括技术选型和效果评估
  • PPO和DPO的核心区别是什么?在垂域应用中如何选择?
  • 如何评估和降低大模型的幻觉?请结合具体场景说明
  • Agent中的记忆机制如何设计?你了解的Memory结构有哪些?
  • 你对Agentic RL的前景怎么看?在工业场景中落地有哪些挑战?
  • 复习强化学习基础(PPO、DPO、GRPO等),准备1-2个自己动手调优的案例

匹配度报告

70
综合匹配度

顶尖前沿技术,高成长高回报,但工作强度和不确定性较大。

适合人群
适合极度追求技术成长、愿意投入高强度工作、希望站在AI前沿的博士应届生。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展95
工作生活40
使命价值75

薪资福利匹配

70中等

薪资未在JD中明确,但小米上市且AI实验室为前沿部门,预计薪资竞争力较强,福利完善。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

95较高

该职位处于大模型与Agent技术最前沿,涉及强化微调、多模态等新技术,成长空间极大。

技术前沿前沿/新兴技术
技术栈LLM、Agent、RL、PPO、DPO、GRPO、多模态、TensorFlow、PyTorch
业务类型ambiguous

工作生活匹配

40较低

北京现场办公,未提及弹性工时或远程,且大模型研发通常强度较大。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

服务于汽车质量等专业场景,提升行业智能化水平,具有一定社会价值,但以技术驱动为主。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-高级材料工程师 (功能材料)-手机

    小米 · 北京市
    AI 估算 · 25k-45k

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-高级材料工程师 (功能材料)-手机

    小米 · 北京市
    AI 估算 · 25k-45k