Xiaomi logo
小米
顶尖应届-决策规划大模型算法研究员-自动驾驶

顶尖应届-决策规划大模型算法研究员-自动驾驶

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
无经验要求
全职员工
仅现场办公
硕士
研究与开发 (研发)
深度学习
强化学习
LLM
自动驾驶
VLM
CNN
决策规划
LSTM
GRU

AI 估算 · 25k–40k

北京小米自动驾驶算法岗,硕士应届,结合行业及大厂薪资水平,月薪在25-40K区间。

职位详情

关于这个职位

该职位面向顶尖应届毕业生,专注于自动驾驶领域的决策规划与大模型算法研究

你将参与开发基于模型的决策规划系统,解决城市与高速场景下的交互决策和轨迹规划问题,同时探索大规模强化学习在自动驾驶中的应用,实现从虚拟环境到真实世界的部署
适合具有扎实C++和深度学习基础、对自动驾驶算法充满热情的优秀应届生

最低要求

计算机、自动化、数学、自动驾驶等相关方向硕士及以上学历

熟练掌握linux下C++开发,良好的数据结构和算法基础,熟练使用agentic coding
熟悉深度学习框架,熟悉CNN、LSTM、GRU、Transformers等网络结构及其训练
以下三点需满足至少一点:
熟悉常见的基于模型的规控与端到端算法
熟悉常见的大规模强化学习算法,并有在自动驾驶中的实践经历
熟悉常见的LLM/VLM模型,并有在自动驾驶中的对齐的经历

工作职责

开发基于模型的决策规划系统,解决城市、高速等场景下的交互决策、轨迹规划问题

开发大规模强化学习算法与系统,完成Agent在虚拟环境中的训练以及Sim2Real的部署
课题名称:超大规模强化学习及在自动驾驶中的应用
课题内容:研究各种Zero范式在Physical AI中的应用,探索Self-Play在海量算力支持下的能力边界

优先资格

有较强的研究能力,如在顶会发表过论文

在ACM-ICPC、TopCoder等竞赛中获得过优异成绩
有NLP、多模态方面的学术或者项目经历,有大模型实践经验

AI 洞察

优缺点分析

优点

  • 小米作为大型科技公司,自动驾驶业务投入巨大,提供海量数据和算力支持
  • 涉及大模型、强化学习等前沿技术,个人技术成长空间广阔
  • 面向顶尖应届生,公司有完善的培养体系,与优秀团队共事
  • 自动驾驶算法复杂度高,需要同时掌握规控、强化学习、大模型等多领域知识
  • 对工程能力要求高,需要扎实的C++和系统设计能力

缺点 / 挑战

  • 工作强度较大,项目交付压力明显,需要适应快速迭代的研发节奏
  • 适合具有扎实编程和深度学习基础、对自动驾驶充满热情、渴望挑战前沿技术并愿意在强竞争环境中成长的顶尖应届生

角色解读

  • 从算法研究员成长为自动驾驶领域的专家,主导核心决策规划系统的设计与迭代
  • 向技术负责人(Tech Lead)发展,带领团队攻克自动驾驶L4/L5级难题
  • 转向研究方向,在顶会发表论文,推动大模型与强化学习在自动驾驶的前沿应用
  • 开发基于模型的决策规划系统,处理自动驾驶中城市与高速场景的交互决策和轨迹规划
  • 设计和实现大规模强化学习算法,在虚拟环境中训练智能体并部署到真实车辆
  • 研究与探索Zero范式、Self-Play等技术在Physical AI中的应用,借助海量算力提升模型能力
  • 精通C++编程和Linux环境,具备扎实的数据结构与算法基础,熟悉agentic coding
  • 深入理解深度学习框架及常见网络结构(CNN、LSTM、GRU、Transformer等),掌握训练流程
  • 至少熟悉规控与端到端算法、大规模强化学习、LLM/VLM中的一个方向,并有相关实践

申请策略

  • 了解小米自动驾驶的技术路线和公开成果,在面试中展现对业务的关注
  • 准备一个与自动驾驶决策或强化学习相关的项目/论文案例,能清晰阐述技术细节和贡献
  • 突出C++编程能力和数据结构算法基础,尤其是实际项目或竞赛中的代码质量
  • 强调深度学习项目经验,包括使用的框架、网络结构和训练技巧
  • 如果有自动驾驶相关经历(规控、强化学习、LLM/VLM应用),务必详细描述
  • 加分项:顶会论文、ACM竞赛获奖、多模态或大模型实践经验
  • 深入复习C++和算法,练习高性能编码和agentic coding技巧
  • 如果缺乏自动驾驶背景,可快速补强基于模型的规控或强化学习基础

面试指南

  • 对于技术对比类问题,先明确概念,再分点列出差异,最后结合上下文给出自己的见解
  • 对于项目经历问题,使用STAR法则:背景、任务、行动、结果,并重点强调技术难点和个人贡献
  • 对于开放性设计问题,提出假设,分步骤分析,并给出可落地的方案,展现系统性思考
  • 请解释一下基于模型的决策规划与传统端到端方法的区别及各自的优缺点
  • 描述一次你使用强化学习解决实际问题的经历,包括算法选型、训练过程和结果
  • 你如何理解Zero范式?它在自动驾驶中可能的应用场景有哪些?
  • 如何在C++中高效实现一个轨迹规划算法?请举例说明数据结构和优化技巧
  • 你对Transformer在自动驾驶中的应用有什么看法?如何将LLM/VLM与决策规划结合?

匹配度报告

71
综合匹配度

小米自动驾驶顶尖应届岗,前沿技术栈,高成长性,但工作强度大、WLB不明。

适合人群
适合追求技术成长和前沿研究、能接受高强度工作的顶尖应届生。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活50
使命价值75

薪资福利匹配

70中等

该职位提供大厂薪资和福利,但具体待遇未明确,且应届生起薪有竞争力但并非最高。

薪资信号未披露(AI估算:25K-40K/月)

成长发展匹配

90较高

职位涉及自动驾驶前沿技术(大模型、强化学习),公司有丰富资源,成长空间极大。

技术前沿前沿/新兴技术
技术栈C++、深度学习、CNN、LSTM、GRU、Transformer、强化学习、LLM、VLM、自动驾驶
业务类型profit_center

工作生活匹配

50较低

北京现场办公,无明确WLB信息,自动驾驶研发通常压力较大。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

75中等

自动驾驶是高速增长赛道,对社会交通效率和安全有积极影响,但职位本身偏技术实现,使命感一般。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs