Xiaomi logo
小米
顶尖应届-OS Agent算法工程师-手机

顶尖应届-OS Agent算法工程师-手机

发布于 大约 15 小时前

普通员工/个人贡献者

深圳市
无经验要求
全职员工
仅现场办公
硕士
研究与开发 (研发)
PyTorch
TensorFlow
预训练
微调
VLM
多模态大模型
Gui Agent
知识增强

AI 估算 · 25k–35k

顶尖应届算法岗,小米深圳,硕士起薪在25-35k/月,15薪合理,技术难度高,薪资有竞争力。

职位详情

关于这个职位

该职位主要面向顶尖应届生,专注于多模态大模型的预训练、微调与部署,并探索知识增强技术提升个性化模型能力

你将参与构建基于端侧VLM的GUI Agent,攻关意图决策大模型,并有机会撰写论文和专利
适合对前沿AI技术有热情、希望在手机端OS智能体方向深耕的同学

最低要求

硕士及以上学历在读,人工智能、计算机科学、电子、信息工程、机器人等专业,有C++/python开发经验

熟练掌握至少一种深度学习框架,如Tensorflow,PyTorch等
对深度学习有深刻认识,熟悉各种神经网络及背后数学原理

工作职责

负责各类多模态大模型的预训练,微调和部署,并应用于实际业务中

探索知识增强技术,通过个人数据提升个性化模型的语言理解和生成能力
融合多模态数据,攻关具备自主观察环境和推断用户需求的意图决策大模型
搭建基于端侧VLM的屏幕理解能力,实现具备泛场景能力的GUI Agent
探索机器学习领域的新技术,探索与其他领域的技术融合
并撰写相关论文,专利

优先资格

对大模型有设计应用经验者优先

对声音、图像、视频、各类传感器的通用融合感知算法有实际经验的优先
在AI或NLP相关顶级会议或者刊物,如ICML,NeurIPS,AAAI,ACL等发表论文者优先

AI 洞察

优缺点分析

优点

  • 小米平台大、资源多,手机端AI应用场景丰富,项目落地性强
  • 多模态大模型是当前AI热点,技术积累含金量高,职业前景广阔
  • 顶尖应届岗,公司重视培养,有论文专利产出机会
  • 深圳科技氛围浓厚,薪资待遇在应届生中具有竞争力
  • 涉及多模态、端侧、知识增强等多个前沿方向,技术难度高,需要持续学习
  • 作为应届生,可能需要快速适应高强度研发节奏
  • 适合对AI大模型有浓厚兴趣、具备较强数理基础和编程能力的顶尖硕士或博士生,尤其是希望在手机端AI方向做出成果的同学

缺点 / 挑战

  • 手机端算力和功耗限制严格,模型优化和部署挑战大

角色解读

  • 从算法工程师成长为多模态大模型专家,主导核心模型研发
  • 向技术主管或架构师方向发展,带领团队攻克技术难题
  • 积累手机端AI应用经验,未来可转向其他端侧智能产品方向
  • 负责多模态大模型的预训练、微调和部署,将模型应用于小米手机的实际业务场景中
  • 通过知识增强技术,利用个人数据提升模型的个性化和意图理解能力
  • 构建端侧VLM的屏幕理解能力,开发能跨场景操作的GUI Agent
  • 探索机器学习前沿技术,撰写论文和专利,推动技术创新
  • 扎实的深度学习基础,熟悉Transformer、CNN等主流神经网络及数学原理
  • 熟练使用PyTorch或TensorFlow等框架,具备C++/Python开发能力
  • 有多模态大模型(如VLM、LLM)的实践或研究经验优先
  • 了解知识增强、端侧部署、传感器融合等方向

申请策略

  • 在简历或面试中体现对小米手机OS智能体的理解,比如小爱同学、MIUI的AI功能
  • 准备一个完整的项目案例,展示从数据到模型到部署的全流程能力
  • 突出多模态项目或大模型相关经历,如预训练、微调、部署等
  • 展示深度学习框架(PyTorch/TensorFlow)的熟练程度和项目成果
  • 如有顶级会议论文(ICML、NeurIPS等)或竞赛奖项,务必放在显眼位置
  • 强调C++/Python开发能力,尤其是性能优化经验
  • 如果对大模型不够熟悉,建议先跑通开源LLM或VLM项目,理解其原理
  • 学习模型压缩、量化、端侧部署相关技术(如TensorRT、NCNN)

面试指南

  • 对于项目介绍类问题,采用STAR法则(情境、任务、行动、结果),突出个人贡献和技术难点
  • 对于技术原理问题,先阐述基本概念,再举例说明实际应用,避免空洞
  • 对于开放设计问题,展示系统思维:先定义问题边界,再拆解模块,最后给出可行方案
  • 请详细介绍你参与过的一个多模态大模型项目,包括模型架构、训练策略和部署方案
  • 如何将一个大模型部署到手机端?你会考虑哪些优化手段?
  • 谈谈你对知识增强的理解,如何在个性化场景中应用?
  • 自注意力机制的数学原理是什么?如何在Transformer中实现?
  • 如果让你设计一个能识别用户手机操作意图的GUI Agent,你会怎么开始?

匹配度报告

69
综合匹配度

大厂核心AI岗,前沿多模态技术,成长空间大,但工作强度和办公灵活性一般。

适合人群
适合追求技术成长和前沿方向,对薪资和WLB要求不高的顶尖应届生。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值70

薪资福利匹配

75中等

薪资在应届中偏高,且有上市大公司福利保障,但JD中未明确提及具体福利细节。

薪资信号市场水准 (25K-35K/月)

成长发展匹配

90较高

职位涉及多模态、端侧等前沿技术,有论文发表机会,公司平台大,成长空间极高。

技术前沿前沿/新兴技术
技术栈多模态大模型、VLM、GUI Agent、知识增强、PyTorch、TensorFlow、C++、Python
成长机会探索机器学习领域的新技术、撰写相关论文,专利
业务类型profit_center

工作生活匹配

40较低

工作地点深圳,未提及远程或弹性,互联网大厂通常加班较多,WLB一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

行业处于AI热潮中,高速增长,但手机端AI直接社会影响力偏中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs