
小米
顶尖应届-OS Agent算法工程师-手机
顶尖应届-OS Agent算法工程师-手机
发布于 大约 15 小时前普通员工/个人贡献者
北京市
无经验要求
全职员工
仅现场办公
硕士
研究与开发 (研发)
深度学习
PyTorch
TensorFlow
预训练
微调
VLM
多模态大模型
Gui Agent
知识增强
AI 估算 · 25k–40k
北京顶尖校招AI算法岗,多模态大模型方向门槛高、需求紧缺,小米薪资有竞争力,预估25k-40k/月,15薪。
职位详情
关于这个职位
该职位是小米手机部的AI算法岗,面向顶尖应届生,专注于多模态大模型的预训练、微调与部署,以及端侧屏幕理解和GUI Agent的研发
你将参与前沿技术探索,如知识增强和意图决策大模型,并有机会发表论文和专利
适合对AI研究有热情、希望将技术落地到手机产品的同学
最低要求
硕士及以上学历在读,人工智能、计算机科学、电子、信息工程、机器人等专业,有C++/python开发经验
熟练掌握至少一种深度学习框架,如Tensorflow,PyTorch等
对深度学习有深刻认识,熟悉各种神经网络及背后数学原理
工作职责
负责各类多模态大模型的预训练,微调和部署,并应用于实际业务中
探索知识增强技术,通过个人数据提升个性化模型的语言理解和生成能力
融合多模态数据,攻关具备自主观察环境和推断用户需求的意图决策大模型
搭建基于端侧VLM的屏幕理解能力,实现具备泛场景能力的GUI Agent
探索机器学习领域的新技术,探索与其他领域的技术融合
并撰写相关论文,专利
优先资格
对大模型有设计应用经验者优先
对声音、图像、视频、各类传感器的通用融合感知算法有实际经验的优先
在AI或NLP相关顶级会议或者刊物,如ICML,NeurIPS,AAAI,ACL等发表论文者优先
AI 洞察
优缺点分析
优点
- 小米作为头部手机厂商,拥有海量用户数据和丰富的落地场景,技术能快速产品化
- 多模态大模型是AI前沿方向,岗位技术含量高,能积累稀缺的算法经验
- 公司提供稳定的平台和资源支持,有机会发表顶会论文和申请专利,提升个人影响力
- 工作强度可能较大,手机端AI对实时性和资源限制要求高,需要解决工程落地难题
- 技术迭代快,需要持续学习最新研究,保持竞争力
- 适合对AI研究有强烈兴趣、具备扎实深度学习基础、希望将前沿算法落地到千万级设备的顶尖应届生
缺点 / 挑战
- 校招竞争激烈,对候选人学术背景和动手能力要求较高
角色解读
- 从算法工程师起步,深入多模态大模型和端侧AI,成为领域专家
- 可向技术专家(如首席科学家)或技术管理(如算法团队负责人)方向发展
- 积累论文和专利成果后,有机会转岗至更核心的AI研发部门或参与行业标准制定
- 负责多模态大模型的预训练、微调和部署,并将模型应用于手机端实际业务中
- 探索知识增强技术,利用个人数据提升模型的理解和生成能力,实现个性化服务
- 融合图像、声音等多模态数据,构建能够自主观察环境并推断用户需求的意图决策大模型
- 搭建基于端侧VLM的屏幕理解能力,开发具备泛场景能力的GUI Agent,提升手机交互体验
- 扎实的机器学习与深度学习基础,熟悉各种神经网络及数学原理
- 熟练掌握至少一种深度学习框架(TensorFlow或PyTorch),并有实际项目经验
- 具备C++/Python开发能力,能够高效实现算法并优化性能
- 对多模态学习、大模型、知识增强等前沿领域有深入理解或实践经验
申请策略
- 深入了解小米手机AI功能(如小爱同学、智能场景)和手机端硬件限制,在面试中展示对业务的理解
- 准备一个完整的项目案例,从问题定义、方案设计、实验对比到落地效果,体现闭环能力
- 突出机器学习/深度学习项目经历,尤其是多模态、大模型或端侧AI相关经验
- 详细描述在TensorFlow/PyTorch框架下的实战成果,如模型性能提升或应用效果
- 强调发表的论文、专利或参与的顶级会议,展示学术潜力
- 附上GitHub链接或技术博客,体现代码能力和持续学习态度
- 复习Transformer、ViT、CLIP等经典模型,并熟悉LLM/VLM的最新进展(如GPT-4V、LLaVA等)
- 强化Python和C++编程,特别是GPU编程(CUDA)和模型量化、压缩等端侧优化技术
面试指南
- 技术原理类:先解释核心概念,再结合具体应用场景,最后说明自己的理解或改进思路
- 项目经验类:按STAR法则(情境-任务-行动-结果)组织,突出个人贡献和技术难点
- 开放性问题:先明确问题背景,然后分步骤提出解决方案,并考虑优缺点和替代方案
- 请详细讲解Transformer的注意力机制,并说明在多模态应用中如何建模不同模态的关系
- 你如何设计一个基于端侧VLM的屏幕理解模型?需要考虑哪些资源限制?
- 描述一个你参与过的多模态或大模型项目,遇到的主要挑战是什么?如何解决的?
- 对于知识增强技术,你了解哪些方法?如何应用于个性化模型?
- 在模型微调时,如何避免灾难性遗忘?请举例说明
匹配度报告
66
综合匹配度
小米手机部顶尖应届AI岗,前沿多模态大模型方向,技术成长极快但加班可能较多。
适合人群
该职位最适合以技术成长为核心驱动、愿意在高强度下快速积累前沿经验的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活40
使命价值65
薪资福利匹配
70中等
该职位为顶尖校招AI岗,薪资在北京具有较强竞争力,但JD未明确薪资和福利细节,因此补偿性动机满足程度中等偏上。
薪资信号未披露(AI估算:25K-40K/月)
成长发展匹配
90较高
岗位专注于多模态大模型等前沿技术,与行业顶级研究接轨,提供论文和专利产出机会,成长性极强。
技术前沿前沿/新兴技术
技术栈多模态大模型、预训练、微调、VLM、GUI Agent、知识增强、TensorFlow、PyTorch
业务类型ambiguous
工作生活匹配
40较低
职位要求北京现场办公,未提及弹性或远程,且AI算法岗通常加班较多,生活化动机满足程度较低。
工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)
使命价值匹配
65中等
AI应用于手机产品能直接改善用户体验,具有一定社会价值,但总体属于商业驱动,意义感中等。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
小米 的其他在招职位
相似职位推荐
Watch Jobs