Xiaomi logo
小米
顶尖应届-视觉生成大模型算法工程师-大模型

顶尖应届-视觉生成大模型算法工程师-大模型

发布于 大约 16 小时前

普通员工/个人贡献者

武汉市
无经验要求
全职员工
仅现场办公
硕士
研究与开发 (研发)
深度学习
PyTorch
TensorFlow
视频编辑
扩散模型
图像编辑
CVPR
Agent系统
画质优化

AI 估算 · 20k–30k

小米武汉顶尖应届算法岗,薪资在行业中上水平,结合公司规模和城市消费,月薪预计2-3万。

职位详情

关于这个职位

该职位是小米视觉生成大模型方向的算法工程师岗位,面向顶尖应届生

你将参与图像视频生成与编辑大模型的研发,包括画质优化、效果调优和Agent系统开发,探索前沿技术并推动落地
适合有扎实深度学习基础和视觉生成研究背景的同学

最低要求

计算机、人工智能、机器学习、自动化、数学等相关专业硕士学历,视觉生成与编辑大模型相关方向

扎实的编程能力,熟练使用Agent coding,熟练掌握PyTorch、TensorFlow等至少一种常用深度学习框架
扎实的视觉生成大模型算法基础,深度参与过该领域的算法研究或应用项目,具备跟进领域前沿和算法创新的能力
有好奇心和责任心,良好的沟通协作能力及团队合作精神

工作职责

参与视觉生成与编辑相关的大模型算法研发,包括图像编辑模型、视频编辑模型、图像视频画质优化、重点场景效果优化、性能与效果平衡、高可控生成等,探索领域前沿,持续创新,打造有影响力的高水平技术

图像视频编辑Agent系统研发

优先资格

在CVPR/ICCV/ECCV/AAAI/ICLR/ICML/NeurIPS/T-PAMI等顶会顶刊发表过视觉生成大模型相关得高水平论文并对论文有实际贡献和深刻理解

以主力身份参加相关领域主流算法竞赛且取得优秀成绩
以主要贡献者身份参与过视觉生成、大模型相关的高影响力项目

AI 洞察

优缺点分析

优点

  • 小米是知名大厂,平台大、资源足,能够接触海量数据和真实业务场景
  • 视觉生成是AI前沿方向,技术成长快,个人价值提升显著
  • 团队氛围好,有资深专家指导,适合应届生快速积累经验
  • 技术迭代迅速,需要持续学习和跟进最新论文,工作强度不低
  • 作为应届生可能需要时间适应从学术研究到工业落地的转变
  • 这个职位适合对视觉生成有浓厚兴趣、有扎实研究基础、渴望在大平台做前沿技术的顶尖应届生

缺点 / 挑战

  • 竞争激烈,对算法创新能力和工程实现要求高,压力较大

角色解读

  • 从算法工程师成长为视觉生成领域的技术专家,主导核心算法方向
  • 向技术管理方向转型,带领团队攻克难题,推动项目落地
  • 横向拓展到多模态、Agent等更广泛的AI领域,成为复合型人才
  • 参与图像视频生成与编辑大模型的研发,包括模型设计、训练和优化
  • 负责重点场景的效果调优和性能平衡,推动算法在实际业务中落地
  • 研发图像视频编辑的Agent系统,实现自动化和智能化编辑能力
  • 扎实的编程能力,熟练使用Python和深度学习框架如PyTorch或TensorFlow
  • 深入理解视觉生成大模型(如扩散模型、GAN等),有相关研究或项目经验
  • 具备算法创新和跟进前沿技术的能力,能够独立解决复杂问题

申请策略

  • 了解小米在AI方向的战略布局,尤其是视觉生成的应用场景(如手机相机、智能家居)
  • 在面试中展现对前沿技术的热情和独立思考能力,结合实际案例说明自己的贡献
  • 重点突出在视觉生成大模型方向的研究成果,如顶会论文、开源项目或竞赛成绩
  • 详细描述参与的项目角色和贡献,强调算法创新和落地效果
  • 展示编程和框架使用能力,包括Agent coding相关经验
  • 提前复习扩散模型、Transformer等主流视觉生成架构的原理和实现
  • 补充Agent系统相关知识,了解如何将大模型与工具调用结合
  • 刷题准备手撕代码,重点训练Python和深度学习框架的熟练度

面试指南

  • 对于原理类问题,先清晰定义概念,然后分步骤讲解,最后结合自己的理解补充优化方向
  • 对于项目经验类问题,使用STAR法则(情境-任务-行动-结果)结构化描述,突出个人贡献和思考
  • 对于开放式设计问题,先拆解需求,提出多种方案并对比优缺点,最后给出推荐方案
  • 请详细讲解扩散模型的训练和采样过程,以及如何加速生成
  • 你之前做过哪些视觉生成项目?遇到的最大技术挑战是什么?如何解决的?
  • 如何评估生成图像的质量?你会从哪些方面优化?
  • 你对Agent系统有什么理解?如何设计一个图像编辑Agent?
  • 请现场用PyTorch实现一个简单的图像生成模块

匹配度报告

72
综合匹配度

小米武汉视觉生成大模型算法岗,前沿技术、薪资优厚,但工作强度可能较大。

适合人群
这个职位最适合追求技术成长和前沿创新的求职者,愿意投入时间在研发上。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值70

薪资福利匹配

80较高

小米作为已上市大厂,提供有竞争力的薪资和福利,但JD未明确列出具体福利,整体薪酬预期较高。

薪资信号偏高 (20K-30K/月)

成长发展匹配

90较高

视觉生成大模型是AI前沿技术,团队资源丰富,个人成长空间大,但JD未明确提及晋升通道。

技术前沿前沿/新兴技术
技术栈视觉生成大模型、PyTorch、TensorFlow、扩散模型、Agent
业务类型profit_center

工作生活匹配

50较低

武汉工作,现场办公模式,未提及弹性工作或福利,考虑到大厂算法岗的普遍强度,WLB可能一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AI行业高速增长,视觉生成技术有广泛社会影响,但JD未强调使命感,整体社会贡献中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs