Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
顶尖应届-具身大模型数据工程师-机器人事业部
立即应聘

顶尖应届-具身大模型数据工程师-机器人事业部

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
无经验要求
全职员工
仅现场办公
学历未注明
研究与开发 (研发)
分布式计算
PyTorch
TensorFlow
视频处理
多模态
VLM
Prompt Engineering
CLIP
自动化标注

AI 估算 · 22k–35k

顶尖应届AI岗位,小米大厂北京,技术门槛高,薪资竞争力强,参考同行应届生水平。

职位详情

关于这个职位

这个职位面向顶尖应届生,负责构建机器人具身大模型的数据处理体系

你将设计千万级视频数据的自动化标注系统,利用视频理解和多模态技术为训练生成高质量数据,并搭建质量评估框架
这是一个前沿技术岗位,能深入接触VLA、VLM等大模型核心环节

最低要求

精通视频处理技术,熟悉动作识别、时间动作定位或视频片段检索等领域

深入理解CLIP、VLM等模型原理,能够熟练运用大模型进行下游数据处理任务,有Prompt Engineering或模型蒸馏经验者优先
精通Python,熟练使用PyTorch / TensorFlow,具备处理PB级视频数据的工程经验,熟悉分布式计算框架(如Ray、Spark)

工作职责

设计并开发支撑千万级机器人视频数据的自动化标注系统

利用视频时空特征、场景切换检测及多模态语义理解技术,实现视频片段的精准边界划分
结合VLM与特定领域模型,为视频自动生成符合VLA训练需求的自然语言描述
构建自动化质量评估体系,利用模型评估、异常检测等手段筛选高质量样本

优先资格

超大规模视频数据处理经验

熟悉3D视觉 / SLAM / 点云数据处理
在NeurIPS / ICLR / ICML / CVPR / ICCV / ECCV等顶会有相关视频理解或多模态成果

AI 洞察

优缺点分析

优点

  • 小米机器人事业部处于具身智能前沿,技术方向有良好发展前景
  • 能接触到大规模视频数据处理和VLM应用,技能含金量高
  • 大公司平台,资源充足,项目体量大,对职业生涯有较强背书
  • 技术栈难度高,要求同时掌握视频处理、大模型和分布式计算,学习曲线陡峭
  • 岗位专注数据工程,可能较少涉及算法创新,对科研导向的人才吸引力有限
  • 适合对具身智能和数据工程有浓厚兴趣、具备较强工程能力且渴望接触前沿技术的顶尖应届生

缺点 / 挑战

  • 工作强度可能较高,需处理PB级数据并保证系统稳定性

角色解读

  • 在小米机器人事业部深入参与具身智能核心数据基建,成长为数据工程专家
  • 通过接触VLA、VLM等前沿技术,可向多模态算法、具身智能研究方向发展
  • 积累大规模分布式数据处理经验,未来可转型AI架构师或机器学习工程师
  • 设计自动化标注系统,处理千万级机器人视频数据,提升数据生产效率
  • 利用视频时空特征和场景切换检测,精准划分视频片段边界
  • 结合VLM和领域模型,为视频自动生成适合VLA训练的自然语言描述
  • 构建质量评估体系,通过模型评估和异常检测筛选高质量样本
  • 精通视频处理技术,熟悉动作识别、时间动作定位或视频检索
  • 深入理解CLIP、VLM等模型原理,能熟练运用大模型进行数据处理
  • 扎实的Python功底,熟练使用PyTorch或TensorFlow,有PB级视频数据处理经验
  • 熟悉分布式计算框架如Ray、Spark,具备大规模数据处理能力

申请策略

  • 在简历和面试中体现对机器人具身智能的兴趣,展示对小米机器人产品的了解
  • 准备一个端到端的数据管道项目,从视频采集、标注到模型训练,突出工程思维
  • 突出视频处理项目经验,特别是大规模数据场景下的工程实现
  • 强调对CLIP/VLM等模型的理解和应用,如Prompt Engineering或模型蒸馏实践
  • 展现Python和分布式框架的工程能力,如使用Ray/Spark处理海量数据的案例
  • 如果有顶会论文或竞赛成绩,务必列出以体现学术潜力
  • 复习视频处理经典算法和工具(如OpenCV、FFmpeg)及时间动作定位方法
  • 熟悉Ray或Spark的分布式编程,尝试用PyTorch实现一个简单视频理解模型

面试指南

  • 对于系统设计类问题,先明确需求(数据量、实时性、精度),再分层介绍(存储、计算、模型、评估),最后总结权衡
  • 对于模型理解类问题,从模型原理、训练数据、应用场景入手,结合实际项目经验说明优势与局限
  • 对于工程实现类问题,强调分布式架构设计,关注容错、扩展性、性能优化,并给出具体参数或案例
  • 你如何设计一个千万级视频数据的自动化标注系统?请描述架构和关键技术
  • 解释CLIP和VLM的区别?如何用VLM为视频生成高质量描述?
  • 如何处理PB级视频数据的分布式处理?请结合Ray/Spark说明
  • 视频片段边界划分有哪些常用方法?如何利用时空特征?
  • 如何评估数据的质量?你有哪些异常检测的思路?

匹配度报告

74
综合匹配度

小米机器人顶尖应届岗,前沿技术、高成长性,但薪资未明示,WLB一般。

适合人群
适合高度看重技术成长和行业前沿、能接受较高工作强度和北京生活的顶尖应届生。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活50
使命价值80

薪资福利匹配

75中等

小米作为上市大厂,薪资福利有竞争力,但JD未明确具体数值,且北京生活成本较高,整体满足度中等偏上。

薪资信号未披露(AI估算:22K-35K/月)

成长发展匹配

90较高

岗位涉及具身智能、VLM、大规模分布式技术,技术前沿性强,且公司平台大,有良好的成长空间。JD虽然未明确提及晋升,但应届生培养路径通常清晰。

技术前沿前沿/新兴技术
技术栈CLIP、VLM、VLA、Ray、Spark、PyTorch、TensorFlow、分布式计算、视频处理、多模态
业务类型ambiguous

工作生活匹配

50较低

工作地点北京,仅现场办公,JD未提及弹性工作或WLB,互联网大厂强度通常较高,生活便利性一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

80较高

具身智能是高速增长赛道,小米机器人业务有社会影响力,但JD未明确使命导向,整体意义感较强。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k