Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Xiaomi logo
小米
大模型数据策略工程师实习生
立即应聘

大模型数据策略工程师实习生

发布于 大约 15 小时前

实习/见习

北京市
无经验要求
实习生
仅现场办公
硕士
软件工程
NLP
PyTorch
TensorFlow
提示工程
数据清洗
大模型
Megatron-LM
DeepSpeed

AI 估算 · 5k–8k

大厂硕士实习,技术岗位,薪资有竞争力,但实习周期较短

职位详情

关于这个职位

作为小米AI团队的大模型数据策略实习生,你将参与大模型数据清洗、处理与质量优化,构建数据分类模型,探索提示工程,并协同多模态数据合成

这是深入了解大模型技术栈、积累实战经验的绝佳机会

最低要求

计算机或相关专业硕士及以上

了解hadoop/spark等大数据处理框架
熟悉Python/scala/java中的一种语言,熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed等多机多卡方案
具备NLP经验,对大模型后训练主流方案有较深刻的理解
关注行业前沿进展,对技术开发及应用有热情,有自己的想法,乐于挑战自我

工作职责

大模型数据质量的持续提升改进与实现

参与数据主题分类模型的构建
VLM/ALM/LLM数据的合成与生产的协同优化
提示工程(Prompt Engineering)的探索
构建和评测数据的质量及评估的方法及评测集的构建
跟进学术界与工业界最新进展

AI 洞察

优缺点分析

优点

  • 小米作为大厂,提供丰富的计算资源和数据场景
  • 接触前沿大模型技术栈(Megatron, DeepSpeed等),技能含金量高
  • 团队氛围技术导向,有导师指导,学习曲线陡峭
  • 技术要求高,需要快速掌握多种框架和工具
  • 数据策略工作可能需要处理大量繁琐的数据清洗任务

缺点 / 挑战

  • 实习期可能面临高强度学习和工作压力
  • 适合对NLP和大模型有浓厚兴趣、自学能力强、乐于挑战的计算机相关专业硕士生

角色解读

  • 积累大模型数据处理与策略经验,可向大模型算法工程师发展
  • 深入理解数据驱动模型优化,未来可转向数据科学家或AI研究员
  • 小米内部转正机会,可参与更核心的模型研发工作
  • 参与大模型数据清洗、处理与质量优化,提升数据质量
  • 构建数据主题分类模型,用于数据分类与筛选
  • 协同多模态数据(VLM/ALM/LLM)的合成与生产流程优化
  • 探索提示工程(Prompt Engineering)以提升模型性能
  • 熟练掌握Python及PyTorch/TensorFlow深度学习框架
  • 了解Hadoop/Spark等大数据处理框架,具备数据处理能力
  • 熟悉Megatron-LM/DeepSpeed等大模型训练框架
  • 具备NLP基础,对大模型后训练(SFT/RLHF等)有理解

申请策略

  • 关注小米AI实验室的公开报告和论文,在面试中展现对业务的了解
  • 准备一个端到端的数据处理或模型微调的项目案例,展示实操能力
  • 突出与数据清洗、NLP、大模型相关的项目或论文经历
  • 重点描述使用大数据框架(Hadoop/Spark)的经验
  • 展示对PyTorch/TensorFlow及大模型框架的熟悉程度
  • 如有开源贡献或技术博客,建议附上链接
  • 提前学习Megatron-LM或DeepSpeed的官方文档和示例
  • 熟悉常用数据清洗工具和技巧,如正则表达式、去重、质量评估

面试指南

  • 先阐述原理,再结合自身项目经验具体说明,注重逻辑和细节
  • 对于框架类问题,可以对比优缺点,并指出在实际应用中的选择依据
  • 对于开放性问题,展示思考过程和解决问题的能力
  • 请谈谈你对大模型数据质量重要性的理解?如何评估数据质量?
  • 你熟悉哪些大数据处理框架?请举例说明如何使用它们处理数据
  • 请解释Megatron-LM和DeepSpeed的主要区别和适用场景
  • 什么是SFT和RLHF?它们在模型训练中起什么作用?
  • 你做过哪些与大模型相关的项目?遇到了哪些挑战?

职位点评

69
综合评分

大厂前沿大模型实习,技术成长快,薪资中等,需现场办公,WLB一般。

更适合这类人
该职位最适合追求技术成长、愿意投入时间学习前沿大模型技术、不介意现场办公的硕士实习生。
表现最好
成长发展
相对薄弱
工作生活
薪资福利65
成长发展90
工作生活50
使命价值70

薪资福利

65中等

实习薪资在大厂中处于中等水平,但小米提供免费班车、食堂等福利,整体补偿性尚可。

薪资信号未披露(AI估算:5K-8K/月)

成长发展

90较高

该实习岗位技术栈前沿,涉及大模型、数据策略、多模态等热门方向,学习机会丰富,发展性优势突出。

技术前沿前沿/新兴技术
技术栈大模型、Megatron-LM、DeepSpeed、NLP、提示工程、数据清洗
业务类型ambiguous

工作生活

50较低

需要在北京现场办公,实习时间相对固定,没有远程选项,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

参与前沿大模型研发,对AI行业有积极影响,但作为实习岗位,使命感相对有限。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • AI 开发工程师(Agent 方向)

    小米 · 武汉市
    AI 估算 · 4k-6k
  • 内容-策略产品实习生-2027届

    小米 · 北京市
    AI 估算 · 3k-5k
  • 小米汽车-硬件工程师-车身工艺

    小米 · 武汉市
    AI 估算 · 20k-35k
  • 商业化产品实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 结构化数据大模型算法实习生-AI实验室

    小米 · 北京市
    AI 估算 · 5k-8k

相似职位推荐

  • 【27届实习】Ray研发工程师

    小红书 · 北京市
    AI 估算 · 4k-6k
  • 电商稳定性架构师

    小红书 · 上海市
    AI 估算 · 30k-60k
  • eGRC-SAP ABAP开发-SA1

    普华永道 · 成都市
    AI 估算 · 12k-20k
  • 资深前端开发工程师(MJ035575)

    携程 · 上海市
    AI 估算 · 25k-40k
  • 后端开发工程师(日常实习)

    顺丰速运 · 深圳市
    AI 估算 · 3k-6k

小米 的其他在招职位

  • AI 开发工程师(Agent 方向)

    小米 · 武汉市
    AI 估算 · 4k-6k
  • 内容-策略产品实习生-2027届

    小米 · 北京市
    AI 估算 · 3k-5k
  • 小米汽车-硬件工程师-车身工艺

    小米 · 武汉市
    AI 估算 · 20k-35k
  • 商业化产品实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 结构化数据大模型算法实习生-AI实验室

    小米 · 北京市
    AI 估算 · 5k-8k

相似职位推荐

  • 【27届实习】Ray研发工程师

    小红书 · 北京市
    AI 估算 · 4k-6k
  • 电商稳定性架构师

    小红书 · 上海市
    AI 估算 · 30k-60k
  • eGRC-SAP ABAP开发-SA1

    普华永道 · 成都市
    AI 估算 · 12k-20k
  • 资深前端开发工程师(MJ035575)

    携程 · 上海市
    AI 估算 · 25k-40k
  • 后端开发工程师(日常实习)

    顺丰速运 · 深圳市
    AI 估算 · 3k-6k