Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
MiMo大模型数据采集工程师
立即应聘

MiMo大模型数据采集工程师

发布于 3 天前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
分布式系统
Javascript
Chrome DevTools
数据采集
Web安全
Fiddler
Js逆向
移动端安全
Mitmproxy

AI 估算 · 20k–35k

大模型数据采集涉及安全对抗,技能稀缺,薪资有竞争力。

职位详情

关于这个职位

加入小米AI团队,负责为大模型训练与评估构建高质量数据管道

你将深入分析目标数据源的接口协议与安全策略,开发高可用数据采集系统,并处理大规模数据的清洗与结构化存储
适合热爱逆向工程与安全对抗的技术人才

最低要求

熟悉 Python / JavaScript,有数据采集或安全研究相关项目经验

能独立完成主流 Web 安全防护的分析与适配
熟练使用 Chrome DevTools、Fiddler、Charles、mitmproxy 等调试工具
具备 JS 代码分析能力:能阅读混淆代码,定位核心逻辑
做事靠谱,能独立推进任务

工作职责

分析目标数据源的接口协议与安全策略

主流 Web 安全防护机制的研究与适配
JS 代码分析与调试,提取关键业务逻辑
Web 协议分析与接口还原
移动端数据通路建设(协议分析、安全机制适配)
设计并开发高可用数据采集系统,完成大规模数据的清洗与结构化存储

优先资格

有移动端安全研究经验(Frida、Xposed、IDA 等)

熟悉人机验证机制的研究与对抗
有大规模数据采集经验,熟悉分布式架构
了解 TLS 指纹、浏览器指纹等 Web 安全技术

AI 洞察

优缺点分析

优点

  • 深度参与大模型关键技术环节,积累稀缺的逆向工程与安全对抗经验
  • 团队技术氛围浓厚,有机会接触到业界前沿的Web安全与移动端安全技术
  • 工作强度可能较大,涉及复杂的接口对抗,调试耗时
  • 技术迭代快,需持续学习最新的反爬和安全防护技术
  • 适合对逆向工程、Web安全有浓厚兴趣,喜欢破解和攻防对抗的技术极客

缺点 / 挑战

  • 小米平台大、资源多,数据量级和挑战性远超小公司
  • 数据采集的边界和合规性问题需要谨慎处理,有一定责任压力

角色解读

  • 纵向发展:成为数据采集与安全对抗领域的专家,主导核心模块
  • 横向转型:积累大模型数据处理经验,转入AI数据工程或模型训练方向
  • 管理路线:带领数据采集团队,负责整体数据供给体系架构
  • 分析各类公开数据源的接口协议与安全策略,突破反爬机制
  • 使用调试工具(如Fiddler、mitmproxy)抓包分析,还原接口逻辑
  • 开发高可用的分布式数据采集系统,处理海量数据清洗与结构化存储
  • 精通Python和JavaScript,具备工程化开发能力
  • 熟悉Web安全防护机制(如验证码、指纹防护),能独立对抗
  • 熟练掌握抓包工具和JS逆向分析,能阅读混淆代码

申请策略

  • 面试前了解小米AI业务方向和大模型数据需求,展现对业务的理解
  • 准备好展示自己的技术热情,比如参与过开源项目或写过逆向相关文章
  • 突出展示自己独立完成的Web安全破解项目案例,包括遇到的问题和解决方案
  • 强调熟练掌握的调试工具和逆向分析能力,最好能提供代码片段或博客链接
  • 如果有大规模数据采集或分布式系统的经验,务必详细描述架构和性能指标
  • 提前练习主流网站的JS逆向,熟悉混淆和解混淆技术
  • 学习Frida、Xposed等移动端hook工具,了解移动端安全机制

面试指南

  • 对于逆向问题,使用STAR法则:情境-任务-行动-结果,展现逻辑清晰
  • 对于系统设计问题,从需求分析、模块划分、容错机制、性能优化等方面展开
  • 描述一次你突破复杂反爬机制的经历,具体使用了哪些工具和技术?
  • 如何分析一个未知协议的接口?请讲述你的方法论
  • 如果遇到高安全防护的站点(如滑块验证码),你计划如何应对?
  • 请设计一个高可用的分布式采集系统架构
  • 你如何看待数据采集的合法性与合规性问题?
  • 复习HTTP协议、TLS指纹、浏览器指纹等Web安全知识

匹配度报告

66
综合匹配度

大厂大模型核心数据岗,技术前沿成长快,但工作强度大,WLB一般。

适合人群
最看重技能成长和前沿技术挑战的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利65
成长发展85
工作生活40
使命价值75

薪资福利匹配

65中等

薪资未在JD中明确,但小米作为上市大厂,薪资水平具有竞争力,且大模型方向通常有额外补贴。

薪资信号未披露(AI估算:20K-35K/月)

成长发展匹配

85较高

职位涉及前沿的大模型数据工程和安全对抗技术,项目挑战大,能快速积累稀缺技能,成长空间广阔。

技术前沿前沿/新兴技术
技术栈Python、JavaScript、Web安全、大模型、数据采集、逆向工程、分布式系统
业务类型profit_center

工作生活匹配

40较低

北京现场办公,未提及WLB或弹性工作,互联网大厂数据岗位通常加班较多,生活平衡一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

75中等

大模型是当前高速增长赛道,参与核心数据建设对社会有间接推动作用,技术创新性较高。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 交付顾问

    小米 · 南宁市
    AI 估算 · 7k-10k
  • 零售专员

    小米 · 德州
    AI 估算 · 25k-45k
  • 车载语音产品实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-8k
  • 零售顾问实习生-2027届

    小米 · 德州市
    AI 估算 · 2k-4k
  • 税务专员实习生

    小米 · 北京市
    AI 估算 · 3k-5k

相似职位推荐

  • 客户端开发实习生-【回森】

    快手 · 北京市
    AI 估算 · 5k-8k
  • 客户端实习生(快影)-【主站】

    快手 · 北京市
    AI 估算 · 6k-10k
  • 服务端开发实习生(影像)-【主站】

    快手 · 北京市
    AI 估算 · 4k-8k
  • Java开发实习生(回森方向)-【主站】

    快手 · 北京市
    AI 估算 · 4k-6k
  • Senior Software Engineer - Tech Foundations

    锐完游戏 · 上海市
    AI 估算 · 25k-45k

小米 的其他在招职位

  • 交付顾问

    小米 · 南宁市
    AI 估算 · 7k-10k
  • 零售专员

    小米 · 德州
    AI 估算 · 25k-45k
  • 车载语音产品实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-8k
  • 零售顾问实习生-2027届

    小米 · 德州市
    AI 估算 · 2k-4k
  • 税务专员实习生

    小米 · 北京市
    AI 估算 · 3k-5k

相似职位推荐

  • 客户端开发实习生-【回森】

    快手 · 北京市
    AI 估算 · 5k-8k
  • 客户端实习生(快影)-【主站】

    快手 · 北京市
    AI 估算 · 6k-10k
  • 服务端开发实习生(影像)-【主站】

    快手 · 北京市
    AI 估算 · 4k-8k
  • Java开发实习生(回森方向)-【主站】

    快手 · 北京市
    AI 估算 · 4k-6k
  • Senior Software Engineer - Tech Foundations

    锐完游戏 · 上海市
    AI 估算 · 25k-45k