Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
顶尖应届-端侧大模型算法工程师-软件
立即应聘

顶尖应届-端侧大模型算法工程师-软件

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
无经验要求
全职员工
仅现场办公
学历未注明
软件工程
深度学习
模型压缩
模型量化
大模型
TFLite
Hexagon DSP
ARM NEON
算子优化
移动端部署

AI 估算 · 20k–35k

端侧大模型为前沿方向,技能要求高,小米平台稳定,应届生薪资竞争力强。

职位详情

关于这个职位

该职位负责将大模型等算法部署到小米移动端设备,并进行性能优化

你将参与移动端深度学习框架开发、算子优化,并探索芯片算力潜能,实现业界领先的算法执行效率
适合对大模型落地和移动端优化有热情的优秀应届生

最低要求

信号处理/模式识别/人工智能等相关专业毕业,熟练使用C/C++

对深度学习有深刻认识,熟悉各种神经网络及背后数学原理,熟悉各类神经网络模型的量化/压缩/性能优化方案

工作职责

负责大模型在内的各类算法的移动端部署与优化

负责移动端深度学习框架开发及算子优化
不断挖掘移动芯片算力潜能,改良模型结构,实现业界领先的算法执行效能
撰写相关论文,专利

优先资格

对大模型加速优化方案有深入了解,对投机采样,GQA,MOE,Lora量化等技术有开发与优化经验者优先

有TFlite (Micro),NCNN,SNPE/QNN,EAI,NeuroPilot等移动端深度学习框架开发经验者优先
熟悉神经网络模型的定点优化,熟悉各类嵌入式平台芯片架构及底层指令,有ARM Neon、Hexagon DSP、Cadence Hifi3/5、RISC-V等平台的算子开发及算法调优经验者优先
有相关领域高质量会议/期刊论文,或深度参与过开源深度学习框架的开发并有相应贡献者优先

AI 洞察

优缺点分析

优点

  • 处于大模型落地的核心赛道,技术前沿性强,积累的经验在行业内有高迁移价值
  • 小米拥有海量移动设备,实际应用场景丰富,能快速验证算法效果
  • 公司平台大,资源充足,有机会接触芯片、框架、算法全栈技术
  • 端侧AI优化涉及芯片、系统、算法多领域知识,学习曲线陡峭
  • 需要应对移动端算力受限和功耗要求,优化难度大
  • 大厂竞争激烈,需持续保持技术敏锐度和产出效率

缺点 / 挑战

  • 适合对AI算法与底层系统结合有浓厚兴趣,喜欢挑战性能极限,且具备扎实C/C++和深度学习功底的应届生

角色解读

  • 技术纵深发展:成为移动端AI优化专家,主导端侧模型架构设计
  • 横向扩展:转向AI芯片设计、编译器优化或云端大模型训练
  • 管理路线:带领算法优化团队,负责产品级AI解决方案交付
  • 将大模型等算法部署到手机芯片上,进行性能优化,确保模型在端侧高效运行
  • 开发移动端深度学习框架,编写和优化底层算子,充分利用芯片的算力
  • 研究模型量化、压缩等加速技术,改写模型结构以适配移动端硬件
  • 撰写技术论文和专利,推动团队技术积累和行业影响力
  • 扎实的C/C++编程能力,熟悉深度学习原理和常见神经网络架构
  • 掌握模型量化、压缩、推理加速等优化方法,了解大模型加速技术如投机采样、GQA等
  • 有移动端推理框架(如TFLite、NCNN)或嵌入式平台(ARM、DSP)开发经验者优先
  • 具备论文撰写和开源贡献能力,能独立解决复杂技术问题

申请策略

  • 关注小米在AIoT和手机AI上的业务布局,在面试中展现对端侧场景的理解
  • 提前了解小米移动端AI框架(如MACE)或相关开源项目,增加共鸣点
  • 突出C/C++项目经验,尤其是性能优化或底层开发相关的工作
  • 展示深度学习项目,特别是模型部署、量化、压缩方面的实践
  • 如有移动端推理框架(TFLite、NCNN等)的使用或二次开发经历,务必详细描述
  • 强调论文、专利或开源贡献,体现研究和工程能力
  • 提前学习大模型常用加速技术(如FlashAttention、量化感知训练)
  • 练习使用至少一种移动端推理框架进行模型转换和性能调优

面试指南

  • 针对优化类问题:先分析瓶颈(计算、内存、IO),再提出具体优化手段(量化、算子融合、内存复用),最后给出可量化的预期效果
  • 针对部署类问题:说明整体流程(模型导出、格式转换、量化校准、性能测试),并强调在小米硬件上的适配考虑
  • 请详细讲一下你过去做过的模型量化或压缩项目,遇到了哪些挑战?
  • 如何将一个PyTorch模型部署到手机端并保持较高推理速度?
  • 解释一下Swin Transformer的结构,并讨论在移动端部署的难点
  • 你如何优化一个卷积算子使其在ARM CPU上运行更快?
  • 大模型在端侧推理时,显存和算力不足,你会采用哪些方案?
  • 复习深度学习模型量化、蒸馏、剪枝等压缩技术原理,准备1-2个完整的项目案例

匹配度报告

68
综合匹配度

小米端侧大模型算法岗,前沿技术栈,高成长空间,但工作强度未明确且WLB信息不足。

适合人群
适合追求技术前沿、快速成长、愿意投入高强度钻研的应届生。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活40
使命价值70

薪资福利匹配

70中等

小米作为大厂提供有竞争力的薪资和福利,但JD未明确披露,整体补偿性处于中等偏上水平。

薪资信号未披露(AI估算:20K-35K/月)

成长发展匹配

90较高

端侧大模型是前沿技术方向,工作内容涉及模型优化、框架开发、论文专利,成长空间极大。

技术前沿前沿/新兴技术
技术栈C/C++、深度学习、大模型、量化、压缩、TFLite、NCNN、ARM Neon、Hexagon DSP
业务类型ambiguous

工作生活匹配

40较低

工作地点在北京的科技园,未提及远程或弹性办公,且大厂算法岗通常工作强度较高。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AI落地移动端具有技术价值和社会效益,但岗位本身更偏工程优化,使命感一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k