Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Xiaomi logo
小米
新业务部-大模型部署优化工程师
立即应聘

新业务部-大模型部署优化工程师

发布于 大约 3 小时前

普通员工/个人贡献者

北京市 / 上海市
中级经验
全职员工
仅现场办公
本科
软件工程
GPU
PyTorch
性能优化
TensorFlow
LLM
CPU
CUDA
TensorRT
NPU

AI 估算 · 25k–50k

大模型部署优化工程师需求旺盛,技术壁垒高,小米为头部大厂,薪资具有竞争力。

职位详情

关于这个职位

该职位主要负责在Android平台部署大模型(AIGC+LLM),进行NPU/GPU/CPU上的高性能算子实现和性能优化,是小米新业务部门的核心技术岗位

最低要求

本科及以上学历,计算机科学、电子工程或自动化等相关专业

熟悉并行/异构计算体系结构,在TPU/NPU/GPU一种平台有3年以上的开发和优化经验
熟悉计算机系统体系架构,软件性能优化加速
熟练使用至少一种主流AI训练框架,如TensorFlow、PyTorch、Caffe等
良好的团队沟通能力、技术攻关能力,责任心强

工作职责

参与Android 平台的大模型(aigc + llm)开发和部署

负责大模型算子在NPU/GPU/CPU部署及高性能算子实现
负责大模型异构部署的算子性能调优及优化工作
分析算子/网络的性能瓶颈,提出性能优化策略,达成性能目标

优先资格

具备业界常用高性能库(TensorRT/cuDNN/CUDA/OPENCV)开发和性能优化经验者优先

AI 洞察

优缺点分析

优点

  • 处于AI大模型热点赛道,技术积累价值高,行业前景广阔
  • 小米新业务部资源充足,可参与前沿端侧AI技术实践
  • 接触大模型在移动设备上的落地全流程,提升端到端部署能力
  • 端侧部署受硬件资源限制,优化难度大,需要深入底层
  • 大模型技术迭代迅速,需要持续学习和跟进最新工具
  • 适合对AI模型部署和性能优化有浓厚兴趣,具备较强系统编程能力和硬件理解能力的技术人员

缺点 / 挑战

  • 项目紧急性高,可能面临较大的交付压力

角色解读

  • 向大模型部署架构师方向发展,主导端侧AI解决方案设计
  • 横向拓展至AI芯片设计或算法优化领域,成为复合型技术专家
  • 在小米新业务部内部可转向算法研发或产品技术管理岗位
  • 负责将大模型(AIGC+LLM)在Android设备上进行部署和优化,实现端侧推理
  • 针对NPU、GPU、CPU等异构硬件,实现高性能算子并持续调优
  • 分析算子及网络性能瓶颈,提出并实施优化策略以达到性能目标
  • 深入理解并行计算和异构计算体系结构,具备NPU/GPU/CPU平台优化经验
  • 熟练使用TensorRT、cuDNN、CUDA等高性能库进行算子开发和优化
  • 掌握至少一种主流AI框架(如PyTorch、TensorFlow)的模型部署流程
  • 具备系统性能分析能力,能够定位瓶颈并制定优化方案

申请策略

  • 在面试中展现对大模型端侧落地的热情和对小米AI产品的了解
  • 可提前准备一个完整的端侧部署项目展示,突出优化方法和效果
  • 突出在GPU/NPU上的模型部署与优化项目经验,展示具体性能提升数据
  • 强调使用TensorRT、CUDA等工具的实际成果和优化思路
  • 体现对异构计算体系结构的理解,以及解决性能瓶颈的案例
  • 深入学习高通或联发科NPU的SDK和工具链
  • 掌握模型量化、剪枝、蒸馏等端侧模型压缩技术

面试指南

  • 先明确问题边界,然后从算法、算子、内存、编译等层面分层分析
  • 结合实际案例,按“问题-分析-方案-效果”结构回答,突出量化结果
  • 如何优化一个Transformer模型在手机端的推理速度?
  • 请解释TensorRT的工作原理和主要的优化策略
  • 描述一次你解决性能瓶颈的经验,具体采用了哪些方法?
  • 在异构计算中,如何选择合适的计算单元分配任务?
  • 你在多线程或并行编程中遇到过哪些挑战?如何解决的?
  • 复习并行计算、GPU架构和内存层次等基础知识

职位点评

72
综合评分

小米新业务部大模型部署优化岗,技术前沿、薪资优厚,但工作强度可能较大。

更适合这类人
最适合追求技术前沿和快速成长的求职者,对工作生活平衡要求不高。
表现最好
成长发展
相对薄弱
工作生活
薪资福利75
成长发展85
工作生活50
使命价值80

薪资福利

75中等

小米作为上市公司,薪资福利在行业中具备竞争力,但JD未明确薪资范围,需面试沟通确认。

薪资信号未披露(AI估算:25K-50K/月)

成长发展

85较高

职位涉及前沿大模型部署技术,能深入底层优化,技术成长空间大,但JD未提及明确晋升路径。

技术前沿前沿/新兴技术
技术栈大模型、LLM、AIGC、NPU、GPU、CPU、TensorRT、CUDA、PyTorch、TensorFlow
业务类型ambiguous

工作生活

50较低

工作地点为固定办公场所,未提及弹性工作或远程,技术岗通常工作强度较大,WLB一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值

80较高

AI大模型赛道高速增长,岗位有较强技术影响力,但社会直接价值偏向消费电子,使命驱动感一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 专卖店店长-无锡

    小米 · 无锡市
    AI 估算 · 8k-15k
  • 小米汽车-发动机旋转往复系统高级工程师

    小米 · 北京市
    AI 估算 · 25k-45k
  • 专卖店店长(宜兴)

    小米 · 无锡市
    AI 估算 · 6k-10k
  • 法务专员实习生

    小米 · 北京市
    AI 估算 · 3k-5k
  • 小米汽车-测试工程师-热管理系统测试

    小米 · 南京市
    AI 估算 · 15k-25k

相似职位推荐

  • 无线固件集成工程师Wireless Firmware Integration Engineer

    特斯拉 · 上海市
    AI 估算 · 20k-35k
  • 自动化控制工程师,软件

    特斯拉 · 上海市
    AI 估算 · 20k-35k

小米 的其他在招职位

  • 专卖店店长-无锡

    小米 · 无锡市
    AI 估算 · 8k-15k
  • 小米汽车-发动机旋转往复系统高级工程师

    小米 · 北京市
    AI 估算 · 25k-45k
  • 专卖店店长(宜兴)

    小米 · 无锡市
    AI 估算 · 6k-10k
  • 法务专员实习生

    小米 · 北京市
    AI 估算 · 3k-5k
  • 小米汽车-测试工程师-热管理系统测试

    小米 · 南京市
    AI 估算 · 15k-25k

相似职位推荐

  • 无线固件集成工程师Wireless Firmware Integration Engineer

    特斯拉 · 上海市
    AI 估算 · 20k-35k
  • 自动化控制工程师,软件

    特斯拉 · 上海市
    AI 估算 · 20k-35k