Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
顶尖应届-软硬协同优化研究员-软件
立即应聘

顶尖应届-软硬协同优化研究员-软件

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
无经验要求
全职员工
仅现场办公
学历未注明
软件工程
GPU
性能优化
LLM
CPU
NPU
异构计算
推理引擎
MoE
端侧推理

AI 估算 · 25k–35k

顶尖应届生岗位,AI优化方向技术难度高,市场稀缺,薪资有竞争力,但应届生起薪略低于社招。

职位详情

关于这个职位

该职位面向顶尖应届生,专注于手机端侧AI大模型的性能优化与软硬协同创新

你将从事从算法到芯片的全栈优化工作,探索30B-100B大模型在移动端的可行性,推动端侧AI推理的能效突破
适合对AI系统优化和异构计算有热情的优秀毕业生

最低要求

模型:深度理解MoE、Transformer、LLM推理原理,及端侧推理优化技术

系统:熟悉异构计算、推理引擎、内存/IO布局
经验:有移动端侧模型部署、调优经验者优化
MoE:有MoE模型工程优化经验者优化

工作职责

主导手机端侧AI模型的性能优化与能效突破,助力端侧高效的AI推理

从算法、编译器、推理引擎、算子到芯片特性,进行全栈式软硬协同优化
跟踪业界最佳成果,挖掘优化方向,协同论证可行性,优化落地效果
整合米端软件到芯片能力,基于AI模型的特性与瓶颈,推动SoC芯片的定制开发
探索构建GPU/NPU/CPU异构并行方案,拓展端侧AI推理的优化路径
对移动端硬件做深度分析,建立benchmark模型,辅助端侧模型的能效优化

AI 洞察

优缺点分析

优点

  • 大厂平台:小米拥有完善的产品生态和芯片合作资源,能接触到软硬件全链路
  • 顶尖应届项目:公司重点培养,资源倾斜,职业起点高
  • 技术难度高:涉及从算法到芯片的全栈优化,需要跨领域知识,学习曲线陡峭
  • 竞争激烈:作为顶尖项目,同事水平高,需要持续进步

缺点 / 挑战

  • 前沿技术:接触百万亿参数大模型在端侧的落地,技术挑战大,成长快
  • 工作强度大:项目周期紧,需要快速迭代验证方案,可能面临较大压力
  • 适合对AI系统优化有浓厚兴趣、具备扎实算法和系统基础、乐于挑战的应届硕博毕业生

角色解读

  • 技术纵深发展:成为端侧AI系统优化专家,主导芯片-算法协同设计
  • 横向拓展:向AI框架开发、编译器开发或芯片架构设计方向延伸
  • 项目管理方向:未来可担任技术Lead或项目经理,带领团队完成复杂优化项目
  • 负责手机端侧AI大模型(30B-100B)的性能优化与能效分析,确保模型在移动设备上高效运行
  • 进行软硬协同优化,包括算法、编译器、推理引擎、算子以及芯片特性的全栈调优
  • 探索GPU/NPU/CPU异构并行方案,推动SoC芯片的定制开发,提升端侧AI推理能力
  • 建立硬件benchmark模型,分析移动端硬件瓶颈,辅助模型能效优化
  • 扎实的AI模型知识:深入理解MoE、Transformer、LLM的推理原理及端侧优化技术
  • 系统能力:熟悉异构计算、推理引擎架构、内存/IO布局优化
  • 工程经验:有移动端模型部署和调优经验,熟悉端侧推理框架
  • 编程与工具:熟练使用Python/C++,了解编译优化技术(如TVM、MLIR)者优先

申请策略

  • 在简历和面试中强调结果导向,用具体性能提升数据(如延迟、功耗)证明能力
  • 了解小米端侧AI产品(如小爱同学)的技术路线,展示对业务场景的理解
  • 突出AI模型部署和优化项目经验,特别是移动端或嵌入式平台的调优案例
  • 展示对MoE、Transformer等模型结构的深入理解,如相关论文、开源贡献
  • 强调异构计算或编译优化相关经历,如使用TVM、XLA等工具的经验
  • 如果有芯片设计或体系结构背景,务必提及,体现软硬协同能力
  • 补强端侧推理框架(如MNN、TNN、NCNN)的使用和源码理解
  • 学习GPU/NPU编程模型(如CUDA、OpenCL、Vulkan),了解移动端硬件特性

面试指南

  • 对于优化类问题,使用“瓶颈分析-方案对比-实施与效果”框架,先定位关键瓶颈,再提出多种方案并分析权衡,最后给出实施路径和预期收益
  • 对于架构设计问题,采用“需求分析-模块划分-关键设计-验证”框架,从业务需求出发,分解功能模块,重点突出创新点和权衡取舍
  • 请详细解释MoE模型在推理时如何实现稀疏激活,以及端侧部署的挑战
  • 如何优化一个LLM在手机端的推理延迟?请从算法、系统、硬件三个层面说明
  • 你如何理解软硬协同优化?请举例说明你之前项目中是如何平衡软件和硬件的
  • 请描述一下TVM或MLIR的工作流程,以及它们在端侧优化中的角色
  • 如果让你设计一个端侧AI芯片的微架构来加速Transformer,你会考虑哪些特性?
  • 复习深度学习编译器知识,了解TVM、MLIR、XLA等的工作原理

匹配度报告

74
综合匹配度

顶尖应届项目,聚焦端侧大模型优化,技术前沿且发展空间大,但工作强度高。

适合人群
特别适合追求技术深度和前沿创新的应届生,愿意在高强度研发中快速成长。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展95
工作生活55
使命价值70

薪资福利匹配

75中等

作为顶尖应届项目,薪资和福利在应届生中具有竞争力,但具体数值未在JD中披露,稳定性方面小米为上市公司,整体较好。

薪资信号未披露(AI估算:25K-35K/月)

成长发展匹配

95较高

职位涉及前沿的端侧大模型优化和软硬协同技术,成长空间极大,且公司提供顶尖应届专项培养,技术前沿性高。

技术前沿前沿/新兴技术
技术栈MoE、Transformer、LLM、端侧推理、异构计算、NPU、GPU、CPU、编译优化
业务类型ambiguous

工作生活匹配

55较低

仅现场办公,未提及远程或弹性工作,通常互联网大厂工作强度较大,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

智能手机AI优化具有明确的产业价值,推动技术普惠,但社会意义相对中性。

行业发展稳定成熟行业
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k