Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
模型优化专家/工程师
立即应聘

模型优化专家/工程师

发布于 大约 2 小时前

普通员工/个人贡献者

北京市 / 上海市
中级经验
全职员工
仅现场办公
硕士
PyTorch
TensorFlow
CUDA
量化
模型压缩
知识蒸馏
大模型推理
PTQ
QAT
Smoothquant

AI 估算 · 25k–50k

AI模型优化为前沿技术方向,大厂核心岗位,硕士2年+经验,月薪预估25-50K,竞争力强。

职位详情

关于这个职位

该职位主要负责AI模型的网络级压缩与优化,包括量化、蒸馏、稀疏化等前沿技术,同时参与模型结构重构和与硬件团队的协作

适合有2年以上模型优化或训练经验的技术专家,工作地点在北京或上海

最低要求

计算机科学、人工智能、数学等相关专业硕士及以上学历,2年以上模型优化或训练经验

深入理解模型量化技术(PTQ/QAT),至少熟悉一种小模型或大模型量化方案,并有实际部署经验
熟悉大模型推理优化技术,如投机采样、Token剪枝、稀疏化等
具备较强的模型训练与复现能力,能够阅读论文并快速实现网络结构改进
了解芯片计算特性,有与硬件团队协作进行模型-芯片协同设计经验者优先
代码能力强,熟练使用PyTorch/TensorFlow等框架,熟悉底层算子开发(如CUDA kernel)者更佳

工作职责

负责AI模型的网络级压缩与优化,涵盖量化(QAT/PTQ)、投机采样(Speculative Decoding)、Token压缩、知识蒸馏等技术

针对大小模型设计并实现差异化量化方案,如小模型的KL散度、Percentile、AdaRound等,大模型的SmoothQuant、AWQ等
参与或主导模型网络结构的优化与重构,将现有网络的算子、Block替换为高效、硬件友好的架构
参与模型训练与微调,能够复现、分析并改进前沿模型结构
与硬件团队紧密合作,提供模型优化视角的硬件设计建议,推动下一代芯片对新型算子与网络结构的支持

AI 洞察

优缺点分析

优点

  • 涉及AI模型优化前沿技术(量化、蒸馏、稀疏化等),技能积累价值高
  • 大厂核心岗位,平台资源丰富,有机会参与顶级AI芯片协同设计
  • 与硬件团队深度合作,拓宽技术视野,职业发展空间大
  • 技术难度高,需深入理解模型底层原理和硬件特性,学习曲线陡峭
  • 工作强度可能较大,涉及多团队协作和快速迭代
  • 对代码和工程能力要求高,需掌握底层算子开发
  • 适合对模型优化和AI芯片协同设计有浓厚兴趣,具备扎实深度学习基础和较强动手能力的技术型人才

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术纵深发展:成为模型优化领域的专家,掌握最前沿的压缩与加速技术
  • 横向拓展:与硬件团队紧密合作,可转向AI芯片设计或系统架构方向
  • 管理路径:积累经验后,可担任技术团队负责人,主导模型优化策略
  • 负责AI模型的网络级压缩与优化,包括量化、蒸馏、Token压缩等技术,提升模型推理效率
  • 针对不同规模模型设计差异化量化方案,如小模型使用KL散度,大模型使用SmoothQuant
  • 参与模型结构重构,将现有算子替换为硬件友好的高效架构,并与硬件团队协同优化
  • 复现并改进前沿模型结构,推动模型在芯片上的高效部署
  • 扎实的模型量化理论,熟悉PTQ/QAT,并有实际部署经验
  • 熟悉大模型推理优化技术,如投机采样、稀疏化等
  • 较强的代码能力,熟练使用PyTorch/TensorFlow,了解CUDA kernel开发
  • 具备论文阅读和模型复现能力,能快速实现网络结构改进

申请策略

  • 提前了解小米在AI芯片和模型优化方面的布局,面试中展示对业务方向的理解
  • 准备一个完整的模型优化项目案例,从问题到方案到效果,突出技术深度
  • 重点突出模型量化或大模型推理优化的项目经验,说明具体技术方案和效果
  • 展示与硬件团队协作的经历,以及底层算子开发(如CUDA)的成果
  • 列出复现前沿论文或改进网络结构的案例,体现研究能力
  • 补充强化大模型推理优化技术,如投机采样、稀疏化
  • 学习CUDA编程和硬件计算特性,提升模型-芯片协同设计能力

面试指南

  • 对于技术问题,采用“理论+实践”的结构:先阐述核心原理,再结合具体项目说明方案选择、实现细节和效果
  • 对于协作问题,强调“沟通-对齐-迭代”的流程,说明如何从模型和硬件两个视角平衡性能与效率
  • 请详细解释PTQ和QAT的区别及各自适用场景
  • 如何对大模型进行高效的推理优化?请举例说明投机采样或Token剪枝的实现
  • 你如何设计与硬件团队协作的模型量化方案?请分享一个实际案例
  • 描述一次你复现并改进前沿模型结构的经历,遇到过哪些挑战?
  • 你对CUDA kernel优化有何经验?如何优化一个算子使其更适配硬件?
  • 复习模型量化和蒸馏的经典论文,熟悉主流量化工具(如TensorRT、ONNX Runtime)

匹配度报告

70
综合匹配度

大厂核心AI岗,前沿技术栈,薪资竞争力强,但现场办公且可能加班。

适合人群
最适合追求技术成长和前沿挑战的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值60

薪资福利匹配

80较高

大厂核心岗位,薪资水平具有竞争力,福利完善,但具体薪资未披露,属于市场偏上水平。

薪资信号未披露(AI估算:25K-50K/月)

成长发展匹配

90较高

职位涉及前沿AI模型优化技术,与硬件团队协作,成长空间极大,技术栈先进。

技术前沿前沿/新兴技术
技术栈量化、蒸馏、投机采样、稀疏化、CUDA
业务类型profit_center

工作生活匹配

50较低

工作地点在北京或上海,现场办公,未提及弹性工作或远程,可能工作强度较大。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

AI模型优化属于技术前沿,对行业发展有推动,但社会影响力相对中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 开发工程师实习生-2027届

    小米 · 武汉市
    AI 估算 · 2k-4k
  • 小米-人力资源实习生-武汉

    小米 · 武汉市
    AI 估算 · 3k-4k
  • 商业化产品实习生-2027届

    小米 · 北京市
    AI 估算 · 3k-5k
  • 活动运营实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 车友会运营实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k

相似职位推荐

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k
  • 【快Star】多模态理解与生成算法研究员

    快手 · 北京市
    AI 估算 · 35k-60k
  • 【快Star】视频大模型高性能与低精度算子工程师

    快手 · 上海市
    AI 估算 · 35k-60k

小米 的其他在招职位

  • 开发工程师实习生-2027届

    小米 · 武汉市
    AI 估算 · 2k-4k
  • 小米-人力资源实习生-武汉

    小米 · 武汉市
    AI 估算 · 3k-4k
  • 商业化产品实习生-2027届

    小米 · 北京市
    AI 估算 · 3k-5k
  • 活动运营实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 车友会运营实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k

相似职位推荐

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k
  • 【快Star】多模态理解与生成算法研究员

    快手 · 北京市
    AI 估算 · 35k-60k
  • 【快Star】视频大模型高性能与低精度算子工程师

    快手 · 上海市
    AI 估算 · 35k-60k