Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小米/大模型推理优化工程师
Xiaomi logo
X
小米 (Xiaomi)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

性能优化模型部署CUDA模型量化TensorRT大模型推理移动端Ai
💡

核心评价

小米核心AI技术岗,专注大模型端侧部署与极致优化,技术成长性极佳,薪资竞争力强,但WLB可能面临挑战。

大模型推理优化工程师

🤖 AI 估测:¥35K-60K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

该职位主要负责将大模型算法部署到小米的手机、平板、汽车等移动设备平台,并负责打造和优化高性能的推理引擎
你需要分析性能瓶颈,设计先进的推理架构,并负责AI项目的交付与SDK维护工作
这是一个专注于前沿AI技术落地和性能极致优化的工程岗位

✓工作职责

负责大模型算法在手机、平板等移动设备平台部署,打造业界领先的全平台推理引擎
分析性能瓶颈,提出系统性优化方案,将算法落地到汽车、手机、小爱等集团业务线
设计先进的推理引擎架构,极致优化高性能算子与推理流水线
了解移动端硬件特性,分析推理性能瓶颈,提出系统性解决方案
充分挖掘硬件平台异构算力,优化资源占用
负责AI项目交付、算法SDK编写、维护、技术文档撰写等工作

⭐最低要求

本科及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业
掌握Python、C、C++等编程语言,精通数据结构算法,具备优秀的编程习惯
了解CNN、LLM、Transformer、ViT等算法原理
熟悉常见深度学习或LLM推理框架,如:TensorRT、ncnn、mnn、llama、cpp、vllm等
对模型量化、定点化、低比特表示有深入研究和理解
有CUDA、NEON、SIMD指令编程经验

👍优先资格

加分项:阅读过任意一种推理框架源码、对高性能计算感兴趣者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 材料及轻量化实习生

    小米

    上海市 · 仅现场办公

  • 安全事务经理(网安)

    小米

    北京市 · 仅现场办公

  • 大模型技术专家(Agent方向)

    小米

    北京市 · 仅现场办公

  • 参控股公司管理实习生-2027届

    小米

    北京市 · 仅现场办公

  • 小米汽车-自动驾驶行车产品经理实习生

    小米

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公