Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小米/移动端 AI 性能专家 (Engine & Efficiency)
Xiaomi logo
X
小米 (Xiaomi)

职位信息

北京市
专家级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

硬件加速性能监控模型量化AI性能优化资源调度移动端开发Kv Cache
💡

核心评价

技术顶尖的移动AI性能专家岗,成长空间巨大,薪资竞争力强,但需专注现场攻坚。

移动端 AI 性能专家 (Engine & Efficiency)

🤖 AI 估测:¥45K-80K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于移动端AI性能优化的专家级技术岗位
你将负责将大型语言模型(LLM)等AI技术高效部署到手机端,通过引擎调优、效率突破和资源调度,解决AI应用在移动设备上遇到的延迟、功耗和并发等核心性能瓶颈,致力于打造极致流畅的端侧AI体验

✓工作职责

引擎调优:负责 Android/iOS、与云端 Mimo 或本地 ExecuTorch/ncnn 的底层接入与硬件加速(NPU/GPU/Metal)
效率突破:实现 Speculative Decoding (投机采样) 或 Prompt Caching,在手机端将 TTFT(首包延迟)降至极致
性能监控:建立全链路监控指标体系,关注 Tokens/sec、ITL (Token 间延迟) 以及 Agent 后台运行时的功耗曲线
资源调度:解决多 Agent 并发请求时的资源竞争问题,防止手机卡顿或发热降频

⭐最低要求

深厚的移动端开发功底(C++/Rust 为佳,Obj-C/Swift/Kotlin 为主)
精通端侧模型量化技术(GGUF、EXL2、AWQ 等),能平衡模型精度与推理速度
理解 Transformer 底层算子逻辑,有对 KV Cache 进行内存压缩或分页管理的实战经验
硬核要求:能够从 Profiler 工具中定位瓶颈,并在极端网络/硬件环境下保持 Agent 请求的高稳定性
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 材料及轻量化实习生

    小米

    上海市 · 仅现场办公

  • 安全事务经理(网安)

    小米

    北京市 · 仅现场办公

  • 大模型技术专家(Agent方向)

    小米

    北京市 · 仅现场办公

  • 参控股公司管理实习生-2027届

    小米

    北京市 · 仅现场办公

  • 小米汽车-自动驾驶行车产品经理实习生

    小米

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公