Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小米/MiMo-大模型推理框架开发工程师
Xiaomi logo
X
小米 (Xiaomi)

职位信息

北京市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

PyTorchGPU优化CUDA性能调优SGLangvLLM大模型推理
💡

核心评价

小米大厂前沿技术岗,专注大模型推理与GPU优化,技术成长性极佳,工作地点固定且可能有强度。

MiMo-大模型推理框架开发工程师

🤖 AI 估测:¥35K-60K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型推理框架开发的高级技术岗位
你将负责基于vLLM、SGLang等前沿技术,设计和实现高效的推理引擎,并进行性能优化与调优,以满足大规模AI模型的实时推理需求
核心工作涉及CUDA内核优化和高性能GPU算子开发,旨在提升模型在不同硬件上的推理性能

✓工作职责

负责基于 vLLM、SGLang 等技术的大模型推理框架的开发工作,包括但不限于设计和实现高效的推理引擎架构,优化推理过程中的计算流程,提高推理性能,以满足不同规模大模型的实时推理需求
复杂大模型框架性能评估和调优工作,构建并完善性能监控体系,通过实时监测训练指标,定位性能瓶颈,提出优化方案,确保在不同硬件上达到最优性能
负责Cuda Kernel优化,开发高性能的GPU算子,提升大模型推理性能

⭐最低要求

硕士及以上学历,计算机、软件工程、数学等相关专业,具备扎实计算机理论基础和丰富编程经验,在深度学习领域有深入研究与实践
精通 Python,熟练掌握至少一种深度学习框架(如 PyTorch),理解深度学习原理算法,有丰富模型开发与调优经验,能独立搭建复杂模型并优化性能
熟悉 C++ 和 CUDA 编程,具备代码优化能力,能针对 GPU 等硬件高效编写和优化代码,了解硬件体系结构并进行针对性优化
有良好团队协作与沟通能力,能与不同背景成员有效沟通协作,责任心强、敬业热情,能承受工作压力,保证项目按时高质量交付

👍优先资格

熟悉大模型推理框架的基本原理和流程,了解 vLLM、SGLang 等大模型推理框架的核心技术和实现优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 材料及轻量化实习生

    小米

    上海市 · 仅现场办公

  • 安全事务经理(网安)

    小米

    北京市 · 仅现场办公

  • 大模型技术专家(Agent方向)

    小米

    北京市 · 仅现场办公

  • 参控股公司管理实习生-2027届

    小米

    北京市 · 仅现场办公

  • 小米汽车-自动驾驶行车产品经理实习生

    小米

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公