Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小米/大模型CUDA开发工程师
Xiaomi logo
X
小米 (Xiaomi)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

GPU高性能计算CUDA模型量化推理引擎大模型推理TensorRT-LLM
💡

核心评价

小米大厂平台、前沿高门槛的大模型CUDA开发岗,技术成长性极佳,薪资竞争力强,工作地点在北京需现场办公。

大模型CUDA开发工程师

🤖 AI 估测:¥35K-60K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

该职位专注于大模型在NVIDIA GPU平台上的推理加速与性能优化
你将负责设计和实现高性能的CUDA算子与推理流水线,对Transformer等主流模型进行定制化加速,并构建支持多模态、动态批处理等核心能力的高效推理引擎
核心目标是推动大模型在实际业务场景中的高效落地

✓工作职责

负责NVIDIA平台大模型推理加速,极致优化推理引擎性能、探索推理框架上限
设计并实现基于CUDA的高性能算子与推理流水线,完成从算法到部署的端到端落地
对Transformer等主流模型结构进行定制化加速,包括内存访问优化、kernel融合、量化压缩、并行调度等
构建高效的大模型推理引擎,支持多模态、动态batching、混合精度、分布式推理等核心能力
分析性能瓶颈,提出系统性优化方案,并推动其在实际业务场景中的应用
输出高质量的技术文档与最佳实践,参与开源社区建设或内部框架研发

⭐最低要求

本科及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业
熟练掌握CUDA C编程语言,了解PTX编程方法,对GPU硬件架构、软件编程模型有深入理解
了解CNN、LLM、Transformer、ViT等算法原理
熟悉常见LLM推理框架,如:TensorRT-LLM、vLLM、SGLang、TensorRT、llama.cpp等
对模型量化、定点化、低比特表示有一定研究和理解

👍优先资格

加分项:阅读过任意一种推理框架源码、对高性能计算感兴趣者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 材料及轻量化实习生

    小米

    上海市 · 仅现场办公

  • 安全事务经理(网安)

    小米

    北京市 · 仅现场办公

  • 大模型技术专家(Agent方向)

    小米

    北京市 · 仅现场办公

  • 参控股公司管理实习生-2027届

    小米

    北京市 · 仅现场办公

  • 小米汽车-自动驾驶行车产品经理实习生

    小米

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公