Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/米哈游/推理平台研发工程师
miHoYo logo
m
米哈游 (miHoYo)

职位信息

上海市 / 北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

分布式系统性能优化GOGPU集群vLLM大模型推理TensorRT-LLMKvcache
💡

核心评价

前沿AI基础设施岗,技术成长性极佳,薪资竞争力强,但WLB面临挑战。

推理平台研发工程师

🤖 AI 估测:¥35K-60K

发布时间:14 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型推理平台研发的工程师岗位
你将负责开发和维护高性能、高可用的推理服务平台,并深入优化KVCache集群、资源调度等核心环节,以支持大规模并发推理需求
这是一个技术挑战性强、处于AI前沿应用领域的核心研发岗位

✓工作职责

负责大模型推理平台的开发、维护与性能优化,保障服务高可用性和高性能运行
对大模型 KVCache 集群进行开发、维护与性能调优,解决大规模并发推理内存瓶颈
管理推理服务的计算资源、流量及任务调度,优化集群资源利用率,降低推理成本
建立推理服务监控告警体系,及时发现和解决性能异常和系统故障
参与推理服务架构设计,支持多模态模型和不同规模模型的推理需求

⭐最低要求

计算机相关专业,本科及以上学历,3-5 年分布式系统或AI推理相关工作经验
具备丰富的推理服务性能优化经验:KVCache 管理、调度策略优化、PD 分离、模型量化、模型并行等
熟练使用 Kubernetes 进行容器化部署,了解 Volcano等GPU资源调度系统
掌握 Go/Python 等编程语言,具备良好的代码规范和系统设计能力
具备推理链路端到端性能分析与故障排查能力,能够在高并发、大规模场景下保障服务稳定运行
熟悉至少一种大模型推理主流框架(vLLM、SGLang、TensorRT-LLM、Dynamo等)
良好的团队协作能力和独立解决复杂问题的能力,能承受一定工作压力

👍优先资格

具备大规模 KVCache 集群管理和维护经验,熟悉缓存压缩、调度等优化策略
有千卡级以上GPU集群的大规模分布式推理服务开发或运维经验
熟悉 NVIDIA H100/A100 等高端GPU特性,有GPU集群管理及推理加速实战经验
了解 InfiniBand、RDMA 等高速网络技术在推理场景中的应用
熟悉多云GPU实例管理(AWS、Azure、阿里云等)和混合云部署方案
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 业务助理

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划(社交)-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 版本运营-星布谷地

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 资深市场公关(媒体关系方向)-原神

    米哈游

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公