Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/米哈游/大模型推理平台开发工程师
miHoYo logo
m
米哈游 (miHoYo)

职位信息

上海市 / 北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

💡

核心评价

前沿AI基础设施岗,技术成长性极佳,薪资竞争力强,位于一线城市核心区,WLB可能面临挑战。

大模型推理平台开发工程师

🤖 AI 估测:¥25K-40K

发布时间:13 天前

立即应聘

ℹ️关于这个职位

该职位专注于大模型推理平台的开发与优化,你将负责构建和维护高性能、高可用的推理服务系统
核心工作包括优化KVCache集群以解决内存瓶颈、管理计算资源与任务调度以降低成本,并建立完善的监控告警体系
这是一个面向2026届毕业生的技术岗位,需要你具备扎实的计算机基础和工程能力,并对分布式系统与底层性能优化有浓厚兴趣

✓工作职责

负责大模型推理平台的开发、维护与性能优化,保障服务高可用性和高性能运行
对大模型 KVCache 集群进行开发、维护与性能调优,解决大规模并发推理内存瓶颈
管理推理服务的计算资源、流量及任务调度,优化集群资源利用率,降低推理成本
建立推理服务监控告警体系,及时发现和解决性能异常和系统故障
参与推理服务架构设计,支持多模态模型和不同规模模型的推理需求

⭐最低要求

本科及以上学历,计算机、软件、人工智能等相关专业
具备扎实的计算机基础(数据结构、算法、操作系统、计算机网络、并发编程)
至少熟悉 Go/Python/C++/Rust 中一种,具有良好的工程实现与代码质量意识
对分布式系统/大规模异构推理有浓厚兴趣,喜欢钻研底层原理与性能瓶颈,有实际追踪相关领域进展

👍优先资格

参与过大模型推理系统优化工作,对PD分离、KV Cache系统、多机推理等有实践和认知
有K8S二开经验,熟悉volcano、lws、ray等框架调度逻辑
熟悉vllm、sglang、dynamo等推理引擎,有参与实际工作
对RadixAttention、PagedAttention、Continous Batching等技术有实际研究和优化经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 业务助理

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划(社交)-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 版本运营-星布谷地

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 资深市场公关(媒体关系方向)-原神

    米哈游

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公