Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/米哈游/AI Infra 推理优化工程师
miHoYo logo
m
米哈游 (miHoYo)

职位信息

上海市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

💡

核心评价

前沿AI大厂核心岗,技术成长性极佳,薪资竞争力强,但需接受现场办公且WLB未知。

AI Infra 推理优化工程师

🤖 AI 估测:¥35K-60K

发布时间:13 天前

立即应聘

ℹ️关于这个职位

该职位是AI基础设施领域的推理优化工程师,主要负责设计和实现高可用的大模型服务化部署与调度,以支持多用户并发、低延迟和弹性伸缩
核心工作还包括深入优化推理引擎性能,解决实际业务中的性能瓶颈,并持续跟进前沿技术进行实验和调研

✓工作职责

设计并实现高可用的大模型服务化部署调度,支持多用户并发、低延迟、弹性伸缩
深入优化推理引擎性能,解决实际业务场景中的性能瓶颈
持续跟进前沿相关技术并进行实验及调研

⭐最低要求

硕士及以上学历,计算机、软件工程、人工智能等相关专业优先
具备较丰富的大语言模型/文生图/视频生成等推理服务优化经验
了解 KV-Cache / Page Attention / Speculative Decoding 等 LLM 推理优化方案
熟练掌握 Linux 环境下的 C/C++ 与 Python 语言,具备良好的代码规范和系统设计能力
熟练使用 Kubernetes/Docker 等容器化与服务化工具,了解 Ray 等调度框架,具备大规模集群部署与调度经验
具有独立解决问题的能力,良好的团队合作精神及沟通能力

👍优先资格

具有 LLM / Diffusion Transformer 部署和推理加速实战经验
具有长序列推理优化及大规模的推理服务实际落地经验
有硕士/博士阶段的计算机系统方向研究背景,或在国际顶级系统会议上(OSDI/SOSP/SIGCOMM/ASPLOS/NSDI等)发表过论文者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 业务助理

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划(社交)-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 版本运营-星布谷地

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 资深市场公关(媒体关系方向)-原神

    米哈游

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公