Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

miHoYo logo
米哈游
Al Infra 推理优化工程师
立即应聘

Al Infra 推理优化工程师

发布于 2 天前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
学历未注明
分布式系统
LLM
CUDA
GPU性能优化
大模型推理
DiT
Ai Infra
Cute
Linux高性能服务

AI 估算 · 35k–60k

AI推理优化工程师属于高稀缺技术岗位,米哈游盈利能力强且在上海,薪资水平位于行业前列。

职位详情

关于这个职位

该职位主要负责米哈游AI推理引擎的研发与优化,涉及大模型服务化部署、GPU性能调优以及前沿AI Infra技术的落地

你将与团队一起解决实际业务中的性能瓶颈,推动高并发、低延迟的推理服务,适合对AI系统底层优化有热情的工程师

最低要求

具有一定的具备 GPU 性能优化经验,包括但不限于 CUDA/Cute/Triton/TileLang 等

扎实的系统与基础设施能力,熟悉 Linux 环境下高性能服务开发,具备良好的代码规范和系统设计能力
具备较丰富的大模型(LLM/DiT 范式)等推理服务优化经验,了解常用推理优化方案
熟练掌握常用 AI Coding 工具,能够将 AI 协同开发融入日常研发流程
具有独立解决问题的能力,良好的团队合作精神及沟通能力

工作职责

设计并实现高可用的大模型服务化部署调度,支持多用户并发、低延迟、弹性伸缩

深入跟进团队内训练/推理相关的性能优化工作,解决实际业务场景中的性能瓶颈
持续跟进 AI Infra、分布式系统与推理优化前沿技术,推动新技术的验证与落地

优先资格

对 DiT 模型的推理优化有深入理解者优先考虑

AI 洞察

优缺点分析

优点

  • 深度接触前沿AI Infra技术(如Cute、Triton),技能壁垒高,市场价值大
  • 米哈游盈利能力极强,薪资待遇优厚,稳定性好
  • 业务场景复杂(大模型游戏内应用),能积累丰富的实战经验
  • 技术难度大,需要深入理解GPU架构和编译原理,学习曲线陡峭
  • 大模型推理优化需要持续跟进学术前沿,工作节奏可能较快
  • 对硬件和系统底层要求高,调试和性能分析较为耗时

缺点 / 挑战

  • 适合对计算机体系结构、GPU编程有浓厚兴趣,喜欢钻研底层性能优化,且能承受较高技术挑战的工程师

角色解读

  • 技术专家路线:深入AI Infra底层,成为分布式推理系统架构师或计算库核心开发者
  • 跨团队影响力:积累经验后主导公司级推理平台建设,推动技术标准制定
  • 管理路线:带团队负责推理优化方向,从个人贡献者转向技术管理
  • 设计和实现高可用的大模型推理服务,处理多用户并发请求,确保低延迟和弹性伸缩
  • 深入团队内的训练与推理性能优化工作,定位并解决GPU利用率、显存、通信等瓶颈
  • 跟踪AI Infra和分布式系统前沿技术,推动新技术在业务中的验证与落地
  • 扎实的GPU性能优化能力,精通CUDA、Triton、Cute等底层工具
  • 熟悉Linux高性能服务开发,具备良好的系统设计和代码规范
  • 丰富的大模型(LLM/DiT)推理优化经验,掌握量化、剪枝、FlashAttention等方案

申请策略

  • 投递前仔细研究米哈游的技术博客或公开演讲,了解其AI Infra架构,在面试中展现针对性
  • 强调持续学习意愿和团队协作能力,因为岗位需要快速跟进新技术并落地
  • 突出GPU优化项目经验:具体说明使用CUDA、Triton等工具解决了哪些性能问题,量化收益(延迟降低百分比、吞吐提升等)
  • 强调大模型推理经验:列出参与过的LLM/DiT推理服务部署案例,以及用到的优化技巧(如FlashAttention、PagedAttention)
  • 展示系统设计能力:描述高可用分布式系统的设计(负载均衡、容错、弹性伸缩),可附带架构图
  • 若CUDA经验不足,建议学习《CUDA By Example》并练习矩阵乘、Attention的算子实现
  • 掌握Triton(NVIDIA Triton Inference Server)和Triton语言(OpenAI Triton)的基本用法
  • 了解DiT(Diffusion Transformer)的推理流程和常见优化方案(如Step合并、FP16/INT8)

面试指南

  • 采用STAR法则(情境、任务、行动、结果)回答项目经历问题
  • 对于技术原理问题,先给出核心概念,再深入解释其机制,最后结合实际或业务场景说明价值
  • 对于设计问题,先列出关键需求(如并发、延迟、成本),再提出方案并权衡优缺点
  • 请描述一次你使用CUDA优化某个算子的经历,遇到了什么瓶颈,如何解决的?
  • LLM推理中常用的优化技术有哪些?请解释FlashAttention的原理和优势
  • 如何设计一个大模型推理服务的弹性伸缩策略?需要考虑哪些因素?
  • 你对DiT模型在推理阶段的优化有什么想法?
  • 请举例说明你在团队中如何推动一项新技术落地

匹配度报告

73
综合匹配度

顶级游戏公司核心AI Infra岗,薪资优厚、技术前沿,但现场办公且可能有一定强度。

适合人群
此职位最适合追求技术深度和前沿发展的工程师,对WLB要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展92
工作生活50
使命价值65

薪资福利匹配

85较高

米哈游作为盈利丰厚的公司,薪资待遇有竞争力,但JD未明确福利细节。整体补偿性动机满足度较高。

薪资信号未披露(AI估算:35K-60K/月)

成长发展匹配

92较高

岗位涉及前沿AI Infra技术,技能成长空间大,且鼓励跟踪新技术落地,发展性动机极强。

技术前沿前沿/新兴技术
技术栈GPU、CUDA、Cute、Triton、TileLang、LLM、DiT、AI Infra、分布式系统
业务类型ambiguous

工作生活匹配

50较低

JD未说明WLB和远程办公,互联网大厂推理优化岗位通常节奏较快,现场办公为主,生活化满足程度一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

65中等

岗位属于AI技术基础设施,虽然对游戏体验有间接贡献,但社会影响力中性,意义感动机满足一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 资深内网安全专家

    米哈游 · 上海市
    AI 估算 · 30k-50k
  • 场记/项目管理(动捕拍摄方向)——第三方编制

    米哈游 · 上海市
    AI 估算 · 8k-15k
  • 强化学习算法研究员

    米哈游 · 上海市
    AI 估算 · 30k-60k
  • 内网安全专家

    米哈游 · 上海市
    AI 估算 · 30k-50k
  • 动作生成研究员实习生

    米哈游 · 上海市
    AI 估算 · 4k-6k

相似职位推荐

  • 信安-后端高级开发工程师(J29230)

    58同城 · 北京市
    AI 估算 · 25k-40k
  • 高级引擎开发工程师(开放世界/SOC) 急招

    莉莉丝 · 上海市
    AI 估算 · 25k-45k
  • 测试工程师

    中国融通集团 · 上海市
    AI 估算 · 8k-15k
  • BaaS 平台研发实习生-存储&数据库部

    小红书 · 上海市
    AI 估算 · 4k-8k
  • Keeta 技术 - AI 全栈开发专家

    美团 · 北京市
    AI 估算 · 30k-50k

米哈游 的其他在招职位

  • 资深内网安全专家

    米哈游 · 上海市
    AI 估算 · 30k-50k
  • 场记/项目管理(动捕拍摄方向)——第三方编制

    米哈游 · 上海市
    AI 估算 · 8k-15k
  • 强化学习算法研究员

    米哈游 · 上海市
    AI 估算 · 30k-60k
  • 内网安全专家

    米哈游 · 上海市
    AI 估算 · 30k-50k
  • 动作生成研究员实习生

    米哈游 · 上海市
    AI 估算 · 4k-6k

相似职位推荐

  • 信安-后端高级开发工程师(J29230)

    58同城 · 北京市
    AI 估算 · 25k-40k
  • 高级引擎开发工程师(开放世界/SOC) 急招

    莉莉丝 · 上海市
    AI 估算 · 25k-45k
  • 测试工程师

    中国融通集团 · 上海市
    AI 估算 · 8k-15k
  • BaaS 平台研发实习生-存储&数据库部

    小红书 · 上海市
    AI 估算 · 4k-8k
  • Keeta 技术 - AI 全栈开发专家

    美团 · 北京市
    AI 估算 · 30k-50k