Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

AMD logo
超威半导体
AI Inference Engineer
立即应聘

AI Inference Engineer

发布于 大约 3 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
研究与开发 (研发)
PyTorch
CUDA
SGLang
vLLM
大模型推理
分布式推理
Flashattention

AI 估算 · 35k–60k

该职位为AI大模型推理方向,技术壁垒高,AMD作为国际芯片巨头,薪资对标一线互联网大厂,估算月薪35-60K。

职位详情

关于这个职位

该职位负责设计、开发和优化高效的大模型推理系统,提升算力利用率和推理性能

需要深入理解大模型算法和主流推理引擎(如vLLM、SGLang),掌握分布式推理框架和算子优化技术(CUDA/Triton)
适合对AI推理加速有浓厚兴趣、具备扎实编程和系统优化能力的技术专家

最低要求

深入理解大模型算法原理,熟悉模型结构,包括常见的GPT系列、llama系列、deepseek系列等模型

熟悉至少一种LLM主流推理引擎,如vllm、sglang等,掌握其底层技术原理,如FlashAttention、PageAttention、Continuous Batching、Speculative Decoding等,具备开发优化经验
了解分布式推理框架原理,如pd分离、Expert Parallel等
熟悉python/C/C++编程,熟练掌握pytorch等至少一种深度学习框架
有算子优化经验,包括不限于CUDA/Triton

工作职责

设计、开发和实现高效的大型模型推理系统,以提高计算性能,提升算力利用率

进行模型性能分析和调优,识别和解决瓶颈问题,提高模型推理速度
跟踪最新的研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展

优先资格

有大模型推理加速落地经验者优先

熟悉分布式推理加速框架,有超大模型分布式加速经验优先

AI 洞察

优缺点分析

优点

  • AMD作为GPU芯片巨头,能接触底层硬件优化,技术积累深厚
  • 团队氛围注重创新与协作,有机会参与高性能计算的顶层设计
  • 技术要求高,需要同时掌握算法、系统、算子优化等多方面知识,学习曲线陡峭
  • 大模型推理竞争激烈,工作强度可能较大,需持续跟进最新研究

缺点 / 挑战

  • 处于AI大模型推理的前沿领域,技术挑战高,个人成长空间大
  • 北京办公,生活成本较高,且未提及远程或弹性工作安排
  • 适合对AI推理性能优化有强烈热情,喜欢挑战底层系统难题,具备扎实编程和工程能力的资深工程师

角色解读

  • 从AI推理工程师成长为系统架构师,负责大规模推理系统设计与优化
  • 向AI基础设施方向拓展,成为GPU计算平台或分布式训练/推理专家
  • 在AMD内部可横向迁移至芯片设计、编译器优化等硬件相关岗位
  • 设计并实现高性能的大模型推理系统,优化计算性能与算力利用率
  • 对模型进行性能分析与调优,识别并解决推理瓶颈,提升推理速度
  • 跟踪AI推理技术前沿,探索并引入创新方案,推动团队技术迭代
  • 深入掌握大模型算法原理(GPT、LLaMA、DeepSeek等)及推理引擎(vLLM、SGLang)
  • 精通Python/C/C++,熟练使用PyTorch等深度学习框架
  • 具备CUDA/Triton算子优化经验,了解分布式推理框架(pd分离、Expert Parallel)

申请策略

  • 研究AMD在AI领域的战略布局(如MI系列GPU、ROCm),在面试中展示对公司技术的理解
  • 准备一个完整的推理优化案例分析,从问题诊断到方案实施,体现解决问题的思路
  • 突出大模型推理优化项目经历,具体说明使用过的推理引擎和优化技术(如FlashAttention、Continuous Batching)
  • 展示CUDA/Triton算子优化案例,量化性能提升效果(如延迟降低X%、吞吐提升Y%)
  • 提及分布式推理相关经验,如Expert Parallel或模型分片部署
  • 系统学习vLLM、SGLang等推理引擎源码,理解其核心调度和显存管理机制
  • 补充AMD ROCm生态知识,了解HIP编程模型,便于在AMD GPU上优化
  • 练习LeetCode中等难度算法题,强化C++系统编程能力

面试指南

  • 从原理到实践:先清晰解释概念,再结合自身项目经验说明如何应用
  • 用STAR法则描述项目:背景、任务、行动、结果,突出量化指标
  • 对比不同方案时,先分析优缺点,再给出选择理由
  • 请解释FlashAttention的原理及其对推理性能的影响
  • 如何优化大模型推理的显存占用和延迟?请举例说明
  • 分布式推理中Expert Parallel与Tensor Parallel的区别是什么?分别适用什么场景?
  • 描述一个你用CUDA或Triton优化算子的项目,具体做了哪些优化,达到什么效果?
  • 你对AMD ROCm平台了解多少?与CUDA相比有哪些异同?

匹配度报告

64
综合匹配度

顶级芯片公司的大模型推理研发岗,技术前沿,薪资面议,要求高,WLB未明确。

适合人群
该职位最适合追求技术成长和前沿领域探索的求职者,对薪资和生活平衡要求不高的人。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利60
成长发展85
工作生活40
使命价值70

薪资福利匹配

60中等

职位未披露具体薪资,但AMD作为国际芯片巨头薪酬具有竞争力,福利需查询官方说明,整体补偿性中等偏上。

薪资信号未披露(AI估算:35K-60K/月)

成长发展匹配

85较高

该职位处于AI大模型推理前沿,技术栈新颖(vLLM、FlashAttention等),成长空间大,但晋升路径未在JD中明确提及。

技术前沿前沿/新兴技术
技术栈大模型推理、vLLM、SGLang、FlashAttention、CUDA、Triton、分布式推理
业务类型ambiguous

工作生活匹配

40较低

职位要求仅现场办公,地点北京,未提及弹性工时或远程选项,工作强度可能较高,生活便利性一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI推理加速属于高速增长赛道,AMD在该领域积极布局,创新性强,但社会影响力为中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

超威半导体 的其他在招职位

  • AI Inference/GPU Kernel Engineer

    超威半导体 · 上海市
    AI 估算 · 25k-45k
  • Memory/SSD SMTS and team lead

    超威半导体 · 深圳市
    AI 估算 · 35k-55k
  • DFT Engineer

    超威半导体 · 上海市
    AI 估算 · 20k-35k
  • Silicon Design Engineer

    超威半导体 · 上海市
    AI 估算 · 25k-40k
  • Silicon Design Engineer

    超威半导体 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • 乘员保护性能开发工程师

    小米 · 上海市
    AI 估算 · 35k-50k
  • 密封系统工程师

    小米 · 南京市
    AI 估算 · 20k-35k
  • 小米汽车-车身工程师

    小米 · 南京市
    AI 估算 · 20k-35k
  • 小米汽车-车身工程师

    小米 · 南京市
    AI 估算 · 35k-55k
  • 次世代UE5战术射击端游-游戏引擎

    腾讯 · 深圳市
    AI 估算 · 30k-50k

超威半导体 的其他在招职位

  • AI Inference/GPU Kernel Engineer

    超威半导体 · 上海市
    AI 估算 · 25k-45k
  • Memory/SSD SMTS and team lead

    超威半导体 · 深圳市
    AI 估算 · 35k-55k
  • DFT Engineer

    超威半导体 · 上海市
    AI 估算 · 20k-35k
  • Silicon Design Engineer

    超威半导体 · 上海市
    AI 估算 · 25k-40k
  • Silicon Design Engineer

    超威半导体 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • 乘员保护性能开发工程师

    小米 · 上海市
    AI 估算 · 35k-50k
  • 密封系统工程师

    小米 · 南京市
    AI 估算 · 20k-35k
  • 小米汽车-车身工程师

    小米 · 南京市
    AI 估算 · 20k-35k
  • 小米汽车-车身工程师

    小米 · 南京市
    AI 估算 · 35k-55k
  • 次世代UE5战术射击端游-游戏引擎

    腾讯 · 深圳市
    AI 估算 · 30k-50k