Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

JD logo
京东
AI Infra优化工程师
立即应聘

AI Infra优化工程师

发布于 大约 15 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
硕士
GPU
NCCL
MLIR
分布式训练
NPU
推理优化
大模型
TVM
SGLang
vLLM

AI 估算 · 30k–55k

高级AI infra工程师岗位,技术栈前沿稀缺,大厂薪资竞争力强,综合市场行情估算。

职位详情

关于这个职位

该职位是京东云AI Infra团队的优化工程师,专注于大模型推理与训练系统的性能优化

你将参与vLLM/SGLang等框架的深度定制、AI编译器优化、高性能算子开发以及系统工具链建设,直接支撑京东集团内外的大模型业务
适合对AI系统栈有深厚兴趣、追求技术前沿的工程师

最低要求

硕士及以上学历,计算机/电子/AI相关专业

年以上AI系统/HPC/深度学习框架/编译器开发经验
至少精通以下一个方向:
推理框架:有vLLM/SGLang/TensorRT-LLM深度开发与生产调优经验,掌握Continuous Batching、KV Cache、量化、Spec Decoding等核心技术
AI编译器:精通TVM/MLIR至少一种,具备IR优化或代码生成经验,国产芯片编译器经验优先
高性能算子:熟悉至少一种国产NPU架构与指令集,具备FA/MLA/MoE等大模型算子开发部署经验
精通GPU/NPU微架构与内存层次,熟悉NCCL/HCCL及TP/PP/EP/CP分布式并行范式
熟练使用Nsight Systems/Compute、PyTorch Profiler等工具
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信

工作职责

推理架构与引擎开发:分析LLM/多模态模型计算图与数据流,设计模型切分、并行策略、通信拓扑、量化方案等端到端架构

完成性能建模与TCO评估
主导PD分离、Attention-FFN分离等前沿架构落地,基于vLLM/SGLang/TensorRT-LLM在CPU/GPU/NPU异构集群上实现精度无损、性能最优
AI编译器优化:深度优化TVM、MLIR等中间表示层,突破算子融合、内存分配、指令调度瓶颈
面向国产芯片设计自动化优化策略,支撑大模型训练与推理高效部署
高性能算子开发:开发GPU/国产NPU上的FA、MLA、MoE、SWA等大模型核心算子,以及AllReduce/AllGather等集合通信算子
定位精度与性能问题
系统工具链建设:构建异构集群调度、监控、一键部署与弹性伸缩平台
开发全链路Profiling与精度诊断工具(算子→通信→调度)
前沿技术落地:追踪并落地Speculative Decoding、动态批处理、MoE EP、长上下文、KV Cache压缩与Offload、低比特量化(W4A8/FP8/GPTQ/AWQ)、计算通信Overlap、端云协同等技术

优先资格

百卡以上集群调优、开源社区贡献者优先

AI 洞察

优缺点分析

优点

  • 前沿技术栈:接触大模型推理最核心的优化技术,行业竞争力强
  • 大厂平台:京东云计算场景丰富,数据量大,实战机会多
  • 团队氛围:技术驱动,鼓励创新,开源社区贡献受认可
  • 成长空间:参与从底层算子到上层系统的全链路开发,技能广度深度兼备
  • 技术门槛高:需要同时掌握硬件架构、编译器和并行计算等多个领域
  • 工作强度大:大模型迭代快,项目周期紧,可能需要应对紧急调优任务
  • 竞争激烈:AI Infra领域人才稀缺但要求极高,需持续学习跟进

缺点 / 挑战

  • 适合对底层系统性能优化有强烈兴趣、喜欢挑战技术难题、具备扎实的计算机系统背景和分布式编程经验的工程师

角色解读

  • 技术深耕方向:成为AI系统架构专家,主导推理优化核心技术
  • 管理方向:带领团队负责AI基础设施平台,晋升为技术经理或架构师
  • 业务拓展方向:结合京东业务场景,推动AI Infra在推荐、搜索等领域的落地
  • 设计并优化大模型推理系统架构,包括模型切分、并行策略和量化方案
  • 深度开发vLLM/SGLang等推理框架,实现高性能推理引擎
  • 编写GPU/NPU上的高性能算子(如Attention、MoE)和集合通信算子
  • 构建集群监控、调度、Profiling工具链,提升系统可靠性和效率
  • 精通至少一种AI推理框架(vLLM、SGLang、TensorRT-LLM)或编译器(TVM、MLIR)
  • 深入理解GPU/NPU微架构,熟悉分布式并行范式(TP/PP/EP/CP)
  • 具备C++/Python编程能力,熟悉CUDA或国产芯片编程
  • 有大规模集群调优经验,熟悉Profiling工具(Nsight、PyTorch Profiler)

申请策略

  • 面试前熟悉京东云AI Infra的技术文章或开源项目,展示对团队技术方向的理解
  • 准备一个完整的系统优化案例,从问题定位到方案实施和效果量化
  • 突出在推理框架(vLLM等)或编译器(TVM/MLIR)上的开发或调优经验
  • 展示高性能算子开发项目,包括性能数据(如加速比、吞吐量)
  • 强调大规模集群(百卡以上)的优化案例,附上Profiling分析结果
  • 提及开源贡献或技术博客,体现技术影响力
  • 补充学习国产NPU(如寒武纪、昇腾)编程和优化方法
  • 深入了解LLM推理的最新论文,如Speculative Decoding、KV Cache压缩

面试指南

  • 对于性能优化类问题,采用'问题-分析-方案-结果'的STAR结构
  • 对于架构设计类问题,先明确约束条件(模型大小、延迟要求、成本),再比较不同方案
  • 对于工具使用类问题,结合实际案例说明Profiling流程和调试技巧
  • 请解释vLLM中Continuous Batching的原理,如何实现高吞吐?
  • 如何优化Transformer推理中的KV Cache?列举几种压缩或Offload策略
  • 描述一次你调试GPU算子的性能瓶颈的经历,使用了哪些工具?
  • TP和PP的优缺点是什么?在什么场景下选择EP?
  • 你对MLIR的理解?如何用于算子融合?

匹配度报告

69
综合匹配度

大厂前沿技术岗,薪资优厚、成长空间大,但工作强度高、WLB一般。

适合人群
最适合追求技术深度和职业成长、能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利78
成长发展92
工作生活40
使命价值65

薪资福利匹配

78中等

京东作为上市巨头,薪资福利具备竞争力,但JD未明确具体数字和福利,综合评估补偿性中等偏上。

薪资信号未披露(AI估算:30K-55K/月)

成长发展匹配

92较高

职位涉及最前沿的AI Infra技术栈(vLLM、TVM、NPU等),成长空间极大,团队技术驱动,持续创新。

技术前沿前沿/新兴技术
技术栈vLLM、SGLang、TensorRT-LLM、TVM、MLIR、GPU、NPU、大模型、分布式训练、推理优化
成长机会广阔的成长空间、富有挑战性的项目
业务类型profit_center

工作生活匹配

40较低

JD未提及工作模式或WLB,互联网大厂通常强度较高,且上海现场办公,通勤压力可能较大。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

65中等

AI Infra是数字经济的基础设施,但京东作为电商平台,社会影响力中性,团队使命聚焦技术支撑。

行业发展高速增长赛道
社会影响中性/一般
使命信号高效支持和驱动京东集团内外部的大模型业务生态及智能体应用
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 评测算法工程师

    京东 · 北京市
    AI 估算 · 25k-40k
  • 站长岗(团队负责人)

    京东 · 河南省
    AI 估算 · 8k-15k
  • 产品技术专家(个人防护)

    京东 · 北京市
    AI 估算 · 30k-50k
  • 生态女装采销

    京东 · 上海市
    AI 估算 · 15k-25k
  • 内衣生态采销岗

    京东 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • Unity客户端开发工程师-【游戏事业部】

    快手 · 广州市
    AI 估算 · 15k-30k
  • 前端研发实习生-【用户体验】

    快手 · 北京市
    AI 估算 · 4k-7k
  • JAVA开发-语音后端

    中国平安 · 深圳市
    AI 估算 · 35k-50k
  • 资深Agent算法工程师

    中国平安 · 深圳市
    AI 估算 · 30k-60k
  • 算法

    中国平安 · 上海市
    AI 估算 · 25k-45k

京东 的其他在招职位

  • 评测算法工程师

    京东 · 北京市
    AI 估算 · 25k-40k
  • 站长岗(团队负责人)

    京东 · 河南省
    AI 估算 · 8k-15k
  • 产品技术专家(个人防护)

    京东 · 北京市
    AI 估算 · 30k-50k
  • 生态女装采销

    京东 · 上海市
    AI 估算 · 15k-25k
  • 内衣生态采销岗

    京东 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • Unity客户端开发工程师-【游戏事业部】

    快手 · 广州市
    AI 估算 · 15k-30k
  • 前端研发实习生-【用户体验】

    快手 · 北京市
    AI 估算 · 4k-7k
  • JAVA开发-语音后端

    中国平安 · 深圳市
    AI 估算 · 35k-50k
  • 资深Agent算法工程师

    中国平安 · 深圳市
    AI 估算 · 30k-60k
  • 算法

    中国平安 · 上海市
    AI 估算 · 25k-45k