Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

JD logo
京东
高可用/AI infra研发岗
立即应聘

高可用/AI infra研发岗

发布于 2 天前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
信息技术与基础设施
分布式系统
GPU
PyTorch
CUDA
容错
高可用
Ai Infra

AI 估算 · 25k–45k

京东大厂AI infra岗位,技术难度高且市场稀缺,北京地区3年以上经验薪资普遍在25k-45k之间,加上大厂年终奖,综合收入可观。

职位详情

关于这个职位

该职位负责京东跨境电商AI基础设施的架构设计与优化,包括调度系统(Kubernetes/Ray)、GPU集群高可用性、效能评估等

需要深厚分布式系统和高性能计算经验,精通Python,并了解深度学习框架底层原理
适合有技术热情、追求前沿AI Infra技术的研发人员

最低要求

具有 3 年以上 AI 基础架构、分布式系统、高性能计算(HPC)或大型云平台开发经验

精通 Python,具备扎实的数据结构与算法功底,编码风格严谨
具备极强的自驱力和技术好奇心,能够主动追踪业界最前沿的 AI Infra 技术动态
计算机、电子信息、自动化、应用数学等相关专业本科及以上学历

工作职责

参与京东跨境电商AI Infro技术架构体系建设,制定和推进架构规范的落实

负责复杂技术项目的顶层方案设计,完成关键技术问题判断和事情的拆解
调度系统优化:参与智算操作系统研发,优化 Kubernetes 或 Ray 的 GPU 资源调度能力
高可用性保障:解决GPU集群的故障恢复(Fault Tolerance)与弹性容错(弹性 Checkpoint)
效能与可观测性:构建集群效能评估模型,精准度量算力资源利用率(MFU/HFU)
跟踪行业趋势和技术前沿,根据业务实际需求,为团队引入新技术和新方案

优先资格

加分项:深入理解 PyTorch/Megatron-LM/DeepSpeed 的底层实现源码及运行机制

加分项:精通 GPU/NPU 架构,具备 CUDA C/C++ 或 Triton 实际开发与调优经验
有跨境电商经验者优先

AI 洞察

优缺点分析

优点

  • 聚焦AI Infra前沿技术,如集群调度、GPU优化,市场稀缺度高
  • 参与跨境电商核心业务,技术影响力直接辐射全球
  • 技术复杂度高,需要持续学习最新架构和工具
  • 互联网大厂工作节奏较快,可能需要应对紧急问题
  • 岗位要求全面,分布式、AI框架、调度系统等都要涉及
  • 适合热爱底层基础设施、对AI计算效率有热情,且愿意在技术深度上不断精进的研发人员

缺点 / 挑战

  • 京东大厂平台,业务场景丰富,技术挑战大,成长空间广阔

角色解读

  • 在AI Infra领域深耕,成为分布式系统或GPU优化专家
  • 向技术架构师方向演进,主导大型平台的设计与演进
  • 横向拓展至AI平台、数据中心等更大规模基础设施领域
  • 参与跨境电商AI基础设施架构设计,制定技术规范和方案
  • 负责复杂技术项目的顶层设计,拆解关键技术问题并推动落地
  • 优化Kubernetes或Ray调度系统,提升GPU资源利用率
  • 保障GPU集群高可用性,实现故障恢复与弹性容错机制
  • 精通Python,具备扎实的数据结构与算法能力
  • 深入理解分布式系统、高性能计算或云平台开发
  • 熟悉Kubernetes、Ray等资源调度框架
  • 了解PyTorch、Megatron-LM、DeepSpeed等深度学习框架的底层实现

申请策略

  • 了解京东零售和跨境电商的业务背景,在面试中展示技术如何赋能业务
  • 准备一个你解决过的复杂分布式系统或性能优化案例,体现系统思维
  • 突出分布式系统或高性能计算项目经验,尤其是Kubernetes、GPU相关
  • 展示Python和数据结构功底,可附上GitHub链接
  • 如有PyTorch/Megatron-LM/DeepSpeed源码理解或CUDA优化经历,重点强调
  • 深入学习Kubernetes调度原理和GPU资源管理
  • 阅读PyTorch、DeepSpeed等框架的源码,理解其底层机制

面试指南

  • 对于原理类问题,用STAR法则:背景、任务、行动、结果,并结合具体技术细节
  • 对于设计类问题,先明确需求约束,再分层阐述架构(如调度层、计算层、存储层、监控层)
  • 对于故障案例,突出排查过程、根因分析、解决方案和预防措施
  • 请解释Kubernetes调度GPU资源的原理及常见问题
  • 如何设计一个高可用的分布式训练集群?
  • 谈谈你对PyTorch DDP和Megatron-LM并行的理解
  • 如何评估和优化GPU集群的MFU/HFU?
  • 你过去解决过的一个最复杂的分布式系统故障案例

匹配度报告

74
综合匹配度

京东AI infra技术岗,前沿技术栈,高成长性,但WLB一般。

适合人群
适合以技术成长和薪资回报为核心动机,能接受现场办公节奏的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展85
工作生活60
使命价值70

薪资福利匹配

80较高

京东大厂薪资福利有竞争力,但JD未明确具体数字,属于市场水准。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

85较高

技术方向前沿(AI Infra、GPU调度、分布式系统),成长路径清晰,但JD未提及晋升通道。

技术前沿前沿/新兴技术
技术栈Kubernetes、Ray、GPU、PyTorch、Megatron-LM、DeepSpeed、CUDA
业务类型profit_center

工作生活匹配

60中等

北京现场办公,大厂通常有弹性工时但未在JD中说明,双休基本保障。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施支撑跨境电商,行业有增长潜力,社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 本地生活公关策划

    京东 · 北京市
    AI 估算 · 20k-35k
  • 站长岗(团队负责人)

    京东 · 湖北省
    AI 估算 · 12k-20k
  • 税务岗

    京东 · 深圳市
    AI 估算 · 20k-40k
  • 采购高级经理

    京东 · 广东省
    AI 估算 · 25k-45k
  • 快快规划岗

    京东 · 福建省
    AI 估算 · 12k-20k

相似职位推荐

  • Staff Machine Learning Engineer, ML Infrastructure - Online

    Unity Technologies · 上海市
    AI 估算 · 50k-80k
  • 运维工程开发实习生-【架构治理/SRE】

    快手 · 北京市
    AI 估算 · 4k-6k
  • AI服务DevOps工程师

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 22301-Digital Talent Trainee

    梅特勒托利多 · 上海市
    AI 估算 · 12k-18k
  • IT iNTERN

    美敦力 · 上海市
    AI 估算 · 4k-6k

京东 的其他在招职位

  • 本地生活公关策划

    京东 · 北京市
    AI 估算 · 20k-35k
  • 站长岗(团队负责人)

    京东 · 湖北省
    AI 估算 · 12k-20k
  • 税务岗

    京东 · 深圳市
    AI 估算 · 20k-40k
  • 采购高级经理

    京东 · 广东省
    AI 估算 · 25k-45k
  • 快快规划岗

    京东 · 福建省
    AI 估算 · 12k-20k

相似职位推荐

  • Staff Machine Learning Engineer, ML Infrastructure - Online

    Unity Technologies · 上海市
    AI 估算 · 50k-80k
  • 运维工程开发实习生-【架构治理/SRE】

    快手 · 北京市
    AI 估算 · 4k-6k
  • AI服务DevOps工程师

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 22301-Digital Talent Trainee

    梅特勒托利多 · 上海市
    AI 估算 · 12k-18k
  • IT iNTERN

    美敦力 · 上海市
    AI 估算 · 4k-6k