Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

JD logo
京东
大模型推理部署工程师
立即应聘

大模型推理部署工程师

发布于 大约 2 个月前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
硕士
软件工程
分布式系统
RAG
AIGC
推理引擎
SGLang
vLLM
TensorRT-LLM

AI 估算 · 30k–50k

大模型推理部署技术稀缺,北京互联网大厂高级工程师,薪资竞争力强,参考市场水平。

职位详情

关于这个职位

京东云事业部AI Infra团队招聘大模型推理部署工程师,负责构建AI原生分布式推理服务架构,开发核心推理平台能力,并参与RAG系统、提示词工程等推理全栈应用实践

适合对前沿大模型技术有热情、具备系统开发经验的人才

最低要求

计算机科学、软件工程、人工智能或相关STEM领域的硕士及以上学历

扎实的计算机科学基础和良好的工程实践能力
精通至少一种主流编程语言(如Python,C++),具备出色的编码和调试能力
熟悉主流大模型推理引擎和优化技术(如 vLLM, SGLang, TensorRT-LLM等)

工作职责

构建AI云推理架构:探索PD分离、KV池化、通信优化等技术,设计并实现适用于AI原生的分布式推理服务架构,应对高并发、低延迟挑战

开发核心推理平台能力:打造AI原生网关及高可用系统,核心技术点包括但不限于:异构资源调度、身份认证与鉴权、请求智能限流、动态模型路由、推理容器/镜像加速、安全变更管控、系统深度可观测性等
参与推理全栈应用实践:积极涉足推理服务上下游应用开发,如构建RAG(检索增强生成)系统、探索提示词工程优化实践、参与AI模型市场(MCP)建设或AIGC应用落地等

优先资格

拥有云计算系统、机器学习平台、分布式计算、中间件等领域的相关开发或落地经验者优先

在机器学习/系统领域顶级会议(如 ATC,ASPLOS, OSDI, MLSys,WWW等)发表论文
作为核心贡献者深度参与知名开源项目,如 vLLM, SGLang, TensorRT-LLM等
在相关国际竞赛中取得突出成绩

AI 洞察

优缺点分析

优点

  • 前沿技术栈:接触大模型推理优化、分布式系统等最新技术,提升行业竞争力
  • 团队氛围:技术驱动,注重创新,鼓励开源贡献与论文发表
  • 技术深度要求高:需要同时掌握系统、算法、工程等多领域知识,学习曲线陡峭
  • 竞争激烈:大模型推理是热门方向,内部外部人才竞争激烈
  • 适合对AI系统充满热情、乐于钻研底层优化、具备分布式系统背景的技术型人才

缺点 / 挑战

  • 大厂平台:京东云提供大规模真实业务场景,技术挑战大,成长空间广阔
  • 工作强度可能较大:大模型迭代快,项目交付压力存在,可能需要应对突发问题

角色解读

  • 技术深耕:成为大模型推理架构专家,领导核心组件设计与优化
  • 领域拓展:向AI Infra全栈发展,覆盖训练、推理、模型服务等方向
  • 管理晋升:从技术骨干逐步成长为团队技术负责人或架构师
  • 设计并实现AI原生分布式推理服务架构,优化PD分离、KV池化等技术,应对高并发低延迟挑战
  • 开发AI原生网关及高可用系统,涵盖异构资源调度、请求限流、动态模型路由等核心平台能力
  • 参与RAG系统、提示词工程、AI模型市场等推理全栈应用实践,推动大模型落地
  • 扎实的编程能力,精通Python或C++,熟悉主流大模型推理引擎如vLLM、SGLang、TensorRT-LLM
  • 深入理解分布式系统、云计算、异构资源调度,有机器学习平台或中间件开发经验
  • 具备系统优化思维,熟悉通信优化、容器化部署、可观测性等技术

申请策略

  • 深入了解京东云AI Infra的业务场景(如零售、物流),面试中展示业务理解
  • 准备系统设计题,如设计高并发推理服务架构
  • 突出大模型推理引擎或分布式系统开发经验,详细描述优化成果(如吞吐量、延迟提升)
  • 展示开源贡献(vLLM等)或相关论文发表,体现技术深度
  • 强调编程能力、系统设计案例,可用项目或竞赛成绩证明
  • 补齐推理引擎(vLLM、TensorRT-LLM)的使用与源码理解
  • 学习Kubernetes、容器化部署、分布式调度等基础设施知识
  • 关注PD分离、KV池化等前沿优化技术,阅读相关论文

面试指南

  • 先阐明目标(高吞吐、低延迟、高可用),再分层次设计:接入层(网关、限流)、调度层(资源管理、模型路由)、执行层(推理引擎优化、通信优化)
  • 针对优化问题:识别瓶颈(如显存、计算、通信),提出具体方案(如PD分离减少碎片、KV池化复用缓存),并说明trade-off
  • 项目介绍使用STAR原则:情境、任务、行动、结果,突出量化成果
  • 请设计一个高吞吐、低延迟的大模型推理服务架构
  • 解释PD分离和KV池化的原理,以及它们如何提升推理性能?
  • 你如何优化vLLM或SGLang中的一个性能瓶颈?请举例
  • 如何处理推理请求的限流和动态路由?
  • 你过去在分布式系统或机器学习平台项目中的具体贡献是什么?

匹配度报告

74
综合匹配度

大厂AI Infra团队,前沿技术栈,技术成长快,但工作强度可能大。

适合人群
最适合重视技术成长和前沿探索的求职者,对WLB要求较高的要谨慎。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值75

薪资福利匹配

80较高

京东作为已上市巨头,薪资福利有竞争力,但JD未提及具体薪资和福利细节,因此保守评分。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

职位涉及前沿大模型推理技术,参与核心平台建设,技术成长空间大,但JD未明确提及晋升路径。

技术前沿前沿/新兴技术
技术栈Python、C++、vLLM、SGLang、TensorRT-LLM、分布式系统、推理引擎、PD分离、KV池化、RAG
业务类型profit_center

工作生活匹配

50较低

JD未提及远程或弹性工作,也未提及WLB相关信号,且大厂AI岗位通常工作强度较高。

工作模式未明确
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

75中等

大模型是高速增长赛道,京东云AI Infra团队助推业务生态,有一定社会影响力,但JD未提及使命导向内容。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 储备片区负责人

    京东 · 江西省
    AI 估算 · 20k-35k
  • 供应链规划岗

    京东 · 长春市
    AI 估算 · 10k-20k
  • 物资支持岗(外卖方向)

    京东 · 河南省
    AI 估算 · 10k-18k
  • 消费信贷产品运营

    京东 · 广东省
    AI 估算 · 20k-40k
  • 业务支持-AMC方向

    京东 · 山东省
    AI 估算 · 15k-25k

相似职位推荐

  • 联盟广告算法工程师-商业算法

    小红书 · 北京市
    AI 估算 · 25k-45k
  • AI应用开发工程师-实习

    小红书 · 北京市
    AI 估算 · 3k-5k
  • 微信-高级算法工程师-音频理解/ASR/对话模型方向

    腾讯 · 北京市
    AI 估算 · 30k-60k
  • Project T UE5 客户端开发工程师(性能优化)

    腾讯 · 上海市
    AI 估算 · 25k-45k
  • Project T UE5 高级引擎开发

    腾讯 · 上海市
    AI 估算 · 30k-50k

京东 的其他在招职位

  • 储备片区负责人

    京东 · 江西省
    AI 估算 · 20k-35k
  • 供应链规划岗

    京东 · 长春市
    AI 估算 · 10k-20k
  • 物资支持岗(外卖方向)

    京东 · 河南省
    AI 估算 · 10k-18k
  • 消费信贷产品运营

    京东 · 广东省
    AI 估算 · 20k-40k
  • 业务支持-AMC方向

    京东 · 山东省
    AI 估算 · 15k-25k

相似职位推荐

  • 联盟广告算法工程师-商业算法

    小红书 · 北京市
    AI 估算 · 25k-45k
  • AI应用开发工程师-实习

    小红书 · 北京市
    AI 估算 · 3k-5k
  • 微信-高级算法工程师-音频理解/ASR/对话模型方向

    腾讯 · 北京市
    AI 估算 · 30k-60k
  • Project T UE5 客户端开发工程师(性能优化)

    腾讯 · 上海市
    AI 估算 · 25k-45k
  • Project T UE5 高级引擎开发

    腾讯 · 上海市
    AI 估算 · 30k-50k