Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

JD logo
京东
大模型推理部署工程师
立即应聘

大模型推理部署工程师

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
硕士
软件工程
分布式系统
RAG
AIGC
SGLang
vLLM
大模型推理
TensorRT-LLM
推理引擎优化

AI 估算 · 30k–55k

大模型推理工程师属于AI前沿方向,京东科技大厂背景,硕士及以上学历要求,薪资具有竞争力,参考一线互联网AI岗位,月薪在30-55K之间。

职位详情

关于这个职位

作为京东云AI Infra团队的大模型推理部署工程师,你将专注于构建和优化大模型推理架构,设计高并发、低延迟的分布式推理服务,并参与RAG、AIGC等前沿应用开发

团队技术氛围浓厚,致力于打造业界领先的推理平台

最低要求

教育背景:计算机科学、软件工程、人工智能或相关STEM领域的硕士及以上学历

技术基石:
扎实的计算机科学基础和良好的工程实践能力
精通至少一种主流编程语言(如Python,C++),具备出色的编码和调试能力
熟悉主流大模型推理引擎和优化技术(如 vLLM, SGLang, TensorRT-LLM等)
软性素质:
沟通协作:具备出色的沟通表达能力和高效的团队协作精神
技术追求:对技术有强烈的好奇心与钻研精神,追求卓越
解决问题:具备优秀的自驱力,能主动发现问题、分析问题并创造性地解决问题
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信

工作职责

构建AI云推理架构: 探索PD分离、KV池化、通信优化等技术,设计并实现适用于AI原生的分布式推理服务架构,应对高并发、低延迟挑战

开发核心推理平台能力: 打造AI原生网关及高可用系统,核心技术点包括但不限于:异构资源调度、身份认证与鉴权、请求智能限流、动态模型路由、推理容器/镜像加速、安全变更管控、系统深度可观测性等
参与推理全栈应用实践: 积极涉足推理服务上下游应用开发,如构建RAG(检索增强生成)系统、探索提示词工程优化实践、参与AI模型市场(MCP)建设或AIGC应用落地等

优先资格

拥有云计算系统、机器学习平台、分布式计算、中间件等领域的相关开发或落地经验者优先

在机器学习/系统领域顶级会议(如 ATC,ASPLOS, OSDI, MLSys,WWW等)发表论文
作为核心贡献者深度参与知名开源项目,如 vLLM, SGLang, TensorRT-LLM等
在相关国际竞赛中取得突出成绩

AI 洞察

优缺点分析

优点

  • 大模型推理是当前AI领域最热的方向之一,技术壁垒高,职业前景广阔
  • 京东科技提供丰富的业务场景和海量数据,有助于积累实战经验
  • 团队技术氛围浓厚,鼓励开源贡献和技术创新,个人成长空间大
  • 高并发低延迟场景下,故障排查和性能调优难度大,需要较强的逻辑思维和耐心
  • 技术迭代极快,需要持续跟进最新论文和开源项目,保持技术更新

缺点 / 挑战

  • 大模型推理涉及大量底层优化和系统设计,对综合能力要求较高,学习曲线陡峭
  • 适合对AI系统底层有浓厚兴趣、喜欢解决性能挑战、具备较强工程能力的开发者,特别是对分布式计算和推理优化有热情的人

角色解读

  • 从推理部署工程师向AI系统架构师发展,负责更大规模、更复杂的AI基础设施设计
  • 深入底层推理优化,成为GPU计算或编译器方向的专家
  • 横向拓展至训练框架或算法领域,成为全栈AI工程师
  • 设计并实现高吞吐、低延迟的大模型推理服务架构,探索PD分离、KV池化等优化技术
  • 开发AI原生网关和推理平台核心能力,包括异构资源调度、请求限流、动态路由等
  • 参与RAG、AIGC等推理全栈应用开发,推动大模型在业务中的落地
  • 精通Python或C++,具备扎实的编码和调试能力
  • 熟悉主流推理引擎如vLLM、SGLang、TensorRT-LLM,了解其优化原理
  • 具备分布式系统、云计算或机器学习平台开发经验,理解高并发架构设计

申请策略

  • 在简历中明确标注熟悉哪些推理引擎和优化技术,并附上相关项目链接或GitHub
  • 面试前了解京东云AI Infra团队的公开技术分享或开源项目,展现对团队技术方向的关注
  • 突出大模型推理相关的项目经验,如使用vLLM优化推理延迟、设计高并发推理服务等
  • 展示对推理引擎源码的深入理解或开源贡献,如提交PR到vLLM或SGLang
  • 强调分布式系统、性能优化方面的成果,如吞吐量提升、延迟降低的具体数据
  • 深入学习一个主流推理引擎(如vLLM)的架构和实现,尝试理解其调度和显存管理机制
  • 补充CUDA编程或GPU底层优化知识,有助于理解PD分离、KV池化等技术的原理
  • 动手搭建一个简单的推理服务,结合RAG或提示词工程,将理论知识转化为实践

面试指南

  • 对于原理类问题,先给出核心概念,然后结合具体实现(如源码或论文)进行阐述,最后提及优缺点或改进方向
  • 对于设计题,采用结构化回答:先明确需求(吞吐、延迟、可用性),再分模块讨论(网关、调度、缓存、容错),最后总结权衡
  • 请解释vLLM中PagedAttention的原理及其对显存利用的优化
  • 如何设计一个高并发、低延迟的推理服务架构?请从PD分离、负载均衡等角度阐述
  • 假设模型推理时出现显存溢出,如何定位和优化?
  • 描述一次你优化分布式系统性能的经历,用了哪些方法?效果如何?
  • 对RAG系统了解多少?如果让你设计一个RAG pipeline,关键步骤是什么?
  • 复习主流推理引擎的论文和技术博客(vLLM、SGLang、TensorRT-LLM),理解关键优化点

匹配度报告

72
综合匹配度

京东大模型推理工程师,前沿技术栈、强发展性、薪资高,但工作强度可能较大。

适合人群
最适合追求技术成长和前沿挑战的求职者,如果非常看重WLB可能需要慎重。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值70

薪资福利匹配

80较高

京东作为上市公司,薪资福利有竞争力,但JD未明确薪资范围。岗位为技术核心,薪酬水平应属市场高水准。

薪资信号未披露(AI估算:30K-55K/月)

成长发展匹配

90较高

职位涉及前沿大模型推理技术,团队鼓励技术创新和开源贡献,提供广阔的成长空间和富有挑战性的项目,发展性极强。

技术前沿前沿/新兴技术
技术栈大模型推理、vLLM、SGLang、TensorRT-LLM、PD分离、KV池化、RAG、AIGC
成长机会广阔的成长空间、富有挑战性的项目
业务类型profit_center

工作生活匹配

50较低

工作地点在北京, JD未提及弹性工作或远程,大厂研发岗位通常需要高强度投入,WLB一般。

工作模式未明确
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型推理是AI基础设施核心,对推动AI应用落地有重要意义,但JD未强调社会价值。京东科技的AI业务属于商业应用,意义感中等偏上。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 采销岗

    京东 · 广东省
    AI 估算 · 25k-40k
  • 销售经理

    京东 · 青海省
    AI 估算 · 6k-10k
  • 应付结算专员

    京东 · 北京市
    AI 估算 · 10k-20k
  • 履约运营岗

    京东 · 湖南省
    AI 估算 · 8k-15k
  • 亚太财务会计岗(北京)

    京东 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • 辅助驾驶HMI后处理研发工程师-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 服务端高级研发工程师

    小米 · 武汉市
    AI 估算 · 25k-40k
  • 高级语音测试开发工程师

    小米 · 北京市
    AI 估算 · 30k-45k
  • 微信-基础功能后台开发

    腾讯 · 广州市
    AI 估算 · 20k-35k
  • 微信-AI应用开发工程师

    腾讯 · 广州市
    AI 估算 · 20k-40k

京东 的其他在招职位

  • 采销岗

    京东 · 广东省
    AI 估算 · 25k-40k
  • 销售经理

    京东 · 青海省
    AI 估算 · 6k-10k
  • 应付结算专员

    京东 · 北京市
    AI 估算 · 10k-20k
  • 履约运营岗

    京东 · 湖南省
    AI 估算 · 8k-15k
  • 亚太财务会计岗(北京)

    京东 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • 辅助驾驶HMI后处理研发工程师-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 服务端高级研发工程师

    小米 · 武汉市
    AI 估算 · 25k-40k
  • 高级语音测试开发工程师

    小米 · 北京市
    AI 估算 · 30k-45k
  • 微信-基础功能后台开发

    腾讯 · 广州市
    AI 估算 · 20k-35k
  • 微信-AI应用开发工程师

    腾讯 · 广州市
    AI 估算 · 20k-40k