Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/京东/大模型推理部署工程师
JD logo
J
京东 (JD)

职位信息

北京市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

分布式系统RAGAIGC推理引擎SGLangvLLMTensorRT-LLM
💡

核心评价

大厂AI Infra团队,前沿技术栈,技术成长快,但工作强度可能大。

大模型推理部署工程师

🤖 AI 估测:¥30K-50K

发布时间:大约 19 小时前

立即应聘

ℹ️关于这个职位

京东云事业部AI Infra团队招聘大模型推理部署工程师,负责构建AI原生分布式推理服务架构,开发核心推理平台能力,并参与RAG系统、提示词工程等推理全栈应用实践
适合对前沿大模型技术有热情、具备系统开发经验的人才

✓工作职责

构建AI云推理架构:探索PD分离、KV池化、通信优化等技术,设计并实现适用于AI原生的分布式推理服务架构,应对高并发、低延迟挑战
开发核心推理平台能力:打造AI原生网关及高可用系统,核心技术点包括但不限于:异构资源调度、身份认证与鉴权、请求智能限流、动态模型路由、推理容器/镜像加速、安全变更管控、系统深度可观测性等
参与推理全栈应用实践:积极涉足推理服务上下游应用开发,如构建RAG(检索增强生成)系统、探索提示词工程优化实践、参与AI模型市场(MCP)建设或AIGC应用落地等

⭐最低要求

计算机科学、软件工程、人工智能或相关STEM领域的硕士及以上学历
扎实的计算机科学基础和良好的工程实践能力
精通至少一种主流编程语言(如Python,C++),具备出色的编码和调试能力
熟悉主流大模型推理引擎和优化技术(如 vLLM, SGLang, TensorRT-LLM等)

👍优先资格

拥有云计算系统、机器学习平台、分布式计算、中间件等领域的相关开发或落地经验者优先
在机器学习/系统领域顶级会议(如 ATC,ASPLOS, OSDI, MLSys,WWW等)发表论文
作为核心贡献者深度参与知名开源项目,如 vLLM, SGLang, TensorRT-LLM等
在相关国际竞赛中取得突出成绩
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 服务支持负责人

    京东

    江苏省 · 仅现场办公

  • 机器人机械设计工程师(传动)

    京东

    北京市 · 仅现场办公

  • 运营调度岗

    京东

    贵州省 · 仅现场办公

  • 采销岗

    京东

    北京市 · 仅现场办公

  • 采销

    京东

    北京市 · 仅现场办公

相似职位推荐

  • java开发工程师

    中国平安

    上海市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 知识工程架构师

    中国平安

    深圳市 · 仅现场办公

  • 支付AI应用开发工程师

    快手

    北京市 · 仅现场办公

  • 大模型资源运营研发工程师

    快手

    北京市 · 仅现场办公