Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

JD logo
京东
推理引擎工程师(大模型/CTR/端)
立即应聘

推理引擎工程师(大模型/CTR/端)

发布于 大约 3 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
软件工程
分布式系统
GPU优化
LLM
多模态
模型蒸馏
模型量化
大模型推理
编译优化
端侧部署

AI 估算 · 35k–65k

北京上市大厂,3-5年经验推理优化方向热门,薪资竞争力强,中位数5万。

职位详情

关于这个职位

该职位主要负责京东零售业务中推理引擎的性能优化与部署,涵盖大模型(如LLM多模态)、CTR模型(推荐/搜索/广告)以及端侧模型的轻量化部署

你将针对不同业务场景定制高性能推理解决方案,通过GPU算子优化、编译优化、模型量化等技术降低延迟、提升吞吐,并推动前沿推理技术的落地与突破

最低要求

本科及以上学历,3-5年机器学习/推理优化研发经验

LLM方向:需熟练掌握大模型推理引擎的优化技术、大模型多模态/文生图/文生视频等大模型算法
具备扎实的学术能力或者是大模型推理引擎开源项目的负责人,具有大模型推理引擎领域发展的前瞻能力
CTR方向:需熟练掌握CTR场景的模型推理的优化技术,熟悉推荐、搜索、广告场景的引擎框架和分布式系统
具备扎实的高性能计算、分布式、GPU算子、编译优化、图优化、存储等经验者优先
端方向:需熟练掌握端上推理的优化技术,熟悉编译优化、端上高性能代码生成、内存优化等
熟练掌握模型优化能力,熟悉模型量化、模型蒸馏、模型压缩等经验者优先

工作职责

负责大模型、CTR模型及端侧模型的推理性能优化与部署,根据业务场景(如LLM多模态生成、推荐/搜索/广告、移动端/嵌入式设备)定制高性能推理解决方案

针对大模型推理场景,优化推理引擎性能,支持文生图、文生视频等多模态任务的低延迟、高吞吐部署
在CTR场景中,优化推荐/广告系统的分布式推理框架,通过GPU算子优化、编译优化、图优化等技术提升大规模稀疏模型的服务效率
负责端侧模型的轻量化部署,通过模型量化、蒸馏、压缩及端上编译优化实现模型在资源受限环境的高效运行
跟踪前沿推理技术,主导开源项目或关键技术攻关,推动团队在推理性能、成本效率上的持续突破

优先资格

CTR方向:具备扎实的高性能计算、分布式、GPU算子、编译优化、图优化、存储等经验者优先

端方向:熟练掌握模型优化能力,熟悉模型量化、模型蒸馏、模型压缩等经验者优先

AI 洞察

优缺点分析

优点

  • 专注前沿技术(大模型、多模态、端侧推理),技术栈新且有深度,利于个人竞争力提升
  • 京东零售业务场景丰富(搜索、推荐、广告),可积累大规模分布式系统的实战经验
  • 已上市大厂,薪资福利有保障,且岗位核心度高,容易产出亮点成果
  • 技术难度高,需要同时掌握大模型、CTR、端侧三个方向,对学习能力要求极高
  • 竞争激烈,行业内推理引擎人才稀缺但需求旺盛,需持续跟踪最新论文和开源项目
  • 适合对性能优化充满热情、具备扎实的计算机体系结构基础,并希望投身大模型基础设施方向的资深工程师

缺点 / 挑战

  • 业务压力大,推理性能直接影响线上效果和成本,可能面临高强度加班

角色解读

  • 技术专家路线:深入推理优化领域,成为GPU算子、编译优化等方向的技术带头人
  • 架构师路线:主导推理平台架构设计,覆盖云、端多种场景,推动公司级推理基础设施演进
  • 跨领域发展:积累大模型、推荐、端侧等多场景经验,转型AI全栈技术专家或技术管理
  • 针对大模型(如ChatGPT类)推理场景,通过算子融合、内存优化等手段减少延迟、提高吞吐
  • 优化CTR推荐/广告系统的分布式推理框架,使用GPU编译优化提升稀疏模型效率
  • 对端侧模型进行量化、蒸馏和压缩,确保在手机等设备上高效运行
  • 跟踪前沿推理技术(如FlashAttention、vLLM),主导技术攻坚或开源贡献
  • 扎实的机器学习基础,熟悉大模型、CTR或端侧模型架构
  • 精通GPU编程(CUDA)和推理引擎优化(TensorRT、ONNX Runtime等)
  • 掌握模型量化、蒸馏、剪枝等压缩技术,以及编译优化(TVM、XLA)
  • 熟悉分布式系统原理,有大规模推理服务部署经验

申请策略

  • 在简历中明确标注自己擅长的大模型/CTR/端侧方向,避免泛泛而谈
  • 关注京东零售的技术博客或开源项目,面试时展现对业务场景的理解
  • 突出在推理优化方面的具体项目,如将模型延迟降低X%、吞吐提升Y倍,并附上量化数据
  • 强调对CUDA、TensorRT、TVM等工具的深入使用经验,最好有底层算子开发经历
  • 如有开源项目贡献(如vLLM、TensorRT-LLM),需重点展示个人角色和贡献
  • 展示多场景能力:同时具备大模型、CTR或端侧中至少两个方向的实践
  • 系统学习GPU编程(CUDA、cuDNN)和推理框架源码(如TensorRT、ONNX Runtime)
  • 掌握模型压缩工具(如NNCF、TensorFlow Lite)和编译优化框架(TVM、MLIR)

面试指南

  • 从系统视角分层回答:模型压缩(量化、剪枝)→ 算子优化(CUDA kernel fusion)→ 内存管理(显存复用)→ 调度优化(batching、pipelining)
  • 对比不同优化方法的适用场景:大模型侧重kv cache优化,CTR侧重稀疏特征处理,端侧侧重量化与编译
  • 结合实践经验,给出具体数值改进,并说明trade-off(如加速比与精度损失)
  • 如何优化一个PyTorch模型的推理性能?请从算子、内存、编译等角度阐述
  • 请解释FlashAttention的原理及在推理加速中的优势
  • 你如何设计一个CTR模型的高性能分布式推理服务?
  • 端侧量化有哪些常用方法?如何在精度和速度之间做权衡?
  • 你参与过哪些推理优化开源项目?具体贡献是什么?

职位点评

68
综合评分

京东零售核心研发岗,薪酬优厚、技术前沿,但WLB一般,适合追求技术深度的工程师。

更适合这类人
最看重技术成长和前沿挑战,对工作生活平衡要求不高,追求薪酬与能力同步提升的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利80
成长发展90
工作生活40
使命价值60

薪资福利

80较高

京东作为上市大厂,薪资水平在行业内有竞争力,且研发岗位福利完善,但JD未明确薪资和具体福利,补偿性动机满足度较好。

薪资信号偏高 (35K-65K/月)

成长发展

90较高

岗位涉及大模型、CTR、端侧三大前沿方向,技术栈新且深度足,个人成长空间大。虽未直接提及晋升,但技术攻关和开源主导机会多。

技术前沿前沿/新兴技术
技术栈大模型推理、CTR模型、端侧部署、GPU优化、编译优化、模型量化、模型蒸馏、分布式系统、LLM、多模态
成长机会主导开源项目、关键技术攻关
业务类型profit_center

工作生活

40较低

北京现场办公,未提及弹性工作或远程可能,大厂研发岗位通常有加班文化,生活平衡一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值

60中等

零售行业的AI应用具有直接商业价值,但社会使命强调不足,创新程度较高但并非颠覆性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 服务质量运营(智能方向)

    京东 · 北京市
    AI 估算 · 20k-35k
  • 京东物流-商务销售

    京东 · 上海市
    AI 估算 · 10k-18k
  • 培训专家

    京东 · 北京市
    AI 估算 · 20k-35k
  • 服务资源统筹岗(运营保障)

    京东 · 北京市
    AI 估算 · 18k-28k
  • 服务资源统筹岗(运营保障)

    京东 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • DJK-后端开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 25k-40k
  • 后端开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 20k-35k
  • Android开发工程师

    顺丰速运 · 西安市
    AI 估算 · 15k-25k
  • 无人机运控系统架构工程师

    顺丰速运 · 深圳市
    AI 估算 · 40k-70k
  • SC-应用架构高级工程师(大模型&AI Agent方向))

    顺丰速运 · 武汉市
    AI 估算 · 30k-50k

京东 的其他在招职位

  • 服务质量运营(智能方向)

    京东 · 北京市
    AI 估算 · 20k-35k
  • 京东物流-商务销售

    京东 · 上海市
    AI 估算 · 10k-18k
  • 培训专家

    京东 · 北京市
    AI 估算 · 20k-35k
  • 服务资源统筹岗(运营保障)

    京东 · 北京市
    AI 估算 · 18k-28k
  • 服务资源统筹岗(运营保障)

    京东 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • DJK-后端开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 25k-40k
  • 后端开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 20k-35k
  • Android开发工程师

    顺丰速运 · 西安市
    AI 估算 · 15k-25k
  • 无人机运控系统架构工程师

    顺丰速运 · 深圳市
    AI 估算 · 40k-70k
  • SC-应用架构高级工程师(大模型&AI Agent方向))

    顺丰速运 · 武汉市
    AI 估算 · 30k-50k