Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

JD logo
京东
AI infra工程师(大模型训推优化)
立即应聘

AI infra工程师(大模型训推优化)

发布于 大约 6 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
硕士
信息技术与基础设施
CUDA
SGLang
vLLM
TensorRT-LLM
大模型优化
Diffusion蒸馏
Nsight Systems/Compute
量化(Qat/Ptq)

AI 估算 · 30k–60k

AI infra岗位热门,京东技术实力强,薪资有竞争力。

职位详情

关于这个职位

该职位负责大模型训练与推理的性能优化,涉及量化、蒸馏、推理引擎定制等前沿技术

你需要与算法研究员协作,分析性能瓶颈并设计系统级优化方案,将业界先进技术落地到生产环境
适合算法与工程能力兼备、追求底层优化的技术人才

最低要求

计算机科学、人工智能、电子工程等相关专业硕士及以上学历,具备2年以上机器学习系统或高性能计算相关经验

扎实的算法功底:深入理解LLM和Diffusion模型的技术细节与计算逻辑,不满足于“调用API”,追求底层优化
卓越的工程能力:精通C++/Python,具备强大的系统编程和调试能力
深度参与过vLLM、Sglang、TensorRT-LLM等至少一种推理框架优化的实际项目经验
硬件层优化经验:熟悉CUDA编程,并能熟练使用Nsight Systems/Compute等GPU性能分析工具进行瓶颈定位与优化
出色的协同能力:能够在算法研究员与工程团队之间高效沟通,用双方的语言精准对接需求与技术方案

工作职责

与算法研究员协同工作,分析模型在训练与推理阶段的性能瓶颈,从系统-算法协同角度提出改进方案

主导或参与量化方案(量化感知训练QAT/训练后量化PTQ)的设计与实施,保障低比特下的模型质量
主导或参与Diffusion模型步数蒸馏工作,将业界前沿的加速技术(如一致性模型、渐进式蒸馏)落地到生产环境
基于vLLM / Sglang / TensorRT-LLM等框架进行深度定制与优化,开发高性能推理引擎
设计与实现动态批处理、持续批处理、流水线/张量并行等高级推理服务与调度策略

AI 洞察

优缺点分析

优点

  • 接触大模型最前沿的训推优化技术,技术成长空间大
  • 京东大厂平台,资源丰富,项目落地性强
  • 与算法研究员紧密协作,培养系统-算法协同思维
  • 技术门槛高,需要同时具备算法与工程深度
  • 工作强度可能较大,需应对快速迭代的业务需求
  • 竞争激烈,需要持续学习追赶业界最新进展
  • 适合算法与工程能力兼备、热爱底层优化、追求技术影响力的求职者

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术专家:在推理优化、量化、蒸馏等细分领域深耕
  • 架构师:主导AI基础设施整体架构设计
  • 技术管理者:带领团队,向AI infra负责人方向发展
  • 分析大模型训练与推理中的性能瓶颈,设计系统-算法协同优化方案
  • 主导量化方案(QAT/PTQ)实施,确保低比特下模型质量
  • 主导Diffusion模型蒸馏,将一致性模型等加速技术落地
  • 基于vLLM/Sglang/TensorRT-LLM定制高性能推理引擎,设计调度策略
  • 精通C++/Python,具备强大的系统编程和调试能力
  • 深入理解LLM和Diffusion模型技术细节,不满足于调用API
  • 熟悉CUDA编程及GPU性能分析工具(Nsight Systems/Compute)
  • 有vLLM、Sglang、TensorRT-LLM等推理框架优化经验

申请策略

  • 表达对系统-算法协同优化的热情,准备具体技术案例
  • 了解京东探索研究院在AI基础设施方面的布局与方向
  • 突出量化、蒸馏或推理框架优化的实际项目经验,展示细节与成果
  • 强调CUDA编程和性能调优的案例,如具体加速比、优化思路
  • 列出对vLLM、TensorRT-LLM等开源框架的贡献或深入理解
  • 提前阅读vLLM、Sglang源码,理解架构与核心优化点
  • 补充Diffusion模型蒸馏和一致性模型相关论文
  • 练习Nsight Systems/Compute分析性能瓶颈的实操

面试指南

  • 从系统-算法协同角度分析问题:先定位瓶颈是计算、内存还是通信,再结合模型特点优化
  • 量化问题:对比QAT/PTQ的适用场景,强调精度与速度的trade-off
  • 推理框架:理解核心机制(如paged attention),突出自己的实践与改进
  • 如何分析LLM推理的性能瓶颈?有哪些常用工具和方法?
  • QAT和PTQ的优缺点分别是什么?如何处理低比特下的精度损失?
  • Diffusion模型蒸馏中一致性模型与渐进式蒸馏的区别?
  • vLLM的continuous batching是如何实现的?
  • 你有过CUDA kernel优化的经验吗?请举例说明

匹配度报告

70
综合匹配度

大厂AI infra岗,前沿技术栈,薪资高,成长快,但工作强度大。

适合人群
最适合追求技术成长、愿意投入高强度工作、希望成为AI infra专家的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

薪资水平在行业中属于较高水准,京东作为大厂福利完善,但JD未明确具体薪资,综合判断有竞争力。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

该岗位涉及大模型训推前沿技术,技术深度和广度俱佳,成长空间极大。

技术前沿前沿/新兴技术
技术栈LLM、Diffusion、量化(QAT/PTQ)、蒸馏、vLLM、Sglang、TensorRT-LLM、CUDA
业务类型ambiguous

工作生活匹配

40较低

仅现场办公,未提及远程或弹性工作,大厂AI infra岗位通常强度较高,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施属于高速增长赛道,技术影响力大,但社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 服务销售岗

    京东 · 上海市
    AI 估算 · 15k-25k
  • 高级采销经理

    京东 · 北京市
    AI 估算 · 30k-50k
  • 物流方案岗

    京东 · 河南省
    AI 估算 · 8k-15k
  • 内容运营(保险)

    京东 · 北京市
    AI 估算 · 20k-35k
  • 保险培训项目岗

    京东 · 北京市
    AI 估算 · 18k-28k

相似职位推荐

  • Assistant IT Manager

    怡和洋行 · 香港特别行政区
    AI 估算 · 35k-55k
  • Senior Cybersecurity Defence Engineer / Manager

    怡和洋行 · 香港特别行政区
    AI 估算 · 40k-60k
  • IT支持

    东陶 · 上海市
    AI 估算 · 6k-10k
  • IT Business Analyst - Intern

    江森自控 · 大连市
    AI 估算 · 2k-4k
  • IT Business Lead - Commercial

    江森自控 · 上海市
    AI 估算 · 30k-45k

京东 的其他在招职位

  • 服务销售岗

    京东 · 上海市
    AI 估算 · 15k-25k
  • 高级采销经理

    京东 · 北京市
    AI 估算 · 30k-50k
  • 物流方案岗

    京东 · 河南省
    AI 估算 · 8k-15k
  • 内容运营(保险)

    京东 · 北京市
    AI 估算 · 20k-35k
  • 保险培训项目岗

    京东 · 北京市
    AI 估算 · 18k-28k

相似职位推荐

  • Assistant IT Manager

    怡和洋行 · 香港特别行政区
    AI 估算 · 35k-55k
  • Senior Cybersecurity Defence Engineer / Manager

    怡和洋行 · 香港特别行政区
    AI 估算 · 40k-60k
  • IT支持

    东陶 · 上海市
    AI 估算 · 6k-10k
  • IT Business Analyst - Intern

    江森自控 · 大连市
    AI 估算 · 2k-4k
  • IT Business Lead - Commercial

    江森自控 · 上海市
    AI 估算 · 30k-45k