Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/京东/推理引擎工程师(大模型/CTR/端)
JD logo
J
京东 (JD)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

分布式系统高性能计算模型蒸馏模型量化推理引擎编译优化端侧部署大模型 (Llm)Ctr模型Gpu算子优化
💡

核心评价

京东核心AI工程岗,技术前沿挑战大,成长空间广阔,薪资竞争力强,需关注工作强度。

推理引擎工程师(大模型/CTR/端)

🤖 AI 估测:¥35K-60K

发布时间:27 天前

立即应聘

ℹ️关于这个职位

这是一个专注于AI模型推理性能优化与部署的工程师岗位
你将负责为大模型(LLM)、CTR模型及端侧模型设计并实现高性能推理解决方案,覆盖从云端服务器到移动/嵌入式设备的多种业务场景
核心工作是通过GPU算子优化、编译优化、模型量化等技术,提升模型推理的效率、降低延迟,并推动团队在推理性能与成本效率上的持续突破

✓工作职责

负责大模型、CTR模型及端侧模型的推理性能优化与部署,根据业务场景(如LLM多模态生成、推荐/搜索/广告、移动端/嵌入式设备)定制高性能推理解决方案
针对大模型推理场景,优化推理引擎性能,支持文生图、文生视频等多模态任务的低延迟、高吞吐部署
在CTR场景中,优化推荐/广告系统的分布式推理框架,通过GPU算子优化、编译优化、图优化等技术提升大规模稀疏模型的服务效率
负责端侧模型的轻量化部署,通过模型量化、蒸馏、压缩及端上编译优化实现模型在资源受限环境的高效运行
跟踪前沿推理技术,主导开源项目或关键技术攻关,推动团队在推理性能、成本效率上的持续突破

⭐最低要求

本科及以上学历,3-5年机器学习/推理优化研发经验
LLM方向:需熟练掌握大模型推理引擎的优化技术、大模型多模态/文生图/文生视频等大模型算法
具备扎实的学术能力或者是大模型推理引擎开源项目的负责人,具有大模型推理引擎领域发展的前瞻能力
CTR方向:需熟练掌握CTR场景的模型推理的优化技术,熟悉推荐、搜索、广告场景的引擎框架和分布式系统
具备扎实的高性能计算、分布式、GPU算子、编译优化、图优化、存储等经验者优先
端方向:需熟练掌握端上推理的优化技术,熟悉编译优化、端上高性能代码生成、内存优化等
熟练掌握模型优化能力,熟悉模型量化、模型蒸馏、模型压缩等经验者优先
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信

👍优先资格

具备扎实的高性能计算、分布式、GPU算子、编译优化、图优化、存储等经验者优先
熟练掌握模型优化能力,熟悉模型量化、模型蒸馏、模型压缩等经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 采销岗位

    京东

    江苏省 · 仅现场办公

  • 运营经理岗

    京东

    重庆市 · 仅现场办公

  • 客户经理岗

    京东

    成都市 · 仅现场办公

  • 客户经理岗

    京东

    广东省 · 仅现场办公

  • 运营经理岗

    京东

    四川省 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公