Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/京东/端侧推理引擎工程师
JD logo
J
京东 (JD)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

性能优化OpenCLCUDATensorRT异构计算推理引擎vLLM
💡

核心评价

京东前沿技术岗,专注大模型端侧部署与优化,技能成长空间大,薪资竞争力强,但WLB可能面临挑战。

端侧推理引擎工程师

🤖 AI 估测:¥35K-60K

发布时间:28 天前

立即应聘

ℹ️关于这个职位

这是一个专注于端侧人工智能推理系统开发的工程师岗位
你将负责设计和优化能在手机、PC、IoT等终端设备上高效运行大模型的推理引擎,涉及从底层硬件(CPU/GPU)性能优化到上层系统架构设计的全链路工作
核心目标是构建高可用、低延迟的端侧AI解决方案,与算法团队紧密协作,将前沿AI技术落地到具体业务场景中

✓工作职责

负责推理引擎的架构设计、开发与性能优化,构建高可用、低延迟的端侧推理系统
负责大模型在手机、PC、IoT设备等终端硬件上的部署和优化工作
深入CPU、GPU底层,设计高性能计算核心和自定义算子
分析系统性能瓶颈,提出并实施系统性优化方案,显著提升推理效率
与算法团队紧密合作,为业务场景提供最优的端侧推理解决方案

⭐最低要求

本科及以上学历,熟练掌握 C/C++、Python语言,有计算机体系结构背景或软件开发背景
熟悉各类深度学习网络和算子底层实现细节,掌握端上推理的优化技术,包括但不限于端上高性能代码实现、内存优化、编译优化等
具备基础的GPU编程能力,包括但不限于 CUDA、OpenCL、Metal等
熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI芯片、GPU加速经验优先
有TensorRT/FasterTransformer/vLLM/SGLang等大模型推理框架使用经验优先

👍优先资格

有服务器端 AI芯片、GPU加速经验优先
有TensorRT/FasterTransformer/vLLM/SGLang等大模型推理框架使用经验优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 采销岗位

    京东

    江苏省 · 仅现场办公

  • 运营经理岗

    京东

    重庆市 · 仅现场办公

  • 客户经理岗

    京东

    成都市 · 仅现场办公

  • 客户经理岗

    京东

    广东省 · 仅现场办公

  • 运营经理岗

    京东

    四川省 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公