Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/滴滴出行/大模型压缩推理优化工程师
DiDi logo
D
滴滴出行 (DiDi)

职位信息

北京市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

深度学习GPU优化自动驾驶量化模型压缩TensorRTONNX大模型
💡

核心评价

前沿大厂技术岗,高成长潜力与薪资预期,工作地点固定,WLB信息不明。

大模型压缩推理优化工程师

🤖 AI 估测:¥35K-60K

发布时间:15 天前

立即应聘

ℹ️关于这个职位

该职位专注于自动驾驶领域大模型的压缩与推理优化
你将负责设计并实施量化、剪枝等模型压缩方案,确保模型在精度损失可控的前提下性能显著提升
同时,你需要针对不同硬件平台优化推理框架,解决实际业务中的性能瓶颈,推动优化后的模型高效落地

✓工作职责

负责自动驾驶大模型的压缩方案设计与落地,包括量化(INT4/INT8/FP8)、剪枝、蒸馏、稀疏化等技术,确保压缩后模型精度损失可控、性能提升达标
跟进大模型压缩推理领域前沿技术(如动态量化、混合专家系统推理优化),将技术转化为实际工程方案,解决业务场景中的性能瓶颈
负责推理性能优化,针对不同硬件(GPU/CPU/NPU)适配推理框架(TensorRT/ONNX Runtime/Triton),优化算子、内存占用、并行策略,降低模型推理,提升推理吞吐
与算法、工程团队协作,推动压缩优化后的模型在实际业务中落地,提供技术支持与问题排查

⭐最低要求

掌握Python/C++编程,具备扎实的算法与数据结构基础
精通深度学习原理,熟悉常见模型结构:如Transformer、Resnet等,了解大模型(如LLaMA、QWEN、GPT系列)的结构特点
熟练掌握至少2种模型压缩技术(如量化、 剪枝、 蒸馏),并了解模型压缩后的评估机制
熟悉至少1种推理框架(TensorRT优先),能独立完成模型ONNX转换、算子融合、内存优化
具备端到端模型部署经验,能排查推理过程中的性能瓶颈(如显存溢出、算子耗时过高)

👍优先资格

有实际落地案例优先
有GPU(NVIDIA H系列/Thor系列)或NPU(昇腾)硬件适配经验者优先
加分项: 能从模型算法压缩、结果评估,走通推理全流程
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

滴滴出行 的其他在招职位

  • 高级/资深 agent研发工程师

    滴滴出行

    北京市 · 仅现场办公

  • 策略运营专家

    滴滴出行

    北京市 · 仅现场办公

  • 渠道运营专家

    滴滴出行

    太原市 · 仅现场办公

  • 高级测试开发(agent)工程师

    滴滴出行

    北京市 · 仅现场办公

  • 策略运营专家

    滴滴出行

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公