Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Pony AI logo
小马智行
软件工程师 - 端到端模型性能优化
立即应聘

软件工程师 - 端到端模型性能优化

发布于 大约 2 个月前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
软件工程
深度学习
PyTorch
性能分析
CUDA
模型优化
量化
TensorRT
蒸馏
剪枝

AI 估算 · 25k–45k

AI模型优化岗位技术门槛高,市场稀缺,小马智行作为自动驾驶头部公司,薪资竞争力强,预计月薪25k-45k。

职位详情

关于这个职位

该职位专注于AI端到端模型的性能优化,涉及CUDA算子开发和C++日常维护

你将与顶尖团队合作,优化自动驾驶等核心模型,提升推理效率
适合有CUDA和深度学习框架经验的技术人才

最低要求

计算机或相关专业本科及以上学历

扎实的软件工程能力,熟练掌握计算机基础知识
有CUDA编程经验,熟悉TensorRT或其它AI加速库
有C++开发经验
熟悉至少一种深度学习框架(Pytorch优先)

工作职责

负责AI端到端模型的性能分析与优化

负责CUDA算子开发与维护
负责C++日常开发与维护

优先资格

熟练掌握CUDA编程,有CUDA优化经验

有C++相关的性能优化、内存优化经验
有算法竞赛经历
有基于TensorRT的模型优化经验
有模型量化、蒸馏、剪枝等工程经验

AI 洞察

优缺点分析

优点

  • 技术前沿:涉及自动驾驶核心AI模型优化,积累稀缺技能
  • 平台优势:小马智行为自动驾驶头部企业,项目经验含金量高
  • 技术难度高:需要同时掌握CUDA、C++和深度学习,学习曲线陡峭
  • 工作强度大:自动驾驶行业竞争激烈,项目周期紧,可能加班
  • 适合对GPU计算和模型优化有浓厚兴趣,具备较强编程能力和学习动力的技术型人才

缺点 / 挑战

  • 薪资优厚:AI优化岗位薪资水平较高,且公司融资充足

角色解读

  • 技术深耕:成为GPU计算或模型优化领域的专家
  • 架构方向:转向AI系统架构,负责整体推理引擎设计
  • 管理方向:带领团队负责模型优化项目,晋升为技术负责人
  • 分析并优化AI端到端模型的性能,提升推理速度和效率
  • 开发和维护CUDA算子,利用GPU加速计算
  • 使用C++进行日常开发,维护高性能代码库
  • 精通CUDA编程和GPU优化技术,熟悉TensorRT等加速库
  • 扎实的C++开发能力,有性能优化经验
  • 熟悉PyTorch等深度学习框架,了解模型部署流程

申请策略

  • 了解小马智行的技术栈和自动驾驶业务方向,在面试中展现对行业的热情
  • 突出CUDA优化项目经验,如算子融合、内存带宽优化等
  • 展示C++性能优化案例,如使用SIMD、多线程等
  • 强调TensorRT或ONNX Runtime的模型部署经验
  • 深入学习CUDA编程模型和GPU架构,如warp调度、共享内存
  • 练习模型量化、蒸馏、剪枝等压缩技术

面试指南

  • STAR法则:描述情境、任务、行动、结果,突出量化指标
  • 技术对比:比较不同优化方法的优劣,展示思考深度
  • 请描述一次CUDA算子优化的经历,你如何分析瓶颈并改进?
  • 如何将PyTorch模型部署到TensorRT?遇到过哪些问题?
  • C++中如何实现高效的内存管理?请举例
  • 解释模型量化的原理,以及如何选择量化方案?
  • 你对自动驾驶中的端到端模型有什么了解?
  • 复习CUDA编程模型和常见优化技巧,准备一个完整的优化案例

匹配度报告

69
综合匹配度

自动驾驶头部公司,前沿技术栈,高成长但工作强度可能较大。

适合人群
最适合追求技术成长和职业发展的求职者,对WLB要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值70

薪资福利匹配

75中等

薪资水平较高,但JD未明确福利,补偿性动机满足较好。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

90较高

技术前沿,涉及CUDA、TensorRT等稀缺技能,成长空间大。

技术前沿前沿/新兴技术
技术栈CUDA、TensorRT、PyTorch、深度学习、模型优化
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及WLB,自动驾驶行业通常工作强度大。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

自动驾驶是高速增长赛道,对社会有积极影响,但JD未强调使命感。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小马智行 的其他在招职位

  • 大模型算法工程师-广州/北京

    小马智行 · 北京市
    AI 估算 · 30k-60k
  • C++实习生 - 仿真分析与问题复现 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 4k-8k
  • C++实习生 - 性能优化 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 5k-8k
  • C++实习生 - 仿真优化 - 深圳

    小马智行 · 深圳市
    AI 估算 · 4k-8k
  • 高级测试工程师 - 需海外高频出差

    小马智行 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI全栈工程师(AI Coding 方向)

    小红书 · 北京市
    AI 估算 · 45k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 40k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 高级/资深iOS开发工程师(MJ035494)

    携程 · 上海市
    AI 估算 · 25k-45k
  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k

小马智行 的其他在招职位

  • 大模型算法工程师-广州/北京

    小马智行 · 北京市
    AI 估算 · 30k-60k
  • C++实习生 - 仿真分析与问题复现 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 4k-8k
  • C++实习生 - 性能优化 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 5k-8k
  • C++实习生 - 仿真优化 - 深圳

    小马智行 · 深圳市
    AI 估算 · 4k-8k
  • 高级测试工程师 - 需海外高频出差

    小马智行 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI全栈工程师(AI Coding 方向)

    小红书 · 北京市
    AI 估算 · 45k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 40k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 高级/资深iOS开发工程师(MJ035494)

    携程 · 上海市
    AI 估算 · 25k-45k
  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k