Pony AI logo
小马智行
软件工程师 - 性能优化 - 上海嘉定

软件工程师 - 性能优化 - 上海嘉定

发布于 大约 2 个月前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
本科
软件工程
深度学习
PyTorch
性能优化
TensorFlow
自动驾驶
CUDA
TensorRT
分布式训练
模型并行

AI 估算 · 30k–50k

自动驾驶性能优化岗位技术门槛高,市场需求旺盛,薪资水平较高,参考上海同级别工程师薪资范围。

职位详情

关于这个职位

该职位专注于自动驾驶系统感知模块的性能优化,涉及深度学习框架、CUDA/TensorRT等加速技术

适合有2年以上深度学习框架开发经验、熟悉分布式训练和模型并行的工程师
你将参与前沿自动驾驶技术的核心优化工作,技术挑战大,成长空间广阔

最低要求

计算机专业本科及以上学历,AI相关研究方向

熟悉典型的计算机体系结构,有分布式性能优化经验,有出色的编程能力
熟悉至少一种深度学习框架(pytorch/tensorflow优先)
具有2年以上深度学习框架开发经验,了解分布式训练,模型并行相关技术
熟悉CUDA/TensorRT或其它AI加速库

工作职责

负责自动驾驶系统感知在线模块的性能优化及软件维护

优先资格

有C/C++项目的软件优化经验

有编译器、操作系统内核开发经验
熟悉CUDA编程 / 基于TensorRT的模型优化经验
有Nvidia Xavier/Orin芯片项目开发经验
有模型训练优化经验

AI 洞察

优缺点分析

优点

  • 自动驾驶是高速增长赛道,技术前沿,个人技能积累快
  • 小马智行是行业头部公司,平台大,项目经验含金量高
  • 性能优化岗位技术深度高,容易形成核心竞争力
  • 薪资水平有竞争力,且公司融资充足,福利待遇好
  • 技术难度大,需要同时掌握深度学习、CUDA、系统优化等多领域知识
  • 技术迭代快,需要持续学习新工具和新方法

缺点 / 挑战

  • 自动驾驶对实时性和安全性要求极高,工作压力较大
  • 适合有深度学习框架开发经验、热爱性能优化、喜欢挑战技术难题的工程师

角色解读

  • 技术深耕:成为自动驾驶性能优化专家,主导核心模块的极致优化
  • 架构演进:转向系统架构设计,负责感知系统整体性能架构
  • 管理方向:带领性能优化团队,从技术骨干成长为技术管理者
  • 负责自动驾驶感知模块的性能优化,通过算法和工程手段提升模型推理速度
  • 使用CUDA、TensorRT等工具对深度学习模型进行加速,确保实时性
  • 参与分布式训练和模型并行方案的设计与实现,提升训练效率
  • 维护和优化现有代码,解决性能瓶颈,保障系统稳定运行
  • 扎实的计算机体系结构知识,理解CPU/GPU内存层次和并行计算原理
  • 精通至少一种深度学习框架(PyTorch/TensorFlow),有框架开发经验
  • 熟悉CUDA编程和TensorRT优化,能够进行算子级调优
  • 具备分布式训练和模型并行经验,了解数据并行、模型并行策略

申请策略

  • 了解小马智行的技术栈和产品方向,在面试中展现对自动驾驶领域的热情
  • 准备一个完整的性能优化案例,从问题分析到方案实施再到效果评估
  • 突出深度学习框架开发经验,尤其是对框架底层算子的修改或优化
  • 详细描述CUDA/TensorRT优化项目,量化性能提升(如延迟降低百分比)
  • 展示分布式训练或模型并行相关项目,说明你的角色和贡献
  • 如果有编译器或操作系统内核经验,务必强调
  • 深入学习CUDA编程和TensorRT,可以完成一些官方示例并尝试优化
  • 熟悉Nvidia Xavier/Orin平台,了解其硬件特性和优化技巧

面试指南

  • 对于优化类问题,采用'问题分析-方案设计-实施-效果评估'的结构,突出量化结果
  • 对于原理类问题,先给出定义,再结合实际项目经验说明应用场景
  • 对于开放性问题,展示系统性思维,从多个维度(算法、工程、硬件)分析
  • 请描述你如何优化一个深度学习模型的推理速度?
  • CUDA编程中,如何优化内存访问模式以提高性能?
  • 解释TensorRT的工作原理,以及如何利用它进行模型优化?
  • 在分布式训练中,数据并行和模型并行各有什么优缺点?如何选择?
  • 你如何定位和解决一个性能瓶颈?请举例说明

匹配度报告

74
综合匹配度

自动驾驶头部公司,前沿技术栈,高薪高压,成长空间大。

适合人群
最适合追求技术成长和高薪的求职者,不适合看重工作生活平衡的人。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值85

薪资福利匹配

80较高

薪资水平较高,但JD未明确福利,整体补偿性较好。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

技术前沿,成长空间大,但JD未提及晋升通道。

技术前沿前沿/新兴技术
技术栈深度学习、CUDA、TensorRT、分布式训练、模型并行、自动驾驶
业务类型profit_center

工作生活匹配

40较低

仅现场办公,地点在嘉定(郊区),JD未提及WLB,生活化动机满足度低。

工作模式仅现场办公
办公地点郊区/偏远地区
加班情况未提及(无法判断)

使命价值匹配

85较高

自动驾驶是高速增长赛道,社会影响力较高,但JD未提及使命。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs