Pony AI logo
小马智行
高性能计算研发工程师

高性能计算研发工程师

发布于 大约 2 个月前

普通员工/个人贡献者

广州市
高级经验
全职员工
仅现场办公
本科
软件工程
深度学习
性能优化
CUDA
计算机体系结构
GPU编程
TensorRT
Clang
Nvcc

AI 估算 · 30k–50k

高性能计算研发工程师稀缺,CUDA和TensorRT技能需求高,广州互联网薪资水平中等偏上,3年以上经验月薪3-5万合理。

职位详情

关于这个职位

该职位负责基于CUDA和TensorRT开发推理框架与优化工具链,监测GPU运行效率,提升深度学习应用的性能

需要与团队协作确保GPU解决方案的集成,并维护高质量的C++代码
适合有丰富GPU编程和性能优化经验的工程师

最低要求

本科及以上学历,计算机相关专业

年以上GPU编程和性能优化经验,具有丰富的CUDA开发背景
熟悉计算机体系结构,在某种处理器架构(GPU,ARM等)做过深入工作
有深度学习框架的使用、优化和调试经验
熟悉Linux下的应用开发和调试
熟悉nvcc, clang等编译工具链,了解编译过程
熟练使用C++,对高质量的代码有追求
熟悉CPU性能调试及优化

工作职责

基于cuda和TensorRT开发推理框架,优化工具链

开发工具监测GPU运行效率及显存使用,提高应用的效率和性能
与其它技术团队合作,确保GPU解决方案的集成功能和性能要求
维护C++代码质量,提高代码的正确性、运行效率以及可读性

AI 洞察

优缺点分析

优点

  • 技术前沿:涉及CUDA、TensorRT等高性能计算技术,技能稀缺性强,市场价值高
  • 职业发展:可深入底层计算优化,积累宝贵经验,未来在AI芯片、自动驾驶等领域有广阔前景
  • 技术难度高:需要深厚的GPU编程和体系结构知识,学习曲线陡峭
  • 工作强度大:自动驾驶行业竞争激烈,项目周期紧,可能需要加班
  • 适合对底层计算和性能优化有浓厚兴趣,具备扎实CUDA和C++基础,愿意在自动驾驶领域深耕的技术型人才

缺点 / 挑战

  • 公司平台:小马智行是自动驾驶领域头部企业,技术氛围浓厚,项目有挑战性
  • 责任重大:优化结果直接影响自动驾驶系统的实时性和安全性,压力较大

角色解读

  • 技术深耕:成为GPU计算或高性能计算领域的专家,主导核心框架设计
  • 架构转型:向系统架构师发展,负责整体计算平台的设计与优化
  • 管理方向:带领GPU优化团队,从技术骨干成长为技术管理者
  • 基于CUDA和TensorRT开发推理框架,优化模型部署工具链,提升推理速度和效率
  • 开发监控工具,实时分析GPU运行效率和显存使用情况,定位性能瓶颈
  • 与算法、工程团队协作,确保GPU解决方案在自动驾驶等场景中的集成与性能达标
  • 维护和优化C++代码质量,确保代码的正确性、高效性和可维护性
  • 精通CUDA编程和GPU性能优化,有丰富的并行计算经验
  • 熟悉TensorRT等推理优化工具,了解深度学习模型部署流程
  • 扎实的C++编程能力,熟悉Linux开发环境和编译工具链(nvcc, clang)
  • 了解计算机体系结构,对GPU或ARM等处理器架构有深入理解

申请策略

  • 了解小马智行的技术栈和产品方向,在面试中展现对自动驾驶计算需求的深刻理解
  • 准备一个完整的GPU优化案例,从问题分析到方案实施再到效果评估,展示系统性思维
  • 突出GPU编程项目经验,尤其是CUDA和TensorRT相关的优化案例,量化性能提升指标
  • 展示C++代码质量意识,如参与过大型项目代码重构或性能调优
  • 强调对计算机体系结构的理解,如做过GPU或ARM架构的底层优化工作
  • 如有深度学习模型部署或推理框架开发经验,务必重点描述
  • 深入学习TensorRT的API和优化策略,掌握模型量化、层融合等技术
  • 熟悉NVIDIA Nsight等性能分析工具,提升GPU调试和优化能力

面试指南

  • STAR法则:描述情境、任务、行动和结果,突出量化指标
  • 对比分析:说明优化前后的性能差异,解释技术选型原因
  • 系统思维:从整体架构角度分析问题,展示对系统各层级的理解
  • 请描述一次你使用CUDA进行性能优化的经历,具体解决了什么问题?
  • TensorRT中常用的优化技术有哪些?如何选择层融合策略?
  • 如何监测GPU显存使用情况?有哪些工具和方法?
  • 在C++中,如何确保代码的高效性和可读性?请举例说明
  • 你对计算机体系结构中的哪些部分有深入研究?如何影响你的优化决策?

匹配度报告

70
综合匹配度

前沿技术、高成长性,但工作强度大、WLB一般。

适合人群
适合追求技术成长、愿意接受挑战、对自动驾驶有热情的开发者,不太适合追求工作生活平衡的人。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活40
使命价值80

薪资福利匹配

70中等

薪资水平较高,但JD未提及福利,补偿性动机满足程度中等偏上。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

技术前沿,涉及CUDA和TensorRT等稀缺技能,成长空间大,发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈CUDA、TensorRT、GPU、C++、深度学习、Linux、nvcc、clang
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及WLB,自动驾驶行业工作强度大,生活化动机满足度低。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

80较高

自动驾驶是高速增长赛道,技术对社会有积极影响,意义感动机满足度高。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs