
小马智行
高性能计算研发工程师
高性能计算研发工程师
发布于 大约 2 个月前普通员工/个人贡献者
广州市
高级经验
全职员工
仅现场办公
本科
软件工程
深度学习
性能优化
CUDA
计算机体系结构
GPU编程
TensorRT
Clang
Nvcc
AI 估算 · 30k–50k
高性能计算研发工程师稀缺,CUDA和TensorRT技能需求高,广州互联网薪资水平中等偏上,3年以上经验月薪3-5万合理。
职位详情
关于这个职位
该职位负责基于CUDA和TensorRT开发推理框架与优化工具链,监测GPU运行效率,提升深度学习应用的性能
需要与团队协作确保GPU解决方案的集成,并维护高质量的C++代码
适合有丰富GPU编程和性能优化经验的工程师
最低要求
本科及以上学历,计算机相关专业
年以上GPU编程和性能优化经验,具有丰富的CUDA开发背景
熟悉计算机体系结构,在某种处理器架构(GPU,ARM等)做过深入工作
有深度学习框架的使用、优化和调试经验
熟悉Linux下的应用开发和调试
熟悉nvcc, clang等编译工具链,了解编译过程
熟练使用C++,对高质量的代码有追求
熟悉CPU性能调试及优化
工作职责
基于cuda和TensorRT开发推理框架,优化工具链
开发工具监测GPU运行效率及显存使用,提高应用的效率和性能
与其它技术团队合作,确保GPU解决方案的集成功能和性能要求
维护C++代码质量,提高代码的正确性、运行效率以及可读性
AI 洞察
优缺点分析
优点
- 技术前沿:涉及CUDA、TensorRT等高性能计算技术,技能稀缺性强,市场价值高
- 职业发展:可深入底层计算优化,积累宝贵经验,未来在AI芯片、自动驾驶等领域有广阔前景
- 技术难度高:需要深厚的GPU编程和体系结构知识,学习曲线陡峭
- 工作强度大:自动驾驶行业竞争激烈,项目周期紧,可能需要加班
- 适合对底层计算和性能优化有浓厚兴趣,具备扎实CUDA和C++基础,愿意在自动驾驶领域深耕的技术型人才
缺点 / 挑战
- 公司平台:小马智行是自动驾驶领域头部企业,技术氛围浓厚,项目有挑战性
- 责任重大:优化结果直接影响自动驾驶系统的实时性和安全性,压力较大
角色解读
- 技术深耕:成为GPU计算或高性能计算领域的专家,主导核心框架设计
- 架构转型:向系统架构师发展,负责整体计算平台的设计与优化
- 管理方向:带领GPU优化团队,从技术骨干成长为技术管理者
- 基于CUDA和TensorRT开发推理框架,优化模型部署工具链,提升推理速度和效率
- 开发监控工具,实时分析GPU运行效率和显存使用情况,定位性能瓶颈
- 与算法、工程团队协作,确保GPU解决方案在自动驾驶等场景中的集成与性能达标
- 维护和优化C++代码质量,确保代码的正确性、高效性和可维护性
- 精通CUDA编程和GPU性能优化,有丰富的并行计算经验
- 熟悉TensorRT等推理优化工具,了解深度学习模型部署流程
- 扎实的C++编程能力,熟悉Linux开发环境和编译工具链(nvcc, clang)
- 了解计算机体系结构,对GPU或ARM等处理器架构有深入理解
申请策略
- 了解小马智行的技术栈和产品方向,在面试中展现对自动驾驶计算需求的深刻理解
- 准备一个完整的GPU优化案例,从问题分析到方案实施再到效果评估,展示系统性思维
- 突出GPU编程项目经验,尤其是CUDA和TensorRT相关的优化案例,量化性能提升指标
- 展示C++代码质量意识,如参与过大型项目代码重构或性能调优
- 强调对计算机体系结构的理解,如做过GPU或ARM架构的底层优化工作
- 如有深度学习模型部署或推理框架开发经验,务必重点描述
- 深入学习TensorRT的API和优化策略,掌握模型量化、层融合等技术
- 熟悉NVIDIA Nsight等性能分析工具,提升GPU调试和优化能力
面试指南
- STAR法则:描述情境、任务、行动和结果,突出量化指标
- 对比分析:说明优化前后的性能差异,解释技术选型原因
- 系统思维:从整体架构角度分析问题,展示对系统各层级的理解
- 请描述一次你使用CUDA进行性能优化的经历,具体解决了什么问题?
- TensorRT中常用的优化技术有哪些?如何选择层融合策略?
- 如何监测GPU显存使用情况?有哪些工具和方法?
- 在C++中,如何确保代码的高效性和可读性?请举例说明
- 你对计算机体系结构中的哪些部分有深入研究?如何影响你的优化决策?
匹配度报告
70
综合匹配度
前沿技术、高成长性,但工作强度大、WLB一般。
适合人群
适合追求技术成长、愿意接受挑战、对自动驾驶有热情的开发者,不太适合追求工作生活平衡的人。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活40
使命价值80
薪资福利匹配
70中等
薪资水平较高,但JD未提及福利,补偿性动机满足程度中等偏上。
薪资信号未披露(AI估算:30K-50K/月)
成长发展匹配
90较高
技术前沿,涉及CUDA和TensorRT等稀缺技能,成长空间大,发展性动机满足度高。
技术前沿前沿/新兴技术
技术栈CUDA、TensorRT、GPU、C++、深度学习、Linux、nvcc、clang
业务类型profit_center
工作生活匹配
40较低
仅现场办公,未提及WLB,自动驾驶行业工作强度大,生活化动机满足度低。
工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)
使命价值匹配
80较高
自动驾驶是高速增长赛道,技术对社会有积极影响,意义感动机满足度高。
行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
小马智行 的其他在招职位
相似职位推荐
Watch Jobs