百度公有云模型训推加速工程师(J95356)
🤖 AI 估测:¥35K-60K
发布时间:22 天前
ℹ️关于这个职位
这是一个专注于大模型性能优化的核心工程岗位
你将负责大模型核心算子的开发、性能分析与优化,以及模型编译精度的验证工作
同时,你需要参与VL/VLA模型的训练、加速与精度评估,并负责相关强化学习训练框架的开发和优化
✓工作职责
负责大模型核心算子的开发/性能分析优化
负责模型算子以及模型编译精度验证
负责VL/VLA模型中一种以上模型的训练/加速/精度评估
负责针对VL/VLA模型的强化学习训练框架开发和优化工作
⭐最低要求
掌握cuda/cutlass dsl等编程,发掘GPU硬件特性,完成常见算子flashattention/gemm等优化工作
对常见算子attention/mlp的底层计算过程有深入了解和分析
熟练使用Nsight Systems/Compute对算法的运行效率如速度、显存占用等进行优化,保证模型精度下提升模型的计算效率
掌握VL/VLA模型中一种以上的常用模型
掌握Verl/OpenRLHF/SimpleVLA-RL/Isaac Lab等一种以上的强化学习训练框架