计算机科学、软件工程、人工智能等相关专业,3 年以上工程化开发经验(含 1 年以上 RL 或深度学习基础设施相关经验)
熟练掌握 Python 编程,具备扎实的工程编码能力,熟悉 C/C++ 者优先(底层优化场景)
深入理解深度学习框架(PyTorch),精通分布式训练原理与实践(FSDP/DeepSpeed/Megatron/Ray 等工具使用经验)
具备强化学习基础,理解 RL 训练流程(智能体、环境、奖励机制、经验回放等核心组件),熟悉主流 RL 框架(Ray、VERL、rllm、Agentlightning)者优先
具备复杂系统设计能力,能独立负责基础设施模块的从 0 到 1 搭建
强问题排查能力,能快速定位训练过程中的工程问题(性能、稳定性、资源瓶颈)
良好的跨团队沟通能力,能准确理解算法需求并转化为工程方案
自驱力强,乐于跟进前沿技术,具备快速学习与落地能力