计算机、人工智能等相关专业,具备扎实的数据结构与算法基础
具备扎实的 Python 编程能力,熟练掌握 PyTorch 等深度学习框架,有优秀的代码规范与工程素养
熟悉 LLM 训练全流程(Pre-train/CPT/SFT/RLHF),熟练使用主流训练/推理框架(如 Megatron-LM、DeepSpeed、vLLM、Sglang 等)
深入理解强化学习原理,熟悉 PPO、DPO、GRPO 等算法基本原理,熟悉基于 RLVR 的强化学习训练者优先
具备敏锐的技术视野,能够将前沿算法与复杂的业务相结合,产出实际价值
具备良好的沟通协作能力,工作积极主动,具备较强的学习能力,可快速验证新想法,推动技术进步