精通Python及PyTorch等框架,具备Qwen、Deepseek等模型的二次训练经验者优先
深入理解Transformer架构、SFT/RL训练范式及Prompt工程,了解Claude Code等Agent开发框架,有完整智能体系统搭建经验者优先
熟悉常用的RL训练框架和训练技巧,有Verl、Slime、AReal等强化学习训练框架使用经验者优先
深入理解分布式框架的底层通信机制、内存管理策略与并行调度等逻辑,能够精准定位核心优化方向
熟悉主流推理框架,掌握 kvcache、量化、算子优化等推理优化方法,并且有落地经验者优先