学历与经验背景: 计算机、人工智能、数学等相关专业,硕士及以上学历
具备 3 年左右 AI 算法工作经验,且至少包含 2 年以上的大语言模型(LLM)或多模态大模型(VLM)的一线训练与调优经验
强化学习(RL)核心背景: 拥有扎实的强化学习理论基础,有丰富的 RLHF、DPO、PPO 或其他 LLM 强化对齐算法的实际落地经验
技术栈与框架底座: 熟练掌握 Python 与 PyTorch
深入理解前沿的大模型基座(如 Qwen, Llama3, DeepSeek 等)及多模态架构(如 LLaVA, Qwen-VL 等)
熟悉 DeepSpeed、Megatron 等分布式训练框架,对显存优化(如 ZeRO 系列)有实际操作经验
工程能力与落地导向: 代码基本功扎实,具备优秀的工程实现能力
能够熟练使用 Docker 容器化技术进行算法环境的构建与跨平台部署