计算机科学、软件工程、人工智能或相关专业硕士及以上学历,具备大模型数据工程或Code LLM等实际项目经验
深入理解 Transformer 架构及大语言模型训练原理,具备丰富的数据处理经验
能针对Code SFT、代码偏好对齐等后训练场景,设计高标准数据方案,有项目实战经验
熟练掌握 Python,善于利用 Cursor、Claude Code 等 AI 辅助工具提升数据生产与自动化分析效率
熟悉至少一门其他主流编程语言(C++/Java/Go等),熟悉Docker优先
具备强烈的数据敏感度、技术热情和自驱力,能够从繁杂的代码与报错日志中洞察模型能力的边界,拥有优秀的跨团队(模型、评测、平台)协作与沟通能力