计算机、人工智能、统计学、数学或相关专业,本科及以上学历,3年大模型评测工作经验以上优先
熟悉业界主流评测工具集和评测集,有独立设计评测框架和评测标准经验
了解Python语言,有实际开发、测试开发或评测工具开发经验优先
具备模型和AI产品分析能力,根据评测结论提出优化建议,驱动优化落地
关注业界前沿AI模型和产品发展,关注AI前沿评测方法发展,并转化为内部评测实践,并且能够熟练借助AI工具进行快速验证,具备Vibe coding或自动化流程搭建能力,支持方案快速验证与落地迭代
积极主动,对AI和大模型领域有激情,喜欢找办法解决问题,具备较强的团队协作能力、组织协调能力、复杂问题解决能力