5年及以上AI/算法测试或评测经验,计算机/人工智能相关专业背景
精通AI评测技术栈:熟悉主流评测框架(如HELM、OpenCompass等)及工具(如PromptBench、FMEval),掌握Python/Java,具备评测脚本开发及自动化平台搭建能力
有完整主导2个以上AI产品评测项目的经验(需在面试中详细阐述)
具备评测体系设计视角,能根据产品阶段灵活调整评测策略,优秀的逻辑分析能力,能针对模型失效场景提出可解释的归因分析,有团队指导经验,擅长知识传递与流程规范化建设,熟悉大模型微调、RAG技术原理及对应评测方法
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信