深度理解大模型业务需求、场景边界及变更诉求,梳理核心质量指标,输出需求拆解文档与测试范围界定,确保测试方向与业务目标一致
针对模型服务全链路及效果保障,设计完备的测试用例体系,覆盖正常场景、异常场景、边界场景及高并发场景,制定测试策略与执行计划
主导测试执行,包括链路质量、协议兼容、推理服务、模型效果等方面
作为测试端核心对接人,联动模型效果评估系统团队,明确效果测试标准与数据互通机制,并协同研发、运维、产品团队推进问题定位与优化闭环
沉淀测试方法论与用例库,推动测试自动化、智能化落地
分析线上质量问题,输出根因分析与改进方案,持续提升模型服务质量基线