顺丰速运的测试开发工程师薪资是多少？

该职位薪资范围为 25k–45k（人民币/月）。

测试开发工程师的工作地点在哪里？

该职位工作地点位于深圳市。工作形式为仅现场办公。

该职位要求本科学历及中级经验工作经验。

🤖 AI 估测：¥25K-45K

发布时间：8 天前

这是一个专注于大模型（LLM）和AI Agent应用质量保障的测试开发工程师岗位

你将负责设计和执行大模型的效果评估、Prompt工程、智能体功能测试以及性能与成本优化，确保AI应用在顺丰业务场景下的准确性、安全性和稳定性

工作职责：

大模型效果评估与验证 - 负责大模型应用的效果测试，设计和执行模型输出质量评估，涉及准确率、一致性、安全性、无害性等多维度评估

Prompt工程与场景测试 - 设计高效精准的Prompt指令，构造复杂业务场景的测试用例，验证模型在不同场景下的效果和稳定性

智能体质量保障 - 负责AI Agent应用的功能测试、工具链验证、多轮对话一致性测试，验证Agent的规划能力、工具调用正确性、约束条件满足

文本和NLP算法效果测试 - 对文本理解、生成、抽取等NLP任务进行效果评估，验证语义准确性、召回率、覆盖率等指标

性能与成本优化 - 进行LLM性能测试（延迟、吞吐、Token效率），评估推理成本，优化模型选型和参数配置

数据集构造与基准测试 - 基于业务场景构造高质量的评测数据集，建立模型效果的基准线，设计自动化评估框架

岗位要求：

本科及以上学历，计算机相关专业，3-5年相关工作经验

有文本/NLP或算法效果测试相关工作经验

有大模型（LLM）测试实际经验，理解Prompt工程和指令优化

精通一种编程语言（Python/Java），能编写复杂的测试脚本和效果评估代码

有性能测试经验，掌握性能测试工具（JMeter/Locust等），能评估推理延迟和成本

理解大模型和Agent框架基础，如LangChain/LangGraph/LlamaIndex/AutoGPT等

了解常见的LLM评估指标（准确率、BLEU、困惑度、ROUGE等）和评估框架（DeepEval等）

较强的数据敏感性和逻辑思维能力

加分项：

有推荐系统、搜索、内容生成等算法效果评估经验

参与过大模型应用（ChatGPT、Claude、国内大模型等）的测试工作

了解机器学习和NLP的基础理论（Word Embedding、Transformer、微调（SFT）等）

有混合检索（RAG）系统的测试经验

有AI模型评测基准（MMLU、C-Eval等）使用经验

参与过Agent或AI应用的端到端测试框架建设

有数据标注、众包评估或人工评估流程的管理经验

熟悉模型安全性和偏见风险评估

测试开发工程师

🤖 AI 估测：¥25K-45K

发布时间：8 天前