Agent 数据策略工程师
🤖 AI 估测:¥35K-60K
发布时间:22 天前
ℹ️关于这个职位
这是一个专注于提升AI Agent模型能力的策略工程师岗位
你将负责设计高质量的Agent训练语料和评测数据集,通过构建多样化的测试场景来评估模型在代码生成、工具调用、多轮交互等核心能力上的表现
同时,你需要探索数据标注策略对模型的影响,并与算法团队协作,为模型训练优化提供数据侧支撑
✓工作职责
整体目标:提升模型在 Agent 方向的专业能力
围绕代码生成、通用agent等场景,设计高质量的 Agent 训练语料
构建端到端的测试用例,从可用性、代码规范、工程质量、任务完成度等多维度评估模型表现
设计并构造高质量的 Agent 评测数据集,能够精准区分不同模型的能力边界
针对 Agent 的规划、工具调用、多轮交互、指令跟随等核心能力,构建多样化的测试场景与用例
持续迭代评测标准,确保评测体系能够跟进业界前沿并反映真实用户需求
探索不同数据标注策略对模型 Agent 能力的影响路径
参与数据与强化学习(RL)结合过程中的实验设计,研究模型能力的可控性检测方法,为训练策略优化提供数据侧支撑
基于深度使用 Claude Code、OpenClaw 等主流 Agent 产品的实践经验,系统性分析当前模型的能力短板与失败模式
针对性地构建补齐数据与边界测试用例,推动模型在弱项上的持续迭代与突破
⭐最低要求
具备 Claude Code、Cursor、OpenClaw 等 AI 编程工具的重度使用经验,对 LLM 辅助开发有自己的理解与思考
熟练掌握 Python,能够独立编写数据处理、评测脚本等工具
对大语言模型有基础认知且对探索大模型能力边界具有较高的热情
具备良好的自主能动性,能够独立发现问题、定义问题并推动解决
善于跨团队协作,能够与研发、算法团队高效配合
具有多年工程开发经验、完成过大型项目的交互
👍优先资格
有前端开发经验,熟悉 React 或 Vue 等主流框架,对前端设计有独立的审美与品味
有大模型数据标注、评测体系设计或数据质量管理经验