Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
智能体测评开发工程师-CodeBuddy/WorkBuddy
立即应聘

智能体测评开发工程师-CodeBuddy/WorkBuddy

发布于 大约 14 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
软件工程
分布式系统
RAG
自动化测试
微服务
GO
CI/CD
容器化
大模型
数据流水线

AI 估算 · 25k–45k

腾讯大厂背景,3年经验+AI方向热度,薪资竞争力强,月薪25-45K较为合理。

职位详情

关于这个职位

该职位主要负责构建智能体评测体系,开发自动化评测平台,对代码智能体(如CodeBuddy/WorkBuddy)进行多维度评估

你需要设计数据流水线、分布式调度引擎,并量化分析模型效果,驱动产品优化
适合有后端开发或测试开发经验、对AI技术有浓厚兴趣的工程师

最低要求

计算机相关专业本科及以上学历,3年以上后端研发或测试开发相关工作经验

精通Java或Go至少一门主流后端编程语言,具备扎实的数据结构与算法基础,拥有良好的工程化思维和规范的编码习惯
具备构建高并发、分布式系统的实际项目经验,熟悉微服务架构、容器化技术及CI/CD开发运维全流程
深入理解软件开发生命周期,能够站在开发者视角设计贴合实际需求的评测场景
具备优秀的问题分析、归因及解决能力,能独立承担技术方案设计并推动落地

工作职责

负责构建数据驱动的智能体评测体系,基于WorkBuddy/Codebuddy使用场景,设计并开发自动化数据流水线,持续挖掘、清洗和生成高度贴合用户实际场景的高质量评测用例

主导研发支持多模型、多版本并行对比的分布式自动化评测平台,负责核心调度与执行引擎的设计与开发,实现对大规模代码任务(如代码生成、代码理解、调研报告等)的高效、精准评估
针对智能体核心能力场景(如长上下文理解、复杂任务拆解、工具调用、制品生成等),设计并实现对应的评测模块与量化评估指标,确保评测深度与业务针对性
建立评测结果分析与产品优化闭环,通过根因分析(覆盖模型效果、提示工程、知识库等维度)输出可落地的优化建议,并将评测指标与产品核心数据关联,驱动智能体效果持续提升

优先资格

有大型系统质量保障或自动化测试平台开发经验者优先

对AI技术有浓厚兴趣,了解大模型、RAG、智能体(Agent)等基本原理,有AI产品评测或工程化相关经验者优先

AI 洞察

优缺点分析

优点

  • 腾讯大平台,AI方向前景广阔,能接触到前沿的大模型和智能体技术
  • 岗位涉及全栈式质量保障,技术深度和广度兼备,个人成长快
  • 与优秀团队合作,有机会参与核心产品迭代,影响力大
  • AI领域发展快,需要持续学习新知识,保持技术敏感度
  • 适合3年以上后端或测试开发经验、对AI评测有浓厚兴趣、喜欢解决复杂工程问题的技术型人才

缺点 / 挑战

  • 评测体系设计复杂,需兼顾准确性、效率和可扩展性,工程挑战大
  • 大厂工作节奏较快,可能有加班压力,需要较强的抗压能力

角色解读

  • 可向AI评测专家方向深耕,成为智能体质量保障领域的权威
  • 也可转型为AI产品研发工程师,参与智能体核心功能开发
  • 未来发展可向技术管理(Tech Lead)或架构师方向晋升
  • 构建数据驱动的智能体评测体系,设计自动化数据流水线以生成高质量评测用例
  • 研发分布式自动化评测平台,支持多模型多版本并行对比,提升评测效率
  • 针对智能体核心能力(如长上下文理解、工具调用)设计评测模块和量化指标
  • 通过根因分析驱动产品优化闭环,将评测指标与产品核心数据关联
  • 精通Java或Go,具备扎实的数据结构和算法基础
  • 有高并发分布式系统开发经验,熟悉微服务、容器化和CI/CD
  • 深入理解软件全生命周期,能设计贴合实际需求的评测场景
  • 对AI技术有浓厚兴趣,了解大模型、RAG、Agent等原理

申请策略

  • 在简历中体现技术方案设计能力,最好附上开源项目或技术博客链接
  • 了解腾讯CodeBuddy/WorkBuddy产品背景,面试时体现对业务的理解
  • 突出分布式系统开发经验,尤其是高并发、微服务、容器化项目
  • 强调自动化测试或质量保障平台建设经历,用量化成果体现价值
  • 展示对AI技术的理解,如大模型评测、RAG或Agent相关项目经验
  • 补充大模型、RAG、Agent的基础知识,了解主流评测指标(如BLEU、ROUGE)
  • 熟悉CI/CD工具链(如Jenkins、GitLab CI),提升工程化能力

面试指南

  • 先明确业务场景和核心目标,再拆解技术模块(数据生成、执行引擎、指标计算),最后考虑扩展性和性能
  • 从工程可行性、准确性、效率三个角度分析,结合具体技术选型(如消息队列、容器编排)
  • 请设计一个智能体的自动化评测方案,需要考虑哪些维度?
  • 如何实现一个支持多模型并行评测的分布式调度引擎?
  • 对于代码生成任务,如何设计评测指标?如何确保评测结果的可靠性?
  • 在处理大规模评测数据时,如何优化数据流水线的性能?
  • 你如何理解智能体能力(如工具调用、任务拆解),如何量化评估?
  • 复习分布式系统设计(如一致性哈希、负载均衡)和常用中间件(Kafka、Redis)

匹配度报告

69
综合匹配度

腾讯大厂AI方向,前沿技术栈、高成长性,但WLB一般、薪资未明确。

适合人群
最适合注重技术成长和发展前景的求职者,如果对WLB要求较高则需谨慎。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利65
成长发展85
工作生活45
使命价值80

薪资福利匹配

65中等

腾讯作为大厂,薪资水平在行业内有竞争力,但JD未明确具体薪资和福利,且未提及年终奖等,因此补偿性动机满足程度中等。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

85较高

岗位涉及前沿AI技术和分布式系统,能深度参与智能体评测平台建设,技术成长空间大,但JD未明确提及培训或晋升通道,因此发展性动机满足程度较高。

技术前沿前沿/新兴技术
技术栈大模型、RAG、Agent、分布式系统、Java、Go
业务类型ambiguous

工作生活匹配

45较低

JD未提及远程或弹性办公,默认现场办公,且未说明WLB政策,大厂通常加班较多,因此生活化动机满足程度较低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

AI行业处于高速增长期,智能体评测是热门方向,岗位能推动产品效果提升,具有较高价值感,但JD未提及社会使命,因此意义感动机满足程度较高。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 《三角洲行动》-海外内容运营

    腾讯 · 深圳市
    AI 估算 · 18k-28k
  • 腾讯云-战略客户销售岗

    腾讯 · 上海市
    AI 估算 · 50k-80k
  • 智能体测评开发工程师-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 腾讯云AI前线部署工程师FDE-(北京/上海)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • 元宝搜索部-大模型算法研究员(Agent方向)

    腾讯 · 北京市
    AI 估算 · 30k-50k

相似职位推荐

  • 顶尖实习-大模型推理加速研究员-AI平台-实习

    小米 · 北京市
    AI 估算 · 6k-10k
  • (实习生) 媒体引擎与高性能计算工程师

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 系统架构师(城配)

    顺丰速运 · 上海市
    AI 估算 · 30k-50k
  • 大模型算法工程师(销服)

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 测试开发工程师

    知乎 · 武汉市
    AI 估算 · 15k-25k

腾讯 的其他在招职位

  • 《三角洲行动》-海外内容运营

    腾讯 · 深圳市
    AI 估算 · 18k-28k
  • 腾讯云-战略客户销售岗

    腾讯 · 上海市
    AI 估算 · 50k-80k
  • 智能体测评开发工程师-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 腾讯云AI前线部署工程师FDE-(北京/上海)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • 元宝搜索部-大模型算法研究员(Agent方向)

    腾讯 · 北京市
    AI 估算 · 30k-50k

相似职位推荐

  • 顶尖实习-大模型推理加速研究员-AI平台-实习

    小米 · 北京市
    AI 估算 · 6k-10k
  • (实习生) 媒体引擎与高性能计算工程师

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 系统架构师(城配)

    顺丰速运 · 上海市
    AI 估算 · 30k-50k
  • 大模型算法工程师(销服)

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 测试开发工程师

    知乎 · 武汉市
    AI 估算 · 15k-25k