Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
智能体测评开发工程师-CodeBuddy/WorkBuddy
立即应聘

智能体测评开发工程师-CodeBuddy/WorkBuddy

发布于 大约 14 小时前

普通员工/个人贡献者

深圳市
中级经验
全职员工
仅现场办公
本科
软件工程
分布式系统
RAG
自动化测试
微服务
GO
CI/CD
大模型
智能体
评测平台

AI 估算 · 25k–45k

腾讯深圳中级后端岗位,结合AI方向技术溢价,市场竞争力强,薪资水平在中大型互联网企业中有优势。

职位详情

关于这个职位

作为腾讯智能体测评开发工程师,你将负责构建数据驱动的智能体评测体系,开发自动化数据流水线和分布式评测平台,对代码生成、工具调用等核心能力进行量化评估,并推动产品优化闭环

这是一个深度结合AI前沿技术与工程化能力的岗位,适合对智能体和大模型有浓厚兴趣的后端开发人才

最低要求

计算机相关专业本科及以上学历,3年以上后端研发或测试开发相关工作经验

精通Java或Go至少一门主流后端编程语言,具备扎实的数据结构与算法基础,拥有良好的工程化思维和规范的编码习惯
具备构建高并发、分布式系统的实际项目经验,熟悉微服务架构、容器化技术及CI/CD开发运维全流程
深入理解软件开发生命周期,能够站在开发者视角设计贴合实际需求的评测场景
有大型系统质量保障或自动化测试平台开发经验者优先
具备优秀的问题分析、归因及解决能力,能独立承担技术方案设计并推动落地
对AI技术有浓厚兴趣,了解大模型、RAG、智能体(Agent)等基本原理,有AI产品评测或工程化相关经验者优先

工作职责

负责构建数据驱动的智能体评测体系,基于WorkBuddy/Codebuddy使用场景,设计并开发自动化数据流水线,持续挖掘、清洗和生成高度贴合用户实际场景的高质量评测用例

主导研发支持多模型、多版本并行对比的分布式自动化评测平台,负责核心调度与执行引擎的设计与开发,实现对大规模代码任务(如代码生成、代码理解、调研报告等)的高效、精准评估
针对智能体核心能力场景(如长上下文理解、复杂任务拆解、工具调用、制品生成等),设计并实现对应的评测模块与量化评估指标,确保评测深度与业务针对性
建立评测结果分析与产品优化闭环,通过根因分析(覆盖模型效果、提示工程、知识库等维度)输出可落地的优化建议,并将评测指标与产品核心数据关联,驱动智能体效果持续提升

AI 洞察

优缺点分析

优点

  • 深度参与AI智能体前沿技术方向,积累大模型评测与工程化经验,市场稀缺性强
  • 岗位涉及全栈工程能力(数据流水线、分布式系统、CI/CD),技能复合度高

缺点 / 挑战

  • 腾讯平台提供海量数据和业务场景,技术挑战大,个人成长空间广阔
  • 技术栈要求较高,需要同时掌握后端工程和AI基础知识,学习曲线较陡
  • 评测体系从零搭建,需要较强的系统设计能力和业务洞察力,初期压力较大
  • 跨团队协作可能较多,需与算法、产品、业务多方沟通,沟通成本较高
  • 适合3年以上后端开发经验、对AI技术有强烈兴趣、乐于挑战复杂系统设计并追求技术深度的工程师

角色解读

  • 在AI评测方向深耕,成为智能体质量保障与效果优化的专家
  • 横向拓展到AI产品研发或架构设计角色,参与核心智能体产品构建
  • 在腾讯内部积累大模型工程化经验,未来可向技术Leader或AI架构师发展
  • 设计并开发自动化数据流水线,从真实用户场景中挖掘和生成高质量评测用例
  • 构建分布式自动化评测平台,支持多模型并行对比,实现高效精准的代码任务评估
  • 针对智能体核心能力(如长上下文、工具调用)设计评测模块和量化指标
  • 通过根因分析驱动产品优化闭环,将评测指标与产品核心数据关联
  • 精通Java或Go,具备扎实的数据结构和算法基础,以及高并发分布式系统经验
  • 熟悉微服务架构、容器化技术和CI/CD流程,能够独立设计和实现大型系统
  • 深入理解软件开发生命周期,具备自动化测试平台或质量保障经验
  • 对AI技术(大模型、RAG、智能体)有浓厚兴趣和基本了解

申请策略

  • 在求职信中表达对AI评测方向的独特见解,例如如何定义高质量的评测用例
  • 提前了解腾讯CodeBuddy/WorkBuddy产品形态,思考可优化的评测痛点
  • 突出高并发分布式系统项目经验,尤其是微服务、容器化部署和CI/CD实践
  • 强调自动化测试平台或质量保障相关成果,包含具体指标(如覆盖率、效率提升)
  • 提及AI相关项目或学习经历,如大模型使用、RAG应用或智能体尝试,体现技术热情
  • 展示问题分析和归因能力,例如根因分析案例或优化建议带来的收益
  • 系统学习大模型、RAG和智能体基本原理,动手搭建简单的评测框架
  • 强化Java或Go的工程实践,特别是并发编程和分布式系统设计模式

面试指南

  • 对于系统设计类问题,采用“需求分析-架构图-核心组件-关键技术选型”的框架,结合实际经验阐述
  • 对于评测指标类问题,先明确目标,再定义具体指标(如准确率、召回率、执行成功率),最后讨论陷阱和优化
  • 对于根因分析类问题,使用“问题描述-假设验证-数据支撑-解决措施-结果复盘”的STAR方法
  • 请设计一个支持多模型并行评测的分布式系统架构,并说明关键组件
  • 如何为智能体的工具调用能力设计量化评测指标?请举例说明
  • 描述一次你通过根因分析解决复杂问题的经历,具体步骤和结果
  • 你对大模型幻觉问题有什么理解?如何在评测中检测或缓解?
  • 如何确保评测数据的高质量和多样性?请分享你的数据流水线设计思路

匹配度报告

64
综合匹配度

腾讯AI评测中台岗位,前沿技术栈,成长性强,但办公灵活性和WLB信息不明。

适合人群
适合高度追求技术成长和前沿领域探索,对工作地点灵活性要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利65
成长发展90
工作生活40
使命价值60

薪资福利匹配

65中等

腾讯作为上市巨头,薪资福利具有市场竞争力,但JD未披露具体薪资和福利细节,整体满足度中等偏上。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

90较高

岗位涉及前沿AI技术(大模型、智能体、RAG),技术挑战大,能显著提升工程和AI交叉能力,发展性动机满足度极高。

技术前沿前沿/新兴技术
技术栈大模型、智能体、RAG、分布式系统、微服务、Java、Go
业务类型ambiguous

工作生活匹配

40较低

工作地点深圳且仅现场办公,JD未提及弹性工作或WLB信息,生活化动机满足度较低。

工作模式未明确
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

60中等

AI智能体处于高速增长赛道,但岗位侧重于内部产品质量,社会影响力一般,意义感动机中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 《三角洲行动》-海外内容运营

    腾讯 · 深圳市
    AI 估算 · 18k-28k
  • 腾讯云-战略客户销售岗

    腾讯 · 上海市
    AI 估算 · 50k-80k
  • 腾讯云AI前线部署工程师FDE-(北京/上海)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • 元宝搜索部-大模型算法研究员(Agent方向)

    腾讯 · 北京市
    AI 估算 · 30k-50k
  • QQ飞车手游-游戏客户端开发工程师-新星引力计划

    腾讯 · 深圳市
    AI 估算 · 15k-25k

相似职位推荐

  • 顶尖实习-大模型推理加速研究员-AI平台-实习

    小米 · 北京市
    AI 估算 · 6k-10k
  • (实习生) 媒体引擎与高性能计算工程师

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 系统架构师(城配)

    顺丰速运 · 上海市
    AI 估算 · 30k-50k
  • 大模型算法工程师(销服)

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 测试开发工程师

    知乎 · 武汉市
    AI 估算 · 15k-25k

腾讯 的其他在招职位

  • 《三角洲行动》-海外内容运营

    腾讯 · 深圳市
    AI 估算 · 18k-28k
  • 腾讯云-战略客户销售岗

    腾讯 · 上海市
    AI 估算 · 50k-80k
  • 腾讯云AI前线部署工程师FDE-(北京/上海)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • 元宝搜索部-大模型算法研究员(Agent方向)

    腾讯 · 北京市
    AI 估算 · 30k-50k
  • QQ飞车手游-游戏客户端开发工程师-新星引力计划

    腾讯 · 深圳市
    AI 估算 · 15k-25k

相似职位推荐

  • 顶尖实习-大模型推理加速研究员-AI平台-实习

    小米 · 北京市
    AI 估算 · 6k-10k
  • (实习生) 媒体引擎与高性能计算工程师

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 系统架构师(城配)

    顺丰速运 · 上海市
    AI 估算 · 30k-50k
  • 大模型算法工程师(销服)

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 测试开发工程师

    知乎 · 武汉市
    AI 估算 · 15k-25k