腾讯的智能体测评开发工程师-CodeBuddy/WorkBuddy薪资是多少？

该职位薪资范围为 25k–45k（人民币/月）。

智能体测评开发工程师-CodeBuddy/WorkBuddy的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

腾讯的智能体测评开发工程师-CodeBuddy/WorkBuddy有什么任职要求？

该职位要求本科学历及中级经验工作经验。

腾讯

智能体测评开发工程师-CodeBuddy/WorkBuddy

立即应聘

智能体测评开发工程师-CodeBuddy/WorkBuddy

发布于大约 14 小时前

普通员工/个人贡献者

北京市

中级经验

全职员工

仅现场办公

本科

软件工程

分布式系统

RAG

自动化测试

微服务

CI/CD

容器化

大模型

数据流水线

AI 估算 · 25k–45k

腾讯大厂背景，3年经验+AI方向热度，薪资竞争力强，月薪25-45K较为合理。

职位详情

关于这个职位

该职位主要负责构建智能体评测体系，开发自动化评测平台，对代码智能体（如CodeBuddy/WorkBuddy）进行多维度评估

你需要设计数据流水线、分布式调度引擎，并量化分析模型效果，驱动产品优化

适合有后端开发或测试开发经验、对AI技术有浓厚兴趣的工程师

最低要求

计算机相关专业本科及以上学历，3年以上后端研发或测试开发相关工作经验

精通Java或Go至少一门主流后端编程语言，具备扎实的数据结构与算法基础，拥有良好的工程化思维和规范的编码习惯

具备构建高并发、分布式系统的实际项目经验，熟悉微服务架构、容器化技术及CI/CD开发运维全流程

深入理解软件开发生命周期，能够站在开发者视角设计贴合实际需求的评测场景

具备优秀的问题分析、归因及解决能力，能独立承担技术方案设计并推动落地

工作职责

负责构建数据驱动的智能体评测体系，基于WorkBuddy/Codebuddy使用场景，设计并开发自动化数据流水线，持续挖掘、清洗和生成高度贴合用户实际场景的高质量评测用例

主导研发支持多模型、多版本并行对比的分布式自动化评测平台，负责核心调度与执行引擎的设计与开发，实现对大规模代码任务（如代码生成、代码理解、调研报告等）的高效、精准评估

针对智能体核心能力场景（如长上下文理解、复杂任务拆解、工具调用、制品生成等），设计并实现对应的评测模块与量化评估指标，确保评测深度与业务针对性

建立评测结果分析与产品优化闭环，通过根因分析（覆盖模型效果、提示工程、知识库等维度）输出可落地的优化建议，并将评测指标与产品核心数据关联，驱动智能体效果持续提升

优先资格

有大型系统质量保障或自动化测试平台开发经验者优先

对AI技术有浓厚兴趣，了解大模型、RAG、智能体（Agent）等基本原理，有AI产品评测或工程化相关经验者优先

AI 洞察

优缺点分析

优点

腾讯大平台，AI方向前景广阔，能接触到前沿的大模型和智能体技术
岗位涉及全栈式质量保障，技术深度和广度兼备，个人成长快
与优秀团队合作，有机会参与核心产品迭代，影响力大
AI领域发展快，需要持续学习新知识，保持技术敏感度
适合3年以上后端或测试开发经验、对AI评测有浓厚兴趣、喜欢解决复杂工程问题的技术型人才

缺点 / 挑战

评测体系设计复杂，需兼顾准确性、效率和可扩展性，工程挑战大
大厂工作节奏较快，可能有加班压力，需要较强的抗压能力

角色解读

可向AI评测专家方向深耕，成为智能体质量保障领域的权威
也可转型为AI产品研发工程师，参与智能体核心功能开发
未来发展可向技术管理（Tech Lead）或架构师方向晋升
构建数据驱动的智能体评测体系，设计自动化数据流水线以生成高质量评测用例
研发分布式自动化评测平台，支持多模型多版本并行对比，提升评测效率
针对智能体核心能力（如长上下文理解、工具调用）设计评测模块和量化指标
通过根因分析驱动产品优化闭环，将评测指标与产品核心数据关联
精通Java或Go，具备扎实的数据结构和算法基础
有高并发分布式系统开发经验，熟悉微服务、容器化和CI/CD
深入理解软件全生命周期，能设计贴合实际需求的评测场景
对AI技术有浓厚兴趣，了解大模型、RAG、Agent等原理

申请策略

在简历中体现技术方案设计能力，最好附上开源项目或技术博客链接
了解腾讯CodeBuddy/WorkBuddy产品背景，面试时体现对业务的理解
突出分布式系统开发经验，尤其是高并发、微服务、容器化项目
强调自动化测试或质量保障平台建设经历，用量化成果体现价值
展示对AI技术的理解，如大模型评测、RAG或Agent相关项目经验
补充大模型、RAG、Agent的基础知识，了解主流评测指标（如BLEU、ROUGE）
熟悉CI/CD工具链（如Jenkins、GitLab CI），提升工程化能力

面试指南

先明确业务场景和核心目标，再拆解技术模块（数据生成、执行引擎、指标计算），最后考虑扩展性和性能
从工程可行性、准确性、效率三个角度分析，结合具体技术选型（如消息队列、容器编排）
请设计一个智能体的自动化评测方案，需要考虑哪些维度？
如何实现一个支持多模型并行评测的分布式调度引擎？
对于代码生成任务，如何设计评测指标？如何确保评测结果的可靠性？
在处理大规模评测数据时，如何优化数据流水线的性能？
你如何理解智能体能力（如工具调用、任务拆解），如何量化评估？
复习分布式系统设计（如一致性哈希、负载均衡）和常用中间件（Kafka、Redis）

匹配度报告

综合匹配度

腾讯大厂AI方向，前沿技术栈、高成长性，但WLB一般、薪资未明确。

适合人群

最适合注重技术成长和发展前景的求职者，如果对WLB要求较高则需谨慎。

最强匹配

成长发展匹配

最弱匹配

工作生活匹配

薪资福利65

成长发展85

工作生活45

使命价值80

薪资福利匹配

65中等

腾讯作为大厂，薪资水平在行业内有竞争力，但JD未明确具体薪资和福利，且未提及年终奖等，因此补偿性动机满足程度中等。

薪资信号未披露（AI估算：25K-45K/月）

成长发展匹配

85较高

岗位涉及前沿AI技术和分布式系统，能深度参与智能体评测平台建设，技术成长空间大，但JD未明确提及培训或晋升通道，因此发展性动机满足程度较高。

技术前沿前沿/新兴技术

技术栈大模型、RAG、Agent、分布式系统、Java、Go

业务类型ambiguous

工作生活匹配

45较低

JD未提及远程或弹性办公，默认现场办公，且未说明WLB政策，大厂通常加班较多，因此生活化动机满足程度较低。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值匹配

80较高

AI行业处于高速增长期，智能体评测是热门方向，岗位能推动产品效果提升，具有较高价值感，但JD未提及社会使命，因此意义感动机满足程度较高。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

腾讯

智能体测评开发工程师-CodeBuddy/WorkBuddy

立即应聘

智能体测评开发工程师-CodeBuddy/WorkBuddy

发布于大约 14 小时前

普通员工/个人贡献者

北京市

中级经验

全职员工

仅现场办公

本科

软件工程

分布式系统

RAG

自动化测试

微服务

CI/CD

容器化

大模型

数据流水线

AI 估算 · 25k–45k

腾讯大厂背景，3年经验+AI方向热度，薪资竞争力强，月薪25-45K较为合理。