字节跳动的Agent数据与评测Leader（Coze方向）-Dev Infra薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

Agent数据与评测Leader（Coze方向）-Dev Infra的工作地点在哪里？

该职位工作地点位于杭州市。工作形式为仅现场办公。

字节跳动的Agent数据与评测Leader（Coze方向）-Dev Infra有什么任职要求？

该职位要求本科学历及高级经验工作经验。

字节跳动

Agent数据与评测Leader（Coze方向）-Dev Infra

立即应聘

Agent数据与评测Leader（Coze方向）-Dev Infra

发布于大约 2 个月前

中层管理(经理/总监)

杭州市

高级经验

全职员工

仅现场办公

本科

信息技术与基础设施

团队管理

大模型

数据建设

评测体系

AI 估算 · 35k–60k

字节跳动大厂AI方向资深技术+管理岗，薪资竞争力强，月薪35K-60K合理。

职位详情

关于这个职位

该职位负责Coze方向Agent数据与评测体系的建设与团队管理，需要带领团队搭建评测基建、建设Benchmark和高质量数据集，并协同多部门推动效果迭代

适合具备大模型评测背景、工程能力强且有管理潜力的资深技术人才

最低要求

本科及以上学历，计算机科学、人工智能、数学等相关专业，具有5年以上大模型相关工作经验

有团队管理经验或团队负责人潜力，具备良好的业务沟通能力和跨团队协同能力，能够推动复杂项目落地

具备扎实的工程能力和数据分析能力，熟练掌握Python、Go、C++中至少一种

工作职责

负责各场景的评测体系建设与团队管理，覆盖编程、Claw、垂类Agent等方向，支撑效果评估、问题定位和迭代闭环

主导评测基建的0-1搭建和长期建设，包括评测产线、数据分析链路、自动化评测能力等

负责Benchmark和高质量评测数据建设，包括数据设计、采集、合成、治理与持续迭代

协同业务、策略、产品、研发等团队，共同对的效果迭代负责

优先资格

有Agent开发或复杂场景评测经验者优先，在相关会议发表过论文者优先

AI 洞察

优缺点分析

优点

字节跳动平台，接触前沿大模型技术，业务影响大
管理岗位，可锻炼团队领导力和跨部门协调能力
薪资福利优厚，大厂标配
评测体系建设需要同时兼顾工程和数据，技术广度要求高
AI领域更新快，需要持续学习保持技术敏感度
适合有5年以上大模型经验、具备管理和工程能力、希望在AI评测领域深耕的技术专家

缺点 / 挑战

从0到1搭建评测体系，挑战性高，个人成长快
跨团队协作频繁，沟通成本较高

角色解读

在字节跳动AI基础设施团队，可晋升为更高级别的技术管理或架构师
通过主导评测体系，成为大模型质量保障领域的专家
可横向拓展至更广泛的AI Infra方向，如训练、推理等
带领团队构建Agent评测体系，覆盖编程、Claw、垂类Agent等场景，确保效果评估与问题定位
主导评测基建从0到1的搭建，包括评测产线、自动化工具和数据分析链路
负责Benchmark和高质量评测数据的设计、采集、合成与持续迭代
跨团队协同（业务、策略、产品、研发），推动效果迭代闭环
扎实的工程能力，熟练使用Python、Go、C++等至少一种编程语言
丰富的大模型评测经验，熟悉评测方法论和自动化流程
数据分析能力，能从数据中发现问题并驱动改进
团队管理与跨部门协作能力，能推动复杂项目落地

申请策略

理解Coze和字节跳动AI生态，在面试中展现对业务场景的洞察
准备一个评测体系建设方案，展示系统性思考
突出大模型评测相关项目经验，特别是从0到1搭建评测体系的经历
强调团队管理或项目领导经验，包括团队规模、跨部门协调案例
展示工程能力，如编程语言熟练度、自动化工具开发
如有Agent开发或论文发表，务必重点提及
如果缺乏评测体系搭建经验，可先自学相关方法论，如自动化评测工具链
补充Agent开发知识，了解Claw等场景

面试指南

STAR法则：情境-任务-行动-结果，特别是项目背景和你的具体贡献
系统性思维：先谈整体架构，再细化到技术细节
数据驱动：强调用数据说话，量化指标和改进效果
请描述你之前负责的大模型评测项目，如何设计评测指标？
如何搭建一个自动化的评测产线？技术选型考虑哪些？
团队管理经验：如何分配任务、跟进进度、处理冲突？
如何与产品、研发等团队协作推动评测结果落地？
对Agent场景的评测有什么独特见解？与传统NLU评测有何不同？

职位点评

综合评分

字节跳动AI基础设施团队，前沿技术栈+管理机会，薪资优厚但工作强度较大。

更适合这类人

适合追求技术成长和职业发展、能接受较高工作强度的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展85

工作生活45

使命价值70

薪资福利

80较高

字节跳动作为上市公司，薪资福利具有竞争力，但JD未明确薪资范围，可推测为市场偏高水准。

薪资信号未披露（AI估算：35K-60K/月）

成长发展

85较高

职位负责前沿大模型评测体系建设，技术挑战大，个人成长空间广阔，但JD未提及培训或晋升通道。

技术前沿前沿/新兴技术

技术栈大模型、Agent、Coze、评测体系、自动化

业务类型profit_center

工作生活

45较低

工作地点杭州，仅现场办公，未提及弹性工作或WLB，大厂通常工作强度较高。

工作模式仅现场办公

办公地点科技园/产业园

加班情况未提及（无法判断）

使命价值

70中等

AI行业高速增长，职位对技术发展方向有较大影响，但社会价值中性。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

Agent数据与评测Leader（Coze方向）-Dev Infra

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

腾讯安全-云主机安全能力运营工程师

AgenticOps Staff Engineer

Advisory Solution Architect

HRIS Analyst (用友技术解决方案架构师)

IT运维专家

字节跳动的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

腾讯安全-云主机安全能力运营工程师

AgenticOps Staff Engineer

Advisory Solution Architect

HRIS Analyst (用友技术解决方案架构师)

IT运维专家

Agent数据与评测Leader（Coze方向）-Dev Infra

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

腾讯安全-云主机安全能力运营工程师

AgenticOps Staff Engineer

Advisory Solution Architect

HRIS Analyst (用友技术解决方案架构师)

IT运维专家

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

腾讯安全-云主机安全能力运营工程师

AgenticOps Staff Engineer

Advisory Solution Architect

HRIS Analyst (用友技术解决方案架构师)

IT运维专家

字节跳动的其他在招职位

字节跳动的其他在招职位