Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
测试开发工程师(AI算法评测)-飞书
立即应聘

测试开发工程师(AI算法评测)-飞书

发布于 大约 6 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
人工智能
数据处理
RAG
GO
沟通协调
测试开发
Ai算法评测
模型评测

AI 估算 · 20k–40k

基于字节跳动大厂薪资水平和AI测试开发岗位稀缺性,预估月薪20-40K。

职位详情

关于这个职位

该职位主要负责飞书AI产品的算法评测工作,包括构建评测体系、制定评测标准、执行评测并分析结果,同时推动评测工具和平台的工程化建设

加入后你将深入参与AI模型质量保障,与研发团队协作优化模型表现
适合对AI测试和质量管理感兴趣的技术人才

最低要求

计算机或者人工智能等相关专业,本科学历及以上

至少熟练使用Python/Go/Java其中一种语言,可进行相关开发
需要有较好的数据处理能力,沟通协调能力,认真负责

工作职责

负责飞书AI产品相关的评测工作,包含AI算法的评测体系建设、评测集构建、以及相关评测工程化建设等

负责RAG领域产品的交付品质,制定合理的验收机制,来评估模型品质,指导模型优化方向
负责AI算法的评测标准和评测流程制定,构建评测集,并推进评测执行,分析评测结果,对模型质量给予充分评估
建设相关评测工具/平台,推动评测工程化和无人化

优先资格

有AI相关的模型评测经验优先

对于AI行业新技术、新方向有兴趣,具备敏锐感知力者优先

AI 洞察

优缺点分析

优点

  • 身处字节跳动大平台,接触前沿AI产品,技术视野开阔
  • AI评测岗位稀缺,专业壁垒高,职业发展前景好
  • 工作内容兼具技术深度与广度,能锻炼工程与算法能力
  • 团队氛围好,鼓励创新,有较多学习资源
  • AI模型评测标准不固定,需要不断探索新的评测方法
  • 工作强度可能较大,需要快速响应产品迭代需求
  • 对新技术敏感度要求高,需持续学习AI领域最新进展
  • 适合对AI技术充满热情、喜欢质量保障工作、具备较强编程和逻辑分析能力的技术人才

缺点 / 挑战

暂无明显挑战项

角色解读

  • 纵向发展:从测试开发工程师成长为AI评测专家或质量管理负责人
  • 横向转型:积累AI领域经验后,可转向AI算法开发或AI产品经理
  • 技术深化:在评测工程化、自动化方向成为技术专家
  • 负责飞书AI产品的算法评测,包括构建评测体系和评测集,确保模型质量
  • 制定评测标准和流程,执行评测并分析结果,为模型优化提供指导
  • 建设评测工具和平台,推动评测自动化和工程化
  • 与算法、产品团队协作,沟通评测需求与优化方向
  • 扎实的编程能力:至少精通Python/Go/Java之一,能进行评测工具开发
  • AI基础知识:理解模型评测方法论,熟悉RAG等主流AI技术
  • 数据处理与分析能力:能处理大规模数据集,分析评测结果
  • 沟通协调能力:与多方协作,推动问题解决

申请策略

  • 提前了解飞书AI产品功能,思考潜在的评测挑战
  • 在面试中展现对AI质量的热情和系统性思维
  • 突出编程项目经验,尤其是Python/Go/Java的实际应用
  • 展示AI相关经验,如模型评测、数据集构建等
  • 强调数据处理和分析能力,可附上具体案例
  • 体现沟通协作能力,如跨团队合作经历
  • 系统学习AI模型评测方法论,了解常用评测指标
  • 熟悉RAG、LLM等前沿技术,动手实践开源模型

面试指南

  • 对于评测方案设计,可以从评测维度、数据集构建、指标选择、流程自动化等方面展开
  • 对于问题定位,结合数据分析与模型原理,提出假设并验证
  • 回答时注重逻辑性和实操性,体现工程思维
  • 如何设计一个AI模型评测方案?请举例说明
  • 你如何评估RAG系统的回答质量?有哪些指标?
  • 遇到模型效果不佳时,你如何定位问题并提供优化建议?
  • 请描述一个你参与过的测试工具开发项目
  • 你对AI测试自动化的理解是什么?如何实现?

匹配度报告

70
综合匹配度

大厂AI评测岗位,技术前沿成长快,薪资优但WLB一般。

适合人群
更适合追求技术成长和职业发展、愿意接受一定工作强度、对AI质量保障有热情的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展85
工作生活50
使命价值70

薪资福利匹配

75中等

字节跳动薪资竞争力强,福利完善,但JD未明确薪资和具体福利,补偿性动机满足较好。

薪资信号未披露(AI估算:20K-40K/月)

成长发展匹配

85较高

工作涉及前沿AI技术,能提升评测和工程化能力,有较好成长空间,但JD未提培训晋升。

技术前沿前沿/新兴技术
技术栈Python、Go、Java、AI算法、模型评测、RAG
业务类型ambiguous

工作生活匹配

50较低

仅现场办公,地点上海核心区域,但未提及WLB政策,大厂加班可能较普遍。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI是高速增长行业,但测试工作社会影响力中性,创新程度较高。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 光学模组专家(变焦透镜)-PICO

    字节跳动 · 上海市
    AI 估算 · 35k-60k
  • AI应用策略运营(人工服务方向)-体验与服务

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级产品经理-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大数据研发工程师 — 实验评估方向

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • 机器人业务系统后端工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • Quality Control Technician

    通用电气-布朗-博韦里 · 上海市
    AI 估算 · 10k-15k
  • Quality Control Specialist-FQC

    通用电气-布朗-博韦里 · 厦门市
    AI 估算 · 7k-11k
  • Summary

    戴森 · 上海市
    AI 估算 · 20k-35k
  • 汽车工段长(质量)

    京东 · 陕西省
    AI 估算 · 8k-14k
  • Customer Quality Engineer

    采埃孚 · 苏州市
    AI 估算 · 15k-22k

字节跳动 的其他在招职位

  • 光学模组专家(变焦透镜)-PICO

    字节跳动 · 上海市
    AI 估算 · 35k-60k
  • AI应用策略运营(人工服务方向)-体验与服务

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级产品经理-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大数据研发工程师 — 实验评估方向

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • 机器人业务系统后端工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • Quality Control Technician

    通用电气-布朗-博韦里 · 上海市
    AI 估算 · 10k-15k
  • Quality Control Specialist-FQC

    通用电气-布朗-博韦里 · 厦门市
    AI 估算 · 7k-11k
  • Summary

    戴森 · 上海市
    AI 估算 · 20k-35k
  • 汽车工段长(质量)

    京东 · 陕西省
    AI 估算 · 8k-14k
  • Customer Quality Engineer

    采埃孚 · 苏州市
    AI 估算 · 15k-22k