Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
测试开发工程师-火山引擎
立即应聘

测试开发工程师-火山引擎

发布于 大约 3 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
深度学习
NLP
汽车行业
质量保障
大模型
评测体系
算法评测
测试基建

AI 估算 · 20k–40k

字节跳动大厂,测试开发岗位,北京,三年经验,薪资具备竞争力,月薪20-40K,15薪较常见。

职位详情

关于这个职位

该职位主要负责火山引擎汽车行业大模型的质量保障工作,包括模型评测、测试基建搭建、测试数据分析与用例设计等

需要具备NLP、深度学习和大模型基础,熟练使用Python/Shell,并有一定抗压能力
适合有AI测试经验、对汽车行业感兴趣的技术人才

最低要求

本科及以上学历,计算机、通信、统计等相关专业三年以上测试或开发工作经验

熟悉NLP、深度学习、生成式语言大模型等基本原理和技术,熟悉常见的评测指标、效果评估方法
熟悉掌握Python/Shell等语言中的一门或者多门
具有良好的沟通能力和团队合作精神、快速的学习能力,具备一定的抗压能力和强烈的责任心

工作职责

负责汽车行业领域大模型的质量保障工作,其中包含软件的需求分析、模型评测、效果评估等,支持行业内的工程化落地

负责汽车行业领域大模型的测试基建、评测体系的建设,提升业务评测效率和质量
负责大模型业务测试数据的分析和统计,对模型结果、过程数据进行分析、提取、统计
根据产品设计制定测试计划、风险评估、设计测试数据和测试用例,执行测试用例,进行Bug追踪等
对大模型以及相关方向(如NLP、CV、多模态等)的前沿技术、评测体系进行持续跟踪和调研

优先资格

有过AI类产品的质量保障工作经历或算法评测经验或有汽车行业相关经验、ToB交付业务经验最佳

AI 洞察

优缺点分析

优点

  • 属于AI大模型前沿领域,技术栈新颖,能积累AI质量保障经验
  • 字节跳动平台大,资源丰富,项目有影响力,职业发展空间大
  • 团队氛围技术导向,能接触业内顶尖技术专家,学习成长快
  • 薪资待遇优厚,福利完善(如六险一金、免费三餐等)
  • 大模型评测技术尚在早期,需要独立探索和建设,对创新要求高
  • 对综合能力要求高:既要懂测开,又要懂算法和行业知识
  • 适合对AI测试有热情、具备较强学习和抗压能力、希望在大模型质量保障领域深耕的资深测试开发工程师

缺点 / 挑战

  • 业务压力较大,需要快速产出和高质量交付,加班可能较多

角色解读

  • 可在测试开发方向深耕,成为AI测试领域的专家,负责更大规模的模型评测体系
  • 可横向拓展至算法工程、模型优化或项目管理方向,参与核心AI产品的研发
  • 字节跳动提供内部转岗和晋升机会,未来可向技术Leader或架构师发展
  • 负责大模型产品的质量保障,包括需求分析、模型评测、效果评估等,确保AI模型在汽车行业的工程化落地
  • 搭建测试基建和评测体系,提升测试效率和覆盖度,参与测试数据分析与统计
  • 根据产品设计制定测试计划、设计测试用例,执行并跟踪Bug,保障产品质量
  • 持续跟踪大模型及相关前沿技术,进行技术调研和评测方法论创新
  • 扎实的NLP、深度学习和大模型原理知识,熟悉常见的评测指标和效果评估方法
  • 精通Python/Shell等编程语言,有较强的编码能力
  • 良好的沟通协作能力和团队精神,快速学习能力,能承受一定工作压力
  • 加分项:AI算法评测经验、汽车行业经验或ToB交付经验

申请策略

  • 面试前了解火山引擎的相关产品,尤其是AI解决方案
  • 准备一个大模型评测或质量保障的系统性方案,展示思考深度
  • 突出AI测试或算法评测相关项目经验,特别是大模型、NLP方向的质量保障案例
  • 展示Python/Shell编程能力,可附上Github或技术博客
  • 强调与汽车行业或ToB交付相关的经验(如有)
  • 量化测试成果,如效率提升百分比、缺陷发现数等
  • 补充大模型评测方法论,熟悉常用评测框架(如MMLU、C-Eval)
  • 学习汽车行业知识,了解车联网、自动驾驶等场景

面试指南

  • 结构清晰:先用一句话概括核心观点,然后分点展开,最后总结
  • 结合实例:用具体项目经历佐证,避免空谈理论
  • 展现思考:不仅说做了什么,更要说明为何这样做、效果如何、学到了什么
  • 请说说你对大模型评测的理解,常用的评测指标有哪些?
  • 描述一个你负责过的AI项目质量保障流程,你遇到了哪些挑战?
  • 如何设计测试用例来评估大模型在汽车场景下的效果?
  • 如果你发现模型效果不达标,你会如何分析和定位问题?
  • 谈谈你对测试基建自动化的经验,如何提升评测效率?

匹配度报告

70
综合匹配度

字节跳动大模型测试开发岗,技术前沿、薪资优厚,但工作强度大,WLB一般。

适合人群
适合追求技术成长和薪资回报、能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活35
使命价值70

薪资福利匹配

85较高

职位薪资福利有竞争力,字节跳动为上市公司,待遇优厚,但未明确薪资范围,面议可能。福利如六险一金、免费三餐等常见。

薪资信号面议 (20K-40K/月)

成长发展匹配

90较高

技术前沿(大模型),成长空间大,字节跳动内部培训丰富,但JD未明确提及晋升路径,技能要求高。

技术前沿前沿/新兴技术
技术栈大模型、NLP、深度学习、Python、Shell
业务类型profit_center

工作生活匹配

35较低

需现场办公,未提及WLB,互联网大厂工作强度大,加班可能普遍。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型赋能汽车行业,有社会价值,行业高速增长,但具体使命导向未明确。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 人审交付运营(BPO/众包方向)-大模型安全&模型运维

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • AI搜索/Agent算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-60k
  • 后端开发工程师(数据方向)-国际化(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 后端开发工程师-国际化达人营销平台

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 保险增长产品经理-财经

    字节跳动 · 北京市
    AI 估算 · 20k-35k

字节跳动 的其他在招职位

  • 人审交付运营(BPO/众包方向)-大模型安全&模型运维

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • AI搜索/Agent算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-60k
  • 后端开发工程师(数据方向)-国际化(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 后端开发工程师-国际化达人营销平台

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 保险增长产品经理-财经

    字节跳动 · 北京市
    AI 估算 · 20k-35k