Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
豆包语音大模型评测工程师-Data语音
立即应聘

豆包语音大模型评测工程师-Data语音

发布于 1 天前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
软件工程
数据分析
PyTorch
多模态
ALM
ASR
TTS
自动化评测
评测体系
语音大模型

AI 估算 · 20k–35k

一线大厂语音评测岗,技能门槛较高,薪资具有市场竞争力

职位详情

关于这个职位

该职位负责豆包语音交互产品的大模型评测工作,包括评测体系建设、自动化评测工具开发以及模型交付质量评估

你将与算法、产品团队协作,通过数据分析和问题归因推动模型效果优化
适合对语音大模型评测有热情、具备工程和数据分析能力的技术人才

最低要求

计算机科学、软件工程、人工智能、语音信号处理等相关专业,本科及以上学历

年以上AI工程研发或模型评测相关经验,有语音、NLP、多模态或大模型评测经验者优先
熟悉模型评测的基本方法,能够围绕准确率、稳定性、鲁棒性、链路延迟、用户体验等维度设计合理的评估方案
具备良好的工程能力,能够参与或主导评测框架、评测工具或评测平台的设计与实现
具备较强的数据处理和分析能力,能够从评测结果、日志和负面案例中发现Pattern,定位问题根因并提出改进建议
具备良好的沟通协作能力和自驱力,能够主动识别评测体系中的问题,并推动评测能力在业务中落地

工作职责

负责豆包语音交互相关产品的评测工作,包括评测体系建设、评测集构建、评测指标设计、自动化评测流程及工程化能力建设

负责ASR、TTS、ALM、端到端S2T/S2S等语音大模型及相关产品的交付质量评估,制定验收标准和质量门禁,支撑模型上线、迭代和效果优化
围绕语音理解、语音生成、端到端多模态交互等场景,设计并落地离线评测、在线评估、负面案例分析、回归验证等机制,持续提升评测覆盖度和准确性
建设多模态大模型评测工具/平台,推动评测流程标准化、自动化和可视化,提升模型评测效率与问题定位效率
基于评测数据进行分析和归因,发现模型能力短板、质量风险和优化方向,协同算法、产品、工程团队推动问题闭环

优先资格

加分项:

有前沿语音大模型、多模态大模型或通用大模型研发/评测经验,参与过有行业影响力的模型、产品或平台项目
熟悉语音理解、语音生成、端到端语音交互等技术方向,对行业新技术保持持续关注,愿意主动学习探索新技术新方向
熟练使用AI Coding工具,了解CLI、Skills、Agent等相关技术栈
熟悉PyTorch等深度学习框架,了解常见深度学习算法和模型训练、推理、评估流程

AI 洞察

优缺点分析

优点

  • 接触前沿语音大模型技术,积累多模态评测经验,技术成长快
  • 大厂平台资源丰富,有机会参与行业影响力项目
  • 薪资福利有竞争力,职业发展空间大
  • 语音评测领域快速演进,需要持续学习新技术
  • 大厂工作节奏可能较快,需要较强的自驱力和抗压能力
  • 适合对语音大模型有浓厚兴趣、喜欢通过数据驱动问题解决、具备工程思维的技术型人才

缺点 / 挑战

  • 评测工作需兼顾技术和沟通,对工程和数据分析能力要求较高

角色解读

  • 纵向深入成为语音大模型评测专家,主导评测体系建设和行业标准制定
  • 横向转型为语音算法工程师或产品经理,积累模型落地和优化经验
  • 晋升为技术Leader,带领评测团队,推动跨部门协作
  • 设计并建设语音大模型的评测体系,包括评测集、指标和自动化流程
  • 负责ASR、TTS等模型的交付质量评估,制定验收标准并推动模型迭代优化
  • 开发评测工具和平台,提升评测效率与问题定位能力
  • 通过数据分析发现模型短板,协同团队推动问题闭环
  • 熟悉模型评测方法论,能设计准确率、稳定性等多维度评估方案
  • 具备扎实的工程能力,能主导评测框架和工具的开发
  • 熟练掌握数据处理和分析技能,能从评测结果中挖掘规律和根因
  • 对语音技术(ASR、TTS、多模态)有深刻理解,了解前沿大模型方向

申请策略

  • 准备一个完整的评测项目案例,包括设计思路、工具实现和成果
  • 关注豆包语音产品动态,了解其技术路线和评测挑战
  • 突出语音或NLP相关项目经验,特别是模型评测或质量保障经历
  • 展示工程能力:开发过评测工具、自动化框架或平台
  • 强调数据分析案例:从评测结果中发现Pattern并推动优化
  • 列出使用PyTorch等深度学习框架的经验
  • 系统学习语音技术(ASR、TTS、端到端模型)和评测方法
  • 提升工程能力,掌握Python、自动化测试框架和CI/CD工具

面试指南

  • 使用STAR法则:情境-任务-行动-结果,清晰展示项目贡献
  • 从多个维度(准确率、稳定性、鲁棒性、延迟)系统回答评测设计问题
  • 强调数据驱动的解决问题思路:问题定位-根因分析-方案验证-闭环
  • 请描述一下你过去参与的一个模型评测项目,包括评测指标、流程和遇到的主要挑战
  • 如何设计一个语音识别(ASR)模型的评测方案?考虑哪些维度?
  • 如果评测发现模型准确率达标但用户体验差,你会如何分析和推动优化?
  • 你了解哪些语音大模型技术?谈谈你对端到端S2T/S2S的理解
  • 如何构建自动化评测流水线?请描述关键组件

职位点评

70
综合评分

大厂前沿语音大模型评测岗,技术成长快、薪资优厚,但工作强度可能较大。

更适合这类人
该职位最适合追求技术成长、希望在语音AI领域深耕的求职者,但对工作与生活平衡要求较高的人需谨慎。
表现最好
成长发展
相对薄弱
工作生活
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利

80较高

字节跳动薪资水平在业内属于第一梯队,但JD未明确具体薪资,福利条款未提及。整体补偿性较好。

薪资信号未披露(AI估算:20K-35K/月)

成长发展

90较高

该岗位直接接触前沿语音大模型技术,评测体系建设能极大锻炼工程和数据分析能力,技术成长空间大。

技术前沿前沿/新兴技术
技术栈语音大模型、ASR、TTS、ALM、端到端S2T/S2S、多模态、PyTorch
业务类型cost_center

工作生活

40较低

工作地点在上海,JD未提及远程或弹性办公,大厂通常节奏快,生活化动机满足度较低。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值

70中等

语音大模型是AI热门方向,岗位对行业有实际推动作用,但JD未强调社会价值,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 平台开发工程师

    中国移动 · 北京市
    AI 估算 · 20k-35k

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 平台开发工程师

    中国移动 · 北京市
    AI 估算 · 20k-35k