字节跳动的豆包语音大模型评测工程师-Data语音薪资是多少？

该职位薪资范围为 20k–35k（人民币/月）。

豆包语音大模型评测工程师-Data语音的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

字节跳动的豆包语音大模型评测工程师-Data语音有什么任职要求？

该职位要求本科学历及中级经验工作经验。

字节跳动

豆包语音大模型评测工程师-Data语音

立即应聘

豆包语音大模型评测工程师-Data语音

发布于 1 天前

普通员工/个人贡献者

上海市

中级经验

全职员工

仅现场办公

本科

软件工程

数据分析

PyTorch

多模态

ALM

ASR

TTS

自动化评测

评测体系

语音大模型

AI 估算 · 20k–35k

一线大厂语音评测岗，技能门槛较高，薪资具有市场竞争力

职位详情

关于这个职位

该职位负责豆包语音交互产品的大模型评测工作，包括评测体系建设、自动化评测工具开发以及模型交付质量评估

你将与算法、产品团队协作，通过数据分析和问题归因推动模型效果优化

适合对语音大模型评测有热情、具备工程和数据分析能力的技术人才

最低要求

计算机科学、软件工程、人工智能、语音信号处理等相关专业，本科及以上学历

年以上AI工程研发或模型评测相关经验，有语音、NLP、多模态或大模型评测经验者优先

熟悉模型评测的基本方法，能够围绕准确率、稳定性、鲁棒性、链路延迟、用户体验等维度设计合理的评估方案

具备良好的工程能力，能够参与或主导评测框架、评测工具或评测平台的设计与实现

具备较强的数据处理和分析能力，能够从评测结果、日志和负面案例中发现Pattern，定位问题根因并提出改进建议

具备良好的沟通协作能力和自驱力，能够主动识别评测体系中的问题，并推动评测能力在业务中落地

工作职责

负责豆包语音交互相关产品的评测工作，包括评测体系建设、评测集构建、评测指标设计、自动化评测流程及工程化能力建设

负责ASR、TTS、ALM、端到端S2T/S2S等语音大模型及相关产品的交付质量评估，制定验收标准和质量门禁，支撑模型上线、迭代和效果优化

围绕语音理解、语音生成、端到端多模态交互等场景，设计并落地离线评测、在线评估、负面案例分析、回归验证等机制，持续提升评测覆盖度和准确性

建设多模态大模型评测工具/平台，推动评测流程标准化、自动化和可视化，提升模型评测效率与问题定位效率

基于评测数据进行分析和归因，发现模型能力短板、质量风险和优化方向，协同算法、产品、工程团队推动问题闭环

优先资格

加分项：

有前沿语音大模型、多模态大模型或通用大模型研发/评测经验，参与过有行业影响力的模型、产品或平台项目

熟悉语音理解、语音生成、端到端语音交互等技术方向，对行业新技术保持持续关注，愿意主动学习探索新技术新方向

熟练使用AI Coding工具，了解CLI、Skills、Agent等相关技术栈

熟悉PyTorch等深度学习框架，了解常见深度学习算法和模型训练、推理、评估流程

AI 洞察

优缺点分析

优点

接触前沿语音大模型技术，积累多模态评测经验，技术成长快
大厂平台资源丰富，有机会参与行业影响力项目
薪资福利有竞争力，职业发展空间大
语音评测领域快速演进，需要持续学习新技术
大厂工作节奏可能较快，需要较强的自驱力和抗压能力
适合对语音大模型有浓厚兴趣、喜欢通过数据驱动问题解决、具备工程思维的技术型人才

缺点 / 挑战

评测工作需兼顾技术和沟通，对工程和数据分析能力要求较高

角色解读

纵向深入成为语音大模型评测专家，主导评测体系建设和行业标准制定
横向转型为语音算法工程师或产品经理，积累模型落地和优化经验
晋升为技术Leader，带领评测团队，推动跨部门协作
设计并建设语音大模型的评测体系，包括评测集、指标和自动化流程
负责ASR、TTS等模型的交付质量评估，制定验收标准并推动模型迭代优化
开发评测工具和平台，提升评测效率与问题定位能力
通过数据分析发现模型短板，协同团队推动问题闭环
熟悉模型评测方法论，能设计准确率、稳定性等多维度评估方案
具备扎实的工程能力，能主导评测框架和工具的开发
熟练掌握数据处理和分析技能，能从评测结果中挖掘规律和根因
对语音技术（ASR、TTS、多模态）有深刻理解，了解前沿大模型方向

申请策略

准备一个完整的评测项目案例，包括设计思路、工具实现和成果
关注豆包语音产品动态，了解其技术路线和评测挑战
突出语音或NLP相关项目经验，特别是模型评测或质量保障经历
展示工程能力：开发过评测工具、自动化框架或平台
强调数据分析案例：从评测结果中发现Pattern并推动优化
列出使用PyTorch等深度学习框架的经验
系统学习语音技术（ASR、TTS、端到端模型）和评测方法
提升工程能力，掌握Python、自动化测试框架和CI/CD工具

面试指南

使用STAR法则：情境-任务-行动-结果，清晰展示项目贡献
从多个维度（准确率、稳定性、鲁棒性、延迟）系统回答评测设计问题
强调数据驱动的解决问题思路：问题定位-根因分析-方案验证-闭环
请描述一下你过去参与的一个模型评测项目，包括评测指标、流程和遇到的主要挑战
如何设计一个语音识别（ASR）模型的评测方案？考虑哪些维度？
如果评测发现模型准确率达标但用户体验差，你会如何分析和推动优化？
你了解哪些语音大模型技术？谈谈你对端到端S2T/S2S的理解
如何构建自动化评测流水线？请描述关键组件

职位点评

综合评分

大厂前沿语音大模型评测岗，技术成长快、薪资优厚，但工作强度可能较大。

更适合这类人

该职位最适合追求技术成长、希望在语音AI领域深耕的求职者，但对工作与生活平衡要求较高的人需谨慎。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展90

工作生活40

使命价值70

薪资福利

80较高

字节跳动薪资水平在业内属于第一梯队，但JD未明确具体薪资，福利条款未提及。整体补偿性较好。

薪资信号未披露（AI估算：20K-35K/月）

成长发展

90较高

该岗位直接接触前沿语音大模型技术，评测体系建设能极大锻炼工程和数据分析能力，技术成长空间大。

技术前沿前沿/新兴技术

技术栈语音大模型、ASR、TTS、ALM、端到端S2T/S2S、多模态、PyTorch

业务类型cost_center

工作生活

40较低

工作地点在上海，JD未提及远程或弹性办公，大厂通常节奏快，生活化动机满足度较低。

工作模式仅现场办公

办公地点科技园/产业园

加班情况未提及（无法判断）

使命价值

70中等

语音大模型是AI热门方向，岗位对行业有实际推动作用，但JD未强调社会价值，意义感中等。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

字节跳动

豆包语音大模型评测工程师-Data语音

立即应聘

豆包语音大模型评测工程师-Data语音

发布于 1 天前

普通员工/个人贡献者

上海市

中级经验

全职员工

仅现场办公

本科

软件工程

数据分析

PyTorch

多模态

ALM

ASR

TTS

自动化评测

评测体系

语音大模型

AI 估算 · 20k–35k

一线大厂语音评测岗，技能门槛较高，薪资具有市场竞争力

职位详情

关于这个职位

该职位负责豆包语音交互产品的大模型评测工作，包括评测体系建设、自动化评测工具开发以及模型交付质量评估

你将与算法、产品团队协作，通过数据分析和问题归因推动模型效果优化

适合对语音大模型评测有热情、具备工程和数据分析能力的技术人才

最低要求

计算机科学、软件工程、人工智能、语音信号处理等相关专业，本科及以上学历

年以上AI工程研发或模型评测相关经验，有语音、NLP、多模态或大模型评测经验者优先

熟悉模型评测的基本方法，能够围绕准确率、稳定性、鲁棒性、链路延迟、用户体验等维度设计合理的评估方案

具备良好的工程能力，能够参与或主导评测框架、评测工具或评测平台的设计与实现

具备较强的数据处理和分析能力，能够从评测结果、日志和负面案例中发现Pattern，定位问题根因并提出改进建议

具备良好的沟通协作能力和自驱力，能够主动识别评测体系中的问题，并推动评测能力在业务中落地

工作职责

负责豆包语音交互相关产品的评测工作，包括评测体系建设、评测集构建、评测指标设计、自动化评测流程及工程化能力建设

负责ASR、TTS、ALM、端到端S2T/S2S等语音大模型及相关产品的交付质量评估，制定验收标准和质量门禁，支撑模型上线、迭代和效果优化

建设多模态大模型评测工具/平台，推动评测流程标准化、自动化和可视化，提升模型评测效率与问题定位效率

基于评测数据进行分析和归因，发现模型能力短板、质量风险和优化方向，协同算法、产品、工程团队推动问题闭环

优先资格

加分项：

有前沿语音大模型、多模态大模型或通用大模型研发/评测经验，参与过有行业影响力的模型、产品或平台项目

熟悉语音理解、语音生成、端到端语音交互等技术方向，对行业新技术保持持续关注，愿意主动学习探索新技术新方向

熟练使用AI Coding工具，了解CLI、Skills、Agent等相关技术栈

熟悉PyTorch等深度学习框架，了解常见深度学习算法和模型训练、推理、评估流程

AI 洞察

优缺点分析

优点

接触前沿语音大模型技术，积累多模态评测经验，技术成长快
大厂平台资源丰富，有机会参与行业影响力项目
薪资福利有竞争力，职业发展空间大
语音评测领域快速演进，需要持续学习新技术
大厂工作节奏可能较快，需要较强的自驱力和抗压能力
适合对语音大模型有浓厚兴趣、喜欢通过数据驱动问题解决、具备工程思维的技术型人才

缺点 / 挑战

评测工作需兼顾技术和沟通，对工程和数据分析能力要求较高

角色解读

纵向深入成为语音大模型评测专家，主导评测体系建设和行业标准制定
横向转型为语音算法工程师或产品经理，积累模型落地和优化经验
晋升为技术Leader，带领评测团队，推动跨部门协作
设计并建设语音大模型的评测体系，包括评测集、指标和自动化流程
负责ASR、TTS等模型的交付质量评估，制定验收标准并推动模型迭代优化
开发评测工具和平台，提升评测效率与问题定位能力
通过数据分析发现模型短板，协同团队推动问题闭环
熟悉模型评测方法论，能设计准确率、稳定性等多维度评估方案
具备扎实的工程能力，能主导评测框架和工具的开发
熟练掌握数据处理和分析技能，能从评测结果中挖掘规律和根因
对语音技术（ASR、TTS、多模态）有深刻理解，了解前沿大模型方向

申请策略

准备一个完整的评测项目案例，包括设计思路、工具实现和成果
关注豆包语音产品动态，了解其技术路线和评测挑战
突出语音或NLP相关项目经验，特别是模型评测或质量保障经历
展示工程能力：开发过评测工具、自动化框架或平台
强调数据分析案例：从评测结果中发现Pattern并推动优化
列出使用PyTorch等深度学习框架的经验
系统学习语音技术（ASR、TTS、端到端模型）和评测方法
提升工程能力，掌握Python、自动化测试框架和CI/CD工具

面试指南

使用STAR法则：情境-任务-行动-结果，清晰展示项目贡献
从多个维度（准确率、稳定性、鲁棒性、延迟）系统回答评测设计问题
强调数据驱动的解决问题思路：问题定位-根因分析-方案验证-闭环
请描述一下你过去参与的一个模型评测项目，包括评测指标、流程和遇到的主要挑战
如何设计一个语音识别（ASR）模型的评测方案？考虑哪些维度？
如果评测发现模型准确率达标但用户体验差，你会如何分析和推动优化？
你了解哪些语音大模型技术？谈谈你对端到端S2T/S2S的理解
如何构建自动化评测流水线？请描述关键组件

职位点评

综合评分

大厂前沿语音大模型评测岗，技术成长快、薪资优厚，但工作强度可能较大。

更适合这类人

该职位最适合追求技术成长、希望在语音AI领域深耕的求职者，但对工作与生活平衡要求较高的人需谨慎。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展90

工作生活40

使命价值70

薪资福利

80较高

字节跳动薪资水平在业内属于第一梯队，但JD未明确具体薪资，福利条款未提及。整体补偿性较好。

薪资信号未披露（AI估算：20K-35K/月）

成长发展

90较高

该岗位直接接触前沿语音大模型技术，评测体系建设能极大锻炼工程和数据分析能力，技术成长空间大。

技术前沿前沿/新兴技术

技术栈语音大模型、ASR、TTS、ALM、端到端S2T/S2S、多模态、PyTorch

业务类型cost_center

工作生活

40较低

工作地点在上海，JD未提及远程或弹性办公，大厂通常节奏快，生活化动机满足度较低。

工作模式仅现场办公

办公地点科技园/产业园

加班情况未提及（无法判断）

使命价值

70中等

语音大模型是AI热门方向，岗位对行业有实际推动作用，但JD未强调社会价值，意义感中等。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

豆包语音大模型评测工程师-Data语音

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

豆包语音大模型评测工程师-Data语音

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

客户端安全工程师

区域配送商务Leader-TikTok Shop

零售行业高级解决方案经理-火山引擎

C端内容产品设计师-生活服务（上海）

云原生产品专家-微服务

相似职位推荐

平台开发工程师

字节跳动 的其他在招职位

客户端安全工程师

区域配送商务Leader-TikTok Shop

零售行业高级解决方案经理-火山引擎

C端内容产品设计师-生活服务（上海）

云原生产品专家-微服务

相似职位推荐

平台开发工程师

字节跳动的其他在招职位

字节跳动的其他在招职位