字节跳动的语音/多模态大模型算法工程师（Speech/Omni/Agent方向）-火山方舟MaaS薪资是多少？

该职位薪资范围为 35k–65k（人民币/月）。

语音/多模态大模型算法工程师（Speech/Omni/Agent方向）-火山方舟MaaS的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

字节跳动的语音/多模态大模型算法工程师（Speech/Omni/Agent方向）-火山方舟MaaS有什么任职要求？

该职位要求硕士学历及高级经验工作经验。

字节跳动

语音/多模态大模型算法工程师（Speech/Omni/Agent方向）-火山方舟MaaS

立即应聘

语音/多模态大模型算法工程师（Speech/Omni/Agent方向）-火山方舟MaaS

发布于 1 天前

普通员工/个人贡献者

北京市

高级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

语音识别

强化学习

LLM

AI Agent

多模态大模型

大模型训练

Multi-Agent

AI 估算 · 35k–65k

北京头部大厂高级算法岗，多模态大模型方向稀缺人才，薪资竞争力强，参考市场水平与公司薪酬体系。

职位详情

关于这个职位

该职位负责研发语音、语言、视觉多模态一体化大模型，推动AI Agent在企业级场景落地，如智能座舱、智能客服等

需要具备多模态大模型、语音语言模型或LLM的研发经验，熟悉大模型训练与部署链路，适合对前沿技术有热情、工程能力强的算法工程师

最低要求

计算机科学、电子信息工程、自动化、人工智能等相关专业背景，硕士学位/博士学位优先

具备多模态大模型、语音语言模型或大语言模型（LLM）的研发经验和深入理解

熟悉AI Agent系统设计与工程实现，工具调用、复杂推理、任务规划、多智能体协同或基于反馈学习的Agent行为对齐方面有实际项目经验者优先

具备良好的工程实现能力，熟悉大模型训练、推理、评测与部署链路，有模型效果优化、性能优化或系统稳定性建设经验者优先

工作职责

参与研发语音、语言、视觉多模态一体化（Omni）端到端大模型，探索跨模态原生融合与低延迟实时交互体验

负责大模型在复杂企业生产场景下的任务规划、Tool调用（Tool Use）、长文本/长音频处理及多智能体（Multi-Agent）协同系统的构建与架构优化

推动多模态大模型、AI Agent及语音生成/理解技术在企业级关键场景中的应用落地，如智能座舱、智能客服、生产力工具、沉浸式陪伴等，实现技术价值转化

深入调研并攻克语音、NLP、多模态、强化学习及大模型Agent等领域的前沿技术难题

优先资格

在领域国际会议或期刊发表过高水平论文者优先，如NeurIPS、ICML、ICLR、CVPR、ACL、Interspeech、ICASSP等

有开源大模型、多模态系统、Agent系统或语音智能项目核心贡献经验者优先

对企业、生产力场景中的模型能力、工程效率、成本控制与稳定性有经验者优先

AI 洞察

优缺点分析

优点

前沿技术栈，接触多模态大模型、AI Agent等最热门方向，积累稀缺经验
字节跳动平台流量与业务场景丰富，技术落地机会多，成长快
团队氛围技术导向，鼓励创新，有顶级会议和开源项目影响力
技术难度高，需要跨领域知识（语音、视觉、NLP、强化学习），学习曲线陡峭
竞争激烈，周围同事背景优秀，需要持续产出高价值成果

缺点 / 挑战

业务压力大，需要快速迭代模型并保证稳定性，工作强度可能较高
适合对多模态和智能体有强烈兴趣、具备扎实算法基础且渴望挑战顶尖技术的工程师

角色解读

技术方向：从算法工程师成长为多模态/Agent领域专家，主导前沿技术研发
管理方向：可向技术负责人或团队Leader发展，带领项目落地
业务方向：深入理解行业场景，转型为技术产品专家或解决方案架构师
研发语音、语言、视觉多模态端到端大模型，实现跨模态融合与低延迟交互
构建复杂企业场景下的AI Agent系统，包括任务规划、工具调用和多智能体协同
推动多模态大模型在智能座舱、智能客服等场景的落地应用
攻克语音、NLP、强化学习及Agent领域的前沿技术难题
扎实的深度学习基础，熟悉Transformer、大模型训练与推理优化
精通多模态大模型或语音语言模型，有相关研发经验
熟悉AI Agent架构设计与工程实现，如任务规划、工具调用
良好的工程能力，掌握大模型部署与性能优化

申请策略

深入了解火山引擎MaaS平台和字节跳动AI业务方向，在面试中展现业务洞察
准备一个端到端的项目案例，从问题定义、模型设计到落地效果，展示全链路能力
突出多模态大模型、语音模型或LLM的研发项目经历，说明具体贡献
强调AI Agent相关项目，如工具调用、任务规划、多智能体协同
列出工程实现能力，包括大模型训练、推理优化、部署上线经验
如有顶会论文或开源项目核心贡献，务必突出
补充强化学习、多模态融合、语音生成等专项知识
熟悉大模型训练框架（如DeepSpeed、Megatron）和推理优化工具

面试指南

对于架构类问题：先概述核心思想，再分模块说明，最后比较不同方法
对于项目类问题：使用STAR法则（情境、任务、行动、结果），强调难点和你的贡献
对于优化类问题：从数据、模型、工程三个层面系统分析，给出具体方案
请讲解多模态大模型的常见架构（如Qwen-VL、LLaVA）及其优缺点
如何设计一个支持工具调用的AI Agent？请描述规划、执行、反思流程
语音大模型在低延迟实时交互场景中面临哪些挑战？如何优化？
介绍你参与过的一个大模型项目，包括数据、训练、部署和效果评估
如何处理多模态数据对齐？请举例说明跨模态注意力机制

职位点评

综合评分

一线大厂、前沿技术栈、高薪资高压力，技术成长极快但WLB一般。

更适合这类人

适合以技术成长为核心动机、愿意投入高强度工作换取前沿技能积累的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展95

工作生活50

使命价值70

薪资福利

80较高

字节跳动薪资在行业中具有竞争力，且作为已上市公司福利体系完善，但JD未明确薪资范围，需面议。

薪资信号面议 (35K-65K/月)

成长发展

95较高

该职位涉及最前沿的多模态大模型和AI Agent技术，成长空间极大，团队技术氛围浓厚，且有字节大平台支持。

技术前沿前沿/新兴技术

技术栈多模态大模型、语音、LLM、AI Agent、强化学习

业务类型profit_center

工作生活

50较低

字节跳动通常要求现场办公，工作强度较高，JD未提及弹性工作或WLB信息。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

多模态大模型和AI Agent是当前AI行业最热门方向，技术价值高，但具体社会影响层面JD未突出使命。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

字节跳动

语音/多模态大模型算法工程师（Speech/Omni/Agent方向）-火山方舟MaaS

立即应聘

语音/多模态大模型算法工程师（Speech/Omni/Agent方向）-火山方舟MaaS

发布于 1 天前

普通员工/个人贡献者

北京市

高级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

语音识别

强化学习

LLM

AI Agent

多模态大模型

大模型训练

Multi-Agent

AI 估算 · 35k–65k

北京头部大厂高级算法岗，多模态大模型方向稀缺人才，薪资竞争力强，参考市场水平与公司薪酬体系。

职位详情

关于这个职位

该职位负责研发语音、语言、视觉多模态一体化大模型，推动AI Agent在企业级场景落地，如智能座舱、智能客服等

需要具备多模态大模型、语音语言模型或LLM的研发经验，熟悉大模型训练与部署链路，适合对前沿技术有热情、工程能力强的算法工程师

最低要求

计算机科学、电子信息工程、自动化、人工智能等相关专业背景，硕士学位/博士学位优先

具备多模态大模型、语音语言模型或大语言模型（LLM）的研发经验和深入理解

熟悉AI Agent系统设计与工程实现，工具调用、复杂推理、任务规划、多智能体协同或基于反馈学习的Agent行为对齐方面有实际项目经验者优先

具备良好的工程实现能力，熟悉大模型训练、推理、评测与部署链路，有模型效果优化、性能优化或系统稳定性建设经验者优先

工作职责

参与研发语音、语言、视觉多模态一体化（Omni）端到端大模型，探索跨模态原生融合与低延迟实时交互体验

负责大模型在复杂企业生产场景下的任务规划、Tool调用（Tool Use）、长文本/长音频处理及多智能体（Multi-Agent）协同系统的构建与架构优化

深入调研并攻克语音、NLP、多模态、强化学习及大模型Agent等领域的前沿技术难题

优先资格

在领域国际会议或期刊发表过高水平论文者优先，如NeurIPS、ICML、ICLR、CVPR、ACL、Interspeech、ICASSP等

有开源大模型、多模态系统、Agent系统或语音智能项目核心贡献经验者优先

对企业、生产力场景中的模型能力、工程效率、成本控制与稳定性有经验者优先

AI 洞察

优缺点分析

优点

前沿技术栈，接触多模态大模型、AI Agent等最热门方向，积累稀缺经验
字节跳动平台流量与业务场景丰富，技术落地机会多，成长快
团队氛围技术导向，鼓励创新，有顶级会议和开源项目影响力
技术难度高，需要跨领域知识（语音、视觉、NLP、强化学习），学习曲线陡峭
竞争激烈，周围同事背景优秀，需要持续产出高价值成果

缺点 / 挑战

业务压力大，需要快速迭代模型并保证稳定性，工作强度可能较高
适合对多模态和智能体有强烈兴趣、具备扎实算法基础且渴望挑战顶尖技术的工程师

角色解读

技术方向：从算法工程师成长为多模态/Agent领域专家，主导前沿技术研发
管理方向：可向技术负责人或团队Leader发展，带领项目落地
业务方向：深入理解行业场景，转型为技术产品专家或解决方案架构师
研发语音、语言、视觉多模态端到端大模型，实现跨模态融合与低延迟交互
构建复杂企业场景下的AI Agent系统，包括任务规划、工具调用和多智能体协同
推动多模态大模型在智能座舱、智能客服等场景的落地应用
攻克语音、NLP、强化学习及Agent领域的前沿技术难题
扎实的深度学习基础，熟悉Transformer、大模型训练与推理优化
精通多模态大模型或语音语言模型，有相关研发经验
熟悉AI Agent架构设计与工程实现，如任务规划、工具调用
良好的工程能力，掌握大模型部署与性能优化

申请策略

深入了解火山引擎MaaS平台和字节跳动AI业务方向，在面试中展现业务洞察
准备一个端到端的项目案例，从问题定义、模型设计到落地效果，展示全链路能力
突出多模态大模型、语音模型或LLM的研发项目经历，说明具体贡献
强调AI Agent相关项目，如工具调用、任务规划、多智能体协同
列出工程实现能力，包括大模型训练、推理优化、部署上线经验
如有顶会论文或开源项目核心贡献，务必突出
补充强化学习、多模态融合、语音生成等专项知识
熟悉大模型训练框架（如DeepSpeed、Megatron）和推理优化工具

面试指南

对于架构类问题：先概述核心思想，再分模块说明，最后比较不同方法
对于项目类问题：使用STAR法则（情境、任务、行动、结果），强调难点和你的贡献
对于优化类问题：从数据、模型、工程三个层面系统分析，给出具体方案
请讲解多模态大模型的常见架构（如Qwen-VL、LLaVA）及其优缺点
如何设计一个支持工具调用的AI Agent？请描述规划、执行、反思流程
语音大模型在低延迟实时交互场景中面临哪些挑战？如何优化？
介绍你参与过的一个大模型项目，包括数据、训练、部署和效果评估
如何处理多模态数据对齐？请举例说明跨模态注意力机制

职位点评

综合评分

一线大厂、前沿技术栈、高薪资高压力，技术成长极快但WLB一般。

更适合这类人

适合以技术成长为核心动机、愿意投入高强度工作换取前沿技能积累的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展95

工作生活50

使命价值70

薪资福利

80较高

字节跳动薪资在行业中具有竞争力，且作为已上市公司福利体系完善，但JD未明确薪资范围，需面议。

薪资信号面议 (35K-65K/月)

成长发展

95较高

该职位涉及最前沿的多模态大模型和AI Agent技术，成长空间极大，团队技术氛围浓厚，且有字节大平台支持。

技术前沿前沿/新兴技术

技术栈多模态大模型、语音、LLM、AI Agent、强化学习

业务类型profit_center

工作生活

50较低

字节跳动通常要求现场办公，工作强度较高，JD未提及弹性工作或WLB信息。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

多模态大模型和AI Agent是当前AI行业最热门方向，技术价值高，但具体社会影响层面JD未突出使命。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

语音/多模态大模型算法工程师（Speech/Omni/Agent方向）-火山方舟MaaS

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

语音/多模态大模型算法工程师（Speech/Omni/Agent方向）-火山方舟MaaS

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

客户端安全工程师

区域配送商务Leader-TikTok Shop

零售行业高级解决方案经理-火山引擎

C端内容产品设计师-生活服务（上海）

云原生产品专家-微服务

相似职位推荐

Early Talent Leadership Development Program - Engineering and Technology

ACB Lead Engineer

Lead Product Engineer

Early Talent Leadership Development Program - Engineering and Technology

Head of Application Engineering

字节跳动 的其他在招职位

客户端安全工程师

区域配送商务Leader-TikTok Shop

零售行业高级解决方案经理-火山引擎

C端内容产品设计师-生活服务（上海）

云原生产品专家-微服务

相似职位推荐

Early Talent Leadership Development Program - Engineering and Technology

ACB Lead Engineer

Lead Product Engineer

Early Talent Leadership Development Program - Engineering and Technology

Head of Application Engineering

字节跳动的其他在招职位

字节跳动的其他在招职位