Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
语音/多模态大模型算法工程师(Speech/Omni/Agent方向)-火山方舟MaaS
立即应聘

语音/多模态大模型算法工程师(Speech/Omni/Agent方向)-火山方舟MaaS

发布于 1 天前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
语音识别
强化学习
LLM
AI Agent
多模态大模型
大模型训练
Multi-Agent

AI 估算 · 35k–65k

北京头部大厂高级算法岗,多模态大模型方向稀缺人才,薪资竞争力强,参考市场水平与公司薪酬体系。

职位详情

关于这个职位

该职位负责研发语音、语言、视觉多模态一体化大模型,推动AI Agent在企业级场景落地,如智能座舱、智能客服等

需要具备多模态大模型、语音语言模型或LLM的研发经验,熟悉大模型训练与部署链路,适合对前沿技术有热情、工程能力强的算法工程师

最低要求

计算机科学、电子信息工程、自动化、人工智能等相关专业背景,硕士学位/博士学位优先

具备多模态大模型、语音语言模型或大语言模型(LLM)的研发经验和深入理解
熟悉AI Agent系统设计与工程实现,工具调用、复杂推理、任务规划、多智能体协同或基于反馈学习的Agent行为对齐方面有实际项目经验者优先
具备良好的工程实现能力,熟悉大模型训练、推理、评测与部署链路,有模型效果优化、性能优化或系统稳定性建设经验者优先

工作职责

参与研发语音、语言、视觉多模态一体化(Omni)端到端大模型,探索跨模态原生融合与低延迟实时交互体验

负责大模型在复杂企业生产场景下的任务规划、Tool调用(Tool Use)、长文本/长音频处理及多智能体(Multi-Agent)协同系统的构建与架构优化
推动多模态大模型、AI Agent及语音生成/理解技术在企业级关键场景中的应用落地,如智能座舱、智能客服、生产力工具、沉浸式陪伴等,实现技术价值转化
深入调研并攻克语音、NLP、多模态、强化学习及大模型Agent等领域的前沿技术难题

优先资格

在领域国际会议或期刊发表过高水平论文者优先,如NeurIPS、ICML、ICLR、CVPR、ACL、Interspeech、ICASSP等

有开源大模型、多模态系统、Agent系统或语音智能项目核心贡献经验者优先
对企业、生产力场景中的模型能力、工程效率、成本控制与稳定性有经验者优先

AI 洞察

优缺点分析

优点

  • 前沿技术栈,接触多模态大模型、AI Agent等最热门方向,积累稀缺经验
  • 字节跳动平台流量与业务场景丰富,技术落地机会多,成长快
  • 团队氛围技术导向,鼓励创新,有顶级会议和开源项目影响力
  • 技术难度高,需要跨领域知识(语音、视觉、NLP、强化学习),学习曲线陡峭
  • 竞争激烈,周围同事背景优秀,需要持续产出高价值成果

缺点 / 挑战

  • 业务压力大,需要快速迭代模型并保证稳定性,工作强度可能较高
  • 适合对多模态和智能体有强烈兴趣、具备扎实算法基础且渴望挑战顶尖技术的工程师

角色解读

  • 技术方向:从算法工程师成长为多模态/Agent领域专家,主导前沿技术研发
  • 管理方向:可向技术负责人或团队Leader发展,带领项目落地
  • 业务方向:深入理解行业场景,转型为技术产品专家或解决方案架构师
  • 研发语音、语言、视觉多模态端到端大模型,实现跨模态融合与低延迟交互
  • 构建复杂企业场景下的AI Agent系统,包括任务规划、工具调用和多智能体协同
  • 推动多模态大模型在智能座舱、智能客服等场景的落地应用
  • 攻克语音、NLP、强化学习及Agent领域的前沿技术难题
  • 扎实的深度学习基础,熟悉Transformer、大模型训练与推理优化
  • 精通多模态大模型或语音语言模型,有相关研发经验
  • 熟悉AI Agent架构设计与工程实现,如任务规划、工具调用
  • 良好的工程能力,掌握大模型部署与性能优化

申请策略

  • 深入了解火山引擎MaaS平台和字节跳动AI业务方向,在面试中展现业务洞察
  • 准备一个端到端的项目案例,从问题定义、模型设计到落地效果,展示全链路能力
  • 突出多模态大模型、语音模型或LLM的研发项目经历,说明具体贡献
  • 强调AI Agent相关项目,如工具调用、任务规划、多智能体协同
  • 列出工程实现能力,包括大模型训练、推理优化、部署上线经验
  • 如有顶会论文或开源项目核心贡献,务必突出
  • 补充强化学习、多模态融合、语音生成等专项知识
  • 熟悉大模型训练框架(如DeepSpeed、Megatron)和推理优化工具

面试指南

  • 对于架构类问题:先概述核心思想,再分模块说明,最后比较不同方法
  • 对于项目类问题:使用STAR法则(情境、任务、行动、结果),强调难点和你的贡献
  • 对于优化类问题:从数据、模型、工程三个层面系统分析,给出具体方案
  • 请讲解多模态大模型的常见架构(如Qwen-VL、LLaVA)及其优缺点
  • 如何设计一个支持工具调用的AI Agent?请描述规划、执行、反思流程
  • 语音大模型在低延迟实时交互场景中面临哪些挑战?如何优化?
  • 介绍你参与过的一个大模型项目,包括数据、训练、部署和效果评估
  • 如何处理多模态数据对齐?请举例说明跨模态注意力机制

职位点评

74
综合评分

一线大厂、前沿技术栈、高薪资高压力,技术成长极快但WLB一般。

更适合这类人
适合以技术成长为核心动机、愿意投入高强度工作换取前沿技能积累的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利80
成长发展95
工作生活50
使命价值70

薪资福利

80较高

字节跳动薪资在行业中具有竞争力,且作为已上市公司福利体系完善,但JD未明确薪资范围,需面议。

薪资信号面议 (35K-65K/月)

成长发展

95较高

该职位涉及最前沿的多模态大模型和AI Agent技术,成长空间极大,团队技术氛围浓厚,且有字节大平台支持。

技术前沿前沿/新兴技术
技术栈多模态大模型、语音、LLM、AI Agent、强化学习
业务类型profit_center

工作生活

50较低

字节跳动通常要求现场办公,工作强度较高,JD未提及弹性工作或WLB信息。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

多模态大模型和AI Agent是当前AI行业最热门方向,技术价值高,但具体社会影响层面JD未突出使命。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • Early Talent Leadership Development Program - Engineering and Technology

    伊顿中国 · 上海市
    AI 估算 · 15k-25k
  • ACB Lead Engineer

    伊顿中国 · 苏州市
    AI 估算 · 20k-35k
  • Lead Product Engineer

    伊顿中国 · 上海市
    AI 估算 · 25k-40k
  • Early Talent Leadership Development Program - Engineering and Technology

    伊顿中国 · 上海市
    AI 估算 · 15k-25k
  • Head of Application Engineering

    德科斯米尔 · 沈阳市
    AI 估算 · 25k-45k

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • Early Talent Leadership Development Program - Engineering and Technology

    伊顿中国 · 上海市
    AI 估算 · 15k-25k
  • ACB Lead Engineer

    伊顿中国 · 苏州市
    AI 估算 · 20k-35k
  • Lead Product Engineer

    伊顿中国 · 上海市
    AI 估算 · 25k-40k
  • Early Talent Leadership Development Program - Engineering and Technology

    伊顿中国 · 上海市
    AI 估算 · 15k-25k
  • Head of Application Engineering

    德科斯米尔 · 沈阳市
    AI 估算 · 25k-45k