ByteDance logo
字节跳动
多模态世界模型算法工程师/专家-豆包大模型

多模态世界模型算法工程师/专家-豆包大模型

发布于 大约 7 小时前

普通员工/个人贡献者

北京市
其它
全职员工
仅现场办公
本科
机器学习
深度学习
强化学习
计算机视觉
LLM
多模态
AIGC
世界模型

AI 估算 · 35k–65k

字节跳动核心AI研究岗,技能稀缺(多模态/大模型),薪资竞争力强,参考行业水平及大厂算法专家薪酬区间。

职位详情

关于这个职位

该岗位属于字节跳动Seed团队,专注于多模态世界模型的算法研究与开发

你将探索多模态理解、生成式、强化学习等前沿技术,构建大规模基础模型并优化系统,推动AI能力突破与应用落地
适合具备扎实机器学习基础、热爱研究、追求技术极致的算法工程师

最低要求

本科及以上学历,计算机、电子、数学等相关专业

在计算机视觉、多模态、AIGC、机器学习、渲染生成等一个或多个领域有较深入的研究者
具有出色的分析、解决问题的能力,能深入解决大模型训练、应用存在的问题,有自主探索解决方案的能力者
具有良好的沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步

工作职责

探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术

探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化
数据建设、指令微调、偏好对齐、模型优化
提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力
探索突破包括而不限于多模态RAG,视觉CoT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent
利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品

优先资格

具有优秀的基础算法、扎实的机器学习基础,熟悉CV、AIGC、NLP、RL、ML等领域的技术,在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊上发表论文者优先

具有优秀的代码能力,熟练掌握C/C++或Python编程语言,ACM/ICPC、NOI/IOl、Top Coder、Kaggle等比赛获奖者优先
在多模态、大模型、基础模型、世界模型、RL、渲染生成领域,主导过大影响力项目者优先

AI 洞察

优缺点分析

优点

  • 字节跳动核心Seed团队,资源丰富,业务落地场景多,影响力大
  • 前沿研究方向(世界模型、多模态),技术壁垒高,个人成长快
  • 团队学术氛围浓厚,鼓励创新,有发表顶会论文机会
  • 薪资福利优厚,大厂保障
  • 研究难度大,需要持续学习最新论文与技术,工作强度高
  • 竞争激烈,团队内部人才云集,需要不断证明自己

缺点 / 挑战

  • 成果要求高,既要学术创新也要推动落地,双重压力
  • 适合有扎实AI研究背景、热爱挑战、希望在多模态大模型领域成为顶尖专家的算法工程师

角色解读

  • 从算法工程师成长为技术专家,主导核心模型设计与研究方向
  • 可向AI架构师或团队负责人发展,带领小组攻克前沿难题
  • 积累顶级会议论文与影响力项目,成为行业知名研究者
  • 研究并开发多模态理解与生成融合的基础模型,优化模型训练与推理效率
  • 构建世界模型及多模态Agent,实现视觉CoT、RAG等高级能力,推动在虚拟世界中的应用
  • 参与数据建设、指令微调、强化学习对齐等全流程,提升模型性能与泛化能力
  • 扎实的机器学习基础,熟悉CV、多模态、AIGC、RL等领域技术
  • 优秀的编程能力,熟练使用Python或C++,有大型项目经验
  • 较强的问题分析与解决能力,能深入大模型训练与应用中的技术难题

申请策略

  • 投递时可附上个人技术博客或项目链接,展示技术热忱
  • 准备一份简明扼要的技术自荐信,说明与岗位的匹配点
  • 突出多模态或计算机视觉相关的研究项目、论文发表或竞赛获奖
  • 强调大模型训练、强化学习、系统优化等实战经验,展示具体贡献
  • 如参与过开源项目或有GitHub高star仓库,务必提及
  • 深入学习Transformer、扩散模型、RLHF等前沿技术原理
  • 熟悉PyTorch、TensorFlow等框架,掌握分布式训练工具如Megatron、DeepSpeed
  • 阅读Seed团队或字节跳动相关技术博客,了解团队方向

面试指南

  • 技术问题:先清晰描述问题背景,再分步骤阐述解决思路,最后总结效果与反思
  • 开放性问题:展示知识广度,结合个人经验给出有深度的观点,并适当提出自己的疑问
  • 代码题:注意边界条件,先讲思路再写代码,优化时间空间复杂度
  • 请讲述你参与过的一个多模态项目,具体负责什么,难点是什么?
  • 如何设计一个大规模多模态模型的训练流程?数据对齐和模型架构怎么选择?
  • 你对世界模型的理解是什么?它与传统CV模型有何区别?
  • 在模型训练中遇到loss不收敛或过拟合,你会如何排查与解决?
  • 谈谈你对强化学习在大模型中的应用(如RLHF)的认识

匹配度报告

73
综合匹配度

字节核心AI研究岗,前沿多模态技术,薪资优厚,成长空间大,但WLB一般。

适合人群
该职位最适合追求技术成长和前沿研究的求职者,能接受高强度工作。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展92
工作生活45
使命价值70

薪资福利匹配

85较高

字节跳动薪资福利处于行业领先水平,但JD未明确薪资,按市场水平估算偏高;福利如五险一金、年终奖等大厂标配,未在JD中提及,故只算中等偏上。

薪资信号未披露(AI估算:35K-65K/月)

成长发展匹配

92较高

岗位直接从事前沿技术研究,技术栈新,项目影响力大,团队学术氛围浓厚,成长空间极大。

技术前沿前沿/新兴技术
技术栈多模态、世界模型、AIGC、强化学习、Transformer、扩散模型
成长机会业界领先、探索前沿技术、长期愿景、世界一流的AI研究团队
业务类型ambiguous

工作生活匹配

45较低

未提及远程或弹性工作,互联网大厂算法岗通常需要高强度投入,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI行业处于高速增长期,该岗位致力于通用人工智能探索,社会影响力正面,但团队目标偏技术导向,使命驱动感中等。

行业发展高速增长赛道
社会影响中性/一般
使命信号寻找通用智能的新方法、追求智能上限、为科技和社会发展作出贡献
创新程度开拓性创新(行业首创)
Watch Jobs