
字节跳动
多模态世界模型算法工程师/专家-豆包大模型
多模态世界模型算法工程师/专家-豆包大模型
发布于 大约 7 小时前普通员工/个人贡献者
北京市
其它
全职员工
仅现场办公
本科
机器学习
深度学习
强化学习
计算机视觉
LLM
多模态
AIGC
世界模型
AI 估算 · 35k–65k
字节跳动核心AI研究岗,技能稀缺(多模态/大模型),薪资竞争力强,参考行业水平及大厂算法专家薪酬区间。
职位详情
关于这个职位
该岗位属于字节跳动Seed团队,专注于多模态世界模型的算法研究与开发
你将探索多模态理解、生成式、强化学习等前沿技术,构建大规模基础模型并优化系统,推动AI能力突破与应用落地
适合具备扎实机器学习基础、热爱研究、追求技术极致的算法工程师
最低要求
本科及以上学历,计算机、电子、数学等相关专业
在计算机视觉、多模态、AIGC、机器学习、渲染生成等一个或多个领域有较深入的研究者
具有出色的分析、解决问题的能力,能深入解决大模型训练、应用存在的问题,有自主探索解决方案的能力者
具有良好的沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步
工作职责
探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术
探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化
数据建设、指令微调、偏好对齐、模型优化
提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力
探索突破包括而不限于多模态RAG,视觉CoT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent
利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品
优先资格
具有优秀的基础算法、扎实的机器学习基础,熟悉CV、AIGC、NLP、RL、ML等领域的技术,在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊上发表论文者优先
具有优秀的代码能力,熟练掌握C/C++或Python编程语言,ACM/ICPC、NOI/IOl、Top Coder、Kaggle等比赛获奖者优先
在多模态、大模型、基础模型、世界模型、RL、渲染生成领域,主导过大影响力项目者优先
AI 洞察
优缺点分析
优点
- 字节跳动核心Seed团队,资源丰富,业务落地场景多,影响力大
- 前沿研究方向(世界模型、多模态),技术壁垒高,个人成长快
- 团队学术氛围浓厚,鼓励创新,有发表顶会论文机会
- 薪资福利优厚,大厂保障
- 研究难度大,需要持续学习最新论文与技术,工作强度高
- 竞争激烈,团队内部人才云集,需要不断证明自己
缺点 / 挑战
- 成果要求高,既要学术创新也要推动落地,双重压力
- 适合有扎实AI研究背景、热爱挑战、希望在多模态大模型领域成为顶尖专家的算法工程师
角色解读
- 从算法工程师成长为技术专家,主导核心模型设计与研究方向
- 可向AI架构师或团队负责人发展,带领小组攻克前沿难题
- 积累顶级会议论文与影响力项目,成为行业知名研究者
- 研究并开发多模态理解与生成融合的基础模型,优化模型训练与推理效率
- 构建世界模型及多模态Agent,实现视觉CoT、RAG等高级能力,推动在虚拟世界中的应用
- 参与数据建设、指令微调、强化学习对齐等全流程,提升模型性能与泛化能力
- 扎实的机器学习基础,熟悉CV、多模态、AIGC、RL等领域技术
- 优秀的编程能力,熟练使用Python或C++,有大型项目经验
- 较强的问题分析与解决能力,能深入大模型训练与应用中的技术难题
申请策略
- 投递时可附上个人技术博客或项目链接,展示技术热忱
- 准备一份简明扼要的技术自荐信,说明与岗位的匹配点
- 突出多模态或计算机视觉相关的研究项目、论文发表或竞赛获奖
- 强调大模型训练、强化学习、系统优化等实战经验,展示具体贡献
- 如参与过开源项目或有GitHub高star仓库,务必提及
- 深入学习Transformer、扩散模型、RLHF等前沿技术原理
- 熟悉PyTorch、TensorFlow等框架,掌握分布式训练工具如Megatron、DeepSpeed
- 阅读Seed团队或字节跳动相关技术博客,了解团队方向
面试指南
- 技术问题:先清晰描述问题背景,再分步骤阐述解决思路,最后总结效果与反思
- 开放性问题:展示知识广度,结合个人经验给出有深度的观点,并适当提出自己的疑问
- 代码题:注意边界条件,先讲思路再写代码,优化时间空间复杂度
- 请讲述你参与过的一个多模态项目,具体负责什么,难点是什么?
- 如何设计一个大规模多模态模型的训练流程?数据对齐和模型架构怎么选择?
- 你对世界模型的理解是什么?它与传统CV模型有何区别?
- 在模型训练中遇到loss不收敛或过拟合,你会如何排查与解决?
- 谈谈你对强化学习在大模型中的应用(如RLHF)的认识
匹配度报告
73
综合匹配度
字节核心AI研究岗,前沿多模态技术,薪资优厚,成长空间大,但WLB一般。
适合人群
该职位最适合追求技术成长和前沿研究的求职者,能接受高强度工作。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展92
工作生活45
使命价值70
薪资福利匹配
85较高
字节跳动薪资福利处于行业领先水平,但JD未明确薪资,按市场水平估算偏高;福利如五险一金、年终奖等大厂标配,未在JD中提及,故只算中等偏上。
薪资信号未披露(AI估算:35K-65K/月)
成长发展匹配
92较高
岗位直接从事前沿技术研究,技术栈新,项目影响力大,团队学术氛围浓厚,成长空间极大。
技术前沿前沿/新兴技术
技术栈多模态、世界模型、AIGC、强化学习、Transformer、扩散模型
成长机会业界领先、探索前沿技术、长期愿景、世界一流的AI研究团队
业务类型ambiguous
工作生活匹配
45较低
未提及远程或弹性工作,互联网大厂算法岗通常需要高强度投入,WLB一般。
工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)
使命价值匹配
70中等
AI行业处于高速增长期,该岗位致力于通用人工智能探索,社会影响力正面,但团队目标偏技术导向,使命驱动感中等。
行业发展高速增长赛道
社会影响中性/一般
使命信号寻找通用智能的新方法、追求智能上限、为科技和社会发展作出贡献
创新程度开拓性创新(行业首创)
字节跳动 的其他在招职位
相似职位推荐
Watch Jobs