ByteDance logo
字节跳动
高级/资深多模态大模型算法工程师-Commercial AI

高级/资深多模态大模型算法工程师-Commercial AI

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
专家级经验
全职员工
仅现场办公
本科
深度学习
PyTorch
强化学习
自然语言处理
计算机视觉
推荐系统
AIGC
多模态大模型

AI 估算 · 50k–80k

高级算法岗,大厂高薪,技术壁垒高,市场稀缺,薪资位居行业前列。

职位详情

关于这个职位

这是一个在字节跳动商业AI部门的高级算法岗,专注于多模态大模型的前沿研究与落地

你将探索多模态理解、生成、强化学习等技术,并将其应用于抖音、今日头条等产品的广告与推荐系统,直接影响数亿用户的决策
适合有扎实AI基础、热爱挑战的科研型人才

最低要求

本科及以上学历,人工智能、计算机、自动化、数学相关专业优先

拥有优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情
怀有科技改变世界的远大抱负,有志于投身机器学习、人工智能、大语言模型、多模态理解和生成等技术领域
扎实的机器学习、CV、AIGC、NLP、RL基础和出色的探索能力

工作职责

成为研究型人才,在你热爱的课题方向上,探索多模态大模型模型领域最具挑战的长期关键问题

探索研究多模态理解、生成式、强化学习、AIGC等前沿技术
探索多模态RAG、视觉COT、多模态Agent、多模态Reward model、RL等多模态进阶能力
探索多模态Deep research、Computer Using Agent、Useful Image Generation、理解生成一体模型在抖音交易场景的能力

优先资格

在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH等顶级会议上发表论文者优先

优秀的代码能力,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先
在多模态大模型、生成领域或者RL领域,主导过大影响力的项目或论文者优先

AI 洞察

优缺点分析

优点

  • 字节跳动平台拥有海量数据和丰富场景,技术研究资源充足,成果易落地
  • 聚焦多模态、AIGC等前沿技术,成长速度极快,积累高含金量经验
  • 技术氛围浓厚,团队有顶尖学者和工程师,合作交流机会多
  • 工作强度大,需应对复杂业务和技术攻关,可能面临长时间投入
  • 技术要求极高,需要持续学习最新论文和技术,保持竞争力
  • 适合有扎实AI基础、热爱前沿技术、愿意在高压下快速成长且追求卓越的科研型人才

缺点 / 挑战

  • 内部竞争激烈,产出压力大,需要高效产出有影响力的成果

角色解读

  • 成为多模态领域专家,负责关键技术方向,推动业务落地和创新
  • 晋升为技术架构师或研究科学家,引领团队技术演进
  • 横向拓展至其他AI领域(如强化学习、生成模型),拓宽技术广度
  • 探索多模态大模型前沿技术,包括多模态理解、生成、强化学习、AIGC等,解决长期关键问题
  • 研发多模态RAG、视觉COT、Agent、Reward model等进阶能力,推动模型性能提升
  • 将先进模型应用于抖音交易场景,优化广告推荐和电商转化,直接影响数亿用户体验
  • 扎实的机器学习、CV、NLP或RL基础,有相关论文或项目经验优先
  • 优秀的编程能力,熟练Python/C++,有ACM、Kaggle等竞赛经验者优先
  • 在多模态大模型领域有深入研究,曾主导过有影响力的项目或论文

申请策略

  • 了解字节商业技术部门的产品和业务方向,思考多模态如何提升广告效果
  • 准备1-2个技术深度的故事,展示你从0到1解决复杂问题的能力
  • 突出多模态、大模型或RL相关的项目经验,强调个人贡献与成果
  • 列出顶级会议论文、竞赛获奖(如CVPR、Kaggle),展示学术与实战能力
  • 详细描述代码能力,如参与开源项目、GitHub star数等
  • 补充强化学习(RLHF、Reward Model)和多模态对齐(CLIP、BLIP)的理论与实现
  • 深入理解AIGC模型(Diffusion、GAN)及其在多模态中的应用
  • 练习系统设计和算法题,尤其是涉及大规模分布式训练的优化

面试指南

  • 用STAR法则描述项目:背景、任务、行动、结果,突出你的角色和贡献
  • 技术问题从理论基础、实际挑战、优化方案三个层次回答,结合公式和落地经验
  • 系统设计问题先明确目标,再拆解模块,最后讨论权衡和扩展性
  • 请详细介绍你参与过的多模态大模型项目,包括模型设计、训练策略和效果
  • 如何解决多模态数据对齐中的噪声和异构问题?
  • RLHF在多模态模型中的应用有哪些挑战?如何优化?
  • 请设计一个多模态检索增强生成(RAG)系统用于广告文案生成
  • 手撕代码:实现Transformer的多头注意力机制,并说明复杂度

匹配度报告

75
综合匹配度

大厂核心算法岗,前沿多模态技术,高薪高成长,但工作强度大。

适合人群
最适合追求技术成长和高回报、接受高强度工作、渴望在顶尖平台发挥影响力的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值80

薪资福利匹配

85较高

大厂高级算法岗薪资待遇优厚,行业顶尖水平,但由于未明确具体福利,保守给分。

薪资信号市场水准 (50K-80K/月)

成长发展匹配

95较高

职位聚焦多模态、AIGC等前沿技术,强研发导向,成长空间极大,但未提及培训晋升制度。

技术前沿前沿/新兴技术
技术栈多模态大模型、深度学习、计算机视觉、自然语言处理、强化学习、AIGC、Python、C++
业务类型profit_center

工作生活匹配

40较低

北京现场办公,未提弹性或远程,且岗位描述暗示高强度挑战,WLB较差。

工作模式仅现场办公
办公地点未明确
加班情况JD含高强度暗示词

使命价值匹配

80较高

影响数亿用户决策,技术创新驱动,商业价值显著,但社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
使命信号影响数亿用户的决策
创新程度积极采用新技术
Watch Jobs