字节跳动的多模态大模型算法工程师-Commercial AI薪资是多少？

该职位薪资范围为 25k–55k（人民币/月）。

多模态大模型算法工程师-Commercial AI的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

字节跳动的多模态大模型算法工程师-Commercial AI有什么任职要求？

该职位要求学历未注明学历及高级经验工作经验。

字节跳动

多模态大模型算法工程师-Commercial AI

立即应聘

多模态大模型算法工程师-Commercial AI

发布于大约 2 个月前

普通员工/个人贡献者

上海市

高级经验

全职员工

仅现场办公

学历未注明

研究与开发 (研发)

强化学习

RAG

LLM

AIGC

VLM

多模态大模型

diffusion

Reward Model

视觉Cot

AI 估算 · 25k–55k

大厂核心算法岗位，多模态大模型方向稀缺，薪资具有竞争力。

职位详情

关于这个职位

该职位加入字节跳动Commercial AI团队，专注于多模态大模型在广告创意场景的落地

你将研究多模态理解、强化学习、AIGC等前沿技术，构建广告创意领域大模型，提升客户投广效率

适合对多模态大模型和强化学习有深入研究兴趣的技术人才

最低要求

具备将研究问题抽象为可验证、可迭代系统的能力，能在不确定目标下自主推进问题拆解与方案探索，在以下至少一个方向具备扎实的研究或工程基础：多模态大模型（VLM/LLM/Diffusion/视频生成等）、强化学习（PPO/GRPO/离线RL/RLHF/Agent RL）、大模型后训练（Post-training/Agentic Training/Reward Modeling）、复杂系统或Benchmark设计（评估指标、目标函数、真实反馈建模）

工作职责

成为研究型人才，在热爱的课题方向上，探索多模态大模型领域最具挑战的长期关键问题

探索研究多模态理解、强化学习、AIGC、多模态RAG、视觉CoT、多模态Agent、多模态Reward model、RL等多模态进阶能力

探索多模态深度研究、理解生成一体模型在抖音广告创意场景的落地，帮助客户提升投广效率

构建广告创意领域大模型，在保持通用能力基础上，增强非可验证/非规则化场景下的创意能力提升，提升个性化、抖音风格、故事叙述方面的能力，使得模型在广泛的创意场景对齐抖音流量的偏好，提升多样性，具备视频/图片/网页/文案生成的后验对齐能力

模型适配电商、短剧、游戏、本地生活等全行业客户多样性需求场景，以及对字节跳动信息流/搜索不同App场景的适配

优先资格

加分项：

有广告/推荐/内容生成/搜索等真实业务经验

有创意生成（文案/图片/视频）或投放优化相关经验

有相关领域会议文章（NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等）

有编程/AI比赛获奖（ACM/ICPC、NOI/IOI、Top Coder、Kaggle等）优先

AI 洞察

优缺点分析

优点

进入字节AI核心团队，接触海量真实业务数据与场景
聚焦多模态大模型前沿方向，技术成长极快
公司资源丰富，研究氛围浓厚，发顶会论文机会多
研究目标具有不确定性，需要较强的自主探索能力
竞争激烈，周围同事水平高，持续学习要求高

缺点 / 挑战

业务落地压力大，需要平衡研究创新与实际效果
适合对多模态大模型有浓厚兴趣、具备较强研究能力且愿意拥抱业务挑战的算法工程师

角色解读

深入多模态大模型核心前沿，成为领域专家
向技术负责人或团队leader发展，主导研究方向
积累广告、推荐等业务经验，拓宽技术应用场景
探索多模态大模型前沿技术，如多模态理解、强化学习、AIGC等
将研究成果落地到抖音广告创意场景，提升广告投放效率
构建广告创意领域大模型，增强生成内容的个性化与多样性
适配电商、游戏等行业需求，优化模型在不同客户端表现
扎实的多模态大模型或强化学习研究基础，熟悉VLM、LLM、Diffusion等
具备将复杂问题抽象为可验证系统的能力，自主推进研究
熟悉大模型后训练技术（Post-training、RLHF、Reward Modeling）
有实际项目或论文经验，能快速迭代模型效果

申请策略

关注字节跳动AI Lab和Commercial AI团队的公开分享与技术博客
准备一个与研究相关的深度技术提案，展示独立思考能力
突出多模态、强化学习相关项目或论文，体现研究深度
强调将研究成果转化为实际应用的案例，如广告创意生成
展示编程能力和开源贡献，如Kaggle、ACM经历
量化成果，如模型提升指标、业务收益等
系统学习强化学习PPO、GRPO等算法，动手实现并实验
熟悉Diffusion模型生成图像/视频的原理和微调方法

面试指南

STAR法则：描述情境、任务、行动、结果，突出个人贡献
先明确问题定义，再拆解为子问题，逐步给出解决方案
强调实验迭代思维，展示对指标和效果优化的理解
请详细介绍你参与的多模态大模型项目，你负责什么？
如何设计一个评估多模态创意生成质量的benchmark？
解释一下PPO和GRPO的区别，实际应用中如何选择？
如果让你在抖音广告场景使用RL优化创意，你会如何设计？
如何平衡模型的通用能力和垂直场景效果？

职位点评

综合评分

前沿多模态大模型方向，薪资优厚，技术成长极快，但工作强度大、WLB一般。

更适合这类人

适合以技术成长为核心驱动力，能接受高强度工作，追求前沿研究的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展90

工作生活40

使命价值70

薪资福利

80较高

薪资待遇处于市场高位，福利完善，但JD未明确具体薪资福利细节。

薪资信号未披露（AI估算：25K-55K/月）

成长发展

90较高

职位围绕多模态大模型前沿技术，成长空间极大，但JD未提及晋升通道。

技术前沿前沿/新兴技术

技术栈多模态大模型、强化学习、AIGC、RAG、视觉CoT、Agent、Reward Model、Diffusion、VLM、LLM

业务类型profit_center

工作生活

40较低

字节跳动通常工作强度较大，JD未提及弹性工作或WLB，且在上海核心办公区。

工作模式未明确

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

广告创意行业成熟稳定，技术有实际商业价值，但社会影响力一般。

行业发展稳定成熟行业

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

字节跳动

多模态大模型算法工程师-Commercial AI

立即应聘

多模态大模型算法工程师-Commercial AI

发布于大约 2 个月前

普通员工/个人贡献者

上海市

高级经验

全职员工

仅现场办公

学历未注明

研究与开发 (研发)

强化学习

RAG

LLM

AIGC

VLM

多模态大模型

diffusion

Reward Model

视觉Cot

AI 估算 · 25k–55k

大厂核心算法岗位，多模态大模型方向稀缺，薪资具有竞争力。

职位详情

关于这个职位

该职位加入字节跳动Commercial AI团队，专注于多模态大模型在广告创意场景的落地

你将研究多模态理解、强化学习、AIGC等前沿技术，构建广告创意领域大模型，提升客户投广效率

适合对多模态大模型和强化学习有深入研究兴趣的技术人才

最低要求

工作职责

成为研究型人才，在热爱的课题方向上，探索多模态大模型领域最具挑战的长期关键问题

探索研究多模态理解、强化学习、AIGC、多模态RAG、视觉CoT、多模态Agent、多模态Reward model、RL等多模态进阶能力

探索多模态深度研究、理解生成一体模型在抖音广告创意场景的落地，帮助客户提升投广效率

模型适配电商、短剧、游戏、本地生活等全行业客户多样性需求场景，以及对字节跳动信息流/搜索不同App场景的适配

优先资格

加分项：

有广告/推荐/内容生成/搜索等真实业务经验

有创意生成（文案/图片/视频）或投放优化相关经验

有相关领域会议文章（NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等）

有编程/AI比赛获奖（ACM/ICPC、NOI/IOI、Top Coder、Kaggle等）优先

AI 洞察

优缺点分析

优点

进入字节AI核心团队，接触海量真实业务数据与场景
聚焦多模态大模型前沿方向，技术成长极快
公司资源丰富，研究氛围浓厚，发顶会论文机会多
研究目标具有不确定性，需要较强的自主探索能力
竞争激烈，周围同事水平高，持续学习要求高

缺点 / 挑战

业务落地压力大，需要平衡研究创新与实际效果
适合对多模态大模型有浓厚兴趣、具备较强研究能力且愿意拥抱业务挑战的算法工程师

角色解读

深入多模态大模型核心前沿，成为领域专家
向技术负责人或团队leader发展，主导研究方向
积累广告、推荐等业务经验，拓宽技术应用场景
探索多模态大模型前沿技术，如多模态理解、强化学习、AIGC等
将研究成果落地到抖音广告创意场景，提升广告投放效率
构建广告创意领域大模型，增强生成内容的个性化与多样性
适配电商、游戏等行业需求，优化模型在不同客户端表现
扎实的多模态大模型或强化学习研究基础，熟悉VLM、LLM、Diffusion等
具备将复杂问题抽象为可验证系统的能力，自主推进研究
熟悉大模型后训练技术（Post-training、RLHF、Reward Modeling）
有实际项目或论文经验，能快速迭代模型效果

申请策略

关注字节跳动AI Lab和Commercial AI团队的公开分享与技术博客
准备一个与研究相关的深度技术提案，展示独立思考能力
突出多模态、强化学习相关项目或论文，体现研究深度
强调将研究成果转化为实际应用的案例，如广告创意生成
展示编程能力和开源贡献，如Kaggle、ACM经历
量化成果，如模型提升指标、业务收益等
系统学习强化学习PPO、GRPO等算法，动手实现并实验
熟悉Diffusion模型生成图像/视频的原理和微调方法

面试指南

STAR法则：描述情境、任务、行动、结果，突出个人贡献
先明确问题定义，再拆解为子问题，逐步给出解决方案
强调实验迭代思维，展示对指标和效果优化的理解
请详细介绍你参与的多模态大模型项目，你负责什么？
如何设计一个评估多模态创意生成质量的benchmark？
解释一下PPO和GRPO的区别，实际应用中如何选择？
如果让你在抖音广告场景使用RL优化创意，你会如何设计？
如何平衡模型的通用能力和垂直场景效果？

职位点评

综合评分

前沿多模态大模型方向，薪资优厚，技术成长极快，但工作强度大、WLB一般。

更适合这类人

适合以技术成长为核心驱动力，能接受高强度工作，追求前沿研究的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展90

工作生活40

使命价值70

薪资福利

80较高

薪资待遇处于市场高位，福利完善，但JD未明确具体薪资福利细节。

薪资信号未披露（AI估算：25K-55K/月）

成长发展

90较高

职位围绕多模态大模型前沿技术，成长空间极大，但JD未提及晋升通道。

技术前沿前沿/新兴技术

技术栈多模态大模型、强化学习、AIGC、RAG、视觉CoT、Agent、Reward Model、Diffusion、VLM、LLM

业务类型profit_center

工作生活

40较低

字节跳动通常工作强度较大，JD未提及弹性工作或WLB，且在上海核心办公区。

工作模式未明确

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

广告创意行业成熟稳定，技术有实际商业价值，但社会影响力一般。

行业发展稳定成熟行业

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

多模态大模型算法工程师-Commercial AI

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

多模态大模型算法工程师-Commercial AI

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

Senior Principal Scientist I, Translational Disease Biology

腾讯游戏-大模型评测专家

预研动作手游-资深文案策划（角色方向）

腾讯游戏-大模型智能评测算法工程师

腾讯游戏-大模型训练框架研发工程师/专家

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

Senior Principal Scientist I, Translational Disease Biology

腾讯游戏-大模型评测专家

预研动作手游-资深文案策划（角色方向）

腾讯游戏-大模型智能评测算法工程师

腾讯游戏-大模型训练框架研发工程师/专家

字节跳动的其他在招职位

字节跳动的其他在招职位