Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
多模态大模型算法工程师-Commercial AI
立即应聘

多模态大模型算法工程师-Commercial AI

发布于 大约 9 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
学历未注明
强化学习
RAG
LLM
AIGC
VLM
多模态大模型
diffusion
Reward Model
视觉Cot

AI 估算 · 25k–55k

大厂核心算法岗位,多模态大模型方向稀缺,薪资具有竞争力。

职位详情

关于这个职位

该职位加入字节跳动Commercial AI团队,专注于多模态大模型在广告创意场景的落地

你将研究多模态理解、强化学习、AIGC等前沿技术,构建广告创意领域大模型,提升客户投广效率
适合对多模态大模型和强化学习有深入研究兴趣的技术人才

最低要求

具备将研究问题抽象为可验证、可迭代系统的能力,能在不确定目标下自主推进问题拆解与方案探索,在以下至少一个方向具备扎实的研究或工程基础:多模态大模型(VLM/LLM/Diffusion/视频生成等)、强化学习(PPO/GRPO/离线RL/RLHF/Agent RL)、大模型后训练(Post-training/Agentic Training/Reward Modeling)、复杂系统或Benchmark设计(评估指标、目标函数、真实反馈建模)

工作职责

成为研究型人才,在热爱的课题方向上,探索多模态大模型领域最具挑战的长期关键问题

探索研究多模态理解、强化学习、AIGC、多模态RAG、视觉CoT、多模态Agent、多模态Reward model、RL等多模态进阶能力
探索多模态深度研究、理解生成一体模型在抖音广告创意场景的落地,帮助客户提升投广效率
构建广告创意领域大模型,在保持通用能力基础上,增强非可验证/非规则化场景下的创意能力提升,提升个性化、抖音风格、故事叙述方面的能力,使得模型在广泛的创意场景对齐抖音流量的偏好,提升多样性,具备视频/图片/网页/文案生成的后验对齐能力
模型适配电商、短剧、游戏、本地生活等全行业客户多样性需求场景,以及对字节跳动信息流/搜索不同App场景的适配

优先资格

加分项:

有广告/推荐/内容生成/搜索等真实业务经验
有创意生成(文案/图片/视频)或投放优化相关经验
有相关领域会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)
有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先

AI 洞察

优缺点分析

优点

  • 进入字节AI核心团队,接触海量真实业务数据与场景
  • 聚焦多模态大模型前沿方向,技术成长极快
  • 公司资源丰富,研究氛围浓厚,发顶会论文机会多
  • 研究目标具有不确定性,需要较强的自主探索能力
  • 竞争激烈,周围同事水平高,持续学习要求高

缺点 / 挑战

  • 业务落地压力大,需要平衡研究创新与实际效果
  • 适合对多模态大模型有浓厚兴趣、具备较强研究能力且愿意拥抱业务挑战的算法工程师

角色解读

  • 深入多模态大模型核心前沿,成为领域专家
  • 向技术负责人或团队leader发展,主导研究方向
  • 积累广告、推荐等业务经验,拓宽技术应用场景
  • 探索多模态大模型前沿技术,如多模态理解、强化学习、AIGC等
  • 将研究成果落地到抖音广告创意场景,提升广告投放效率
  • 构建广告创意领域大模型,增强生成内容的个性化与多样性
  • 适配电商、游戏等行业需求,优化模型在不同客户端表现
  • 扎实的多模态大模型或强化学习研究基础,熟悉VLM、LLM、Diffusion等
  • 具备将复杂问题抽象为可验证系统的能力,自主推进研究
  • 熟悉大模型后训练技术(Post-training、RLHF、Reward Modeling)
  • 有实际项目或论文经验,能快速迭代模型效果

申请策略

  • 关注字节跳动AI Lab和Commercial AI团队的公开分享与技术博客
  • 准备一个与研究相关的深度技术提案,展示独立思考能力
  • 突出多模态、强化学习相关项目或论文,体现研究深度
  • 强调将研究成果转化为实际应用的案例,如广告创意生成
  • 展示编程能力和开源贡献,如Kaggle、ACM经历
  • 量化成果,如模型提升指标、业务收益等
  • 系统学习强化学习PPO、GRPO等算法,动手实现并实验
  • 熟悉Diffusion模型生成图像/视频的原理和微调方法

面试指南

  • STAR法则:描述情境、任务、行动、结果,突出个人贡献
  • 先明确问题定义,再拆解为子问题,逐步给出解决方案
  • 强调实验迭代思维,展示对指标和效果优化的理解
  • 请详细介绍你参与的多模态大模型项目,你负责什么?
  • 如何设计一个评估多模态创意生成质量的benchmark?
  • 解释一下PPO和GRPO的区别,实际应用中如何选择?
  • 如果让你在抖音广告场景使用RL优化创意,你会如何设计?
  • 如何平衡模型的通用能力和垂直场景效果?

匹配度报告

70
综合匹配度

前沿多模态大模型方向,薪资优厚,技术成长极快,但工作强度大、WLB一般。

适合人群
适合以技术成长为核心驱动力,能接受高强度工作,追求前沿研究的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

薪资待遇处于市场高位,福利完善,但JD未明确具体薪资福利细节。

薪资信号未披露(AI估算:25K-55K/月)

成长发展匹配

90较高

职位围绕多模态大模型前沿技术,成长空间极大,但JD未提及晋升通道。

技术前沿前沿/新兴技术
技术栈多模态大模型、强化学习、AIGC、RAG、视觉CoT、Agent、Reward Model、Diffusion、VLM、LLM
业务类型profit_center

工作生活匹配

40较低

字节跳动通常工作强度较大,JD未提及弹性工作或WLB,且在上海核心办公区。

工作模式未明确
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

广告创意行业成熟稳定,技术有实际商业价值,但社会影响力一般。

行业发展稳定成熟行业
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 服务器整机结构工程师-Data

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 内容营销经理(飞书AI/Agent方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 游戏动作设计组长/专家

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 后端研发工程师-客服平台(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-35k
  • 内容分发策略产品-红果短剧

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • PSIG_智能体算法工程师(J99389)

    百度 · 北京市
    AI 估算 · 25k-45k
  • Agent算法研究实习生(演化策略方向)(J100042)

    百度 · 北京市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 服务器整机结构工程师-Data

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 内容营销经理(飞书AI/Agent方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 游戏动作设计组长/专家

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 后端研发工程师-客服平台(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-35k
  • 内容分发策略产品-红果短剧

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • PSIG_智能体算法工程师(J99389)

    百度 · 北京市
    AI 估算 · 25k-45k
  • Agent算法研究实习生(演化策略方向)(J100042)

    百度 · 北京市
    AI 估算 · 4k-8k