Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
多模态算法工程师-抖音内容理解
立即应聘

多模态算法工程师-抖音内容理解

发布于 大约 4 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
本科
深度学习
NLP
模型训练
数据工程
PyTorch
LLM
多模态
大模型
CV
内容理解

AI 估算 · 40k–60k

多模态算法是AI前沿方向,字节薪资竞争力强,高级岗位月薪40-60K合理,15薪体现大厂标准。

职位详情

关于这个职位

该职位是抖音内容理解团队的核心算法岗位,专注于多模态大模型的基础研究与业务落地

你将参与提升视频、音频、图像、文本及多模态的理解能力,推动模型在搜索、推荐、广告等场景的应用,同时有机会探索理解与生成模型的结合,产出学术成果并影响亿级用户

最低要求

计算机/软件/人工智能/数学等相关专业的优先

具有扎实的机器学习基础,对深度学习、大语言模型、多模态模型、生成式模型等内容理解与生成技术有深入的理解,数理功底扎实,自学能力强
有扎实的编码能力,熟练使用相关机器学习框架和工程框架

工作职责

研究方向:提升视频、音频、图像、文本及多模态的大模型基础能力,在业务领域与通用领域取得行业领先的效果,建设体系化的模型能力提升方法论

探索理解大模型与生成大模型能力结合互补模式,探索并落地一体化模型并取得更高的模型效果
推动多模态内容理解能力在搜索、推荐、广告等场景的落地应用
负责抖音、直播、今日头条等业务场景下的开集内容理解工作,建设多模态大模型、生成式模型等前沿模型技术能力,接近人类感知认知模型能力,产出相应的研究成果
负责抖音等业务场景通用多模态大模型的模型训练和基础建设,包括但不限于模型训练、数据工程、训练推理框架迭代、维护模型评估指标体系
跟进行业最新技术进展,探索多模态方向的新技术研究与落地

优先资格

在多模态大模型领域有经验,在短视频、图文算法领域有经验者优先

在计算机科学高水平会议和期刊如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、PAMI、IJCV等发表过论文或有竞赛经验者优先

AI 洞察

优缺点分析

优点

  • 深度参与万亿级用户场景,技术和业务影响力巨大,成果可快速落地
  • 团队资源丰富,数据量大,能够从事最前沿的多模态研究,产出高水平论文
  • 薪资福利极具竞争力,股票期权等激励丰厚
  • 技术成长加速,与顶尖同事共事,学习最新AI技术
  • 技术更新迅速,需要持续学习,保持对前沿领域的敏锐度
  • 对个人综合能力要求高,既要工程落地能力,又要学术创新能力
  • 适合具备极强自学能力和算法功底、渴望在AI前沿领域快速成长、能适应高强度工作节奏的求职者

缺点 / 挑战

  • 工作强度较高,字节节奏快,可能需要应对紧急业务需求

角色解读

  • 技术纵深发展:成为多模态/大模型领域的顶尖专家,主导基础模型研究与创新
  • 横向发展:转向搜索、推荐、广告等业务算法方向,或跨团队负责完整产品线
  • 管理路线:积累项目经验后,可晋升为技术Leader,带领团队攻克难题
  • 负责多模态大模型(文本、图像、视频、音频)的基础能力提升,包括模型训练、数据工程和推理框架优化
  • 推动多模态内容理解在抖音、今日头条等产品的搜索、推荐、广告业务中落地
  • 探索理解大模型与生成大模型的结合,参与一体化模型的研究与开发
  • 跟踪前沿技术,发表学术论文并贡献开源项目
  • 扎实的机器学习基础,深入理解深度学习、大语言模型、多模态模型和生成式模型
  • 熟练使用PyTorch等框架,具备优秀的编码能力,能够独立进行模型训练和部署
  • 拥有多模态或LLM相关项目经验,熟悉短视频/图文内容理解领域者优先
  • 具备学术研究能力,有过顶级会议论文发表或竞赛经历者优先

申请策略

  • 关注字节跳动技术博客和开源项目,了解团队技术方向,在面试中展示兴趣
  • 准备一个完整的多模态项目讲解,从问题定义、方案设计到效果评估,体现系统性思考
  • 重点突出多模态或LLM相关项目经验,详细描述模型架构、训练过程及业务效果
  • 列出发表的顶级会议论文或参与的开源项目,展示学术或工程贡献
  • 强调扎实的代码能力,如使用PyTorch实现复杂模型,或优化训练框架的经验
  • 如有搜索/推荐/广告相关经验,务必突出对业务场景的理解
  • 补充对比学习、视觉-语言预训练(如CLIP)、扩散模型等前沿技术知识
  • 掌握大规模分布式训练技术,熟悉DeepSpeed、Megatron等框架

面试指南

  • 对于技术方案类问题,采用STAR法则:先说明背景和目标,再详细阐述方案设计,最后总结效果和反思
  • 对于趋势类问题,结合近期论文(如LLaVA、GPT-4V)和工业实践,展现深度思考,避免泛泛而谈
  • 始终将业务理解融入技术回答,展示算法如何服务于用户体验或商业指标
  • 请介绍一下你参与过的多模态项目,包括模型架构、训练数据和最终效果
  • 如何设计一个用于短视频内容理解的多模态模型?请从特征提取、融合方式到输出任务展开
  • 你对当前LLM和多模态大模型的技术趋势有什么看法?你认为未来一年最大的突破可能在哪?
  • 如何在大规模多模态数据上高效训练一个视觉-语言模型?请讨论数据工程、模型并行和训练策略
  • 给定一个业务场景(如抖音搜索),你如何利用多模态技术提升搜索结果的相关性?

匹配度报告

71
综合匹配度

前沿多模态算法岗,薪资技术双高,但工作强度大,WLB差。

适合人群
最适合追求技术前沿和高速成长、不介意高强度工作节奏的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活30
使命价值75

薪资福利匹配

85较高

字节跳动提供行业顶级的薪酬和福利,但薪资面议,岗位级别高,综合回报丰厚。

薪资信号面议 (40K-60K/月)

成长发展匹配

95较高

岗位聚焦多模态前沿技术,团队资源丰富,有论文产出和学术合作机会,技术成长极快。

技术前沿前沿/新兴技术
技术栈多模态、大模型、LLM、深度学习、CV、NLP
成长机会学术论文、技术报告、开源能力
业务类型profit_center

工作生活匹配

30较低

仅现场办公,未提及弹性工作,字节加班文化普遍,WLB较差。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

工作直接影响亿万用户的内容消费体验,但使命导向不如医疗/环保领域直接。

行业发展高速增长赛道
社会影响中性/一般
使命信号改变影响用户、改变行业格局
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 资深研发工程师(互动方向)-国际化内容安全平台

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 平台产品营销经理-国际化广告商业平台

    字节跳动 · 深圳市
    AI 估算 · 30k-50k
  • 大语言模型通用Agent研究工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 推荐算法工程师(多端电商)-抖音电商

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • 国际战略专家-TikTok Shop

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发实习生-【主站】

    快手 · 北京市
    AI 估算 · 5k-8k
  • 前端实习岗(J72414)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 大数据研发(J93780)

    百度 · 北京市
    AI 估算 · 25k-45k
  • golang实习开发工程师(J72787)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 算法实习生(J77875)

    百度 · 北京市
    AI 估算 · 4k-6k

字节跳动 的其他在招职位

  • 资深研发工程师(互动方向)-国际化内容安全平台

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 平台产品营销经理-国际化广告商业平台

    字节跳动 · 深圳市
    AI 估算 · 30k-50k
  • 大语言模型通用Agent研究工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 推荐算法工程师(多端电商)-抖音电商

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • 国际战略专家-TikTok Shop

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发实习生-【主站】

    快手 · 北京市
    AI 估算 · 5k-8k
  • 前端实习岗(J72414)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 大数据研发(J93780)

    百度 · 北京市
    AI 估算 · 25k-45k
  • golang实习开发工程师(J72787)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 算法实习生(J77875)

    百度 · 北京市
    AI 估算 · 4k-6k