ByteDance logo
字节跳动
大模型算法工程师-抖音质量

大模型算法工程师-抖音质量

发布于 大约 1 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
深度学习
PyTorch
计算机视觉
TensorFlow
模型部署
多模态
AIGC
大模型
MLLM

AI 估算 · 35k–55k

大模型算法岗需求旺盛,字节跳动薪资竞争力强,上海地区硕士以上学历,综合行业水平估算。

职位详情

关于这个职位

作为字节跳动抖音质量团队的大模型算法工程师,你将专注于利用多模态大模型技术解决音画质评估、AIGC内容理解等多媒体质量难题,推动产品体验优化

该岗位涉及从模型设计、训练到部署的全链路工作,并与产品、工程团队紧密协作,适合对前沿技术有热情、渴望在工业界落地大模型应用的算法人才

最低要求

计算机、人工智能相关专业,本科及以上学历,具有深度学习相关的算法研究和落地经验,具有LLM开发和应用的实践的经历

熟悉CNN/Transformer/Vit/BLIP/BERT等主流模型架构,熟练使用Pytorch、Tensorflow、Caffe、Keras等机器学习框架
具备一定多模态大模型的算法经验(SFT/PE/RLHF/RAG),包括MLLM的训练、微调和评测工作,具备大模型部署实践经验,掌握vLLM、TRT等主流大模型部署框架,熟悉大模型推理优化的基本方案
熟悉图像、音频等多媒体生成算法,如VAE,DIFFUSION等基本架构,了解生成模型的评估方法

工作职责

负责抖音系产品的多媒体泛质量方向下利用大模型技术解决多媒体质量的问题,包括但不限于基于MLLM设计音画质评估模型,AIGC生成内容(图像视频生成、音频生成等)理解/评估,用户体验大模型、音视频等相关问题挖掘算法、多模态内容理解等方向

负责深度学习模型的部署的优化工作,能够配合工程团队完成模型的上线开发和应用
基于业务形态和算法技术,挖掘产品体验问题,并与产品研发团队密切配合,推动业务落地,提升产品用户体验
跟随团队参与校企横向项目、学术论坛会议、数据科学竞赛等,协助团队构建学术/工业界影响力

优先资格

具有算法工程化、模型蒸馏、模型部署,模型算子调优,SDK设计等工程经验,具备较强的工程能力

在CVPR、ICCV、ECCV、ICML、NeurlIPS等机器学习和计算机视觉顶级会议发表文章或CVPR NTIRE、Kaggle、CCF、天池等知名数据科学竞赛取得前列名次优先

AI 洞察

优缺点分析

优点

  • 深度参与抖音亿级用户产品的核心质量优化,业务影响力大
  • 接触大模型、多模态等前沿技术,技术积累丰厚,行业认可度高
  • 字节跳动技术氛围浓厚,资源充足,有学术合作和竞赛机会,利于个人品牌建设
  • 薪资福利具有竞争力,股票期权等长期激励
  • 技术难度大,需持续学习前沿模型与部署优化,保持技术领先
  • 适合有深度学习和大模型实战经验、渴望在工业界落地前沿技术、能承受快节奏的技术人才

缺点 / 挑战

  • 工作强度较高,互联网大厂节奏快,需快速迭代和响应业务需求
  • 跨部门协作频繁,沟通成本较高,需要较强的推动能力

角色解读

  • 从算法工程师逐步成长为技术专家,深入多媒体质量与多模态方向
  • 横向拓展至其他业务线(如抖音其他质量场景或公司级AI平台)
  • 可转向技术管理,带领团队攻关复杂问题,或成为AI领域核心研究员
  • 设计和训练多模态大模型,用于评估抖音视频/音频质量、理解AIGC生成内容
  • 将模型部署到生产环境,优化推理速度和资源占用,配合工程团队上线
  • 与产品、运营协作,挖掘用户体验痛点,推动算法落地以提升产品指标
  • 参与学术合作和竞赛,跟踪前沿技术,提升团队技术影响力
  • 扎实的深度学习基础,熟悉CNN、Transformer、ViT、BLIP等主流模型
  • 熟练使用PyTorch、TensorFlow等框架,具备LLM开发经验(SFT、RLHF等)
  • 掌握多模态大模型训练、微调、评测,以及部署框架(vLLM、TRT)
  • 了解图像/音频生成模型(VAE、Diffusion)及其评估方法

申请策略

  • 了解抖音质量团队的技术博客和公开分享,面试中展示对业务场景的理解
  • 准备一个端到端的项目案例,从问题定义、模型设计到上线效果完整阐述
  • 突出大模型相关项目经验,如MLLM训练、微调、部署的具体案例
  • 强调在多媒体质量、AIGC理解或计算机视觉领域的成果,附带量化指标
  • 展示工程化能力,如模型优化、推理加速、SDK设计等实践
  • 列出顶级会议论文或数据科学竞赛获奖,增加竞争力
  • 补充多模态大模型部署经验,学习vLLM、TensorRT等框架
  • 深入理解Diffusion、VAE等生成模型原理及评估指标

面试指南

  • STAR法则:情境(Situation)、任务(Task)、行动(Action)、结果(Result),清晰结构化
  • 技术问题先阐述基本原理,再结合自身实践,最后总结关键点
  • 对开放性问题,先明确问题边界,再给出多种方案并比较优劣
  • 请详细描述你参与过的一个多模态大模型项目,包括模型架构、训练数据、调优方法和最终效果
  • 如何评估AIGC生成内容的画质?有哪些常用的客观和主观指标?
  • 在大模型部署时,你遇到过哪些性能瓶颈?如何优化推理延迟和显存占用?
  • 解释一下RLHF的流程,以及在大模型微调中的作用
  • 如果让你设计一个抖音视频质量评估模型,你会选择什么架构?为什么?

匹配度报告

72
综合匹配度

大厂核心业务、前沿技术栈、薪资优厚,但工作强度大、WLB一般。

适合人群
最适合追求技术前沿成长、期待高薪回报、能适应高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活45
使命价值70

薪资福利匹配

85较高

字节跳动薪资在行业内属于第一梯队,大模型岗位更因稀缺性偏高,但JD未明确具体薪资和福利,需面试确认。

薪资信号未披露(AI估算:35K-55K/月)

成长发展匹配

90较高

该岗位聚焦大模型、多模态前沿技术,涉及从研究到部署全链路,成长空间极大;且鼓励学术合作和竞赛,技术积累快。

技术前沿前沿/新兴技术
技术栈大模型、多模态、MLLM、RLHF、Diffusion、Transformer、vLLM
成长机会参与校企横向项目、学术论坛会议、数据科学竞赛等,协助团队构建学术/工业界影响力
业务类型profit_center

工作生活匹配

45较低

字节跳动普遍工作强度较大,JD未提及弹性工作或WLB,且上海现场办公,通勤压力可能较大。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

抖音作为亿级用户产品,优化用户体验具有明显社会价值;AI技术应用提升内容质量,但商业导向较强。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号提升产品用户体验
创新程度积极采用新技术
Watch Jobs