Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
多模态大模型数据工程师-智能创作(北京/上海/深圳)
立即应聘

多模态大模型数据工程师-智能创作(北京/上海/深圳)

发布于 1 天前

普通员工/个人贡献者

北京市 / 上海市
中级经验
全职员工
仅现场办公
硕士
数据清洗
多模态数据
大模型
数据增强
特征提取
数据处理Pipeline

AI 估算 · 30k–50k

字节跳动一线城市硕3+年经验,多模态大模型方向竞争激烈,薪资竞争力强,中位数40K*15月属合理区间。

职位详情

关于这个职位

作为多模态大模型数据工程师,你将参与智能创作核心视觉大模型的后训练数据生产与处理

工作聚焦于搭建和优化大规模数据处理Pipeline,管理十亿级多模态数据的回流与清洗,并与算法团队深度合作推动模型效果提升
如果你热爱大数据处理与AI前沿技术,这将是一个兼具挑战与成长的机会

最低要求

硕士学位及以上,计算机、人工智能、软件工程等专业优先

具备3年以上数据处理或模型训练工作经验,熟练掌握文本、多模态等非结构化数据处理方法,熟悉数据清洗、特征提取和数据增强等技术,能够解决数据工作中各种问题
精通Python、Golang、Java等至少一种编程语言,具备良好的编码能力和代码质量意识,熟悉常用的数据处理、文本处理和图像处理库,能够高效地实现数据清洗和处理的算法和流程
掌握大数据开发相关工具,如Spark/Flink/Hadoop/Ray等
具备丰富的数据建模以及数据架构经验,能够对结构化和非结构化数据场景进行统一的建模
具备优秀的分析问题和解决问题能力,勇于挑战困难问题,具备良好的团队协作意识

工作职责

负责&参与智能创作Seedance/Seedream及Seed VLM视觉大模型后训练的数据生产工作

负责和参与上述场景数据处理Pipeline的框架搭建和优化工作,并通过平台化建设持续提升数据处理效率、自助化程度和易用性
负责十亿级别高质量多模态数据的回流、清洗与血缘管理,建设数据飞轮提升高质量后训练数据集规模
与算法深度合作,参与前沿模型研究中数据解决方案开发和维护,不断提升训练数据质量和规模,提升模型后训练效果

优先资格

有图片和视频等多媒体数据处理平台架构建设经验者优先

AI 洞察

优缺点分析

优点

  • 参与前沿多模态大模型研发,技术栈新,成长空间大
  • 与顶尖算法团队合作,能快速积累AI数据工程经验
  • 对编程和分布式系统能力要求高,需持续学习
  • 模型迭代快,工作节奏快,需要适应高强度协作
  • 适合有3年以上数据处理经验、热爱大数据技术、渴望在AI前沿领域深入发展的工程师

缺点 / 挑战

  • 字节跳动平台资源丰富,数据规模大,挑战性强
  • 数据处理Pipeline搭建和优化工作强度较大,需应对海量数据挑战

角色解读

  • 深耕数据工程领域,成长为大数据架构师或数据科学家
  • 结合算法理解,转型为AI算法工程师,参与模型训练全流程
  • 在字节跳动智能创作团队积累经验,未来可向技术管理或资深技术专家发展
  • 负责十亿级多模态数据的回流、清洗与血缘管理,建设数据飞轮
  • 搭建和优化数据处理Pipeline,提升数据处理效率和自助化程度
  • 与算法团队深度合作,参与前沿模型的数据解决方案开发,持续提升训练数据质量
  • 精通Python/Golang/Java,具备大数据开发工具(Spark/Flink/Hadoop/Ray)使用经验
  • 扎实的数据处理能力,熟悉多模态数据清洗、特征提取、数据增强等技术
  • 具备数据建模和数据架构经验,能处理结构化和非结构化数据

申请策略

  • 在简历中明确标注可接受的工作地点(北京/上海/深圳)
  • 投递时附上GitHub或个人项目链接,展示编码能力和数据工程经验
  • 突出大数据处理项目经验,尤其是Spark/Flink等框架的使用场景和成果
  • 强调多模态数据(图像/视频/文本)处理的具体案例
  • 展示数据Pipeline架构设计能力,用量化指标体现效率提升
  • 如有开源贡献或相关技术博客,建议附上
  • 补充多模态大模型基础知识,了解数据如何影响模型训练
  • 熟悉Ray等分布式计算框架,提升数据处理效率

面试指南

  • 采用STAR法则:描述场景、任务、行动和结果,强调量化指标
  • 技术问题先讲原理,再举具体例子,最后总结最佳实践
  • 对于开放性设计问题,先明确需求,再分模块阐述方案,并考虑扩展性
  • 请描述你处理过最大的多模态数据集规模,以及使用的Pipeline架构
  • 如何处理数据倾斜问题?在Spark中如何优化?
  • 数据清洗中如何保证质量?举例说明你使用过的清洗策略
  • 你如何设计一个数据血缘管理系统?
  • 对当前多模态大模型的理解?数据在后训练中的作用是什么?

匹配度报告

74
综合匹配度

字节跳动多模态大模型数据工程师,前沿技术栈、高薪资潜力,但WLB一般、需现场办公。

适合人群
适合追求技术成长、渴望在AI前沿领域深耕,且能接受高强度和现场办公节奏的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展92
工作生活50
使命价值70

薪资福利匹配

85较高

字节跳动作为上市大厂,薪资在行业内具有较强竞争力,福利完善。但JD未明确薪资和具体福利,仅从公司品牌推测薪资偏高。

薪资信号偏高 (30K-50K/月)

成长发展匹配

92较高

该职位处于多模态大模型前沿,技术栈新颖,平台大,成长机会多。JD中强调与算法深度合作,能接触前沿研究,且数据工程本身发展路径清晰。

技术前沿前沿/新兴技术
技术栈多模态、大模型、Spark、Flink、Python、Golang、数据清洗、特征提取、数据增强、Ray
业务类型ambiguous

工作生活匹配

50较低

JD未提及工作模式,但字节跳动作为互联网大厂,通常要求现场办公,且加班较常见。工作地点在核心城市,但未明确具体地段。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

智能创作领域属于AI应用前沿,具有推动内容创作变革的意义,但JD未直接强调社会使命。行业增长快,创新性高。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k