Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
智能模型数据平台工程师-AI Data
立即应聘

智能模型数据平台工程师-AI Data

发布于 大约 14 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
本科
PyTorch
GO
TensorFlow
数据湖
向量数据库
大模型
ClickHouse
数据血缘
Ai-Native
Hudi

AI 估算 · 25k–40k

字节跳动AI数据核心岗位,技术栈前沿且难度高,北京地区高级工程师薪资竞争力强,年终奖丰厚。

职位详情

关于这个职位

该职位是字节跳动AI数据平台团队的核心岗位,负责构建和管理Seed大模型海量数据的统一平台,覆盖数据生产、管理、消费和质量全生命周期

你将主导技术选型和架构优化,使用Spark/Flink/Ray等大数据引擎,搭建高吞吐、高容错的数据基础设施,支撑日PB级数据处理
同时需要构建AI-Native的数据Agent,探索新一代数据平台范式

最低要求

本科及以上学历,计算机相关专业

精通Python、Java、Go等至少一种编程语言,有服务端开发经验,具备良好的编码能力和代码质量意识
至少精通以下引擎/架构之一:Spark/Flink/Ray等大数据处理引擎,Hudi/Iceberg/Paimon等数据湖,及Doris/ClickHouse等OLAP引擎,PyTorch/TensorFlow等机器学习框架,索引与搜索架构
在线上有实践经验,有源码阅读经验,有引擎二次开发经验优先
对业务敏感,能快速理解业务背景,具备优秀的技术与业务结合能力,有较好的需求抽象能力和架构能力
学习能力强,能够快速学习完全没有涉猎过的新技术,并快速应用于工程实践

工作职责

围绕Seed大模型数据全生命周期,建设Seed大模型海量数据的管理/生产/消费/质量的统一平台,提升大模型数据全生命周期的使用效率与质量,赋能算法预训练、SFT/RLHF等场景

构建大模型领域的Data Agent,重构AI-Native的数据平台范式
协同基础架构/云平台团队,搭建稳定高效的底层数据基础设施(数据湖、对象存储、分布式计算、大规模数据检索、数据血缘系统,调度引擎,算力平台等)
主导技术选型与架构优化,基于Spark/Flink/Ray、湖仓一体、向量数据库,调度引擎等技术栈,构建高吞吐、高容错、可扩展的处理存储能力,支撑日PB级数据处理

优先资格

大数据平台生产与管理开发经验

大模型数据抓取、加工,合成应用于预训练、SFT/RLHF的实践经验
Agent项目开发经验,了解当前Agent架构实践
良好的AI Coding实践者,有将Harness Engineering应用于实际开发工作经验

AI 洞察

优缺点分析

优点

  • 深度参与大模型核心数据平台建设,技术栈前沿,如Spark/Flink/Ray、数据湖、向量数据库等,技能积累价值高
  • 团队技术氛围浓厚,有机会接触开源社区,提升开源影响力
  • 技术复杂度高,需要掌握多种大数据和AI组件,学习曲线陡峭
  • 业务节奏快,需要快速响应算法团队的需求,工作强度可能较大

缺点 / 挑战

  • 字节跳动大平台,数据量巨大(日PB级),挑战和成长空间大
  • 对系统稳定性和性能要求极高,处理海量数据时容错和优化挑战多
  • 适合技术功底扎实、热爱大数据和AI基础设施、乐于挑战高难度问题、有较强自驱力和学习能力的工程师

角色解读

  • 从数据平台工程师成长为AI数据架构师,主导大模型数据基础设施的整体设计
  • 深入大模型领域,成为数据与算法结合的专家,推动AI-Native数据平台创新
  • 向技术管理方向发展,带领团队构建更高效的数据体系
  • 负责Seed大模型数据全生命周期的统一平台建设,包括数据管理、生产、消费和质量监控
  • 构建AI-Native的数据Agent,实现数据处理的自动化和智能化
  • 与基础架构团队协同,搭建稳定高效的底层数据基础设施,如数据湖、分布式计算、调度引擎等
  • 进行技术选型和架构优化,确保平台具备高吞吐、高容错、可扩展的能力,支撑日PB级数据处理
  • 精通Python、Java、Go等至少一种编程语言,具备扎实的编码和工程能力
  • 深入掌握大数据处理引擎如Spark/Flink/Ray,或数据湖技术如Hudi/Iceberg/Paimon,或OLAP引擎如Doris/ClickHouse
  • 有线上大规模数据处理系统的实践经验,具备源码阅读和二次开发能力优先
  • 对业务敏感,能快速理解并抽象需求,具备优秀的架构设计能力

申请策略

  • 字节跳动非常看重技术深度和业务理解,面试前可以了解Seed大模型的基本背景和数据需求
  • 准备一个你主导的复杂系统设计案例,突出架构决策和性能优化
  • 突出大数据引擎(Spark/Flink/Ray)或数据湖(Hudi/Iceberg)的深度使用和优化经验,最好有线上大规模案例
  • 展示编程能力,如参与过开源项目或贡献过源码
  • 如果有大模型数据相关项目(如预训练数据处理、SFT数据构建),务必强调
  • 体现架构设计能力,如主导过数据平台或数据管道的设计
  • 如果对数据湖或OLAP引擎不熟悉,可以快速学习Hudi/Iceberg/Paimon或Doris/ClickHouse的架构和使用
  • 了解大模型数据全生命周期,包括预训练数据清洗、SFT数据标注、RLHF数据反馈等流程

面试指南

  • 对于系统设计题,先明确需求和约束(规模、一致性、延迟),然后分模块(存储、计算、调度、元数据)阐述设计,最后总结权衡
  • 对于技术原理题,先说明基础概念,再结合实际经验谈优化手段,引用源码更佳
  • 对于开放性问题,结合AIAgent和实际业务场景,展示对业务的理解和创新思路
  • 请设计一个支持PB级数据的数据湖平台,包括存储、计算、元数据管理
  • Spark Shuffle的原理是什么?如何优化Spark作业性能?
  • 你如何理解大模型数据全生命周期?数据如何影响模型效果?
  • 描述一次你解决线上大数据系统故障的经历
  • 说说你对AI-Native数据平台的理解,与传统平台有何不同?

匹配度报告

72
综合匹配度

字节AI数据核心岗,前沿技术栈,薪资优厚,成长快但工作强度大。

适合人群
最适合发展性动机强的求职者,追求技术前沿和快速成长,愿意接受高强度工作。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值75

薪资福利匹配

85较高

字节跳动薪资水平领先,该岗位属核心AI数据团队,薪资偏高,福利优厚(五险一金、年终奖、补充医疗等),补偿性动机满足度高。

薪资信号偏高 (25K-40K/月)

成长发展匹配

90较高

岗位涉及前沿AI数据技术栈,如大模型数据、Data Agent、湖仓一体等,成长空间极大;团队技术氛围浓厚,有导师制和内部技术分享。

技术前沿前沿/新兴技术
技术栈Python、Java、Go、Spark、Flink、Ray、Hudi、Iceberg、Paimon、Doris、ClickHouse、PyTorch、TensorFlow、数据湖、向量数据库、Data Agent、AI-Native
业务类型profit_center

工作生活匹配

40较低

北京现场办公,字节跳动工作节奏较快,加班较常见,JD未明确提及WLB,办公地点位于市区,但工作强度可能影响生活。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

参与大模型关键基础设施,推动AI技术发展,具有较高社会影响力;AI行业高速增长,岗位创新性强。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • 快手后端实习生(后端/AI方向)

    快手 · 北京市
    AI 估算 · 4k-6k
  • 服务端测试开发工程师-【商业化】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 服务端测试开发工程师-【线索营销】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 后端开发-数智

    中国平安 · 深圳市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • 快手后端实习生(后端/AI方向)

    快手 · 北京市
    AI 估算 · 4k-6k
  • 服务端测试开发工程师-【商业化】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 服务端测试开发工程师-【线索营销】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 后端开发-数智

    中国平安 · 深圳市
    AI 估算 · 25k-40k