Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
智能模型数据平台工程师-AI Data
立即应聘

智能模型数据平台工程师-AI Data

发布于 大约 16 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
本科
机器学习
分布式系统
数据湖
大模型
Ai-Native
Data Agent

AI 估算 · 30k–45k

字节跳动核心AI数据平台,技术前沿,要求高,薪资具有竞争力,月薪30k-45k合理。

职位详情

关于这个职位

该职位负责建设Seed大模型数据全生命周期管理平台,涵盖数据采集、加工、存储与消费,并构建AI-Native的数据平台范式

你将与基础架构团队协作,搭建稳定高效的大数据基础设施,支撑PB级数据处理
适合对大数据和大模型技术有浓厚兴趣、追求技术深度的工程师

最低要求

本科及以上学历,计算机相关专业

精通Python、Java、Go等至少一种编程语言,有服务端开发经验,具备良好的编码能力和代码质量意识
至少精通以下引擎/架构之一:Spark/Flink/Ray等大数据处理引擎,Hudi/Iceberg/Paimon等数据湖,及Doris/ClickHouse等OLAP引擎,PyTorch/TensorFlow等机器学习框架,索引与搜索架构
在线上有实践经验,有源码阅读经验,有引擎二次开发经验优先
对业务敏感,能快速理解业务背景,具备优秀的技术与业务结合能力,有较好的需求抽象能力和架构能力
学习能力强,能够快速学习完全没有涉猎过的新技术,并快速应用于工程实践

工作职责

围绕Seed大模型数据全生命周期,建设Seed大模型海量数据的管理/生产/消费/质量的统一平台,提升大模型数据全生命周期的使用效率与质量,赋能算法预训练、SFT/RLHF等场景

构建大模型领域的Data Agent,重构AI-Native的数据平台范式
协同基础架构/云平台团队,搭建稳定高效的底层数据基础设施(数据湖、对象存储、分布式计算、大规模数据检索、数据血缘系统,调度引擎,算力平台等)
主导技术选型与架构优化,基于Spark/Flink/Ray、湖仓一体、向量数据库,调度引擎等技术栈,构建高吞吐、高容错、可扩展的处理存储能力,支撑日PB级数据处理

优先资格

加分项:

大数据平台生产与管理开发经验
大模型数据抓取、加工,合成应用于预训练、SFT/RLHF的实践经验
Agent项目开发经验,了解当前Agent架构实践
良好的AI Coding实践者,有将Harness Engineering应用于实际开发工作经验

AI 洞察

优缺点分析

优点

  • 处于大模型技术前沿,参与核心数据平台建设,技术价值高
  • 字节跳动平台资源丰富,团队技术氛围浓厚,成长空间大
  • 薪资福利具有竞争力,项目影响力覆盖全公司业务
  • 技术栈覆盖广泛,学习曲线陡峭,需要持续跟进新技术
  • 业务迭代快,需要快速交付,可能面临高强度开发节奏

缺点 / 挑战

  • 大模型数据量巨大,对系统稳定性和性能要求极高,工作压力较大
  • 适合对大数据和大模型技术有强烈兴趣、具备扎实工程能力、愿意挑战高难度问题的技术型人才

角色解读

  • 深耕大数据与AI平台领域,成为大模型数据基础设施专家或架构师
  • 向AI算法训练与推理方向拓展,参与大模型核心技术优化
  • 晋升技术Leader,带领团队构建下一代数据平台,推动技术演进
  • 建设和管理大模型数据全生命周期平台,涵盖数据采集、加工、存储、消费和质量监控
  • 设计和实现Data Agent,推动AI-Native数据平台范式,提升数据使用效率
  • 与基础架构团队协作,搭建稳定高效的大数据基础设施,包括数据湖、分布式计算和调度引擎
  • 主导技术选型和架构优化,基于Spark/Flink/Ray等引擎构建高吞吐、可扩展的数据处理能力
  • 精通Python、Java或Go等编程语言,具备良好的编码和代码质量意识
  • 深度掌握Spark/Flink/Ray等大数据处理引擎,或Hudi/Iceberg等数据湖技术
  • 熟悉Doris/ClickHouse等OLAP引擎,或PyTorch/TensorFlow等机器学习框架
  • 具备较强的业务理解和需求抽象能力,能够快速学习新技术并应用于工程实践

申请策略

  • 在简历和面试中体现技术广度与深度,突出业务理解能力
  • 提前了解字节Seed大模型相关背景,展示对AI数据平台的理解
  • 突出大数据引擎的线上实践经验,特别是源码阅读或二次开发经历
  • 展示数据平台或大模型数据处理相关项目,说明架构设计和优化成果
  • 强调分布式系统设计能力,如高吞吐、高容错架构案例
  • 如有Agent或AI Coding经验,重点呈现
  • 深入学习Spark/Flink/Ray的底层原理和调优技巧
  • 了解大模型训练数据流程,包括数据清洗、去重、合成等

面试指南

  • 采用STAR法则:说明情境(Situation)、任务(Task)、行动(Action)、结果(Result),结合过往项目经验
  • 技术对比类问题先明确核心维度(性能、一致性、生态等),然后举例实际场景
  • 架构设计类问题先定位需求,再分层阐述数据流、组件选型和容错机制
  • 请比较Spark、Flink和Ray三者的核心差异及适用场景
  • 如何处理PB级数据的ETL任务?请设计一个架构方案
  • Hudi、Iceberg和Paimon数据湖技术如何选型?各有什么优缺点?
  • 如何构建一个数据血缘系统?需要考虑哪些关键点?
  • 在大模型训练中,数据质量如何保证?请描述一个数据清洗流程

匹配度报告

70
综合匹配度

核心AI数据平台,前沿技术栈,薪资优厚,但工作强度大,WLB一般。

适合人群
最适合追求技术成长和高薪回报的求职者,对WLB要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

字节跳动薪资福利在行业内有竞争力,且该岗位为核心技术岗,薪资待遇偏上,但JD未明确具体数字。

薪资信号未披露(AI估算:30K-45K/月)

成长发展匹配

90较高

职位涉及大模型数据平台前沿技术,要求快速学习新技术,成长空间大,但JD未直接提及培训或晋升制度。

技术前沿前沿/新兴技术
技术栈大模型、Data Agent、数据湖、Spark、Flink、Ray、向量数据库
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性工时或远程,字节跳动通常工作强度较大,WLB一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型赛道高速增长,职位对AI发展有积极贡献,但社会影响偏中性,创新性较强。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 大模型算法工程师-商品治理

    字节跳动 · 北京市
    AI 估算 · 35k-60k
  • 芯片DFT工程师(深圳)

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 大模型代码评测专家-大模型数据服务中心

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • AI客户端开发工程师(应用研究方向)-集团信息系统

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 媒介专家-媒介一组

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Sr. Assoc, Production Eng, WRB Tech

    渣打银行 · 天津市
    AI 估算 · 20k-35k
  • 网络运营管理实习生

    中国移动 · 西藏自治区-其它
    AI 估算 · 2k-4k
  • 无人机-云服务运维工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • 大数据计算架构师

    京东 · 北京市
    AI 估算 · 50k-70k
  • AI平台架构师

    京东 · 北京市
    AI 估算 · 35k-65k

字节跳动 的其他在招职位

  • 大模型算法工程师-商品治理

    字节跳动 · 北京市
    AI 估算 · 35k-60k
  • 芯片DFT工程师(深圳)

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 大模型代码评测专家-大模型数据服务中心

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • AI客户端开发工程师(应用研究方向)-集团信息系统

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 媒介专家-媒介一组

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Sr. Assoc, Production Eng, WRB Tech

    渣打银行 · 天津市
    AI 估算 · 20k-35k
  • 网络运营管理实习生

    中国移动 · 西藏自治区-其它
    AI 估算 · 2k-4k
  • 无人机-云服务运维工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • 大数据计算架构师

    京东 · 北京市
    AI 估算 · 50k-70k
  • AI平台架构师

    京东 · 北京市
    AI 估算 · 35k-65k