字节跳动的具身智能数据开发工程师-Seed薪资是多少？

该职位薪资范围为 25k–45k（人民币/月）。

具身智能数据开发工程师-Seed的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

字节跳动的具身智能数据开发工程师-Seed有什么任职要求？

该职位要求学历未注明学历及中级经验工作经验。

字节跳动

具身智能数据开发工程师-Seed

立即应聘

具身智能数据开发工程师-Seed

发布于大约 2 个月前

普通员工/个人贡献者

北京市

中级经验

全职员工

仅现场办公

学历未注明

软件工程

多模态数据

大模型

数据处理

机器人

AI 估算 · 25k–45k

大厂中级职位，北京地区AI数据工程方向，技术门槛高，薪资竞争力强，通常15个月薪资。

职位详情

关于这个职位

该职位负责搭建机器人领域的大模型数据处理平台，支持从采集到评估的全流程数据闭环

你将设计与实现高吞吐、可扩展的时序多模态数据处理引擎，并与算法团队深度配合，提升数据质量，驱动机器人能力进化

适合对AI数据工程和机器人系统有浓厚兴趣的技术人才

最低要求

对机器人系统、人工智能训练、数据平台等方向有浓厚兴趣，愿意深入理解机器人“大脑”的构建逻辑

精通Python或Golang至少一种编程语言，能够开发高效、可扩展的数据集处理工具

具备图像/视频/多模态数据处理经验，熟悉数据处理、格式转换、时间同步等处理流程

具备以下至少一种经验：自动标注、数据质检、数据合成、数据增强、数据配比、或评测集构建

工作职责

搭建机器人领域专属的大模型数据处理平台，支持从采集、清洗、标注、训练到评估的全流程数据闭环

设计与实现高吞吐、可扩展的时序多模态数据处理引擎、服务图像、视频、语音、动作等多模态数据

与算法团队深度配合,基于大模型能力，提取有价值的数据,提升数据质量,深度参与数据驱动下机器人能力的进化

模型评估体系建设，从模型训练到模型评测一站式完成,为模型性能提供可靠的数据支持

优先资格

熟悉分布式计算或大数据处理框架（如Spark、Flink、Ray、Hadoop等）者优先

有海量数据处理平台、数据调度系统、数据流/批一体框架使用或开发经验者优先

有VLM/VLA训练调优经验者优先

AI 洞察

优缺点分析

优点

字节跳动大平台，资源丰富，数据量和业务场景优质
薪资待遇具有竞争力，且团队技术氛围浓厚
技术栈要求广泛，需要同时掌握数据处理、分布式系统、多模态等多领域知识
行业仍处于早期阶段，技术路线可能快速变化，需要持续学习
适合对AI数据工程充满热情、具备较强编程和数据处理能力、愿意在快速迭代的前沿领域深耕的技术人才

缺点 / 挑战

处于AI前沿领域（具身智能），技术挑战大，成长空间广阔
工作强度较高，互联网大厂节奏快，可能需要应对紧急项目

角色解读

在数据工程领域深入发展，成为数据平台架构师或数据技术专家
横向向算法方向拓展，结合VLM/VLA经验转型为具身智能算法工程师
纵向晋升为技术Leader，带领数据团队支撑机器人业务快速发展
搭建和维护机器人领域的大模型数据处理平台，实现从数据采集到模型评估的全流程自动化
设计和优化时序多模态数据处理引擎，高效处理图像、视频、语音、动作等异构数据
与算法团队协作，基于大模型能力进行数据提取和质量提升，驱动机器人能力迭代
构建模型评估体系，提供可靠的数据支持，确保模型性能的持续优化
精通Python或Golang，能够开发高效的数据处理工具
熟悉多模态数据处理流程，包括格式转换、时间同步等
掌握自动标注、数据增强、评测集构建等至少一种数据工程经验
了解分布式计算框架（如Spark、Flink、Ray）优先，有海量数据处理平台经验更佳

申请策略

在简历中明确列出技术栈和项目规模（数据量、吞吐量等），用数据说话
了解字节Seed团队的业务方向，在面试中展示对机器人数据闭环的见解
突出多模态数据处理项目经验，尤其是图像/视频/时序数据相关
强调大数据处理框架（Spark/Flink/Ray等）的实际使用案例和性能优化成果
如有VLM/VLA或自动标注经验，务必重点展示
展现对机器人或AI系统底层数据闭环的理解，体现技术深度
补充分布式计算和大数据技术的实战能力，可通过开源项目或自建Demo
学习多模态数据格式（如HDF5、TFRecord）和时序处理方法

面试指南

STAR法则：描述情境、任务、行动、结果，突出技术选型和量化成效
对比分析：针对选型问题（如Spark vs Flink），从实时性、吞吐量、容错等维度比较
系统设计：阐述整体架构，分模块说明数据流、存储、计算和监控
请描述一个你设计过的多模态数据处理管道，包括数据格式、吞吐量、挑战和优化
如何在大规模数据下保证数据质量？请结合自动标注和质检经验说明
对Spark和Flink的流批一体处理有什么理解？在什么场景下选择哪种框架？
你对VLM/VLA的训练数据有什么看法？如何构建高质量的评测集？
模拟一个机器人传感器数据流的场景，你会如何设计数据存储和处理架构？

职位点评

综合评分

大厂前沿AI数据岗，技术成长空间大，薪资竞争力强，但工作强度可能较高。

更适合这类人

适合以技能成长和前沿技术为核心动机的求职者，对WLB要求不高，追求高薪高成长。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展90

工作生活40

使命价值70

薪资福利

85较高

字节跳动大厂提供有竞争力的薪资和福利（如五险一金、年终奖），但JD未明确薪资范围，故薪酬信号为未披露。

薪资信号未披露（AI估算：25K-45K/月）

成长发展

90较高

职位涉及前沿的具身智能和大模型数据工程，技术前沿性强，但JD未明确提及晋升通道或培训。

技术前沿前沿/新兴技术

技术栈Python、Golang、Spark、Flink、Ray、Hadoop、多模态数据、大模型、VLM、VLA

业务类型ambiguous

工作生活

40较低

北京现场办公，未提及弹性工作或远程，互联网大厂通常强度较高，WLB信号不明确。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

具身智能属于高速增长赛道，社会影响力中性，JD未提使命感词汇，但技术驱动进步有间接价值。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

字节跳动

具身智能数据开发工程师-Seed

立即应聘

具身智能数据开发工程师-Seed

发布于大约 2 个月前

普通员工/个人贡献者

北京市

中级经验

全职员工

仅现场办公

学历未注明

软件工程

多模态数据

大模型

数据处理

机器人

AI 估算 · 25k–45k

大厂中级职位，北京地区AI数据工程方向，技术门槛高，薪资竞争力强，通常15个月薪资。

职位详情

关于这个职位

该职位负责搭建机器人领域的大模型数据处理平台，支持从采集到评估的全流程数据闭环

你将设计与实现高吞吐、可扩展的时序多模态数据处理引擎，并与算法团队深度配合，提升数据质量，驱动机器人能力进化

适合对AI数据工程和机器人系统有浓厚兴趣的技术人才

最低要求

对机器人系统、人工智能训练、数据平台等方向有浓厚兴趣，愿意深入理解机器人“大脑”的构建逻辑

精通Python或Golang至少一种编程语言，能够开发高效、可扩展的数据集处理工具

具备图像/视频/多模态数据处理经验，熟悉数据处理、格式转换、时间同步等处理流程

具备以下至少一种经验：自动标注、数据质检、数据合成、数据增强、数据配比、或评测集构建

工作职责

搭建机器人领域专属的大模型数据处理平台，支持从采集、清洗、标注、训练到评估的全流程数据闭环

设计与实现高吞吐、可扩展的时序多模态数据处理引擎、服务图像、视频、语音、动作等多模态数据

与算法团队深度配合,基于大模型能力，提取有价值的数据,提升数据质量,深度参与数据驱动下机器人能力的进化

模型评估体系建设，从模型训练到模型评测一站式完成,为模型性能提供可靠的数据支持

优先资格

熟悉分布式计算或大数据处理框架（如Spark、Flink、Ray、Hadoop等）者优先

有海量数据处理平台、数据调度系统、数据流/批一体框架使用或开发经验者优先

有VLM/VLA训练调优经验者优先

AI 洞察

优缺点分析

优点

字节跳动大平台，资源丰富，数据量和业务场景优质
薪资待遇具有竞争力，且团队技术氛围浓厚
技术栈要求广泛，需要同时掌握数据处理、分布式系统、多模态等多领域知识
行业仍处于早期阶段，技术路线可能快速变化，需要持续学习
适合对AI数据工程充满热情、具备较强编程和数据处理能力、愿意在快速迭代的前沿领域深耕的技术人才

缺点 / 挑战

处于AI前沿领域（具身智能），技术挑战大，成长空间广阔
工作强度较高，互联网大厂节奏快，可能需要应对紧急项目

角色解读

在数据工程领域深入发展，成为数据平台架构师或数据技术专家
横向向算法方向拓展，结合VLM/VLA经验转型为具身智能算法工程师
纵向晋升为技术Leader，带领数据团队支撑机器人业务快速发展
搭建和维护机器人领域的大模型数据处理平台，实现从数据采集到模型评估的全流程自动化
设计和优化时序多模态数据处理引擎，高效处理图像、视频、语音、动作等异构数据
与算法团队协作，基于大模型能力进行数据提取和质量提升，驱动机器人能力迭代
构建模型评估体系，提供可靠的数据支持，确保模型性能的持续优化
精通Python或Golang，能够开发高效的数据处理工具
熟悉多模态数据处理流程，包括格式转换、时间同步等
掌握自动标注、数据增强、评测集构建等至少一种数据工程经验
了解分布式计算框架（如Spark、Flink、Ray）优先，有海量数据处理平台经验更佳

申请策略

在简历中明确列出技术栈和项目规模（数据量、吞吐量等），用数据说话
了解字节Seed团队的业务方向，在面试中展示对机器人数据闭环的见解
突出多模态数据处理项目经验，尤其是图像/视频/时序数据相关
强调大数据处理框架（Spark/Flink/Ray等）的实际使用案例和性能优化成果
如有VLM/VLA或自动标注经验，务必重点展示
展现对机器人或AI系统底层数据闭环的理解，体现技术深度
补充分布式计算和大数据技术的实战能力，可通过开源项目或自建Demo
学习多模态数据格式（如HDF5、TFRecord）和时序处理方法

面试指南

STAR法则：描述情境、任务、行动、结果，突出技术选型和量化成效
对比分析：针对选型问题（如Spark vs Flink），从实时性、吞吐量、容错等维度比较
系统设计：阐述整体架构，分模块说明数据流、存储、计算和监控
请描述一个你设计过的多模态数据处理管道，包括数据格式、吞吐量、挑战和优化
如何在大规模数据下保证数据质量？请结合自动标注和质检经验说明
对Spark和Flink的流批一体处理有什么理解？在什么场景下选择哪种框架？
你对VLM/VLA的训练数据有什么看法？如何构建高质量的评测集？
模拟一个机器人传感器数据流的场景，你会如何设计数据存储和处理架构？

职位点评

综合评分

大厂前沿AI数据岗，技术成长空间大，薪资竞争力强，但工作强度可能较高。

更适合这类人

适合以技能成长和前沿技术为核心动机的求职者，对WLB要求不高，追求高薪高成长。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展90

工作生活40

使命价值70

薪资福利

85较高

字节跳动大厂提供有竞争力的薪资和福利（如五险一金、年终奖），但JD未明确薪资范围，故薪酬信号为未披露。

薪资信号未披露（AI估算：25K-45K/月）

成长发展

90较高

职位涉及前沿的具身智能和大模型数据工程，技术前沿性强，但JD未明确提及晋升通道或培训。

技术前沿前沿/新兴技术

技术栈Python、Golang、Spark、Flink、Ray、Hadoop、多模态数据、大模型、VLM、VLA

业务类型ambiguous

工作生活

40较低

北京现场办公，未提及弹性工作或远程，互联网大厂通常强度较高，WLB信号不明确。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

具身智能属于高速增长赛道，社会影响力中性，JD未提使命感词汇，但技术驱动进步有间接价值。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

具身智能数据开发工程师-Seed

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

具身智能数据开发工程师-Seed

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

腾讯游戏-高性能算子优化工程师/专家

腾讯游戏-大模型推理性能优化工程师/专家

TAB实验中台-#后台开发工程师#

腾讯游戏-大模型智能评测算法工程师

腾讯游戏-大模型强化学习框架研发工程师/专家

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

腾讯游戏-高性能算子优化工程师/专家

腾讯游戏-大模型推理性能优化工程师/专家

TAB实验中台-#后台开发工程师#

腾讯游戏-大模型智能评测算法工程师

腾讯游戏-大模型强化学习框架研发工程师/专家

字节跳动的其他在招职位

字节跳动的其他在招职位