Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
数据处理架构师-AI Data
立即应聘

数据处理架构师-AI Data

发布于 大约 7 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
本科
研究与开发 (研发)
性能优化
CUDA
模型蒸馏
模型量化
大模型
vLLM
TensorRT-LLM

AI 估算 · 35k–65k

大模型核心岗位,技术难度高,市场稀缺,字节跳动薪资竞争力强,结合高级架构师级别估算。

职位详情

关于这个职位

作为字节跳动数据处理架构师,你将负责大模型预训练数据处理管线的性能优化,聚焦于GPU推理加速、CPU计算优化和分布式批处理,涉及内容理解、模型打标、数据清洗等关键场景

该岗位需要深入理解大模型推理和数据处理流程,通过Profiling和Benchmark持续提升吞吐、稳定性和资源利用率,并推动优化方案落地为平台能力

最低要求

本科及以上学历,计算机/人工智能/软件工程/电子工程等相关专业,具备扎实的编程基础,熟练掌握Python/C++/Go/Rust等至少一种语言

具备较强的性能分析和收益量化能力,能够用明确指标评估优化收益
理解大模型推理和数据处理任务的基本流程,熟悉模型部署与优化工具链,具备模型推理、离线批处理或高性能计算相关经验
具备良好的工程落地意识,能将优化经验沉淀为工具、文档或平台能力,能够与算法、产品、Infra等团队协同推进复杂问题解决
具备以下至少一个方向的深入经验:模型推理加速方向:熟悉GPU推理优化、CUDA/TensorRT-LLM/vLLM/SGLang等技术,能定位显存、吞吐、并发、调度、通信等性能瓶颈并完成优化
量化与蒸馏方向:熟悉量化、蒸馏、剪枝、小模型替换或模型压缩方法,能设计效果/成本Tradeoff评估方案,并推动优化方案应用到生产环境
CPU/离线计算加速方向:熟悉Spark、Ray、Flink等分布式计算框架,具备Profiling、数据倾斜治理、I/O优化、并发调优、shuffle优化和吞吐优化经验

工作职责

负责大模型预训练数据处理过程的高频算子与批处理链路的性能优化,覆盖内容理解、模型打标、数据清洗、格式转换等场景,提升数据处理任务的吞吐、稳定性和资源利用率

面向数据处理平台建设可复用的优化能力,围绕GPU推理、CPU计算、批处理并发、资源撮合、执行计划、任务调度等关键环节,推进Profiling、Benchmark、瓶颈定位和持续优化
探索并落地模型类算子的推理加速和优化方案,建立效果、成本、吞吐、稳定性的评估体系,在保证数据处理效果的前提下降低推理成本

优先资格

有大模型预训练数据处理、批量推理、离线模型推理等生产链路优化经验者优先

有推理框架/推理性能优化生产落地经验者/有量化、蒸馏、剪枝、小模型替换等模型压缩方案落地经验,并能完整说明效果、成本、吞吐和稳定性收益者优先
有复杂离线任务Profiling、性能基线建设、资源规格治理、算子平台化或大规模任务稳定性治理经验者优先

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,技术氛围浓厚,与顶级算法和工程团队合作
  • 薪资待遇优厚,股票期权等长期激励,职业成长空间大
  • 工作强度可能较大,需要应对高并发、低延迟的优化需求,涉及跨团队协作
  • 技术栈深且更新快,需持续学习GPU推理、分布式系统等新进展
  • 优化收益量化难度高,需要较强的数据分析和实验设计能力

缺点 / 挑战

  • 置身大模型最前线,处理海量数据,技术挑战性强,能快速积累前沿AI工程经验
  • 适合有扎实系统编程基础、对AI基础设施充满热情、喜欢攻克性能瓶颈的技术专家,能承受较强工作压力

角色解读

  • 成长为数据处理与AI基础设施领域的专家,主导大规模训练数据管线的架构设计
  • 可向AI系统架构师或技术负责人方向发展,负责更大范围的推理与训练优化
  • 积累深厚的GPU/分布式计算优化经验,在AI工程化领域具有广泛职业前景
  • 负责大模型预训练数据处理管线的性能优化,包括算子加速、批处理链路优化,提升吞吐和资源利用率
  • 建设可复用的优化平台能力,围绕GPU推理、CPU计算、任务调度等环节进行Profiling和Benchmark
  • 探索模型推理加速方案(量化、蒸馏等),建立效果-成本评估体系,降低推理成本
  • 扎实的编程基础,精通Python/C++/Go/Rust之一,具备性能分析和收益量化能力
  • 深入理解大模型推理和数据处理流程,熟悉GPU推理优化(CUDA, TensorRT-LLM等)或分布式计算框架(Spark, Ray)
  • 具备工程落地意识,能将优化经验沉淀为工具或平台能力,并与算法、产品、Infra团队协作

申请策略

  • 在简历和面试中展示具体的技术方案和收益量化过程,体现系统性思考
  • 了解字节跳动在AI数据平台方面的技术栈和业务方向,提前准备相关问题
  • 突出在GPU推理优化(CUDA, TensorRT-LLM等)或分布式计算(Spark, Ray)方向的实际项目经验
  • 用量化指标展示性能优化成果,如吞吐提升、延迟降低、资源节约等
  • 强调将优化经验工具化或平台化的能力,体现工程化思维
  • 如果缺乏GPU推理经验,可以先学习CUDA编程和vLLM等推理框架
  • 深入了解大模型训练数据处理流程,包括数据清洗、模型打标等环节
  • 强化性能分析工具使用,如Profiling、Benchmark方法

面试指南

  • 回答性能优化问题时,遵循“问题-分析-方案-量化收益”的结构,突出指标和对比
  • 对于技术原理问题,从基础概念开始,逐步深入,展示对底层机制的理解
  • 对于方案设计问题,先明确目标和约束,再提出多种方案并权衡,最后总结推荐
  • 请描述一个你做过的大规模数据处理性能优化案例,用了什么方法,提升了多少?
  • 解释一下GPU推理中的显存优化策略,比如vLLM的PagedAttention原理
  • 如何设计一个量化方案,在效果损失可控的前提下最大化推理吞吐?
  • 在处理数据倾斜时,你会采取哪些措施?请结合Spark或Ray说明
  • 你如何评估一次优化收益?请设计一个评估指标体系

匹配度报告

70
综合匹配度

大厂核心AI基础设施岗位,前沿技术栈,高薪资高成长,但工作强度大、WLB较差。

适合人群
最适合追求技术成长和职业发展的求职者,愿意接受高强度工作以换取前沿技术积累和丰厚回报。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活30
使命价值70

薪资福利匹配

85较高

字节跳动薪资在行业内具有竞争力,但JD未明确具体薪资和福利,故略保守;高级岗通常有股票,补偿性较高。

薪资信号未披露(AI估算:35K-65K/月)

成长发展匹配

95较高

职位聚焦大模型数据处理前沿技术,涵盖GPU加速、分布式计算、模型压缩等,技术成长空间极大,且字节跳动有丰富的AI场景。

技术前沿前沿/新兴技术
技术栈GPU推理优化、CUDA、TensorRT-LLM、vLLM、SGLang、量化、蒸馏、模型压缩、Spark、Ray、Flink
业务类型profit_center

工作生活匹配

30较低

仅现场办公,字节跳动以高强度著称,JD未提及WLB,工作压力可能较大。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型行业高速增长,该岗位直接贡献于AI基础能力,具有技术影响力,但社会价值中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家素材策略运营(自助中心)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 15k-25k
  • 女装行业运营-抖音电商(苏皖)

    字节跳动 · 上海市
    AI 估算 · 12k-20k
  • 广告算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 后端开发工程师(AI Agent)-国际化广告质量效能(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 品牌营销专家(活动方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • AI创新技术负责人

    网易 · 北京市
    AI 估算 · 50k-80k
  • 广西页岩气公司-科技创新岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k
  • 广西页岩气公司-压裂试气岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k
  • 广西页岩气公司-气藏管理岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k

字节跳动 的其他在招职位

  • 商家素材策略运营(自助中心)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 15k-25k
  • 女装行业运营-抖音电商(苏皖)

    字节跳动 · 上海市
    AI 估算 · 12k-20k
  • 广告算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 后端开发工程师(AI Agent)-国际化广告质量效能(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 品牌营销专家(活动方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • AI创新技术负责人

    网易 · 北京市
    AI 估算 · 50k-80k
  • 广西页岩气公司-科技创新岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k
  • 广西页岩气公司-压裂试气岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k
  • 广西页岩气公司-气藏管理岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k