Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI计算基础设施工程师-基础技术
立即应聘

AI计算基础设施工程师-基础技术

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
分布式系统
GPU
性能优化
LLM
AI基础设施
算力调度

AI 估算 · 30k–60k

字节跳动为一线互联网大厂,AI基础设施岗位技术门槛高,薪资处于市场高位,考虑15薪。

职位详情

关于这个职位

作为AI计算基础设施工程师,你将负责字节跳动大规模AI训练与推理场景的核心基础设施设计与优化

工作涉及GPU集群、高性能网络与存储系统,以及基于Kubernetes的算力调度平台建设,是支撑公司AI业务规模化发展的关键技术角色

最低要求

具备Kubernetes集群管理、开源系统开发及性能优化经验

熟悉语言模型(LLM)及相关扩展模型的基本原理,参与过模型推理和训练基础设施的研发
熟悉Linux环境下的程序开发与性能优化,具备内核、存储、网络或GPU驱动等相关开发经验者优先

工作职责

负责AI计算基础设施的规划、建设与持续优化,面向大规模模型训练与推理场景,设计并构建与运维以GPU等加速器为核心的计算、网络、存储与调度体系

结合模型并行策略与底层硬件拓扑,持续提升系统整体性能、资源利用率及稳定性,保障关键业务负载的高效运行
参与基于Kubernetes的算力调度与资源管理平台建设,实现多租户隔离、弹性伸缩及任务级资源精细化管理
通过性能分析、故障定位与成本优化手段,在性能、可靠性与成本之间进行系统性权衡,推动AI算力能力的平台化与产品化落地,支撑业务规模化发展

AI 洞察

优缺点分析

优点

  • 接触前沿的GPU集群、分布式训练技术,技能积累快,行业认可度高
  • 公司平台大,资源充足,有丰富的内部工具和专家支持,学习成长空间广阔
  • 技术栈更新快,需要持续学习最新硬件和软件架构,保持竞争力
  • 适合对AI基础设施底层技术有强烈热情、具备较强工程能力和系统优化思维的资深工程师

缺点 / 挑战

  • 字节跳动AI业务高速发展,岗位参与核心基础设施,技术挑战大、影响力强
  • 工作强度可能较高,大规模集群运维和性能调优需要投入大量精力
  • 多团队协作复杂,需要与算法、产品等部门紧密配合,沟通成本较高

角色解读

  • 可向AI基础设施架构师或技术专家方向发展,成为大规模分布式系统的领军人物
  • 有机会深入GPU硬件和底层优化,成为高性能计算领域专家
  • 积累丰富的大规模运维经验后,可转向技术管理或AI平台产品化方向
  • 设计和构建大规模GPU集群的计算、网络和存储架构,支撑语言模型训练与推理
  • 优化系统性能、资源利用率和稳定性,通过并行策略与硬件拓扑匹配提升效率
  • 参与Kubernetes算力调度平台开发,实现多租户隔离与弹性伸缩
  • 进行性能分析与故障定位,在成本、性能和可靠性之间做权衡
  • 精通Kubernetes集群管理与开源系统开发,具备大规模集群运维经验
  • 深入理解大型语言模型(LLM)原理及相关分布式训练框架
  • 熟悉Linux系统编程、性能优化,了解内核、存储、网络或GPU驱动
  • 具备系统性思维,能进行成本-性能-可靠性的综合权衡

申请策略

  • 准备一个完整的大规模集群性能问题排查或优化案例,展示系统性解决问题的思路
  • 了解字节跳动AI基础设施的技术栈和开源项目(如ByteDance相关),在面试中体现关注度
  • 突出Kubernetes大规模集群管理或性能优化的项目经验,最好有具体数据和成果
  • 强调对LLM及相关分布式训练框架(如DeepSpeed、Megatron)的实际使用或优化经历
  • 展示Linux内核或GPU驱动开发经验,或相关性能调优案例
  • 如有开源贡献或技术博客,务必列出以体现技术深度
  • 深入研究Kubernetes调度器源码,理解GPU调度和拓扑感知策略
  • 学习NVIDIA GPU架构(如Hopper、Blackwell)及CUDA编程,提升底层优化能力

面试指南

  • 案例驱动:用STAR方法(情境-任务-行动-结果)结构化描述项目经验
  • 原理优先:先解释相关技术原理,再结合实践说明具体做法和效果
  • 权衡思维:强调在性能、成本和可靠性之间的权衡决策,体现系统观
  • 请描述一次你优化Kubernetes集群资源利用率的经历,遇到哪些挑战?
  • 在大规模语言模型训练中,如何选择合适的并行策略和数据布局?
  • GPU集群中常见的性能瓶颈有哪些?如何定位和解决?
  • 设计一个支持多租户的AI算力调度系统,需要考虑哪些关键技术点?
  • 解释一下GPU Direct和NCCL的工作原理,以及它们在分布式训练中的作用

匹配度报告

68
综合匹配度

字节跳动AI基础设施岗,前沿技术栈、薪资竞争力强,但工作强度高、WLB一般。

适合人群
最适合重视技术成长和前沿挑战的求职者,对薪资和WLB要求适中。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值60

薪资福利匹配

80较高

字节跳动为上市巨头,薪资竞争力强,福利完善,但JD未明确薪资范围,福利项未提及。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

该岗位涉及前沿AI基础设施技术(GPU集群、LLM、Kubernetes),技术成长空间大,但JD未明确提及晋升通道或培训。

技术前沿前沿/新兴技术
技术栈Kubernetes、GPU、LLM、分布式训练、性能优化
业务类型profit_center

工作生活匹配

40较低

工作地点北京,未提及弹性办公,互联网大厂基础设施岗位通常加班较多,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

AI基础设施岗位支持公司核心业务,技术影响力大,但社会直接影响不明显。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 大模型算法工程师-商品治理

    字节跳动 · 北京市
    AI 估算 · 35k-60k
  • 芯片DFT工程师(深圳)

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 大模型代码评测专家-大模型数据服务中心

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • AI客户端开发工程师(应用研究方向)-集团信息系统

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 媒介专家-媒介一组

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Sr. Assoc, Production Eng, WRB Tech

    渣打银行 · 天津市
    AI 估算 · 20k-35k
  • 网络运营管理实习生

    中国移动 · 西藏自治区-其它
    AI 估算 · 2k-4k
  • 无人机-云服务运维工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • 大数据计算架构师

    京东 · 北京市
    AI 估算 · 50k-70k
  • AI平台架构师

    京东 · 北京市
    AI 估算 · 35k-65k

字节跳动 的其他在招职位

  • 大模型算法工程师-商品治理

    字节跳动 · 北京市
    AI 估算 · 35k-60k
  • 芯片DFT工程师(深圳)

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 大模型代码评测专家-大模型数据服务中心

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • AI客户端开发工程师(应用研究方向)-集团信息系统

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 媒介专家-媒介一组

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Sr. Assoc, Production Eng, WRB Tech

    渣打银行 · 天津市
    AI 估算 · 20k-35k
  • 网络运营管理实习生

    中国移动 · 西藏自治区-其它
    AI 估算 · 2k-4k
  • 无人机-云服务运维工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • 大数据计算架构师

    京东 · 北京市
    AI 估算 · 50k-70k
  • AI平台架构师

    京东 · 北京市
    AI 估算 · 35k-65k