Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI计算基础设施工程师-基础技术
立即应聘

AI计算基础设施工程师-基础技术

发布于 大约 1 小时前

普通员工/个人贡献者

杭州市
高级经验
全职员工
仅现场办公
学历未注明
分布式系统
GPU
模型训练
性能优化
存储
LLM
计算基础设施
推理

AI 估算 · 25k–45k

AI基础设施技术门槛高,字节大厂薪资有竞争力,杭州生活成本合理,预估中上水平。

职位详情

关于这个职位

负责字节跳动AI计算基础设施的规划、建设与优化,涉及大规模GPU集群、Kubernetes调度、模型训练与推理性能提升

你将参与设计高性能计算、网络、存储体系,并推动算力平台化与产品化落地,是支撑AI业务规模化发展的关键角色

最低要求

具备Kubernetes集群管理、开源系统开发及性能优化经验

熟悉语言模型(LLM)及相关扩展模型的基本原理,参与过模型推理和训练基础设施的研发
熟悉Linux环境下的程序开发与性能优化,具备内核、存储、网络或GPU驱动等相关开发经验者优先

工作职责

负责AI计算基础设施的规划、建设与持续优化,面向大规模模型训练与推理场景,设计并构建与运维以GPU等加速器为核心的计算、网络、存储与调度体系

结合模型并行策略与底层硬件拓扑,持续提升系统整体性能、资源利用率及稳定性,保障关键业务负载的高效运行
参与基于Kubernetes的算力调度与资源管理平台建设,实现多租户隔离、弹性伸缩及任务级资源精细化管理
通过性能分析、故障定位与成本优化手段,在性能、可靠性与成本之间进行系统性权衡,推动AI算力能力的平台化与产品化落地,支撑业务规模化发展

优先资格

具备内核、存储、网络或GPU驱动等相关开发经验者优先

AI 洞察

优缺点分析

优点

  • 前沿技术栈:接触GPU集群、LLM、Kubernetes等最热门技术
  • 大平台资源:字节跳动海量业务场景和算力需求,快速积累经验
  • 高成长性:AI基础设施是核心赛道,职业发展空间广阔
  • 良好薪酬福利:大厂提供有竞争力的薪资和福利
  • 高强度工作:可能面临大模型训练任务带来的高压和紧急问题
  • 技术要求全面:需同时掌握系统、网络、存储、底层硬件等多领域知识
  • 快速迭代:AI技术更新快,需持续学习保持竞争力

缺点 / 挑战

  • 适合对底层基础设施有浓厚兴趣、喜欢挑战高性能优化、愿意深耕AI基础设施领域的工程师

角色解读

  • 成为AI基础设施架构专家,主导下一代计算平台设计
  • 向技术管理方向发展,带领团队负责AI基础设施整体战略
  • 横向拓展至AI平台产品化或大规模分布式系统架构
  • 设计并构建大规模GPU集群,优化计算、网络、存储和调度体系以支撑AI模型训练与推理
  • 结合模型并行策略和硬件拓扑,提升系统性能和资源利用率,保障关键业务稳定运行
  • 基于Kubernetes建设算力调度平台,实现多租户隔离、弹性伸缩和精细化资源管理
  • 通过性能分析和成本优化,在性能、可靠性与成本间平衡,推动AI算力平台化落地
  • 精通Kubernetes集群管理和开源系统开发,具备性能优化经验
  • 深入理解LLM等模型原理,有模型训练/推理基础设施研发经验
  • 熟悉Linux系统编程和性能优化,了解内核、存储、网络或GPU驱动
  • 具备分布式系统设计和故障定位能力

申请策略

  • 了解字节跳动AI基础设施团队的技术博客和开源项目,面试中展现主动性
  • 准备1-2个复杂系统调优的案例,说明量化分析和解决的问题
  • 突出Kubernetes集群管理经验,特别是大规模集群的优化和稳定性保障案例
  • 强调参与过LLM推理或训练基础设施的研发,详述具体贡献和技术难点
  • 展示Linux系统性能优化的项目,如内核调优、网络优化等
  • 如有GPU驱动或硬件相关经验,重点描述
  • 补充Kubernetes高级调度、网络插件(如Calico)等知识
  • 深入学习LLM训练框架(如DeepSpeed、Megatron)和推理优化技术

面试指南

  • STAR原则:清晰描述情境、任务、行动和结果,突出量化效果
  • 技术原理+实践:先简明解释概念,再结合实际项目说明应用和权衡
  • 问题分解:遇到复杂问题时,先拆解为多个子问题,逐步分析解决
  • 请描述你主导过的一个Kubernetes集群性能优化项目,具体做了哪些工作?
  • 如何理解LLM训练中的模型并行策略?请结合硬件拓扑说明
  • 当GPU显存不足时,如何在不影响训练效果的前提下进行优化?
  • 谈谈你对AI基础设施平台化的理解,以及如何平衡性能和成本?
  • 在Linux环境下,你如何定位和处理内存泄漏问题?

匹配度报告

70
综合匹配度

字节跳动AI基础设施岗,前沿技术栈、高成长性,但现场办公且强度未知。

适合人群
最看重技术成长和职业发展,能接受一定工作强度的工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

字节跳动提供有竞争力的薪酬和福利,但JD未明确薪资范围,属于大厂标准区间。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

90较高

该职位涉及前沿AI基础设施技术(GPU、LLM、Kubernetes),成长路径清晰,但JD未提及明确培训或晋升通道。

技术前沿前沿/新兴技术
技术栈Kubernetes、GPU、LLM、模型训练、推理、性能优化、Linux
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性工作或远程支持,且大厂AI基础设施岗位通常有一定工作强度。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施是技术驱动领域,支持业务创新,但社会影响力相对间接。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 抖音策略产品经理-内容理解

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 云服务器镜像架构师-计算

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家补贴效率运营-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 前端开发工程师-中国交易与广告

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 视觉设计Leader-TikTok(上海)

    字节跳动 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • Assistant IT Manager

    怡和洋行 · Hong Kong
    AI 估算 · 25k-45k

字节跳动 的其他在招职位

  • 抖音策略产品经理-内容理解

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 云服务器镜像架构师-计算

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家补贴效率运营-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 前端开发工程师-中国交易与广告

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 视觉设计Leader-TikTok(上海)

    字节跳动 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • Assistant IT Manager

    怡和洋行 · Hong Kong
    AI 估算 · 25k-45k