Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI计算基础设施工程师-基础技术
立即应聘

AI计算基础设施工程师-基础技术

发布于 大约 21 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
学历未注明
网络
GPU
模型训练
性能优化
存储
LLM
AI基础设施
模型推理

AI 估算 · 30k–60k

AI基础设施人才稀缺,大厂高薪,中级岗位月薪3-6万合理,15薪体现互联网行业竞争力。

职位详情

关于这个职位

该职位负责构建和优化AI计算基础设施,包括GPU集群、网络和存储系统,支持大规模模型训练与推理

你将使用Kubernetes进行资源调度,提升系统性能和稳定性,并参与底层性能优化
适合有基础设施背景且热爱AI技术的工程师

最低要求

具备Kubernetes集群管理、开源系统开发及性能优化经验

熟悉语言模型(LLM)及相关扩展模型的基本原理,参与过模型推理和训练基础设施的研发
熟悉Linux环境下的程序开发与性能优化,具备内核、存储、网络或GPU驱动等相关开发经验者优先

工作职责

负责AI计算基础设施的规划、建设与持续优化,面向大规模模型训练与推理场景,设计并构建与运维以GPU等加速器为核心的计算、网络、存储与调度体系

结合模型并行策略与底层硬件拓扑,持续提升系统整体性能、资源利用率及稳定性,保障关键业务负载的高效运行
基于Kubernetes的算力调度与资源管理平台建设,实现多租户隔离、弹性伸缩及任务级资源精细化管理
通过性能分析、故障定位与成本优化手段,在性能、可靠性与成本之间进行系统性权衡,推动AI算力能力的平台化与产品化落地,支撑业务规模化发展

AI 洞察

优缺点分析

优点

  • 处于AI前沿赛道,技术含量高,能积累稀缺的GPU集群和大模型部署经验
  • 字节跳动平台资源丰富,有机会参与大规模实际业务,技术影响力大
  • 薪资待遇竞争力强,且公司技术氛围浓厚,促进快速成长
  • 技术复杂度高,需要同时理解硬件、系统软件和AI模型,学习曲线陡峭
  • 行业内竞争激烈,需要持续跟进最新技术(如新型GPU、分布式框架)

缺点 / 挑战

  • 业务压力大,需保障大规模集群稳定运行,可能出现紧急故障处理
  • 适合有系统基础设施背景、对AI技术充满热情、能承受高强度研发挑战的工程师

角色解读

  • 横向扩展:向AI基础设施架构师或系统架构专家发展,设计更大规模集群
  • 纵向深入:深耕底层技术(如GPU虚拟化、网络优化),成为领域权威
  • 管理路线:带领基础设施团队,负责技术决策和团队管理
  • 设计并建设以GPU为核心的AI计算集群,涵盖计算、网络、存储和调度系统
  • 与算法团队合作,通过硬件拓扑优化和并行策略提升模型训练/推理性能
  • 基于Kubernetes开发资源管理平台,实现多租户隔离、弹性伸缩和任务调度
  • 进行性能分析、故障定位和成本优化,平衡性能、可靠性与成本
  • 精通Kubernetes集群管理,具备开源系统开发和性能优化经验
  • 熟悉LLM等大模型原理,参与过训练或推理基础设施研发
  • 扎实的Linux系统编程能力,了解内核、存储、网络或GPU驱动

申请策略

  • 提前了解字节跳动在AI基础设施方面的公开技术(如ByteDance AI Systems),面试中展现匹配度
  • 准备一个系统设计案例,例如如何设计一个支持万卡GPU集群的调度系统
  • 突出你管理Kubernetes集群的实际项目,包括规模、性能优化成果
  • 展示参与过的大模型训练或推理项目,说明你的具体贡献(如加速比、资源利用率)
  • 强调Linux系统调优、网络或存储方面的底层开发经验,最好有性能分析数据
  • 深入学习LLM推理框架(如vLLM、TensorRT-LLM)和训练框架(如DeepSpeed、Megatron)
  • 补充GPU驱动或RDMA网络相关知识,了解主流硬件拓扑(如NVLink、InfiniBand)

面试指南

  • 使用STAR法则:情境(Situation)、任务(Task)、行动(Action)、结果(Result),清晰描述项目背景和你的贡献
  • 对于系统设计题,从需求分析出发,考虑功能性(调度、隔离)和非功能性(性能、可靠性),给出层次化方案
  • 如何设计一个支持万卡GPU集群的Kubernetes调度系统?
  • 大模型训练中常见的性能瓶颈有哪些?如何优化?
  • 请描述一次你排查和解决生产环境GPU集群故障的经历
  • 你如何评估和选择不同的网络架构(如IB vs RoCE)来支持分布式训练?
  • 复习Kubernetes调度器扩展机制、GPU拓扑感知调度、NVLink等知识
  • 准备1-2个完整的性能优化案例,包括问题定位、优化方法和效果数据

匹配度报告

79
综合匹配度

大厂AI基础设施前沿技术岗,薪资高、技术成长快,但WLB一般。

适合人群
适合高度看重技术成长和薪资回报、能接受一定工作压力的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活60
使命价值80

薪资福利匹配

85较高

薪资未在JD中明确,但基于大厂和职位稀缺性,预计薪酬较高,福利完善(如五险一金、补充医疗等,但JD未提及,故不写入)。整体补偿性较强。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

JD涉及AI基础设施前沿技术(GPU、LLM、Kubernetes),技术成长空间大,但未明确提及晋升或培训路径。发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈GPU、LLM、Kubernetes、模型训练、模型推理、性能优化、Linux
业务类型ambiguous

工作生活匹配

60中等

仅现场办公,工作地点上海,JD未提及弹性工作或WLB,互联网公司通常有加班可能,生活方式满足度一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

AI基础设施是高速增长赛道,技术创新性强,对社会有推动AI应用的价值,但JD未明确使命陈述。意义感较强。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • HRBP Leader(国际化业务)(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 大模型安全产品-豆包创作

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 大客户销售经理(医疗健康行业)-飞书

    字节跳动 · 上海市
    AI 估算 · 25k-40k
  • 国际化广告算法工程师-推荐大模型(北京/上海/杭州)

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 搜索产品运营(自动化评估方向)-TikTok

    字节跳动 · 北京市
    AI 估算 · 20k-40k

相似职位推荐

  • 动力运行维护(实习生)

    中国移动 · 中卫市
    AI 估算 · 2k-4k
  • 运维工程师岗

    京东 · 福建省
    AI 估算 · 15k-25k
  • 网络运维工程师

    京东 · 湖北省
    AI 估算 · 15k-25k
  • Assistant IT Manager

    怡和洋行 · Hong Kong
    AI 估算 · 25k-45k
  • IDC数字化交付工程师

    腾讯 · 深圳市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • HRBP Leader(国际化业务)(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 大模型安全产品-豆包创作

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 大客户销售经理(医疗健康行业)-飞书

    字节跳动 · 上海市
    AI 估算 · 25k-40k
  • 国际化广告算法工程师-推荐大模型(北京/上海/杭州)

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 搜索产品运营(自动化评估方向)-TikTok

    字节跳动 · 北京市
    AI 估算 · 20k-40k

相似职位推荐

  • 动力运行维护(实习生)

    中国移动 · 中卫市
    AI 估算 · 2k-4k
  • 运维工程师岗

    京东 · 福建省
    AI 估算 · 15k-25k
  • 网络运维工程师

    京东 · 湖北省
    AI 估算 · 15k-25k
  • Assistant IT Manager

    怡和洋行 · Hong Kong
    AI 估算 · 25k-45k
  • IDC数字化交付工程师

    腾讯 · 深圳市
    AI 估算 · 25k-40k