Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI Infra平台研发工程师(大模型开发机方向)-Seed
立即应聘

AI Infra平台研发工程师(大模型开发机方向)-Seed

发布于 大约 4 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
软件工程
分布式系统
GO
MLOps
云原生
GPU调度
Operator
Ai Infra
Crd

AI 估算 · 25k–55k

一线大厂核心AI团队,技术栈前沿,薪资竞争力强,月薪中位数约40K

职位详情

关于这个职位

该职位负责字节跳动Seed团队的大模型开发机平台研发,核心工作是设计开发机后端系统,管理Kubernetes资源编排与调度,建设云端开发体验(如VS Code Server、SSH等)

需要具备扎实的分布式系统架构能力,与算法、训练平台等团队协作,持续提升大模型研发效率和资源利用率
适合对云原生、AI Infra和容器技术有深入热情的工程师

最低要求

本科及以上学历,计算机、软件工程或相关专业优先

具备扎实的软件工程能力,熟悉至少一种主流后端开发语言,如Go、Java、Python、C++等
有较强的系统设计和代码实现能力
熟悉应用开发和平台开发,有复杂业务系统、基础平台、研发平台、云平台或机器学习平台建设经验
具备扎实的架构基础,理解分布式系统、高可用设计、服务治理、异步任务、缓存、消息队列、数据库设计等常见后端架构模式
熟悉容器化和Kubernetes生态,理解Pod、Deployment、StatefulSet、CRD、Operator、Scheduler、Volume、NetworkPolicy等核心机制
理解资源编排与调度相关技术,有CPU/GPU调度、队列、配额、多租户隔离、弹性伸缩、资源回收等经验者优先
具备良好的问题分析和故障排查能力,能独立定位复杂线上问题
具备良好的沟通协作能力,能够和算法、平台、SRE、基础设施团队高效配合

工作职责

负责大模型平台开发机的后端系统设计与研发,包括开发机生命周期管理、用户权限与资源隔离等能力

设计和优化基于Kubernetes的资源编排与调度体系,支持CPU/GPU、共享存储、网络、镜像等复杂资源管理场景,跟进云原生、AI Infra、GPU调度、分布式训练、AI Agent等方向的技术演进,并推动在平台中的落地
建设面向算法研发的云端开发体验,包括VS Code Server、SSH、Web IDE、任务环境复用、镜像管理、数据挂载等能力
负责平台核心架构设计与工程化建设,提升系统的稳定性、可扩展性、可观测性和运维效率,包括服务治理、监控告警、日志链路、故障诊断、灰度发布、容量规划和成本优化
与算法、训练平台、基础架构、运维等团队协作,持续提升大模型研发效率和资源利用率

优先资格

有机器学习平台、训练平台、开发机平台、AI Infra、MLOps平台建设经验

有GPU集群、异构资源调度、分布式训练、模型开发环境建设经验
熟悉Kubeflow、JupyterHub、Ray、Volcano、Kueue、Argo Workflows、KServe、MLflow等相关技术
熟悉Linux、容器运行时、网络、存储、镜像构建、远程开发协议等底层技术
有公司、云厂商、AI平台或基础架构团队经验
对研发效率、平台产品体验、稳定性和成本优化有深入理解
了解AI Agent相关技术,有Agent IDE、AI Coding、自动化研发助手、数据/训练Agent等产品或平台建设经验者优先

AI 洞察

优缺点分析

优点

  • 身处字节跳动核心AI团队,接触业界最前沿的大模型技术和海量计算资源
  • 技术栈新且深入(K8s、GPU调度、云原生),个人技术成长空间大
  • 大厂平台,薪资福利有竞争力,且有机会参与开源项目或发表技术成果
  • 技术跨度大,需要同时掌握后端、容器、调度、分布式等多领域知识,学习曲线陡峭

缺点 / 挑战

  • 工作强度可能较高,涉及线上问题排查和紧急响应,需较强的抗压能力
  • 跨团队协作频繁,对沟通和推动能力有较高要求
  • 适合热爱底层基础设施、对容器化和资源调度有浓厚兴趣,愿意在高挑战性环境中快速成长的工程师

角色解读

  • 纵向深耕AI Infra领域,成为Kubernetes调度、GPU资源管理方面的专家架构师
  • 横向拓展至大模型训练平台或基础架构团队,负责更大规模的分布式训练系统
  • 随着经验积累,可向技术Leader或架构师方向发展,带领团队进行平台演进
  • 设计和开发大模型开发机的后端系统,管理开发机生命周期、用户权限和资源隔离
  • 基于Kubernetes构建资源编排与调度体系,优化CPU/GPU、存储、网络等资源的调度效率
  • 建设面向算法研发的云端开发体验,包括VS Code Server、SSH、Web IDE等工具集成
  • 负责平台架构设计,提升系统稳定性、可扩展性和可观测性,并与算法、训练平台等团队协作
  • 精通至少一种后端开发语言(Go、Java、Python、C++),具备扎实的软件工程和系统设计能力
  • 深入理解Kubernetes生态,熟悉Pod、Deployment、CRD、Operator等核心机制及资源调度
  • 熟悉分布式系统、高可用设计、服务治理、缓存、消息队列等后端架构模式
  • 有复杂业务系统或平台开发经验,理解MLOps、AI Infra或云平台建设

申请策略

  • 关注字节跳动Seed团队的技术博客和开源项目,了解团队技术方向,在面试中展现热情
  • 准备一个你主导或深度参与的复杂系统设计案例,用STAR法则清晰描述
  • 突出Kubernetes相关项目经验,如自定义Controller、调度器或资源管理系统的开发
  • 强调后端系统设计能力,展示你在分布式、高可用架构方面的实践经验
  • 列出与AI Infra或机器学习平台相关的经历,包括GPU调度、训练平台等
  • 体现问题排查和性能优化案例,如线上故障定位、成本优化等
  • 深入Kubernetes源码,理解Scheduler、Controller Manager等组件的工作原理
  • 学习Kubeflow、Ray、Volcano等AI平台技术栈,了解主流MLOps工具

面试指南

  • 对于设计类问题,先明确需求与约束,再给出分层或模块化的架构方案,并权衡利弊
  • 对于技术细节问题,从原理出发,结合实际经验,用具体案例佐证
  • 对于故障排查问题,强调系统性思维:从现象到根因,列出排查步骤和工具
  • 请描述Kubernetes中Pod调度到节点的完整流程,以及如何自定义调度器?
  • 如何设计一个支持多租户GPU隔离的资源管理系统?
  • 你在之前的项目中如何保障高可用和稳定性,请举例说明
  • 讲讲你对CRD和Operator的理解,并举例如何用Operator管理自定义资源
  • 在分布式系统中,如何做容量规划和成本优化?

匹配度报告

76
综合匹配度

字节核心AI团队,前沿技术栈高成长,薪资优但工作强度较大

适合人群
适合追求技术深度和前沿领域、愿意接受高强度工作以换取快速成长的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值80

薪资福利匹配

85较高

字节跳动薪资水平行业领先,福利完善,但JD未明确薪资范围,综合评估补偿性动机满足度高。

薪资信号未披露(AI估算:25K-55K/月)

成长发展匹配

90较高

岗位涉及前沿AI Infra技术,K8s、GPU调度、云原生等,技术成长空间极大,发展性动机满足度很高。

技术前沿前沿/新兴技术
技术栈Kubernetes、GPU调度、分布式训练、云原生、CRD、Operator
业务类型profit_center

工作生活匹配

50较低

办公地点仅在上海现场办公,未提及弹性工作或WLB政策,大厂研发岗位通常有一定强度,生活化动机满足一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

AI行业处于高速增长期,字节Seed团队致力于通用智能研究,社会影响力中性,但技术创新性强,意义感较足。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 国际化电商广告运营-消费电子Global Business Solutions

    字节跳动 · 上海市
    AI 估算 · 18k-28k
  • CV/NLP/多模态算法工程师-国际化电商

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • BSP测试开发工程师-豆包手机助手

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • AI Agent算法专家-国际化电商

    字节跳动 · 杭州市
    AI 估算 · 50k-80k
  • 商业化产品(线索行业投放策略方向)-国际化

    字节跳动 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • 【27届实习】Product Engineer 产品工程师 - 跨境电商&支付

    小红书 · 北京市
    AI 估算 · 5k-8k
  • 【27届实习】Product Engineer-产品工程师(AI与全栈方向)-TnS

    小红书 · 北京市
    AI 估算 · 5k-8k
  • 【27届实习】Product Engineer-产品工程师(AI与全栈方向)-Dots

    小红书 · 北京市
    AI 估算 · 5k-10k
  • 【27届实习】Product Engineer-产品工程师(AI与全栈方向)-多媒体技术

    小红书 · 北京市
    AI 估算 · 5k-8k
  • 【27届实习】Product Engineer 产品工程师- 商业平台技术

    小红书 · 北京市
    AI 估算 · 5k-7k

字节跳动 的其他在招职位

  • 国际化电商广告运营-消费电子Global Business Solutions

    字节跳动 · 上海市
    AI 估算 · 18k-28k
  • CV/NLP/多模态算法工程师-国际化电商

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • BSP测试开发工程师-豆包手机助手

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • AI Agent算法专家-国际化电商

    字节跳动 · 杭州市
    AI 估算 · 50k-80k
  • 商业化产品(线索行业投放策略方向)-国际化

    字节跳动 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • 【27届实习】Product Engineer 产品工程师 - 跨境电商&支付

    小红书 · 北京市
    AI 估算 · 5k-8k
  • 【27届实习】Product Engineer-产品工程师(AI与全栈方向)-TnS

    小红书 · 北京市
    AI 估算 · 5k-8k
  • 【27届实习】Product Engineer-产品工程师(AI与全栈方向)-Dots

    小红书 · 北京市
    AI 估算 · 5k-10k
  • 【27届实习】Product Engineer-产品工程师(AI与全栈方向)-多媒体技术

    小红书 · 北京市
    AI 估算 · 5k-8k
  • 【27届实习】Product Engineer 产品工程师- 商业平台技术

    小红书 · 北京市
    AI 估算 · 5k-7k