Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
异构云服务器高级技术专家-计算
立即应聘

异构云服务器高级技术专家-计算

发布于 大约 2 小时前

普通员工/个人贡献者

西安市
高级经验
全职员工
仅现场办公
学历未注明
分布式计算
GPU
云计算
GO
CPU
CUDA
RDMA
AI性能优化
NPU
KVM

AI 估算 · 40k–60k

字节跳动高级技术专家岗位,西安薪资较北京略低,但公司竞争力强,结合技术稀缺性,月薪区间合理。

职位详情

关于这个职位

该职位负责火山引擎异构云服务器的架构设计与性能优化,聚焦AI场景下的GPU/NPU硬件适配与系统软件调优

你将深入云基础设施,解决稳定性与性能瓶颈,同时参与算力调度策略设计,提升资源利用率
适合具备5年以上公有云或GPU领域经验、精通C++/Python/Go且热爱系统调优的技术专家

最低要求

年以上公有云基础设施开发或GPU/NPU相关技术领域工作经验,熟悉云服务器业务,了解常见公有云产品功能

熟练掌握C++/Python/Go等一种或多种语言,具备优秀的软硬件系统调试能力,和良好的跨团队沟通、协调能力

工作职责

负责异构云服务器架构设计与研发工作,深入理解前沿AI业务场景需求,结合火山引擎云基础设施底座及GPU/NPU、CPU、RDMA网卡等硬件特点完成设计与研发,快速定位解决各类功能问题,并指导公有云系统软件设计与硬件选型

负责异构云服务器性能优化工作,深入理解GPU/NPU、CPU、RDMA网卡等硬件特点及Linux Kernel等系统软件架构,通过多层次的分析工具定位关键性能瓶颈,与相关团队合作优化各类软硬件系统以达成业务目标
负责公有云场景下异构云服务器的稳定性架构设计与优化,主导从底层硬件适配到上层软件栈的全链路稳定性保障方案落地,构建异构云服务器稳定性监控与预警体系,实现潜在风险的提前识别与自动化处置
参与字节跳动异构计算资源池统一调度方案的设计,构建异构算力资源画像与智能调度策略,最大化提升异构资源池利用率,支持潮汐复用模式下字节跳动内部业务与外部客户的资源分时流转,降低客户上云成本

优先资格

具备GPU/NPU/CPU相关性能分析、故障排查及监控工具的开发或使用经验

熟悉分布式计算、集合通信机制,有GPU相关软件(CUDA、驱动、编译器)及AI性能调优经验
熟悉Kubernetes及容器技术,或具备QEMU、KVM等虚拟化相关开发、调优经验

AI 洞察

优缺点分析

优点

  • 前沿技术栈:直接接触GPU/NPU、RDMA、AI性能优化等最先进技术,行业经验极具价值
  • 技术深度要求极高:需同时掌握硬件、内核、云平台等多层知识,学习曲线陡峭
  • 团队协作复杂度高:需要与硬件厂商、内核团队、AI业务等多方频繁沟通协调

缺点 / 挑战

  • 公司平台优势:字节跳动与火山引擎业务高速增长,基础设施挑战大,个人贡献能见度高
  • 复杂系统挑战:全链路优化与稳定性保障,锻炼系统思维和跨团队协作能力
  • 工作强度可能较大:云计算基础设施对稳定性和性能要求苛刻,紧急问题处理压力存在
  • 适合具备深厚系统底层功底、热爱性能调优与架构设计、乐于挑战前沿技术难题的资深工程师

角色解读

  • 技术深耕:成为异构计算领域的顶尖专家,主导下一代云服务器架构设计
  • 横向拓展:向系统软件、AI框架、数据中心网络等关联领域延伸,成为全栈型技术领袖
  • 管理方向:带领技术团队,从技术专家转型为技术管理者,负责大规模基础设施团队
  • 设计并演进异构云服务器架构,适配GPU/NPU等新型硬件,支撑AI业务高效运行
  • 深入系统底层进行性能分析与调优,使用多层级工具定位CPU、GPU、网络等瓶颈,协同团队优化软硬件
  • 主导异构云服务器的稳定性方案,构建监控与自动化处置体系,保障服务高可用
  • 参与算力资源调度策略设计,优化资源利用率,实现潮汐复用,降低客户成本
  • 深入理解GPU/NPU、CPU、RDMA等硬件原理,以及Linux内核和系统软件架构
  • 精通C++、Python、Go中至少一种语言,具备强大的系统调试和问题定位能力
  • 熟悉云服务器产品与技术,有公有云基础设施或GPU相关领域5年以上经验
  • 对分布式计算、集合通信、CUDA编程或虚拟化(QEMU/KVM)有经验者优先

申请策略

  • 了解字节跳动和火山引擎的业务方向(如大模型训练、推理服务),在面试中展现对业务场景的理解
  • 准备一个你主导过的复杂系统问题从分析到解决的完整故事,展示系统思维和解决问题的方法论
  • 重点突出公有云或GPU/NPU相关项目经验,说明你在其中承担的角色和技术贡献
  • 详细描述性能优化案例,包括问题背景、分析方法、优化效果和数据对比
  • 强调对Linux内核、虚拟化或分布式计算的理解,可附上相关代码仓库或技术博客
  • 提前复习CUDA编程、GPU架构细节,以及常见的AI训练/推理优化技术
  • 熟悉Kubernetes和容器技术,了解其与GPU结合的调度方式(如NVIDIA GPU Operator)
  • 动手搭建小型云服务器模拟环境,实践性能监控与调优工具(如perf、NVIDIA-smi等)

面试指南

  • 面对技术问题,采用STAR(情境-任务-行动-结果)框架,清晰描述背景、你的角色、具体行动和量化成果
  • 对于架构设计问题,从需求分析、方案选型、权衡利弊、验证迭代四个步骤展开,体现系统思维
  • 请描述一次你优化GPU性能的经历,用到了哪些工具和方法?
  • 如何设计一个高可用的异构云服务器稳定性监控体系?
  • 在Linux内核层面,CPU、内存、IO的性能瓶颈如何定位?举例说明
  • Kubernetes如何调度GPU资源?介绍你熟悉的相关组件和原理
  • 如何理解RDMA在云服务器中的作用?你是否有相关的故障排查经验?
  • 复习存储、网络、计算三方面的系统知识,特别是Linux内核调度、内存管理、中断处理等

匹配度报告

70
综合匹配度

字节跳动高级技术专家,前沿异构计算技术栈,薪资优厚,技术成长极快,但WLB一般。

适合人群
最适合以技术成长和前沿挑战为核心动力的资深工程师,对WLB要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活45
使命价值70

薪资福利匹配

75中等

字节跳动薪资竞争力强,高级技术专家岗位待遇优厚,但JD未明确福利细节,综合判断补偿性动机满足度较高。

薪资信号未披露(AI估算:40K-60K/月)

成长发展匹配

90较高

岗位涉及GPU/NPU、AI性能优化等前沿技术,且有丰富的系统调优和架构设计工作,发展空间极大。

技术前沿前沿/新兴技术
技术栈GPU、NPU、RDMA、CUDA、分布式计算、AI性能优化
业务类型ambiguous

工作生活匹配

45较低

工作地点西安,但未提及远程或弹性工作,且基础设施岗位可能面临较强的On-Call压力,WLB相对有限。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

岗位通过技术优化降低客户上云成本,具有一定的行业意义,但主要技术驱动,社会使命感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 增长算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 用户产品经理(同城Tab方向)-TikTok生活服务

    字节跳动 · 上海市
    AI 估算 · 15k-25k
  • 推荐算法专家-抖音推荐技术

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 服务器装备测试/Diag 工程师

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 服务器硬件研发维护专家-Data

    字节跳动 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 【快Star】光和数据通信技术工程师-AI网络方向

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】高性能网络研发工程师

    快手 · 北京市
    AI 估算 · 20k-30k
  • 【快Star】GPU混部调度研发工程师

    快手 · 北京市
    AI 估算 · 20k-32k

字节跳动 的其他在招职位

  • 增长算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 用户产品经理(同城Tab方向)-TikTok生活服务

    字节跳动 · 上海市
    AI 估算 · 15k-25k
  • 推荐算法专家-抖音推荐技术

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 服务器装备测试/Diag 工程师

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 服务器硬件研发维护专家-Data

    字节跳动 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 【快Star】光和数据通信技术工程师-AI网络方向

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】高性能网络研发工程师

    快手 · 北京市
    AI 估算 · 20k-30k
  • 【快Star】GPU混部调度研发工程师

    快手 · 北京市
    AI 估算 · 20k-32k