Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Deepseek logo
深度求索
IT 基础设施团队
立即应聘

IT 基础设施团队

发布于 大约 11 小时前

普通员工/个人贡献者

杭州市 / 北京市
中级经验
全职员工
仅现场办公
学历未注明
信息技术与基础设施
GPU
GO
网络协议
RDMA
故障排查
自动化运维
硬件压测

AI 估算 · 20k–45k

AI基础设施技术稀缺,薪资竞争力强;但公司B轮,月薪适中,综合14月。

职位详情

关于这个职位

该职位属于AI基础设施团队,负责大模型训练所需硬件与网络的全生命周期管理,包括GPU集群、高速网络、数据中心运维及员工桌面支持

你将深入硬件底层或网络前沿技术,确保系统在极限负载下稳定运行,是AI模型性能的基石
适合热爱技术深度、喜欢解决复杂问题的工程师

最低要求

扎实的技术功底,在硬件架构(CPU/GPU/存储/网络互联)或网络技术(路由协议、RDMA、数通)中至少一个方向有深入理解或强烈兴趣

熟悉 Python 或 Go,能独立开发压测、配置管理、自动化运维等工具
具备数据建模能力
强烈的好奇心与求知欲
良好的沟通协调能力,能在多团队协作、高压环境下稳定决策与执行

工作职责

硬件方向:探索业界最新硬件(GPU、CPU、SSD、网卡、服务器等),建立硬件配置管理体系,设计通用硬件基准压测框架,快速响应集群故障

网络方向:精通OSPF、BGP、VXLAN、VPN等核心数通技术,负责跨地域多数据中心互联架构,深入InfiniBand、RoCE v2等RDMA技术,建设全栈监控与可观测性体系

优先资格

有大规模GPU集群(NVIDIA/Ascend)运维或压测经验

熟悉Redfish/IPMI
有Rust开发经验
了解硬件底层规范与实现,包括ACPI、OpenBMC、BIOS/UEFI、PCIe、I2C/I3C等
有跨地域容灾与DCI项目经验
有RDMA生产环境调优经验或网络自动化平台开发经验
了解AI训练流程

AI 洞察

优缺点分析

优点

  • 接触最前沿AI硬件和网络技术,技能积累快
  • 深度求索作为AI明星公司,平台和成长空间大
  • 团队重视技术深度,适合技术狂热者
  • 工作强度大,高压环境下需快速响应故障
  • 技术门槛高,需要持续学习最新硬件和协议
  • 热爱底层技术、喜欢钻研细节、能适应高强度工作的技术极客

缺点 / 挑战

  • 工作内容富有挑战性和影响力,直接决定模型性能
  • 跨团队协作多,沟通成本较高

角色解读

  • 成为硬件或网络领域的专家,解决行业级难题
  • 向架构师或技术管理方向发展,领导基础设施团队
  • 横向拓展到AI系统优化、数据中心设计等更高层次
  • 负责GPU集群硬件选型、压测与故障处理,确保训练任务连续性
  • 设计并优化大规模网络拓扑,包括跨数据中心互联和RDMA网络
  • 开发自动化工具管理硬件配置和网络运维,提升效率
  • 支持员工桌面系统,保障办公环境稳定运行
  • 深入理解硬件架构(CPU/GPU/存储/网络)或网络协议(OSPF/BGP/RDMA)
  • 熟练掌握Python或Go,能开发运维和压测工具
  • 具备系统性思维和故障排查能力,能在高压下快速决策
  • 良好的沟通协作能力,与多团队紧密配合

申请策略

  • 在简历中清晰表达对技术细节的追求,如“从第一性原理理解”
  • 关注深度求索的技术博客和开源项目,体现对公司的了解
  • 突出GPU集群运维或网络调优的具体项目经验
  • 展示开发自动化工具的能力,如压测框架或配置管理脚本
  • 强调故障排查案例,说明分析过程和结果
  • 若有开源贡献或技术博客,突出技术热情
  • 深入学习RDMA、InfiniBand等高性能网络技术
  • 练习Python/Go编写网络自动化脚本

面试指南

  • 使用STAR法则:情境、任务、行动、结果,结构化描述经验
  • 技术问题先阐述原理,再结合实际案例,展现深度
  • 行为问题突出沟通、优先级管理和冷静决策
  • 描述一次GPU集群故障,如何定位和解决?
  • 解释OSPF和BGP的区别,以及在大规模网络中的使用场景
  • 如何设计一个硬件压测框架?考虑哪些指标?
  • 对RDMA的理解,RoCE v2和InfiniBand的优缺点?
  • 如何处理多个团队之间的冲突或紧急情况?

职位点评

65
综合评分

AI基础设施前沿技术,高成长性,但工作强度大,适合技术狂热者。

更适合这类人
最看重技术成长和行业前景,愿意为深度技术投入高强度努力的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利60
成长发展90
工作生活30
使命价值80

薪资福利

60中等

薪资未明确但市场水准,公司B轮可能福利中等,整体补偿性一般。

薪资信号未披露(AI估算:20K-45K/月)

成长发展

90较高

前沿AI基础设施技术,深度学习和实践机会多,成长路径清晰。

技术前沿前沿/新兴技术
技术栈GPU、RDMA、InfiniBand、RoCE v2、Python、Go
业务类型cost_center

工作生活

30较低

现场办公,高压环境,WLB较差,适合能接受高强度工作的人。

工作模式仅现场办公
办公地点科技园/产业园
加班情况JD含高强度暗示词

使命价值

80较高

工作直接决定AI训练效率,使命感强,行业高速增长。

行业发展高速增长赛道
社会影响中性/一般
使命信号我们不写模型,但我们决定模型能跑多快、每一层都不成为瓶颈
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

深度求索 的其他在招职位

  • Frontier(持续学习/自进化/新范式)研究员

    深度求索 · 北京市
    AI 估算 · 30k-60k
  • HR团队

    深度求索 · 杭州市
    AI 估算 · 15k-30k
  • 法务团队

    深度求索 · 杭州市
    AI 估算 · 12k-25k
  • 后训练(数据/算法)研究员

    深度求索 · 杭州市
    AI 估算 · 30k-60k
  • 情感智能数据产品经理

    深度求索 · 杭州市
    AI 估算 · 4k-8k

相似职位推荐

  • IaaS运维高级工程师

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • IaaS运维工程师岗

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • IaaS运维工程师

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • 海外交付架构师

    中国平安 · 香港
    AI 估算 · 60k-90k
  • 应用运维专家工程师

    中国平安 · 深圳市
    AI 估算 · 25k-45k

深度求索 的其他在招职位

  • Frontier(持续学习/自进化/新范式)研究员

    深度求索 · 北京市
    AI 估算 · 30k-60k
  • HR团队

    深度求索 · 杭州市
    AI 估算 · 15k-30k
  • 法务团队

    深度求索 · 杭州市
    AI 估算 · 12k-25k
  • 后训练(数据/算法)研究员

    深度求索 · 杭州市
    AI 估算 · 30k-60k
  • 情感智能数据产品经理

    深度求索 · 杭州市
    AI 估算 · 4k-8k

相似职位推荐

  • IaaS运维高级工程师

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • IaaS运维工程师岗

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • IaaS运维工程师

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • 海外交付架构师

    中国平安 · 香港
    AI 估算 · 60k-90k
  • 应用运维专家工程师

    中国平安 · 深圳市
    AI 估算 · 25k-45k