Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Alibaba logo
阿里巴巴
大规模多地域数据存储和异构计算系统研究-阿里星
立即应聘

大规模多地域数据存储和异构计算系统研究-阿里星

发布于 大约 2 小时前

普通员工/个人贡献者

北京市 / 杭州市
初级经验
全职员工
仅现场办公
学历未注明
信息技术与基础设施
GO
数据压缩
文件系统
RDMA
分布式存储
对象存储
Kv存储
Arrow
Checkpoint

AI 估算 · 20k–35k

阿里星面向顶尖应届生,薪资具有竞争力,结合杭州/北京水平与岗位技术难度,月薪预计在2-3.5万,发放月数16个月。

职位详情

关于这个职位

该职位是阿里巴巴阿里星项目下的核心研究岗位,专注于面向大模型训练的多地域AI存储架构、高效模型存储格式、多模态样本存储与索引系统以及异构计算引擎的研发

你将参与构建支撑大规模分布式训练的数据底座,解决数据吞吐、成本与稳定性挑战,是AI基础设施的关键技术岗位

最低要求

工程与系统基础:计算机相关专业背景,具备优秀的工程实现能力,精通 C/C++、Go 或 Python

具备扎实的数据结构、操作系统、分布式系统与存储系统基础,熟悉性能分析与故障定位方法
大规模存储系统经验:有分布式文件系统、对象存储、KV 存储、湖仓系统或缓存系统研发经验,理解数据分片、副本、纠删码、一致性协议、元数据管理、冷热分层、跨地域复制等核心机制
AI 数据与训练场景理解:熟悉大模型训练数据链路,包括样本构建、数据加载、Checkpoint、模型权重管理、数据版本管理等
有 LLM、多模态训练平台或大规模数据管道经验者优先
高性能数据处理经验:熟悉高吞吐 I/O、零拷贝、异步流水线、并行计算、数据压缩、编解码、索引优化等技术
有 GPU Direct Storage、RDMA、高性能网络或异构计算优化经验者优先
数据格式与计算引擎经验:熟悉 Parquet、Arrow、ORC、WebDataset、TFRecord、HDF5 等数据格式,或 Spark、Ray、Flink、Dask 等分布式计算框架
有自研样本格式、索引系统或多模态数据处理引擎经验者优先

工作职责

大规模多地域 AI 存储架构:负责面向大模型训练与多模态数据处理的多地域数据存储系统设计与演进,支撑跨地域 GPU 集群下模型、样本、特征与中间结果的高效存储、访问与迁移,解决大规模训练中的数据吞吐、成本与稳定性挑战

新一代模型存储格式研究:研究面向大模型的高效存储格式,包括浮点数压缩、权重分片、增量存储、Checkpoint 压缩与快速恢复等技术,降低模型存储成本与跨地域传输开销,提升模型存储、分发与恢复效率
多模态样本存储与索引系统:设计融合结构化与非结构化数据的多模态样本存储格式,覆盖文本、图像、音频、视频等数据类型,构建高性能索引、元数据管理与数据版本体系,提升大规模训练数据的检索、加载与治理效率
样本计算与异构计算引擎:研发高效弹性的多模态样本计算系统,支持数据清洗、解码、增强、过滤、特征抽取等计算流程,结合 CPU / GPU / 异构加速资源进行调度与性能优化,提升样本计算整体效率与资源利用率
AI 训练数据底座落地支撑:作为 AI 基础设施核心模块,支撑大模型训练与应用落地,解决训练过程中的数据规模化、跨地域一致性、吞吐抖动、成本控制与系统稳定性问题,保障模型从数据准备到训练应用的顺畅衔接

优先资格

对 AI Infra、存储系统与大规模数据处理有强烈兴趣,具备系统性思考能力和端到端优化意识,乐于深入底层、解决复杂工程问题,不惧挑战

AI 洞察

优缺点分析

优点

  • 深度参与AI基础设施前沿技术,接触大规模分布式系统和异构计算,技术积累含金量高
  • 阿里巴巴平台资源丰富,阿里星项目提供优质的培养机会和职业起点
  • 团队技术氛围浓厚,解决的是大模型训练中的核心痛点,工作成就感强
  • 技术栈深、复杂度高,要求同时掌握存储、AI数据链路和异构计算,学习曲线陡峭
  • 工作强度可能较大,需要处理大规模系统的稳定性问题和突发故障

缺点 / 挑战

  • 作为校招岗位,对工程经验和系统设计能力要求较高,需要快速成长
  • 适合对AI基础设施和分布式系统有强烈兴趣,具备扎实编程和系统基础,乐于挑战底层优化难题的顶尖应届生

角色解读

  • 从AI基础设施存储系统工程师起步,逐步成为分布式存储架构师或AI Infra技术专家
  • 可横向扩展到AI训练平台、异构计算或数据中间件领域,参与更大规模系统设计
  • 在阿里星体系下,获得快速晋升通道和资源倾斜,有机会领导核心模块的演进
  • 设计并实现支撑大模型训练的多地域分布式存储系统,解决跨集群数据高效访问和迁移问题
  • 研究新一代模型存储格式,优化浮点数压缩、增量存储和Checkpoint快速恢复,降低存储和传输成本
  • 构建多模态样本存储与高性能索引系统,支持文本、图像、音频等数据类型的快速检索和版本管理
  • 研发样本计算与异构计算引擎,结合CPU/GPU/加速器进行数据清洗、解码、增强等流程的调度与性能优化
  • 精通C/C++、Go或Python,具备扎实的系统编程和性能调优能力
  • 深入理解分布式系统原理,包括数据分片、一致性协议、元数据管理和冷热分层等机制
  • 熟悉大模型训练数据链路,如样本构建、数据加载、Checkpoint管理等
  • 掌握高吞吐I/O、零拷贝、异步流水线、数据压缩和索引优化技术,有RDMA或GPU Direct Storage经验更佳

申请策略

  • 在面试中表现出对AI基础设施端到端优化的系统性思考,例如从存储到计算的全链路瓶颈分析
  • 了解阿里巴巴在AI Infra上的布局(如PAI、盘古存储),结合自身经验提出改进想法
  • 突出分布式存储或高性能计算相关的项目经验,尤其是涉及数据分片、一致性协议或性能调优的部分
  • 强调熟悉大模型数据链路,如参与过数据加载、Checkpoint优化或MoE训练系统
  • 展示对底层技术的掌握,如RDMA、GPU Direct Storage、零拷贝等技术应用
  • 如果有开源贡献或技术博客,突出在存储或AI Infra领域的影响力
  • 提前深入学习Alluxio、Ceph、MinIO等开源分布式存储系统源码
  • 动手实践大模型训练中的数据加载和Checkpoint流程,理解实际挑战

面试指南

  • 对于系统设计题,先明确核心需求和约束(如跨地域延迟、数据量级),再给出分层架构,并讨论一致性模型(如最终一致)、数据流和容错机制
  • 对于优化类问题,从profiling入手,识别瓶颈(I/O、CPU、网络),然后针对性地提出技术方案(如缓存、预取、异步、压缩)
  • 请设计一个支持多地域数据同步的分布式文件系统,你会如何考虑一致性、性能和成本?
  • 解释Checkpoint在大模型训练中的作用,如何优化其存储和恢复速度?
  • 你如何对分布式存储系统进行性能分析和瓶颈定位?请举一个实际例子
  • 描述你使用过的分布式计算框架(如Spark、Ray),遇到过哪些性能问题?如何解决?
  • 请谈谈你对数据压缩算法(如Snappy、Zstd)的理解,在存储场景下如何选型?
  • 复习分布式系统经典论文(如GFS、BigTable、Spanner),理解设计哲学和取舍

匹配度报告

74
综合匹配度

阿里星AI存储研究岗,前沿技术栈、薪资优厚,但工作强度高、WLB一般。

适合人群
最适合追求技术快速成长、对AI基础设施有强烈热情、愿意投入高强度工作的顶尖应届生。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值85

薪资福利匹配

80较高

阿里星作为阿里巴巴顶尖校招项目,薪资待遇在应届生中极具竞争力,加上大厂完善的福利体系(五险一金、补充保险等),补偿性动机满足度较高。但具体薪资未在JD中披露。

薪资信号面议 (20K-35K/月)

成长发展匹配

90较高

该职位涉及最前沿的AI基础设施技术(分布式存储、异构计算、大模型训练),技术栈新颖且深度高,阿里星项目提供内部培训和快速成长通道,发展性动机强烈满足。

技术前沿前沿/新兴技术
技术栈分布式存储、异构计算、大模型训练、RDMA、GPU Direct Storage、Checkpoint、压缩算法、多模态
业务类型profit_center

工作生活匹配

40较低

JD未明确工作模式和WLB,但阿里巴巴作为互联网大厂,高强度工作和一定程度的加班较常见,且工作地点为北京/杭州核心办公区,生活化动机满足有限。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

85较高

该职位直接支撑大模型训练与应用落地,处于AI基础设施核心位置,技术推动力强,社会影响力较大,满足对意义感和行业前景的追求。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

阿里巴巴 的其他在招职位

  • 动漫商业化IP授权

    阿里巴巴 · 上海市
    AI 估算 · 15k-25k
  • AGV电气系统设计

    阿里巴巴 · 杭州市
    AI 估算 · 4k-6k
  • 机器人运动控制嵌入式工程师

    阿里巴巴 · 杭州市
    AI 估算 · 18k-35k
  • AGV产品结构设计

    阿里巴巴 · 杭州市
    AI 估算 · 15k-25k
  • 物流科技商业分析

    阿里巴巴 · 杭州市
    AI 估算 · 4k-6k

相似职位推荐

  • 数据工程师(实习)

    小红书 · 上海市
    AI 估算 · 4k-6k
  • Web Software Developer

    法国兴业银行 · 香港特别行政区
    AI 估算 · 30k-50k
  • IT&D Business Analyst for China

    利洁时 · 上海市
    AI 估算 · 20k-35k
  • Technology & AI Transformation PMO Senior Analyst

    文华东方酒店 · Hong Kong
    AI 估算 · 27k-45k
  • Assistant IT Manager

    怡和洋行 · Hong Kong
    AI 估算 · 45k-65k

阿里巴巴 的其他在招职位

  • 动漫商业化IP授权

    阿里巴巴 · 上海市
    AI 估算 · 15k-25k
  • AGV电气系统设计

    阿里巴巴 · 杭州市
    AI 估算 · 4k-6k
  • 机器人运动控制嵌入式工程师

    阿里巴巴 · 杭州市
    AI 估算 · 18k-35k
  • AGV产品结构设计

    阿里巴巴 · 杭州市
    AI 估算 · 15k-25k
  • 物流科技商业分析

    阿里巴巴 · 杭州市
    AI 估算 · 4k-6k

相似职位推荐

  • 数据工程师(实习)

    小红书 · 上海市
    AI 估算 · 4k-6k
  • Web Software Developer

    法国兴业银行 · 香港特别行政区
    AI 估算 · 30k-50k
  • IT&D Business Analyst for China

    利洁时 · 上海市
    AI 估算 · 20k-35k
  • Technology & AI Transformation PMO Senior Analyst

    文华东方酒店 · Hong Kong
    AI 估算 · 27k-45k
  • Assistant IT Manager

    怡和洋行 · Hong Kong
    AI 估算 · 45k-65k