大模型存储工程师/专家

🤖 AI 估测:¥35K-65K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型训练与推理场景的存储工程师/专家岗位
你将负责设计和开发存储组件,构建面向海量数据的分级缓存系统,并优化数据访问接口,以支持快手7亿用户产生的百PB级高价值数据资产
核心目标是保障数据稳固,并应对AGI时代带来的技术挑战

工作职责

负责存储相关组件的设计与开发,服务于大模型训练及推理场景,包括模型分发、KV Cache、并行 IO 优化等,提高核心性能指标
负责设计和实现面向海量数据的分布式缓存,综合利用本地内存、本地 SSD 以及远端存储系统(对象存储/HDFS)等进行数据的存储和迁移管理,实现「近计算端缓存+远端大容量存储」的一体化分级系统
负责设计和实现高效、易用的数据访问接口,实现和推理框架、引擎的无缝对接
负责存储与缓存的接入、管理、运维、监控,确保稳定性

最低要求

本科及以上学历,计算机相关专业,存储领域 3 年以上工作经验
熟练掌握 Java/Go 至少一种,具备优秀的编码能力,对工程质量有很高的自我要求
熟悉 Fuse 用户态文件系统、分布式缓存系统(如 Alluxio/JuiceFS/GooseFS/JindoFS)等
有强烈的责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象与拆分

👍优先资格

具有以下条件者优先:
熟悉主流的机器学习框架/推理引擎(如 vLLM/PyTorch)
有大模型推理相关的技术落地经验(如 KVCache 相关优化)