Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

MiniMax logo
稀宇科技
大模型数据链路工程师-2027届
立即应聘

大模型数据链路工程师-2027届

发布于 大约 18 小时前

普通员工/个人贡献者

北京市 / 上海市
无经验要求
全职员工
仅现场办公
本科
软件工程
分布式计算
GO
数据湖
云原生
大模型
Hudi

AI 估算 · 15k–25k

AI大模型方向薪资较高,B轮公司有竞争力,北京上海生活成本高,薪资处于市场中等偏上水平。

职位详情

关于这个职位

该职位负责大模型数据管道的设计和实现,与算法团队紧密合作,构建分布式数据处理引擎,推动数据清洗、样本生成等关键环节

你将深入使用Ray、Spark等框架,并涉及云原生技术栈,是接触前沿AI基础设施的绝佳机会

最低要求

届本科及以上,计算机科学、软件工程等相关专业

扎实的Python/Java/Scala/C++/Go等高级语言编程功底
熟悉Ray内核或者Ray相关框架应用
熟悉常见的分布式计算框架(如Spark/Flink等)
熟悉常见的数据湖框架(Delta/Iceberg/Hudi等)
有良好的团队沟通协作能力,及优秀的项目驱动能力

工作职责

与算法团队深度合作,推进数据清洗、样本生成等场景下多阶段复杂pipeline的分布式引擎设计和落地

支撑大模型数据的清洗/分类/采样等场景,持续完善Ray/Spark内核功能及性能
通过云原生技术栈搭建多云多地域的混合计算底座, 参与Ray/Spark在K8S上的弹性/潮汐资源集群稳定性/可观测性/平台化对接等能力建设

优先资格

有数据平台研发、机器学习相关背景、k8s研发经验者优先

AI 洞察

优缺点分析

优点

  • 处于AI大模型风口,技术前沿,学习资源丰富,成长速度快
  • 涉及分布式计算、云原生、数据湖等多领域,技能栈全面
  • B轮公司,团队规模适中,有机会参与核心系统设计与决策
  • 大模型数据量巨大,对系统性能和处理效率要求极高,技术难度大
  • 需要与算法团队紧密配合,沟通协调能力要求高
  • 作为应届生,需快速掌握Ray/Spark等复杂框架,学习曲线陡峭

缺点 / 挑战

  • 适合对分布式系统和大模型基础设施有浓厚兴趣,编程能力强,愿意挑战高难度技术问题的同学

角色解读

  • 从数据链路工程师成长为分布式系统专家或AI基础设施架构师
  • 可向算法方向拓展,深入理解大模型训练与数据的关系
  • 随着经验积累,可晋升为技术负责人,带领团队负责完整数据平台建设
  • 与算法团队合作,设计和实现大模型数据清洗、样本生成的多阶段分布式管道
  • 优化和扩展Ray/Spark的内核功能,提升数据处理性能和效率
  • 基于云原生技术栈(K8S)搭建跨地域的混合计算平台,保障集群稳定性和可观测性
  • 扎实的编程基础,精通Python/Java/Scala等至少一门高级语言
  • 深入理解Ray或Spark等分布式计算框架的原理和应用
  • 熟悉数据湖技术(如Delta/Iceberg/Hudi)及云原生容器编排(K8s)

申请策略

  • 面试前深入了解稀宇科技的大模型产品方向,思考数据链路如何支撑模型训练
  • 准备一个自己动手实现的分布式数据处理小项目,展示系统设计能力
  • 突出分布式计算相关项目经验,如使用Spark/Ray处理大规模数据
  • 强调编程语言掌握程度,展示GitHub或个人项目代码质量
  • 如果有K8s或数据湖相关经验,务必重点描述
  • 系统学习Ray官方文档,动手实践Ray Core和Ray AI Runtime
  • 巩固Spark SQL和结构化流处理,了解Spark on K8s部署
  • 阅读数据湖技术(如Delta Lake)的架构文档,理解其与大数据生态的结合

面试指南

  • 对比分析类问题:先分别解释两者核心特点,再对比适用场景,最后给出选择建议
  • 设计与优化类问题:从数据流、计算模型、资源管理等角度分步阐述,结合具体技术栈
  • 项目经验类问题:用STAR法则描述背景、任务、行动、结果,突出个人贡献和技术难点
  • 请简述Ray和Spark在分布式计算中的区别与各自适用场景
  • 如何设计一个高效的大规模数据清洗pipeline?
  • 解释你在项目中如何处理数据倾斜问题?
  • K8s调度资源时如何保证Spark任务的稳定性?
  • 复习分布式系统基础理论,如数据分区、容错机制、一致性等

职位点评

64
综合评分

AI大模型数据方向,技术前沿,薪资未明但成长潜力大,需较强编程和分布式基础。

更适合这类人
适合追求技术深度和前沿领域,对薪资初期要求不高,重视成长空间和技能积累的应届生。
表现最好
成长发展
相对薄弱
薪资福利
薪资福利45
成长发展88
工作生活50
使命价值75

薪资福利

45较低

JD未提及薪资和具体福利,B轮公司薪酬具有不确定性,但北京上海应届生薪资市场水平较高,综合考虑评分居中偏低。

薪资信号未披露(AI估算:15K-25K/月)

成长发展

88较高

职位涉及前沿AI基础设施和分布式计算技术,完全符合技术成长需求,且B轮公司通常技术迭代快,学习机会多。

技术前沿前沿/新兴技术
技术栈Ray、Spark、K8s、分布式计算、数据湖、大模型
业务类型profit_center

工作生活

50较低

工作地点北京上海,通常需现场办公,JD未提及弹性工作或远程,生活成本高但符合行业常态。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

75中等

大模型行业处于高速增长期,技术推动AI发展,社会影响力较大,但职位本身偏工程实现,使命感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

稀宇科技 的其他在招职位

  • IaaS 研发工程师-2027届

    稀宇科技 · 北京市
    AI 估算 · 4k-8k
  • Linux 内核开发工程师-2027届

    稀宇科技 · 北京市
    AI 估算 · 20k-35k
  • 容器网络研发工程师-2027届

    稀宇科技 · 北京市
    AI 估算 · 20k-30k
  • 高性能网络研发工程师-2027届

    稀宇科技 · 北京市
    AI 估算 · 8k-12k
  • 云原生平台开发工程师-2027届

    稀宇科技 · 北京市
    AI 估算 · 20k-30k

相似职位推荐

  • Agent Platform Engineer(MJ035816)

    携程 · 上海市
    AI 估算 · 25k-40k
  • 微信视频号-高级推荐大模型算法工程师-生态方向(北京)

    腾讯 · 广州市
    AI 估算 · 30k-60k
  • 《三角洲行动》-游戏AI开发工程师

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • J3-UE5动作游戏-UE5客户端开发工程师-战斗

    腾讯 · 深圳市
    AI 估算 · 35k-65k
  • 微信视频号直播-推荐大模型高级算法工程师-生态方向(深圳)

    腾讯 · 广州市
    AI 估算 · 35k-55k

稀宇科技 的其他在招职位

  • IaaS 研发工程师-2027届

    稀宇科技 · 北京市
    AI 估算 · 4k-8k
  • Linux 内核开发工程师-2027届

    稀宇科技 · 北京市
    AI 估算 · 20k-35k
  • 容器网络研发工程师-2027届

    稀宇科技 · 北京市
    AI 估算 · 20k-30k
  • 高性能网络研发工程师-2027届

    稀宇科技 · 北京市
    AI 估算 · 8k-12k
  • 云原生平台开发工程师-2027届

    稀宇科技 · 北京市
    AI 估算 · 20k-30k

相似职位推荐

  • Agent Platform Engineer(MJ035816)

    携程 · 上海市
    AI 估算 · 25k-40k
  • 微信视频号-高级推荐大模型算法工程师-生态方向(北京)

    腾讯 · 广州市
    AI 估算 · 30k-60k
  • 《三角洲行动》-游戏AI开发工程师

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • J3-UE5动作游戏-UE5客户端开发工程师-战斗

    腾讯 · 深圳市
    AI 估算 · 35k-65k
  • 微信视频号直播-推荐大模型高级算法工程师-生态方向(深圳)

    腾讯 · 广州市
    AI 估算 · 35k-55k