Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

miHoYo logo
米哈游
AI数据湖研发工程师
立即应聘

AI数据湖研发工程师

发布于 大约 16 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
软件工程
分布式计算
数据湖
向量检索
Lance
全文检索

AI 估算 · 35k–55k

AI数据湖属于前沿技术岗位,米哈游薪资待遇优厚,结合市场行情及中级工程师水平,薪资处于中高水平。

职位详情

关于这个职位

作为AI数据湖研发工程师,你将负责设计和实现基于Apache Iceberg/Lance的企业级数据湖架构,开发元数据管理、全文检索、向量检索等核心模块,并构建统一的SDK以支撑AI/ML训练与推理

这个职位要求深厚的大数据和分布式系统背景,适合对数据湖技术有热情的技术专家

最低要求

本科及以上学历,计算机科学、软件工程等相关专业

熟练掌握 Java 和 Python,3年及以上相关开发经验
深入理解 Spark、Ray 等分布式计算框架,了解其在 ML 场景下的应用
掌握 Iceberg / Lance 等数据湖格式及其在不同查询引擎(Spark / Trino / Flink 等)中的读写原理,具备源码阅读与二次开发能力
熟悉全文检索(如 Lucene / Elasticsearch)或向量检索(如 ANN 算法、向量数据库)相关技术
具备良好的沟通协作能力,主动负责,有技术热情

工作职责

设计并实现基于 Apache Iceberg / Lance 的企业级 AI 数据湖架构

开发数据湖核心功能模块,包括元数据管理及优化、全文检索、向量检索、查询加速等
设计并开发数据湖 SDK,提供统一的数据访问接口,支撑上层 AI/ML 训练与推理场景

优先资格

有大规模数据湖生产环境(PB 级 / 多引擎)落地经验

有 Iceberg / Lance / Spark 等开源社区贡献经验
熟悉数据湖查询加速(如缓存、索引、物化视图)或 LakeHouse 架构实践
有 AI/ML 数据底座(特征存储、训练数据管理)相关经验

AI 洞察

优缺点分析

优点

  • 米哈游作为头部游戏公司,技术平台和资源雄厚,项目复杂度高,能积累大规模数据湖实战经验
  • AI数据湖是当前前沿技术方向,职业含金量高,未来发展前景广阔
  • 团队技术氛围浓厚,有机会接触开源社区核心技术和贡献代码
  • 技术栈深度和广度要求高,需要同时掌握分布式系统、数据湖、检索等多个领域知识
  • 纯技术岗位,晋升路径可能相对受限,需主动规划技术深度与管理能力
  • 适合对数据湖和AI基础设施有强烈技术热情,喜欢攻克复杂系统问题,并希望在大平台上快速成长的工程师

缺点 / 挑战

  • 游戏行业项目节奏较快,可能面临一定的工期压力

角色解读

  • 成为数据湖/数据基础设施领域的专家,主导公司数据架构演进
  • 向AI数据平台架构师方向发展,融合数据与AI技术栈
  • 深入开源社区(如Iceberg、Spark),成为核心贡献者,提升技术影响力
  • 设计并实现基于Apache Iceberg/Lance的企业级AI数据湖架构,确保高可用和高性能
  • 开发元数据管理、全文检索、向量检索等核心模块,优化查询加速能力
  • 设计并封装数据湖SDK,为AI/ML训练和推理提供统一的数据访问接口
  • 精通Java和Python,具备扎实的编程功底和分布式系统经验
  • 深入理解Spark、Ray等分布式计算框架,以及Iceberg/Lance等数据湖格式的原理
  • 熟悉全文检索或向量检索技术,了解Lucene、Elasticsearch或向量数据库
  • 具备源码阅读和二次开发能力,能够深入优化数据湖组件

申请策略

  • 在求职信中表达对AI数据基础设施的兴趣,并结合米哈游业务提出自己的见解
  • 关注米哈游技术博客和开源动态,了解其技术栈和团队风格,在面试中展现文化契合度
  • 突出数据湖相关项目经验,特别是基于Iceberg/Lance的实践,以及性能优化成果
  • 强调对Spark、Ray等分布式框架的深入使用和调优经验,附上具体数据(如数据量、性能提升)
  • 展示全文检索或向量检索的技术细节,说明在AI场景中的应用
  • 如有开源贡献,列出PR链接或参与社区讨论的经历,体现技术影响力
  • 深入学习Iceberg或Lance的源码,理解其核心机制,可以尝试提交小的patch
  • 动手搭建一个小型AI数据湖原型,结合Spark和向量检索,加深整体理解

面试指南

  • 针对原理类问题:先阐述核心概念和设计思想,然后结合实际场景分析优缺点,最后给出优化建议
  • 针对设计类问题:从需求分析开始,明确约束条件,给出架构方案,并讨论不同方案的权衡
  • 针对迁移/实践类问题:分阶段描述,突出风险控制和验证方法,并提及性能监控和回退策略
  • 请描述Apache Iceberg的元数据管理机制,以及如何优化Commit性能?
  • 如何设计一个支持全文检索和向量检索的混合查询引擎?
  • 在数据湖中如何保证数据一致性和ACID事务?
  • Spark与Ray在ML场景下的区别和适用场景是什么?
  • 假设你需要将PB级数据从Hive迁移到Iceberg,你会如何设计迁移方案?

匹配度报告

82
综合匹配度

米哈游AI数据湖工程师,前沿技术栈,高成长高薪资,但需现场办公且WLB信息不明确。

适合人群
该职位最适合重视技术成长和前沿探索的求职者,尤其是希望在AI数据基础设施领域深耕的人。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活70
使命价值80

薪资福利匹配

85较高

米哈游作为行业头部公司,薪资福利具有竞争力,且公司处于盈利状态,稳定性和回报预期较高。

薪资信号偏高 (35K-55K/月)

成长发展匹配

95较高

该职位涉及AI数据湖、Iceberg、向量检索等前沿技术,成长空间极大,但JD中未明确提及晋升路径或培训计划。

技术前沿前沿/新兴技术
技术栈Java、Python、Spark、Ray、Iceberg、Lance、全文检索、向量检索、分布式计算
业务类型ambiguous

工作生活匹配

70中等

上海现场办公,未提及弹性工作或远程,通勤和时间灵活性一般;但米哈游整体WLB口碑尚可,具体需进一步了解。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

80较高

AI赋能游戏开发,属于高速增长赛道,技术本身具有创新性,但游戏行业社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 招聘HR实习生

    米哈游 · 上海市
    AI 估算 · 4k-6k
  • AI 研发工程师(场景管线)

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 投放运营实习生 (素材内容方向)

    米哈游 · 上海市
    AI 估算 · 4k-6k
  • 数据测试开发工程师

    米哈游 · 上海市
    AI 估算 · 20k-35k
  • 2D动画( Live2D)-原神【第三方编制】

    米哈游 · 上海市
    AI 估算 · 10k-15k

相似职位推荐

  • 顶尖应届-大模型训练框架研发工程师-基础技术平台

    小米 · 北京市
    AI 估算 · 25k-35k
  • 顶尖应届-智能体研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-车机OS性能优化工程师(智能平台方向)-智能座舱

    小米 · 北京市
    AI 估算 · 25k-40k
  • 顶尖应届-智能体工程师-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-大模型算法工程师-软件

    小米 · 北京市
    AI 估算 · 20k-30k

米哈游 的其他在招职位

  • 招聘HR实习生

    米哈游 · 上海市
    AI 估算 · 4k-6k
  • AI 研发工程师(场景管线)

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 投放运营实习生 (素材内容方向)

    米哈游 · 上海市
    AI 估算 · 4k-6k
  • 数据测试开发工程师

    米哈游 · 上海市
    AI 估算 · 20k-35k
  • 2D动画( Live2D)-原神【第三方编制】

    米哈游 · 上海市
    AI 估算 · 10k-15k

相似职位推荐

  • 顶尖应届-大模型训练框架研发工程师-基础技术平台

    小米 · 北京市
    AI 估算 · 25k-35k
  • 顶尖应届-智能体研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-车机OS性能优化工程师(智能平台方向)-智能座舱

    小米 · 北京市
    AI 估算 · 25k-40k
  • 顶尖应届-智能体工程师-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-大模型算法工程师-软件

    小米 · 北京市
    AI 估算 · 20k-30k