Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Netease logo
网易
资深 AI 工程师(机器学习平台方向)
立即应聘

资深 AI 工程师(机器学习平台方向)

发布于 3 天前

普通员工/个人贡献者

广州市
高级经验
全职员工
仅现场办公
学历未注明
GPU
PyTorch
GO
TensorFlow
MLOps
MLflow

AI 估算 · 30k–50k

资深AI工程师,技术栈前沿,大厂平台,市场薪酬水平高,综合估算月薪3-5万。

职位详情

关于这个职位

该职位专注于企业级云原生机器学习平台建设,负责从模型开发、训练到部署的全生命周期管理

你将与算法、业务团队协作,提供标准化MLOps解决方案,并优化GPU算力集群的运营效率
适合具备K8s和MLOps实战经验,对分布式系统和GPU调度有深入理解的技术专家

最低要求

熟练掌握 K8s 大规模集群运维管理,精通容器、镜像、存储、网络,熟悉云原生 CI/CD、服务网格主流工具链

具备完整 MLOps 平台落地经验,熟悉 Kubeflow、MLflow、Ray 至少一种生态工具
熟悉 TensorFlow / PyTorch 主流框架,了解分布式训练基础原理、模型部署与推理优化常规方案
有 GPU 集群运维、算力资源调度、显存 / 算力隔离管控实战经验,懂 GPU 业务负载特性
熟练掌握 Python,了解 Go 更佳,具备良好分布式系统工程设计与问题排查能力
具备良好跨团队沟通、抗压能力,能独立负责平台模块建设

工作职责

负责企业级云原生机器学习平台建设,支撑模型开发、训练、部署、上线全生命周期管理

负责机器学习平台核心组件落地与优化,包含分布式训练调度、模型版本管理、模型服务化推理部署
负责 GPU 算力集群精细化运营,通过资源调度、弹性伸缩、异构算力管理,优化大模型训练 / 推理成本
搭建平台监控、告警、可观测体系,保障机器学习集群及业务系统高可用、高稳定
对接算法、业务团队,拆解需求并提供 MLOps 标准化平台解决方案

AI 洞察

优缺点分析

优点

  • 大厂平台,技术栈前沿(K8s、GPU、MLOps),能深入AI基础设施核心,积累稀缺经验
  • 薪资有竞争力,网易福利体系完善,职业发展通道清晰
  • 参与企业级平台建设,工作成果直接影响公司AI业务效率,成就感强
  • 技术要求全面且深入,需同时掌握分布式系统、云原生、AI框架等多领域知识,学习曲线陡峭
  • 平台建设需对接多团队,沟通协调和抗压能力要求高,可能面临频繁的需求变更和紧急故障处理

缺点 / 挑战

  • GPU集群运营压力大,需保障高可用和高性能,故障排查复杂,可能需要on-call
  • 适合具备扎实云原生和AI基础设施背景,喜欢挑战复杂系统问题,乐于在技术深度上持续精进,并愿意承担一定跨团队协作压力的资深工程师

角色解读

  • 技术纵深发展:成为机器学习基础设施专家,主导大规模分布式训练架构设计
  • 横向拓展:转向AI平台产品经理或技术负责人,管理平台团队
  • 行业跨界:积累MLOps经验后可向AI中台、云计算平台等方向转型,职业前景广阔
  • 负责搭建和优化云原生机器学习平台,实现模型开发、训练、部署、监控的全流程自动化
  • 管理大规模GPU集群,通过资源调度和弹性伸缩降低算力成本,提升训练推理效率
  • 与算法和业务团队紧密协作,提供MLOps标准化解决方案,推动平台能力落地
  • 精通K8s集群运维、容器化、网络存储,熟悉云原生CI/CD工具链
  • 有MLOps平台实战经验,熟悉Kubeflow、MLflow或Ray等工具
  • 掌握TensorFlow/PyTorch,理解分布式训练和模型推理优化
  • 具备GPU集群运维和资源隔离管控经验,熟悉Python,了解Go更佳

申请策略

  • 简历中展示对MLOps全链路理解,包括CI/CD、模型版本管理、监控告警体系
  • 面试前了解网易AI业务方向(如游戏、电商、云服务),思考平台如何支撑业务场景
  • 突出K8s大规模集群管理经验,列举具体集群规模、优化成果(如资源利用率提升、成本降低)
  • 描述MLOps平台建设或参与项目,详细说明使用Kubeflow/MLflow/Ray的具体场景和贡献
  • 强调GPU算力调度优化案例,包括具体技术方案(如弹性伸缩、显存隔离)和量化效果
  • 如果对Go语言不够熟悉,建议快速学习基础语法,并练习微服务或系统组件实现
  • 关注MLOps领域最新工具(如KubeRay、Triton Inference Server),通过文档或开源项目补强

面试指南

  • 用STAR法则:情境(Situation)、任务(Task)、行动(Action)、结果(Result),结合具体项目数据
  • 技术问题先分析本质,再分步骤阐述方案,强调权衡(如成本vs性能、灵活vs稳定)
  • 沟通协作问题展示同理心和优先级管理能力,结合Case说明如何推动共识
  • 请描述你参与过的MLOps平台架构,以及如何实现分布式训练的自动化调度?
  • 如何处理K8s集群中GPU资源碎片化问题?你用过哪些显存隔离技术?
  • 在优化大模型推理成本方面,你有哪些经验和方案?
  • 你如何设计监控告警体系来保障ML平台的高可用?请举例
  • 当你与算法团队在资源需求上有冲突时,如何协调解决?

匹配度报告

69
综合匹配度

网易大厂,前沿MLOps与GPU基础设施,薪资可观,技术成长空间大,但WLB一般。

适合人群
适合以技术成长为首要目标,能接受一定加班和现场办公的资深技术人才。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利82
成长发展90
工作生活45
使命价值60

薪资福利匹配

82较高

网易作为上市公司,薪资福利在行业中有竞争力,平台稳定。但JD未透露具体薪资和福利细节,薪酬信号不明确。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

该职位涉及前沿的MLOps和云原生技术栈,能深入AI基础设施核心,技能成长空间大。JD提及需独立负责平台模块,有较强学习和挑战机会。

技术前沿前沿/新兴技术
技术栈Kubernetes、Kubeflow、MLflow、Ray、TensorFlow、PyTorch、GPU、MLOps、分布式训练、推理优化
业务类型cost_center

工作生活匹配

45较低

JD未提及远程办公或弹性工作,地点为广州固定办公,且可能涉及on-call。行业特性下WLB一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

60中等

AI基础设施平台对于推动公司AI落地有直接贡献,但JD未强调社会使命感或行业变革,属于技术中后台角色。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

网易 的其他在招职位

  • 高级/资深Android开发工程师(多终端业务)

    网易 · 杭州市
    AI 估算 · 25k-35k
  • 财经公关经理

    网易 · 北京市
    AI 估算 · 25k-40k
  • 版权监控实习生(网易云音乐)

    网易 · 杭州市
    AI 估算 · 4k-6k
  • UE客户端开发(巅峰极速)

    网易 · 广州市
    AI 估算 · 25k-40k
  • 海外社媒创意运营(英语)

    网易 · 广州市
    AI 估算 · 2k-4k

相似职位推荐

  • 信安-后端高级开发工程师(J29230)

    58同城 · 北京市
    AI 估算 · 25k-40k
  • 高级引擎开发工程师(开放世界/SOC) 急招

    莉莉丝 · 上海市
    AI 估算 · 25k-45k
  • 测试工程师

    中国融通集团 · 上海市
    AI 估算 · 8k-15k
  • BaaS 平台研发实习生-存储&数据库部

    小红书 · 上海市
    AI 估算 · 4k-8k
  • Keeta 技术 - AI 全栈开发专家

    美团 · 北京市
    AI 估算 · 30k-50k

网易 的其他在招职位

  • 高级/资深Android开发工程师(多终端业务)

    网易 · 杭州市
    AI 估算 · 25k-35k
  • 财经公关经理

    网易 · 北京市
    AI 估算 · 25k-40k
  • 版权监控实习生(网易云音乐)

    网易 · 杭州市
    AI 估算 · 4k-6k
  • UE客户端开发(巅峰极速)

    网易 · 广州市
    AI 估算 · 25k-40k
  • 海外社媒创意运营(英语)

    网易 · 广州市
    AI 估算 · 2k-4k

相似职位推荐

  • 信安-后端高级开发工程师(J29230)

    58同城 · 北京市
    AI 估算 · 25k-40k
  • 高级引擎开发工程师(开放世界/SOC) 急招

    莉莉丝 · 上海市
    AI 估算 · 25k-45k
  • 测试工程师

    中国融通集团 · 上海市
    AI 估算 · 8k-15k
  • BaaS 平台研发实习生-存储&数据库部

    小红书 · 上海市
    AI 估算 · 4k-8k
  • Keeta 技术 - AI 全栈开发专家

    美团 · 北京市
    AI 估算 · 30k-50k