Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Unity logo
Unity Technologies
Senior Machine Learning Engineer, ML Infrastructure - Online
立即应聘

Senior Machine Learning Engineer, ML Infrastructure - Online

发布于 大约 22 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
学历未注明
软件工程
GPU
PyTorch
GKE
Triton Inference Server
Ml Infrastructure

AI 估算 · 30k–60k

该职位要求高级ML基础设施技能,市场稀缺,在上海的上市科技公司薪资有竞争力。

职位详情

关于这个职位

该职位是Unity Vector团队的资深机器学习工程师,专注于构建和优化在线模型推理基础设施

你将设计高可靠、低延迟的推理系统,支持大规模生产环境中的实时预测、实验和AI驱动决策
需要深入掌握PyTorch、Kubernetes等工具,并具备系统思维和跨团队协作能力

最低要求

有构建和运维生产级在线ML推理系统的丰富经验

有使用模型服务框架的经验,如NVIDIA Triton Inference Server, TorchServe, Ray Serve, TensorFlow Serving等
有使用动态批处理、模型编译、量化、GPU加速、GPU内核优化、缓存或运行时调整等技术优化推理工作负载的经验
有分布式系统、Kubernetes、自动伸缩、服务可靠性和生产环境可观测性的丰富经验
熟练掌握Python编程语言,有生产ML系统和高规模服务的实践经验
有PyTorch和现代模型部署工作流的经验,包括模型打包、验证和服务生命周期管理
有设计安全模型上线、金丝雀测试、A/B实验和自动回滚基础设施的经验
具备强大的系统思维,能够分析在线系统中的延迟、吞吐量、可靠性、可伸缩性和成本权衡
有领导技术方向并在跨团队中影响架构决策(无正式职权)的能力

工作职责

设计和运维大规模在线推理基础设施,为生产ML模型提供低延迟和高可靠性服务

使用PyTorch, Triton Inference Server, Kubernetes, GKE, Ray等构建和改进模型服务系统
通过批处理、模型编译、GPU/CPU利用率优化、请求调度和运行时调优来优化推理性能
开发模型部署、金丝雀测试、A/B实验、流量分割、回滚和生产验证的基础设施
通过延迟、吞吐量、错误率、成本、饱和度和模型健康监控来提高在线ML系统的可观察性
构建自我修复和自动伸缩能力,以支持动态实验流量、变化的模型复杂性和生产可靠性要求
与ML工程师紧密合作,在保持生产安全、可伸缩性和成本效率的同时,支持更快的模型迭代
提高模型服务工作流的可靠性和可重复性,包括模型打包、工件验证、兼容性测试和部署自动化
领导架构改进,使在线ML平台更加健壮、用户友好、可伸缩和成本高效

AI 洞察

优缺点分析

优点

  • 参与核心ML基础设施建设,技术深度和广度兼备,对职业发展极有帮助
  • 与全球顶尖工程师合作,提升国际化视野和英语工作能力
  • 公司福利完善,包括股票期权、培训等
  • 在线推理系统对延迟和可靠性要求极高,工作强度可能较大
  • 需要同时掌握ML和工程化技能,技术栈复杂,学习曲线陡峭
  • 跨团队协作多,需要较强的沟通和影响力

缺点 / 挑战

  • Unity作为游戏引擎巨头,平台稳定,业务场景丰富,挑战大
  • 适合有3-5年以上ML工程经验,对生产级系统充满热情,喜欢挑战高并发、低延迟场景的资深工程师

角色解读

  • 可向ML基础设施架构师方向发展,成为平台技术负责人
  • 也可转向更广泛的AI平台或数据工程领域,负责更大规模系统
  • 或在Unity内部晋升为Staff/Principal Engineer,主导跨团队技术决策
  • 设计和运维大规模在线推理基础设施,确保生产ML模型低延迟高可靠
  • 使用PyTorch、Triton Inference Server、Kubernetes等构建和改进模型服务系统
  • 优化推理性能,包括批处理、模型编译、GPU利用率调优等
  • 开发模型部署、金丝雀测试、A/B实验、回滚等基础设施
  • 精通Python和PyTorch,有生产级ML系统经验
  • 深入理解模型服务框架(如Triton、TorchServe)和分布式系统
  • 熟悉Kubernetes、GKE等容器编排和自动伸缩技术
  • 具备系统思维,能够权衡延迟、吞吐量、可伸缩性和成本

申请策略

  • 了解Unity的业务,特别是Vector团队如何支持游戏广告和实时决策,可以体现你的兴趣
  • 准备一个你主导过的ML基础设施优化案例,从问题到方案到结果完整讲述
  • 突出你构建和运维大规模在线ML推理系统的经验,包括具体指标(如QPS、延迟、可用性)
  • 展示你对模型服务框架(如Triton、Ray Serve)和分布式系统的深入使用或优化经历
  • 强调你在性能优化(GPU、批处理、编译)方面的具体成果
  • 提及你参与过A/B实验、金丝雀发布、自动回滚等基础设施建设项目
  • 如果未接触过Triton Inference Server或Ray Serve,建议先学习并搭建小项目
  • 加强Kubernetes和GKE的实操经验,熟悉Helm、Istio等工具

面试指南

  • 使用STAR法则:情境、任务、行动、结果
  • 展示系统思维:从端到端考虑,包括数据、模型、基础设施、监控
  • 突出量化结果:如将延迟降低X%,吞吐量提升Y%,可用性达到Z个9
  • 描述你设计过的一个大规模在线推理系统,包括架构、关键技术和挑战
  • 如何优化模型推理的延迟和吞吐量?举一个具体的例子
  • 解释金丝雀发布和A/B实验在模型部署中的实现方式
  • 如何在Kubernetes上实现自动伸缩?你如何设置HPA和VPA?
  • 你如何监控和诊断在线ML系统中的性能问题?

匹配度报告

72
综合匹配度

高级ML基础设施工程师,技术前沿、薪酬有竞争力,但工作强度可能较大,需要现场办公。

适合人群
该职位最适合追求技术成长和职业发展的求职者,尤其是对ML基础设施有热情的人。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值70

薪资福利匹配

80较高

该职位提供有竞争力的薪资和股权,福利完善,但未明确具体数字,薪酬信号为未披露。

薪资信号未披露(AI估算:30K-60K/月)
福利待遇综合健康、人寿和伤残保险、通勤补贴、员工持股、有竞争力的退休/养老金计划、慷慨的假期和个人休假日、为新父母提供带薪休假和家庭护理计划、办公室零食、心理健康和幸福感项目、员工资源小组、全球员工援助计划、培训和发展计划、志愿者和捐款匹配计划

成长发展匹配

90较高

该职位涉及前沿ML基础设施技术,有大量学习和成长机会,公司提供培训和职业发展资源。

技术前沿前沿/新兴技术
技术栈Python、PyTorch、Triton Inference Server、Ray、Kubernetes、GKE、GPU、A/B testing、分布式系统、自动伸缩
成长机会培训和发展计划
业务类型ambiguous

工作生活匹配

50较低

工作地点在上海,要求现场办公,未提及远程或弹性工作,可能有一定加班压力。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

Unity作为游戏引擎领导者,业务影响力大,但职位本身偏向技术基础设施,社会影响力中等。

行业发展稳定成熟行业
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

Unity Technologies 的其他在招职位

  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k
  • Senior Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 35k-55k
  • Staff Machine Learning Engineer, ML Infrastructure - Online

    Unity Technologies · 上海市
    AI 估算 · 50k-80k
  • Senior Performance Manager, Demand

    Unity Technologies · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • AI全栈工程师(AI Coding 方向)

    小红书 · 北京市
    AI 估算 · 45k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 40k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 高级/资深iOS开发工程师(MJ035494)

    携程 · 上海市
    AI 估算 · 25k-45k
  • Software Engineer—北京(C#/Java/Golang)

    特斯拉 · 北京市
    AI 估算 · 25k-45k

Unity Technologies 的其他在招职位

  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k
  • Senior Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 35k-55k
  • Staff Machine Learning Engineer, ML Infrastructure - Online

    Unity Technologies · 上海市
    AI 估算 · 50k-80k
  • Senior Performance Manager, Demand

    Unity Technologies · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • AI全栈工程师(AI Coding 方向)

    小红书 · 北京市
    AI 估算 · 45k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 40k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 高级/资深iOS开发工程师(MJ035494)

    携程 · 上海市
    AI 估算 · 25k-45k
  • Software Engineer—北京(C#/Java/Golang)

    特斯拉 · 北京市
    AI 估算 · 25k-45k