Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Unity logo
Unity Technologies
Staff Machine Learning Engineer, ML Infrastructure - Online
立即应聘

Staff Machine Learning Engineer, ML Infrastructure - Online

发布于 大约 22 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
学历未注明
信息技术与基础设施
分布式系统
PyTorch
GKE
模型部署
模型优化
可观测性
A/B实验
Triton Inference Server
推理性能

AI 估算 · 50k–80k

资深ML工程师,稀缺技能,市场竞争力强,上市企业薪资优厚

职位详情

关于这个职位

作为 Unity Vector 团队的核心成员,你将负责设计和演进在线模型推理平台,支持大规模生产环境的低延迟推理、模型部署、实验和优化

与 ML 工程师和平台团队紧密合作,确保模型安全、高效地部署和迭代
这个角色需要深厚的系统思维和分布式系统经验,是推动机器学习基础设施技术方向的关键岗位

最低要求

丰富的生产级在线机器学习推理系统构建和运维经验

熟悉模型服务框架如 NVIDIA Triton Inference Server、TorchServe、Ray Serve、TensorFlow Serving 等
熟练运用动态批处理、模型编译、量化、GPU加速、缓存、运行时调优等技术优化推理性能
深入理解分布式系统、Kubernetes、弹性伸缩、服务可靠性与生产可观测性
熟练使用 Python,具备生产级 ML 系统和高并发服务的开发经验
熟悉 PyTorch 及现代模型部署工作流(包括模型打包、验证和服务生命周期管理)
有设计安全模型上线、金丝雀测试、A/B实验和自动回滚的基础设施经验
能够权衡在线系统的延迟、吞吐、可靠性、可扩展性和成本
具备在没有正式授权的情况下领导技术方向和跨团队架构决策的能力

工作职责

设计并运维大规模在线推理基础设施,以低延迟和高可靠性服务生产 ML 模型

使用 PyTorch、Triton Inference Server、Kubernetes、GKE、Ray 等分布式服务框架构建和改进模型服务系统
通过批处理、模型编译、GPU/CPU 利用率优化、请求调度和运行时调优优化推理性能
开发模型部署、金丝雀测试、A/B实验、流量拆分、回滚和生产验证的基础设施
通过延迟、吞吐、错误率、成本、饱和度和模型健康监控改进在线 ML 系统的可观测性
构建自愈和弹性伸缩能力,以支持动态的实验流量、变化的模型复杂度和生产可靠性需求
与 ML 工程师紧密合作,在保持生产安全、可扩展性和成本效率的同时加速模型迭代
改进模型服务工作流的可靠性和可重复性,包括模型打包、工件验证、兼容性测试和部署自动化
领导架构改进,使在线 ML 平台更健壮、易用、可扩展且成本高效

AI 洞察

优缺点分析

优点

  • 接触前沿的ML推理技术(如Triton、Ray),积累稀缺的分布式系统经验
  • Unity作为上市公司,薪资福利有竞争力,且提供股票期权和全球化协作机会
  • 团队技术氛围浓厚,能推动技术方向,有较强的自主权和成长空间
  • 跨团队协作频繁,需要较强的沟通和影响力,没有正式管理权但需带领技术决策
  • 技术栈更新快,需要持续学习,保持对前沿技术的敏感度
  • 适合有5年以上ML系统经验、喜欢解决高难度基础设施问题、渴望在技术深度和领导力上同时发展的工程师

缺点 / 挑战

  • 深度参与世界级游戏引擎的AI基础设施建设,技术挑战大、影响力广
  • 需要应对超大规模流量和低延迟要求,系统设计复杂度高,压力较大

角色解读

  • 从Staff工程师向Principal或Distinguished工程师发展,成为ML基础设施领域的权威专家
  • 横向拓展到ML平台架构师或技术总监,负责更大范围的系统设计
  • 深耕某一方向(如推理优化、模型编排)成为行业技术领袖
  • 设计和维护大规模在线推理基础设施,确保生产环境下的高可用和低延迟模型服务
  • 优化模型推理性能,包括使用批处理、模型编译、GPU加速等先进技术
  • 开发部署流水线和实验平台,支持金丝雀发布、A/B测试和自动回滚
  • 与ML团队协作,推动模型迭代效率同时保障生产稳定性
  • 深入了解模型服务框架(如Triton、TorchServe)和分布式系统
  • 熟练掌握Kubernetes、Docker等容器编排和云原生技术
  • 精通Python和PyTorch,具备高性能计算和系统优化能力
  • 具备系统思维,能权衡延迟、吞吐、成本、可靠性等指标

申请策略

  • 在简历中量化你的成果,例如“将推理延迟降低30%”或“支持日均10亿次请求”
  • 准备一个你领导过的ML基础设施改进的故事,突出技术决策和团队协作
  • 突出你设计和运维大规模ML推理系统的项目经验,包括吞吐、延迟优化案例
  • 重点展示对模型服务框架(如Triton、TorchServe)和Kubernetes的深入实践
  • 强调你在性能优化方面的成果,如通过量化、编译等降低延迟或成本
  • 体现你主导跨团队技术决策的经历,特别是推动架构演进的能力
  • 若对Triton或Ray不熟悉,建议学习其架构和调优方法
  • 加强对分布式系统可观测性工具(如Prometheus、Grafana)的实践

面试指南

  • 使用STAR方法:描述情境、任务、行动和结果,突出你做的技术决策和量化收益
  • 展示系统思考:从整个链路(数据、模型、部署、监控)分析问题,兼顾性能和成本
  • 体现领导力:说明如何通过技术论证和数据驱动影响团队,而不依赖权威
  • 请描述你设计过的一个大规模在线推理系统,如何保证低延迟和高可靠性?
  • 如何优化PyTorch模型在生产环境中的推理性能?请举例说明
  • 谈谈你在Kubernetes上部署ML模型的经验,如何处理弹性伸缩和故障恢复?
  • 如果模型推理延迟突然升高,你会如何排查和解决问题?
  • 你如何推动团队成员采用新的基础设施方案,而无需正式的管理职权?

匹配度报告

71
综合匹配度

上市大厂、前沿技术栈、高薪资福利但需现场办公,适合技术成长导向的资深ML工程师。

适合人群
适合技术成长驱动、追求前沿挑战的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

Unity作为上市公司,薪资福利具有竞争力,提供股票、保险、假期等,且明确列出多项福利,补偿性动机满足度较高。

薪资信号未披露(AI估算:50K-80K/月)
福利待遇Comprehensive health, life, and disability insurance、Commute subsidy、Employee stock ownership、Competitive retirement/pension plans、Generous vacation and personal days、Support for new parents through leave and family-care programs、Office food snacks、Mental Health and Wellbeing programs、Employee Resource Groups、Global Employee Assistance Program、Training and development programs、Volunteering and donation matching program

成长发展匹配

90较高

该岗位涉及前沿的ML推理技术和分布式系统,技术栈新且挑战大,有明确的成长信号如培训和发展项目,发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈PyTorch、Triton Inference Server、Kubernetes、Ray、GPU加速、模型编译
成长机会Training and development programs
业务类型profit_center

工作生活匹配

40较低

职位要求现场办公,且未明确提及弹性工作或远程,加班信号未提及但可能因业务需要有一定强度,生活化动机满足度一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)
工作生活平衡Generous vacation and personal days

使命价值匹配

70中等

Unity在游戏引擎和实时3D领域领先,ML基础设施支撑创新,但岗位偏向内部平台,社会使命感一般,行业前景好但直接社会影响有限。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

Unity Technologies 的其他在招职位

  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k
  • Senior Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 35k-55k
  • Senior Machine Learning Engineer, ML Infrastructure - Online

    Unity Technologies · 上海市
    AI 估算 · 30k-60k
  • Senior Performance Manager, Demand

    Unity Technologies · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 运维工程开发实习生-【架构治理/SRE】

    快手 · 北京市
    AI 估算 · 4k-6k
  • AI服务DevOps工程师

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 22301-Digital Talent Trainee

    梅特勒托利多 · 上海市
    AI 估算 · 12k-18k
  • IT iNTERN

    美敦力 · 上海市
    AI 估算 · 4k-6k
  • Foshan - Operations Report Assistant

    毕马威 · 佛山市
    AI 估算 · 6k-10k

Unity Technologies 的其他在招职位

  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k
  • Senior Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 35k-55k
  • Senior Machine Learning Engineer, ML Infrastructure - Online

    Unity Technologies · 上海市
    AI 估算 · 30k-60k
  • Senior Performance Manager, Demand

    Unity Technologies · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 运维工程开发实习生-【架构治理/SRE】

    快手 · 北京市
    AI 估算 · 4k-6k
  • AI服务DevOps工程师

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 22301-Digital Talent Trainee

    梅特勒托利多 · 上海市
    AI 估算 · 12k-18k
  • IT iNTERN

    美敦力 · 上海市
    AI 估算 · 4k-6k
  • Foshan - Operations Report Assistant

    毕马威 · 佛山市
    AI 估算 · 6k-10k