Unity Technologies的Senior Machine Learning Engineer, ML Infrastructure - Online薪资是多少？

该职位薪资范围为 30k–60k（人民币/月）。

Unity Technologies

Senior Machine Learning Engineer, ML Infrastructure - Online

立即应聘

Senior Machine Learning Engineer, ML Infrastructure - Online

发布于大约 2 个月前

普通员工/个人贡献者

上海市

高级经验

全职员工

仅现场办公

学历未注明

软件工程

Ml Infrastructure

Triton Inference Server

GKE

GPU

PyTorch

AI 估算 · 30k–60k

该职位要求高级ML基础设施技能，市场稀缺，在上海的上市科技公司薪资有竞争力。

职位详情

关于这个职位

该职位是Unity Vector团队的资深机器学习工程师，专注于构建和优化在线模型推理基础设施

你将设计高可靠、低延迟的推理系统，支持大规模生产环境中的实时预测、实验和AI驱动决策

需要深入掌握PyTorch、Kubernetes等工具，并具备系统思维和跨团队协作能力

最低要求

有构建和运维生产级在线ML推理系统的丰富经验

有使用模型服务框架的经验，如NVIDIA Triton Inference Server, TorchServe, Ray Serve, TensorFlow Serving等

有使用动态批处理、模型编译、量化、GPU加速、GPU内核优化、缓存或运行时调整等技术优化推理工作负载的经验

有分布式系统、Kubernetes、自动伸缩、服务可靠性和生产环境可观测性的丰富经验

熟练掌握Python编程语言，有生产ML系统和高规模服务的实践经验

有PyTorch和现代模型部署工作流的经验，包括模型打包、验证和服务生命周期管理

有设计安全模型上线、金丝雀测试、A/B实验和自动回滚基础设施的经验

具备强大的系统思维，能够分析在线系统中的延迟、吞吐量、可靠性、可伸缩性和成本权衡

有领导技术方向并在跨团队中影响架构决策（无正式职权）的能力

工作职责

设计和运维大规模在线推理基础设施，为生产ML模型提供低延迟和高可靠性服务

使用PyTorch, Triton Inference Server, Kubernetes, GKE, Ray等构建和改进模型服务系统

通过批处理、模型编译、GPU/CPU利用率优化、请求调度和运行时调优来优化推理性能

开发模型部署、金丝雀测试、A/B实验、流量分割、回滚和生产验证的基础设施

通过延迟、吞吐量、错误率、成本、饱和度和模型健康监控来提高在线ML系统的可观察性

构建自我修复和自动伸缩能力，以支持动态实验流量、变化的模型复杂性和生产可靠性要求

与ML工程师紧密合作，在保持生产安全、可伸缩性和成本效率的同时，支持更快的模型迭代

提高模型服务工作流的可靠性和可重复性，包括模型打包、工件验证、兼容性测试和部署自动化

领导架构改进，使在线ML平台更加健壮、用户友好、可伸缩和成本高效

AI 洞察

优缺点分析

优点

参与核心ML基础设施建设，技术深度和广度兼备，对职业发展极有帮助
与全球顶尖工程师合作，提升国际化视野和英语工作能力
公司福利完善，包括股票期权、培训等
在线推理系统对延迟和可靠性要求极高，工作强度可能较大
需要同时掌握ML和工程化技能，技术栈复杂，学习曲线陡峭
跨团队协作多，需要较强的沟通和影响力

缺点 / 挑战

Unity作为游戏引擎巨头，平台稳定，业务场景丰富，挑战大
适合有3-5年以上ML工程经验，对生产级系统充满热情，喜欢挑战高并发、低延迟场景的资深工程师

角色解读

可向ML基础设施架构师方向发展，成为平台技术负责人
也可转向更广泛的AI平台或数据工程领域，负责更大规模系统
或在Unity内部晋升为Staff/Principal Engineer，主导跨团队技术决策
设计和运维大规模在线推理基础设施，确保生产ML模型低延迟高可靠
使用PyTorch、Triton Inference Server、Kubernetes等构建和改进模型服务系统
优化推理性能，包括批处理、模型编译、GPU利用率调优等
开发模型部署、金丝雀测试、A/B实验、回滚等基础设施
精通Python和PyTorch，有生产级ML系统经验
深入理解模型服务框架（如Triton、TorchServe）和分布式系统
熟悉Kubernetes、GKE等容器编排和自动伸缩技术
具备系统思维，能够权衡延迟、吞吐量、可伸缩性和成本

申请策略

了解Unity的业务，特别是Vector团队如何支持游戏广告和实时决策，可以体现你的兴趣
准备一个你主导过的ML基础设施优化案例，从问题到方案到结果完整讲述
突出你构建和运维大规模在线ML推理系统的经验，包括具体指标（如QPS、延迟、可用性）
展示你对模型服务框架（如Triton、Ray Serve）和分布式系统的深入使用或优化经历
强调你在性能优化（GPU、批处理、编译）方面的具体成果
提及你参与过A/B实验、金丝雀发布、自动回滚等基础设施建设项目
如果未接触过Triton Inference Server或Ray Serve，建议先学习并搭建小项目
加强Kubernetes和GKE的实操经验，熟悉Helm、Istio等工具

面试指南

使用STAR法则：情境、任务、行动、结果
展示系统思维：从端到端考虑，包括数据、模型、基础设施、监控
突出量化结果：如将延迟降低X%，吞吐量提升Y%，可用性达到Z个9
描述你设计过的一个大规模在线推理系统，包括架构、关键技术和挑战
如何优化模型推理的延迟和吞吐量？举一个具体的例子
解释金丝雀发布和A/B实验在模型部署中的实现方式
如何在Kubernetes上实现自动伸缩？你如何设置HPA和VPA？
你如何监控和诊断在线ML系统中的性能问题？

职位点评

综合评分

高级ML基础设施工程师，技术前沿、薪酬有竞争力，但工作强度可能较大，需要现场办公。

从薪资福利、成长空间、工作节奏和岗位方向综合评估，方便横向比较。

更适合这类人

该职位最适合追求技术成长和职业发展的求职者，尤其是对ML基础设施有热情的人。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展90

工作生活50

使命价值70

薪资福利

80较高

该职位提供有竞争力的薪资和股权，福利完善，但未明确具体数字，薪酬信号为未披露。

薪资信号未披露（AI估算：30K-60K/月）

福利待遇综合健康、人寿和伤残保险、通勤补贴、员工持股、有竞争力的退休/养老金计划、慷慨的假期和个人休假日、为新父母提供带薪休假和家庭护理计划、办公室零食、心理健康和幸福感项目、员工资源小组、全球员工援助计划、培训和发展计划、志愿者和捐款匹配计划

成长发展

90较高

该职位涉及前沿ML基础设施技术，有大量学习和成长机会，公司提供培训和职业发展资源。

技术前沿前沿/新兴技术

技术栈Python、PyTorch、Triton Inference Server、Ray、Kubernetes、GKE、GPU、A/B testing、分布式系统、自动伸缩

成长机会培训和发展计划

业务类型ambiguous

工作生活

50较低

工作地点在上海，要求现场办公，未提及远程或弹性工作，可能有一定加班压力。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

70中等

Unity作为游戏引擎领导者，业务影响力大，但职位本身偏向技术基础设施，社会影响力中等。

行业发展稳定成熟行业

社会影响中性/一般

创新程度积极采用新技术

Unity Technologies 的其他在招职位

相似职位推荐

Watch Jobs

Senior Machine Learning Engineer, ML Infrastructure - Online

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

Senior Strategic Sales

GPS - Programmatic Strategy Partnership Manager

Staff Machine Learning Engineer, ML Infrastructure - Offline

Senior Machine Learning Engineer, ML Infrastructure - Offline

Staff Machine Learning Engineer, ML Infrastructure - Online

OG项目组-高级游戏客户端开发

生态发展部-游戏客户端开发-Unity引擎技术专家/技术Leader（性能优化方向）

OG项目组-高级游戏客户端开发

AW项目组- AI原生游戏引擎开发

OG项目组-高级游戏客户端开发

Unity Technologies 的其他在招职位

Senior Strategic Sales

GPS - Programmatic Strategy Partnership Manager

Staff Machine Learning Engineer, ML Infrastructure - Offline

Senior Machine Learning Engineer, ML Infrastructure - Offline

Staff Machine Learning Engineer, ML Infrastructure - Online

相似职位推荐

OG项目组-高级游戏客户端开发

生态发展部-游戏客户端开发-Unity引擎技术专家/技术Leader（性能优化方向）

OG项目组-高级游戏客户端开发

AW项目组- AI原生游戏引擎开发

OG项目组-高级游戏客户端开发