小米的大模型训练与推理Infra工程师-MiMo薪资是多少？

该职位薪资范围为 35k–70k（人民币/月）。

大模型训练与推理Infra工程师-MiMo的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求本科学历及高级经验工作经验。

🤖 AI 估测：¥35K-70K

发布时间：大约 1 个月前

这是一个专注于大模型训练与推理基础设施开发的高级工程师职位

你将负责设计和构建支持大规模分布式训练的计算平台，并优化在线/离线推理框架的性能

核心工作涉及高性能计算技术集成、系统性能监控与调优，并与模型研究及产品团队紧密协作，推动大模型技术在实际业务场景中的落地应用

职位描述：

模型训练基础设施开发

设计和实现支持大规模分布式训练的计算平台，优化模型训练效率和资源利用率

维护和扩展现有的分布式训练框架，确保平台的高性能和稳定性（如基于 PyTorch、TensorFlow 或 JAX）

集成和优化高性能计算技术（如 CUDA、MPI、NCCL 等）

模型推理基础设施开发

构建高效的推理框架，支持大模型的在线和离线推理需求

优化推理速度、内存占用和能耗，支持多种硬件架构（GPU、NPU等）

实现PD分离、Context Caching、模型量化、推敲编码等推理优化技术

性能监控与优化

开发工具链和监控系统，跟踪训练与推理过程的性能瓶颈

分析并优化数据加载、通信效率和硬件利用率等关键环节

跨团队协作

与模型研究团队密切合作，理解模型需求，定制训练和推理策略

支持产品团队的模型部署需求，推动大模型在实际场景中的落地应用

基本要求：

计算机科学、软件工程、机器学习或相关领域的本科及以上学历，硕士或博士优先

深入理解深度学习原理和分布式训练框架（如 Horovod、DeepSpeed、Ray 等）

熟练掌握至少一种主流深度学习框架（如 PyTorch、TensorFlow 或 JAX）

熟悉高性能计算技术（CUDA、NCCL、cuDNN 等）及硬件架构（GPU、NPU 等）

具有扎实的编程能力，精通 Python 和至少一种系统级编程语言（如 C++）

优先条件：

有参与或主导过大规模模型（如 Transformer、大语言模型）的训练和部署经验

熟悉模型优化技术（如混合精度训练、剪枝、量化等）

对云计算和容器化技术（如 Kubernetes、Docker、Terraform）有实际经验

对新兴 AI 硬件（如 H卡）有实操经验

具备优秀的系统设计和性能调优能力

大模型训练与推理Infra工程师-MiMo

🤖 AI 估测：¥35K-70K

发布时间：大约 1 个月前