小米的顶尖应届-具身大模型训练推理工程师-XiaomiRobotics薪资是多少？

该职位薪资范围为 25k–40k（人民币/月）。

顶尖应届-具身大模型训练推理工程师-XiaomiRobotics的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求硕士学历及初级经验工作经验。

🤖 AI 估测：¥25K-40K

发布时间：23 天前

这是一个面向顶尖应届毕业生的具身大模型训练与推理工程师岗位

你将负责设计和优化大规模AI模型的训练与推理基础设施，使用Megatron-LM、DeepSpeed等前沿框架，并致力于提升训练性能和推理效率

工作涉及与算法、数据等多团队协作，是进入AI基础设施领域的高起点技术岗位

负责具身大模型训练与推理基础设施的架构设计、搭建与优化，支撑大规模预训练、持续训练、强化学习及在线/离线推理任务稳定高效运行

基于Megatron-LM、DeepSpeed、FSDP等分布式训练框架，设计并优化数据并行、张量并行、流水并行、专家并行等策略，支撑大参数量多模态模型训练

深耕大模型训练性能优化，包括显存占用、算力利用率、通信效率、checkpoint与断点续训、训练稳定性等关键问题，提升训练吞吐与资源效率

负责推理系统优化与部署，覆盖自回归模型、Diffusion模型及MoE模型等典型架构，提升推理链路在吞吐、延迟、显存占用和稳定性方面的综合表现

推动量化、算子融合、图优化、显存复用、服务化部署等推理加速技术落地，支撑具身大模型在云端或端上环境的部署

与算法、数据、平台团队紧密协作，完善训练配置、日志监控、指标可视化、故障定位等工具链，提升研发效率与工程标准化水平

硕士及以上学历，计算机科学、软件工程、人工智能等相关专业，具备大模型训练Infra、推理加速或分布式系统研发经验

熟悉Megatron-LM、DeepSpeed、FSDP等主流分布式训练框架，理解数据并行、模型并行、张量并行、流水并行、专家并行等核心机制

熟练掌握Python/C++，熟悉PyTorch等深度学习框架，具备扎实的工程实现、性能分析与问题排查能力

理解Transformer及其变体、Diffusion、MoE等主流模型结构，熟悉训练和推理阶段常见的性能瓶颈与优化方法

具备模型推理加速，熟悉TensorRT、ONNX Runtime、Triton等推理框架或相关工具，具备量化、算子融合、显存优化等实践经验者优先

有大规模GPU集群训练、推理部署、容错与调度优化经验者优先

具备良好的跨团队协作与技术推动能力，能够结合业务需求设计高效稳定的训练推理方案

具备模型推理加速，熟悉TensorRT、ONNX Runtime、Triton等推理框架或相关工具，具备量化、算子融合、显存优化等实践经验者优先

有大规模GPU集群训练、推理部署、容错与调度优化经验者优先

顶尖应届-具身大模型训练推理工程师-XiaomiRobotics

🤖 AI 估测：¥25K-40K

发布时间：23 天前