腾讯的元宝-大模型训练工程师薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

元宝-大模型训练工程师的工作地点在哪里？

该职位工作地点位于深圳市。工作形式为仅现场办公。

该职位要求硕士学历及中级经验工作经验。

🤖 AI 估测：¥35K-60K

发布时间：大约 1 个月前

这是一个专注于大模型训练基础设施的工程师岗位

你将负责设计和优化LLM训练框架，确保其高性能、可扩展和稳定，以支撑千亿级参数模型的分布式训练

需要与算法和平台团队紧密协作，推动AI大模型技术的落地与创新

负责设计和优化LLM训练框架，支撑LLM高性能训练

与算法团队、平台团队紧密协作，确保LLM infra的稳定、高性能、可扩展，推动AI大模型技术的落地与创新：

负责设计和优化LLM训练框架，支撑LLM高性能训练

与算法团队、平台团队紧密协作，确保LLM infra的稳定、高性能、可扩展

系统设计与优化：设计并搭建分布式训练框架，跟平台协作，支持千亿级参数大模型的训练

性能调优与成本优化：针对大模型训练任务，优化框架（如PyTorch/VERL等）的分布式策略，提升训练效率

稳定性与可靠性保障：设计高可用架构，解决训练中断、数据丢失等风险，确保长周期训练任务的稳定性

协作与落地：与算法团队紧密合作，理解模型需求，提供基础设施层面的技术建议

推动开源工具的定制化开发，适配业务场景

计算机科学、分布式系统或相关专业硕士及以上学历，2年以上大模型Infra领域经验

精通PyTorch，熟悉其底层原理与分布式扩展机制

至少熟练使用一种开源训练框架（VERL， ROLL， ms-swift等），可根据业务需求，熟练开发Megatron， Deepspeed 训练引擎和 VLLM，sglang推理引擎

熟悉GPU集群架构，了解NVIDIA GPU（如A100/H100）的硬件特性与优化方法

掌握分布式系统原理，熟悉Kubernetes、Slurm、Ray等资源调度框架

元宝-大模型训练工程师

🤖 AI 估测：¥35K-60K

发布时间：大约 1 个月前