携程的大模型训练专家(MJ031051)薪资是多少？

该职位薪资范围为 55k–85k（人民币/月）。

大模型训练专家(MJ031051)的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

携程的大模型训练专家(MJ031051)有什么任职要求？

该职位要求硕士学历及专家级经验工作经验。

大模型训练专家(MJ031051)

🤖 AI 估测：¥55K-85K

发布时间：14 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大规模预训练模型（LLM）全流程开发与优化的专家级技术岗位

你将主导从模型架构设计、分布式训练、显存优化到业务场景（如智能客服、内容生成）落地的核心工作

岗位要求深入掌握Transformer、RLHF等前沿技术，并具备百亿参数模型的实际训练经验

✓工作职责

【核心职责】：

大模型训练与优化

（1）主导百亿级以上参数的预训练模型全流程工作，包括数据清洗、架构设计、分布式训练策略制定（如Data/Pipeline/Tensor Parallelism）及训练稳定性优化

（2）优化模型训练效率，解决显存瓶颈、长序列处理、多模态对齐等问题，降低训练成本并提升模型性能

后训练技术落地

（1）开展有监督微调（SFT）、奖励模型训练（RM）和RLHF/RLAIF，提升模型的指令遵循能力、安全性和业务场景适配性

（2）构建自动化评估体系，针对模型效果、伦理合规性设计多维评测方案

技术突破与工程化

（1）研究MoE、高效注意力机制等前沿技术，推动模型压缩、量化及推理加速，支持云端或边缘设备部署

（2）主导高可用训练平台建设，完善断点续训、故障恢复等机制，保障大规模训练的稳定性

跨领域协同与赋能

（1）与业务团队合作，将模型能力应用于智能客服、行业知识库、流程自动化等场景，通过LangChain等框架实现技术落地

（2）指导团队成员，输出技术文档与专利，构建团队技术壁垒

⭐最低要求

教育背景：计算机科学、人工智能、数学等相关专业硕士及以上学历

精通PyTorch/TensorFlow等框架，熟练掌握DeepSpeed、Megatron-LM等分布式训练工具

具备70B+参数模型的预训练、继续训练、SFT、RLHF全流程实战经验，能独立解决训练中的工程问题（如显存溢出、收敛稳定性等）

深入理解Transformer架构、强化学习对齐技术（如PPO、DPO）及模型优化方法（量化、蒸馏）

有开源大模型（如LLaMA、Qwen、ChatGLM）改造或训练经验，熟悉高质量数据构建与治理策略

👍优先资格

在顶级会议（NeurIPS、ICML等）发表相关论文，或参与开源大模型项目者优先考虑

有互联网垂直领域的大模型落地案例者优先考虑

核心评价

大模型训练专家(MJ031051)

ℹ️关于这个职位

✓工作职责

⭐最低要求

👍优先资格

携程的其他在招职位

相似职位推荐

大模型训练专家(MJ031051)

ℹ️关于这个职位

✓工作职责

⭐最低要求

👍优先资格

携程 的其他在招职位

相似职位推荐

携程的其他在招职位