腾讯的大模型训练框架研发工程师-强化学习/精调/蒸馏方向薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

大模型训练框架研发工程师-强化学习/精调/蒸馏方向的工作地点在哪里？

该职位工作地点位于深圳市。工作形式为仅现场办公。

该职位要求硕士学历及高级经验工作经验。

🤖 AI 估测：¥45K-80K

发布时间：18 天前

该职位是腾讯的大模型训练框架研发工程师，专注于强化学习、模型精调和知识蒸馏方向

你将负责核心模块的开发与优化，构建高效的分布式训练框架和工具链，并探索前沿技术以提升产品竞争力

这是一个技术深度高、对前沿AI技术有浓厚兴趣的研发岗位

框架开发与优化：负责强化学习、模型精调、知识蒸馏等核心模块的设计与开发，提升框架的训练效率与易用性

分布式训练支持：基于Megatron-LM、DeepSpeed等工具，优化大模型分布式训练策略（数据并行/张量并行/流水并行/专家并行等），解决显存、通信与计算瓶颈

工具链构建：参与开发轻量化训练框架（如LLama-Factory、swift），支持快速模型微调、部署及多硬件平台适配

前沿技术探索：跟踪学术动态（如RLHF、MoE架构、FlashMLA、EPLB、DualPipe等），将最新研究成果转化为框架功能，提升产品竞争力

协作与文档：与产品团队紧密配合，提供框架级解决方案

编写技术文档与案例，赋能公有云客户

计算机科学、数学、电子工程等相关专业硕士及以上学历，3年以上深度学习框架或工具链开发经验，精通Python，熟练使用C++

有Megatron-LM、DeepSpeed等开源框架使用或二次开发经验，理解分布式训练、显存优化技术

工程经验上具备大型项目架构设计能力，能独立解决性能调优、多节点调试等复杂问题

综合素养

强烈的技术热情，良好的沟通能力与团队协作精神

熟悉 GRPO/PPO 等 RL 算法、veRL/Slime/AReaL等强化学习框架者优先

熟悉CUDA编程、高性能计算优化（如算子融合、通信优化）者优先

熟悉NCCL、MPI等集合通信算法者优先

大模型训练框架研发工程师-强化学习/精调/蒸馏方向

🤖 AI 估测：¥45K-80K

发布时间：18 天前