腾讯的微信-AI Infra工程师-大模型训练与RL方向薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

微信-AI Infra工程师-大模型训练与RL方向的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求本科学历及高级经验工作经验。

🤖 AI 估测：¥45K-80K

发布时间：30 天前

这是一个专注于AI基础设施建设的核心工程岗位

你将负责开发和优化支撑千亿级大模型训练与强化学习的底层框架，解决分布式训练、资源调度等核心工程难题，并与算法团队紧密合作，推动前沿AI技术在微信海量业务场景中的规模化落地

核心训练框架开发与优化：负责大模型分布式训练框架（基于Megatron-LM / DeepSpeed等）的底层架构设计与核心代码开发

支撑千亿/万亿模型的高效、稳定训练

RL Infra 系统建设与协同优化：负责强化学习（PPO/GRPO/DPO等）训练框架的开发和优化

深度解决 Actor 生成（结合 vLLM/SGlang 等推理引擎）与 Critic/Reward 训练阶段的资源调度、状态流转及通信瓶颈，实现 Training 与 Inference 的极致协同

算法与系统协同设计 (Co-design)：与前沿算法团队紧密合作，追踪并引入业界最新开源生态（如 Verl, Slime, ROLL, AReal 等），快速完成技术原型验证，加速前沿大模型对齐算法在微信海量业务场景的规模化落地

计算机相关专业，具备较强的动手能力

熟悉 Python ，具备扎实的系统编程功底和优秀的复杂系统 Debug 能力

训练框架经验：深入理解大模型分布式训练原理，具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验

RL 与 RL Infra 储备：熟悉大模型后训练与对齐技术（PPO、GRPO、DPO等），熟悉 Verl、ROLL，AReal 等强化学习/分布式计算框架，可以理解并解决 RL过程中的工程痛点

综合素质：具备极强的技术好奇心与自驱力，面对业界无先例的技术难题，能独立思考并推动解决

微信-AI Infra工程师-大模型训练与RL方向

🤖 AI 估测：¥45K-80K

发布时间：30 天前