腾讯的微信秒剪-agent强化学习训练框架开发工程师-（广州）薪资是多少？

该职位薪资范围为 35k–65k（人民币/月）。

微信秒剪-agent强化学习训练框架开发工程师-（广州）的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求学历未注明学历及高级经验工作经验。

🤖 AI 估测：¥35K-65K

发布时间：大约 1 个月前

这是一个专注于大模型与智能体（Agent）强化学习训练框架开发的高级技术岗位

你将负责搭建和优化高性能的Agent RL训练与推理框架，以提升在超长上下文（如工具调用）场景下的训练效率和稳定性

同时，你需要深入参与大模型推理性能优化、分布式训练性能调优以及模型后训练流程的链路分析，致力于解决前沿AI技术落地中的核心工程挑战

参与开发优化大模型推理性能，提升长调用链 Agent 推理效果和推理性能

搭建高性能的 Agent RL训练和推理框架，满足超长上下文(工具调用)场景下 Agent RL的训练效率以及训练稳定性

参与大窗口、分布式训练的性能优化，持续跟进大模型训练框架前沿技术，进行关键技术预研以及落地验证

深入分析模型后训练过程中的链路流程，包括数据加载、通信效率等，提升训练速度以及训练吞吐

精通Python及PyTorch等框架，具备Qwen、Deepseek等模型的二次训练经验者优先

深入理解Transformer架构、SFT/RL训练范式及Prompt工程，了解Claude Code等Agent开发框架，有完整智能体系统搭建经验者优先

熟悉常用的RL训练框架和训练技巧，有Verl、Slime、AReal等强化学习训练框架使用经验者优先

深入理解分布式框架的底层通信机制、内存管理策略与并行调度等逻辑，能够精准定位核心优化方向

熟悉主流推理框架，掌握 kvcache、量化、算子优化等推理优化方法，并且有落地经验者优先

具备Qwen、Deepseek等模型的二次训练经验者优先

有完整智能体系统搭建经验者优先

有Verl、Slime、AReal等强化学习训练框架使用经验者优先

掌握 kvcache、量化、算子优化等推理优化方法，并且有落地经验者优先

微信秒剪-agent强化学习训练框架开发工程师-（广州）

🤖 AI 估测：¥35K-65K

发布时间：大约 1 个月前