快手的大模型强化学习研发实习生薪资是多少？

该职位薪资范围为 6k–12k（人民币/月）。

大模型强化学习研发实习生的工作地点在哪里？

该职位工作地点位于上海市、北京市。工作形式为仅现场办公。

该职位要求本科学历及无经验要求工作经验。

🤖 AI 估测：¥6K-12K

发布时间：19 天前

这是一个面向大模型与强化学习（LLM+RL）方向的研发实习岗位

你将参与强化学习框架的设计与开发，致力于提升框架的稳定性和训练效率，并探索前沿的RL工程实践

这是一个深入AI核心领域、积累一线工程经验的机会

参与强化学习框架研发，聚焦LLM+RL方向，参与RL框架设计和研发，提升框架稳定性和效率

优化强化学习框架性能，如训练速度和显存占用，支撑业务方大规模强化学习训练

关注前沿RL工程实践，探索RL新范式

计算机、数学、自动化、人工智能等相关专业优先，本科及以上学历

熟悉强化学习流程，包括但是不限于PPO、GRPO等算法

良好的C++/PyTorch工程能力，精通数据结构和常用的算法

熟悉PyTorch和GPU编程优先，熟悉Megatron和SGLang框架优先