腾讯的腾讯云乐享-强化学习算法研究员薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

腾讯云乐享-强化学习算法研究员的工作地点在哪里？

该职位工作地点位于深圳市。工作形式为仅现场办公。

该职位要求硕士学历及中级经验工作经验。

🤖 AI 估测：¥35K-60K

发布时间：16 天前

这是一个专注于前沿人工智能领域的算法研究岗位

你将作为腾讯云乐享团队的一员，主要研究并应用强化学习技术，特别是针对代码领域的Agentic Workflow和Agentic Memory设计

你需要将算法研究与工程实践相结合，探索并构建高效、可扩展的智能体解决方案

作为研究者，探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题

主要关注比SFT泛化效果更好的强化学习

能结合实际用户需求、产生的用户数据、agent的实现细节，调整训练语料和训练目标

能和agent开发高效沟通，设计memory存取逻辑，并且通过模型训练让模型适配自己设计的agent

作为工程师，考虑到 LLM inference 对推理算力的高消耗，设计出合理的前后端交互，前端架构，后端架构，在有限的推理算力下，做出完整的 Agentic Workflow 解决方案

最好是探索一套通用可扩展的 Agentic Workflow 解决方案

自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士以上学历

有工程编码经验，熟练掌握 Python，C/C++，Golang，Java，JavaScript，TypeScript 等至少一种语言

掌握深度学习基础知识，能根据具体问题做针对性优化，熟悉深度学习中不同任务及相应的主流模型和算法

对 Prompt Engineering、Agentic Workflow、GRPO等新的基于GPT结构的NLP强化学习方法有实践经验

有高质量论文发表者优先（如ACL、EMNLP、NeurIPS、ICML、ICLR等)

腾讯云乐享-强化学习算法研究员

🤖 AI 估测：¥35K-60K

发布时间：16 天前