Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/智能体-强化学习算法研究员-CodeBuddy/WorkBuddy
Tencent logo
T
腾讯 (Tencent)

职位信息

广东省-深圳市 / 北京市 / 上海市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

深度学习强化学习系统架构LLM算法研究Prompt EngineeringGrpo
💡

核心评价

腾讯前沿AI算法岗,技术顶尖、成长性极佳、薪资竞争力强,但WLB可能需平衡。

智能体-强化学习算法研究员-CodeBuddy/WorkBuddy

🤖 AI 估测:¥45K-80K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于智能体(Agent)与强化学习算法研究的岗位,你将探索并设计Agentic Workflow和Memory来解决代码领域的问题
你需要结合前沿的强化学习技术(如GRPO)与工程实践,在有限的推理算力下,构建高效、可扩展的智能体解决方案

✓工作职责

作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题
主要关注比SFT泛化效果更好的强化学习
能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标
能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent
作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案
最好是探索一套通用可扩展的 Agentic Workflow 解决方案
备注:base地可选深圳/北京/上海

⭐最低要求

自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士以上学历
有5年以上的工程编码经验,熟练掌握 Python,C/C++,Golang,Java,JavaScript,TypeScript 等至少一种语言
掌握深度学习基础知识,能根据具体问题做针对性优化,熟悉深度学习中不同任务及相应的主流模型和算法
对 Prompt Engineering、Agentic Workflow、GRPO等新的基于GPT结构的NLP强化学习方法 有实践经验

👍优先资格

有高质量论文发表者优先(如ACL、EMNLP、NeurIPS、ICML、ICLR等)
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公