Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
微信搜索-Agent算法专家
立即应聘

微信搜索-Agent算法专家

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
专家级经验
全职员工
仅现场办公
学历未注明
研究与开发 (研发)
强化学习
分布式训练
大模型
PPO
RLHF
DPO
CoT
Grpo
Search Agent

AI 估算 · 60k–80k

腾讯北京高级算法专家,大模型+强化学习方向人才稀缺,薪资具备竞争力,综合市场行情估算。

职位详情

关于这个职位

该职位负责微信搜索Agent能力的优化,包括DeepSearch/DeepResearch等Agentic能力,以及真实世界复杂任务的Agent探索

你将跟进前沿技术如Mid-Train、SFT、RLVR等,并参与稳定高效的Agentic RL方案研究
适合在大模型与强化学习交叉方向有深厚积累的算法专家,工作内容极具技术挑战与创新性

最低要求

算法功底:精通PPO、GRPO、DPO等强化学习算法,有大模型RLHF实战经验

专业深度:深刻理解CoT、自反思及工具学习,熟悉分布式训练框架

工作职责

参与微信搜索Agent能力优化,包括Search Agent(DeepSearch/DeepResearch)和真实世界复杂任务上的Agentic能力

跟进前沿技术:Mid-Train、SFT、GRM、PRM、RLVR、Agentic RL、Agent自进化、Context管理/Memory等
探索稳定高效的Agentic RL方案,探索下一代大模型结合Agent结合搜索的技术和产品范式

优先资格

学术背景:在NeurIPS、ICLR、ICML等顶会以一作发表过RL或Agent相关论文优先

AI 洞察

优缺点分析

优点

  • 腾讯微信搜索业务场景丰富,数据量大,技术落地价值高
  • 涉及最前沿的大模型与强化学习交叉方向,个人成长极快
  • 公司平台大,资源充足,可参与顶级会议论文发表
  • 技术难度高,需要同时掌握RL、LLM、Agent等多个领域知识
  • 北京现场办公,工作时间可能较长

缺点 / 挑战

  • 业务指标压力大,可能需要应对快速迭代和线上效果挑战
  • 适合在大模型和强化学习方向有深厚积累,渴望挑战前沿技术、追求高成长性的算法专家

角色解读

  • 技术纵深上可成为大模型+Agent领域的顶尖专家,主导核心算法方向
  • 横向发展可转向AI产品架构或AI研究负责人,推动技术商业化落地
  • 腾讯内部晋升通道清晰,可向技术总监或首席科学家方向发展
  • 优化微信搜索的Agent能力,涉及DeepSearch/DeepResearch等复杂任务,提升搜索智能体在真实世界中的表现
  • 跟踪并落地前沿技术,如Mid-Train、SFT、GRM、PRM、RLVR等,持续迭代模型性能
  • 探索稳定高效的Agentic RL方案,推动大模型与搜索结合的产品范式创新
  • 精通PPO、GRPO、DPO等强化学习算法,具备大模型RLHF实战经验
  • 深刻理解CoT、自反思及工具学习,熟悉分布式训练框架(如Megatron、DeepSpeed)
  • 具备较强的算法实现和系统设计能力,能够独立完成复杂实验和调优

申请策略

  • 面试前深入理解微信搜索的业务特点,准备1-2个Agent优化方案思路
  • 关注腾讯技术开放日或招聘宣讲,了解团队文化和技术方向
  • 突出RLHF、PPO等相关项目的实际落地经验,最好有搜索或Agent场景成果
  • 强调顶会论文(NeurIPS/ICLR/ICML)一作,展示学术深度
  • 展示分布式训练框架的使用经验,以及模型优化技巧
  • 可附上开源项目或技术博客链接,证明技术影响力
  • 补习Agent相关前沿技术,如ReAct、Toolformer、Self-Reflection等
  • 熟悉Megatron、DeepSpeed等分布式训练框架的原理和调优

面试指南

  • 对于算法类问题,先阐述基本原理,再结合具体项目说明实现细节和调试经验
  • 对于系统设计问题,先分析场景约束,再给出分阶段解决方案,并说明权衡
  • 对于开放性问题,展示对前沿技术的理解,提出自己的见解和可能的探索方向
  • 请详细介绍一下你参与过的RLHF项目,包括模型设计、数据收集、训练流程和效果
  • PPO和GRPO的差异是什么?如何在实践中选择?
  • 如何设计一个稳定的Agentic RL训练方案?面临哪些挑战?
  • 如何将CoT和工具学习融入到搜索Agent中?
  • 面对搜索场景的实时性要求,如何平衡模型推理速度和效果?

匹配度报告

75
综合匹配度

腾讯微信搜索Agent算法专家,前沿RL+Agent技术,高成长高薪资,工作强度较大。

适合人群
最适合追求技术前沿和高成长性的求职者,对WLB要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值70

薪资福利匹配

85较高

腾讯为已上市巨头企业,提供具有竞争力的薪资和福利,北京地区算法专家薪资处于市场高位。

薪资信号偏高 (60K-80K/月)

成长发展匹配

95较高

岗位涉及前沿的RL+Agent技术,鼓励创新和论文发表,成长空间极大。

技术前沿前沿/新兴技术
技术栈RLHF、PPO、GRPO、DPO、CoT、Search Agent、Agentic RL、Mid-Train、SFT
业务类型ambiguous

工作生活匹配

50较低

北京现场办公,按互联网大厂惯例可能加班,但JD未明确说明工作模式。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

微信搜索服务亿万用户,技术影响力大,但JD未强调社会使命。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • Project T-游戏战斗策划(AI方向)

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • OG项目组-资深叙事设计师

    腾讯 · 深圳市
    AI 估算 · 20k-40k
  • 微信搜索-AI Infra 工程师-大模型推理方向(深圳)(广州)

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 微信-基础功能后台开发

    腾讯 · 广州市
    AI 估算 · 20k-35k
  • 微信-AI应用开发工程师

    腾讯 · 广州市
    AI 估算 · 20k-40k

相似职位推荐

  • Principal AI Engineer

    维塔士 · 上海市
    AI 估算 · 50k-80k
  • Senior Technical Engineer

    施耐德 · 上海市
    AI 估算 · 25k-35k
  • 非标自动化机械设计工程师(上海)

    舍弗勒 · 上海市
    AI 估算 · 15k-25k
  • 算法工程师

    中国平安 · 深圳市
    AI 估算 · 25k-40k
  • 战斗策划(怪物向)-UE在研

    叠纸游戏 · 上海市
    AI 估算 · 18k-35k

腾讯 的其他在招职位

  • Project T-游戏战斗策划(AI方向)

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • OG项目组-资深叙事设计师

    腾讯 · 深圳市
    AI 估算 · 20k-40k
  • 微信搜索-AI Infra 工程师-大模型推理方向(深圳)(广州)

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 微信-基础功能后台开发

    腾讯 · 广州市
    AI 估算 · 20k-35k
  • 微信-AI应用开发工程师

    腾讯 · 广州市
    AI 估算 · 20k-40k

相似职位推荐

  • Principal AI Engineer

    维塔士 · 上海市
    AI 估算 · 50k-80k
  • Senior Technical Engineer

    施耐德 · 上海市
    AI 估算 · 25k-35k
  • 非标自动化机械设计工程师(上海)

    舍弗勒 · 上海市
    AI 估算 · 15k-25k
  • 算法工程师

    中国平安 · 深圳市
    AI 估算 · 25k-40k
  • 战斗策划(怪物向)-UE在研

    叠纸游戏 · 上海市
    AI 估算 · 18k-35k