Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/混元大模型后训练算法工程师/专家-agent
Tencent logo
T
腾讯 (Tencent)

职位信息

北京市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

PyTorchTensorFlowSFT大语言模型RLHFReflexion
💡

核心评价

腾讯核心AI岗,技术前沿挑战大,成长空间与薪资回报俱佳,WLB信息不明。

混元大模型后训练算法工程师/专家-agent

🤖 AI 估测:¥45K-80K

发布时间:16 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型后训练阶段,特别是Agent能力研发的高级算法工程师岗位
你将负责设计和实现Agent类数据的全链路生产、质检与修复方案,并深度参与Agent能力的评测与数据飞轮构建,以持续驱动模型核心能力的演进
岗位要求深入理解大模型原理,并具备前沿Agent框架的实践经验

✓工作职责

负责大模型后训练(SFT+RL)阶段 Agent 类数据的全链路研发,针对 Agent 场景特有的多轮交互、长链路规划及工具调用特性,设计并落地基于多智能体博弈、复杂轨迹生成等技术的数据生产、自动化质检与定向修复方案,确保 Agent 数据的稳定、高标准交付
深度参与 Agent 能力的专项评测与分析,制定科学的评价指标体系,通过剖析模型在实际任务中的弱项(如探索效率、工具使用等),设计并落地高效的数据飞轮机制,定向进行数据补充与配方调整,实现“评测发现问题-数据定向强化-效果闭环提升”,持续驱动模型核心能力的演进
深度追踪与研究用于支撑大模型后训练与 Agent 能力提升的前沿数据技术,关注数据自动生成、复杂轨迹数据构建、多模态与多智能体互动等方向,能够将最新数据相关成果快速转化为业务价值

⭐最低要求

计算机科学、人工智能或相关专业硕士及以上学历,具备大模型数据工程或模型训练实际项目经验
深入理解 Transformer 架构及大语言模型训练原理,具备丰富的数据经验,能针对 LLM Alignment、RLHF等后训练场景,设计高标准数据方案,有项目实战经验
深入实践过 ReAct、Reflexion 等前沿 Agent 推理框架,能够深度剖析 Agent 运行轨迹,系统性优化其思维链质量、工具调用的鲁棒性及环境反馈准确性
熟练掌握 Python,熟悉 PyTorch/TensorFlow 等深度学习框架,能高效利用模型能力解决数据链路难点
具备强烈的数据敏感度、技术热情和自驱力,能够从繁杂的数据中洞察模型能力的边界,拥有优秀的跨团队(模型、评测)协作与沟通能力

👍优先资格

在CCF-A顶会(NeurIPS, ICLR, ICML, ACL 等)有高质量论文发表,或在开源社区(如 HuggingFace、GitHub大模型相关项目)有高影响力贡献者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公