腾讯的混元大模型后训练算法工程师/专家-agent薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

混元大模型后训练算法工程师/专家-agent的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求硕士学历及高级经验工作经验。

🤖 AI 估测：¥45K-80K

发布时间：16 天前

这是一个专注于大模型后训练阶段，特别是Agent能力研发的高级算法工程师岗位

你将负责设计和实现Agent类数据的全链路生产、质检与修复方案，并深度参与Agent能力的评测与数据飞轮构建，以持续驱动模型核心能力的演进

岗位要求深入理解大模型原理，并具备前沿Agent框架的实践经验

负责大模型后训练（SFT+RL）阶段 Agent 类数据的全链路研发，针对 Agent 场景特有的多轮交互、长链路规划及工具调用特性，设计并落地基于多智能体博弈、复杂轨迹生成等技术的数据生产、自动化质检与定向修复方案，确保 Agent 数据的稳定、高标准交付

深度参与 Agent 能力的专项评测与分析，制定科学的评价指标体系，通过剖析模型在实际任务中的弱项（如探索效率、工具使用等），设计并落地高效的数据飞轮机制，定向进行数据补充与配方调整，实现“评测发现问题-数据定向强化-效果闭环提升”，持续驱动模型核心能力的演进

深度追踪与研究用于支撑大模型后训练与 Agent 能力提升的前沿数据技术，关注数据自动生成、复杂轨迹数据构建、多模态与多智能体互动等方向，能够将最新数据相关成果快速转化为业务价值

计算机科学、人工智能或相关专业硕士及以上学历，具备大模型数据工程或模型训练实际项目经验

深入理解 Transformer 架构及大语言模型训练原理，具备丰富的数据经验，能针对 LLM Alignment、RLHF等后训练场景，设计高标准数据方案，有项目实战经验

深入实践过 ReAct、Reflexion 等前沿 Agent 推理框架，能够深度剖析 Agent 运行轨迹，系统性优化其思维链质量、工具调用的鲁棒性及环境反馈准确性

熟练掌握 Python，熟悉 PyTorch/TensorFlow 等深度学习框架，能高效利用模型能力解决数据链路难点

具备强烈的数据敏感度、技术热情和自驱力，能够从繁杂的数据中洞察模型能力的边界，拥有优秀的跨团队（模型、评测）协作与沟通能力

在CCF-A顶会（NeurIPS, ICLR, ICML, ACL 等）有高质量论文发表，或在开源社区（如 HuggingFace、GitHub大模型相关项目）有高影响力贡献者优先

混元大模型后训练算法工程师/专家-agent

🤖 AI 估测：¥45K-80K

发布时间：16 天前