Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/混元大语言模型后训练算法工程师-模型合版方向(北京/深圳)
Tencent logo
T
腾讯 (Tencent)

职位信息

北京市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

💡

核心评价

腾讯核心AI团队的前沿大模型算法岗,技术成长性极佳,薪资竞争力强,但需接受现场办公及可能的较高工作强度。

混元大语言模型后训练算法工程师-模型合版方向(北京/深圳)

🤖 AI 估测:¥35K-65K

发布时间:10 天前

立即应聘

ℹ️关于这个职位

这是一个专注于腾讯混元大语言模型后训练与模型合版方向的算法工程师职位
你将深度参与SFT、RL等后训练算法的研发与策略研究,致力于提升模型的泛化性、能力边界和训练效率
同时,你需要探索前沿技术方向,并将研究成果转化为实际的模型能力或生产效率

✓工作职责

深度参与混元大模型后训练(包括 SFT、RL )及模型合版的研发和相关算法策略研究,提升模型泛化性、能力边界和上限
后训练策略和生产范式的研究,探索更加敏捷、普适和可扩展的训练范式,提升训练和生产效率
相关前沿后训练技术方向探索,包括但不限于 Reasoning/Agentic 能力增强和 Scaling, RL/OPD 等收敛性和可扩展性研究
将研究成果转化为实际的模型能力或生产效率,并撰写高水平技术报告或论文,提升技术影响力

⭐最低要求

计算机科学、数学、人工智能等相关专业硕士及以上学历,具备良好的数理基础
具备良好的工程实现能力,熟练使用 PyTroch、Megatraon、vLLM 等常见大模型训练和推理框架
具备良好的技术视野,深入理解大模型相关技术原理,熟悉大模型 SFT、RL 及 reward 建模等训练范式,对 RL/OPD 等有深入的实践和研究经验
具备良好的数据 sense 和问题分析能力,作风严谨细致,善于借助大模型及相关工具解决问题和提升效率
对大模型及相关前沿技术和产品具有极强的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公