Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/混元大模型算法研究员-模型评测
Tencent logo
T
腾讯 (Tencent)

职位信息

北京市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

顶会论文大模型评测代码评测性能归因分析评测算法
💡

核心评价

腾讯核心前沿岗,定义大模型评测标准,技术成长与行业影响力极佳,薪资竞争力强。

混元大模型算法研究员-模型评测

🤖 AI 估测:¥45K-80K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型算法评测的前沿研究岗位
你将负责设计和构建下一代大模型评测体系,通过严谨的数据合成与算法研究,系统性评估模型在复杂场景下的真实能力,并精准定位其性能瓶颈

✓工作职责

定义下一代评测范式:设计并建立一套能系统性地衡量大模型在开放、真实、复杂场景下的真实能力评测体系(包括不局限于Agent、Tool Use、Code、Search等),以科学地探索并定义模型的认知边界
构建严谨、高效的评测数据体系:能将对模型能力的理解转化为科学、严谨的数据设计与rubrics标注规范,构建自动化评测数据合成算法,为整个评测体系提供高质量的数据基石
评测算法研究:研究实现高效、精准的模型性能归因分析算法,准确定位模型薄弱区间

⭐最低要求

具备基于第一性原理的卓越问题解决能力,能自主应对模型评测与诊断中的核心挑战
具备从评测体系构建到深度性能诊断、评测结果分析的评测项目经验者优化
具备优秀的沟通协作精神,能与跨领域团队紧密合作,共同推进技术创新
具备优秀的编程能力,熟练掌握C++/Python者优先
在NeurIPS、ICLR、ICML、ACL、EMNLP等顶会发表过高质量论文者优先

👍优先资格

熟练掌握C++/Python者优先
在NeurIPS、ICLR、ICML、ACL、EMNLP等顶会发表过高质量论文者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公