Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/智谱/AI院-评测-算法工程师(社招)
GLM logo
G
智谱 (GLM)

职位信息

北京市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

LLM自动化评估大语言模型RL训练DPO模型评测数据飞轮Critic模型超级对齐
💡

核心评价

前沿AI大模型评测岗,技术成长性极佳,薪资竞争力强,但需接受现场办公且WLB未知。

AI院-评测-算法工程师(社招)

🤖 AI 估测:¥30K-50K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

该职位主要负责对大语言模型(LLM)进行全面、高效的评测与深度分析,明确其优势与缺陷,为模型迭代提供关键指引
你将探索自动化评估方法,构建评测系统与数据飞轮,并与预训练、Post-Training团队合作,参与技术文档与学术论文的撰写

✓工作职责

对大模型进行全面、细致、准确、高效的评测,对模型能力深度分析,明确模型的现有优势与缺陷,作为模型下一步发展的指路明灯
涉及当前几乎所有类型的主流大模型,包括但不限于通用对话、代码、图片/视频/语音理解与生成、长文本、Agent、角色扮演等
探索可靠的LLM-as-a-Judge方法,在模型能力边界范围内最大化自动化评估的占比
与预训练、Post-Training方向密切合作,构建准确、通用的Critic模型用于DPO、RL训练等
完善与扩展评测的维度,挖掘已知模型能力之外的评测指标,探索未来模型方向
参与搭建自动化、可扩展、可靠的评测系统,缩短评价周期,助力内部模型迭代
构建评测的数据飞轮,实现线上数据获取-数据筛选分类-标注-模型迭代-评估的正向循环
对大模型的安全性进行全方位评估和提升能力,研究大模型超级对齐的前瞻性技术
参与撰写技术文档和学术论文,包括并不限于基准设计、评测标准和研究进展等

⭐最低要求

职位描述中未明确列出最低任职要求
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

智谱 的其他在招职位

  • 大模型交付工程师/架构师-北京

    智谱

    北京市 · 仅现场办公

  • 业务拓展实习生

    智谱

    北京市 · 仅现场办公

  • 安卓开发工程师

    智谱

    北京市 · 仅现场办公

  • MaaS-SRE/DBA

    智谱

    北京市 · 仅现场办公

  • 解决方案架构师-深圳

    智谱

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公