Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/智谱/26届校招-大模型算法工程师(预训练数据质量)
GLM logo
G
智谱 (GLM)

职位信息

北京市
初级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

分布式计算LLM多模态数据云原生大模型数据质量评估预训练数据
💡

核心评价

前沿大厂技术岗,高成长潜力,薪资竞争力强,但工作地点固定且WLB未知。

26届校招-大模型算法工程师(预训练数据质量)

🤖 AI 估测:¥25K-35K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个面向应届生的校招岗位,专注于大模型预训练阶段的数据质量工作
你将负责设计和优化PB级多模态数据的处理、清洗与评估体系,确保用于训练的数据具备高质量和多样性
核心工作是利用分布式计算和算法能力,构建自动化的数据质量评估与优化系统

✓工作职责

【岗位职责】
一、大规模预训练数据处理与优化
设计和优化PB级多模态训练数据的筛选、去重、清洗体系
基于LLM模型的语义级去重算法、质量筛选算法优化
领域特定数据筛选策略,支持代码、数学、科学等专业领域
二、数据质量评估与优化体系
构建基于大模型的数据质量自动评估系统
设计数据多样性、复杂度、有用性等多维度评估指标
优化数据配比策略,包括领域权重、语言分布、质量分层
构建数据污染检测算法,识别测试数据泄露

⭐最低要求

【任职要求】
一、基础要求
统招本科及以上学历,计算机、AI相关专业
大模型预训练项目经验,深度参与过大模型预训练数据处理
有处理TB级以上训练数据的实际项目经验
二、技术能力
精通分布式计算框架(Spark、Ray、Maxcompute等)
掌握高性能文本处理算法(LSH、SimHash等)
熟悉云原生数据处理架构
熟悉数据质量评估指标和方法

👍优先资格

【加分项】
有开源大模型项目数据相关的贡献经验
发表过大模型数据相关的顶会论文
熟悉 AI 伦理与安全合规的数据处理流程
多模态数据处理经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

智谱 的其他在招职位

  • 大模型交付工程师/架构师-北京

    智谱

    北京市 · 仅现场办公

  • 业务拓展实习生

    智谱

    北京市 · 仅现场办公

  • 安卓开发工程师

    智谱

    北京市 · 仅现场办公

  • MaaS-SRE/DBA

    智谱

    北京市 · 仅现场办公

  • 解决方案架构师-深圳

    智谱

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公