Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/智谱/算法工程师
GLM logo
G
智谱 (GLM)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

分布式计算云原生架构LLM多模态数据数据质量评估Simhash预训练数据处理
💡

核心评价

前沿大厂算法岗,技术成长性极佳,薪资竞争力强,但需接受现场办公及可能的快节奏。

算法工程师

🤖 AI 估测:¥30K-50K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型预训练数据处理与优化的算法工程师岗位
你将负责设计和优化PB级多模态数据的筛选、清洗、去重体系,并构建数据质量自动评估与优化系统
核心工作围绕提升大模型训练数据的质量、多样性和安全性展开

✓工作职责

一、大规模预训练数据处理与优化
设计和优化PB级多模态训练数据的筛选、去重、清洗体系
基于LLM模型的语义级去重算法、质量筛选算法优化
领域特定数据筛选策略,支持代码、数学、科学等专业领域
二、数据质量评估与优化体系
构建基于大模型的数据质量自动评估系统
设计数据多样性、复杂度、有用性等多维度评估指标
优化数据配比策略,包括领域权重、语言分布、质量分层
构建数据污染检测算法,识别测试数据泄露

⭐最低要求

统招本科及以上学历,计算机、AI相关专业
大模型预训练项目经验,深度参与过大模型预训练数据处理
有处理TB级以上训练数据的实际项目经验
精通分布式计算框架(Spark、Ray、Maxcompute等)
掌握高性能文本处理算法(LSH、SimHash等)
熟悉云原生数据处理架构
熟悉数据质量评估指标和方法

👍优先资格

有开源大模型项目数据相关的贡献经验
发表过大模型数据相关的顶会论文
熟悉 AI 伦理与安全合规的数据处理流程
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

智谱 的其他在招职位

  • 大模型交付工程师/架构师-北京

    智谱

    北京市 · 仅现场办公

  • 业务拓展实习生

    智谱

    北京市 · 仅现场办公

  • 安卓开发工程师

    智谱

    北京市 · 仅现场办公

  • MaaS-SRE/DBA

    智谱

    北京市 · 仅现场办公

  • 解决方案架构师-深圳

    智谱

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公