Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/百度/大模型数据研发(J98033)
Baidu logo
B
百度 (Baidu)

职位信息

北京市
初级经验
实习生
仅现场办公
硕士
实习/见习

标签

NLPGO后端开发大模型海量数据处理分布式爬虫反爬策略
💡

核心评价

百度大模型数据实习岗,技术前沿、成长性极佳,是积累高含金量经验的黄金起点。

大模型数据研发(J98033)

🤖 AI 估测:¥8K-15K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个面向大模型数据工程领域的实习岗位
你将参与构建和优化支撑大模型训练的数据中台,包括海量数据的抓取、清洗、存储及服务化
核心工作涉及分布式爬虫平台开发、反爬策略攻克以及前沿数据处理技术的应用,旨在为AI模型提供高质量、高效率的数据供给

✓工作职责

参与大模型数据工程中台(涵盖海量数据抓取、清洗处理、存储及模型服务)的架构设计与核心模块开发,持续突破高并发场景下的系统吞吐量与稳定性瓶颈
负责构建与优化分布式数据采集平台,攻克复杂场景下的反爬策略,保障多模态训练素材的高效、高质量产出
追踪并实践大模型与前沿工程技术,将新技术应用于实际的数据流转与处理链路中,提升业务整体运转效率

⭐最低要求

计算机科学与技术、人工智能、软件工程等相关专业硕士在读(具备同等技术潜力的优秀本科生亦可)
扎实的编程基础,精通 Go 或 Python,熟悉常用后端框架及底层原理,具备优秀的Linux系统级操作及问题排查能力
具备丰富的分布式网络爬虫实战经验,熟悉主流反爬机制及应对策略,能够独立完成复杂目标的数据获取
具备极强的技术好奇心与自驱力,逻辑分析能力强,面对无明确边界的技术难题能主动寻找并落实解决方案

👍优先资格

熟悉大模型底层结构(如Transformer)与应用生态,有NLP、海量数据处理或深度学习相关项目落地经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • Agent产品经理(J99599)

    百度

    北京市 · 仅现场办公

  • 开发测试工程师(实习生)(J99576)

    百度

    北京市 · 仅现场办公

  • Agent产品经理(J99563)

    百度

    北京市 · 仅现场办公

  • 平台产品经理(J99562)

    百度

    北京市 · 仅现场办公

  • Agent工程架构师(J99561)

    百度

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公