Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaohongshu logo
小红书
【REDstar】Dots-大模型预训练数据算法研究员
立即应聘

【REDstar】Dots-大模型预训练数据算法研究员

发布于 2 天前

实习/见习

北京市 / 上海市
无经验要求
实习生
仅现场办公
本科
深度学习
PyTorch
预训练
LLM
数据筛选
大模型
数据增强
算法评测
数据配比
训练算法优化

AI 估算 · 5k–10k

算法研究实习生岗位,小红书平台有竞争力,参考行业水平,月薪按工作日估算。

职位详情

关于这个职位

该职位是小红书REDstar计划下的大模型预训练数据算法研究员,专注于突破大模型预训练阶段的核心能力瓶颈

你将参与海量数据高效筛选、智能数据配比、算法评测验证及训练算法优化等工作,系统性探索前沿算法架构与数据智能策略
适合对LLM、深度学习有热情且具备扎实工程能力的同学

最低要求

年级不限,本科及以上在读,计算机、人工智能、软件工程或相关交叉学科背景优先,C9院校优先

拥有卓越的工程实现能力与扎实的算法功底,熟练掌握至少一门主流编程语言及PyTorch框架,熟练使用Code Agent者优先
深耕机器学习与深度学习领域,具备大型语言模型(LLM)项目实战或大规模预训练实际经验者优先
具备出色的沟通与协作能力,自驱力强,敢于担当,乐于与团队共同探索前沿技术,推动技术演进与落地

工作职责

致力于突破大模型预训练阶段核心能力瓶颈,系统性探索前沿算法架构与数据智能策略

海量数据的高效筛选与质量评估
智能数据配比与动态增强
严谨可复现的算法评测与验证体系
面向预训练效率的训练算法优化
通用场景下可扩展的数据管线设计
端到端自动化高性能数据流水线构建

优先资格

在NeurIPS、ICML、COLT、ICLR、CVPR等顶级会议或期刊上发表相关研究成果者优先

AI 洞察

优缺点分析

优点

  • 参与最前沿的大模型预训练技术,技能积累快,行业前景广阔
  • 小红书作为头部互联网公司,平台资源丰富,数据海量真实
  • REDstar计划可能提供较多技术交流与学习机会,成长空间大
  • 技术难度高,需要同时掌握算法和工程,对综合能力要求高
  • 作为实习生,竞争激烈,需要主动学习和快速产出
  • 适合对LLM和深度学习有强烈兴趣、追求技术深度、具备较强自驱力和工程能力的同学

缺点 / 挑战

  • 算法研究岗,工作内容具有创新性和挑战性,技术认可度高
  • 预训练研究周期长,迭代快,可能需要承受一定的工作压力

角色解读

  • 从算法研究实习生晋升为正式研究员,深入参与核心模型研发
  • 向大模型预训练专家方向深耕,成为数据智能或算法优化领域的骨干
  • 未来可转向AI研究科学家或技术Leader,引领前沿技术探索
  • 负责海量文本数据的高效筛选与质量评估,构建高质量预训练数据集
  • 探索智能数据配比与动态增强策略,提升模型训练效果
  • 设计可复现的算法评测体系,验证预训练算法性能
  • 优化训练算法并搭建端到端自动化数据流水线
  • 扎实的机器学习与深度学习基础,熟悉LLM相关技术
  • 精通Python及PyTorch框架,具备优秀的工程实现能力
  • 有大规模数据处理或预训练实际经验者优先
  • 良好的沟通协作能力与自驱力

申请策略

  • 了解小红书在AI领域的布局,尤其是社区内容与模型结合的业务方向
  • 准备一个与数据智能相关的技术分享或案例分析,展示你的思考深度
  • 突出相关项目经验,如LLM预训练、数据清洗、数据增强等
  • 强调编程能力和PyTorch使用熟练度,附上GitHub链接或代码样本
  • 如果有顶级会议论文或开源贡献,务必重点展示
  • 体现数据敏感性和分析能力,例如在大规模数据处理上的实践
  • 提前熟悉大模型常见数据预处理工具(如datasets、tokenizers)
  • 掌握训练加速技术(如分布式训练、混合精度)

面试指南

  • 采用STAR法则:先简要说明背景,再讲清思路/方案,突出关键决策与难点
  • 对于开放性问题,结合具体实验或文献支撑观点,体现系统性思考
  • 请谈谈你对大模型预训练数据质量的理解,如何评估数据质量?
  • 你如何设计数据配比策略来提升模型在下游任务上的表现?
  • 描述一个你使用PyTorch进行大规模数据处理的工程实践
  • 你在LLM项目中遇到的最大技术挑战是什么?如何解决的?
  • 复习大模型基础知识,包括Transformer架构、预训练目标、数据预处理流程
  • 准备1-2个自己深度参与的项目,从数据、模型、评估全链路梳理

匹配度报告

59
综合匹配度

前沿大模型预训练算法研究实习,技术成长快,但薪资一般且需现场办公。

适合人群
最适合追求技术成长、热爱前沿研究的同学,对薪资和WLB要求不高。
最强匹配
成长发展匹配
最弱匹配
薪资福利匹配
薪资福利30
成长发展95
工作生活40
使命价值70

薪资福利匹配

30较低

实习生薪资按市场水平,但福利较少,补偿性动机满足度低。

薪资信号未披露(AI估算:5K-10K/月)

成长发展匹配

95较高

该岗位聚焦大模型前沿技术,提供丰富的学习和实践机会,发展性动机满足度极高。

技术前沿前沿/新兴技术
技术栈大模型、预训练、深度学习、LLM、PyTorch、数据筛选、数据配比、数据增强、算法评测、训练算法优化
业务类型ambiguous

工作生活匹配

40较低

要求现场办公,未提及弹性或WLB福利,且大模型研究可能加班,生活化动机满足度一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型是高速增长赛道,但岗位未明确社会价值,意义感动机满足度中等偏上。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • IT Business Partner

    小红书 · 美国,新加坡
    AI 估算 · 35k-60k
  • 【急招岗位】AI端到端全栈工程师 - iOS/Andr/后端/前端

    小红书 · 北京市
    AI 估算 · 35k-65k
  • 内容数据科学实习生

    小红书 · 上海市
    AI 估算 · 5k-8k
  • 隐私与数据合规实习生

    小红书 · 上海市
    AI 估算 · 4k-6k
  • 公共事务实习生

    小红书 · 北京市
    AI 估算 · 4k-7k

相似职位推荐

  • 算法实习生(孵化)-【主站】

    快手 · 北京市
    AI 估算 · 4k-8k
  • Process Development 2

    大众汽车 · 大连市
    AI 估算 · 15k-25k
  • Mechanical Designer 2

    大众汽车 · 大连市
    AI 估算 · 15k-25k
  • Part Owner 3

    大众汽车 · 大连市
    AI 估算 · 18k-28k
  • Part Owner 4

    大众汽车 · 大连市
    AI 估算 · 15k-25k

小红书 的其他在招职位

  • IT Business Partner

    小红书 · 美国,新加坡
    AI 估算 · 35k-60k
  • 【急招岗位】AI端到端全栈工程师 - iOS/Andr/后端/前端

    小红书 · 北京市
    AI 估算 · 35k-65k
  • 内容数据科学实习生

    小红书 · 上海市
    AI 估算 · 5k-8k
  • 隐私与数据合规实习生

    小红书 · 上海市
    AI 估算 · 4k-6k
  • 公共事务实习生

    小红书 · 北京市
    AI 估算 · 4k-7k

相似职位推荐

  • 算法实习生(孵化)-【主站】

    快手 · 北京市
    AI 估算 · 4k-8k
  • Process Development 2

    大众汽车 · 大连市
    AI 估算 · 15k-25k
  • Mechanical Designer 2

    大众汽车 · 大连市
    AI 估算 · 15k-25k
  • Part Owner 3

    大众汽车 · 大连市
    AI 估算 · 18k-28k
  • Part Owner 4

    大众汽车 · 大连市
    AI 估算 · 15k-25k