Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Bilibili logo
哔哩哔哩
【B-UP】大语言模型(LLM)算法工程师(实习)
立即应聘

【B-UP】大语言模型(LLM)算法工程师(实习)

发布于 大约 15 小时前

实习/见习

上海市
无经验要求
实习生
仅现场办公
学历未注明
研究与开发 (研发)
PyTorch
LLM
机器翻译
DeepSpeed
CPT
RLHF
MoE
Megatron
Verl

AI 估算 · 4k–9k

上海头部互联网公司LLM实习岗位,薪资处于行业中等偏上,且技术方向热门,实习经历含金量高。

职位详情

关于这个职位

作为哔哩哔哩的大语言模型算法实习生,你将参与前沿的MoE模型持续预训练、强化学习训练(RLVR/RLAIF)、多语种机器翻译以及长程智能体强化学习等方向

你需要动手搭建实验、编写脚本、评测模型,在真实的业务场景中实践和优化大模型技术
适合深度学习基础扎实、对大模型有浓厚兴趣的在校学生

最低要求

深度学习基础扎实,熟悉当前主流LLM架构

熟悉常见大模型训练框架(Megatron/DeepSpeed/Verl)
有LLM相关项目经验:CPT、SFT、RL 任意方向即可
有阅读论文与复现能力,能快速上手实验
良好的自我学习能力和独立思考能力

工作职责

参与大规模MoE模型的持续预训练(CPT):数据清洗与混合策略、训练调优与结果分析

参与RLVR/RLAIF强化学习训练流程:数据构建、reward shaping、训练调优
参与多语种机器翻译(MT)方向:语料处理、模型微调、评测
参与Long horizon agentic RL方向:搭建复杂交互环境与任务流、多步骤推理轨迹收集、Reward设计与策略网络优化
编写实验脚本、构建评测工具,支持模型上线前的质量验证

优先资格

有相关领域顶会论文,或拥有影响力工作

有自己的LLM项目
有机器翻译(MT)经验
有 Agent RL相关的训练经验,或 harness engineering 经验

AI 洞察

优缺点分析

优点

  • 紧跟LLM技术最前沿,接触MoE、RLHF等热点方向,积累稀缺经验
  • 上海头部互联网平台,技术氛围浓厚,导师制成长环境
  • 实习期间有实际业务数据场景,产出可量化的成果
  • 工作强度较大,实验周期长,需要耐心和持续学习
  • 竞争激烈,需要快速产出成果以争取转正机会
  • 适合深度学习基础扎实、对LLM有强烈兴趣、希望积累前沿大模型经验的在校研究生或高年级本科生

缺点 / 挑战

  • 技术门槛较高,需要扎实的深度学习和LLM基础

角色解读

  • 实习转正后晋升为正式算法工程师,深入参与核心模型研发
  • 在LLM预训练、强化学习对齐、多模态等方向深耕,成为领域专家
  • 向技术管理或架构师方向发展,带领团队推动技术突破
  • 参与大规模MoE模型的持续预训练,负责数据清洗、混合策略制定及训练调优
  • 参与强化学习训练流程,包括数据构建、奖励塑形和策略网络优化
  • 参与多语种机器翻译和长程智能体强化学习方向的实验与评测
  • 编写实验脚本和评测工具,支持模型上线前的质量验证
  • 扎实的深度学习基础,熟悉主流LLM架构(如Transformer、MoE)
  • 熟练掌握大模型训练框架(Megatron/DeepSpeed/Verl)的使用与调优
  • 具备独立阅读论文并复现实验的能力,能快速上手新方向
  • 良好的自我学习和独立思考能力,能主动解决问题

申请策略

  • 在简历中具体描述项目中扮演的角色和量化成果
  • 关注B站技术博客和开源项目,在面试中展现对公司的了解
  • 突出LLM相关项目经验,如CPT、SFT、RL等方向的实操
  • 列出掌握的深度学习框架和训练框架(PyTorch、Megatron等)
  • 如有论文或开源项目,优先展示
  • 强调复现论文和独立实验的能力
  • 预先学习MoE、RLHF、Agent RL等前沿技术原理
  • 动手实践使用Megatron或DeepSpeed进行模型训练

面试指南

  • STAR法则:描述情境、任务、行动和结果,突出个人贡献
  • 对比阐述:对技术问题先解释基本原理,再结合项目经验说明实际应用中的考量
  • 分点陈述:先给出结论,再分点展开论据,体现逻辑性
  • 请详细介绍一下你参与的一个LLM项目,挑战是什么?如何解决的?
  • MoE模型相比Dense模型有什么优缺点?训练时需要注意什么?
  • RLHF中的reward model如何设计?有哪些常见问题?
  • 如何评估一个LLM对话模型的质量?有哪些指标?
  • 请解释Verl训练框架的核心组件和工作流程

职位点评

71
综合评分

上海头部互联网LLM实习岗位,前沿技术栈、高成长性,但需现场办公且薪资中规中矩。

更适合这类人
适合以技术成长为首要目标的求职者,愿意投入时间学习前沿大模型技术并接受较快节奏。
表现最好
成长发展
相对薄弱
工作生活
薪资福利65
成长发展90
工作生活60
使命价值70

薪资福利

65中等

实习薪资处于上海市场中等偏上水平,但作为实习岗位薪资天花板有限,福利完备但非核心激励。

薪资信号未披露(AI估算:4K-9K/月)

成长发展

90较高

该岗位技术前沿,涉及MoE、RLHF、Agent RL等热点方向,成长空间极大,有明确的技能积累和转正晋升路径。

技术前沿前沿/新兴技术
技术栈LLM、MoE、RLHF、RLAIF、Agent RL、Megatron、DeepSpeed、Verl
业务类型ambiguous

工作生活

60中等

需现场办公,上海地段,互联网公司普遍较快节奏,但实习不强制加班。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

大模型技术对行业有变革意义,但作为实习生的日常工作更偏技术实现,社会价值感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

哔哩哔哩 的其他在招职位

  • 【B-UP】大模型算法工程师(视频理解)(实习)

    哔哩哔哩 · 上海市
    AI 估算 · 5k-10k
  • 【B-UP】推荐算法工程师(校招)

    哔哩哔哩 · 上海市
    AI 估算 · 20k-30k
  • 【B-UP】大语言模型(LLM)算法工程师(校招)

    哔哩哔哩 · 上海市
    AI 估算 · 20k-30k
  • 【B-UP】推荐算法工程师(实习)

    哔哩哔哩 · 上海市
    AI 估算 · 3k-6k
  • 【B-UP】模型开发工程师AI Infra(校招)

    哔哩哔哩 · 上海市
    AI 估算 · 20k-30k

相似职位推荐

  • 上车体布置集成工程师-人机工程方向

    小米 · 南京市
    AI 估算 · 15k-25k
  • 智慧零售算法工程师

    腾讯 · 武汉市
    AI 估算 · 20k-35k
  • 混元Agent后训练算法工程师(北京/上海/深圳)

    腾讯 · 北京市
    AI 估算 · 35k-65k
  • 混元VLM 预训练数据算法工程师(北京/深圳/上海)

    腾讯 · 北京市
    AI 估算 · 25k-40k
  • 算法工程师-大模型

    中国平安 · 深圳市
    AI 估算 · 25k-45k

哔哩哔哩 的其他在招职位

  • 【B-UP】大模型算法工程师(视频理解)(实习)

    哔哩哔哩 · 上海市
    AI 估算 · 5k-10k
  • 【B-UP】推荐算法工程师(校招)

    哔哩哔哩 · 上海市
    AI 估算 · 20k-30k
  • 【B-UP】大语言模型(LLM)算法工程师(校招)

    哔哩哔哩 · 上海市
    AI 估算 · 20k-30k
  • 【B-UP】推荐算法工程师(实习)

    哔哩哔哩 · 上海市
    AI 估算 · 3k-6k
  • 【B-UP】模型开发工程师AI Infra(校招)

    哔哩哔哩 · 上海市
    AI 估算 · 20k-30k

相似职位推荐

  • 上车体布置集成工程师-人机工程方向

    小米 · 南京市
    AI 估算 · 15k-25k
  • 智慧零售算法工程师

    腾讯 · 武汉市
    AI 估算 · 20k-35k
  • 混元Agent后训练算法工程师(北京/上海/深圳)

    腾讯 · 北京市
    AI 估算 · 35k-65k
  • 混元VLM 预训练数据算法工程师(北京/深圳/上海)

    腾讯 · 北京市
    AI 估算 · 25k-40k
  • 算法工程师-大模型

    中国平安 · 深圳市
    AI 估算 · 25k-45k