Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/哔哩哔哩/算法实习生(基础模型)【2027届】
Bilibili logo
B
哔哩哔哩 (Bilibili)

职位信息

上海市
初级经验
实习生
仅现场办公
学历未注明
实习/见习

标签

强化学习LLM机器翻译DeepSpeedMoEMegatron生成式推荐实验复现
💡

核心评价

顶尖互联网公司AI实习,技术栈前沿,成长性极佳,是进入大模型领域的黄金起点。

算法实习生(基础模型)【2027届】

🤖 AI 估测:¥8K-12K

发布时间:18 天前

立即应聘

ℹ️关于这个职位

这是一个面向2027届毕业生的算法实习生岗位,专注于基础模型方向
你将参与大规模MoE模型的持续预训练、强化学习训练流程、多语种机器翻译以及生成式推荐基础模型等多个前沿项目
工作内容包括数据处理、模型训练调优、实验脚本编写和评测工具构建,旨在支持模型上线前的质量验证

✓工作职责

参与大规模MoE模型的持续预训练(CPT):数据清洗与混合策略、训练调优与结果分析
参与RLVR/RLAIF强化学习训练流程:数据构建、reward 分析、训练调优
参与多语种机器翻译(MT)方向:语料处理、模型微调、评测
参与生成式推荐基础模型方向:构建用户行为与内容特征序列数据、生成式任务设计与模型微调(SFT/RFT)、离线评测与线上效果分析
参与Agentic RL(智能体强化学习)方向:搭建复杂交互环境与任务流、多步骤推理轨迹(Trajectory)收集、Reward设计与策略网络优化
编写实验脚本、构建评测工具,支持模型上线前的质量验证

⭐最低要求

深度学习基础扎实,熟悉Transformer原理,熟悉当前主流LLM架构
熟悉常见大模型训练框架(Megatron/DeepSpeed/Verl)
有LLM相关项目经验:CPT、SFT、RL 任意方向即可
有阅读论文与复现能力,能快速上手实验
良好的自我学习能力和独立思考能力

👍优先资格

有相关领域顶会论文,或拥有影响力工作
有自己的LLM项目
有机器翻译(MT)经验
熟悉生成式推荐(前沿进展,有相关研究或业务落地经验)
有 Agent RL相关的项目经验或算法调优经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

哔哩哔哩 的其他在招职位

  • 运维工程师

    哔哩哔哩

    上海市 · 仅现场办公

  • 交易生态-图书类目运营负责人

    哔哩哔哩

    上海市 · 仅现场办公

  • 社区生态运营

    哔哩哔哩

    上海市 · 仅现场办公

  • 海外社媒推广运营-猫耳FM国际版

    哔哩哔哩

    上海市 · 仅现场办公

  • 节目制作人

    哔哩哔哩

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公