Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/哔哩哔哩/算法工程师-多模态大模型内容理解方向
Bilibili logo
B
哔哩哔哩 (Bilibili)

职位信息

上海市
中级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

PyTorch强化学习LLM模型蒸馏分布式训练多模态大模型
💡

核心评价

前沿AI大厂核心岗,技术成长性极佳,薪资竞争力强,工作地点固定。

算法工程师-多模态大模型内容理解方向

🤖 AI 估测:¥35K-60K

发布时间:5 天前

立即应聘

ℹ️关于这个职位

这是一个专注于多模态大模型内容理解方向的算法工程师岗位
你将负责大语言模型的后训练与迭代,运用强化学习、蒸馏等技术优化模型性能,并参与训练工程平台化与评测体系建设
该职位要求你具备扎实的机器学习基础和前沿技术探索能力,在哔哩哔哩的业务场景下推动AI模型的实际应用与落地

✓工作职责

工作职责:
大语言模型后训练与迭代
●在真实业务数据与线上反馈驱动下,设计并实现大语言模型的后训练方案,包括 SFT、RL,以及其他蒸馏方案等
●围绕目标场景(理解、分类、生成、抽取等)持续优化模型能力与泛化表现
强化学习训练策略与算法实现
●参与或负责 GRPO、GSPO、DAPO 等强化学习算法在多模态/LLM后训练中的落地
●可以在不同场景下,设计不同的奖励模型/打分器(Reward/Preference),优化采样、优势估计、KL约束与训练稳定性,提升对齐质量与可控性
蒸馏与轻量化落地
●探索 教师-学生蒸馏、偏好蒸馏、数据蒸馏、logits/hidden states蒸馏等方法,在效果与成本之间做权衡
●支持模型在推理侧的效率优化(吞吐、延迟、显存),配合业务达成线上成本指标
●需要有技术敏感性,在该方向上可以进行前沿研究的探索
训练工程与平台化支持
●基于 LLaMA-Factory、EasyR1、Verl等训练框架完成数据流水线、训练配置、实验管理与复现
●与数据、产品、工程团队协作,建立“数据—训练—评估—上线—反馈”的闭环体系
评测体系与问题分析
●建立或维护离线评测集与线上A/B策略,定义指标(有效性、鲁棒性、安全性、可控性等)
●针对badcase进行归因分析(数据分布、奖励偏置、过拟合、幻觉、工具调用失败等),提出可执行优化方案

⭐最低要求

基础能力
●计算机/数学/统计/人工智能相关专业,硕士及以上
●1-3 年多模态内容理解、计算机视觉、自然语言处理或内容安全相关工作经验
●扎实的机器学习与深度学习基础,精通 Transformer 架构与主流多模态大模型(LLaVA、Qwen-VL、InternVL 等)
●熟练使用 Python,具备良好的工程实现与调试能力(PyTorch、训练日志分析、实验复现等)
后训练与算法经验
●熟悉并有实践经历:SFT、RLHF/RLAIF、DPO/IPO类、蒸馏 等后训练方法中的一种或多种
●熟悉GRPO、GSPO、DAPO等强化学习算法的基本原理与实现细节(采样、优势、KL、稳定性技巧等)
●熟悉蒸馏相关方法(teacher forcing、logits distill、偏好蒸馏、数据蒸馏/过滤等)
框架与工具链
●熟悉 LLaMA-Factory、EasyR1、Verl 等训练框架的配置与调参流程
●熟悉分布式训练/并行策略(DDP、ZeRO、梯度累积、混合精度等)者优先

👍优先资格

加分项(Nice to Have)
●有大规模低质内容识别、反搬运、反作弊或内容审核系统建设经验者优先
●有大语言模型训练经验,尤其是SFT和RL之间的互补和效果分析
●熟悉推理与部署优化:vLLM/TensorRT-LLM、量化、KV Cache优化、吞吐/延迟分析
●在顶会/开源社区有论文/代码贡献(GitHub、HF、论文复现等)
●熟悉数据处理:偏好数据构建、数据去噪、难例挖掘、自动标注与质量控制
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

哔哩哔哩 的其他在招职位

  • 运维工程师

    哔哩哔哩

    上海市 · 仅现场办公

  • 交易生态-图书类目运营负责人

    哔哩哔哩

    上海市 · 仅现场办公

  • 社区生态运营

    哔哩哔哩

    上海市 · 仅现场办公

  • 海外社媒推广运营-猫耳FM国际版

    哔哩哔哩

    上海市 · 仅现场办公

  • 节目制作人

    哔哩哔哩

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公