哔哩哔哩的算法工程师-多模态大模型内容理解方向薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

算法工程师-多模态大模型内容理解方向的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

哔哩哔哩的算法工程师-多模态大模型内容理解方向有什么任职要求？

该职位要求硕士学历及中级经验工作经验。

算法工程师-多模态大模型内容理解方向

🤖 AI 估测：¥35K-60K

发布时间：5 天前

立即应聘

ℹ️关于这个职位

这是一个专注于多模态大模型内容理解方向的算法工程师岗位

你将负责大语言模型的后训练与迭代，运用强化学习、蒸馏等技术优化模型性能，并参与训练工程平台化与评测体系建设

该职位要求你具备扎实的机器学习基础和前沿技术探索能力，在哔哩哔哩的业务场景下推动AI模型的实际应用与落地

✓工作职责

工作职责:

大语言模型后训练与迭代

●在真实业务数据与线上反馈驱动下，设计并实现大语言模型的后训练方案，包括 SFT、RL，以及其他蒸馏方案等

●围绕目标场景（理解、分类、生成、抽取等）持续优化模型能力与泛化表现

强化学习训练策略与算法实现

●参与或负责 GRPO、GSPO、DAPO 等强化学习算法在多模态/LLM后训练中的落地

●可以在不同场景下，设计不同的奖励模型/打分器（Reward/Preference），优化采样、优势估计、KL约束与训练稳定性，提升对齐质量与可控性

蒸馏与轻量化落地

●探索教师-学生蒸馏、偏好蒸馏、数据蒸馏、logits/hidden states蒸馏等方法，在效果与成本之间做权衡

●支持模型在推理侧的效率优化（吞吐、延迟、显存），配合业务达成线上成本指标

●需要有技术敏感性，在该方向上可以进行前沿研究的探索

训练工程与平台化支持

●基于 LLaMA-Factory、EasyR1、Verl等训练框架完成数据流水线、训练配置、实验管理与复现

●与数据、产品、工程团队协作，建立“数据—训练—评估—上线—反馈”的闭环体系

评测体系与问题分析

●建立或维护离线评测集与线上A/B策略，定义指标（有效性、鲁棒性、安全性、可控性等）

●针对badcase进行归因分析（数据分布、奖励偏置、过拟合、幻觉、工具调用失败等），提出可执行优化方案

⭐最低要求

基础能力

●计算机/数学/统计/人工智能相关专业，硕士及以上

●1-3 年多模态内容理解、计算机视觉、自然语言处理或内容安全相关工作经验

●扎实的机器学习与深度学习基础，精通 Transformer 架构与主流多模态大模型（LLaVA、Qwen-VL、InternVL 等）

●熟练使用 Python，具备良好的工程实现与调试能力（PyTorch、训练日志分析、实验复现等）

后训练与算法经验

●熟悉并有实践经历：SFT、RLHF/RLAIF、DPO/IPO类、蒸馏等后训练方法中的一种或多种

●熟悉GRPO、GSPO、DAPO等强化学习算法的基本原理与实现细节（采样、优势、KL、稳定性技巧等）

●熟悉蒸馏相关方法（teacher forcing、logits distill、偏好蒸馏、数据蒸馏/过滤等）

框架与工具链

●熟悉 LLaMA-Factory、EasyR1、Verl 等训练框架的配置与调参流程

●熟悉分布式训练/并行策略（DDP、ZeRO、梯度累积、混合精度等）者优先

👍优先资格

加分项（Nice to Have）

●有大规模低质内容识别、反搬运、反作弊或内容审核系统建设经验者优先

●有大语言模型训练经验，尤其是SFT和RL之间的互补和效果分析

●熟悉推理与部署优化：vLLM/TensorRT-LLM、量化、KV Cache优化、吞吐/延迟分析

●在顶会/开源社区有论文/代码贡献（GitHub、HF、论文复现等）

●熟悉数据处理：偏好数据构建、数据去噪、难例挖掘、自动标注与质量控制

算法工程师-多模态大模型内容理解方向

🤖 AI 估测：¥35K-60K

发布时间：5 天前

核心评价