哔哩哔哩的大模型数据开发工程师薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

大模型数据开发工程师的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

该职位要求本科学历及中级经验工作经验。

🤖 AI 估测：¥35K-60K

发布时间：18 天前

该职位是哔哩哔哩的大模型数据开发工程师，主要负责构建和优化面向大模型训练的超大规模多模态数据处理流水线

你将设计高性能的数据算子库，研发与训练框架无缝集成的Dataloader，并建立数据质量评估体系，为算法团队提供高质量的训练数据支持

端到端数据流水线设计：负责设计、构建与优化面向大模型训练的超大规模多模态数据端到端处理流水线，覆盖数据获取、清洗、标注、质量验证到最终训练集生成的全过程

高性能数据算子库开发：抽象和封装多模态数据（文本、图像、视频、音频）的通用处理逻辑，设计并实现高性能、可复用的数据算子库（如：图像解帧、语音识别、文本分词、质量过滤、数据增强等）

训练数据Dataloader研发：深入跟进模型训练阶段，基于处理好的高质量数据集，研发与优化与PyTorch等训练框架无缝集成的高性Dataloader，确保训练过程中数据读取与加载的效率，解决I/O瓶颈，极大提升GPU利用率

流水线编排与效率提升：研发灵活的配置化流水线引擎，支持原子算子的快速编排，并持续优化全链路的数据处理速度和资源效率，快速响应算法团队的数据需求

质量与评估体系：建立数据质量监控与评估体系，确保输出数据集的洁净度、一致性与有效性，并能量化数据质量对最终模型效果的影响

计算机科学、软件工程、大数据或相关专业本科及以上学历，有3年以上数据开发或算法工程经验

精通Python，熟练使用Pandas、PyTorch等数据处理和深度学习框架，必须具备构建或优化训练数据Dataloader的实际经验

深入理解多模态数据的特性及处理技术，具备丰富的数据建模和数据架构经验，能够设计统一、高效的数据处理抽象

有使用Spark、Ray等分布式框架进行大规模数据处理的实战经验，理解其核心原理

具备优秀的业务理解能力和跨团队（数据、算法、Infra）沟通协作精神，责任心强，有严谨的问题排查与优化

大模型数据开发工程师

🤖 AI 估测：¥35K-60K

发布时间：18 天前