Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/哔哩哔哩/资深大模型数据开发工程师-AI搜方向
Bilibili logo
B
哔哩哔哩 (Bilibili)

职位信息

上海市
高级经验
全职员工
仅现场办公
本科
基层主管/组长

标签

团队管理数据工程RAGGPU集群大模型多模态数据处理
💡

核心评价

前沿AI搜索数据工程岗,技术成长空间巨大,平台优势明显,但可能面临较高工作强度。

资深大模型数据开发工程师-AI搜方向

🤖 AI 估测:¥45K-80K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

该职位是哔哩哔哩AI搜索方向的核心数据工程岗位
你将负责从零到一搭建服务于大模型的专属数据体系,包括知识库、检索材料库等,并处理站内外的百亿级多模态数据(图文、音视频、弹幕)
你需要设计并开发高效的分布式数据处理流水线,优化算力与存储,并带领团队推动数据驱动搜索体验的闭环优化

✓工作职责

工作职责:
围绕B站AI搜业务,从0到1搭建搜索场景专属大模型数据体系,包括垂类知识库、RAG检索材料库、用户Query数据池等,实现数据分钟/小时级低延迟更新,支撑搜素精准度、响应速度提升
负责B站站内+站外高质量数据的采集、整合与治理,覆盖图文/音视频/弹幕等B站特色多模态数据、全网泛知识/泛娱乐类数据,处理百亿级海量数据,为AI搜大模型训练、推理提供优质语料
设计适配B站内容生态的数据采集-清洗-打标-入库-迭代标准化流程,开发基于Ray/Spark的分布式数据处理Pipeline,适配音视频/弹幕等特色数据处理需求,实现CPU/GPU动态编排,支撑日均TB级AI训练数据自动化处理
优化算力与存储体系,结合B站多模态数据特点设计分级存储方案,提升GPU利用率、降低存储成本
搭建元数据管理与数据血缘追踪体系,缩短数据问题追溯时间,保障AI搜数据链路稳定性
基于B站AI搜用户行为,构建Query驱动的数据飞轮,实现RAG材料、搜索反馈数据的自动化沉淀与迭代,推动“数据-模型-搜索体验”的闭环优化
跨部门协同B站算法、Infra、内容生态等团队,对齐AI搜数据需求,从数据层面推动搜索场景大模型应用落地
带领3-10人数据工程团队,统筹数据基建、Pipeline开发与维护等工作
探索B站特色多模态数据融合方案(文本-音视频-弹幕),构建高质量对齐数据集,助力AI搜多模态大模型研发与场景化应用

⭐最低要求

【硬性要求】
本科及以上学历,计算机、大数据、人工智能等相关专业,5年以上AI数据开发/数据工程相关工作经验,有大厂大模型/搜索/内容平台数据领域从业经历优先
精通Python开发,熟练掌握Ray/Spark/Hadoop等分布式数据处理框架,了解GPU异构集群管理、MinIO/Alluxio等存储技术,有爬虫系统开发、多模态数据处理经验者优先
熟悉内容平台数据特点(如音视频/弹幕/UGC)者加分
有AI数据体系从0到1搭建经验,主导过大模型知识库、RAG材料库、多模态数据集等项目落地,能独立完成搜索/内容场景数据处理架构设计与工程化实现
具备海量数据处理能力,有处理TB/PB级文本、千万小时级音视频、百亿级网页/UGC数据的实战经验,能实现数据分钟/小时级低延迟采集/更新
有可量化的项目成果,如GPU利用率提升至80%+、存储成本降低30%+、数据问题追溯从小时级缩短至分钟级、推动大模型/搜索业务体验显著提升等

👍优先资格

【软性要求】
具备极强的从0到1开荒能力,能结合内容/搜索场景特点解决海量多模态数据处理、算力调度等实际工程问题,推动数据项目从无到有落地并规模化运营
跨部门协调与沟通能力突出,能高效对齐算法、Infra、内容运营等多方需求,推动数据能力与B站AI搜业务的协同发展
动手能力(Hands on)强,深度参与业务与架构设计,能快速定位并解决数据采集、处理、治理全流程问题,保障AI搜数据链路高效稳定
能统筹团队目标、分配工作、推动项目落地,具备良好的团队激励与培养意识
对大模型+搜索场景有一定理解,熟悉内容平台用户行为与数据特点,能结合B站AI搜业务需求设计定制化数据方案,推动数据驱动搜索算法与体验提升
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

哔哩哔哩 的其他在招职位

  • 运维工程师

    哔哩哔哩

    上海市 · 仅现场办公

  • 交易生态-图书类目运营负责人

    哔哩哔哩

    上海市 · 仅现场办公

  • 社区生态运营

    哔哩哔哩

    上海市 · 仅现场办公

  • 海外社媒推广运营-猫耳FM国际版

    哔哩哔哩

    上海市 · 仅现场办公

  • 节目制作人

    哔哩哔哩

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公