Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Bilibili logo
哔哩哔哩
大模型推理平台开发工程师
立即应聘

大模型推理平台开发工程师

发布于 大约 20 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
本科
分布式系统
GPU
GO
LLM
DeepSpeed
vLLM
TensorRT-LLM

AI 估算 · 40k–60k

大模型推理平台开发人才稀缺,B站作为互联网大厂,薪资有竞争力,参考上海高级工程师市场水平。

职位详情

关于这个职位

该职位负责设计并开发大模型推理平台,包括架构设计、GPU集群资源调度优化、推理加速引擎集成,以及监控运维体系搭建,支撑业务模型高效稳定运行

适合对AI基础设施有热情、具备扎实编程和云原生经验的工程师

最低要求

计算机相关专业本科及以上学历,具备扎实的编程功底(精通 Python 或 Go/C++)

熟悉云原生技术栈,精通 Docker、Kubernetes (K8s) 及其调度原理,有大规模GPU集群调度开发经验者优先
深入理解主流大模型(如LLaMA系列、Qwen、DeepSeek等)的推理原理,熟悉分布式推理框架(如Ray, DeepSpeed)
具备优秀的工程落地能力,能够独立负责从模型接入、性能优化到平台化交付的完整链路

工作职责

负责大模型推理平台的架构设计与核心功能开发,支撑业务模型的高效上线与稳定服务

负责GPU集群的资源管理与调度系统开发,优化多租户环境下的资源隔离、配额管理及弹性伸缩
深入研究并落地主流推理加速引擎(如vLLM, TensorRT-LLM, TGI等),持续提升模型推理性能与资源利用率
搭建完善的推理服务监控与自动化运维体系,保障高并发场景下服务的低延迟与高可用

AI 洞察

优缺点分析

优点

  • 接触最前沿的大模型推理技术和加速框架,技术成长迅速
  • 公司已上市且规模大,平台稳定,薪资福利有竞争力
  • 技术深度要求高,需要同时掌握底层系统、云原生和AI框架
  • 高并发低延迟场景对系统性能与稳定性提出严苛要求
  • 大模型领域迭代极快,需要持续学习和跟进新技术

缺点 / 挑战

  • B站作为大型互联网平台,数据丰富、业务场景多样,挑战与机遇并存
  • 适合对AI基础设施有强烈兴趣、喜欢解决性能挑战、具备较强工程能力的后端或系统工程师

角色解读

  • 成为AI基础设施领域专家,主导大模型推理平台架构演进
  • 向AI平台架构师方向发展,负责整体AI基础设施的设计与规划
  • 积累技术管理经验,带领团队攻克高性能计算与分布式系统难题
  • 设计并开发大模型推理平台架构,支撑业务模型高效上线与稳定服务
  • 优化GPU集群的资源管理与调度系统,实现多租户环境下的资源隔离与弹性伸缩
  • 研究并落地主流推理加速引擎(如vLLM、TensorRT-LLM),提升推理性能与资源利用率
  • 搭建推理服务的监控与自动化运维体系,保障高并发场景下的低延迟与高可用
  • 精通Python、Go或C++,具备扎实的编程功底
  • 熟悉云原生技术栈,精通Docker、Kubernetes及其调度原理,有大规模GPU集群调度经验
  • 深入理解大模型推理原理,熟悉分布式推理框架如Ray、DeepSpeed
  • 优秀的工程落地能力,能独立完成从模型接入到平台化交付的完整链路

申请策略

  • 在简历和面试中体现对推理延迟优化、资源利用率提升的量化成果
  • 关注B站技术博客和开源项目,了解其技术栈和业务方向
  • 突出GPU集群调度或分布式训练/推理项目经验,展示性能优化成果
  • 强调对Kubernetes、Docker等云原生技术的深入理解和实战案例
  • 展示使用vLLM、DeepSpeed等推理加速框架的具体项目细节
  • 学习主流推理加速引擎(如vLLM、TensorRT-LLM)的内部原理和使用方法
  • 深入Kubernetes调度器,了解GPU资源调度和扩展机制

面试指南

  • 对于技术问题,先阐述原理,再结合实际项目经验,强调优化思路和结果
  • 对于设计问题,采用分层方法:先分解需求,再讨论架构组件、关键权衡和可行性
  • 项目介绍使用STAR法则:情境、任务、行动、结果,突出个人贡献和技术难点
  • 如何优化大模型推理的延迟和吞吐量?请结合具体框架说明
  • Kubernetes中如何实现GPU资源的调度与隔离?
  • 请描述一个你参与过的大模型推理或分布式系统项目,涉及哪些挑战和解决方案?
  • vLLM与TensorRT-LLM的优缺点对比,如何选择?
  • 设计一个高可用的大模型推理服务架构,需要考虑哪些关键点?

匹配度报告

68
综合匹配度

大厂前沿技术岗,薪资优厚,技术成长快,但工作强度可能较大。

适合人群
适合追求技术成长、愿意投入高强度学习的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展85
工作生活40
使命价值70

薪资福利匹配

75中等

薪资水平预计较高,但JD未明确提及福利,动机满足度中等偏上。

薪资信号未披露(AI估算:40K-60K/月)

成长发展匹配

85较高

技术栈前沿,成长空间大,但JD未明确晋升路径,动机满足度较高。

技术前沿前沿/新兴技术
技术栈Python、Go、C++、Docker、Kubernetes、GPU、LLM、vLLM、TensorRT-LLM、DeepSpeed、Ray
业务类型ambiguous

工作生活匹配

40较低

仅现场办公,上海通勤压力可能较大,JD未提及WLB,动机满足度低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型是高速增长赛道,对社会影响中性,创新水平较高,动机满足度中上。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

哔哩哔哩 的其他在招职位

  • AI数据基建工程师

    哔哩哔哩 · 上海市
    AI 估算 · 25k-45k
  • 海外钱包产品经理

    哔哩哔哩 · 上海市
    AI 估算 · 25k-45k
  • 销售管理(销售BP)

    哔哩哔哩 · 上海市
    AI 估算 · 25k-40k
  • 商业化-行业运营(本土美妆方向)

    哔哩哔哩 · 上海市
    AI 估算 · 20k-30k
  • 美妆鞋服行业运营-效果方向

    哔哩哔哩 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • 支付架构工程师-【电商】

    快手 · 北京市
    AI 估算 · 35k-65k
  • Java开发工程师(B端商家)-【电商】

    快手 · 杭州市
    AI 估算 · 25k-45k
  • 前端开发工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k
  • 前端开发高级工程师(web)

    中国平安 · 深圳市
    AI 估算 · 20k-35k
  • 后端开发高级工程师

    中国平安 · 深圳市
    AI 估算 · 25k-40k

哔哩哔哩 的其他在招职位

  • AI数据基建工程师

    哔哩哔哩 · 上海市
    AI 估算 · 25k-45k
  • 海外钱包产品经理

    哔哩哔哩 · 上海市
    AI 估算 · 25k-45k
  • 销售管理(销售BP)

    哔哩哔哩 · 上海市
    AI 估算 · 25k-40k
  • 商业化-行业运营(本土美妆方向)

    哔哩哔哩 · 上海市
    AI 估算 · 20k-30k
  • 美妆鞋服行业运营-效果方向

    哔哩哔哩 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • 支付架构工程师-【电商】

    快手 · 北京市
    AI 估算 · 35k-65k
  • Java开发工程师(B端商家)-【电商】

    快手 · 杭州市
    AI 估算 · 25k-45k
  • 前端开发工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k
  • 前端开发高级工程师(web)

    中国平安 · 深圳市
    AI 估算 · 20k-35k
  • 后端开发高级工程师

    中国平安 · 深圳市
    AI 估算 · 25k-40k