Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Kwai logo
快手
【快Star】多模态推理平台工程师
立即应聘

【快Star】多模态推理平台工程师

发布于 大约 2 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
分布式系统
PyTorch
多模态
AIOps
AIGC
SGLang
vLLM
大模型推理

AI 估算 · 25k–45k

快手为互联网大厂,北京中高级工程师薪资具有市场竞争力,该岗位涉及前沿AI技术,薪资水平较高。

职位详情

关于这个职位

该职位负责快手多模态推理平台的建设,涉及大模型分布式推理工作流、AIOps平台和Agent应用开发

你将参与端到端部署与优化,使用Python/Java等技术栈,与团队协作加速业务迭代
适合对前沿AI技术有热情的工程师

最低要求

本科及以上学历,计算机、软件工程、人工智能等相关专业优先

计算机和编程基础扎实,熟练掌握Java或Python,有服务端系统的开发经验
有较强的工作责任心和自驱力,较好的学习能力和沟通能力,良好的工作文档习惯

工作职责

多模态推理工作流架构,设计并实现多阶段分布式推理工作流,支持视觉/文本/音频等多模态内容生成任务,负责大模型服务的端到端开发与部署,包括模型集成、API封装及异构资源调度优化

AIOPS平台建设与协作提效,构建面向大模型业务的全生命周期AIOPS平台,覆盖开发、测试、监控全流程,建设标准化工具链与自动化流程,落地跨团队高效协作范式,加速业务迭代与成果转化
Agent应用开发,支持TOC多模态AIGC任务的编排计算,利用Agent能力辅助用户进行复杂视频生成等

优先资格

熟悉大模型推理或训练框架(如vLLM、SGLang、PyTorch等)、云原生编排调度者优先

AI 洞察

优缺点分析

优点

  • 快手平台流量大,业务场景丰富,AIGC领域发展迅速
  • 涉及前沿的大模型推理技术栈,技术积累价值高
  • 团队技术氛围浓厚,能接触到业界先进实践
  • 大模型推理优化复杂,需要深入了解底层原理和框架源码
  • 互联网大厂工作强度较大,可能需要适应加班节奏
  • 技术栈更新快,需要持续学习新框架和工具
  • 适合对大模型推理和分布式系统有浓厚兴趣、具备较强自驱力和学习能力的技术工程师

缺点 / 挑战

暂无明显挑战项

角色解读

  • 成为大模型基础设施专家,深入推理优化与架构设计
  • 向系统架构师方向发展,负责大规模分布式系统设计
  • 有机会转向技术管理或AI产品经理,结合业务推动创新
  • 设计和实现多模态推理工作流,支持分布式部署和异构资源调度,保障大模型服务的高效运行
  • 构建AIOps平台,覆盖开发测试监控全流程,提升团队协作与业务迭代效率
  • 开发Agent应用,支持TOC多模态AIGC任务的编排计算,辅助用户进行复杂视频生成
  • 扎实的编程基础,熟悉Python或Java,具备服务端开发经验
  • 理解大模型推理框架(如vLLM、SGLang)和分布式系统原理
  • 掌握云原生技术(如Kubernetes)和编排调度

申请策略

  • 深入了解快手AI业务(如视频生成、内容理解),展示对多模态推理的热情
  • 准备一个完整的项目案例,说明从设计到部署的思考过程
  • 突出大模型推理或训练相关项目经验,展示对框架的理解
  • 强调分布式系统设计经验,如微服务、容器化等
  • 列出云原生技术实践,如Kubernetes编排案例
  • 熟悉vLLM、SGLang等推理框架的源码和优化方法
  • 提高分布式调度和异构计算知识,学习Kubernetes Operator
  • 了解Agent相关技术,如LangChain、ReAct模式

面试指南

  • 结合项目经验,从系统架构、优化策略、实际效果等方面系统回答
  • 先阐述设计目标,再分步骤说明实现方案,最后总结权衡
  • 如何优化大模型推理延迟和吞吐量?
  • 设计一个多阶段分布式推理工作流,需要考虑哪些因素?
  • 对比vLLM和SGLang的特点和适用场景
  • 如何处理异构资源(CPU/GPU/NPU)的调度?
  • Agent应用在复杂视频生成中如何设计编排逻辑?
  • 复习大模型推理优化技术,包括量化、批处理、KV Cache等

匹配度报告

69
综合匹配度

快手快Star,大模型推理平台,前沿技术栈,薪资优厚,但工作强度较大。

适合人群
该职位最适合追求技术成长、希望接触前沿AI领域且能接受较强工作节奏的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展85
工作生活50
使命价值60

薪资福利匹配

80较高

该职位作为快手快Star项目,提供具有市场竞争力的薪资和股票期权,福利体系完善(如五险一金、补充医疗等),但JD未明确列出具体数字,综合判断薪资满足度较高。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

85较高

职位涉及多模态大模型推理等前沿技术,技术栈先进,能接触到分布式系统全流程,成长空间大,但JD未明确提及晋升通道或培训计划。

技术前沿前沿/新兴技术
技术栈vLLM、SGLang、PyTorch、Kubernetes、分布式系统、Agent
业务类型profit_center

工作生活匹配

50较低

快手北京总部位于科技园区,办公环境良好但通勤可能耗时,互联网大厂通常工作节奏较快,JD未提及弹性工作或远程选项,生活平衡一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

60中等

快手在短视频和直播领域有广泛用户基础,AIGC业务具有创新性,但社会影响力中性,行业属于高速增长赛道,但使命感信号不明显。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k