Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Kwai logo
快手
【快Star】多模态生成模型计算效率优化工程师
立即应聘

【快Star】多模态生成模型计算效率优化工程师

发布于 大约 2 小时前

普通员工/个人贡献者

上海市 / 北京市
初级经验
全职员工
仅现场办公
硕士
线性代数
概率论
注意力机制
多模态生成模型
投机推理
Tilelang
Kv-Cache压缩
量化加速

AI 估算 · 22k–30k

快手校招硕士薪资通常22k-30k,技术核心岗位有竞争力,年终奖和股票补充,符合大厂水准。

职位详情

关于这个职位

该职位专注于多模态生成模型(如扩散模型、大语言模型)的计算效率优化,核心任务是设计高效注意力机制、低比特量化加速和投机推理方案

适合对生成式AI底层计算有浓厚兴趣、具备扎实数学和编程能力的研究型工程师

最低要求

硕士及以上学历,数学、计算机、自动化、电子等专业优先

熟悉Transformer结构及其变种,熟悉Attention的设计和多种变种实现,熟练使用Triton / TileLang 等工具
熟练掌握线性代数、概率论和矩阵论
有较强的自驱力和学习力,对生成式模型有强烈的兴趣

工作职责

高效Attention设计:探索新一代注意力实现机制,包括Sparse/Quant-Attention、Linear-Attention、Mamba等,破除Attention计算平方复杂度限制

量化加速:探索NV-FP4/INT4等低比特精度的量化后训练(QAT)和KV-cache压缩,优化计算效率且保证效果无损
投机推理:提升Auto-Regressive模型的生成效率,利用draft-verify机制实现低成本token生成

优先资格

有NIPS/ICLR/ICML/CVPR等顶会发表经历者优先

AI 洞察

优缺点分析

优点

  • 快手核心AI团队,参与前沿多模态生成模型研发,技术含金量高
  • 快Star校招项目提供完善培养体系,导师制帮助快速成长
  • 薪资和福利有竞争力,上市大厂稳定性好
  • 工作内容研究导向强,需要持续跟踪文献并实验,对数学和编程能力要求高
  • 大模型领域竞争激烈,需要快速产出成果并适应高强度迭代节奏

缺点 / 挑战

  • 适合数学基础扎实、对生成式AI底层优化有热情、喜欢挑战技术难题的应届硕士/博士

角色解读

  • 深耕计算效率方向,成为大模型推理优化专家,主导下一代架构设计
  • 横向扩展至多模态生成模型的全链路优化,包括训练和推理
  • 有机会发表顶级论文或推动技术落地,晋升为团队技术骨干或研究员
  • 设计和实现高效注意力机制,如稀疏注意力、线性注意力、Mamba等,降低计算复杂度
  • 开发低精度量化方案(FP4/INT4)并压缩KV缓存,平衡模型速度与精度
  • 优化自回归模型的生成效率,通过投机推理(draft-verify)实现低开销token生成
  • 扎实的Transformer和Attention机制原理,熟悉多种变种实现
  • 熟练使用Triton/TileLang等高性能计算工具,具备CUDA优化经验更佳
  • 精通线性代数、概率论和矩阵论,能推导和优化数学模型
  • 自驱力强,对生成式模型有热情,能快速学习新技术

申请策略

  • 投递时附上技术博客或GitHub项目链接,展示对计算优化的浓厚兴趣
  • 面试前准备一套完整的优化思路,从问题定义到解决方案量化对比
  • 突出Attention机制、量化或投机推理相关项目经历,包括实现细节和效果
  • 展示编程能力:Triton/CUDA优化经验、开源贡献或高性能计算项目
  • 若有顶会论文(如NeurIPS、ICLR)或相关竞赛获奖,重点标注
  • 强调数学基础(线性代数、概率论)和应用场景
  • 补充Triton/TileLang实践,完成一个简单的Attention优化demo
  • 精读1-2篇相关顶会论文(如FlashAttention、SmoothQuant),复现核心方法

面试指南

  • 先概述核心思想,再分步骤说明实现细节,最后对比性能和改进方向
  • 遇到开放设计问题,先定义目标,列出候选方案,分析trade-off,给出推荐方案并说明原因
  • 请解释FlashAttention的原理和优势,如何实现IO-aware优化?
  • 量化后训练(QAT)中如何平衡精度和速度,如果出现精度损失怎么办?
  • 投机推理中draft模型的选择策略和接收率优化方法有哪些?
  • 请用Triton实现一个简单的softmax kernel,并分析性能瓶颈
  • Transformer的平方复杂度限制,有哪些替代方案(如线性注意力)及其优缺点?
  • 复习Transformer论文和常见变种(如Mamba、Linear Attention),准备代码复现

匹配度报告

74
综合匹配度

快手校招核心AI岗,前沿技术栈,高成长性,但现场办公节奏快,WLB一般。

适合人群
最适合重视技术成长和前沿探索的求职者,愿意投入高强度工作换取快速提升。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活55
使命价值70

薪资福利匹配

80较高

快手作为上市大厂,薪资水平在行业中有竞争力,校招福利完善,但具体薪资需面议。

薪资信号未披露(AI估算:22K-30K/月)

成长发展匹配

90较高

该职位处于大模型效率优化前沿,技术挑战大,快Star项目提供强培养体系,成长空间极大。

技术前沿前沿/新兴技术
技术栈Attention、量化加速、投机推理、Triton、TileLang、Transformer
业务类型profit_center

工作生活匹配

55较低

仅现场办公,北京/上海核心地段,互联网公司通常节奏较快,但未明确WLB信息。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

多模态生成模型是当前AI热门方向,快手有大量用户场景,技术影响力大,但社会价值中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k