快手的【快Star】多模态生成模型计算效率优化工程师薪资是多少？

该职位薪资范围为 22k–30k（人民币/月）。

【快Star】多模态生成模型计算效率优化工程师的工作地点在哪里？

该职位工作地点位于上海市、北京市。工作形式为仅现场办公。

快手的【快Star】多模态生成模型计算效率优化工程师有什么任职要求？

该职位要求硕士学历及初级经验工作经验。

快手

【快Star】多模态生成模型计算效率优化工程师

立即应聘

【快Star】多模态生成模型计算效率优化工程师

发布于大约 2 个月前

普通员工/个人贡献者

上海市 / 北京市

初级经验

全职员工

仅现场办公

硕士

软件工程

Tilelang

多模态生成模型

投机推理

概率论

注意力机制

线性代数

Kv-Cache压缩

量化加速

AI 估算 · 22k–30k

快手校招硕士薪资通常22k-30k，技术核心岗位有竞争力，年终奖和股票补充，符合大厂水准。

职位详情

关于这个职位

该职位专注于多模态生成模型（如扩散模型、大语言模型）的计算效率优化，核心任务是设计高效注意力机制、低比特量化加速和投机推理方案

适合对生成式AI底层计算有浓厚兴趣、具备扎实数学和编程能力的研究型工程师

最低要求

硕士及以上学历，数学、计算机、自动化、电子等专业优先

熟悉Transformer结构及其变种，熟悉Attention的设计和多种变种实现，熟练使用Triton / TileLang 等工具

熟练掌握线性代数、概率论和矩阵论

有较强的自驱力和学习力，对生成式模型有强烈的兴趣

工作职责

高效Attention设计：探索新一代注意力实现机制，包括Sparse/Quant-Attention、Linear-Attention、Mamba等，破除Attention计算平方复杂度限制

量化加速：探索NV-FP4/INT4等低比特精度的量化后训练(QAT)和KV-cache压缩，优化计算效率且保证效果无损

投机推理：提升Auto-Regressive模型的生成效率，利用draft-verify机制实现低成本token生成

优先资格

有NIPS/ICLR/ICML/CVPR等顶会发表经历者优先

AI 洞察

优缺点分析

优点

快手核心AI团队，参与前沿多模态生成模型研发，技术含金量高
快Star校招项目提供完善培养体系，导师制帮助快速成长
薪资和福利有竞争力，上市大厂稳定性好
工作内容研究导向强，需要持续跟踪文献并实验，对数学和编程能力要求高
大模型领域竞争激烈，需要快速产出成果并适应高强度迭代节奏

缺点 / 挑战

适合数学基础扎实、对生成式AI底层优化有热情、喜欢挑战技术难题的应届硕士/博士

角色解读

深耕计算效率方向，成为大模型推理优化专家，主导下一代架构设计
横向扩展至多模态生成模型的全链路优化，包括训练和推理
有机会发表顶级论文或推动技术落地，晋升为团队技术骨干或研究员
设计和实现高效注意力机制，如稀疏注意力、线性注意力、Mamba等，降低计算复杂度
开发低精度量化方案（FP4/INT4）并压缩KV缓存，平衡模型速度与精度
优化自回归模型的生成效率，通过投机推理（draft-verify）实现低开销token生成
扎实的Transformer和Attention机制原理，熟悉多种变种实现
熟练使用Triton/TileLang等高性能计算工具，具备CUDA优化经验更佳
精通线性代数、概率论和矩阵论，能推导和优化数学模型
自驱力强，对生成式模型有热情，能快速学习新技术

申请策略

投递时附上技术博客或GitHub项目链接，展示对计算优化的浓厚兴趣
面试前准备一套完整的优化思路，从问题定义到解决方案量化对比
突出Attention机制、量化或投机推理相关项目经历，包括实现细节和效果
展示编程能力：Triton/CUDA优化经验、开源贡献或高性能计算项目
若有顶会论文（如NeurIPS、ICLR）或相关竞赛获奖，重点标注
强调数学基础（线性代数、概率论）和应用场景
补充Triton/TileLang实践，完成一个简单的Attention优化demo
精读1-2篇相关顶会论文（如FlashAttention、SmoothQuant），复现核心方法

面试指南

先概述核心思想，再分步骤说明实现细节，最后对比性能和改进方向
遇到开放设计问题，先定义目标，列出候选方案，分析trade-off，给出推荐方案并说明原因
请解释FlashAttention的原理和优势，如何实现IO-aware优化？
量化后训练（QAT）中如何平衡精度和速度，如果出现精度损失怎么办？
投机推理中draft模型的选择策略和接收率优化方法有哪些？
请用Triton实现一个简单的softmax kernel，并分析性能瓶颈
Transformer的平方复杂度限制，有哪些替代方案（如线性注意力）及其优缺点？
复习Transformer论文和常见变种（如Mamba、Linear Attention），准备代码复现

职位点评

综合评分

快手校招核心AI岗，前沿技术栈，高成长性，但现场办公节奏快，WLB一般。

更适合这类人

最适合重视技术成长和前沿探索的求职者，愿意投入高强度工作换取快速提升。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展90

工作生活55

使命价值70

薪资福利

80较高

快手作为上市大厂，薪资水平在行业中有竞争力，校招福利完善，但具体薪资需面议。

薪资信号未披露（AI估算：22K-30K/月）

成长发展

90较高

该职位处于大模型效率优化前沿，技术挑战大，快Star项目提供强培养体系，成长空间极大。

技术前沿前沿/新兴技术

技术栈Attention、量化加速、投机推理、Triton、TileLang、Transformer

业务类型profit_center

工作生活

55较低

仅现场办公，北京/上海核心地段，互联网公司通常节奏较快，但未明确WLB信息。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

多模态生成模型是当前AI热门方向，快手有大量用户场景，技术影响力大，但社会价值中性。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

快手

【快Star】多模态生成模型计算效率优化工程师

立即应聘

【快Star】多模态生成模型计算效率优化工程师

发布于大约 2 个月前

普通员工/个人贡献者

上海市 / 北京市

初级经验

全职员工

仅现场办公

硕士

软件工程

Tilelang

多模态生成模型

投机推理

概率论

注意力机制

线性代数

Kv-Cache压缩

量化加速

AI 估算 · 22k–30k

快手校招硕士薪资通常22k-30k，技术核心岗位有竞争力，年终奖和股票补充，符合大厂水准。

职位详情

关于这个职位

该职位专注于多模态生成模型（如扩散模型、大语言模型）的计算效率优化，核心任务是设计高效注意力机制、低比特量化加速和投机推理方案

适合对生成式AI底层计算有浓厚兴趣、具备扎实数学和编程能力的研究型工程师

最低要求

硕士及以上学历，数学、计算机、自动化、电子等专业优先

熟悉Transformer结构及其变种，熟悉Attention的设计和多种变种实现，熟练使用Triton / TileLang 等工具

熟练掌握线性代数、概率论和矩阵论

有较强的自驱力和学习力，对生成式模型有强烈的兴趣

工作职责

高效Attention设计：探索新一代注意力实现机制，包括Sparse/Quant-Attention、Linear-Attention、Mamba等，破除Attention计算平方复杂度限制

量化加速：探索NV-FP4/INT4等低比特精度的量化后训练(QAT)和KV-cache压缩，优化计算效率且保证效果无损

投机推理：提升Auto-Regressive模型的生成效率，利用draft-verify机制实现低成本token生成

优先资格

有NIPS/ICLR/ICML/CVPR等顶会发表经历者优先

AI 洞察

优缺点分析

优点

快手核心AI团队，参与前沿多模态生成模型研发，技术含金量高
快Star校招项目提供完善培养体系，导师制帮助快速成长
薪资和福利有竞争力，上市大厂稳定性好
工作内容研究导向强，需要持续跟踪文献并实验，对数学和编程能力要求高
大模型领域竞争激烈，需要快速产出成果并适应高强度迭代节奏

缺点 / 挑战

适合数学基础扎实、对生成式AI底层优化有热情、喜欢挑战技术难题的应届硕士/博士

角色解读

深耕计算效率方向，成为大模型推理优化专家，主导下一代架构设计
横向扩展至多模态生成模型的全链路优化，包括训练和推理
有机会发表顶级论文或推动技术落地，晋升为团队技术骨干或研究员
设计和实现高效注意力机制，如稀疏注意力、线性注意力、Mamba等，降低计算复杂度
开发低精度量化方案（FP4/INT4）并压缩KV缓存，平衡模型速度与精度
优化自回归模型的生成效率，通过投机推理（draft-verify）实现低开销token生成
扎实的Transformer和Attention机制原理，熟悉多种变种实现
熟练使用Triton/TileLang等高性能计算工具，具备CUDA优化经验更佳
精通线性代数、概率论和矩阵论，能推导和优化数学模型
自驱力强，对生成式模型有热情，能快速学习新技术

申请策略

投递时附上技术博客或GitHub项目链接，展示对计算优化的浓厚兴趣
面试前准备一套完整的优化思路，从问题定义到解决方案量化对比
突出Attention机制、量化或投机推理相关项目经历，包括实现细节和效果
展示编程能力：Triton/CUDA优化经验、开源贡献或高性能计算项目
若有顶会论文（如NeurIPS、ICLR）或相关竞赛获奖，重点标注
强调数学基础（线性代数、概率论）和应用场景
补充Triton/TileLang实践，完成一个简单的Attention优化demo
精读1-2篇相关顶会论文（如FlashAttention、SmoothQuant），复现核心方法

面试指南

先概述核心思想，再分步骤说明实现细节，最后对比性能和改进方向
遇到开放设计问题，先定义目标，列出候选方案，分析trade-off，给出推荐方案并说明原因
请解释FlashAttention的原理和优势，如何实现IO-aware优化？
量化后训练（QAT）中如何平衡精度和速度，如果出现精度损失怎么办？
投机推理中draft模型的选择策略和接收率优化方法有哪些？
请用Triton实现一个简单的softmax kernel，并分析性能瓶颈
Transformer的平方复杂度限制，有哪些替代方案（如线性注意力）及其优缺点？
复习Transformer论文和常见变种（如Mamba、Linear Attention），准备代码复现

职位点评

综合评分

快手校招核心AI岗，前沿技术栈，高成长性，但现场办公节奏快，WLB一般。

更适合这类人

最适合重视技术成长和前沿探索的求职者，愿意投入高强度工作换取快速提升。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展90

工作生活55

使命价值70

薪资福利

80较高

快手作为上市大厂，薪资水平在行业中有竞争力，校招福利完善，但具体薪资需面议。

薪资信号未披露（AI估算：22K-30K/月）

成长发展

90较高

该职位处于大模型效率优化前沿，技术挑战大，快Star项目提供强培养体系，成长空间极大。

技术前沿前沿/新兴技术

技术栈Attention、量化加速、投机推理、Triton、TileLang、Transformer

业务类型profit_center

工作生活

55较低

仅现场办公，北京/上海核心地段，互联网公司通常节奏较快，但未明确WLB信息。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

多模态生成模型是当前AI热门方向，快手有大量用户场景，技术影响力大，但社会价值中性。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

【快Star】多模态生成模型计算效率优化工程师

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

【快Star】多模态生成模型计算效率优化工程师

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

快手 的其他在招职位

大客户销售经理（3c家电方向）-【电商】

UX设计实习生(场域导购与AI设计）-【电商】

快手达人运营-【电商】

大客户销售（酒旅方向）-【生活服务】

广告投放与达人营销实习生（可灵AI专项）

相似职位推荐

高级软件研发工程师

营销增长工程师/架构师

高级专家工程师-实线TL（运力平台方向）

高级算法工程师

高级/资深 agent研发工程师

快手 的其他在招职位

大客户销售经理（3c家电方向）-【电商】

UX设计实习生(场域导购与AI设计）-【电商】

快手达人运营-【电商】

大客户销售（酒旅方向）-【生活服务】

广告投放与达人营销实习生（可灵AI专项）

相似职位推荐

高级软件研发工程师

营销增长工程师/架构师

高级专家工程师-实线TL（运力平台方向）

高级算法工程师

高级/资深 agent研发工程师

快手的其他在招职位

快手的其他在招职位