Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Kwai logo
快手
【快Star】多模态生成算法研究员
立即应聘

【快Star】多模态生成算法研究员

发布于 大约 2 小时前

普通员工/个人贡献者

深圳市 / 上海市
高级经验
全职员工
仅现场办公
学历未注明
PyTorch
视频生成
AI Agent
多模态生成
DiT
MLLM
大模型训练
Flow Matching
Diffusion Transformer

AI 估算 · 35k–60k

快手上市大厂,多模态生成算法为前沿方向,人才稀缺,参考互联网大厂高级研究员薪资,一线城市薪资较高。

职位详情

关于这个职位

这是一个研究型职位,专注于多模态生成大模型的算法研究与落地,涉及文本、图像、视频、音频等多条件驱动的视频生成

你将参与模型架构设计、预训练和后训练,解决高质量视频生成中的关键问题,如人物一致性、动作合理性和长时序稳定性
适合有生成模型经验、技术追求高、好奇心强的算法研究员

最低要求

熟悉 Flow Matching / DiT / MLLM 等相关技术,有生成模型项目经验

具备较强代码能力和实验能力,有大模型训练、调参、debug 经验
对数据、模型结构、loss、训练稳定性和生成效果有较好的判断力
好奇心强,思路灵活,技术追求高,做事靠谱、细致、有责任心,能够持续跟进前沿技术并落地验证
熟练使用 AI coding/agent 工具,能够提升研发和实验效率

工作职责

负责多模态生成大模型相关算法研究与落地,包括文本、图像、视频、音频、动作、镜头、ID 等多条件驱动的视频生成

参与模型架构设计、预训练、后训练和实际业务效果提升
重点解决高质量视频生成中的人物一致性、动作合理性、长时序稳定性、可控生成和低成本高品质生成等问题

优先资格

有顶会论文、开源项目、产品落地或大规模模型训练经验

在ACM-ICPC、NOI / IOI 等竞赛中取得优秀成绩

AI 洞察

优缺点分析

优点

  • 多模态生成是AIGC最热赛道,技术前景广阔,快手有海量数据和应用场景
  • 公司已上市,提供有竞争力的薪资和股票,技术氛围浓厚
  • 有机会参与从研究到落地的全流程,做出有影响力的产品(如快手视频特效)
  • 视频生成任务计算资源消耗大,可能需要面对训练不稳定、效果不达预期的挫败感
  • 这个职位适合技术好奇心强、有扎实生成模型经验、能承受高强度和快节奏的算法研究员

缺点 / 挑战

  • 技术迭代极快,需要持续学习新论文和模型,心理压力较大
  • 竞争激烈,快手内部人才云集,绩效压力大

角色解读

  • 纵向:从算法研究员到技术专家,主导多模态生成方向的核心技术攻关
  • 横向:转向AI产品经理或技术总监,结合业务需求推动AI应用落地
  • 学术:持续发表顶会论文,成为领域内知名研究者,或创业获得投资
  • 设计和优化多模态生成模型(如文本到视频、图像到视频),研究DiT、Flow Matching等架构
  • 参与大模型的全流程训练,包括数据构建、模型调参、稳定性提升和效果评估
  • 解决视频生成中的关键技术难题,如人物一致性、长时序连贯性、可控生成等
  • 持续跟踪前沿论文并复现验证,推动技术落地到实际产品
  • 扎实的深度学习基础,熟悉生成模型(如扩散模型、DiT、VQGAN等)和Transformer架构
  • 熟练的编程和实验能力,精通PyTorch,有大模型分布式训练经验
  • 对数据敏感,能独立分析模型问题并优化训练策略
  • 熟悉AI agent工具(如Copilot、AutoGPT)提升研发效率

申请策略

  • 快手对工程能力要求高,简历中最好体现独立搭建和训练模型的经验
  • 面试前了解快手在视频生成领域的产品(如快影、AIGC特效),提出改进想法
  • 突出生成模型项目经验,如扩散模型、视频生成、多模态等方向的研究或落地成果
  • 强调大模型训练经验(分布式、混合精度、调试技巧)和代码能力(GitHub链接、竞赛成绩)
  • 列出顶会论文(CVPR/ICCV/NeurIPS等)或开源贡献,证明学术影响力
  • 提前复习Flow Matching、Diffusion Transformer(DiT)的论文和代码实现
  • 掌握MLLM(多模态大语言模型)的相关知识,如LLaVA、Video-LLaMA等
  • 熟悉AI agent工具,如使用Cursor或Copilot高效编写实验代码

面试指南

  • STAR法则:遇到什么问题、采取了什么方法、结果如何
  • 从原理到实践:先解释理论基础,再讲具体实现和调优经验
  • 对比分析法:比较不同方案的优劣,展示技术判断力
  • 请介绍你参与的一个生成模型项目,包括模型设计、训练过程和效果
  • 详细解释Flow Matching和Diffusion Model的联系与区别
  • 如何解决视频生成中的人物一致性和动作合理性问题?
  • 你如何调试大模型训练中的loss不收敛或梯度爆炸问题?
  • 你对多模态大模型(MLLM)的未来趋势怎么看?

匹配度报告

70
综合匹配度

快手多模态生成研究员:前沿技术、高成长、高压力,适合技术狂热者。

适合人群
最适合追求技术前沿和高速成长的求职者,对薪资和生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

快手为上市大厂,薪资和福利具有竞争力,处于行业较高水平。但JD未明确薪资范围,需面议。

薪资信号面议 (35K-60K/月)

成长发展匹配

90较高

职位涉及前沿的多模态生成技术,有大量学习和成长机会,且快手鼓励技术落地和发表论文。

技术前沿前沿/新兴技术
技术栈Flow Matching、DiT、MLLM、多模态生成、视频生成、大模型训练
业务类型profit_center

工作生活匹配

40较低

职位要求好奇心强和技术追求高,暗示可能加班,且需持续跟踪前沿,工作强度大。

工作模式仅现场办公
办公地点市区核心地段
加班情况JD含高强度暗示词

使命价值匹配

70中等

AI生成内容有广泛社会影响,但快手作为娱乐平台,偏重商业变现,社会使命感一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k