Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Kwai logo
快手
【快Star】音视频大模型算法工程师
立即应聘

【快Star】音视频大模型算法工程师

发布于 大约 2 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
硕士
深度学习
PyTorch
计算机视觉
视频增强
视频生成
大模型
AR
降噪
diffusion
超分辨率

AI 估算 · 25k–50k

快手大厂,音视频大模型是热门方向,硕士学历+前沿技术要求,薪资在互联网行业具有竞争力。

职位详情

关于这个职位

该职位专注于音视频大模型算法研究,主要涉及生成式视频处理技术,如超分、降噪、视频修复等

你将探索 Diffusion、AR 等前沿模型,负责核心算法设计与优化,并在快手平台推动技术落地
适合对 AGI 和视频大模型有浓厚兴趣、具备扎实深度学习基础的研究型工程师

最低要求

计算机视觉、人工智能等相关方向硕士及以上学历,具备扎实的深度学习基础

熟悉常见 low-level 图像/视频处理算法,包括但不限于超分辨率、降噪、去模糊、视频增强等
熟悉 Diffusion、AR等主流生成式模型框架
对 AGI 和视频大模型方向有浓厚兴趣

工作职责

从事面向视频增强与修复的生成式视频处理大模型关键技术研究,探索基于 Diffusion / AR 等范式的视频生成与 low-level 视频处理算法,包括超分、降噪、去压缩伪影、视频修复等方向

负责视频大模型核心技术研发,包括网络架构设计、时域一致性建模、大规模数据训练、模型保真能力优化及视频生成质量提升
探索生成式视频处理与视频压缩结合的新型框架,持续跟踪国际前沿 AI 技术并推动落地

优先资格

在 CV/AI 相关 CCF-A 类会议或期刊发表过高质量论文,或在视觉、算法竞赛中取得优异成绩者优先

具备视频生成、Diffusion、AR、多模态大模型等相关研究经验者优先

AI 洞察

优缺点分析

优点

  • 快手短视频业务场景丰富,音视频大模型方向属于核心赛道,资源投入大
  • 技术前沿,涉及 Diffusion、AR 等热点,个人技术积累和行业竞争力提升快
  • 公司已上市,平台稳定,薪资和福利有保障
  • 职位要求高,需要同时具备扎实的理论基础和工程实践能力
  • 涉及大规模训练,需要处理海量数据和算力资源,对系统调优能力有要求
  • 适合对计算机视觉和生成式模型有强烈热情、具备研究型思维和良好工程能力的算法工程师,尤其是希望在视频AI领域深耕的同学

缺点 / 挑战

  • 研究方向竞争激烈,需要持续跟踪论文并快速迭代,工作强度可能较高

角色解读

  • 技术深耕:成为视频生成与处理领域的专家,在快手内部主导核心技术突破
  • 研究导向:可向高级研究员或技术 Leader 发展,带领团队探索下一代视频大模型
  • 横向拓展:积累 AGI 和多模态大模型经验,未来向更广泛的 AI 方向转型
  • 研究并开发基于 Diffusion 和 AR 等生成式模型的视频增强和修复算法,包括超分辨率、降噪、去伪影等
  • 设计视频大模型的网络架构,解决时域一致性问题,优化大规模训练和模型保真度
  • 探索生成式视频处理与视频压缩的结合,跟踪前沿技术并推动实际落地
  • 扎实的深度学习基础,熟悉常见 low-level 视觉算法(超分、降噪等)
  • 深入理解 Diffusion 和 AR 等生成式模型框架
  • 编程能力强,熟练使用 PyTorch 等框架,具备大规模数据处理经验
  • 有计算机视觉或人工智能领域的研究背景,能阅读和复现顶会论文

申请策略

  • 关注快手技术博客和论文,了解团队研究方向,在面试中展现针对性思考
  • 提前准备一个自我主导的视频处理小项目(如利用开源模型做超分),展示动手能力
  • 突出计算机视觉相关项目经验,特别是 low-level 视觉或视频生成方向的成果
  • 列出发表的顶会论文或竞赛获奖,证明学术能力
  • 详细描述使用 Diffusion、AR 等模型的实际工程经验,包括网络设计、训练优化
  • 强调对 AGI 和视频大模型的理解和兴趣,可附上技术博客或开源贡献
  • 系统学习 Diffusion 模型原理和代码实现(如 Stable Diffusion、Video Diffusion)
  • 熟悉视频数据处理流水线,包括编解码、光流等基础

面试指南

  • 对于原理类问题,先定义核心概念,再从数学和工程角度展开,最后举例说明
  • 对于开放性问题,采用「现状-挑战-方案-展望」的逻辑,展现系统性思考
  • 对于编码题,先确认需求,再分步骤编写,同时解释关键设计选择
  • 谈谈你对 Diffusion 模型用于视频生成的理解,它和图像生成有何异同?
  • 如何解决视频超分中的时域闪烁问题?请给出至少两种思路
  • 描述一次你优化大规模模型训练过程的经历,遇到哪些挑战?
  • 你如何看待 AGI 与视频大模型的结合?有哪些潜在应用?
  • 写一段伪代码实现一个简单的自注意力机制

匹配度报告

72
综合匹配度

快手音视频大模型算法岗,前沿技术驱动,薪资优厚,但现场办公且WLB一般。

适合人群
适合追求技术前沿和职业成长,对薪资有较高期望,能接受一定工作强度和时间投入的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值70

薪资福利匹配

80较高

快手作为上市大厂,薪资水平具有竞争力,但JD未明确具体薪资和福利,需面试确认。

薪资信号未披露(AI估算:25K-50K/月)

成长发展匹配

90较高

职位涉及最前沿的生成式视频大模型技术,成长空间极大,但JD未提及晋升通道或培训。

技术前沿前沿/新兴技术
技术栈Diffusion、AR、视频生成、超分辨率、大模型
业务类型ambiguous

工作生活匹配

50较低

职位为北京现场办公,未提及弹性工作或加班信息,互联网大厂通常存在一定加班文化。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

音视频大模型属于高速增长赛道,技术创新可能带来社会价值,但JD未明确使命导向。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k