小红书的流式视频理解算法工程师薪资是多少？

该职位薪资范围为 30k–55k（人民币/月）。

流式视频理解算法工程师的工作地点在哪里？

该职位工作地点位于北京市、上海市。工作形式为仅现场办公。

小红书的流式视频理解算法工程师有什么任职要求？

该职位要求硕士学历及中级经验工作经验。

小红书

流式视频理解算法工程师

立即应聘

流式视频理解算法工程师

发布于大约 2 个月前

普通员工/个人贡献者

北京市 / 上海市

中级经验

全职员工

仅现场办公

硕士

软件工程

PyTorch

分布式训练

视频理解

RLHF

时序建模

MLLM

Kv Cache

Videollm

流式推理

AI 估算 · 30k–55k

视频大模型方向技术门槛高、需求旺盛，小红书薪资竞争力强，上海北京生活成本高，估值合理。

职位详情

关于这个职位

该职位专注于流式视频理解前沿方向，让模型具备实时视频理解能力

你将参与视频大模型研发，包括流式推理架构设计、训练数据构建、内容理解模型落地等，工作涉及从研究到工程的全链路

适合对视频理解和多模态大模型有热情、追求技术突破的工程师

最低要求

基础要求：计算机、电子工程、自动化等相关专业硕士及以上学历

扎实的深度学习基础，熟悉 Transformer 架构、注意力机制、位置编码等核心技术

熟练掌握 PyTorch，具备独立复现/改进论文的能力

良好的代码工程能力，有大规模分布式训练经验优先

专业方向（满足其中一项即可）：有视频理解相关研究或工程经验（VideoLLM、MLLM、Video QA、时序建模等），能独立跟进前沿工作

有长上下文/高效推理相关经验（KV Cache 优化、序列并行、量化、蒸馏等）

有在线视频理解或流式系统相关经验，了解实时推理系统架构设计

工作职责

跟踪流式视频理解领域最新进展，输出技术洞察，探索适合业务场景的创新方案

设计高效的流式推理架构，包括记忆压缩模块、时序建模与位置编码方案

构建流式视频训练数据集与训练框架，探索离线到在线的课程学习范式

研发视频内容理解模型：高光识别、场景分类、精彩度评分、人物/物体语义理解

实现智能切片能力：从直播流/点播视频中自动定位高光片段，支持实时和离线两种模式

将内容理解能力接入产品链路，包括直播封面、运营挖掘工具、创作者笔记诊断报告等

构建流式视频评测体系，与人工标注对比，持续提升模型精度

优化端到端推理延迟、显存占用和吞吐量，满足实时性要求

优先资格

加分项：在 CVPR、ICCV、NeurIPS、ICLR、ECCV、AAAI 等顶会发表过相关论文，有一作或重要贡献者优先

有直播/视频平台内容理解落地经验（高光识别、精华切片、封面生成等具体场景）

了解视频编解码基础（I/P/B 帧、码率、分辨率），能理解多媒体系统上下文

熟悉 RL/RLHF 在多模态模型上的应用

AI 洞察

优缺点分析

优点

前沿方向：流式视频大模型是AI热门领域，研究价值高，技术壁垒强
大平台：小红书拥有海量视频数据，业务场景丰富（直播、笔记、电商）
技能积累：可深入Transformer、分布式训练、多模态融合等核心技术栈
成长空间：有机会从研究到落地全链路参与，积累端到端经验
技术难度高：涉及视频流、时序建模、实时推理，需要扎实的算法和工程能力
竞争激烈：算法岗人才饱和，需要持续跟进顶会论文，保持技术创新

缺点 / 挑战

业务压力：需要将前沿研究快速落地到产品，平衡效果和效率
适合对视频理解和多模态大模型有浓厚兴趣、乐于挑战技术前沿、具备较强工程能力的算法工程师

角色解读

技术纵深发展：成为流式视频理解领域的专家，主导核心算法研发
横向扩展：转向多模态大模型、实时系统架构、AI产品等方向
管理路线：带领团队负责视频理解技术线，从IC到技术Leader
跟踪流式视频理解前沿技术，探索创新方案并落地业务
设计高效流式推理架构，包括记忆压缩、时序建模等核心模块
构建视频内容理解模型，实现高光识别、场景分类、智能切片等功能
优化推理延迟和显存，满足流式视频实时处理要求
扎实的深度学习基础，熟悉Transformer、注意力机制、位置编码等
精通PyTorch，能独立复现和改进论文算法
有视频理解或长上下文高效推理经验，了解KV Cache优化
良好的工程能力，熟悉大规模分布式训练

申请策略

提前了解小红书的视频业务（直播、笔记、电商），思考技术如何赋能
关注公司技术博客和开源项目，面试时展示对业务的理解
突出视频理解、VideoLLM、多模态相关项目或论文经历
强调分布式训练、KV Cache优化、模型压缩等效率提升经验
展示在顶会发表论文或竞赛获奖经历，增强研究能力证明
如果有直播/视频平台落地经验，务必详细描述成果和量化指标
补充流式推理相关技术：如StreamingLLM、内存管理、位置编码变体
学习视频编解码基础知识，理解多媒体系统上下文

面试指南

STAR法则：情境(Situation)、任务(Task)、行动(Action)、结果(Result)，结构清晰
比较法：对比不同方法优缺点，展示技术深度和批判性思维
工程导向：结合业务场景说明技术选型，兼顾效果和效率
请介绍你参与过的视频理解项目，遇到的挑战和解决方案
如何设计一个流式视频理解模型，使其能够边看边理解？
Transformer中的位置编码有哪些？在视频流场景下如何选择或改进？
如何优化视频大模型的推理速度，降低显存占用？
你对VideoLLM的最新进展有哪些了解？请举例说明

匹配度报告

综合匹配度

前沿视频大模型算法岗，技术成长性极强，薪资优厚，但工作强度可能较大。

适合人群

适合追求技术成长和职业发展的求职者，对WLB要求不高，愿意投入时间钻研前沿技术。

最强匹配

成长发展匹配

最弱匹配

工作生活匹配

薪资福利75

成长发展95

工作生活40

使命价值70

薪资福利匹配

75中等

小红书超大型企业，薪资福利有竞争力，但JD未明确具体数字，综合判断处于市场水准偏上。

薪资信号未披露（AI估算：30K-55K/月）

成长发展匹配

95较高

前沿流式视频大模型方向，技术栈先进，有顶会论文机会，成长空间巨大。

技术前沿前沿/新兴技术

技术栈流式视频大模型、VideoLLM、Transformer、PyTorch、KV Cache、时序建模、分布式训练、RLHF

业务类型profit_center

工作生活匹配

40较低

仅现场办公，未提及弹性工作，互联网大厂强度较大，WLB无明显保障。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值匹配

70中等

视频理解技术有一定社会价值，但主要是商业应用，使命感中等。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

流式视频理解算法工程师

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

匹配度报告

薪资福利匹配

成长发展匹配

工作生活匹配

使命价值匹配

小红书的其他在招职位

产品体验设计师（AI创新方向）

联盟广告算法工程师-商业算法

AI应用开发工程师-实习

世界杯项目实习生

现场娱乐运营实习生

相似职位推荐

微信-高级算法工程师-音频理解/ASR/对话模型方向

Project T UE5 客户端开发工程师（性能优化）

Project T UE5 高级引擎开发

Project T UE5 客户端开发工程师（3C）

Project T UE5 客户端开发工程师（游戏 AI）

小红书的其他在招职位

产品体验设计师（AI创新方向）

联盟广告算法工程师-商业算法

AI应用开发工程师-实习

世界杯项目实习生

现场娱乐运营实习生

相似职位推荐

微信-高级算法工程师-音频理解/ASR/对话模型方向

Project T UE5 客户端开发工程师（性能优化）

Project T UE5 高级引擎开发

Project T UE5 客户端开发工程师（3C）

Project T UE5 客户端开发工程师（游戏 AI）

流式视频理解算法工程师

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

匹配度报告

薪资福利匹配

成长发展匹配

工作生活匹配

使命价值匹配

小红书 的其他在招职位

产品体验设计师（AI创新方向）

联盟广告算法工程师-商业算法

AI应用开发工程师-实习

世界杯项目实习生

现场娱乐运营实习生

相似职位推荐

微信-高级算法工程师-音频理解/ASR/对话模型方向

Project T UE5 客户端开发工程师（性能优化）

Project T UE5 高级引擎开发

Project T UE5 客户端开发工程师（3C）

Project T UE5 客户端开发工程师（游戏 AI）

小红书 的其他在招职位

产品体验设计师（AI创新方向）

联盟广告算法工程师-商业算法

AI应用开发工程师-实习

世界杯项目实习生

现场娱乐运营实习生

相似职位推荐

微信-高级算法工程师-音频理解/ASR/对话模型方向

Project T UE5 客户端开发工程师（性能优化）

Project T UE5 高级引擎开发

Project T UE5 客户端开发工程师（3C）

Project T UE5 客户端开发工程师（游戏 AI）

小红书的其他在招职位

小红书的其他在招职位