Xiaohongshu logo
小红书
【dots】原生多模基座算法工程师

【dots】原生多模基座算法工程师

发布于 大约 18 小时前

普通员工/个人贡献者

北京市 / 上海市
中级经验
全职员工
仅现场办公
学历未注明
PyTorch
强化学习
多模态
图像编辑
图像生成
大模型
RLHF
Diffusion Models
Post-Training
Preference Learning

AI 估算 · 30k–60k

顶尖互联网核心算法岗,技术难度高,薪资竞争力强。

职位详情

关于这个职位

该职位负责小红书下一代多模态基座模型的后训练与对齐优化,聚焦图像生成与编辑的对齐方法,涉及SFT、偏好学习、强化学习等技术,旨在提升模型可控性与用户满意度

适合有多模态生成模型经验、热爱前沿技术的算法人才

最低要求

任职资格

扎实的机器学习与多模态基础:具备扎实的机器学习与深度学习基础,熟练使用至少一种主流深度学习框架(如 PyTorch、JAX、TensorFlow 等),并在生成模型或多模态模型中有较深入的实践经验
生成模型 / 对齐方向相关经验:对监督学习、强化学习、偏好学习、表示学习等方法有深入理解
在图像生成、图像编辑、多模态理解或相关方向中,有过模型训练、对齐或系统优化的实际经验
优秀的实验设计与问题拆解能力:能够从复杂生成现象中抽象问题、设计实验、分析结果并提出可执行的改进方案
对模型行为有敏锐的直觉,同时具备严谨的工程与研究能力

工作职责

工作职责

你将参与到小红书下一代基座模型与 AI native 应用的构建中,通过多模
理解生成一体的对齐与优化(Post-Train):参与多模态大模型的 post-training 与对齐研究,围绕「理解 → 规划 → 生成」的一体化链路,提升模型在复杂指令理解、规划与工具调用、语义一致性、生成可控性、多轮编辑与用户意图对齐等方面的整体表现
图像生成与编辑方向的对齐方法探索:深入研究图像生成模型(Text-to-Image / Image Editing 等)在真实使用场景中的失效模式,如语义偏移、指令遗漏、风格漂移、结构崩坏、幻觉生成等问题
探索并实践包括但不限于:
SFT / Preference Learning / RL-based 方法在图像生成中的应用
多模态 reward model 及 reward system 设计
Spatial difusion model RL 算法设计及实验验证
探索图像编辑能力与 agentic 能力结合,基于小红书的 deep research 能力,为用户在穿搭、家装场景等生活提供独特体验
探索图像生成能力与 thinking with generated images 结合提升模型的推理能力
跨职能协作与能力落地:与产品、工程、评测及安全团队紧密合作,将对齐与 post-train 成果落地到实际图像生成与编辑产品中,持续推动模型在可控性、稳定性与用户满意度上的提升

优先资格

加分项

在顶级学术会议(ICML、ICLR、NeurIPS、CVPR、ACL、AAAI 等)发表过与生成模型或多模态相关的研究成果
在 ACM/ICPC、NOI/IOI、Kaggle 等竞赛中取得优异成绩
参与过大规模图像生成 / 编辑模型的训练、对齐或评测项目
有 AI Alignment、Post-Training、Multi-Modal RL 或人类反馈建模相关经验

AI 洞察

优缺点分析

优点

  • 深度参与下一代多模态基础模型的构建,技术前沿性强
  • 小红书平台提供丰富的应用场景和数据,实验环境优越
  • 与顶尖团队协作,接触最新研究成果和工程实践
  • 对齐与后训练方向复杂,需要扎实的理论和实践功底
  • 竞争激烈,需要持续学习最新技术

缺点 / 挑战

  • 工作强度可能较高,互联网大厂节奏快
  • 适合对多模态生成模型有浓厚兴趣、喜欢挑战前沿技术、具备较强工程和研究能力的算法工程师

角色解读

  • 技术路线:从算法工程师成长为多模态对齐方向的专家,主导核心技术研发
  • 管理路线:随着项目规模扩大,可向技术负责人或团队Leader发展
  • 行业路线:积累前沿经验后,可转向AIGC、AI产品等领域的更高层职位
  • 参与多模态大模型的后训练与对齐研究,优化模型在指令理解、规划、生成等方面的表现
  • 探索图像生成与编辑中的对齐方法,包括SFT、偏好学习、强化学习等技术的应用
  • 设计多模态奖励模型和强化学习算法,提升生成可控性与用户满意度
  • 与产品、工程团队协作,将对齐成果落地到实际产品中
  • 扎实的机器学习和深度学习基础,熟练使用PyTorch、JAX等框架
  • 深入理解监督学习、强化学习、偏好学习等方法,并有生成模型或对齐方向的实践经验
  • 优秀的实验设计与问题拆解能力,能从复杂现象中抽象问题并设计改进方案
  • 熟悉图像生成、编辑、多模态模型的前沿技术,如Diffusion模型、RLHF等

申请策略

  • 关注小红书在AIGC领域的布局,面试中展示对产品的理解
  • 准备一个完整的项目案例,从问题定义到实验结论,体现系统性思维
  • 突出生成模型或对齐方向的项目经历,如图像生成、编辑、RLHF等
  • 展示顶会论文、竞赛获奖等加分项
  • 强调实验设计和问题拆解能力,可附上具体案例
  • 补充强化学习和偏好学习相关知识,如PPO、DPO等算法
  • 熟悉Diffusion模型的最新变体及对齐方法
  • 了解小红书业务特点,例如穿搭、家装等场景需求

面试指南

  • STAR法则:描述情境、任务、行动和结果,突出个人贡献
  • 对比分析法:对比不同方法或模型的优劣,展示技术深度
  • 逻辑链条法:从问题发现到解决方案,逐步展示分析过程
  • 请介绍一下你参与过的多模态生成模型项目,以及你在其中的贡献
  • 解释一下RLHF在图像生成中的应用,与文本生成的差异是什么?
  • 如何设计实验来评估图像编辑模型的对齐效果?
  • 你对Post-Training的理解是什么?目前有哪些主流方法?
  • 如果模型生成图像出现语义偏移,你如何进行根因分析和改进?

匹配度报告

76
综合匹配度

前沿多模态算法岗,技术成长极高,但工作生活平衡一般。

适合人群
最看重技术成长和前沿探索的求职者,能接受互联网工作节奏。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活60
使命价值70

薪资福利匹配

85较高

薪资水平位于互联网大厂核心算法岗市场水准,福利虽未在JD明确但大厂通常完善。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

技术栈前沿,涉及多模态、强化学习等热门方向,成长空间大。

技术前沿前沿/新兴技术
技术栈多模态、图像生成、强化学习、RLHF、Diffusion模型、SFT、Preference Learning
业务类型profit_center

工作生活匹配

60中等

工作模式未明确,互联网大厂通常需要现场办公且强度较高。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

行业处于高速增长赛道,产品应用场景丰富,社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs