Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaohongshu logo
小红书
Dots-Posttrain算法工程师-General Agent
立即应聘

Dots-Posttrain算法工程师-General Agent

发布于 3 天前

普通员工/个人贡献者

北京市 / 上海市
高级经验
全职员工
仅现场办公
学历未注明
NLP
PyTorch
强化学习
推理
CV
工具使用
多模态大模型
RLHF
Ai Alignment

AI 估算 · 30k–60k

高级算法工程师岗位,技能稀缺(强化学习、多模态),小红书平台竞争力强,薪资处于市场高位。

职位详情

关于这个职位

该职位专注于利用强化学习方法对多模态大模型进行对齐与优化,解决RLHF中的训练稳定性、Reward Hacking等难题,并探索计算扩展对模型能力提升的方法

你将研究Multi-Agent、长期目标等前沿对齐技术,针对性优化幻觉、推理、工具使用等场景,提升大模型应用价值
适合具备扎实机器学习基础(如PyTorch)、在NLP/CV/RL领域有深入研究和实践经验,对大模型对齐有热情的候选人

最低要求

具备扎实的机器学习基础,能熟练使用至少一种深度学习框架(e.g. PyTorch、Jax、TensorFlow、MindSpore、PaddlePaddle)

对监督学习、强化学习、表示学习等机器学习方法有深入理解并具备相关的实践经验
在 NLP/CV/RL 等至少一个 AI 领域中有过深入的研究经历,或通过机器学习算法解决过复杂业务场景问题
具备卓越的实验分析与问题解决能力,有创新思维,能够良好沟通、与团队成员高效协作

工作职责

利用强化学习方法对多模态大模型进行对齐:

解决优化现有多模态大模型 RLHF 中的训练效果、稳定性、Reward Hacking 等问题
探索 RL 阶段 computaiton scaling 对模型能力提升的方法
研究 Multi-Agent、Long-term Objective、Scalable Oversight 等方向下基于强化学习的对齐方法
基于前沿方法对幻觉、推理、工具使用、安全等场景问题进行针对性优化,提升大模型的应用价值

优先资格

加分项:

对大模型 RL 技术有极大热情
有 ICML、ICLR、NeurIPS、ACL、CVPR、AAAI 等顶级学术会议发表过有影响力研究成果的优先
主导、参与过 AI 相关的有大影响力的开源/闭源项目的优先
有 AI Alignment 相关研究或大模型应用项目经历的优先

AI 洞察

优缺点分析

优点

  • 小红书平台资源丰富,业务场景多样,研究成果可快速落地
  • 与顶尖团队合作(可能参与顶会发表),职业发展空间大
  • 技术难度高,需精通强化学习和大模型,持续跟进前沿论文
  • 工作强度可能较大,需应对快速迭代的研发节奏
  • 竞争激烈,需具备较强的创新和问题解决能力
  • 适合对大模型对齐有极大热情、具备扎实ML基础和研究能力、渴望在技术前沿突破的算法工程师

缺点 / 挑战

  • 身处大模型最前沿领域,接触顶级技术挑战,快速积累稀缺经验

角色解读

  • 技术深度方向:成为强化学习对齐专家,主导大模型核心能力提升
  • 技术广度方向:扩展到多模态、Agent等前沿领域,成为全栈AI科学家
  • 管理方向:带领团队攻克关键技术难题,向技术总监或首席科学家发展
  • 优化多模态大模型的RLHF训练,解决效果和稳定性问题,如Reward Hacking
  • 探索强化学习阶段计算量扩展(computation scaling)对模型能力的提升方法
  • 研究Multi-Agent、长期目标、可扩展监督等前沿对齐方向,应用于幻觉、推理、工具使用等具体场景
  • 扎实的机器学习基础,熟练使用PyTorch等深度学习框架
  • 深入理解监督学习、强化学习、表示学习,并有实践经验
  • 在NLP、CV或RL领域有深入研究或复杂业务解决经验,具备创新和协作能力

申请策略

  • 提前了解小红书在通用Agent和多模态方面的技术布局,在简历和面试中表达匹配度
  • 准备一个技术分享,展示自己在大模型对齐上的深度思考
  • 突出强化学习或RLHF相关项目经验,量化效果提升
  • 强调多模态、NLP/CV等领域的顶会论文或开源贡献
  • 展示解决复杂问题的实验分析能力(如Reward Hacking的案例)
  • 深入理解RLHF原理,动手复现主流对齐方法(如PPO、DPO)
  • 熟悉多模态大模型架构(如CLIP、BLIP2等)
  • 加强编程和工程能力,熟练使用PyTorch和分布式训练工具

面试指南

  • 结构化回答:先定义问题,再分解步骤,最后举例或引用论文
  • 突出实验经验:结合具体项目说明所做的优化和结果
  • 展示前沿认知:提及最新研究(如ICML等会议论文)并给出个人思考
  • 请解释RLHF的完整流程,并说明如何解决Reward Hacking问题?
  • 如何将强化学习应用于多模态大模型的对齐?举例说明
  • 你如何设计实验来评估对齐效果?
  • Multi-Agent场景下,强化学习对齐面临哪些挑战?
  • 你对Scalable Oversight的理解是什么?有哪些可行方法?

匹配度报告

72
综合匹配度

小红书大模型核心算法岗,前沿技术栈,高成长但WLB一般。

适合人群
最适合追求技术前沿和快速成长的求职者,愿意接受一定的工作强度以换取顶尖技术积累。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值70

薪资福利匹配

85较高

小红书作为头部互联网公司,薪资福利具有竞争力,但JD未明确薪资,需面试确认。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

95较高

该职位处于AI最前沿,涉及强化学习、多模态、Agent等,技术成长空间极大,且公司平台能支撑研究落地。

技术前沿前沿/新兴技术
技术栈强化学习、多模态大模型、RLHF、PyTorch、NLP、CV、AI Alignment
业务类型profit_center

工作生活匹配

40较低

JD未提及远程或弹性工作,且互联网大厂算法岗位通常工作强度较高,WLB可能一般。

工作模式未明确
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型对齐具有推动AI安全与价值的重要社会意义,但公司业务本质是商业化,使命感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • 作者产品运营(深圳/上海/北京)

    小红书 · 北京市
    AI 估算 · 20k-35k
  • about编辑部实习生(内容运营&策划方向)

    小红书 · 上海市
    AI 估算 · 4k-6k
  • BaaS 平台研发实习生-存储&数据库部

    小红书 · 上海市
    AI 估算 · 4k-8k
  • 组织文化部活动运营实习生

    小红书 · 北京市
    AI 估算 · 6k-8k
  • 治理策略经营分析专家-T&S

    小红书 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • AI研发创新(实习生)

    中国移动 · 银川市
    AI 估算 · 3k-5k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • Business R&D Entry Professional

    日立能源 · 合肥市
    AI 估算 · 15k-30k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • 大模型算法工程师

    京东 · 北京市
    AI 估算 · 35k-65k

小红书 的其他在招职位

  • 作者产品运营(深圳/上海/北京)

    小红书 · 北京市
    AI 估算 · 20k-35k
  • about编辑部实习生(内容运营&策划方向)

    小红书 · 上海市
    AI 估算 · 4k-6k
  • BaaS 平台研发实习生-存储&数据库部

    小红书 · 上海市
    AI 估算 · 4k-8k
  • 组织文化部活动运营实习生

    小红书 · 北京市
    AI 估算 · 6k-8k
  • 治理策略经营分析专家-T&S

    小红书 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • AI研发创新(实习生)

    中国移动 · 银川市
    AI 估算 · 3k-5k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • Business R&D Entry Professional

    日立能源 · 合肥市
    AI 估算 · 15k-30k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • 大模型算法工程师

    京东 · 北京市
    AI 估算 · 35k-65k