
普通员工/个人贡献者
AI 估算 · 30k–60k
高级算法工程师岗位,技能稀缺(强化学习、多模态),小红书平台竞争力强,薪资处于市场高位。
该职位专注于利用强化学习方法对多模态大模型进行对齐与优化,解决RLHF中的训练稳定性、Reward Hacking等难题,并探索计算扩展对模型能力提升的方法
具备扎实的机器学习基础,能熟练使用至少一种深度学习框架(e.g. PyTorch、Jax、TensorFlow、MindSpore、PaddlePaddle)
利用强化学习方法对多模态大模型进行对齐:
加分项:
优点
缺点 / 挑战
小红书大模型核心算法岗,前沿技术栈,高成长但WLB一般。
小红书作为头部互联网公司,薪资福利具有竞争力,但JD未明确薪资,需面试确认。
该职位处于AI最前沿,涉及强化学习、多模态、Agent等,技术成长空间极大,且公司平台能支撑研究落地。
JD未提及远程或弹性工作,且互联网大厂算法岗位通常工作强度较高,WLB可能一般。
大模型对齐具有推动AI安全与价值的重要社会意义,但公司业务本质是商业化,使命感中等。