小红书的【hi lab】应用-大模型算法工程师薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

【hi lab】应用-大模型算法工程师的工作地点在哪里？

该职位工作地点位于北京市、上海市、杭州市。工作形式为仅现场办公。

该职位要求硕士学历及中级经验工作经验。

🤖 AI 估测：¥35K-60K

发布时间：28 天前

该职位是大模型算法工程师，专注于大模型的后训练、对齐与能力提升

你将负责设计和迭代SFT、RLHF等后训练流水线，构建AI与人类组合的反馈系统，并致力于提升模型的推理、工具使用、安全对齐及个性化能力

最终目标是推动研究成果在小红书下一代AI原生应用产品中落地

工作职责：

Post-Training Pipeline 设计与迭代：搭建并持续优化 SFT、RM、RLHF / RLAIF / RLVF 等后训练流水线，支持多模态模型的高效迭代，让千亿级大模型在一次次“后训练”中真正变得聪明、智慧、安全

可扩展监督与反馈系统：设计低成本人类 + AI 组合反馈机制，自动化完成偏好采集、对齐传递与数据质量评估，通过 Product-Research co-design 探索构建真实用户反馈的模型迭代机制

通用推理与工具使用能力提升：构建跨模态强化学习环境和多样化奖励体系，帮助模型学会调用外部工具、提升模型利用文本-图像-语音跨模态信息进行复杂推理和问题解决能力

长期记忆、个性化与终身学习：探索持久记忆与动态偏好建模，使模型能够跨会话记住用户偏好、持续学习而不遗忘核心能力

安全评估与价值观对齐：搭建安全对齐机制、红队测试、越狱防御与自动化评测框架，量化模型幻觉、稳定性及价值观一致性，制定风险缓解策略，确保模型在开放场景中始终行为可控

跨职能落地：与产品、设计、人文训练师及数据团队，把研究成果迅速推向真实场景，打造小红书下一代战略级 AI native 应用产品

硕士及以上学历，计算机等相关专业方向优先

扎实机器学习与深度学习基础，熟练掌握PyTorch / JAX / TensorFlow等任一框架

熟悉后训练常用技术（SFT、RLHF / DPO / RLAIF 等）或具备相关项目 / 竞赛 / 论文经验

具备实验设计与问题定位能力，能独立分析大模型在不同数据分布和任务场景下的表现

善于沟通和团队协作，乐于在快速迭代中分享想法、推动落地

【加分项】

有深度参与贡献的顶会（ICML / NeurIPS / ICLR / ACL / CVPR 等）论文

ACM-ICPC、NOI/IOI、Kaggle 等竞赛奖项

参与过开源 / 闭源大模型的 Alignment / Post-Training 项目经历

【hi lab】应用-大模型算法工程师

🤖 AI 估测：¥35K-60K

发布时间：28 天前