
普通员工/个人贡献者
AI 估算 · 30k–60k
大模型研究员岗位稀缺,核心技术要求高,市场竞争激烈,薪资处于行业上游。
这是一个专注于大模型强化学习的研究岗位,核心工作是优化RLHF、RFT等对齐算法,设计训练管道,提升模型在Agent任务上的表现
有RLHF对齐策略经验,能优化人类偏好建模
研究和优化大模型强化学习(RLHF、RFT、ReFT、RL等)相关的核心算法
参与过大模型训练或RLHF项目,有开源贡献或论文发表者优先
优点
缺点 / 挑战
前沿大模型RL研究岗,技术成长极高,薪资可观,但WLB一般。
薪资水平高,但未明确提及福利,且需面试确认具体待遇。
处于大模型技术最前沿,有大量研究机会,能快速积累核心技能。
仅现场办公,未提及弹性工作或远程,且大模型研发可能强度较大。
大模型是高速增长赛道,推动AI前沿发展,有社会影响力。