
普通员工/个人贡献者
AI 估算 · 30k–60k
大模型方向稀缺人才,字节跳动薪资竞争力强,技术难度高,月薪3-6万区间较合理。
该职位专注于大模型的后训练优化,涉及强化学习、Agent系统及高性能基础设施研发
优秀的代码能力、数据结构和基础算法功底,熟练掌握Linux环境下的C/C++、Python编程
研发Agentic强化学习系统,包括Agentic RL算法、超长上下文训练和推理加速、多轮轨迹交互等能力
熟悉GRPO/PPO/DAPO等RL算法、veRL/OpenRLHF/AReal/ROLL/Slime等任一强化学习框架
优点
缺点 / 挑战
顶级大厂前沿AI岗,技术天花板极高,薪资优厚,但工作强度大。
字节跳动提供有竞争力的薪资福利,薪资在行业内处于偏高水准,但未明确说明福利细节。
该职位处于大模型最前沿,强化学习和Agent技术是未来方向,技术成长空间极大,且JD明确要求自驱学习,暗示公司鼓励员工成长。
JD未提及远程办公或弹性工作,字节跳动通常要求现场办公,且大模型方向项目压力大,WLB一般。
岗位专注于商业AI,推动交易与广告的智能化,有明确商业价值;但社会影响力相对中性。