
实习/见习
AI 估算 · 8k–15k
一线大厂算法实习生薪资较高,结合技术难度和顶尖公司背景,月薪约8-15K
该职位聚焦于大语言模型的后训练算法研发,包括SFT、RLHF、DPO等对齐方法,以及强化学习训练优化
)2027/2028 届在校硕士及以上学历,计算机科学、人工智能、机器学习、NLP 或相关专业
)后训练算法研发:参与游戏内容、角色扮演等场景下大模型的后训练(Post-training)算法研发工作,涵盖 SFT、RLHF、DPO 等对齐方法的实现与优化,提升模型在剧情生成、角色一致性、对话连贯性、情感表达等维度的能力
)有 Reward Model 训练、强化学习(PPO/DPO/GRPO)应用于语言模型的研究或实践经验
优点
缺点 / 挑战
顶尖AI游戏公司实习,前沿LLM后训练技术栈,成长空间极大但WLB未知。
薪资未在JD中披露,但作为大厂实习生通常具有行业竞争力;福利信息缺失,补偿性动机满足程度中等偏低。
该职位涉及LLM最前沿技术(后训练、RLHF等),技能成长空间极大,但JD未提及晋升或培训。
工作地点在上海,需现场办公;JD未提及任何WLB信息,可能面临游戏行业典型的工作强度。
AI+游戏属于高速增长赛道,创新性强,但社会价值偏中性,使命导向不明显。