字节跳动的游戏AI算法高级工程师（强化学习方向）-AIGC薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

游戏AI算法高级工程师（强化学习方向）-AIGC的工作地点在哪里？

该职位工作地点位于杭州市。工作形式为仅现场办公。

字节跳动的游戏AI算法高级工程师（强化学习方向）-AIGC有什么任职要求？

该职位要求硕士学历及高级经验工作经验。

字节跳动

游戏AI算法高级工程师（强化学习方向）-AIGC

立即应聘

游戏AI算法高级工程师（强化学习方向）-AIGC

发布于大约 2 个月前

普通员工/个人贡献者

杭州市

高级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

大语言模型

强化学习

深度强化学习

AIGC

LLM

MOBA

PyTorch

TensorFlow

AI 估算 · 35k–60k

字节跳动高级算法岗，杭州游戏AI方向，薪资竞争力强，技能要求高。

职位详情

关于这个职位

该职位专注于游戏AI算法研发，特别是强化学习与LLM融合方向，负责从模型训练到线上部署的全流程

你将参与高拟人化智能体（如虚拟玩家、智能NPC）的开发，推动前沿技术在游戏场景落地，并优化大规模分布式训练系统

适合对游戏AI有浓厚兴趣、具备强化学习和深度学习背景的算法工程师

最低要求

计算机相关专业，硕士及以上学位

基础扎实，编码过关，熟悉常用的算法和数据结构，熟练掌握C/C++、Go、Python等至少一门编程语言，具备较强动手和快速学习能力，能够应用TF、PyTorch等主流框架实现模型搭建与算法调优

工作职责

参与游戏AI Bot的算法研究和应用，包括但不限于强化学习、模仿学习、基于大语言模型（LLM）的AI算法等，结合游戏场景，推动模型从训练到线上部署的全流程落地

探索AI Bot与LLM的融合技术，研发高拟人化、强交互性的智能体（如虚拟助手、虚拟玩家、智能NPC等）

算法应用效果优化，提高大规模分布式训练系统的学习效率和效果

跟踪学术界与工业界前沿技术，推动技术方案创新

优先资格

对强化学习、深度学习、LLM等算法原理及其在游戏行业的应用有深入的理解，在MOBA/UGC/卡牌等游戏类型有AI Bot上线经验者优先

对于游戏AI技术研究探索和应用有浓厚兴趣的同学优先

AI 洞察

优缺点分析

优点

字节跳动核心业务，资源丰富，拥有大量游戏场景和真实数据供模型训练
前沿技术方向，强化学习+LLM融合是AI领域的热点，技能增值快
团队成员多为行业大牛，技术氛围浓厚，有助于快速成长
游戏AI对拟人化和交互性要求高，算法落地难度大，可能需要频繁迭代
大规模分布式训练系统运维复杂，需要投入大量时间进行工程优化
行业竞争激烈，需要持续跟踪学术界最新论文并快速实验

缺点 / 挑战

适合对游戏AI充满热情、具备扎实算法功底且愿意挑战复杂工程问题的技术型人才

角色解读

技术专家路线：深耕游戏AI算法，成为强化学习或LLM领域的顶尖研究者
技术管理路线：带领团队负责完整游戏AI项目，向AI技术总监发展
跨领域发展：转向AIGC、机器人或自动驾驶等同样依赖强化学习的领域
研发游戏AI Bot，运用强化学习、模仿学习和LLM技术，让虚拟角色具备高拟人化行为
推动AI模型从训练到线上部署的全流程落地，包括数据收集、模型训练、性能优化等
优化大规模分布式训练系统，提高训练效率与模型效果
扎实的强化学习、深度学习理论基础，熟悉主流算法如DQN、PPO、SAC等
熟练掌握Python和至少一种深度学习框架（PyTorch/TensorFlow），具备模型搭建和调优能力
对LLM有深入理解，能够将大语言模型与强化学习结合用于智能体对话与决策

申请策略

提前了解字节跳动旗下的游戏业务（如朝夕光年），在面试中展示对该游戏AI应用的思考
准备一个完整的AI Bot项目案例，从问题定义、算法选择到上线效果分析
突出强化学习项目经验，尤其是游戏AI Bot的上线案例（如MOBA、卡牌等）
强调LLM相关研究或应用经历，如对话系统、智能体开发
展示编程能力：C++/Python熟练度，大型分布式系统的经验
补充LLM的微调技巧（如LoRA、RLHF），以及强化学习与LLM结合的最新方法
熟悉Unity或Unreal引擎中的AI集成流程，了解游戏开发管线

面试指南

结合具体项目经验，阐述问题定义、方案选择、实施过程及结果
先讲理论框架，再结合实际场景中的调优技巧，展示深度理解
请解释PPO算法的工作原理及其在游戏AI中的应用
如何将大语言模型集成到强化学习智能体中？有哪些挑战？
描述你设计过一个大规模分布式训练系统的经历，如何优化训练效率？
在MOBA游戏中，AI如何实现团队协作？你会选择哪种算法框架？
你如何看待AIGC在游戏中的应用前景？请举例说明
复习强化学习经典算法（DQN、A3C、PPO等），并能手推关键公式

职位点评

综合评分

字节跳动游戏AI算法岗，前沿技术栈，高成长性，但工作强度可能较大。

更适合这类人

最适合将技能成长和前沿技术探索作为首要动机的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展95

工作生活50

使命价值75

薪资福利

85较高

字节跳动薪资在业内处于领先水平，且上市后福利完善，但JD未明确提及具体福利。

薪资信号市场水准 (35K-60K/月)

成长发展

95较高

职位涉及强化学习、LLM等前沿技术，且有完整的业务场景，成长空间极大。

技术前沿前沿/新兴技术

技术栈强化学习、模仿学习、LLM、AIGC、分布式训练

成长机会推动技术方案创新、跟踪学术界与工业界前沿技术

业务类型profit_center

工作生活

50较低

杭州办公，但未说明远程或弹性工作，互联网大厂通常工作强度较高。

工作模式未明确

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

75中等

游戏AI领域具有创新性，能带来沉浸式体验，但社会影响力相对有限。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

字节跳动

游戏AI算法高级工程师（强化学习方向）-AIGC

立即应聘

游戏AI算法高级工程师（强化学习方向）-AIGC

发布于大约 2 个月前

普通员工/个人贡献者

杭州市

高级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

大语言模型

强化学习

深度强化学习

AIGC

LLM

MOBA

PyTorch

TensorFlow

AI 估算 · 35k–60k

字节跳动高级算法岗，杭州游戏AI方向，薪资竞争力强，技能要求高。

职位详情

关于这个职位

该职位专注于游戏AI算法研发，特别是强化学习与LLM融合方向，负责从模型训练到线上部署的全流程

你将参与高拟人化智能体（如虚拟玩家、智能NPC）的开发，推动前沿技术在游戏场景落地，并优化大规模分布式训练系统

适合对游戏AI有浓厚兴趣、具备强化学习和深度学习背景的算法工程师

最低要求

计算机相关专业，硕士及以上学位

工作职责

探索AI Bot与LLM的融合技术，研发高拟人化、强交互性的智能体（如虚拟助手、虚拟玩家、智能NPC等）

算法应用效果优化，提高大规模分布式训练系统的学习效率和效果

跟踪学术界与工业界前沿技术，推动技术方案创新

优先资格

对强化学习、深度学习、LLM等算法原理及其在游戏行业的应用有深入的理解，在MOBA/UGC/卡牌等游戏类型有AI Bot上线经验者优先

对于游戏AI技术研究探索和应用有浓厚兴趣的同学优先

AI 洞察

优缺点分析

优点

字节跳动核心业务，资源丰富，拥有大量游戏场景和真实数据供模型训练
前沿技术方向，强化学习+LLM融合是AI领域的热点，技能增值快
团队成员多为行业大牛，技术氛围浓厚，有助于快速成长
游戏AI对拟人化和交互性要求高，算法落地难度大，可能需要频繁迭代
大规模分布式训练系统运维复杂，需要投入大量时间进行工程优化
行业竞争激烈，需要持续跟踪学术界最新论文并快速实验

缺点 / 挑战

适合对游戏AI充满热情、具备扎实算法功底且愿意挑战复杂工程问题的技术型人才

角色解读

技术专家路线：深耕游戏AI算法，成为强化学习或LLM领域的顶尖研究者
技术管理路线：带领团队负责完整游戏AI项目，向AI技术总监发展
跨领域发展：转向AIGC、机器人或自动驾驶等同样依赖强化学习的领域
研发游戏AI Bot，运用强化学习、模仿学习和LLM技术，让虚拟角色具备高拟人化行为
推动AI模型从训练到线上部署的全流程落地，包括数据收集、模型训练、性能优化等
优化大规模分布式训练系统，提高训练效率与模型效果
扎实的强化学习、深度学习理论基础，熟悉主流算法如DQN、PPO、SAC等
熟练掌握Python和至少一种深度学习框架（PyTorch/TensorFlow），具备模型搭建和调优能力
对LLM有深入理解，能够将大语言模型与强化学习结合用于智能体对话与决策

申请策略

提前了解字节跳动旗下的游戏业务（如朝夕光年），在面试中展示对该游戏AI应用的思考
准备一个完整的AI Bot项目案例，从问题定义、算法选择到上线效果分析
突出强化学习项目经验，尤其是游戏AI Bot的上线案例（如MOBA、卡牌等）
强调LLM相关研究或应用经历，如对话系统、智能体开发
展示编程能力：C++/Python熟练度，大型分布式系统的经验
补充LLM的微调技巧（如LoRA、RLHF），以及强化学习与LLM结合的最新方法
熟悉Unity或Unreal引擎中的AI集成流程，了解游戏开发管线

面试指南

结合具体项目经验，阐述问题定义、方案选择、实施过程及结果
先讲理论框架，再结合实际场景中的调优技巧，展示深度理解
请解释PPO算法的工作原理及其在游戏AI中的应用
如何将大语言模型集成到强化学习智能体中？有哪些挑战？
描述你设计过一个大规模分布式训练系统的经历，如何优化训练效率？
在MOBA游戏中，AI如何实现团队协作？你会选择哪种算法框架？
你如何看待AIGC在游戏中的应用前景？请举例说明
复习强化学习经典算法（DQN、A3C、PPO等），并能手推关键公式

职位点评

综合评分

字节跳动游戏AI算法岗，前沿技术栈，高成长性，但工作强度可能较大。

更适合这类人

最适合将技能成长和前沿技术探索作为首要动机的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展95

工作生活50

使命价值75

薪资福利

85较高

字节跳动薪资在业内处于领先水平，且上市后福利完善，但JD未明确提及具体福利。

薪资信号市场水准 (35K-60K/月)

成长发展

95较高

职位涉及强化学习、LLM等前沿技术，且有完整的业务场景，成长空间极大。

技术前沿前沿/新兴技术

技术栈强化学习、模仿学习、LLM、AIGC、分布式训练

成长机会推动技术方案创新、跟踪学术界与工业界前沿技术

业务类型profit_center

工作生活

50较低

杭州办公，但未说明远程或弹性工作，互联网大厂通常工作强度较高。

工作模式未明确

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

75中等

游戏AI领域具有创新性，能带来沉浸式体验，但社会影响力相对有限。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

游戏AI算法高级工程师（强化学习方向）-AIGC

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

游戏AI算法高级工程师（强化学习方向）-AIGC

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

软件技术规划SE/专家(手机海外方向)

AI Coding大模型/算法实习

Electrode

Process Engineering Intern

电池安全技师 Battery Safety Technician

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

软件技术规划SE/专家(手机海外方向)

AI Coding大模型/算法实习

Electrode

Process Engineering Intern

电池安全技师 Battery Safety Technician

字节跳动的其他在招职位

字节跳动的其他在招职位