Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
游戏AI算法高级工程师(强化学习方向)-AIGC
立即应聘

游戏AI算法高级工程师(强化学习方向)-AIGC

发布于 大约 10 小时前

普通员工/个人贡献者

杭州市
高级经验
全职员工
仅现场办公
硕士
PyTorch
强化学习
TensorFlow
LLM
大语言模型
AIGC
深度强化学习
MOBA

AI 估算 · 35k–60k

字节跳动高级算法岗,杭州游戏AI方向,薪资竞争力强,技能要求高。

职位详情

关于这个职位

该职位专注于游戏AI算法研发,特别是强化学习与LLM融合方向,负责从模型训练到线上部署的全流程

你将参与高拟人化智能体(如虚拟玩家、智能NPC)的开发,推动前沿技术在游戏场景落地,并优化大规模分布式训练系统
适合对游戏AI有浓厚兴趣、具备强化学习和深度学习背景的算法工程师

最低要求

计算机相关专业,硕士及以上学位

基础扎实,编码过关,熟悉常用的算法和数据结构,熟练掌握C/C++、Go、Python等至少一门编程语言,具备较强动手和快速学习能力,能够应用TF、PyTorch等主流框架实现模型搭建与算法调优

工作职责

参与游戏AI Bot的算法研究和应用,包括但不限于强化学习、模仿学习、基于大语言模型(LLM)的AI算法等,结合游戏场景,推动模型从训练到线上部署的全流程落地

探索AI Bot与LLM的融合技术,研发高拟人化、强交互性的智能体(如虚拟助手、虚拟玩家、智能NPC等)
算法应用效果优化,提高大规模分布式训练系统的学习效率和效果
跟踪学术界与工业界前沿技术,推动技术方案创新

优先资格

对强化学习、深度学习、LLM等算法原理及其在游戏行业的应用有深入的理解,在MOBA/UGC/卡牌等游戏类型有AI Bot上线经验者优先

对于游戏AI技术研究探索和应用有浓厚兴趣的同学优先

AI 洞察

优缺点分析

优点

  • 字节跳动核心业务,资源丰富,拥有大量游戏场景和真实数据供模型训练
  • 前沿技术方向,强化学习+LLM融合是AI领域的热点,技能增值快
  • 团队成员多为行业大牛,技术氛围浓厚,有助于快速成长
  • 游戏AI对拟人化和交互性要求高,算法落地难度大,可能需要频繁迭代
  • 大规模分布式训练系统运维复杂,需要投入大量时间进行工程优化
  • 行业竞争激烈,需要持续跟踪学术界最新论文并快速实验

缺点 / 挑战

  • 适合对游戏AI充满热情、具备扎实算法功底且愿意挑战复杂工程问题的技术型人才

角色解读

  • 技术专家路线:深耕游戏AI算法,成为强化学习或LLM领域的顶尖研究者
  • 技术管理路线:带领团队负责完整游戏AI项目,向AI技术总监发展
  • 跨领域发展:转向AIGC、机器人或自动驾驶等同样依赖强化学习的领域
  • 研发游戏AI Bot,运用强化学习、模仿学习和LLM技术,让虚拟角色具备高拟人化行为
  • 推动AI模型从训练到线上部署的全流程落地,包括数据收集、模型训练、性能优化等
  • 优化大规模分布式训练系统,提高训练效率与模型效果
  • 扎实的强化学习、深度学习理论基础,熟悉主流算法如DQN、PPO、SAC等
  • 熟练掌握Python和至少一种深度学习框架(PyTorch/TensorFlow),具备模型搭建和调优能力
  • 对LLM有深入理解,能够将大语言模型与强化学习结合用于智能体对话与决策

申请策略

  • 提前了解字节跳动旗下的游戏业务(如朝夕光年),在面试中展示对该游戏AI应用的思考
  • 准备一个完整的AI Bot项目案例,从问题定义、算法选择到上线效果分析
  • 突出强化学习项目经验,尤其是游戏AI Bot的上线案例(如MOBA、卡牌等)
  • 强调LLM相关研究或应用经历,如对话系统、智能体开发
  • 展示编程能力:C++/Python熟练度,大型分布式系统的经验
  • 补充LLM的微调技巧(如LoRA、RLHF),以及强化学习与LLM结合的最新方法
  • 熟悉Unity或Unreal引擎中的AI集成流程,了解游戏开发管线

面试指南

  • 结合具体项目经验,阐述问题定义、方案选择、实施过程及结果
  • 先讲理论框架,再结合实际场景中的调优技巧,展示深度理解
  • 请解释PPO算法的工作原理及其在游戏AI中的应用
  • 如何将大语言模型集成到强化学习智能体中?有哪些挑战?
  • 描述你设计过一个大规模分布式训练系统的经历,如何优化训练效率?
  • 在MOBA游戏中,AI如何实现团队协作?你会选择哪种算法框架?
  • 你如何看待AIGC在游戏中的应用前景?请举例说明
  • 复习强化学习经典算法(DQN、A3C、PPO等),并能手推关键公式

匹配度报告

76
综合匹配度

字节跳动游戏AI算法岗,前沿技术栈,高成长性,但工作强度可能较大。

适合人群
最适合将技能成长和前沿技术探索作为首要动机的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值75

薪资福利匹配

85较高

字节跳动薪资在业内处于领先水平,且上市后福利完善,但JD未明确提及具体福利。

薪资信号市场水准 (35K-60K/月)

成长发展匹配

95较高

职位涉及强化学习、LLM等前沿技术,且有完整的业务场景,成长空间极大。

技术前沿前沿/新兴技术
技术栈强化学习、模仿学习、LLM、AIGC、分布式训练
成长机会推动技术方案创新、跟踪学术界与工业界前沿技术
业务类型profit_center

工作生活匹配

50较低

杭州办公,但未说明远程或弹性工作,互联网大厂通常工作强度较高。

工作模式未明确
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

游戏AI领域具有创新性,能带来沉浸式体验,但社会影响力相对有限。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 消息中间件产品开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 番茄系内容运营-音乐

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 基础框架产品-红果短剧

    字节跳动 · 深圳市
    AI 估算 · 20k-35k
  • XR系统应用开发工程师-移动OS

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • UX设计师-飞书文档

    字节跳动 · 深圳市
    AI 估算 · 15k-30k

相似职位推荐

  • Lab Formulation Engineer

    路威酩轩 · 上海市
    AI 估算 · 20k-35k
  • R&D intern

    通用电气-布朗-博韦里 · 江门市
    AI 估算 · 3k-4k
  • 算法开发工程师

    京东 · 上海市
    AI 估算 · 30k-60k
  • 音频算法

    一汽丰田 · 北京市
    AI 估算 · 30k-50k

字节跳动 的其他在招职位

  • 消息中间件产品开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 番茄系内容运营-音乐

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 基础框架产品-红果短剧

    字节跳动 · 深圳市
    AI 估算 · 20k-35k
  • XR系统应用开发工程师-移动OS

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • UX设计师-飞书文档

    字节跳动 · 深圳市
    AI 估算 · 15k-30k

相似职位推荐

  • Lab Formulation Engineer

    路威酩轩 · 上海市
    AI 估算 · 20k-35k
  • R&D intern

    通用电气-布朗-博韦里 · 江门市
    AI 估算 · 3k-4k
  • 算法开发工程师

    京东 · 上海市
    AI 估算 · 30k-60k
  • 音频算法

    一汽丰田 · 北京市
    AI 估算 · 30k-50k