Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
豆包大模型算法工程师(互动娱乐)-火山方舟
立即应聘

豆包大模型算法工程师(互动娱乐)-火山方舟

发布于 大约 17 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
NeurIPS
大模型
RL
PPO
Grpo
语音S2S
Character-Llm

AI 估算 · 30k–60k

上海字节跳动大模型算法岗,结合岗位级别和市场水平,薪资具有竞争力。

职位详情

关于这个职位

该职位主要负责豆包大模型在互动娱乐场景的算法优化与创新,包括角色扮演大模型(Character-LLM)的迭代、游戏Agent与CodeAgent的设计与训练,以及语音到语音(S2S)模型的拟人化提升

你将参与强化学习(RL)和智能体(Agent)的前沿探索,与团队共同推动大模型技术在娱乐领域的落地

最低要求

计算机相关专业,本科及以上学历,一年及以上大模型算法工作经验

有RL训练经验,熟悉如GRPO、PPO、DAPO等Recipe,有较强的RL分析和改进经验
优秀的代码能力、数据结构和基础算法功底,C/C++或Python熟练

工作职责

负责参与Character-LLM迭代优化,包括但不限于数据合成、数据筛选、数据分析、Post-Training等任务

负责参与游戏Agent和CodeAgent任务的设计,环境的构建、Reward的设计以及保障RL的正确训练
负责语音S2S在通用任务上基础能力的优化,支持类似FC、RAG等场景
负责语音S2S在角色扮演及真人对话上拟人能力的提升
对RM、RL、Agent有技术探索的热情

优先资格

有领域顶级会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先

熟悉大模型相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉业界前沿评估方法者优先
在大模型领域,主导参与过大影响力的项目或论文者优先
出色的独立分析和解决问题的能力,能深入解决大模型评估优化和应用存在的问题
良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步

AI 洞察

优缺点分析

优点

  • 深耕前沿大模型与强化学习技术,接触行业顶尖的算法和工程实践
  • 字节跳动平台资源丰富,数据量大,业务场景多样,技术成长空间大
  • 团队氛围浓厚,有机会与顶级会议论文作者合作,参与有影响力的项目
  • 技术难度高,需要同时掌握RL、大模型、语音等多个领域,学习曲线陡峭
  • 工作节奏快,可能需要应对高强度研发和快速迭代的需求
  • 适合对强化学习和大模型有浓厚兴趣、具备扎实编程功底和较强自驱力的技术型人才,希望在互联网大厂前沿团队中快速成长

缺点 / 挑战

  • 岗位竞争激烈,对候选人的代码能力和学术背景要求较高

角色解读

  • 在大模型和RL领域深耕,成为技术专家,主导核心算法的研发与创新
  • 向技术管理方向发展,带领团队负责互动娱乐场景的算法落地与迭代
  • 跨领域拓展,结合语音、Agent等方向,成长为多模态智能体领域的领军人才
  • 负责优化角色扮演大模型(Character-LLM),通过数据合成、筛选和Post-Training提升模型在互动娱乐场景的表现
  • 设计和训练游戏Agent和CodeAgent,包括环境构建、奖励函数设计,并确保强化学习训练的正确性
  • 提升语音S2S模型的基础能力,支持FC、RAG等场景,同时增强角色扮演与真人对话的拟人化效果
  • 扎实的强化学习基础,熟悉GRPO、PPO等主流算法,能独立分析并改进RL训练流程
  • 优秀的编程能力,熟练使用C/C++或Python,具备良好的数据结构和算法功底
  • 对大模型技术有深入理解,包括预训练、微调、Post-Training等,有实际项目经验

申请策略

  • 在简历中清晰描述你在RL和大模型项目中的具体贡献,最好量化效果
  • 提前了解字节跳动火山方舟的业务方向,思考如何将你的经验与互动娱乐场景结合
  • 重点突出RL相关项目经验,尤其是GRPO、PPO等算法的实际应用和优化案例
  • 展示大模型相关的研究成果或工程落地经历,包括数据处理、模型训练、评估等环节
  • 如有顶级会议论文或编程竞赛获奖,务必放在显眼位置
  • 系统学习RL算法原理,动手复现经典论文,如PPO、DQN等
  • 熟悉大模型Post-Training流程,了解SFT、RLHF等常用方法
  • 补充语音相关基础知识,了解S2S模型架构和评估方法

面试指南

  • 对于RL算法问题,先阐述原理,再结合项目实际说明应用场景和优化动机
  • 对于开放性问题,采用“问题-方案-效果”的结构,量化结果
  • 对于评估类问题,从多个维度(准确性、多样性、拟人化等)展开,并引用业界常见方法
  • 请详细解释GRPO和PPO的区别,以及你在项目中是如何选择和改进的?
  • 描述一次你在大模型Post-Training中遇到的数据问题,你是如何分析和处理的?
  • 如何评判一个角色扮演大模型的好坏?你会设计哪些评估指标?
  • 如果你要训练一个游戏Agent,你会如何设计奖励函数?可能会遇到哪些挑战?
  • 复习强化学习经典算法,重点掌握GRPO、PPO的推导和实现细节

匹配度报告

68
综合匹配度

前沿大模型算法岗,技术成长极高,薪资优厚,但工作节奏快,WLB一般。

适合人群
该职位最适合追求技术成长和前沿挑战的求职者,对工作生活平衡要求不高,看重薪资和职业发展空间。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值60

薪资福利匹配

80较高

字节跳动薪资水平在行业内具有竞争力,且已上市公司福利完善,但JD中未明确薪资和具体福利,因此得分中等偏高。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

岗位聚焦大模型和RL前沿技术,JD中强调技术探索和创新,成长空间巨大,但未明确提及晋升通道。

技术前沿前沿/新兴技术
技术栈大模型、RL、GRPO、PPO、Agent、Character-LLM、语音S2S
成长机会技术探索、推进技术进步
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性工作或远程,互联网大厂工作节奏通常较快,生活平衡一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

互动娱乐场景具有一定的社会影响力,但更多是商业驱动,创新性较强,使命感一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 高级蓝牙软件开发工程师-豆包手机助手(北京/深圳)

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 发卡产品经理-国际支付

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 广告投放经理-中国用户增长

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • AI应用后端研发工程师-国际化短视频-深圳/上海

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 抖音时政垂类运营经理

    字节跳动 · 北京市
    AI 估算 · 30k-50k

相似职位推荐

  • 技术美术师(美术向)

    莉莉丝 · 上海市
    AI 估算 · 20k-35k
  • R&D Engineer

    日立能源 · 西安市
    AI 估算 · 15k-25k
  • R&D Intern on Material, Power Electronics, Power System and Data Science

    日立能源 · 北京市
    AI 估算 · 4k-6k
  • Technology Platform-游戏机器学习研究工程师

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 数值策划

    三七互娱 · 厦门市
    AI 估算 · 15k-25k

字节跳动 的其他在招职位

  • 高级蓝牙软件开发工程师-豆包手机助手(北京/深圳)

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 发卡产品经理-国际支付

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 广告投放经理-中国用户增长

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • AI应用后端研发工程师-国际化短视频-深圳/上海

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 抖音时政垂类运营经理

    字节跳动 · 北京市
    AI 估算 · 30k-50k

相似职位推荐

  • 技术美术师(美术向)

    莉莉丝 · 上海市
    AI 估算 · 20k-35k
  • R&D Engineer

    日立能源 · 西安市
    AI 估算 · 15k-25k
  • R&D Intern on Material, Power Electronics, Power System and Data Science

    日立能源 · 北京市
    AI 估算 · 4k-6k
  • Technology Platform-游戏机器学习研究工程师

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 数值策划

    三七互娱 · 厦门市
    AI 估算 · 15k-25k