Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
豆包大模型算法工程师(互动娱乐)-火山方舟
立即应聘

豆包大模型算法工程师(互动娱乐)-火山方舟

发布于 大约 14 小时前

普通员工/个人贡献者

杭州市
中级经验
全职员工
仅现场办公
本科
数据合成
大模型
RL
PPO
Grpo
语音S2S
Dapo

AI 估算 · 35k–55k

大模型方向薪资溢价高,字节跳动头部大厂,杭州生活成本适中,硕士起薪高,年包预计60-80万。

职位详情

关于这个职位

加入字节跳动火山方舟团队,专注于豆包大模型在互动娱乐方向的算法研发

你将参与Character-LLM、游戏Agent、语音S2S等前沿技术的优化与创新,通过数据合成、RL训练等手段提升模型表现
这是一个与顶级技术团队合作、深入大模型核心研发的机会,适合对RL和Agent技术充满热情的你

最低要求

计算机相关专业,本科及以上学历,一年及以上大模型算法工作经验

有RL训练经验,熟悉如GRPO、PPO、DAPO等Recipe,有较强的RL分析和改进经验
优秀的代码能力、数据结构和基础算法功底,C/C++或Python熟练
出色的独立分析和解决问题的能力,能深入解决大模型评估优化和应用存在的问题
良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步

工作职责

负责参与Character-LLM迭代优化,包括但不限于数据合成、数据筛选、数据分析、Post-Training等任务

负责参与游戏Agent和CodeAgent任务的设计,环境的构建、Reward的设计以及保障RL的正确训练
负责语音S2S在通用任务上基础能力的优化,支持类似FC、RAG等场景
负责语音S2S在角色扮演及真人对话上拟人能力的提升
对RM、RL、Agent有技术探索的热情

优先资格

有相关方向技术和研究背景的候选人优先

有领域顶级会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)优先
有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先
熟悉大模型相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉业界前沿评估方法者优先
在大模型领域,主导参与过大影响力的项目或论文者优先

AI 洞察

优缺点分析

优点

  • 前沿技术栈:直接参与大模型、强化学习、语音S2S等AI最热门领域,技术积累价值极高
  • 大平台资源:字节跳动提供海量数据和算力支持,项目影响力大,成果易转化为论文或产品
  • 薪资竞争力强:头部大厂AI岗位薪资处于行业顶尖水平,且福利完善
  • 团队技术氛围好:与顶级研发人员共事,技术交流频繁,成长速度快
  • 工作强度大:大模型迭代快,项目节奏紧凑,可能需要高强度投入和快速响应
  • 技术难度高:涉及RL训练、模型调优等复杂问题,需要扎实的理论功底和调试经验
  • 竞争激烈:对标岗位要求高,候选人背景强,面试和工作中都需持续学习

缺点 / 挑战

  • 适合有大模型或RL背景、热爱技术挑战、渴望在AI前沿领域快速成长的算法工程师

角色解读

  • 技术深度方向:从算法工程师成长为RL/Agent领域专家,主导大模型核心模块研发
  • 技术广度方向:跨足语音、Agent、Character-LLM等多个方向,成为综合型AI技术负责人
  • 管理方向:随着项目扩大,可晋升为技术Leader,带领团队攻关复杂技术难题
  • 负责大模型(Character-LLM)的迭代优化,包括数据合成、筛选及后训练(Post-Training),提升模型在互动娱乐场景的表现
  • 设计游戏Agent和CodeAgent任务,构建环境与Reward机制,并保障强化学习(RL)的正确训练
  • 优化语音S2S(语音到语音)模型的基础能力,支持如FC(职能调用)、RAG(检索增强生成)等场景,并提升语音在角色扮演中的拟人度
  • 探索RM(奖励模型)、RL(强化学习)、Agent(智能体)等前沿技术,推动技术创新
  • 扎实的计算机基础,精通至少一门编程语言(Python或C/C++),具备优秀的代码和算法能力
  • 深入理解大模型算法(如Transformer、LLM微调等),有RL训练经验,熟悉GRPO、PPO、DAPO等算法
  • 具备数据分析和处理能力,能够进行数据合成、筛选和质量评估
  • 有独立分析和解决问题的能力,能深入解决大模型评估优化中的实际问题

申请策略

  • 关注字节跳动火山方舟团队的技术博客和开源项目,面试中展示对团队方向的深入理解
  • 准备一个完整的项目案例,从问题定义、方案设计到最终效果,体现解决复杂问题的能力
  • 重点突出RL训练经验,具体说明使用过的算法(如PPO、GRPO)及实际优化效果
  • 强调大模型项目经历(如LLM微调、数据合成),附上量化成果(如指标提升)
  • 展示代码能力:提供GitHub链接、竞赛获奖或开源贡献,体现C++/Python熟练度
  • 如有顶级会议论文或比赛奖项(ACL、NeurIPS、Kaggle等),必须醒目列出
  • 系统复习RL经典算法(PPO、TRPO、DAPO等),并动手实现一个简单RL项目
  • 熟悉主流大模型框架(如Transformers、DeepSpeed),了解Post-Training技术(DPO、RLHF)

面试指南

  • 技术原理类:先阐述基础理论,再结合实际项目经验说明应用细节,最后总结挑战和解决方案
  • 项目经历类:采用STAR法则(情景、任务、行动、结果),突出关键决策和量化收益
  • 开放性问题:先拆解问题,给出多个可行方案并分析优劣,展示系统思考能力
  • 请详细解释PPO和GRPO的原理及区别,并说明在实际训练中如何调整超参数?
  • 如何在RL训练中设计Reward函数以避免奖励欺骗(reward hacking)?
  • 描述一次你优化大模型性能的经历,用了哪些数据策略和训练技巧?
  • 如何处理语音S2S模型在角色扮演场景中的拟人度问题?
  • 在Agent任务中,如何确保RL训练的稳定性和收敛性?

匹配度报告

69
综合匹配度

大厂AI核心岗位,前沿技术栈,高薪高成长,但工作强度和WLB挑战较大。

适合人群
最看重技术成长和前沿挑战的求职者,愿意为顶尖技术付出一定生活自由度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展95
工作生活40
使命价值60

薪资福利匹配

80较高

薪资水平在行业中属顶尖,字节跳动福利完善(如五险一金、高比例公积金、免费三餐等),但JD未明确具体薪资,属于面议,但结合大厂和岗位性质,补偿性动机满足度较高。

薪资信号面议 (35K-55K/月)

成长发展匹配

95较高

该岗位处于AI最前沿领域,技术迭代快,项目影响力大,团队氛围技术导向,成长空间极大。JD中虽未明确提及导师制或培训,但大厂通常有内部学习资源,且技术挑战本身促进发展。

技术前沿前沿/新兴技术
技术栈大模型、RL、GRPO、PPO、DAPO、Agent、语音S2S
业务类型profit_center

工作生活匹配

40较低

字节跳动整体工作节奏较快,且JD未提及弹性办公或远程,杭州办公地点大概率在市区科技园,但未明确说明。WLB信号缺失,需考虑加班可能性。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

60中等

互动娱乐方向的大模型应用属于高速增长赛道,但社会影响力一般,更多是技术驱动。JD未提及使命价值,创新水平高因为是行业领先技术。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • Senior Analytical Scientist

    赫力昂 · 苏州市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • Senior Analytical Scientist

    赫力昂 · 苏州市
    AI 估算 · 25k-40k