Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/字节跳动/强化学习算法工程师-剪映CapCut
ByteDance logo
B
字节跳动 (ByteDance)

职位信息

北京市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

强化学习LLMRLHF大模型训练
💡

核心评价

顶尖大厂核心AI岗,技术前沿、成长性极佳,薪资竞争力强,但需接受现场办公及可能的快节奏。

强化学习算法工程师-剪映CapCut

🤖 AI 估测:¥35K-70K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于视频创作Agent研发的强化学习算法工程师岗位
你将负责研究大模型对齐、Agent设计及端到端训练,并应用强化学习等前沿算法优化视频创作流程
核心工作包括高质量数据挖掘、评测方法设计以及推动LLM/VLM Agent技术在实际业务场景中的落地

✓工作职责

负责视频创作Agent相关的研发与应用,研究大模型的对齐方法、Agent的设计&端到端训练(Agentic RL)等,跟进LLM、Agent的最新进展
研究LLM/VLM Agent训练算法,尤其是强化学习(RL)的各类算法
高质量数据的挖掘和清洗,研究探索数据自动、半自动合成方案,设计视频创作Agent的评测方法,设计置信的RL Reward方案
持续跟踪LLM/VLM、Agent领域的最新技术动态,并将其应用于实际业务场景中,推动技术落地

⭐最低要求

优秀的代码能力、数据结构和基础算法功底,熟练掌握至少一门语言
深入理解大模型或图片视频生成等相关技术栈(如RLHF、SFT、Dit/Vit/Transformer、Stable Diffusion等),对强化学习(RL)在上述技术栈中的应用机制和潜力有清晰认知,可灵活运用RL优化相关流程
出色的问题分析和解决能力,有自主探索解决方案的能力
良好的沟通协作能力,能和团队一起探索新技术,推动技术进步

👍优先资格

ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先
在大模型领域,主导过有影响力的项目或论文者优先
在NeurIPS/ICML/ICLR/ACL/EMNLP等顶会发表论文者优先
有大模型训练经验,有文案生成、创意生成、素材编辑、AI特效等有相关经验,有Agent、Tool-Use、MCP等相关经验优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI产品经理(海外增长)-飞书

    字节跳动

    北京市 · 仅现场办公

  • 采购政策与合规专家

    字节跳动

    北京市 · 仅现场办公

  • 华南游戏行业销售经理-火山引擎

    字节跳动

    深圳市 · 仅现场办公

  • 高级后台开发工程师-Cross Platform

    字节跳动

    深圳市 · 仅现场办公

  • 前端开发专家/工程师-基础架构(北京)

    字节跳动

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公