Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI Agent算法专家-国际电商
立即应聘

AI Agent算法专家-国际电商

发布于 1 天前

普通员工/个人贡献者

北京市
专家级经验
全职员工
仅现场办公
学历未注明
强化学习
LLM
多模态
SFT
多智能体系统
AI Agent
PPO
RLHF
LangGraph
Grpo

AI 估算 · 35k–60k

算法专家级职位,技术要求极高,字节跳动薪资竞争力强,中位数约47500元/月。

职位详情

关于这个职位

作为字节跳动国际电商团队的AI Agent算法专家,你将专注于构建电商领域智能Agent的核心大脑,推动前沿AI技术在治理场景落地

工作涉及主流Agent框架(如LangGraph、Codex)的应用、Skills工具集开发、强化学习模型优化以及Agent基础设施的稳定性建设
此职位要求深厚的Python开发经验与LLM/Agent原理理解,适合热爱技术、追求前沿并具备算法背景的高端人才

最低要求

精通Python编程,具备生产级应用的开发经验,熟悉Linux开发环境,并对数据结构和算法有深入理解

熟悉至少一种主流Agent框架,如LangGraph、OpenClaw、Hermes、Codex、Claude Code等,并有实际项目经验
深刻理解大模型(LLM)与AI Agent的核心原理,熟悉主流Agent架构(如ReAct/PlanAct)、多智能体系统(Multi-Agent)及上下文工程与记忆(Context Engineering/Memory)等概念
具备AI算法背景,对SFT、RLHF等Post-training技术有深入了解,有针对性优化模型能力的实践经验者优先
具备出色的技术沟通、项目管理和跨团队协同能力,能够撰写清晰的技术文档、教程和示例代码
对技术充满热情,具备优秀的分析和解决问题能力,能够主动追踪前沿技术并探索其在业务中的应用

工作职责

构建电商Agent核心大脑与前沿技术落地:探索主流Agent框架,如LangGraph、OpenClaw、Hermes、Codex、Claude Code等,构建稳定可靠的Valley-Agent基座,重点提升任务的自动规划与调度、工具调用、多模态交互及深度研究能力

持续追踪AI Agent领域的最新进展(如Codex,OpenClaw,Hermes,ClaudeCode等),引入并验证新技术的可行性,沉淀技术文档与最佳实践,推动前沿技术在国际电商治理场景的创新应用
打造电商场景Skills工具集:基于电商业务系统,构建和优化一系列高性能、可复用的Skills
这包括利用小尺寸模型打造支撑高QPS场景的基础模型工具集,也包括将复杂的业务SOP(标准作业程序)封装为稳定可调用的治理Agent(如审核、RCA、立规Agent)
研发与优化Agentic RL:基于主流Agent框架,并结合Post-training技术(SFT/RLHF)与强化学习(PPO/GRPO)对模型进行持续优化,建立电商大模型的Agentic RL训练体系,提升模型在复杂问题上的准确率与动态反思能力
探索Agent自动化与自进化:结合Auto-Workflow与多智能体系统(MAS),一方面支持工作流的自动生成与优化,另一方面探索基于Agentic RAG和Memory机制的自进化(Self-Evolution)闭环,让Agent能够从真实交互数据中学习,持续提升其决策与执行能力
构建稳定可靠的Agent基础设施:负责Agent系统的性能与稳定性优化,包括资源利用、QPS、成本控制、环境交互速度等,并沉淀通用能力,构建包含可观测性与权限体系的Agent Infra,保障系统的安全可控

优先资格

在电商、内容风控、平台治理等领域有相关算法或研发经验

在强化学习领域有深入研究或实践经验,如Policy-based/Value-based methods、PPO、GRPO等
熟悉多模态(Multi-modal)推理技术,并有相关项目落地经验
对Agent安全(Safety)、成本优化、性能(QPS/稳定性)有深入思考或实践经验
在ICML、ICLR、NeurIPS、ACL、CVPR等学术会议上发表过有影响力的研究成果,或在ACM/ICPC、NOI/IOI、Kaggle等竞赛中获奖者
熟悉全球主流大模型服务及API,有设计并落地复杂Agent系统的经验

AI 洞察

优缺点分析

优点

  • 技术前沿:专注于AI Agent、强化学习等最热门领域,学习曲线陡峭
  • 平台优势:字节跳动国际电商业务高速增长,资源丰富,项目影响力大
  • 成长空间:参与核心系统搭建,有机会主导技术方向,晋升通道清晰
  • 技术难度高:涉及多智能体、自进化等复杂概念,需要持续学习和创新
  • 竞争激烈:岗位要求高,面临来自全球顶尖人才的竞争

缺点 / 挑战

  • 工作强度大:互联网大厂节奏快,可能需要承担较大压力
  • 适合具备扎实算法背景、对AI Agent充满热情、渴望在高速发展业务中挑战技术深度的资深工程师

角色解读

  • 技术深耕方向:成为Agent架构专家或强化学习算法专家,主导核心技术研发
  • 管理方向:逐步转型为技术Leader,带领团队探索前沿技术并推动业务落地
  • 业务与行业方向:深入电商治理领域,成为AI+电商的行业解决方案专家,向CTO/VP发展
  • 负责构建电商Agent核心大脑,探索LangGraph等主流框架,实现任务自动规划与多模态交互
  • 打造电商场景Skills工具集,封装业务SOP为可复用Agent,并优化高QPS基础模型
  • 研发Agentic RL,结合SFT/RLHF和PPO/GRPO提升模型复杂问题解决能力
  • 构建稳定可靠的Agent基础设施,优化性能、成本与可观测性,保障系统安全可控
  • 精通Python编程,具备生产级开发经验,熟悉Linux及数据结构和算法
  • 熟悉至少一种主流Agent框架(LangGraph等),并有实际项目经验
  • 深刻理解LLM与Agent核心原理,包括ReAct架构、多智能体系统及上下文工程
  • 具备AI算法背景,掌握SFT、RLHF等Post-training技术,有强化学习实践经验

申请策略

  • 在申请材料中强调对Agent技术的热情和前沿追踪能力,如列出近期关注的技术博客
  • 面试前准备一个完整Agent设计案例,说明从规划到落地的思考过程
  • 突出Agent框架项目经验,例如使用LangGraph或类似工具的实际落地案例
  • 展示强化学习或Post-training成果,如某模型通过RLHF提升准确率的量化指标
  • 强调技术文档撰写和跨团队协作能力,展现技术领导力
  • 列举发表论文或竞赛获奖,证明学术或实战实力
  • 深入掌握LangGraph等主流Agent框架,动手复现一个简单Agent系统
  • 补充强化学习理论知识,尤其是PPO/GRPO算法,可参考Spinning Up

面试指南

  • 对于项目类问题,使用STAR(情况、任务、行动、结果)框架,突出技术挑战和成果
  • 对于算法理论问题,先解释核心概念,再结合实操经验,最后提一下局限性
  • 对于系统设计问题,从需求分析、架构选择、权衡优化三方面展开
  • 请介绍一个你使用Agent框架完成的项目,重点说明架构设计和遇到的问题
  • 如何通过强化学习优化LLM的复杂推理能力?请结合具体算法说明
  • 在设计多智能体系统时,如何协调不同Agent的冲突并保证稳定性?
  • 请谈谈你对Agent自进化(Self-Evolution)的理解,以及如何在实际场景中实现
  • 如何评估Agent系统的性能(如QPS、成本、准确率)并进行优化?

匹配度报告

69
综合匹配度

前沿AI Agent算法岗,技术深度极高,薪资优厚,但工作强度大且WLB一般。

适合人群
最适合追求技术成长和前沿探索的求职者,愿意接受高强度工作换取行业领先技能。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值70

薪资福利匹配

75中等

岗位薪资处于行业高端,但JD未明确薪资和福利,仅从公司规模和职位层级看,补偿性较强。

薪资信号未披露(AI估算:35K-60K/月)

成长发展匹配

90较高

职位聚焦前沿AI Agent技术,涉及强化学习、多智能体系统等,成长空间极大,且公司鼓励技术探索。

技术前沿前沿/新兴技术
技术栈LLM、Agent、LangGraph、ReAct、RLHF、PPO、GRPO、Multi-Agent、SFT
成长机会持续追踪前沿技术、沉淀技术文档与最佳实践、推动前沿技术应用
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提弹性工作或加班情况,大厂普遍高强度,生活平衡较差。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

国际电商业务属于高速增长赛道,Agent技术应用能显著提升治理效率,有一定社会价值。

行业发展高速增长赛道
社会影响中性/一般
使命信号创新应用、提升决策与执行能力
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k
  • PD Chemist

    汉高 · 上海市
    AI 估算 · 18k-28k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k
  • PD Chemist

    汉高 · 上海市
    AI 估算 · 18k-28k