Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI Agent算法专家-国际电商
立即应聘

AI Agent算法专家-国际电商

发布于 1 天前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
本科
LLM
SFT
多智能体系统
电商
PPO
RLHF
LangGraph
Grpo
Openclaw
Claude Code

AI 估算 · 45k–70k

字节跳动上海算法专家岗,结合AI Agent稀缺技能,薪资属于互联网大厂高位水平。

职位详情

关于这个职位

作为字节跳动国际电商的AI Agent算法专家,你将负责构建电商场景下的智能体核心大脑,探索前沿Agent框架并落地到实际业务中

工作涉及打造高性能技能工具集、优化Agent强化学习体系,以及推动Agent的自动化与自进化能力
这是一个技术深度与业务影响力兼具的岗位,适合对AI Agent和大模型有热情、渴望挑战复杂工程问题的算法工程师

最低要求

精通Python编程,具备生产级应用的开发经验,熟悉Linux开发环境,并对数据结构和算法有深入理解

熟悉至少一种主流Agent框架,如LangGraph、OpenClaw、Hermes、Codex、Claude Code等,并有实际项目经验
深刻理解大模型(LLM)与AI Agent的核心原理,熟悉主流Agent架构(如ReAct/PlanAct)、多智能体系统(Multi-Agent)及上下文工程与记忆(Context Engineering/Memory)等概念
具备AI算法背景,对SFT、RLHF等Post-training技术有深入了解,有针对性优化模型能力的实践经验者优先
具备出色的技术沟通、项目管理和跨团队协同能力,能够撰写清晰的技术文档、教程和示例代码
对技术充满热情,具备优秀的分析和解决问题能力,能够主动追踪前沿技术并探索其在业务中的应用

工作职责

构建电商Agent核心大脑与技术前沿追踪:探索主流Agent框架,如LangGraph、OpenClaw、Hermes、Codex、Claude Code等,构建稳定可靠的Valley-Agent基座,重点提升任务的自动规划与调度、工具调用、多模态交互及深度研究能力

持续追踪AI Agent领域的最新进展(如Codex,OpenClaw,Hermes,ClaudeCode等),引入并验证新技术的可行性,沉淀技术文档与最佳实践,推动前沿技术在国际电商治理场景的创新应用
打造电商场景Skills工具集:基于电商业务系统,构建和优化一系列高性能、可复用的Skills
这包括利用小尺寸模型打造支撑高QPS场景的基础模型工具集,也包括将复杂的业务SOP(标准作业程序)封装为稳定可调用的治理Agent(如审核、RCA、立规Agent)
研发与优化Agentic RL:基于主流agent框架,并结合Post-training技术(SFT/RLHF)与强化学习(PPO/GRPO)对模型进行持续优化,建立电商大模型的Agentic RL训练体系,提升模型在复杂问题上的准确率与动态反思能力
探索Agent自动化与自进化:结合Auto-Workflow与多智能体系统(MAS),一方面支持工作流的自动生成与优化,另一方面探索基于Agentic RAG和Memory机制的自进化(Self-Evolution)闭环,让Agent能够从真实交互数据中学习,持续提升其决策与执行能力
构建稳定可靠的Agent基础设施:负责Agent系统的性能与稳定性优化,包括资源利用、QPS、成本控制、环境交互速度等,并沉淀通用能力,构建包含可观测性与权限体系的Agent Infra,保障系统的安全可控

优先资格

在电商、内容风控、平台治理等领域有相关算法或研发经验

在强化学习领域有深入研究或实践经验,如Policy-based/Value-based methods、PPO、GRPO等
熟悉多模态(Multi-modal)推理技术,并有相关项目落地经验
对Agent安全(Safety)、成本优化、性能(QPS/稳定性)有深入思考或实践经验
在ICML、ICLR、NeurIPS、ACL、CVPR等学术会议上发表过有影响力的研究成果,或在ACM/ICPC、NOI/IOI、Kaggle等竞赛中获奖者
熟悉全球主流大模型服务及API,有设计并落地复杂Agent系统的经验

AI 洞察

优缺点分析

优点

  • 字节跳动大平台,海量电商数据和应用场景,技术落地机会多
  • 前沿AI Agent方向,技术成长快,行业需求旺盛
  • 团队技术氛围好,有机会与顶级工程师和科学家合作
  • 技术迭代快,需要持续学习和追踪前沿进展
  • 电商场景复杂,业务需求多变,工程稳定性要求高
  • 适合对AI Agent和大模型有强烈热情、具备扎实算法和工程能力、渴望在高速增长业务中实现技术突破的资深算法工程师

缺点 / 挑战

  • 强化学习和Post-training技术门槛较高,需要扎实的理论基础

角色解读

  • 技术深耕:成为Agent框架和强化学习领域的权威专家
  • 架构演进:从单一Agent设计到多智能体系统架构师
  • 管理路线:带领算法团队,推动AI Agent在国际电商的全面落地
  • 设计并构建电商场景下的AI Agent核心大脑,实现任务自动规划、工具调用和多模态交互
  • 开发和优化高性能技能工具集,将业务SOP封装为可调用的治理Agent
  • 基于强化学习(PPO/GRPO)和Post-training技术优化大模型,提升Agent的准确性和反思能力
  • 探索Agent的自动化与自进化机制,构建稳定可靠的Agent基础设施
  • 精通Python和Linux开发,具备生产级应用经验
  • 熟悉LangGraph等主流Agent框架,理解ReAct/PlanAct等架构
  • 深入理解LLM原理和Post-training技术(SFT/RLHF),有强化学习实践经验
  • 具备跨团队协作能力和技术文档撰写能力

申请策略

  • 关注字节跳动国际电商的技术博客,了解团队方向和近期成果
  • 在简历中强调跨团队协作和技术文档能力,这是加分项
  • 突出Agent框架(LangGraph等)的实际项目经验,说明你在任务规划、工具调用中的具体贡献
  • 强调Post-training技术(SFT/RLHF)和强化学习(PPO/GRPO)的实践经验,最好有量化效果
  • 展示电商、风控或治理领域的算法落地案例,体现业务理解能力
  • 如果有开源贡献或学术论文,列出相关成果
  • 熟悉至少一种主流Agent框架的源码和最佳实践,动手搭建一个Demo
  • 系统学习强化学习(尤其是PPO/GRPO)和RLHF的训练流程

面试指南

  • 项目经历类:STAR法则(情境、任务、行动、结果),突出技术选型和量化成果
  • 设计类:先明确目标,拆解模块(规划、工具、记忆等),再讨论技术方案和权衡
  • 原理类:从定义出发,对比不同方法,结合实践经验说明优劣
  • 请描述你使用LangGraph构建Agent的经历,遇到过哪些挑战?
  • 解释SFT和RLHF的区别,以及你如何应用它们优化模型?
  • 设计一个电商场景下的Agent,要求自动处理用户退款争议
  • 如何评估Agent系统的性能和稳定性?QPS和成本如何平衡?
  • 你对多智能体系统(MAS)的理解?在电商中有什么应用场景?

匹配度报告

69
综合匹配度

字节国际电商前沿AI Agent岗,技术成长爆棚,薪资丰厚,但WLB一般。

适合人群
最看重技术成长和前沿探索,对薪资和平台有高要求,能接受较高工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展95
工作生活40
使命价值65

薪资福利匹配

75中等

字节跳动薪资待遇在互联网行业处于头部水平,但JD未明确薪资范围,且作为算法专家岗位,整体薪酬竞争力强。

薪资信号未披露(AI估算:45K-70K/月)

成长发展匹配

95较高

岗位聚焦AI Agent前沿技术,涉及LLM、强化学习、多智能体系统等,技术成长空间极大。JD明确要求追踪前沿并沉淀文档,发展性极强。

技术前沿前沿/新兴技术
技术栈Python、LangGraph、OpenClaw、Hermes、Codex、Claude Code、LLM、SFT、RLHF、PPO、GRPO、多智能体系统、电商
业务类型profit_center

工作生活匹配

40较低

JD中未提及远程或弹性工作,字节跳动通常要求现场办公。工作强度可能较高,但未明确说明加班情况。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

65中等

电商和AI结合对用户购物体验有直接改善,但JD未强调社会价值。行业前景好,但岗位本身偏技术实现,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k
  • PD Chemist

    汉高 · 上海市
    AI 估算 · 18k-28k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k
  • PD Chemist

    汉高 · 上海市
    AI 估算 · 18k-28k