Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI Agent算法专家-国际电商
立即应聘

AI Agent算法专家-国际电商

发布于 2 天前

普通员工/个人贡献者

北京市
专家级经验
全职员工
仅现场办公
学历未注明
研究与开发 (研发)
强化学习
LLM
多模态
SFT
电商
大模型
AI Agent
PPO
RLHF

AI 估算 · 40k–70k

高级AI Agent算法专家,字节跳动大厂,北京,技术稀缺度高,月薪40-70K,15薪,竞争力强。

职位详情

关于这个职位

该职位专注于构建电商领域的AI Agent系统,包括核心大脑、工具集、强化学习训练、自动化及基础设施

适合具有深厚AI算法背景和Agent开发经验的技术专家,将前沿技术应用于大规模电商治理场景

最低要求

精通Python编程,具备生产级应用的开发经验,熟悉Linux开发环境,并对数据结构和算法有深入理解

熟悉至少一种主流Agent框架,如LangGraph、OpenClaw、Hermes、Codex、Claude Code等,并有实际项目经验
深刻理解大模型(LLM)与AI Agent的核心原理,熟悉主流Agent架构(如ReAct/PlanAct)、多智能体系统(Multi-Agent)及上下文工程与记忆(Context Engineering/Memory)等概念
具备AI算法背景,对SFT、RLHF等Post-training技术有深入了解,有针对性优化模型能力的实践经验者优先
具备出色的技术沟通、项目管理和跨团队协同能力,能够撰写清晰的技术文档、教程和示例代码
对技术充满热情,具备优秀的分析和解决问题能力,能够主动追踪前沿技术并探索其在业务中的应用

工作职责

构建电商Agent核心大脑并追踪前沿技术:探索主流Agent框架,如LangGraph、OpenClaw、Hermes、Codex、Claude Code等,构建稳定可靠的Valley-Agent基座,重点提升任务的自动规划与调度、工具调用、多模态交互及深度研究能力

持续追踪AI Agent领域的最新进展,引入并验证新技术的可行性,沉淀技术文档与最佳实践,推动前沿技术在国际电商治理场景的创新应用
打造电商场景Skills工具集:基于电商业务系统,构建和优化一系列高性能、可复用的Skills
这包括利用小尺寸模型打造支撑高QPS场景的基础模型工具集,也包括将复杂的业务SOP(标准作业程序)封装为稳定可调用的治理Agent(如审核、RCA、立规Agent)
研发与优化Agentic RL:基于主流Agent框架,并结合Post-training技术(SFT/RLHF)与强化学习(PPO/GRPO)对模型进行持续优化,建立电商大模型的Agentic RL训练体系,提升模型在复杂问题上的准确率与动态反思能力
探索Agent自动化与自进化:结合Auto-Workflow与多智能体系统(MAS),一方面支持工作流的自动生成与优化,另一方面探索基于Agentic RAG和Memory机制的自进化(Self-Evolution)闭环,让Agent能够从真实交互数据中学习,持续提升其决策与执行能力
构建稳定可靠的Agent基础设施:负责Agent系统的性能与稳定性优化,包括资源利用、QPS、成本控制、环境交互速度等,并沉淀通用能力,构建包含可观测性与权限体系的Agent Infra,保障系统的安全可控

优先资格

在电商、内容风控、平台治理等领域有相关算法或研发经验

在强化学习领域有深入研究或实践经验,如Policy-based/Value-based methods、PPO、GRPO等
熟悉多模态(Multi-modal)推理技术,并有相关项目落地经验
对Agent安全(Safety)、成本优化、性能(QPS/稳定性)有深入思考或实践经验
在ICML、ICLR、NeurIPS、ACL、CVPR等学术会议上发表过有影响力的研究成果,或在ACM/ICPC、NOI/IOI、Kaggle等竞赛中获奖者
熟悉全球主流大模型服务及API,有设计并落地复杂Agent系统的经验

AI 洞察

优缺点分析

优点

  • 字节跳动大厂平台,资源丰富,业务场景复杂,有真实落地机会
  • 团队技术氛围浓厚,可接触顶级学术会议和竞赛成果
  • 技术难度高,需要同时掌握Agent框架、大模型训练和工程优化
  • 电商业务对稳定性、QPS和成本有严格要求,工作强度可能较大
  • 跨团队协同多,对沟通和文档能力要求高
  • 适合具备AI算法和工程双背景、热爱前沿技术、渴望在复杂业务中创造价值的资深技术人才

缺点 / 挑战

  • 身处AI Agent最前沿,技术挑战大,成长空间极高

角色解读

  • 沿着AI Agent架构师或技术专家路线深耕,成为Agent系统领域的顶级专家
  • 横向拓展至多模态、自进化系统等前沿方向,主导技术革新
  • 未来可向技术管理方向发展,带领团队推动AI在电商治理的全面落地
  • 构建电商Agent核心大脑,探索LangGraph等框架,实现任务自动规划与工具调用
  • 打造可复用的Skills工具集,包括小模型高QPS服务和复杂业务Agent
  • 研发Agentic RL,结合SFT/RLHF和强化学习优化模型,提升准确率和反思能力
  • 精通Python和Linux,具备生产级开发经验,深入理解数据结构和算法
  • 熟悉至少一种主流Agent框架(如LangGraph)并有实际项目经验
  • 深刻理解LLM与AI Agent原理,包括ReAct架构、多智能体系统和上下文工程
  • 具备Post-training技术(SFT/RLHF)和强化学习(PPO/GRPO)的实践背景

申请策略

  • 在求职信中表达对AI Agent技术趋势的理解,并阐明如何应用于电商场景
  • 提前了解字节跳动国际电商业务,思考Agent能解决的具体痛点
  • 突出Agent框架(LangGraph等)的实际项目经验,展示架构设计和优化成果
  • 重点描述Post-training和强化学习(SFT/RLHF/PPO)的实践,附上量化结果
  • 如果有电商或风控经验,务必强调业务理解与落地效果
  • 列出学术论文或竞赛获奖,证明技术深度
  • 若缺少Agent框架经验,可快速学习LangGraph并动手搭建一个简单Agent
  • 补充强化学习相关知识,尤其是PPO、GRPO的原理和代码实现

面试指南

  • 技术问题:从原理出发,结合自身项目经验,先讲总体思路再深入细节
  • 系统设计:明确需求,评估约束,给出架构方案,考虑扩展性和稳定性
  • 行为问题:用STAR法则讲清情境、任务、行动和结果
  • 请描述你过去使用LangGraph或其他框架构建Agent的过程,遇到了哪些挑战?
  • SFT和RLHF如何结合来优化大模型的Agent能力?
  • 如何设计一个高QPS、低成本的Agent服务?
  • 多智能体系统中如何协调多个Agent的决策?
  • 谈谈你对Agent安全性的理解,如何防止恶意Prompt注入?

职位点评

74
综合评分

字节跳动AI Agent算法专家,前端技术顶尖,薪资优厚,但工作节奏快、压力大。

更适合这类人
最适合追求技术成长和前沿创新的求职者,愿意为高回报投入高强度工作。
表现最好
成长发展
相对薄弱
工作生活
薪资福利80
成长发展95
工作生活50
使命价值70

薪资福利

80较高

字节跳动头部大厂,薪资位于行业顶尖水平,福利完善,但具体薪资未明示,仍需面议。

薪资信号面议 (40K-70K/月)

成长发展

95较高

技术前沿性极强,Agent领域正高速发展,公司提供大量实践机会,成长路径清晰。

技术前沿前沿/新兴技术
技术栈AI Agent、LangGraph、LLM、SFT、RLHF、PPO、GRPO、多模态、强化学习
成长机会沉淀技术文档、追踪前沿技术、持续优化
业务类型profit_center

工作生活

50较低

仅现场办公,地点北京,未提及弹性工作或WLB,互联网大厂节奏通常较快。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

电商行业成熟稳定,但治理场景有一定社会价值,创新性高。

行业发展稳定成熟行业
社会影响中性/一般
使命信号治理、安全可控
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 税务合规专家

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 测试开发工程师-客服中台-北京

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 安全检测工程师-安全与风控

    字节跳动 · 杭州市
    AI 估算 · 20k-35k
  • 高级测试开发工程师-抖音

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 大模型训练存储系统专家-Seed

    字节跳动 · 杭州市
    AI 估算 · 50k-80k

相似职位推荐

  • 微信支付-大模型风控算法工程师

    腾讯 · 深圳市
    AI 估算 · 35k-60k
  • 魔方工作室-动作生成算法工程师-角色动画方向

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 运动健康算法工程师-实习-2027届

    小米 · 深圳市
    AI 估算 · 5k-8k
  • Principal Algorithm Engineer

    采埃孚 · 上海市
    AI 估算 · 50k-80k
  • Lead Engineer, Modeling & Simulation

    特灵 · 上海市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • 税务合规专家

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 测试开发工程师-客服中台-北京

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 安全检测工程师-安全与风控

    字节跳动 · 杭州市
    AI 估算 · 20k-35k
  • 高级测试开发工程师-抖音

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 大模型训练存储系统专家-Seed

    字节跳动 · 杭州市
    AI 估算 · 50k-80k

相似职位推荐

  • 微信支付-大模型风控算法工程师

    腾讯 · 深圳市
    AI 估算 · 35k-60k
  • 魔方工作室-动作生成算法工程师-角色动画方向

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 运动健康算法工程师-实习-2027届

    小米 · 深圳市
    AI 估算 · 5k-8k
  • Principal Algorithm Engineer

    采埃孚 · 上海市
    AI 估算 · 50k-80k
  • Lead Engineer, Modeling & Simulation

    特灵 · 上海市
    AI 估算 · 25k-40k