
字节跳动
豆包大模型Agent算法工程师-火山方舟
豆包大模型Agent算法工程师-火山方舟
发布于 大约 2 个月前普通员工/个人贡献者
深圳市
高级经验
全职员工
仅现场办公
学历未注明
研究与开发 (研发)
LLM
SFT
RL
LlamaIndex
LangGraph
MCP
Agentic Rl
Multi-Agent
A2A
AI 估算 · 40k–70k
大模型Agent方向热门,技能稀缺,字节薪资竞争力强,高级算法岗月薪40k-70k合理。
职位详情
关于这个职位
该职位负责豆包大模型Agent的设计与效果优化,包括训练Agent模型、优化架构、开发原型应用,并与基础模型团队合作反哺模型迭代
你将专注于Agent架构和强化学习,探索Agent能力上限,做出有影响力的创新工作
适合在大模型和Agent领域有深厚积累的技术专家
最低要求
熟悉Agentic RL的方法,了解Agentic RL Infra(例如CodeRL,Reward System),熟悉模型的Post-Training训练技术,能针对特定模型能力问题进行SFT、RL训练优化
精通Python的编程技能,并有构建生产应用程序的经验,具备在Linux开发环境下的开发能力,熟悉至少一种主流大模型应用框架(如LangGraph、LlamaIndex、OpenAI AgentsSDK、GoogleADK等)
对大模型和Agent有较深入的理解,熟悉常见的LLM实施模式、提示工程、评估框架、检索框架等,了解Agent Architectures/Structures(Multi-Agent、Context Engineering/Management、ReAct/PlanAct/CodeAct),了解Agent相关的交互协议(MCP、A2A、FunctionCall)
具备强大的技术沟通能力,能够创建可扩展的内容(文档、教程、示例代码),同时有较强的项目管理能力和多团队协同能力
工作职责
Agent的设计与效果优化,训练优化Agent的Driver模型,通过Agent架构优化(工具、上下文管理、编排等)和模型优化(Agentic RL等具体任务的Post-Training),产出效果领先的Agent
设计和开发领先AI应用和解决方案原型,验证产品概念和需求,构建应用评估并优化Agent效果,为火山方舟平台的AI应用提供领先的Agent解决方案
探索Agent Architectures/Structures的上限,在Agent应用研究中最大程度释放模型的能力,以Agent的形式突破现有方法和模型无法解决的问题,做出如AlphaEvolve、Multi-Agent Research System等有影响力的创新工作,识别模型能力缺陷,与Seed深度合作从应用探索反哺基础模型迭代
优先资格
熟悉大模型服务,有AI算法相关领域技术背景、AI产品工作经验的优先
AI 洞察
优缺点分析
优点
- 处于大模型和Agent技术最前沿,技能积累价值极高,市场竞争力强
- 字节跳动平台资源丰富,能接触大规模真实应用场景和顶级工程团队
- 薪资待遇优厚,股权和年终奖可观,职业发展空间大
- 技术难度高,需要同时掌握强化学习、大模型、系统工程等多个领域知识,学习曲线陡峭
- 工作强度大,互联网大厂节奏快,可能出现加班和紧急项目
- 竞争激烈,需持续跟进最新研究,保持技术领先
缺点 / 挑战
- 适合有扎实AI/RL基础、热爱技术挑战、渴望在Agent领域做出突破性贡献的算法工程师
角色解读
- 可向Agent技术专家或大模型架构师方向发展,专注于更复杂的Agent系统和基础模型优化
- 有机会成为AI应用团队的技术负责人,推动产品落地和创新
- 借助字节跳动的平台资源,可参与前沿研究,发表论文或开源项目,提升行业影响力
- 设计和优化Agent模型,通过Agentic RL等方法训练Driver模型,提升Agent效果
- 开发原型应用和解决方案,验证产品概念,评估并优化Agent在火山方舟平台上的表现
- 探索Agent架构上限,如Multi-Agent、Context Engineering等,突破现有方法局限,做出创新性工作
- 精通Python和主流大模型应用框架(如LangGraph、LlamaIndex),有生产级应用开发经验
- 深入理解Agentic RL、Post-Training技术(SFT、RL),熟悉Agent架构和交互协议
- 具备技术沟通和项目管理能力,能与团队高效协作
申请策略
- 在求职信中表达对Agent技术前景的理解和热情,引用团队或公司的相关成果
- 准备一份技术博客或Demo,展示你如何优化Agent效果或解决实际问题
- 突出Agent或RL相关项目经验,如对话系统、工具使用、多智能体协作等
- 强调Post-Training经验,包括SFT、RLHF、RL调优的具体案例
- 展示工程能力:Python代码质量、框架使用(LangGraph等)、系统设计
- 深入掌握至少一个Agent框架,例如LangGraph或AutoGen,动手搭建复杂Agent
- 复习强化学习基础,特别是策略梯度、PPO,以及Agentic RL实际案例
- 了解MCP、A2A等协议,关注Agent互操作性和标准化动态
面试指南
- 使用STAR原则(情境-任务-行动-结果)结构化回答项目经验,突出个人贡献和量化成果
- 对于设计类问题,先明确目标和约束,再提出方案,比较不同选择的优劣
- 展示对技术细节的理解,同时体现系统思考能力
- 请介绍你过去参与的一个Agent项目,你如何优化其效果?
- 解释Agentic RL与传统RL的区别,并设计一个奖励系统
- 如何评估Agent在不同任务上的表现?你会使用哪些指标?
- 请描述Multi-Agent系统的挑战,并给出解决方案
- 如果我们想让Agent学会调用工具,你会如何设计训练流程?
职位点评
64
综合评分
大厂前沿Agent算法岗,技术含金量高、薪资优厚,但工作强度大、WLB一般。
更适合这类人
最看重技术成长和前沿研究,能接受高强度工作的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利75
成长发展90
工作生活30
使命价值60
薪资福利
75中等
薪资有竞争力,但JD未提及具体福利,补偿性动机满足程度较高。
薪资信号未披露(AI估算:40K-70K/月)
成长发展
90较高
前沿Agent技术,大量学习成长机会,但未明确晋升路径,发展性动机满足度高。
技术前沿前沿/新兴技术
技术栈Agentic RL、Post-Training、LLM、Multi-Agent、MCP
业务类型profit_center
工作生活
30较低
仅现场办公,字节通常强度大,未提及WLB,生活化动机满足度低。
工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)
使命价值
60中等
行业高速增长,Agent创新性强,但未强调社会价值,意义感动机中等。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
字节跳动 的其他在招职位
相似职位推荐
Watch Jobs