
字节跳动
豆包大模型Agent算法工程师-火山方舟
豆包大模型Agent算法工程师-火山方舟
发布于 大约 2 个月前普通员工/个人贡献者
上海市
高级经验
全职员工
仅现场办公
本科
研究与开发 (研发)
LLM
SFT
RL
LlamaIndex
LangGraph
MCP
Agentic Rl
Post-Training
Multi-Agent
AI 估算 · 40k–60k
上海头部互联网大厂高级算法岗,Agent方向人才稀缺,薪资竞争力强。
职位详情
关于这个职位
作为豆包大模型Agent算法工程师,你将专注于Agent架构设计与效果优化,通过RL和Post-Training提升模型能力,并开发前沿AI应用解决方案,推动火山方舟平台的Agent技术落地
最低要求
熟悉Agentic RL的方法,了解Agentic RL Infra(例如CodeRL,Reward System),熟悉模型的Post-Training训练技术,能针对特定模型能力问题进行SFT、RL训练优化
精通Python的编程技能,并有构建生产应用程序的经验,具备在Linux开发环境下的开发能力,熟悉至少一种主流大模型应用框架(如LangGraph、LlamaIndex、OpenAI、AgentsSDK、GoogleADK等)
对大模型和Agent有较深入的理解,熟悉常见的LLM实施模式、提示工程、评估框架、检索框架等,了解Agent Architectures/Structures(Multi-Agent、Context Engineering/Management、ReAct/PlanAct/CodeAct),了解Agent相关的交互协议(MCP、A2A、FunctionCall)
具备强大的技术沟通能力,能够创建可扩展的内容(文档、教程、示例代码),同时有较强的项目管理能力和多团队协同能力
熟悉大模型服务,有AI算法相关领域技术背景、AI产品工作经验的优先
工作职责
Agent的设计与效果优化,训练优化Agent的Driver模型,通过Agent架构优化(工具、上下文管理、编排等)和模型优化(Agentic RL等具体任务的Post-Training),产出效果领先的Agent
设计和开发领先AI应用和解决方案原型,验证产品概念和需求,构建应用评估并优化Agent效果,为火山方舟平台的AI应用提供领先的Agent解决方案
探索Agent Architectures/Structures的上限,在Agent应用研究中最大程度释放模型的能力,以Agent的形式突破现有方法和模型无法解决的问题,做出如AlphaEvolve、Multi-Agent Research System等有影响力的创新工作,识别模型能力缺陷,与Seed深度合作从应用探索反哺基础模型迭代
AI 洞察
优缺点分析
优点
- 字节跳动大平台,火山方舟业务前景广阔,Agent技术是AI前沿方向,技能积累价值高
- 与Seed团队深度合作,有机会接触大模型核心研发,参与创新研究
- 薪资优厚,福利完善,职业发展路径清晰
- 技术难度高,需要同时掌握算法和工程能力,学习曲线陡峭
- 适合有较强算法和工程背景、对Agent技术充满热情、渴望在AI前沿领域深耕的求职者
缺点 / 挑战
- 工作强度可能较大,互联网公司节奏快,需要应对多团队协作和项目压力
角色解读
- 可向Agent技术专家或AI应用架构师方向发展,成为团队技术核心
- 有机会参与前沿研究,推动Agent技术突破,晋升为高级研究员或技术负责人
- 积累多团队协同经验,可转向技术管理或AI产品负责人角色
- 负责Agent Driver模型的训练优化,通过Agent架构和模型Post-Training提升Agent效果
- 设计并开发领先的AI应用原型,验证产品概念,构建评估体系并优化Agent方案
- 探索Agent架构上限,进行创新研究如AlphaEvolve,反哺基础模型迭代
- 精通Agentic RL方法和Infra,如CodeRL、Reward System
- 熟练掌握Python,有生产应用开发经验,熟悉LangGraph等大模型框架
- 深入理解大模型和Agent,掌握提示工程、评估框架、交互协议等
申请策略
- 提前了解火山方舟产品和Agent方向动态,在面试中展示对业务的理解
- 准备1-2个Agent创新想法或案例,体现研究潜力
- 突出Agent相关项目经验,如RL训练、Post-Training、多Agent系统等
- 强调Python编程和框架使用经历,展示生产级应用成果
- 列出发表的相关论文或开源项目,体现创新能力
- 深入复习Agentic RL和Post-Training技术,动手实践CodeRL等Infra
- 熟悉LangGraph、LlamaIndex等框架,动手搭建Agent应用原型
面试指南
- 用STAR方法:Situation-Task-Action-Result,结合具体项目说明技术方案和成果
- 先阐述原理,再给出设计思路,最后说明权衡和优化点
- 强调协作和沟通能力,展示跨团队合作经验
- 请解释Agentic RL的原理,并举例如何优化Agent的Driver模型
- 你如何设计一个Multi-Agent系统来解决复杂任务?
- 描述一次你使用Post-Training技术提升模型能力的经历
- 你对MCP和A2A协议的理解是什么?
- 如果你发现模型存在能力缺陷,你会如何与Seed团队协作改进?
职位点评
75
综合评分
大厂高薪、前沿Agent技术、强成长性,但WLB一般。
更适合这类人
适合追求前沿技术成长、高薪资回报、能接受高强度工作的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展90
工作生活50
使命价值75
薪资福利
85较高
字节跳动作为已上市巨头,薪资福利在行业内具有较强竞争力,该岗位薪资水平偏高,且公司福利完善。
薪资信号未披露(AI估算:40K-60K/月)
成长发展
90较高
该岗位处于AI前沿技术领域,涉及Agent、多模态、RL等新兴技术,且与Seed团队合作,技能成长和晋升空间大。
技术前沿前沿/新兴技术
技术栈Agentic RL、Post-Training、LLM、Multi-Agent、Python、LangGraph
业务类型profit_center
工作生活
50较低
互联网大厂工作节奏较快,职位描述未提及弹性工作或远程办公,工作地点在上海,现场办公为主。
工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)
使命价值
75中等
Agent技术是AI领域的核心方向,对行业有推动意义,但社会影响力一般,属于技术商业化应用。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
字节跳动 的其他在招职位
相似职位推荐
Business R&D Experienced Professional
日立能源 · 合肥市AI 估算 · 15k-30kManager, Product Development Job Details | BASF SE
巴斯夫 · 上海市AI 估算 · 25k-40kEngineer R&D - Compounding Job Details | BASF SE
巴斯夫 · 上海市AI 估算 · 18k-28kAssistant Chemist, Alkoxylation Job Details | BASF SE
巴斯夫 · 上海市AI 估算 · 10k-15k发动机研发实习生
小米 · 北京市AI 估算 · 4k-6k
Watch Jobs