
字节跳动
AI Agent记忆系统工程师/架构师-基础设施
AI Agent记忆系统工程师/架构师-基础设施
发布于 1 天前普通员工/个人贡献者
成都市
高级经验
全职员工
仅现场办公
本科
分布式系统
RAG
GO
多模态
向量索引
Agent Memory
AI 估算 · 30k–50k
前沿AI方向,技术难度高,竞争激烈,成都薪资略低于一线城市,但大厂加持薪资有竞争力。
职位详情
关于这个职位
该职位负责构建下一代AI Agent记忆系统基础设施,包括记忆存储、检索、压缩等核心模块,面向大模型应用场景,支撑海量数据下的低延迟、高可用服务
你将与模型、应用团队协作,推动记忆能力在真实业务中落地,并持续优化系统效果与成本
适合对分布式系统、AI基础设施有深入理解的技术专家
最低要求
计算机、人工智能、数据科学等相关专业,本科及以上学历
具备扎实的分布式系统、数据库、检索系统或人工智能基础设施相关经验,有较强的系统设计与工程落地能力
熟悉Go/Java/Python/C++语言中的一种,具备良好的代码质量意识与工程规范
理解大模型应用中的核心技术问题,包括但不限于Embedding、RAG、Context Engineering、检索增强、长期状态管理等
熟悉记忆(Memory)相关关键技术中的一个或多个方向:记忆抽取与表征、向量/图索引、召回与排序、记忆更新、压缩与遗忘、多模态记忆融合
能够从系统与算法结合的视角分析和优化效果、延迟、成本与可扩展性,有真实复杂系统经验者优先
工作职责
负责新一代AI Agent Memory基础设施的架构设计、核心模块研发与系统演进,建设支持长期记忆、会话记忆、任务记忆等能力的统一记忆平台
面向海量数据、低延迟和高可用场景,设计并优化记忆系统的写入、存储、索引、检索、更新、压缩与遗忘机制,支撑在线推理与个性化交互
围绕大模型、Context Engineering与数据管理的交叉问题,探索记忆表征、召回排序、冲突消解、摘要融合、记忆生命周期管理等关键技术
设计支持文本、图像、音频、行为等多模态信息的统一记忆模型与处理流程,提升Agent在复杂场景下的长期一致性、个性化与任务完成效果
与模型、应用、平台等团队协作,推动Memory能力在真实业务中的落地,并从效果、成本、延迟、稳定性和安全性等维度持续优化系统,跟踪技术前沿方向,参与制定AI Agent Memory服务的中长期技术规划,推动关键能力演进与技术创新
优先资格
有Agent Memory、用户画像、搜广推特征平台、知识库等相关研究或工程经验
参与过Mem0/MemOS/MemU等相关开源项目,对社区主流Memory方案有深入理解
在数据库、信息检索、机器学习或人工智能系统相关领域有高质量论文、开源影响力或代表性技术成果
有多模态信息处理、在线推理系统、个性化Agent或长期用户状态建模经验
AI 洞察
优缺点分析
优点
- 技术前沿:Agent记忆是AI核心基础设施,处于快速发展期,学习曲线陡峭但回报高
- 大厂平台:字节跳动拥有丰富业务场景和海量数据,技术落地机会多
- 技术难度高:需要同时掌握系统与算法,跨领域知识要求全面
- 工作强度大:字节跳动节奏较快,项目周期紧张,可能需要应对高强度开发与迭代
- 适合有分布式系统或AI基础设施背景,对记忆系统和大模型交叉领域有浓厚兴趣,能承受较快节奏、追求技术深度的资深工程师
缺点 / 挑战
- 薪资丰厚:高级岗位薪资待遇优厚,且字节跳动的期权/股票有较高价值
- 竞争压力:团队内人才密集,技术成长和晋升需持续输出成果
角色解读
- 在AI基础设施领域深耕,成为记忆系统方向的专家或技术Leader
- 横向发展至大模型平台、搜索推荐等关联系统架构岗位
- 积累多模态与Agent经验,转型AI系统架构师或技术总监
- 设计并开发AI Agent的记忆存储、索引、检索、压缩等核心系统模块,构建统一记忆平台
- 优化海量数据下的低延迟与高可用性能,支撑在线推理与个性化交互场景
- 探索记忆表征、多模态融合等前沿技术,提升Agent的长期一致性与任务完成效果
- 扎实的分布式系统与数据库经验,精通Go/Java/Python/C++中至少一种语言
- 深入理解大模型应用技术栈,如Embedding、RAG、Context Engineering
- 熟悉记忆相关算法:向量索引、召回排序、记忆压缩与遗忘机制
申请策略
- 在简历中具体描述你如何平衡效果、延迟、成本与可扩展性,体现系统思维
- 面试前了解字节跳动AI Agent产品线(如豆包),思考记忆系统如何支撑业务
- 突出分布式系统设计经验,特别是高并发、低延迟、高可用系统项目
- 强调大模型相关技术实践,如RAG、Embedding、Context Engineering
- 展示记忆或类似系统(用户画像、推荐特征平台)的工程成果
- 如有开源项目或论文,务必列出,尤其是Mem0、MemOS等Memory项目
- 提前学习向量数据库(如Milvus、FAISS)和图索引技术
- 熟悉主流Memory方案(Mem0、MemOS等)的架构与优劣
面试指南
- 对于系统设计题,先明确需求(数据量、延迟、一致性),再分层架构,分别讨论存储、索引、检索、更新策略,最后评估权衡
- 对于算法题,从问题定义出发,对比现有技术(如向量检索、图索引),结合业务场景给出优化点,并提及代价与收益
- 设计一个支持长期记忆的Agent记忆系统,你会如何考虑存储、索引和压缩?
- 如何在海量用户记忆数据中实现低延迟检索?请从算法与系统角度阐述
- 记忆更新和遗忘机制如何设计才能平衡模型性能与个性化?
- 你如何理解Context Engineering?在实际系统中如何应用?
- 谈谈你对多模态记忆融合的难点和解决方案
- 复习分布式系统核心概念(CAP、一致性协议、分片、复制)
匹配度报告
76
综合匹配度
前沿AI基础设施岗,技术成长空间大、薪资高,但工作强度较大且WLB一般。
适合人群
最注重技术成长和发展机会的求职者,若对WLB要求较高则需谨慎考虑。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展92
工作生活50
使命价值75
薪资福利匹配
85较高
字节跳动提供有竞争力的薪资和福利,成都作为新一线城市生活成本相对较低,但未明确提及福利细节。整体薪资水平偏高。
薪资信号偏高 (30K-50K/月)
成长发展匹配
92较高
该职位处于AI前沿,技术栈现代,涉及大模型、记忆系统等新兴领域,有大量发展机会。但JD未明确提及晋升通道。
技术前沿前沿/新兴技术
技术栈分布式系统、Go、Java、Python、C++、Embedding、RAG、Context Engineering、向量索引、Agent Memory、多模态
业务类型ambiguous
工作生活匹配
50较低
仅现场办公,未提及弹性工时或远程,字节跳动工作节奏较快,WLB一般。
工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)
使命价值匹配
75中等
AI Agent基础设施是高速增长赛道,对社会智能化有推动作用,但JD未明确使命感表述。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
字节跳动 的其他在招职位
相似职位推荐
Watch Jobs