
字节跳动
AI DB研发工程师/架构师-基础设施
AI DB研发工程师/架构师-基础设施
发布于 大约 21 小时前普通员工/个人贡献者
广州市
高级经验
全职员工
仅现场办公
学历未注明
软件工程
分布式系统
GO
LLM
多模态
Rocksdb
Agent Runtime
向量索引
数据库内核
Agent Memory
AI 估算 · 35k–65k
字节跳动高级技术岗,广州薪资略低于北京上海,但AI数据库方向稀缺,月薪35k-65k,中位数50k,15薪符合大厂标准。
职位详情
关于这个职位
作为字节跳动AI DB研发工程师/架构师,你将负责设计并研发面向飞书Base、AI原生产品的Agentic数据库,打造下一代数据存储与计算引擎,涵盖查询优化、分布式执行、多模态存储等核心模块,深度参与AI时代数据基础设施的构建
最低要求
至少深入掌握C/C++/Go其中一门编程语言,熟悉多线程与异步编程模型,具备良好的性能优化意识与高质量工程交付能力
有Agent Memory相关经验:熟悉记忆存储与检索策略、记忆压缩与遗忘机制、记忆分层架构设计等
有Agent Runtime相关经验:熟悉工具调用编排、Context/Session生命周期管理、多Agent协同框架、Agent可观测性体系建设等
有多模态数据处理经验:熟悉图像/视频/文本等多模态数据统一存储格式、向量索引构建、Embedding技术、混合搜索(Hybrid Search)等
熟悉数据库内核实现原理,有自研数据库引擎、RocksDB/LevelDB、MySQL、MongoDB、Cassandra、HBase、InfluxDB等分布式或单机存储引擎研发经验
熟悉分布式一致性协议、分布式事务、分布式数据处理架构,深入理解计算机体系结构,具备高并发程序设计与存储I/O性能优化能力
工作职责
负责字节跳动面向飞书Base、AI原生产品等垂直业务领域的Agentic数据库产品设计与研发,打造面向智能体的下一代数据存储与计算引擎
负责数据库模块(查询优化器、分布式执行引擎、存储引擎、语义算子Semantic Operators等)的架构设计、功能迭代与产品化落地,打造极致性能与高可用性的数据库内核
负责Agentic Data Infra方向技术研发,包括多模态数据统一存储与检索引擎、智能体记忆(Agentic Memory)、上下文(Context)、运行时(Runtime)架构设计与落地,构建面向AI时代的全栈数据基础设施
优先资格
有Agent/LLM应用线上落地经验,深入理解智能体与底层数据系统的交互模式与真实痛点
在开源Agent框架(LangGraph、LlamaIndex、Letta/MemGPT、AutoGen等)或向量数据库(Milvus、Qdrant、Weaviate、LanceDB等)有Contributor/Committer经历
ACM等算法竞赛获奖经历
AI 洞察
优缺点分析
优点
- 接触前沿的Agentic数据库和AI数据基础设施,技术壁垒高,积累稀缺经验
- 字节跳动平台大,资源丰富,产品落地场景多,能快速成长
- 薪资竞争力强,股票等福利优厚,职业发展空间广阔
- 团队技术氛围浓厚,可与业内顶尖专家共事
- 技术难度大,需要同时掌握数据库内核、分布式系统、AI等多领域知识
- 跨团队协作复杂,需要良好的沟通和推动能力
缺点 / 挑战
- 业务需求变化快,需要快速学习和迭代,工作强度较高
- 适合具备深厚数据库或分布式系统背景,渴望投身AI基础设施前沿方向,能承受高强度技术挑战的资深工程师/架构师
角色解读
- 技术专家路线:深耕数据库内核或AI数据基础设施,成为行业顶尖架构师
- 技术管理路线:带领团队负责更大规模的系统设计,晋升为技术Leader或总监
- 跨领域发展:结合AI和数据库,拓展至AI平台、数据中台等方向
- 设计并研发面向AI场景的数据库系统,包括查询优化、分布式执行、存储引擎等核心模块
- 负责Agentic Data Infra,如智能体记忆、上下文管理、多模态数据统一存储与检索
- 优化数据库性能与高可用性,解决分布式一致性、事务处理等难题
- 与飞书Base、AI产品团队协作,将技术落地到实际业务场景
- 精通C/C++或Go,具备高性能编程和系统级优化能力
- 深入理解数据库内核原理,有自研引擎或主流存储引擎研发经验
- 熟悉Agent Memory、Runtime、多模态数据处理等AI基础设施技术
- 掌握分布式一致协议、事务处理、高并发架构设计
申请策略
- 提前了解飞书Base和字节AI产品的技术架构,在面试中展现对业务的理解
- 准备一个有深度的技术方案,如设计一个简化版的Agentic Memory存储系统
- 突出数据库内核或分布式存储引擎的实战经验,详细描述架构设计和性能优化案例
- 如果有Agent/LLM相关项目,强调在记忆、上下文、多模态方面的技术贡献
- 标明开源贡献或竞赛获奖,尤其是Agent框架或向量数据库相关
- 用数据量化成果,如吞吐量、延迟、可用性提升等
- 补齐Agent Memory和Runtime的知识,阅读LangGraph、LlamaIndex等源码
- 深入理解多模态数据处理和向量检索技术,熟悉Milvus等工具
面试指南
- 系统性结构:先明确需求和技术约束,再分层阐述架构(存储层、计算层、接口层),最后评估优缺点
- 案例驱动:结合过往项目,讲清楚问题背景、方案选型、落地效果和反思
- 对比分析:比较不同技术方案的适用场景,展现深度思考
- 请设计一个支持多模态数据统一存储和混合检索的数据库架构
- 如何实现智能体记忆的压缩与分层?有哪些策略?
- 分布式数据库在强一致性下如何保证高可用?谈谈你熟悉的协议
- 你在数据库内核优化的实践中,遇到过哪些性能瓶颈?如何解决的?
- 对LangGraph等Agent框架的了解?如何与底层数据库交互?
匹配度报告
76
综合匹配度
大厂高薪、前沿AI数据库技术栈,技术成长空间极大,但工作强度可能较高。
适合人群
适合极度追求技术成长、渴望接触AI基础设施前沿、对工作强度有心理准备的资深工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值75
薪资福利匹配
85较高
字节跳动薪资待遇在行业内处于领先水平,高级岗位薪资空间大,且提供股票、年终奖等福利,但具体薪资面议,未明确数字,故补偿性动机满足程度较高。
薪资信号面议 (35K-65K/月)
成长发展匹配
95较高
职位涉及最前沿的Agentic数据库和AI基础设施技术,技术含量极高,团队和平台能提供大量学习成长机会,发展性动机得到极大满足。
技术前沿前沿/新兴技术
技术栈C/C++、Go、Agent Memory、Agent Runtime、多模态、向量索引、数据库内核、分布式系统、LLM
业务类型profit_center
工作生活匹配
50较低
大厂研发岗位通常工作强度较高,广州办公地点,未提及弹性或远程,生活化动机满足一般。
工作模式未明确
办公地点未明确
加班情况未提及(无法判断)
使命价值匹配
75中等
职位面向AI时代的数据基础设施,行业处于高速增长赛道,工作具有前沿创新意义,但社会影响力较中性。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
字节跳动 的其他在招职位
相似职位推荐
Watch Jobs