ByteDance logo
字节跳动
AI DB研发工程师/架构师-基础设施

AI DB研发工程师/架构师-基础设施

发布于 大约 21 小时前

普通员工/个人贡献者

广州市
高级经验
全职员工
仅现场办公
学历未注明
软件工程
分布式系统
GO
LLM
多模态
Rocksdb
Agent Runtime
向量索引
数据库内核
Agent Memory

AI 估算 · 35k–65k

字节跳动高级技术岗,广州薪资略低于北京上海,但AI数据库方向稀缺,月薪35k-65k,中位数50k,15薪符合大厂标准。

职位详情

关于这个职位

作为字节跳动AI DB研发工程师/架构师,你将负责设计并研发面向飞书Base、AI原生产品的Agentic数据库,打造下一代数据存储与计算引擎,涵盖查询优化、分布式执行、多模态存储等核心模块,深度参与AI时代数据基础设施的构建

最低要求

至少深入掌握C/C++/Go其中一门编程语言,熟悉多线程与异步编程模型,具备良好的性能优化意识与高质量工程交付能力

有Agent Memory相关经验:熟悉记忆存储与检索策略、记忆压缩与遗忘机制、记忆分层架构设计等
有Agent Runtime相关经验:熟悉工具调用编排、Context/Session生命周期管理、多Agent协同框架、Agent可观测性体系建设等
有多模态数据处理经验:熟悉图像/视频/文本等多模态数据统一存储格式、向量索引构建、Embedding技术、混合搜索(Hybrid Search)等
熟悉数据库内核实现原理,有自研数据库引擎、RocksDB/LevelDB、MySQL、MongoDB、Cassandra、HBase、InfluxDB等分布式或单机存储引擎研发经验
熟悉分布式一致性协议、分布式事务、分布式数据处理架构,深入理解计算机体系结构,具备高并发程序设计与存储I/O性能优化能力

工作职责

负责字节跳动面向飞书Base、AI原生产品等垂直业务领域的Agentic数据库产品设计与研发,打造面向智能体的下一代数据存储与计算引擎

负责数据库模块(查询优化器、分布式执行引擎、存储引擎、语义算子Semantic Operators等)的架构设计、功能迭代与产品化落地,打造极致性能与高可用性的数据库内核
负责Agentic Data Infra方向技术研发,包括多模态数据统一存储与检索引擎、智能体记忆(Agentic Memory)、上下文(Context)、运行时(Runtime)架构设计与落地,构建面向AI时代的全栈数据基础设施

优先资格

有Agent/LLM应用线上落地经验,深入理解智能体与底层数据系统的交互模式与真实痛点

在开源Agent框架(LangGraph、LlamaIndex、Letta/MemGPT、AutoGen等)或向量数据库(Milvus、Qdrant、Weaviate、LanceDB等)有Contributor/Committer经历
ACM等算法竞赛获奖经历

AI 洞察

优缺点分析

优点

  • 接触前沿的Agentic数据库和AI数据基础设施,技术壁垒高,积累稀缺经验
  • 字节跳动平台大,资源丰富,产品落地场景多,能快速成长
  • 薪资竞争力强,股票等福利优厚,职业发展空间广阔
  • 团队技术氛围浓厚,可与业内顶尖专家共事
  • 技术难度大,需要同时掌握数据库内核、分布式系统、AI等多领域知识
  • 跨团队协作复杂,需要良好的沟通和推动能力

缺点 / 挑战

  • 业务需求变化快,需要快速学习和迭代,工作强度较高
  • 适合具备深厚数据库或分布式系统背景,渴望投身AI基础设施前沿方向,能承受高强度技术挑战的资深工程师/架构师

角色解读

  • 技术专家路线:深耕数据库内核或AI数据基础设施,成为行业顶尖架构师
  • 技术管理路线:带领团队负责更大规模的系统设计,晋升为技术Leader或总监
  • 跨领域发展:结合AI和数据库,拓展至AI平台、数据中台等方向
  • 设计并研发面向AI场景的数据库系统,包括查询优化、分布式执行、存储引擎等核心模块
  • 负责Agentic Data Infra,如智能体记忆、上下文管理、多模态数据统一存储与检索
  • 优化数据库性能与高可用性,解决分布式一致性、事务处理等难题
  • 与飞书Base、AI产品团队协作,将技术落地到实际业务场景
  • 精通C/C++或Go,具备高性能编程和系统级优化能力
  • 深入理解数据库内核原理,有自研引擎或主流存储引擎研发经验
  • 熟悉Agent Memory、Runtime、多模态数据处理等AI基础设施技术
  • 掌握分布式一致协议、事务处理、高并发架构设计

申请策略

  • 提前了解飞书Base和字节AI产品的技术架构,在面试中展现对业务的理解
  • 准备一个有深度的技术方案,如设计一个简化版的Agentic Memory存储系统
  • 突出数据库内核或分布式存储引擎的实战经验,详细描述架构设计和性能优化案例
  • 如果有Agent/LLM相关项目,强调在记忆、上下文、多模态方面的技术贡献
  • 标明开源贡献或竞赛获奖,尤其是Agent框架或向量数据库相关
  • 用数据量化成果,如吞吐量、延迟、可用性提升等
  • 补齐Agent Memory和Runtime的知识,阅读LangGraph、LlamaIndex等源码
  • 深入理解多模态数据处理和向量检索技术,熟悉Milvus等工具

面试指南

  • 系统性结构:先明确需求和技术约束,再分层阐述架构(存储层、计算层、接口层),最后评估优缺点
  • 案例驱动:结合过往项目,讲清楚问题背景、方案选型、落地效果和反思
  • 对比分析:比较不同技术方案的适用场景,展现深度思考
  • 请设计一个支持多模态数据统一存储和混合检索的数据库架构
  • 如何实现智能体记忆的压缩与分层?有哪些策略?
  • 分布式数据库在强一致性下如何保证高可用?谈谈你熟悉的协议
  • 你在数据库内核优化的实践中,遇到过哪些性能瓶颈?如何解决的?
  • 对LangGraph等Agent框架的了解?如何与底层数据库交互?

匹配度报告

76
综合匹配度

大厂高薪、前沿AI数据库技术栈,技术成长空间极大,但工作强度可能较高。

适合人群
适合极度追求技术成长、渴望接触AI基础设施前沿、对工作强度有心理准备的资深工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值75

薪资福利匹配

85较高

字节跳动薪资待遇在行业内处于领先水平,高级岗位薪资空间大,且提供股票、年终奖等福利,但具体薪资面议,未明确数字,故补偿性动机满足程度较高。

薪资信号面议 (35K-65K/月)

成长发展匹配

95较高

职位涉及最前沿的Agentic数据库和AI基础设施技术,技术含量极高,团队和平台能提供大量学习成长机会,发展性动机得到极大满足。

技术前沿前沿/新兴技术
技术栈C/C++、Go、Agent Memory、Agent Runtime、多模态、向量索引、数据库内核、分布式系统、LLM
业务类型profit_center

工作生活匹配

50较低

大厂研发岗位通常工作强度较高,广州办公地点,未提及弹性或远程,生活化动机满足一般。

工作模式未明确
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

75中等

职位面向AI时代的数据基础设施,行业处于高速增长赛道,工作具有前沿创新意义,但社会影响力较中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs