
多点数智
AI工程师-Agent Infra & LLMOps 方向(北京)
AI工程师-Agent Infra & LLMOps 方向(北京)
发布于 大约 2 个月前普通员工/个人贡献者
北京市
无经验要求
全职员工
仅现场办公
本科
软件工程
GO
LLM
Serverless
gRPC
vLLM
AI 估算 · 20k–30k
AI基础设施方向技术门槛高,市场需求旺盛,应届生起薪较高,北京互联网公司薪资水平领先。
职位详情
关于这个职位
该职位专注于AI Agent基础设施与LLMOps方向,负责构建工具链服务化、代码执行沙箱、模型推理部署及工程化流水线
你将参与前沿的AI系统设计,使用Docker、Kubernetes、Go/Python等技术,为算法团队提供高效稳定的基础设施支持
适合对分布式系统、云原生和AI工程化有浓厚兴趣的应届生
最低要求
届本科及以上学历,计算机相关专业,系统结构、分布式系统、云计算方向优先
精通 Docker 原理,熟悉 Kubernetes (K8s) 的基本操作与编排
熟练掌握 Go (高性能服务) 或 Python (AI 生态对接),了解 gRPC/HTTP2 协议
扎实的 OS、网络基础,理解进程/线程、IO 多路复用
工作职责
Agent工具链服务化 (FaaS化): 设计并实现 Agent 的 Tool Server
将搜索、计算、API 调用等能力封装为独立的无服务器函数 (Serverless/FaaS),实现按需扩缩容
负责 OpenAPI / JSON Schema 的自动生成与管理,确保 Agent 能准确理解并调用这些工具函数
代码解释器与沙箱构建 (Code Sandbox): 基于 Docker 或 MicroVM (如 Firecracker, gVisor) 构建安全的 代码执行沙箱
解决 Agent 生成代码(Python/SQL)在运行时的依赖管理、资源隔离(CPU/Mem限制)和网络控制问题
模型推理服务部署 (Inference Serving): 配合算法同学,将微调后的 LLM 部署为高并发服务
优化推理引擎(如使用 vLLM, TGI, TensorRT-LLM),降低 Time-to-First-Token (TTFT) 延迟
工程化与流水线: 搭建 Agent Evaluation Pipeline,让算法同学(A/B)的评测脚本能自动化运行在集群中
负责向量数据库(Milvus/Qdrant)等中间件的容器化部署与维护
优先资格
熟悉 Serverless 架构 (Knative, OpenFaaS) 或云厂商的 Lambda/Function 实践
了解 LLM 推理框架 (vLLM, Ollama, Triton Inference Server)
有 Sandbox 开发经验,或者对容器逃逸、安全隔离有深入研究
操作过 LangChain/AutoGPT,清晰知道它们在实际部署时的痛点
AI 洞察
优缺点分析
优点
- 前沿技术栈:涉及LLM、Agent、Serverless、K8s等热门技术,技能积累价值高
- 行业前景好:AI基础设施是AI落地的关键环节,市场需求持续增长
- 公司平台:多点数智是零售数字化领域知名企业,业务场景丰富
- 技术难度高:需要同时掌握分布式系统、容器安全、推理优化等多领域知识
- 工作强度可能较大:AI基础设施对稳定性和性能要求高,可能面临紧急问题处理
- 竞争激烈:AI方向人才众多,需要持续学习保持竞争力
缺点 / 挑战
- 适合对系统架构、云原生和AI工程化有浓厚兴趣,喜欢挑战技术难题,愿意在AI基础设施领域深耕的应届生
角色解读
- 技术纵深发展:成为AI基础设施专家,深入系统架构、推理优化、安全隔离等方向
- 横向拓展:向MLOps、AI平台架构师发展,负责更大规模的AI系统设计与运维
- 管理路线:从技术骨干成长为技术Leader,带领团队构建下一代AI基础设施
- 设计并实现Agent工具链的FaaS化服务,将搜索、计算等能力封装为无服务器函数,实现按需扩缩容
- 基于Docker或MicroVM构建安全的代码执行沙箱,解决依赖管理和资源隔离问题
- 配合算法团队将微调后的LLM部署为高并发推理服务,优化推理引擎降低延迟
- 搭建自动化评估流水线,负责向量数据库等中间件的容器化部署与维护
- 精通Docker和Kubernetes,具备容器编排和云原生部署能力
- 熟练掌握Go或Python,了解gRPC/HTTP2协议,具备扎实的操作系统和网络基础
- 了解LLM推理框架(如vLLM、Triton)和Serverless架构(如Knative)者优先
- 对安全沙箱、容器逃逸有研究,或熟悉LangChain/AutoGPT实际部署痛点者加分
申请策略
- 关注多点数智在AI领域的业务布局,面试中展现对零售+AI结合的理解
- 准备一个完整的技术项目案例,从设计到部署,体现系统思维和解决问题的能力
- 突出Docker/K8s相关项目经验,如容器化部署、集群管理、编排实践
- 展示Go或Python的高性能服务开发经历,尤其是涉及gRPC、并发编程的项目
- 如果有LLM推理优化、Serverless或沙箱安全相关经验,务必重点描述
- 强调对系统底层原理的理解,如操作系统、网络协议、IO多路复用等
- 深入学习Kubernetes的调度、网络、存储原理,动手搭建集群并实践
- 了解主流LLM推理框架(vLLM、Triton)的架构和优化方法
面试指南
- 技术问题:先阐述基本原理,再结合实际项目经验,最后总结优化思路
- 设计问题:明确需求,拆解模块,考虑扩展性和安全性,给出权衡
- 行为问题:使用STAR法则(情境、任务、行动、结果)结构化回答
- 请解释Docker和Kubernetes的工作原理,以及如何设计一个高可用的微服务架构
- 如何优化LLM推理服务的延迟和吞吐量?请结合具体框架说明
- 设计一个安全的代码执行沙箱,需要考虑哪些关键点?
- Agent工具链中,如何确保工具函数的自动生成和准确调用?
- 请描述一次你解决复杂系统问题的经历,包括问题分析、方案设计和实施
匹配度报告
70
综合匹配度
前沿AI基础设施岗位,技术成长极佳,但工作强度可能较大,WLB一般。
适合人群
最适合追求技术成长和前沿领域探索的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展95
工作生活40
使命价值75
薪资福利匹配
70中等
薪资水平在应届生中具有竞争力,但JD未明确提及福利,稳定性一般。
薪资信号未披露(AI估算:20K-30K/月)
成长发展匹配
95较高
技术栈前沿,涉及LLM、Agent、云原生等热门领域,成长空间巨大。
技术前沿前沿/新兴技术
技术栈Go、Python、Docker、Kubernetes、LLM、vLLM、Serverless、gRPC、Milvus、Agent
业务类型ambiguous
工作生活匹配
40较低
仅现场办公,未提及弹性工作或WLB,可能面临较高工作强度。
工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)
使命价值匹配
75中等
AI基础设施是推动AI落地的关键,具有技术价值,但社会影响力一般。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
多点数智 的其他在招职位
相似职位推荐
Watch Jobs