PINGAN logo
中国平安
推理优化工程师

推理优化工程师

发布于 大约 16 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
硕士
PyTorch
推理优化
金融科技
大模型
SGLang
vLLM
TensorRT-LLM

AI 估算 · 35k–60k

大厂+前沿技术栈+高学历要求,薪资处于市场较高水平,结合上海地域溢价,竞争力强。

职位详情

关于这个职位

该职位专注于将AI大模型高效落地到实际业务中,负责模型推理性能优化、部署架构设计和稳定性保障

你将接触到最前沿的推理优化技术(如vLLM、TensorRT-LLM),并参与大规模分布式系统的搭建与调优,适合热爱底层优化和工程挑战的技术人才

最低要求

硕士及以上学历,3年以上AI系统架构设计与开发经验,独立主导过百万级用户量AI产品架构设计

精通机器学习、深度学习等基础原理以及工程化理论,有2年以上大模型相关工程实践经历
熟悉推理优化技术,对于PD分离、KV-Cache、张量并行有一定了解,熟悉vLLM、SGLang、TensorRT-LLM等推理框架,有推理优化项目经验者优先
精通模型部署及监控,熟练使用docker/kubernetes等容器化和集群管理技术,以及restful api设计
精通python/Java/C++至少一种编程语言
熟悉AI平台集成TensorFlow、PyTorch、PaddlePaddle、MindSpore等框架能力,有AI平台研发经验者优先
熟悉云原生、容器在AI平台中运用的能力
具备金融科技领域经验,熟悉金融科技业务场景
在顶会(NeurIPS/ICML 等)发表过 LLM 相关论文或有专利成果者优先

工作职责

将研发模型转化为工程化代码,进行模型封装

搭建或优化算法工程化基础设施,如模型部署平台、推理服务框架、性能测试工具等
负责模型部署方案设计与实施,适配不同场景,解决兼容性问题
对已上线的算法模型进行性能优化,包括提升准确率,降低计算成本,提高鲁棒性等

AI 洞察

优缺点分析

  • 技术前沿:直接参与大模型推理优化,掌握最新技术如vLLM、PD分离等,技能积累价值高
  • 平台优势:中国平安是上市巨头,资源丰富,项目规模大,能接触百万级用户量产品
  • 行业前景:AI工程化是当前热点,金融科技领域需求旺盛,职业发展空间广阔
  • 技术门槛高:需要扎实的算法功底和系统工程能力,同时熟悉多种框架和工具栈
  • 工作强度可能较大:涉及线上性能优化和稳定性保障,可能需要应对突发问题
  • 竞争激烈:大厂对推理优化人才需求大,面试考察深度和广度均较高
  • 适合热爱底层系统优化、追求技术深度、具有扎实编程和算法基础,并希望在AI工程化领域深耕的工程师

角色解读

  • 技术深度发展:成为推理优化专家、AI系统架构师,主导核心基础设施研发
  • 跨领域拓展:向AI平台研发、云原生AI方向延伸,或转向金融科技业务场景
  • 管理路线:积累工程落地经验后,可晋升为技术团队负责人,带领算法工程化团队
  • 将AI大模型研发成果转化为高效、稳定的工程化代码,完成模型封装和部署
  • 搭建和优化模型推理服务框架、部署平台及性能测试工具,提升系统可靠性
  • 设计适配不同业务场景的模型部署方案,解决兼容性和性能瓶颈问题
  • 持续对线上模型进行性能调优,降低计算成本,提升准确率和鲁棒性
  • 精通Python/C++,熟悉深度学习框架(PyTorch等)和推理优化技术(KV-Cache、张量并行等)
  • 熟练使用Docker、Kubernetes等容器化与集群管理技术,具备云原生部署经验
  • 熟悉vLLM、TensorRT-LLM等主流推理框架,有大模型工程化实践经历
  • 具备系统架构设计能力,能独立主导百万级用户量AI产品的架构设计

申请策略

  • 了解平安的金融科技业务场景(如保险、银行AI应用),在面试中展现业务理解
  • 准备好一个完整的端到端模型部署与优化案例,从技术选型到性能对比,体现工程思维
  • 突出大模型推理优化项目经历,详细描述使用的框架(如vLLM、TensorRT-LLM)和优化效果(延迟、吞吐量提升)
  • 强调系统架构设计经验,例如独立设计并落地了百万级用户量的AI服务架构
  • 展示容器化、Kubernetes部署经验,以及云原生相关技能(如K8s、Docker)
  • 若有金融科技背景或相关项目,务必突出,这是重要加分项
  • 深入学习推理优化技术:阅读vLLM、SGLang等框架源码,掌握PD分离、KV-Cache等原理
  • 补强云原生技能:学习Kubernetes调度、集群管理,了解AI平台云原生实践

面试指南

  • STAR法则:描述项目背景(Situation)、任务(Task)、你的具体行动(Action)和量化结果(Result)
  • 分层次回答:先从整体架构设计入手,再深入到具体优化技术,最后用数据佐证效果
  • 请描述你在大模型推理优化方面的项目经验,具体采用了哪些技术手段?
  • 如何设计一个高并发、低延迟的推理服务架构?请谈谈你的思路
  • 说说你对vLLM或TensorRT-LLM的理解,它们分别解决了什么问题?
  • 在Kubernetes上部署AI模型时,你遇到过哪些挑战?如何解决?
  • 如果模型推理速度不满足业务要求,你会从哪些方面进行优化?
  • 复习深度学习推理优化知识:掌握KV-Cache、张量并行、模型量化、蒸馏等概念

匹配度报告

74
综合匹配度

大厂前沿技术岗,高发展潜力,薪资优厚,但WLB一般。

适合人群
该职位最适合追求技术成长和职业发展的求职者,尤其是希望在AI推理优化领域成为专家的工程师,但需接受可能的工作强度和不完全弹性的工作方式。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利匹配

85较高

中国平安是上市巨头,薪资预计处于市场高水平,福利完善,稳定性强,但JD未明确薪资和福利,故略有保守。

薪资信号未披露 (35K-60K/月)

成长发展匹配

90较高

该职位涉及前沿大模型推理优化技术,能深入接触vLLM、TensorRT-LLM等主流框架,技能成长空间极大,且有顶会论文优先项,技术氛围浓厚。

技术前沿前沿/新兴技术
技术栈vLLM、SGLang、TensorRT-LLM、KV-Cache、张量并行、PyTorch、Kubernetes
业务类型profit_center

工作生活匹配

50较低

工作地点在上海,仅现场办公,未提及弹性工作或远程,大厂高薪但工作强度可能较大,WLB信号不明。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

金融科技领域AI应用具有社会价值(提升金融服务效率和安全性),行业高速增长,技术创新水平高,但JD未提使命导向内容。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs