中国平安的推理优化工程师薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

推理优化工程师的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

中国平安的推理优化工程师有什么任职要求？

该职位要求硕士学历及高级经验工作经验。

中国平安

推理优化工程师

立即应聘

推理优化工程师

发布于大约 2 个月前

普通员工/个人贡献者

上海市

高级经验

全职员工

仅现场办公

硕士

软件工程

PyTorch

推理优化

金融科技

大模型

SGLang

vLLM

TensorRT-LLM

AI 估算 · 35k–60k

大厂+前沿技术栈+高学历要求，薪资处于市场较高水平，结合上海地域溢价，竞争力强。

职位详情

关于这个职位

该职位专注于将AI大模型高效落地到实际业务中，负责模型推理性能优化、部署架构设计和稳定性保障

你将接触到最前沿的推理优化技术（如vLLM、TensorRT-LLM），并参与大规模分布式系统的搭建与调优，适合热爱底层优化和工程挑战的技术人才

最低要求

硕士及以上学历，3年以上AI系统架构设计与开发经验，独立主导过百万级用户量AI产品架构设计

精通机器学习、深度学习等基础原理以及工程化理论，有2年以上大模型相关工程实践经历

熟悉推理优化技术，对于PD分离、KV-Cache、张量并行有一定了解，熟悉vLLM、SGLang、TensorRT-LLM等推理框架，有推理优化项目经验者优先

精通模型部署及监控，熟练使用docker/kubernetes等容器化和集群管理技术，以及restful api设计

精通python/Java/C++至少一种编程语言

熟悉AI平台集成TensorFlow、PyTorch、PaddlePaddle、MindSpore等框架能力，有AI平台研发经验者优先

熟悉云原生、容器在AI平台中运用的能力

具备金融科技领域经验，熟悉金融科技业务场景

在顶会（NeurIPS/ICML 等）发表过 LLM 相关论文或有专利成果者优先

工作职责

将研发模型转化为工程化代码，进行模型封装

搭建或优化算法工程化基础设施，如模型部署平台、推理服务框架、性能测试工具等

负责模型部署方案设计与实施，适配不同场景，解决兼容性问题

对已上线的算法模型进行性能优化，包括提升准确率，降低计算成本，提高鲁棒性等

AI 洞察

优缺点分析

优点

技术前沿：直接参与大模型推理优化，掌握最新技术如vLLM、PD分离等，技能积累价值高
平台优势：中国平安是上市巨头，资源丰富，项目规模大，能接触百万级用户量产品
行业前景：AI工程化是当前热点，金融科技领域需求旺盛，职业发展空间广阔
技术门槛高：需要扎实的算法功底和系统工程能力，同时熟悉多种框架和工具栈
工作强度可能较大：涉及线上性能优化和稳定性保障，可能需要应对突发问题
适合热爱底层系统优化、追求技术深度、具有扎实编程和算法基础，并希望在AI工程化领域深耕的工程师

缺点 / 挑战

竞争激烈：大厂对推理优化人才需求大，面试考察深度和广度均较高

角色解读

技术深度发展：成为推理优化专家、AI系统架构师，主导核心基础设施研发
跨领域拓展：向AI平台研发、云原生AI方向延伸，或转向金融科技业务场景
管理路线：积累工程落地经验后，可晋升为技术团队负责人，带领算法工程化团队
将AI大模型研发成果转化为高效、稳定的工程化代码，完成模型封装和部署
搭建和优化模型推理服务框架、部署平台及性能测试工具，提升系统可靠性
设计适配不同业务场景的模型部署方案，解决兼容性和性能瓶颈问题
持续对线上模型进行性能调优，降低计算成本，提升准确率和鲁棒性
精通Python/C++，熟悉深度学习框架（PyTorch等）和推理优化技术（KV-Cache、张量并行等）
熟练使用Docker、Kubernetes等容器化与集群管理技术，具备云原生部署经验
熟悉vLLM、TensorRT-LLM等主流推理框架，有大模型工程化实践经历
具备系统架构设计能力，能独立主导百万级用户量AI产品的架构设计

申请策略

了解平安的金融科技业务场景（如保险、银行AI应用），在面试中展现业务理解
准备好一个完整的端到端模型部署与优化案例，从技术选型到性能对比，体现工程思维
突出大模型推理优化项目经历，详细描述使用的框架（如vLLM、TensorRT-LLM）和优化效果（延迟、吞吐量提升）
强调系统架构设计经验，例如独立设计并落地了百万级用户量的AI服务架构
展示容器化、Kubernetes部署经验，以及云原生相关技能（如K8s、Docker）
若有金融科技背景或相关项目，务必突出，这是重要加分项
深入学习推理优化技术：阅读vLLM、SGLang等框架源码，掌握PD分离、KV-Cache等原理
补强云原生技能：学习Kubernetes调度、集群管理，了解AI平台云原生实践

面试指南

STAR法则：描述项目背景（Situation）、任务（Task）、你的具体行动（Action）和量化结果（Result）
分层次回答：先从整体架构设计入手，再深入到具体优化技术，最后用数据佐证效果
请描述你在大模型推理优化方面的项目经验，具体采用了哪些技术手段？
如何设计一个高并发、低延迟的推理服务架构？请谈谈你的思路
说说你对vLLM或TensorRT-LLM的理解，它们分别解决了什么问题？
在Kubernetes上部署AI模型时，你遇到过哪些挑战？如何解决？
如果模型推理速度不满足业务要求，你会从哪些方面进行优化？
复习深度学习推理优化知识：掌握KV-Cache、张量并行、模型量化、蒸馏等概念

匹配度报告

综合匹配度

大厂前沿技术岗，高发展潜力，薪资优厚，但WLB一般。

适合人群

该职位最适合追求技术成长和职业发展的求职者，尤其是希望在AI推理优化领域成为专家的工程师，但需接受可能的工作强度和不完全弹性的工作方式。

最强匹配

成长发展匹配

最弱匹配

工作生活匹配

薪资福利85

成长发展90

工作生活50

使命价值70

薪资福利匹配

85较高

中国平安是上市巨头，薪资预计处于市场高水平，福利完善，稳定性强，但JD未明确薪资和福利，故略有保守。

薪资信号未披露（AI估算：35K-60K/月）

成长发展匹配

90较高

该职位涉及前沿大模型推理优化技术，能深入接触vLLM、TensorRT-LLM等主流框架，技能成长空间极大，且有顶会论文优先项，技术氛围浓厚。

技术前沿前沿/新兴技术

技术栈vLLM、SGLang、TensorRT-LLM、KV-Cache、张量并行、PyTorch、Kubernetes

业务类型profit_center

工作生活匹配

50较低

工作地点在上海，仅现场办公，未提及弹性工作或远程，大厂高薪但工作强度可能较大，WLB信号不明。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值匹配

70中等

金融科技领域AI应用具有社会价值（提升金融服务效率和安全性），行业高速增长，技术创新水平高，但JD未提使命导向内容。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

中国平安

推理优化工程师

立即应聘

推理优化工程师

发布于大约 2 个月前

普通员工/个人贡献者

上海市

高级经验

全职员工

仅现场办公

硕士

软件工程

PyTorch

推理优化

金融科技

大模型

SGLang

vLLM

TensorRT-LLM

AI 估算 · 35k–60k

大厂+前沿技术栈+高学历要求，薪资处于市场较高水平，结合上海地域溢价，竞争力强。