Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

PINGAN logo
中国平安
算法工程师(大模型推理加速)
立即应聘

算法工程师(大模型推理加速)

发布于 3 天前

普通员工/个人贡献者

深圳市
中级经验
全职员工
仅现场办公
学历未注明
CUDA
量化
vLLM
分布式推理
TensorRT-LLM
大模型推理加速

AI 估算 · 30k–55k

大模型推理加速为前沿方向,深圳大厂中高级算法工程师薪资较高,市场竞争力强。

职位详情

关于这个职位

该职位专注于大语言模型和多模态模型的推理服务部署与性能优化,涉及vLLM、TensorRT-LLM等主流推理框架

你将参与前沿的推理加速技术如量化、长上下文优化的落地,适合对高性能计算和模型优化有热情的工程师
公司是金融科技龙头,提供大平台和丰富算力资源

最低要求

熟练掌握 C/C++、Python、Rust 中的一种或多种,工程素养扎实

熟练使用 AI Coding 工具
熟悉 Transformer 架构及主流大模型结构(Qwen、DeepSeek 等),理解前向推理计算流程
熟悉至少一种主流推理框架(vLLM、SGLang、TensorRT-LLM 等),有使用或二次开发经验
熟悉常见推理优化技术,如 PagedAttention、Prefix Cache、Speculative Decoding、量化等
熟悉 Docker/Kubernetes,有模型服务容器化部署经验
了解分布式推理(TP/PP/EP)及 NCCL 等通信库
认真负责,主动性强,有担当,愿意处理排障、调试、验证等基础但关键的工作

工作职责

负责大语言模型及多模态模型的推理服务部署、性能优化和稳定性保障

基于 vLLM、SGLang、TensorRT-LLM 等框架,建设和优化推理服务能力
跟踪推理加速前沿技术,推动量化、长上下文优化、PD 分离等能力落地

优先资格

有 CUDA/Triton Kernel 开发或 GPU 架构级性能调优经验

有 vLLM、SGLang、TensorRT-LLM 二次开发或开源贡献经验
有 PD 分离、Expert Parallel、KV Cache 优化等实战经验
有 GPU 集群调度经验

AI 洞察

优缺点分析

优点

  • 前沿技术领域:大模型推理加速是当前AI热点,技术积累含金量高
  • 大平台资源:中国平安作为金融科技巨头,提供充足的GPU算力和业务场景
  • 技能全面:涉及系统编程、分布式、AI框架,能力提升空间大
  • 技术难度高:需要同时掌握系统编程、分布式和AI模型知识,学习曲线陡峭
  • 工作强度可能较大:涉及线上服务稳定性保障和紧急排障,需要一定抗压能力
  • 岗位细分:专注推理优化,可能与其他AI方向(如训练、数据)接触较少
  • 适合对高性能计算有浓厚兴趣、喜欢钻研底层优化技术、具备较强工程能力的算法工程师

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术深度方向:成为推理加速专家,主导GPU Kernel开发和架构级优化
  • 架构方向:成长为分布式系统架构师,设计大规模推理集群
  • 管理方向:带团队负责推理平台整体建设,晋升为技术经理或架构师
  • 负责将训练好的大模型部署到生产环境,确保推理服务的高性能和稳定性
  • 基于vLLM、TensorRT-LLM等框架进行二次开发和定制优化
  • 跟踪并落地量化、长上下文、PD分离等前沿推理加速技术
  • 处理线上排障、调试和验证等基础但关键的工作
  • 扎实的编程能力:至少精通C/C++、Python或Rust之一,熟练使用AI编码工具
  • 深入理解Transformer架构和主流大模型(如Qwen、DeepSeek),熟悉前向推理流程
  • 掌握至少一种推理框架(vLLM、SGLang、TensorRT-LLM),有使用或二次开发经验
  • 熟悉推理优化技术(PagedAttention、量化、Speculative Decoding等)和容器化部署(Docker/Kubernetes)

申请策略

  • 面试前准备一个完整的推理服务优化项目复盘,包括问题分析、方案设计、效果量化
  • 关注平安的金融AI应用场景,思考推理加速如何赋能业务(如智能客服、风控)
  • 突出使用推理框架(vLLM、TensorRT-LLM等)的项目经验,强调性能优化成果(如延迟降低、吞吐提升)
  • 展示GPU编程能力:CUDA kernel开发、算子优化经历是重要加分项
  • 强调容器化和分布式部署经验:Kubernetes、NCCL、分布式推理(TP/PP/EP)
  • 系统学习vLLM或TensorRT-LLM的源码结构,尝试进行二次开发或贡献补丁
  • 补充CUDA和GPU架构知识,熟悉NVIDIA Nsight等性能分析工具
  • 了解最新的推理加速技术:FlashAttention、Continuous Batching、PD分离等

面试指南

  • 技术原理题:先说明基础概念,再结合实际案例阐述优化思路和效果
  • 项目经验题:用STAR法则(情境-任务-行动-结果)组织回答,突出量化指标
  • 系统设计题:从分层架构、资源调度、容错等角度全面考虑,体现工程思维
  • 请解释PagedAttention的原理及为什么能提升推理效率
  • 描述一次使用vLLM优化推理性能的经历,遇到什么困难如何解决?
  • Transformer模型的前向推理计算流程是怎样的?如何优化attention计算?
  • 在Kubernetes上部署大模型推理服务需要考虑哪些方面?
  • 对模型量化(如INT8、FP8)的理解,量化后如何保证精度?

匹配度报告

70
综合匹配度

大厂大模型推理加速岗,前沿技术栈,薪资优厚,但工作强度大、WLB不确定。

适合人群
该职位最适合重视技能成长、追求技术前沿的求职者。如果对工作生活平衡要求较高,可能需要谨慎考虑。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利82
成长发展95
工作生活45
使命价值60

薪资福利匹配

82较高

薪酬水平在深圳大厂中具有竞争力,且公司为上市巨头,稳定性高。但JD未明确列出福利,可能包括标准五险一金和年终奖。

薪资信号未披露(AI估算:30K-55K/月)

成长发展匹配

95较高

该职位聚焦大模型推理加速前沿技术,涉及框架二次开发、GPU优化等高价值技能,成长空间极大。明确要求跟踪前沿技术,技术栈现代。

技术前沿前沿/新兴技术
技术栈vLLM、TensorRT-LLM、CUDA、Kubernetes、量化、PagedAttention
业务类型profit_center

工作生活匹配

45较低

深圳现场办公,但JD未提及弹性工作或WLB。互联网大厂推理优化岗位通常面临较高工作强度和紧急排障要求。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

60中等

金融科技行业稳定,但大模型推理优化直接推动业务智能化落地,有一定社会价值。行业处于高速增长期。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

中国平安 的其他在招职位

  • 客户经理-分销(石家庄)

    中国平安 · 石家庄市
    AI 估算 · 7k-12k
  • 综合金融拓展部销售推动岗

    中国平安 · 深圳市
    AI 估算 · 8k-15k
  • 客户经理-分销北区(北京)

    中国平安 · 北京市
    AI 估算 · 10k-20k
  • 流动性管理岗

    中国平安 · 上海市
    AI 估算 · 20k-35k
  • AI产品经理

    中国平安 · 深圳市
    AI 估算 · 25k-40k

相似职位推荐

  • 信安-后端高级开发工程师(J29230)

    58同城 · 北京市
    AI 估算 · 25k-40k
  • 高级引擎开发工程师(开放世界/SOC) 急招

    莉莉丝 · 上海市
    AI 估算 · 25k-45k
  • 测试工程师

    中国融通集团 · 上海市
    AI 估算 · 8k-15k
  • BaaS 平台研发实习生-存储&数据库部

    小红书 · 上海市
    AI 估算 · 4k-8k
  • Keeta 技术 - AI 全栈开发专家

    美团 · 北京市
    AI 估算 · 30k-50k

中国平安 的其他在招职位

  • 客户经理-分销(石家庄)

    中国平安 · 石家庄市
    AI 估算 · 7k-12k
  • 综合金融拓展部销售推动岗

    中国平安 · 深圳市
    AI 估算 · 8k-15k
  • 客户经理-分销北区(北京)

    中国平安 · 北京市
    AI 估算 · 10k-20k
  • 流动性管理岗

    中国平安 · 上海市
    AI 估算 · 20k-35k
  • AI产品经理

    中国平安 · 深圳市
    AI 估算 · 25k-40k

相似职位推荐

  • 信安-后端高级开发工程师(J29230)

    58同城 · 北京市
    AI 估算 · 25k-40k
  • 高级引擎开发工程师(开放世界/SOC) 急招

    莉莉丝 · 上海市
    AI 估算 · 25k-45k
  • 测试工程师

    中国融通集团 · 上海市
    AI 估算 · 8k-15k
  • BaaS 平台研发实习生-存储&数据库部

    小红书 · 上海市
    AI 估算 · 4k-8k
  • Keeta 技术 - AI 全栈开发专家

    美团 · 北京市
    AI 估算 · 30k-50k