Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

PINGAN logo
中国平安
云架构专家工程师(智算)
立即应聘

云架构专家工程师(智算)

发布于 大约 17 小时前

普通员工/个人贡献者

深圳市
专家级经验
全职员工
仅现场办公
本科
分布式计算
GPU
MLOps
RDMA
RoCE
云原生
推理引擎
大模型训练/推理
智算平台

AI 估算 · 50k–70k

智算领域人才稀缺,大厂高薪,参考深圳同级别专家薪资,月薪5-7万合理。

职位详情

关于这个职位

该职位是平安集团智算平台的核心技术专家,负责大模型训练与推理的架构设计、性能优化及全链路监控

你将主导云原生与GPU集群的调度优化,提升算力利用率并降低推理成本
适合具备8年以上分布式系统经验、精通Kubernetes和AI基础设施的技术专家

最低要求

)计算机、人工智能等相关专业,本科及以上学历

)8年以上基础设施、云原生、智算或算法平台架构设计或研发经验,熟悉云原生、智算平台、大模型训练/推理等领域
)精通Kubernetes、GPU容器运行时、Device Plugin、Hived、Volcano等云原生技术,具备大规模计算集群的设计、部署或运维经验
熟悉CI/CD流程,熟悉MLOps模型训练及推理的部署流程
)有GPU/国产算力集群的构建和优化经验,能够分析并解决分布式环境中的性能瓶颈,熟悉大规模训练和推理下的运维和排障,具备全链路可观测性设计能力和故障定位能力
)熟悉大规模智算集群的网络拓扑、通信协议(RoCE)与通信模式(如RDMA、NVLink、InfiniBand等),熟悉AllReduce、All-to-All等集合通信进行性能测试及调优
)有推理引擎设计或研发经验,熟悉vLLM、SGlang、TensorRT、Dynamo、MindIE等推理引擎,熟悉PD分离、大EP、AF分离、KVCache等推理加速技术
)出色的沟通能力,善于跨团队协作,具有支持多团队AI项目的经验

工作职责

)负责智算平台规划与架构设计,结合BU业务场景,制定技术路线,明确智算平台、LLM训推及工具生态的核心功能与技术架构

)优化并提升模型训练(微调/强化学习)、模型推理算力使用率
深入优化平台资源管理及调度能力,包括GPU/国产算力、内存/显存、RDMA网络等,提升系统的可靠性、性能和扩展性
)LLM推理引擎优化,通过PD分离、EP并行、算子调优、网络或存储调优等技术提高推理引擎性能降低Tokens单位成本
)LLM全链路性能监控,建立性能指标体系(吞吐量、时延、资源利用率),输出调优方案、标准与自动化诊断工具
)负责LLM基础模型和配套推理引擎的引入、适配、优化及性能基线评测,为业务提供最优性价比的模型和推理引擎

AI 洞察

优缺点分析

优点

  • 站在AI浪潮最前沿,接触大模型核心基础设施,技术积累极具竞争力
  • 平安集团平台广阔,项目规模和复杂性远超一般公司,提升解决实际问题的能力
  • 薪资回报优厚,且公司稳定,福利完善
  • 技术深度要求极高,需同时掌握分布式系统、网络通信、AI框架等多领域知识
  • 工作强度可能较大,尤其是面对大规模训练任务时的排障与优化工作
  • 技术迭代极快,需要持续学习并跟进最新论文和开源项目
  • 适合技术深耕型人才,享受解决复杂系统难题、追求极致性能,且愿意在AI基础设施领域长期发展

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术深耕:成为智算/云原生领域的权威专家,主导行业标准制定
  • 管理转型:可向智算平台技术总监或AI基础设施负责人发展,带领团队
  • 业务拓展:结合业务场景,向AI产品架构或解决方案架构师方向延伸
  • 设计并优化平安智算平台的整体架构,确保能高效支持大规模大模型训练与推理
  • 深入GPU集群的资源调度与性能优化,解决分布式训练中的网络与计算瓶颈
  • 主导推理引擎的选型与定制优化,通过PD分离、EP并行等技术降低推理成本
  • 建立全链路性能监控体系,输出自动化诊断工具并推动持续调优
  • 精通Kubernetes及GPU容器化技术,具备大规模集群部署和运维经验
  • 熟悉智算网络协议(如RoCE、InfiniBand)和集合通信调优
  • 掌握主流推理引擎(vLLM、TensorRT等)及其优化技术
  • 具备MLOps和CI/CD流程实践,能推动模型训练与部署的自动化

申请策略

  • 了解平安在金融科技领域的大模型应用方向(如保险理赔、客服等),思考平台如何赋能业务
  • 面试前准备好一个完整的大型智算平台架构设计方案,包含网络、调度和推理优化
  • 突出大规模GPU集群设计和运维的具体项目,量化集群规模(节点数、GPU卡数)
  • 列举推理引擎优化案例,如降低延迟或提升吞吐的百分比
  • 强调网络通信优化经验,如RDMA调优或集合通信加速
  • 体现跨团队协作经验,例如支持多个AI业务团队的基础设施需求
  • 学习vLLM、SGLang等最新推理引擎的源码结构,了解其内部优化机制
  • 熟悉国产芯片(如昇腾)的适配和优化方法

面试指南

  • 结构性回答:先明确问题背景(规模、业务场景),然后从瓶颈分析、优化措施、效果验证三步展开
  • 对比法:针对不同方案(如vLLM vs TensorRT)从性能、灵活性和成本对比,展示决策依据
  • STAR法则:用具体项目经历回答,说明情境、任务、行动和结果,尤其突出量化指标
  • 请描述你设计过的最大的Kubernetes集群规模,以及遇到的调度挑战和解决方案
  • 如何优化一个Transformer模型的推理性能?请从模型、系统和硬件角度说明
  • 在大规模分布式训练中,如何检测和解决AllReduce通信瓶颈?
  • 解释PD分离(Prefill-Decode分离)的原理和适用场景
  • 如何为多租户场景设计GPU资源调度策略,同时保证公平性和利用率?

匹配度报告

71
综合匹配度

技术前沿的AI基础设施专家岗,高薪高成长,但工作强度预估较大。

适合人群
最适合追求技术成长和薪资回报的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

薪资水平高,大厂福利稳定,但具体薪酬未在JD中明确,整体补偿性较好。

薪资信号未披露(AI估算:50K-70K/月)

成长发展匹配

90较高

前沿技术栈,涉及大模型、云原生、高性能计算,成长空间极大,但JD未明确晋升机制。

技术前沿前沿/新兴技术
技术栈Kubernetes、GPU、大模型、推理引擎、RDMA、MLOps
业务类型ambiguous

工作生活匹配

40较低

JD未提及灵活工作安排,大厂技术岗通常强度较大,WLB一般。

工作模式未明确
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施对社会智能化有推动作用,但平安作为金融机构,直接社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

中国平安 的其他在招职位

  • 私行团队总经理

    中国平安 · 温州市
    AI 估算 · 30k-50k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • 机构商保总

    中国平安 · 上海市
    AI 估算 · 40k-70k
  • 团体核保报价岗

    中国平安 · 上海市
    AI 估算 · 25k-45k
  • AI工程化(安全领域)

    中国平安 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 云原生AI算力平台实习生(J99729)

    百度 · 北京市
    AI 估算 · 5k-8k
  • 高级/资深前端研发工程师-Dev Infra

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大数据后端开发工程师-内容质量

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • Spark引擎研发工程师-数据平台

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • 后端研发工程师(云编辑)-剪映Capcut(北京/广州/深圳)

    字节跳动 · 深圳市
    AI 估算 · 20k-40k

中国平安 的其他在招职位

  • 私行团队总经理

    中国平安 · 温州市
    AI 估算 · 30k-50k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • 机构商保总

    中国平安 · 上海市
    AI 估算 · 40k-70k
  • 团体核保报价岗

    中国平安 · 上海市
    AI 估算 · 25k-45k
  • AI工程化(安全领域)

    中国平安 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 云原生AI算力平台实习生(J99729)

    百度 · 北京市
    AI 估算 · 5k-8k
  • 高级/资深前端研发工程师-Dev Infra

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大数据后端开发工程师-内容质量

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • Spark引擎研发工程师-数据平台

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • 后端研发工程师(云编辑)-剪映Capcut(北京/广州/深圳)

    字节跳动 · 深圳市
    AI 估算 · 20k-40k