COSCO logo
中国远洋运输集团
高级系统工程师 (云计算)

高级系统工程师 (云计算)

发布于 大约 16 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
本科
GPU
LLM
阿里云

AI 估算 · 25k–40k

国企高级云工程师,技术栈前沿,上海地区薪资处于市场中上水平。

职位详情

关于这个职位

该职位负责设计、构建和优化公司云平台架构,管理私有云及阿里云、Azure等公有云平台,核心是围绕Kubernetes和Rancher进行容器编排与集群管理

同时涉及GPU资源调度、AI工作负载支持以及自动化工具开发,确保系统的高可用性、安全性和成本效益
适合具备深厚云原生技术背景并追求技术深度发展的工程师

最低要求

本科及以上学历,计算机科学与技术/软件工程/信息与计算科学等相关专业

熟悉云原生应用架构,精通容器编排技术,熟练掌握Rancher等Kubernetes集群管理工具,熟悉服务网格(如Istio)
精通阿里云、Azure云等主流公有云平台管理(IaaS/PaaS核心服务)
熟悉GPU资源的规划、调度、监控和优化
熟练掌握Java/Python/Go中至少一门主流编程语言,具备良好的自动化脚本编写或平台工具开发能力
熟悉Kafka、RabbitMQ等消息中间件的原理与应用
掌握操作系统(Linux为主)、计算机网络(TCP/IP协议栈、路由交换基础、防火墙)、分布式系统基础及容器技术等核心计算机理论知识
具备大学英语六级(CET-6)或以上水平,具备优秀的英文技术文档阅读和编写能力
具备优秀的沟通协调能力和团队合作精神

工作职责

设计、构建与优化符合公司策略的云平台架构与解决方案,确保应用系统的高可用性、弹性伸缩能力、卓越性能、安全保障及成本效益

负责公司私有云及外部主流公有云(如阿里云、Azure)平台的管理、部署和日常运维
负责基于Rancher的Kubernetes(K8S)平台的核心技术管理,包括集群生命周期管理(部署、升级、扩缩容)、安全策略实施、监控告警优化、日常运维及故障排除
负责制定并持续完善公司云平台管理策略,推动其落地实施,并建立效果评估与反馈机制

优先资格

持有CKA认证者优先

持有阿里云ACP、微软相关云认证者优先
具备大语言模型(LLM)等AI工作负载相关基础设施的管理经验者优先
具有开发Operator、CRD控制器或云原生相关工具,或具有Terraform等自动化开发经验优先
了解主流大数据处理与数据集成组件(如HDFS, Spark, Flink, FlinkCDC, Debezium等)的架构与工作原理者优先

AI 洞察

优缺点分析

优点

  • 技术栈前沿,涵盖Kubernetes、公有云、GPU调度等热门领域,技能保值性高
  • 国企巨头,平台稳定,福利完善,适合寻求长期发展的技术人才
  • 接触大型分布式系统,积累高并发、高可用架构经验,行业认可度高
  • 国企环境可能流程繁琐,创新节奏相对互联网慢,需适应体制内工作方式
  • 适合喜欢钻研底层技术、对云原生和基础设施有浓厚兴趣,且追求稳定工作环境的工程师

缺点 / 挑战

  • 技术广度要求高,需同时掌握云、容器、编程、中间件等多方面知识,学习压力大
  • 运维职责包括故障排除和应急响应,可能面临On-call压力

角色解读

  • 可向云架构专家或技术总监发展,负责更大规模的云平台规划
  • 随着AI基础设施需求增长,可转型为AI云平台架构师,负责GPU集群和LLM部署
  • 也可深耕Kubernetes生态,成为云原生技术专家,推动公司容器化进程
  • 设计并优化云平台架构,确保系统高可用、弹性伸缩且安全高效
  • 管理私有云和公有云(阿里云、Azure)的日常运维与部署
  • 负责Kubernetes集群的全生命周期管理,包括升级、扩缩容和故障排除
  • 制定云平台管理策略并推动落地,同时关注GPU资源调度和AI工作负载基础设施
  • 精通容器编排技术,尤其是Kubernetes和Rancher,掌握Istio等服务网格
  • 深度掌握阿里云、Azure等公有云IaaS/PaaS核心服务
  • 熟练至少一门编程语言(Java/Python/Go),具备自动化脚本和工具开发能力
  • 熟悉Linux操作系统、网络协议栈、分布式系统及容器技术

申请策略

  • 了解中国远洋运输集团的业务背景,思考云技术如何助力航运数字化转型,面试中展现业务理解
  • 提前准备英语技术文档阅读能力,面试可能会要求翻译或解释英文技术文档
  • 突出Kubernetes集群管理经验,特别是Rancher使用和CKA认证
  • 强调公有云平台(阿里云/Azure)的实际项目,包括架构设计和成本优化案例
  • 展示自动化脚本或工具开发能力,如Terraform、Operator开发等
  • 如具备GPU调度或LLM部署经验,务必重点提及
  • 若未接触过Istio或服务网格,建议快速学习并动手实践
  • 补充大数据组件(Spark、Flink)基础知识,虽为加分项但面试可能涉及

面试指南

  • STAR法则描述项目经历:情境、任务、行动、结果,突出技术选型原因和量化成果
  • 对于技术对比问题,采用“核心差异-适用场景-个人经验”三层结构回答
  • 故障排查类问题:先定位现象,再分析可能原因,最后给出解决方案并复盘
  • 请描述你设计过的一个高可用云架构,包括如何考虑成本和安全?
  • Kubernetes集群如何实现滚动升级和回滚?遇到Pod调度失败如何处理?
  • 阿里云和Azure的主要差异是什么?在跨云迁移中你如何保持一致性?
  • 如何监控和优化Kubernetes集群的性能?你使用过哪些监控工具?
  • 解释一下Terraform如何管理基础设施,并对比它与Ansible的优劣

匹配度报告

72
综合匹配度

稳定国企,前沿云原生技术栈,薪资中上,但工作地点固定且WLB不明确。

适合人群
最适合追求技术深度发展、愿意在稳定平台深耕云原生技术的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展85
工作生活60
使命价值70

薪资福利匹配

75中等

国企上市巨头,薪资福利稳定,虽未明确薪资但市场水准估计中上,适合追求稳定收入的求职者。

薪资信号未披露(AI估算:25K-40K/月)

成长发展匹配

85较高

技术栈前沿,覆盖云原生、AI基础设施等方向,成长空间大,但未明确提及晋升通道。

技术前沿前沿/新兴技术
技术栈Kubernetes、Rancher、阿里云、Azure、GPU、LLM、Istio、Terraform
业务类型cost_center

工作生活匹配

60中等

仅现场办公,位于上海杨浦区,市中心位置便利,但未提及弹性工作或WLB,可能加班。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

航运国企,业务稳定,技术推动数字化有一定社会价值,但创新性一般。

行业发展稳定成熟行业
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs