Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

AMD logo
超威半导体
Software Development Engineer
立即应聘

Software Development Engineer

发布于 大约 2 个月前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
软件工程
GPU
CI/CD
GitHub Actions
Buildkite

AI 估算 · 30k–45k

AMD全球巨头,MTS级别,上海高级DevOps工程师薪资水平,技术栈热门,GPU和AI方向需求旺盛

职位详情

关于这个职位

作为AI/ML框架团队的软件工程师,你将负责构建和维护可扩展的DevOps基础设施,加速AMD的AI软件开发

工作内容包括设计CI/CD流水线、管理Kubernetes集群、使用Ansible和Python实现自动化,以及支持GPU计算环境
适合有扎实DevOps背景、熟悉Kubernetes和自动化工具的工程师

最低要求

THE PERSON: The ideal candidate is a skilled engineer with a strong background in DevOps, site reliability, or infrastructure engineering. They are proficient in Kubernetes, CI/CD tools, scripting (Python/Bash), and infrastructure automation frameworks such as Ansible. Experience working with GPU compute environments and integrating automated test workflows is highly valued. This person thrives in collaborative, fast-paced environments and can drive technical execution with minimal oversight. They bring a problem-solving mindset, strong communication skills, and a passion for building reliable, scalable systems.

ACADEMIC CREDENTIALS: Bachelor's or master's degree in computer/software engineering, Computer Science, or related technical discipline. Years of professional and relevant industry experience.

工作职责

CI/CD Pipeline Development: Design, implement, and manage efficient continuous integration and delivery pipelines using Buildkite, GitHub Actions, and Jenkins to enable rapid and reliable software deployment.

Kubernetes Infrastructure Management: Deploy and maintain robust Kubernetes-based environments across both on-premise and cloud platforms to support scalable service orchestration.
Infrastructure Automation: Automate provisioning, configuration, and management of infrastructure using Ansible, Python, and Bash to improve system consistency and reduce manual intervention.
Service Deployment with Helm: Administer application and service deployment in Kubernetes using Helm charts for consistent and repeatable release processes.
GPU Server Support: Configure, manage, and maintain GPU-based compute environments including lifecycle automation and hardware-level test integration.
Database and Observability Integration: Interact with MySQL databases to support dynamic data updates and integrate data sources into Grafana dashboards for monitoring and insights.
Cross-Functional Collaboration: Work closely with development teams, SREs, and project stakeholders to ensure system-level alignment and high-impact delivery.
Quality Assurance Enablement: Integrate automated testing frameworks into CI pipelines to ensure code quality, stability, and performance across development cycles.

优先资格

PREFERRED EXPERIENCE: DevOps Tools & Automation: Proficient with Buildkite, GitHub Actions, Jenkins, Ansible, and scripting languages like Python and Bash for streamlining DevOps workflows. Containerization & Orchestration: Strong experience with Docker, Kubernetes, and Helm for deploying and managing scalable, containerized applications. Infrastructure as Code (IaC): Hands-on experience automating infrastructure provisioning and configuration to ensure reproducibility and scalability across environments. GPU-Based Compute Environments: Familiarity with GPU server lifecycle management and integration of GPU resources into CI test workflows for performance-critical applications. Monitoring & Observability: Experience using tools like Checkmk, Prometheus, and Grafana to monitor infrastructure health and application performance. Version Control & Collaboration: Advanced knowledge of Git-based version control, including branching strategies and CI/CD integration for collaborative development. Linux & System Administration: Solid background in Linux environments, including shell scripting and system-level troubleshooting across distributed systems. Agile & Cross-Disciplinary Collaboration: Comfort working in Agile teams and partnering with software, infrastructure, and product teams to drive consistent delivery and innovation.

AI 洞察

优缺点分析

优点

  • 掌握Kubernetes、GPU等关键技术,在AI基础设施领域具有高市场价值
  • 参与AI加速和前沿技术,能积累高性能计算和分布式系统的实战经验
  • DevOps工作强度较大,需处理多团队需求和突发问题
  • 技术栈要求全面,需持续学习新工具和框架
  • GPU环境配置和调试较为复杂,对故障排查能力要求高
  • 适合热爱基础设施自动化、喜欢解决复杂系统问题、追求技术深度的DevOps工程师

缺点 / 挑战

  • AMD是全球半导体领导者,平台大,技术挑战丰富,利于职业背书

角色解读

  • 可向资深DevOps工程师或SRE专家发展,深入GPU集群和AI基础设施方向
  • 有机会转为技术经理或架构师,负责更大规模的系统设计和团队指导
  • 在AMD内部可横向移动至AI/ML框架开发或数据中心工程等前沿领域
  • 设计并维护CI/CD流水线,使用Buildkite、GitHub Actions和Jenkins确保快速可靠的软件部署
  • 管理Kubernetes集群的部署与运维,覆盖本地和云平台,支持GPU服务器环境
  • 使用Ansible、Python和Bash实现基础设施自动化,包括资源配置和配置管理
  • 与开发团队、SRE和项目干系人协作,确保系统级对齐和高质量交付
  • 精通Kubernetes和容器化技术(Docker、Helm),能独立管理集群
  • 熟练使用CI/CD工具(Buildkite、Jenkins)和自动化框架(Ansible)
  • 扎实的脚本编程能力(Python、Bash),熟悉Linux系统管理
  • 了解GPU服务器生命周期管理及监控工具(Prometheus、Grafana)

申请策略

  • 了解AMD的AI软件栈(如ROCm),在面试中展示对AI基础设施的理解
  • 强调开源社区贡献或技术博客,体现学习能力和分享精神
  • 突出Kubernetes集群管理经验,包括部署、扩展和故障恢复的具体案例
  • 强调CI/CD流水线搭建和优化成果,如提高部署频率或减少故障时间
  • 展示自动化脚本编写能力,最好有Ansible或类似工具的大规模使用经历
  • 若具备GPU服务器支持或AI项目经验,应作为亮点呈现
  • 熟悉Helm chart编写和Kubernetes operator模式
  • 学习监控工具如Prometheus和Grafana的数据源集成与告警设置

面试指南

  • STAR法则:描述情境、任务、行动和结果,突出量化指标
  • 技术深度与广度结合:先简述原理,再结合项目实例说明具体操作和难点解决
  • 展现系统性思维:从整体架构出发,解释决策原因和备选方案
  • 请描述一个你设计的高可用CI/CD流水线,如何处理失败和回滚?
  • Kubernetes中如何管理有状态应用?举例说明StatefulSet的使用场景
  • 如何监控大规模Kubernetes集群?Prometheus和Grafana的配置经验
  • GPU服务器运维中遇到过哪些问题?如何自动化GPU资源分配?
  • 用Ansible实现基础设施自动化的典型案例,包括playbook设计和角色组织

匹配度报告

70
综合匹配度

AMD DevOps工程师,前沿技术栈,高成长性,办公现场,薪资有竞争力但未明确。

适合人群
最适合追求技术成长和前沿方向,对工作生活平衡要求不是特别高的DevOps工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展85
工作生活50
使命价值70

薪资福利匹配

75中等

AMD为上市跨国巨头,薪资福利有竞争力,但JD未明确披露具体薪资和福利细节,补偿性满足度中等偏高。

薪资信号未披露(AI估算:30K-45K/月)

成长发展匹配

85较高

职位涉及Kubernetes、GPU、DevOps等前沿技术,有广阔的技能成长空间;但JD中未明确提及晋升通道或培训,发展性满足度较高。

技术前沿前沿/新兴技术
技术栈Kubernetes、GPU、CI/CD、Ansible、Docker、Helm、Prometheus、Grafana
业务类型cost_center

工作生活匹配

50较低

JD未提及远程或弹性工作,上海办公室通常现场办公;且DevOps角色可能涉及on-call或紧急响应,生活化满足度一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AMD致力于加速AI和计算体验,有一定使命感,但职位偏重内部基础设施,直接社会价值感知不强。

行业发展高速增长赛道
社会影响中性/一般
使命信号build great products that accelerate next-generation computing experiences
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

超威半导体 的其他在招职位

  • DFT Engineer

    超威半导体 · 上海市
    AI 估算 · 20k-35k
  • Silicon Design Engineer

    超威半导体 · 上海市
    AI 估算 · 25k-40k
  • Silicon Design Engineer

    超威半导体 · 上海市
    AI 估算 · 30k-50k
  • Physical Design Engineer

    超威半导体 · 上海市
    AI 估算 · 30k-50k
  • Datacenter FAE Support Manager

    超威半导体 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 联盟广告算法工程师-商业算法

    小红书 · 北京市
    AI 估算 · 25k-45k
  • AI应用开发工程师-实习

    小红书 · 北京市
    AI 估算 · 3k-5k
  • 微信-高级算法工程师-音频理解/ASR/对话模型方向

    腾讯 · 北京市
    AI 估算 · 30k-60k
  • Project T UE5 客户端开发工程师(性能优化)

    腾讯 · 上海市
    AI 估算 · 25k-45k
  • Project T UE5 高级引擎开发

    腾讯 · 上海市
    AI 估算 · 30k-50k

超威半导体 的其他在招职位

  • DFT Engineer

    超威半导体 · 上海市
    AI 估算 · 20k-35k
  • Silicon Design Engineer

    超威半导体 · 上海市
    AI 估算 · 25k-40k
  • Silicon Design Engineer

    超威半导体 · 上海市
    AI 估算 · 30k-50k
  • Physical Design Engineer

    超威半导体 · 上海市
    AI 估算 · 30k-50k
  • Datacenter FAE Support Manager

    超威半导体 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 联盟广告算法工程师-商业算法

    小红书 · 北京市
    AI 估算 · 25k-45k
  • AI应用开发工程师-实习

    小红书 · 北京市
    AI 估算 · 3k-5k
  • 微信-高级算法工程师-音频理解/ASR/对话模型方向

    腾讯 · 北京市
    AI 估算 · 30k-60k
  • Project T UE5 客户端开发工程师(性能优化)

    腾讯 · 上海市
    AI 估算 · 25k-45k
  • Project T UE5 高级引擎开发

    腾讯 · 上海市
    AI 估算 · 30k-50k