AMD logo
超威半导体
多模态算法工程师(模型优化方向)/ Multimodal Algorithm Engineer (Model Optimization)

多模态算法工程师(模型优化方向)/ Multimodal Algorithm Engineer (Model Optimization)

发布于 大约 14 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
硕士
PyTorch
GPU优化
量化
知识蒸馏
VLM
VLA
具身智能
Wam

AI 估算 · 35k–65k

上海AI算法岗,跨国巨头,要求硕士博士且技能前沿,月薪范围合理,竞争力强。

职位详情

关于这个职位

作为AMD核心算法团队成员,你将负责多模态基础模型(如VLM、VLA、World Action Models)的训练、压缩、量化和推理优化,推动具身智能和下一代多模态智能体在AMD硬件上的高性能部署

工作涉及与编译器、驱动和系统软件团队紧密协作,共同实现全栈协同优化
这是一个前沿技术岗位,适合对多模态AI和模型优化有热情的研究型工程师

最低要求

计算机科学、人工智能、机器人、电子工程或相关领域的硕士或博士学位

在VLM、VLA或WAM(World Action Models)方面有实践经验——特别是在机器人决策、模拟环境训练或动作序列生成方面者优先
精通PyTorch
熟悉多模态和具身AI框架
熟悉Isaac Gym、LIBERO、MuJoCo或RoboTwin等仿真平台
扎实的软件工程能力,能提供从研究原型到生产部署的全周期解决方案

工作职责

在AMD平台上优化多模态模型(VLM / VLA / WAM)的训练策略、微调和对齐

增强WAM/VLA模型在具身智能场景(如机器人、基于仿真的交互)中的动作预测、世界状态建模和长时程规划能力
设计并实现模型优化技术,包括量化(PTQ/QAT)、剪枝、知识蒸馏、算子融合和KV缓存优化,以改善推理延迟、吞吐量和能效
与编译器、驱动和系统软件团队紧密协作,将模型深度集成到AMD的软件栈中
保持在World Models、动作生成和多模态智能体领域的前沿研究,并为AMD异构计算平台探索新架构

优先资格

在多模态智能体、世界模型或机器人领域有开源项目贡献(如OpenVLA、DROID、ACT)

在顶级会议(如CVPR、ICRA、CoRL、NeurIPS、ICLR)上发表过多模态学习或具身AI论文者优先
在模型优化方面有扎实背景:量化、稀疏化、Kernel融合、动态批处理等
有AMD ROCm生态系统或异构计算性能调优经验
理解GPU/加速器架构
有CUDA或HIP经验者更佳

AI 洞察

优缺点分析

优点

  • 处于AI前沿赛道——多模态和具身智能,技术成长空间大
  • AMD是芯片巨头,能接触底层硬件和全栈优化,技术深度和广度并重
  • 团队氛围国际化,协作对象包括编译器、驱动等顶尖工程师,学习资源丰富
  • 薪资福利优厚,且上海作为核心城市,职业发展机会多
  • 技术门槛高,需要同时掌握算法和硬件优化,学习曲线陡峭
  • 具身智能领域尚在早期,研发不确定性大,需要较强的自驱力和研究能力

缺点 / 挑战

  • 工作强度可能较高,尤其是项目交付期,需投入较多时间
  • 适合有扎实深度学习基础、对多模态和具身智能充满热情,愿意深入底层硬件优化,并能承受一定研发压力的技术型求职者

角色解读

  • 在AMD可成长为多模态AI算法专家,深入参与前沿技术研发,积累全栈优化经验
  • 有机会向技术专家或技术负责人发展,带领团队攻克具身智能、模型优化等难题
  • 未来可跳槽至其他AI芯片公司或机器人领域,担任高级算法研究岗
  • 负责多模态大模型(VLM/VLA/WAM)的训练、微调和对齐,提升模型在具身智能场景下的表现
  • 设计和实现模型优化技术,如量化、剪枝、知识蒸馏和KV缓存优化,以降低延迟和提高吞吐量
  • 与编译器、驱动和系统软件团队协作,将算法深度集成到AMD的软件栈和硬件平台上
  • 扎实的深度学习基础,精通PyTorch,熟悉多模态和具身AI框架
  • 有VLM、VLA或World Action Models的实践经验,了解机器人决策或模拟训练
  • 掌握模型优化技术:量化、剪枝、知识蒸馏等,有GPU/加速器架构知识更佳
  • 较强的软件工程能力,能从研究原型到生产部署全周期开发

申请策略

  • 仔细研究AMD的技术博客和开源项目(如ROCm),面试时展示对AMD软件栈的理解
  • 准备一个端到端的项目案例,从模型训练到部署优化,体现全栈思维
  • 突出VLM/VLA/WAM相关项目经验,特别是训练、微调、量化、部署等全流程经历
  • 重点展示PyTorch编程能力和模型优化成果(如加速比、压缩率等量化指标)
  • 如有顶级会议论文或开源项目贡献(如OpenVLA、DROID),务必突出
  • 强调与硬件优化相关的经验,如CUDA/HIP、GPU内核优化或AMD ROCm平台使用
  • 如果缺少具身AI经验,可自学Isaac Gym、MuJoCo等仿真平台,练习动作生成或世界模型
  • 深入掌握模型量化工具(如PyTorch的量化模块、TensorRT、ONNX Runtime),并动手实践

面试指南

  • 对于项目经验问题,采用STAR法则:背景、任务、行动、结果,重点突出个人贡献和技术细节
  • 对于优化技术问题,先阐述理论基础,再结合实际经验,说明权衡和选择依据
  • 对于系统性能问题,从计算图、内存层次、并行性等角度分析,体现出对硬件架构的理解
  • 请详细介绍你参与的一个VLM/VLA项目,包括模型架构、训练策略和遇到的挑战
  • 解释PTQ和QAT的区别,并举例说明在什么场景下选择哪种量化方式
  • 如何优化一个多模态模型的推理延迟?请从系统层面(算子融合、内存带宽)和算法层面(剪枝、蒸馏)分别阐述
  • 你对World Action Models的理解是什么?它与传统规划方法相比有何优势?
  • 在GPU上优化大规模模型时,如何分析和解决性能瓶颈?

匹配度报告

69
综合匹配度

前沿AI算法岗,技术成长拉满,但工作强度大,WLB欠佳。

适合人群
适合极度看重技术成长、愿意投入高强度研发,对WLB要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展92
工作生活30
使命价值75

薪资福利匹配

80较高

上海AI算法岗薪资较高,AMD作为上市公司福利完善,但JD未明确薪资和具体福利细节,仅提及一般性福利描述,整体补偿性较好。

薪资信号未披露(AI估算:35K-65K/月)

成长发展匹配

92较高

该职位技术前沿性极强(多模态、具身智能、模型优化),且AMD提供顶尖计算资源和全栈协同机会,成长空间巨大,发展性动机得到极高满足。

技术前沿前沿/新兴技术
技术栈VLM、VLA、WAM、量化、知识蒸馏、PyTorch、Isaac Gym、MuJoCo、ROCm、CUDA
成长机会cutting-edge AMD compute resources、full-stack co-design、collaborative globally distributed team
业务类型ambiguous

工作生活匹配

30较低

工作地点上海,仅现场办公,JD未涉及远程或弹性工作,且暗示高强度研发,WLB可能较差。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

AI和具身智能属于高速增长赛道,但JD未体现明确社会使命感,偏技术驱动。

行业发展高速增长赛道
社会影响中性/一般
使命信号build great products that accelerate next-generation computing experiences、shape the future of AI and beyond
创新程度积极采用新技术
Watch Jobs