
超威半导体
多模态算法工程师(模型优化方向)/ Multimodal Algorithm Engineer (Model Optimization)
多模态算法工程师(模型优化方向)/ Multimodal Algorithm Engineer (Model Optimization)
发布于 大约 14 小时前普通员工/个人贡献者
上海市
中级经验
全职员工
仅现场办公
硕士
PyTorch
GPU优化
量化
知识蒸馏
VLM
VLA
具身智能
Wam
AI 估算 · 35k–65k
上海AI算法岗,跨国巨头,要求硕士博士且技能前沿,月薪范围合理,竞争力强。
职位详情
关于这个职位
作为AMD核心算法团队成员,你将负责多模态基础模型(如VLM、VLA、World Action Models)的训练、压缩、量化和推理优化,推动具身智能和下一代多模态智能体在AMD硬件上的高性能部署
工作涉及与编译器、驱动和系统软件团队紧密协作,共同实现全栈协同优化
这是一个前沿技术岗位,适合对多模态AI和模型优化有热情的研究型工程师
最低要求
计算机科学、人工智能、机器人、电子工程或相关领域的硕士或博士学位
在VLM、VLA或WAM(World Action Models)方面有实践经验——特别是在机器人决策、模拟环境训练或动作序列生成方面者优先
精通PyTorch
熟悉多模态和具身AI框架
熟悉Isaac Gym、LIBERO、MuJoCo或RoboTwin等仿真平台
扎实的软件工程能力,能提供从研究原型到生产部署的全周期解决方案
工作职责
在AMD平台上优化多模态模型(VLM / VLA / WAM)的训练策略、微调和对齐
增强WAM/VLA模型在具身智能场景(如机器人、基于仿真的交互)中的动作预测、世界状态建模和长时程规划能力
设计并实现模型优化技术,包括量化(PTQ/QAT)、剪枝、知识蒸馏、算子融合和KV缓存优化,以改善推理延迟、吞吐量和能效
与编译器、驱动和系统软件团队紧密协作,将模型深度集成到AMD的软件栈中
保持在World Models、动作生成和多模态智能体领域的前沿研究,并为AMD异构计算平台探索新架构
优先资格
在多模态智能体、世界模型或机器人领域有开源项目贡献(如OpenVLA、DROID、ACT)
在顶级会议(如CVPR、ICRA、CoRL、NeurIPS、ICLR)上发表过多模态学习或具身AI论文者优先
在模型优化方面有扎实背景:量化、稀疏化、Kernel融合、动态批处理等
有AMD ROCm生态系统或异构计算性能调优经验
理解GPU/加速器架构
有CUDA或HIP经验者更佳
AI 洞察
优缺点分析
优点
- 处于AI前沿赛道——多模态和具身智能,技术成长空间大
- AMD是芯片巨头,能接触底层硬件和全栈优化,技术深度和广度并重
- 团队氛围国际化,协作对象包括编译器、驱动等顶尖工程师,学习资源丰富
- 薪资福利优厚,且上海作为核心城市,职业发展机会多
- 技术门槛高,需要同时掌握算法和硬件优化,学习曲线陡峭
- 具身智能领域尚在早期,研发不确定性大,需要较强的自驱力和研究能力
缺点 / 挑战
- 工作强度可能较高,尤其是项目交付期,需投入较多时间
- 适合有扎实深度学习基础、对多模态和具身智能充满热情,愿意深入底层硬件优化,并能承受一定研发压力的技术型求职者
角色解读
- 在AMD可成长为多模态AI算法专家,深入参与前沿技术研发,积累全栈优化经验
- 有机会向技术专家或技术负责人发展,带领团队攻克具身智能、模型优化等难题
- 未来可跳槽至其他AI芯片公司或机器人领域,担任高级算法研究岗
- 负责多模态大模型(VLM/VLA/WAM)的训练、微调和对齐,提升模型在具身智能场景下的表现
- 设计和实现模型优化技术,如量化、剪枝、知识蒸馏和KV缓存优化,以降低延迟和提高吞吐量
- 与编译器、驱动和系统软件团队协作,将算法深度集成到AMD的软件栈和硬件平台上
- 扎实的深度学习基础,精通PyTorch,熟悉多模态和具身AI框架
- 有VLM、VLA或World Action Models的实践经验,了解机器人决策或模拟训练
- 掌握模型优化技术:量化、剪枝、知识蒸馏等,有GPU/加速器架构知识更佳
- 较强的软件工程能力,能从研究原型到生产部署全周期开发
申请策略
- 仔细研究AMD的技术博客和开源项目(如ROCm),面试时展示对AMD软件栈的理解
- 准备一个端到端的项目案例,从模型训练到部署优化,体现全栈思维
- 突出VLM/VLA/WAM相关项目经验,特别是训练、微调、量化、部署等全流程经历
- 重点展示PyTorch编程能力和模型优化成果(如加速比、压缩率等量化指标)
- 如有顶级会议论文或开源项目贡献(如OpenVLA、DROID),务必突出
- 强调与硬件优化相关的经验,如CUDA/HIP、GPU内核优化或AMD ROCm平台使用
- 如果缺少具身AI经验,可自学Isaac Gym、MuJoCo等仿真平台,练习动作生成或世界模型
- 深入掌握模型量化工具(如PyTorch的量化模块、TensorRT、ONNX Runtime),并动手实践
面试指南
- 对于项目经验问题,采用STAR法则:背景、任务、行动、结果,重点突出个人贡献和技术细节
- 对于优化技术问题,先阐述理论基础,再结合实际经验,说明权衡和选择依据
- 对于系统性能问题,从计算图、内存层次、并行性等角度分析,体现出对硬件架构的理解
- 请详细介绍你参与的一个VLM/VLA项目,包括模型架构、训练策略和遇到的挑战
- 解释PTQ和QAT的区别,并举例说明在什么场景下选择哪种量化方式
- 如何优化一个多模态模型的推理延迟?请从系统层面(算子融合、内存带宽)和算法层面(剪枝、蒸馏)分别阐述
- 你对World Action Models的理解是什么?它与传统规划方法相比有何优势?
- 在GPU上优化大规模模型时,如何分析和解决性能瓶颈?
匹配度报告
69
综合匹配度
前沿AI算法岗,技术成长拉满,但工作强度大,WLB欠佳。
适合人群
适合极度看重技术成长、愿意投入高强度研发,对WLB要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展92
工作生活30
使命价值75
薪资福利匹配
80较高
上海AI算法岗薪资较高,AMD作为上市公司福利完善,但JD未明确薪资和具体福利细节,仅提及一般性福利描述,整体补偿性较好。
薪资信号未披露(AI估算:35K-65K/月)
成长发展匹配
92较高
该职位技术前沿性极强(多模态、具身智能、模型优化),且AMD提供顶尖计算资源和全栈协同机会,成长空间巨大,发展性动机得到极高满足。
技术前沿前沿/新兴技术
技术栈VLM、VLA、WAM、量化、知识蒸馏、PyTorch、Isaac Gym、MuJoCo、ROCm、CUDA
成长机会cutting-edge AMD compute resources、full-stack co-design、collaborative globally distributed team
业务类型ambiguous
工作生活匹配
30较低
工作地点上海,仅现场办公,JD未涉及远程或弹性工作,且暗示高强度研发,WLB可能较差。
工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)
使命价值匹配
75中等
AI和具身智能属于高速增长赛道,但JD未体现明确社会使命感,偏技术驱动。
行业发展高速增长赛道
社会影响中性/一般
使命信号build great products that accelerate next-generation computing experiences、shape the future of AI and beyond
创新程度积极采用新技术
超威半导体 的其他在招职位
相似职位推荐
Watch Jobs