Hyundai logo
现代汽车
大模型端侧部署工程师

大模型端侧部署工程师

发布于 大约 3 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
深度学习
PyTorch
多模态模型
NVIDIA
大语言模型
模型量化
知识蒸馏
TensorRT
剪枝

AI 估算 · 25k–45k

大模型端侧部署技术要求高,市场稀缺,汽车巨头平台薪资有竞争力,综合估算月薪范围。

职位详情

关于这个职位

该职位负责将大语言模型及多模态模型部署到端侧硬件平台(如高通、英伟达),通过剪枝、量化和知识蒸馏等技术优化模型性能,提升推理速度和效率

你将参与前沿技术研究,与算法、硬件团队协作,推动智能驾驶等场景的AI落地
适合有深度学习部署经验、热爱技术挑战的工程师

最低要求

硕士及以上学历,计算机、人工智能等相关专业

两年及以上相关工作经验
熟悉深度学习基本原理,掌握至少一种深度学习框架(如PyTorch、TensorFlow)
熟悉C/C++、Python等编程语言,具备良好的编程基础
熟悉NPU、GPU等SOC的编程,模型网络结构优化以及内存等优化
熟悉模型部署相关流程,如有TensorRT、NeuroPilot/SNPE等工具链使用经验
有大语言模型和多模态大模型工程化部署、模型优化的经验
具备较强的学习能力和动手能力,自我驱动力强

工作职责

针对不同硬件平台(Qualcomm、Nvidia等),进行结构化剪枝、知识蒸馏、模型转换和量化压缩等工作

分析优化模型结构,将LLM、VLM,NLP等模型部署到对应平台,提升模型的推理速度与运算效率
跟进新技术动态,优化现有模型、资源占用,降低推理时延和精度损失,提升模型效果
完成项目相关技术文档的编写和整理
与算法、硬件和供应商等相关团队密切配合,共同推进项目进度

AI 洞察

优缺点分析

优点

  • 大模型端侧部署是行业前沿方向,技术稀缺性强,职业发展前景广阔
  • 现代汽车作为跨国巨头,平台稳定,资源充足,能接触到多种硬件平台和实际应用场景
  • 团队位于上海研发中心,技术氛围浓厚,有机会与顶尖算法和硬件团队合作
  • 技术要求全面且深入,需要同时掌握模型压缩、硬件编程和工具链使用,学习曲线陡峭
  • 跨部门协作频繁,需要与算法、硬件、供应商等多方沟通,对项目管理能力有一定要求
  • 适合有深度学习部署经验、热衷于技术攻坚、希望在AI落地方向深入发展的工程师

缺点 / 挑战

暂无明显挑战项

角色解读

  • 成为端侧AI部署专家,主导复杂模型的工程化落地
  • 向算法研发方向发展,深入模型压缩与加速算法创新
  • 在项目积累中晋升技术主管,带领团队攻克技术难题
  • 对不同硬件平台进行模型剪枝、量化和知识蒸馏等压缩优化,降低模型大小和计算量
  • 将大语言模型和多模态模型部署到端侧设备,使用TensorRT、NeuroPilot等工具链优化推理速度
  • 持续跟踪技术前沿,改进模型结构和资源占用,平衡精度与效率
  • 编写技术文档,与算法、硬件及供应商团队协作,确保项目按时交付
  • 扎实的深度学习基础知识,熟练使用PyTorch或TensorFlow等框架
  • 精通C/C++和Python编程,具备良好的代码优化能力
  • 熟悉模型部署工具链(如TensorRT、SNPE)和NPU/GPU编程
  • 有实际的大模型或多模态模型部署、量化、剪枝项目经验

申请策略

  • 深入了解现代汽车在智能驾驶和AI领域的布局,在面试中展现对汽车行业AI应用的理解
  • 准备1-2个完整的部署案例,涵盖从模型压缩到硬件部署的全流程,突出解决问题的方法
  • 突出模型部署和优化项目,尤其是大模型或端侧部署的实战经验,用量化、剪枝等技术细节亮明实力
  • 强调C/C++和Python的编程能力,并列举使用的工具链(TensorRT、NeuroPilot等)和硬件平台
  • 展示团队协作和项目推动成果,如优化后的推理速度提升、精度保持等量化指标
  • 系统学习模型量化算法(如PTQ、QAT)和剪枝策略,弥补理论短板
  • 熟悉高通SNPE和英伟达TensorRT的官方文档和最佳实践,动手搭建演示Demo

面试指南

  • 采用STAR法则(情境、任务、行动、结果)回答项目经验,突出技术选型和量化结果
  • 对比不同压缩技术时,先阐述原理,再结合具体场景说明选择依据
  • 遇到问题时,展示系统性排查思路:先复现问题、分析瓶颈、逐步调优
  • 请你详细描述一个你做过的大模型部署项目,包括压缩方法、工具链和最终效果
  • 剪枝和量化的区别是什么?各有什么优缺点?如何在精度和速度之间权衡?
  • 在使用TensorRT或NeuroPilot时,你遇到过哪些性能瓶颈?如何优化?
  • 如果你的模型在端侧推理时出现较大精度损失,你会如何排查和解决?
  • 你如何与算法团队沟通模型结构调整需求?请举例说明

职位点评

69
综合评分

前沿大模型端侧部署岗位,技术成长性强、薪资竞争力好,但现场办公且无明显WLB信号。

更适合这类人
适合追求技术深度与前沿发展、对办公灵活性要求不高的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利70
成长发展85
工作生活50
使命价值70

薪资福利

70中等

薪资未在JD中明确,但该职位技术稀缺,汽车巨头通常提供有竞争力的薪酬福利。

薪资信号未披露(AI估算:25K-45K/月)

成长发展

85较高

工作内容涉及前沿大模型部署技术,能深度接触多种硬件平台和优化工具,技术成长空间大。

技术前沿前沿/新兴技术
技术栈大模型、LLM、VLM、模型量化、剪枝、知识蒸馏、TensorRT、NeuroPilot
业务类型ambiguous

工作生活

50较低

职位明确要求现场办公,未提及弹性工作或远程,工作灵活性较低。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

70中等

大模型端侧部署应用于智能汽车,属于高速增长领域,但社会影响力相对中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs