
现代汽车
大模型端侧部署工程师
大模型端侧部署工程师
发布于 大约 3 小时前普通员工/个人贡献者
上海市
中级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
深度学习
PyTorch
多模态模型
NVIDIA
大语言模型
模型量化
知识蒸馏
TensorRT
剪枝
AI 估算 · 25k–45k
大模型端侧部署技术要求高,市场稀缺,汽车巨头平台薪资有竞争力,综合估算月薪范围。
职位详情
关于这个职位
该职位负责将大语言模型及多模态模型部署到端侧硬件平台(如高通、英伟达),通过剪枝、量化和知识蒸馏等技术优化模型性能,提升推理速度和效率
你将参与前沿技术研究,与算法、硬件团队协作,推动智能驾驶等场景的AI落地
适合有深度学习部署经验、热爱技术挑战的工程师
最低要求
硕士及以上学历,计算机、人工智能等相关专业
两年及以上相关工作经验
熟悉深度学习基本原理,掌握至少一种深度学习框架(如PyTorch、TensorFlow)
熟悉C/C++、Python等编程语言,具备良好的编程基础
熟悉NPU、GPU等SOC的编程,模型网络结构优化以及内存等优化
熟悉模型部署相关流程,如有TensorRT、NeuroPilot/SNPE等工具链使用经验
有大语言模型和多模态大模型工程化部署、模型优化的经验
具备较强的学习能力和动手能力,自我驱动力强
工作职责
针对不同硬件平台(Qualcomm、Nvidia等),进行结构化剪枝、知识蒸馏、模型转换和量化压缩等工作
分析优化模型结构,将LLM、VLM,NLP等模型部署到对应平台,提升模型的推理速度与运算效率
跟进新技术动态,优化现有模型、资源占用,降低推理时延和精度损失,提升模型效果
完成项目相关技术文档的编写和整理
与算法、硬件和供应商等相关团队密切配合,共同推进项目进度
AI 洞察
优缺点分析
优点
- 大模型端侧部署是行业前沿方向,技术稀缺性强,职业发展前景广阔
- 现代汽车作为跨国巨头,平台稳定,资源充足,能接触到多种硬件平台和实际应用场景
- 团队位于上海研发中心,技术氛围浓厚,有机会与顶尖算法和硬件团队合作
- 技术要求全面且深入,需要同时掌握模型压缩、硬件编程和工具链使用,学习曲线陡峭
- 跨部门协作频繁,需要与算法、硬件、供应商等多方沟通,对项目管理能力有一定要求
- 适合有深度学习部署经验、热衷于技术攻坚、希望在AI落地方向深入发展的工程师
缺点 / 挑战
暂无明显挑战项
角色解读
- 成为端侧AI部署专家,主导复杂模型的工程化落地
- 向算法研发方向发展,深入模型压缩与加速算法创新
- 在项目积累中晋升技术主管,带领团队攻克技术难题
- 对不同硬件平台进行模型剪枝、量化和知识蒸馏等压缩优化,降低模型大小和计算量
- 将大语言模型和多模态模型部署到端侧设备,使用TensorRT、NeuroPilot等工具链优化推理速度
- 持续跟踪技术前沿,改进模型结构和资源占用,平衡精度与效率
- 编写技术文档,与算法、硬件及供应商团队协作,确保项目按时交付
- 扎实的深度学习基础知识,熟练使用PyTorch或TensorFlow等框架
- 精通C/C++和Python编程,具备良好的代码优化能力
- 熟悉模型部署工具链(如TensorRT、SNPE)和NPU/GPU编程
- 有实际的大模型或多模态模型部署、量化、剪枝项目经验
申请策略
- 深入了解现代汽车在智能驾驶和AI领域的布局,在面试中展现对汽车行业AI应用的理解
- 准备1-2个完整的部署案例,涵盖从模型压缩到硬件部署的全流程,突出解决问题的方法
- 突出模型部署和优化项目,尤其是大模型或端侧部署的实战经验,用量化、剪枝等技术细节亮明实力
- 强调C/C++和Python的编程能力,并列举使用的工具链(TensorRT、NeuroPilot等)和硬件平台
- 展示团队协作和项目推动成果,如优化后的推理速度提升、精度保持等量化指标
- 系统学习模型量化算法(如PTQ、QAT)和剪枝策略,弥补理论短板
- 熟悉高通SNPE和英伟达TensorRT的官方文档和最佳实践,动手搭建演示Demo
面试指南
- 采用STAR法则(情境、任务、行动、结果)回答项目经验,突出技术选型和量化结果
- 对比不同压缩技术时,先阐述原理,再结合具体场景说明选择依据
- 遇到问题时,展示系统性排查思路:先复现问题、分析瓶颈、逐步调优
- 请你详细描述一个你做过的大模型部署项目,包括压缩方法、工具链和最终效果
- 剪枝和量化的区别是什么?各有什么优缺点?如何在精度和速度之间权衡?
- 在使用TensorRT或NeuroPilot时,你遇到过哪些性能瓶颈?如何优化?
- 如果你的模型在端侧推理时出现较大精度损失,你会如何排查和解决?
- 你如何与算法团队沟通模型结构调整需求?请举例说明
职位点评
69
综合评分
前沿大模型端侧部署岗位,技术成长性强、薪资竞争力好,但现场办公且无明显WLB信号。
更适合这类人
适合追求技术深度与前沿发展、对办公灵活性要求不高的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利70
成长发展85
工作生活50
使命价值70
薪资福利
70中等
薪资未在JD中明确,但该职位技术稀缺,汽车巨头通常提供有竞争力的薪酬福利。
薪资信号未披露(AI估算:25K-45K/月)
成长发展
85较高
工作内容涉及前沿大模型部署技术,能深度接触多种硬件平台和优化工具,技术成长空间大。
技术前沿前沿/新兴技术
技术栈大模型、LLM、VLM、模型量化、剪枝、知识蒸馏、TensorRT、NeuroPilot
业务类型ambiguous
工作生活
50较低
职位明确要求现场办公,未提及弹性工作或远程,工作灵活性较低。
工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)
使命价值
70中等
大模型端侧部署应用于智能汽车,属于高速增长领域,但社会影响力相对中性。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
现代汽车 的其他在招职位
相似职位推荐
Watch Jobs