起亚的大模型端侧部署工程师薪资是多少？

该职位薪资范围为 25k–45k（人民币/月）。

大模型端侧部署工程师的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

起亚的大模型端侧部署工程师有什么任职要求？

该职位要求本科学历及中级经验工作经验。

起亚

大模型端侧部署工程师

立即应聘

大模型端侧部署工程师

发布于大约 2 个月前

普通员工/个人贡献者

上海市

中级经验

全职员工

仅现场办公

本科

软件工程

Qualcomm

模型部署

量化压缩

LLM

NVIDIA

PyTorch

TensorRT

VLM

AI 估算 · 25k–45k

大模型部署是当前热门技能，端侧优化需求旺盛；上海一线城市薪资较高，结合行业和公司规模，薪资具有竞争力。

职位详情

关于这个职位

该职位负责将大语言模型（LLM）和多模态模型（VLM）部署到端侧硬件平台（如Qualcomm、Nvidia），通过剪枝、量化、蒸馏等技术优化模型效率，提升推理速度和降低资源占用

你将与算法、硬件及供应商团队协作，推动模型在汽车等场景中的落地应用

适合对AI工程化、嵌入式部署有浓厚兴趣的候选人

最低要求

硕士及以上学历，计算机、人工智能等相关专业

两年及以上相关工作经验

熟悉深度学习基本原理，掌握至少一种深度学习框架(如PyTorch、TensorFlow)

熟悉C/C++、Python等编程语言，具备良好的编程基础

熟悉NPU、GPU等SOC的编程，模型网络结构优化以及内存等优化

熟悉模型部署相关流程，如有TensorRT、NeuroPilot/SNPE等工具链使用经验

有大语言模型和多模态大模型工程化部署、模型优化的经验

具备较强的学习能力和动手能力，自我驱动力强

工作职责

针对不同硬件平台(Qualcomm、Nvidia等)，进行结构化剪枝、知识蒸馏、模型转换和量化压缩等工作

分析优化模型结构，将LLM、VLM，NLP等模型部署到对应平台，提升模型的推理速度与运算效率

跟进新技术动态，优化现有模型、资源占用，降低推理时延和精度损失，提升模型效果

完成项目相关技术文档的编写和整理

与算法、硬件和供应商等相关团队密切配合，共同推进项目进度

AI 洞察

优缺点分析

优点

大模型端侧部署是前沿方向，技术壁垒高，未来需求持续增长
起亚与现代汽车集团提供国际化平台，有机会接触多硬件平台和实际车载场景
团队技术氛围浓厚，可紧跟LLM/VLM最新动态
端侧资源受限，需要精细优化，调试难度大
硬件平台迭代快，需持续学习新工具链和芯片架构
汽车行业对稳定性和安全性要求高，项目周期可能较长

缺点 / 挑战

适合对AI工程化有热情、喜欢底层性能优化、乐于接受技术挑战的工程师

角色解读

技术深耕：成为端侧AI部署专家，主导跨平台模型优化
架构方向：转向AI系统工程架构，负责整体推理平台建设
管理方向：带领部署团队，协调算法与硬件资源
将大语言模型（LLM）和多模态模型（VLM）经过剪枝、量化、蒸馏等压缩技术，部署到高通、英伟达等端侧芯片上
优化模型推理速度、显存占用和精度，确保模型在车载等实时场景高效运行
与算法团队和硬件供应商协作，解决部署中遇到的兼容性和性能问题
扎实的深度学习基础，熟悉PyTorch或TensorFlow框架
精通C/C++和Python，具备底层编程能力
熟悉NPU/GPU编程，了解TensorRT、SNPE等部署工具链
有LLM/VLM实际部署或模型优化经验

申请策略

了解起亚与现代汽车在智能座舱和自动驾驶方面的布局，面试中展现对汽车AI场景的理解
准备一个端侧部署的案例，详细描述优化过程与量化结果
重点展示大模型部署项目的完整经历，包括模型压缩、工具链使用和最终性能指标
突出C/C++与Python混合编程能力，以及NPU/GPU优化经验
如有开源贡献或相关技术博客，务必呈现
提前熟悉TensorRT和Qualcomm SNPE/NeuroPilot工具链
动手实践LLM/VLM的量化（如GPTQ、AWQ）和剪枝方法

面试指南

采用STAR方法：背景、任务、行动、结果，强调量化指标（如推理时延降低X%，精度损失Y%）
从数据流、算子映射、内存带宽等维度分析性能瓶颈，给出系统化优化方案
请详细描述一次你完成的大模型端侧部署项目，包括压缩方法、工具链和最终效果
如何平衡模型推理速度、精度和资源占用？请举例说明
TensorRT和SNPE在量化策略上有何异同？如何选择？
如果你在部署时发现模型在NPU上运行比GPU慢，你会如何分析并优化？
复习模型压缩理论（剪枝、量化、蒸馏）和常见工具链API
准备2-3个部署案例，涵盖不同硬件平台或模型类型

职位点评

综合评分

前沿大模型部署岗位，技术成长空间大，薪资有竞争力，但WLB一般。

更适合这类人

最看重技术成长和前沿领域，能接受现场办公和一定工作强度的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利70

成长发展85

工作生活60

使命价值65

薪资福利

70中等

薪资较高且福利完善，但JD未明确薪资范围，需面议。

薪资信号面议 (25K-45K/月)

成长发展

85较高

职位涉及前沿大模型部署技术，技能成长空间大，但JD未明确晋升路径。

技术前沿前沿/新兴技术

技术栈LLM、VLM、TensorRT、Quantization、Pruning

业务类型ambiguous

工作生活

60中等

仅现场办公，未提及弹性工时，可能涉及一定强度的项目周期。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

65中等

汽车行业智能化转型带来社会价值，但JD未强调使命感。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

起亚

大模型端侧部署工程师

立即应聘

大模型端侧部署工程师

发布于大约 2 个月前

普通员工/个人贡献者

上海市

中级经验

全职员工

仅现场办公

本科

软件工程

Qualcomm

模型部署

量化压缩

LLM

NVIDIA

PyTorch

TensorRT

VLM

AI 估算 · 25k–45k

大模型部署是当前热门技能，端侧优化需求旺盛；上海一线城市薪资较高，结合行业和公司规模，薪资具有竞争力。

职位详情

关于这个职位

你将与算法、硬件及供应商团队协作，推动模型在汽车等场景中的落地应用

适合对AI工程化、嵌入式部署有浓厚兴趣的候选人

最低要求

硕士及以上学历，计算机、人工智能等相关专业

两年及以上相关工作经验

熟悉深度学习基本原理，掌握至少一种深度学习框架(如PyTorch、TensorFlow)

熟悉C/C++、Python等编程语言，具备良好的编程基础

熟悉NPU、GPU等SOC的编程，模型网络结构优化以及内存等优化

熟悉模型部署相关流程，如有TensorRT、NeuroPilot/SNPE等工具链使用经验

有大语言模型和多模态大模型工程化部署、模型优化的经验

具备较强的学习能力和动手能力，自我驱动力强

工作职责

针对不同硬件平台(Qualcomm、Nvidia等)，进行结构化剪枝、知识蒸馏、模型转换和量化压缩等工作

分析优化模型结构，将LLM、VLM，NLP等模型部署到对应平台，提升模型的推理速度与运算效率

跟进新技术动态，优化现有模型、资源占用，降低推理时延和精度损失，提升模型效果

完成项目相关技术文档的编写和整理

与算法、硬件和供应商等相关团队密切配合，共同推进项目进度

AI 洞察

优缺点分析

优点

大模型端侧部署是前沿方向，技术壁垒高，未来需求持续增长
起亚与现代汽车集团提供国际化平台，有机会接触多硬件平台和实际车载场景
团队技术氛围浓厚，可紧跟LLM/VLM最新动态
端侧资源受限，需要精细优化，调试难度大
硬件平台迭代快，需持续学习新工具链和芯片架构
汽车行业对稳定性和安全性要求高，项目周期可能较长

缺点 / 挑战

适合对AI工程化有热情、喜欢底层性能优化、乐于接受技术挑战的工程师

角色解读

技术深耕：成为端侧AI部署专家，主导跨平台模型优化
架构方向：转向AI系统工程架构，负责整体推理平台建设
管理方向：带领部署团队，协调算法与硬件资源
将大语言模型（LLM）和多模态模型（VLM）经过剪枝、量化、蒸馏等压缩技术，部署到高通、英伟达等端侧芯片上
优化模型推理速度、显存占用和精度，确保模型在车载等实时场景高效运行
与算法团队和硬件供应商协作，解决部署中遇到的兼容性和性能问题
扎实的深度学习基础，熟悉PyTorch或TensorFlow框架
精通C/C++和Python，具备底层编程能力
熟悉NPU/GPU编程，了解TensorRT、SNPE等部署工具链
有LLM/VLM实际部署或模型优化经验

申请策略

了解起亚与现代汽车在智能座舱和自动驾驶方面的布局，面试中展现对汽车AI场景的理解
准备一个端侧部署的案例，详细描述优化过程与量化结果
重点展示大模型部署项目的完整经历，包括模型压缩、工具链使用和最终性能指标
突出C/C++与Python混合编程能力，以及NPU/GPU优化经验
如有开源贡献或相关技术博客，务必呈现
提前熟悉TensorRT和Qualcomm SNPE/NeuroPilot工具链
动手实践LLM/VLM的量化（如GPTQ、AWQ）和剪枝方法

面试指南

采用STAR方法：背景、任务、行动、结果，强调量化指标（如推理时延降低X%，精度损失Y%）
从数据流、算子映射、内存带宽等维度分析性能瓶颈，给出系统化优化方案
请详细描述一次你完成的大模型端侧部署项目，包括压缩方法、工具链和最终效果
如何平衡模型推理速度、精度和资源占用？请举例说明
TensorRT和SNPE在量化策略上有何异同？如何选择？
如果你在部署时发现模型在NPU上运行比GPU慢，你会如何分析并优化？
复习模型压缩理论（剪枝、量化、蒸馏）和常见工具链API
准备2-3个部署案例，涵盖不同硬件平台或模型类型

职位点评

综合评分

前沿大模型部署岗位，技术成长空间大，薪资有竞争力，但WLB一般。

更适合这类人

最看重技术成长和前沿领域，能接受现场办公和一定工作强度的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利70

成长发展85

工作生活60

使命价值65

薪资福利

70中等

薪资较高且福利完善，但JD未明确薪资范围，需面议。

薪资信号面议 (25K-45K/月)

成长发展

85较高

职位涉及前沿大模型部署技术，技能成长空间大，但JD未明确晋升路径。

技术前沿前沿/新兴技术

技术栈LLM、VLM、TensorRT、Quantization、Pruning

业务类型ambiguous

工作生活

60中等

仅现场办公，未提及弹性工时，可能涉及一定强度的项目周期。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

65中等

汽车行业智能化转型带来社会价值，但JD未强调使命感。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

大模型端侧部署工程师

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

大模型端侧部署工程师

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

起亚 的其他在招职位

高级智能座舱大数据分析架构师

车辆控制软件开发工程师（VMC）

（社招）CCS服务/业务运营

（校/社招）商品战略企划

自动驾驶数据仿真平台架构师

相似职位推荐

Industrial Engineering ES

专家工程师（MPT）

高级软件开发工程师-配送引擎

资深研发工程师（商品&商家）

高级golang研发工程师

起亚 的其他在招职位

高级智能座舱大数据分析架构师

车辆控制软件开发工程师（VMC）

（社招）CCS服务/业务运营

（校/社招）商品战略企划

自动驾驶数据仿真平台架构师

相似职位推荐

Industrial Engineering ES

专家工程师（MPT）

高级软件开发工程师-配送引擎

资深研发工程师（商品&商家）

高级golang研发工程师

起亚的其他在招职位

起亚的其他在招职位