Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

KIA logo
起亚
大模型端侧部署工程师
立即应聘

大模型端侧部署工程师

发布于 大约 14 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
PyTorch
LLM
模型部署
NVIDIA
TensorRT
VLM
Qualcomm
量化压缩

AI 估算 · 25k–45k

大模型部署是当前热门技能,端侧优化需求旺盛;上海一线城市薪资较高,结合行业和公司规模,薪资具有竞争力。

职位详情

关于这个职位

该职位负责将大语言模型(LLM)和多模态模型(VLM)部署到端侧硬件平台(如Qualcomm、Nvidia),通过剪枝、量化、蒸馏等技术优化模型效率,提升推理速度和降低资源占用

你将与算法、硬件及供应商团队协作,推动模型在汽车等场景中的落地应用
适合对AI工程化、嵌入式部署有浓厚兴趣的候选人

最低要求

硕士及以上学历,计算机、人工智能等相关专业

两年及以上相关工作经验
熟悉深度学习基本原理,掌握至少一种深度学习框架(如PyTorch、TensorFlow)
熟悉C/C++、Python等编程语言,具备良好的编程基础
熟悉NPU、GPU等SOC的编程,模型网络结构优化以及内存等优化
熟悉模型部署相关流程,如有TensorRT、NeuroPilot/SNPE等工具链使用经验
有大语言模型和多模态大模型工程化部署、模型优化的经验
具备较强的学习能力和动手能力,自我驱动力强

工作职责

针对不同硬件平台(Qualcomm、Nvidia等),进行结构化剪枝、知识蒸馏、模型转换和量化压缩等工作

分析优化模型结构,将LLM、VLM,NLP等模型部署到对应平台,提升模型的推理速度与运算效率
跟进新技术动态,优化现有模型、资源占用,降低推理时延和精度损失,提升模型效果
完成项目相关技术文档的编写和整理
与算法、硬件和供应商等相关团队密切配合,共同推进项目进度

AI 洞察

优缺点分析

优点

  • 大模型端侧部署是前沿方向,技术壁垒高,未来需求持续增长
  • 起亚与现代汽车集团提供国际化平台,有机会接触多硬件平台和实际车载场景
  • 团队技术氛围浓厚,可紧跟LLM/VLM最新动态
  • 端侧资源受限,需要精细优化,调试难度大
  • 硬件平台迭代快,需持续学习新工具链和芯片架构
  • 汽车行业对稳定性和安全性要求高,项目周期可能较长

缺点 / 挑战

  • 适合对AI工程化有热情、喜欢底层性能优化、乐于接受技术挑战的工程师

角色解读

  • 技术深耕:成为端侧AI部署专家,主导跨平台模型优化
  • 架构方向:转向AI系统工程架构,负责整体推理平台建设
  • 管理方向:带领部署团队,协调算法与硬件资源
  • 将大语言模型(LLM)和多模态模型(VLM)经过剪枝、量化、蒸馏等压缩技术,部署到高通、英伟达等端侧芯片上
  • 优化模型推理速度、显存占用和精度,确保模型在车载等实时场景高效运行
  • 与算法团队和硬件供应商协作,解决部署中遇到的兼容性和性能问题
  • 扎实的深度学习基础,熟悉PyTorch或TensorFlow框架
  • 精通C/C++和Python,具备底层编程能力
  • 熟悉NPU/GPU编程,了解TensorRT、SNPE等部署工具链
  • 有LLM/VLM实际部署或模型优化经验

申请策略

  • 了解起亚与现代汽车在智能座舱和自动驾驶方面的布局,面试中展现对汽车AI场景的理解
  • 准备一个端侧部署的案例,详细描述优化过程与量化结果
  • 重点展示大模型部署项目的完整经历,包括模型压缩、工具链使用和最终性能指标
  • 突出C/C++与Python混合编程能力,以及NPU/GPU优化经验
  • 如有开源贡献或相关技术博客,务必呈现
  • 提前熟悉TensorRT和Qualcomm SNPE/NeuroPilot工具链
  • 动手实践LLM/VLM的量化(如GPTQ、AWQ)和剪枝方法

面试指南

  • 采用STAR方法:背景、任务、行动、结果,强调量化指标(如推理时延降低X%,精度损失Y%)
  • 从数据流、算子映射、内存带宽等维度分析性能瓶颈,给出系统化优化方案
  • 请详细描述一次你完成的大模型端侧部署项目,包括压缩方法、工具链和最终效果
  • 如何平衡模型推理速度、精度和资源占用?请举例说明
  • TensorRT和SNPE在量化策略上有何异同?如何选择?
  • 如果你在部署时发现模型在NPU上运行比GPU慢,你会如何分析并优化?
  • 复习模型压缩理论(剪枝、量化、蒸馏)和常见工具链API
  • 准备2-3个部署案例,涵盖不同硬件平台或模型类型

匹配度报告

70
综合匹配度

前沿大模型部署岗位,技术成长空间大,薪资有竞争力,但WLB一般。

适合人群
最看重技术成长和前沿领域,能接受现场办公和一定工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展85
工作生活60
使命价值65

薪资福利匹配

70中等

薪资较高且福利完善,但JD未明确薪资范围,需面议。

薪资信号面议 (25K-45K/月)

成长发展匹配

85较高

职位涉及前沿大模型部署技术,技能成长空间大,但JD未明确晋升路径。

技术前沿前沿/新兴技术
技术栈LLM、VLM、TensorRT、Quantization、Pruning
业务类型ambiguous

工作生活匹配

60中等

仅现场办公,未提及弹性工时,可能涉及一定强度的项目周期。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

65中等

汽车行业智能化转型带来社会价值,但JD未强调使命感。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

起亚 的其他在招职位

  • AI融合技术工程师

    起亚 · 烟台市
    AI 估算 · 6k-12k
  • 高级仪表HUD设计发布工程师

    起亚 · 上海市
    AI 估算 · 25k-45k
  • (实习)人事支援

    起亚 · 北京市
    AI 估算 · 3k-5k
  • (社招)电池包安全结构设计工程师

    起亚 · 烟台市
    AI 估算 · 15k-25k
  • (校/社招)资金管理-出纳

    起亚 · 北京市
    AI 估算 · 6k-10k

相似职位推荐

  • 番茄模型运维(后端方向)-CQC

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 云平台架构负责人/架构师-Data

    字节跳动 · 上海市
    AI 估算 · 40k-80k
  • 营销算法工程师-文娱行业(深圳/北京)

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 测试开发工程师-生活服务(商家平台)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 资深前端研发工程师-流量与内容

    字节跳动 · 上海市
    AI 估算 · 25k-45k

起亚 的其他在招职位

  • AI融合技术工程师

    起亚 · 烟台市
    AI 估算 · 6k-12k
  • 高级仪表HUD设计发布工程师

    起亚 · 上海市
    AI 估算 · 25k-45k
  • (实习)人事支援

    起亚 · 北京市
    AI 估算 · 3k-5k
  • (社招)电池包安全结构设计工程师

    起亚 · 烟台市
    AI 估算 · 15k-25k
  • (校/社招)资金管理-出纳

    起亚 · 北京市
    AI 估算 · 6k-10k

相似职位推荐

  • 番茄模型运维(后端方向)-CQC

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 云平台架构负责人/架构师-Data

    字节跳动 · 上海市
    AI 估算 · 40k-80k
  • 营销算法工程师-文娱行业(深圳/北京)

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 测试开发工程师-生活服务(商家平台)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 资深前端研发工程师-流量与内容

    字节跳动 · 上海市
    AI 估算 · 25k-45k