Qualcomm logo
高通
Senior Machine Learning Engineer

Senior Machine Learning Engineer

发布于 大约 11 小时前

普通员工/个人贡献者

西安市
专家级经验
全职员工
仅现场办公
本科
性能优化
Generative AI
嵌入式系统
LLM
NPU
LVM
Ai Inference Runtime

AI 估算 · 25k–45k

高通常年招聘高级ML工程师,薪资在西安极具竞争力,结合AI领域热度及技能要求较高。

职位详情

关于这个职位

该职位是高通西安的资深机器学习工程师,专注于生成式AI推理运行时的设计与优化,涉及LLM和多模态模型在嵌入式平台的高效部署

你需要精通C++和AI推理框架,解决系统级性能问题,并与团队协作推动AI技术在边缘场景的落地
适合有深厚AI工程背景、追求技术深度的求职者

最低要求

工程、信息系统、计算机科学或相关领域学士学位,以及2年以上软件工程或相关工作经验

OR
工程、信息系统、计算机科学或相关领域硕士学位,以及1年以上软件工程或相关工作经验
OR
工程、信息系统、计算机科学或相关领域博士学位
年以上使用C、C++、Java、Python等编程语言的学术或工作经验

工作职责

专注于生成式AI推理运行时(Genie)和AI协处理器的关键模块设计与实现,支持边缘和嵌入式平台上复杂模型的高效执行

实现并优化嵌入式及边缘平台上大型语言模型(LLM)和多模态模型的推理,包括执行效率、内存管理和资源利用率改进
设计并优化推理运行时与AI协处理器之间的协作机制,提升整体系统性能和可扩展性
解决生成式AI平台中的系统级性能和稳定性问题
跨团队协作,推动生成式AI推理技术在平台级用例中的应用

优先资格

长期拥有AI推理运行时、AI加速技术或平台级组件经验者优先

有高通NPU部署和开发经验者优先
计算机科学、电子工程或电气与计算机工程硕士学位优先

AI 洞察

优缺点分析

优点

  • 高通是全球领先的半导体和通信公司,平台大,技术积累深厚,尤其在AI芯片和嵌入式领域
  • 该职位聚焦生成式AI前沿技术,涉及LLM和边缘计算,技能保值性强
  • 西安生活成本相对一线城市较低,薪资水平在本地具有竞争力
  • 工作内容技术难度高,需要同时掌握系统级编程和AI推理优化
  • 嵌入式开发调试复杂,需要较强的耐心和问题定位能力
  • 非常适合对生成式AI底层实现有浓厚兴趣、具备扎实C++系统编程和AI推理经验的中高级工程师

缺点 / 挑战

  • 边缘设备资源受限,优化挑战大,可能面临高性能与低功耗的权衡

角色解读

  • 技术路线:高级工程师 → 技术专家(Staff/Principal Engineer) → 架构师,专注于AI推理或系统优化
  • 管理路线:技术领导者(Tech Lead) → 工程经理,带领团队推进AI平台项目
  • 横向发展:可转向AI芯片设计、编译器优化或更广泛的系统软件领域
  • 设计并实现生成式AI推理运行时(Genie)和AI协处理器的核心模块,确保边缘设备上的模型高效运行
  • 对LLM和多模态模型进行推理优化,包括内存管理、执行效率提升和资源调度
  • 解决系统级性能和稳定性问题,推动AI推理技术在平台级场景的落地
  • 精通C++,熟悉Python或Java,具备系统级编程能力
  • 深入理解LLM/LVM推理工作流,有相关系统设计和实现经验
  • 熟悉Android/Linux开发环境,有嵌入式或异构计算平台经验
  • 掌握资源受限环境下的性能、内存和并发优化技术

申请策略

  • 了解高通在AI领域的最新布局(如Snapdragon平台),在面试中展示对业务方向的理解
  • 准备一个端到端的AI推理优化案例,从模型到部署,突出系统思维
  • 突出AI推理运行时或相关系统项目的个人贡献,尤其是性能优化成果
  • 详细列出C++和Python项目经验,特别是嵌入式或Android/Linux平台
  • 如果有Qualcomm NPU或类似硬件加速经验,重点强调
  • 展示对LLM/LVM推理工作流的系统级理解,如模型压缩、内存管理
  • 复习C++11/14/17新特性,熟悉现代C++编程范式
  • 学习Android NDK或Linux内核驱动开发基础知识

面试指南

  • 对于性能优化问题,采用STAR框架(情境、任务、行动、结果),先描述问题背景,再说明具体优化措施(如内存池、算子融合、量化),最后用数据展示提升
  • 对于系统设计问题,先明确约束条件(资源限制、实时性要求),再提出候选方案并权衡利弊,最后给出推荐方案
  • 对于C++语言特性问题,结合具体使用场景解释,避免纯理论背诵
  • 请描述一个你优化过LLM推理性能的项目,具体做了哪些工作,取得了什么效果?
  • 在资源受限的嵌入式设备上,你会如何平衡模型精度和推理速度?
  • 你如何分析并解决多线程并发中的性能瓶颈?请举例
  • 解释C++中的移动语义和完美转发,以及它们在性能优化中的应用
  • 你对高通NPU的架构有什么了解?如何将AI模型映射到NPU上?

匹配度报告

74
综合匹配度

高通西安高级ML工程师,技术前沿、薪资竞争力强,但WLB和办公灵活性一般。

适合人群
最适合追求技术深度和前沿领域成长、能接受现场办公和一定工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值75

薪资福利匹配

80较高

高通常年作为跨国巨头,薪资福利体系完善,在西安属于顶级水准,但JD未明确具体薪资和福利细节,仅可推测。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

90较高

职位涉及生成式AI前沿技术,技能成长空间大;高通提供内部培训和跨团队协作机会,但JD未明确提及晋升通道。

技术前沿前沿/新兴技术
技术栈Generative AI、LLM、LVM、NPU、嵌入式系统、性能优化、C++、Python、Java、Android、Linux
业务类型profit_center

工作生活匹配

50较低

JD未提及弹性工作或远程,按高通惯例可能以现场办公为主,WLB一般。西安办公地点可能在科技园区,通勤尚可。

工作模式未明确
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

75中等

生成式AI是高速增长赛道,高通在边缘AI领域有重要地位,社会影响力中性偏正,但JD未强调使命或社会价值。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs