Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Intel logo
英特尔
AI Software Engineer Intern
立即应聘

AI Software Engineer Intern

发布于 大约 16 小时前

实习/见习

上海市
无经验要求
实习生
仅现场办公
硕士
分布式系统
PyTorch
LLM
CUDA
GPU编程
vLLM
TensorRT-LLM
MoE

AI 估算 · 5k–10k

英特尔上海实习,硕士/博士在读,岗位技术难度高,薪资在大厂实习中处于中等偏上水平。

职位详情

关于这个职位

这是一个在英特尔上海的AI软件工程师实习岗位,专注于构建下一代大语言模型(LLM)推理系统,涉及模型优化、运行时性能和系统级设计

你将研究前沿论文并实现优化技术,包括GPU内核与运行时优化(Triton/CUDA)、MoE系统以及端到端推理系统开发
适合对LLM推理性能有强烈兴趣的硕士或博士在读学生

最低要求

硕士或博士在读(计算机科学、电子工程或相关领域)

扎实的编程技能(必须掌握 Python)
熟悉 PyTorch 和 Transformer 模型
扎实的算法和系统基础
至少可实习6个月(短期不考虑)

工作职责

研究与原型开发:阅读并复现前沿工作(LLM推理、MoE、系统),将思路转化为可工作的优化实现,识别瓶颈并迭代超越基线性能

LLM推理优化:实现和评估连续/动态批处理、KV缓存优化与内存管理、推测解码、Flash/Paged Attention、量化(INT8/FP8/低比特)等技术,优化延迟、吞吐量和GPU利用率
MoE(混合专家)系统:探索稀疏模型的高效推理,包括路由策略与负载均衡、专家并行与分片、通信与计算权衡,提升MoE推理的可扩展性和效率
内核与运行时优化:使用现代方法(Triton类编程模型、CUDA或等效底层框架)开发和优化GPU内核,研究内存访问模式与布局优化、算子融合与内核效率、张量工作负载的编译器风格优化,比较不同内核/运行时策略并集成到系统中
端到端推理系统开发:构建和优化完整的推理栈,包括模型执行层(vLLM、TensorRT-LLM或类似)、运行时调度与批处理、跨GPU/节点的分布式推理,工作内容涉及多GPU/多节点扩展、NCCL/通信优化、系统级性能调优

优先资格

具备以下一项或多项经验:

GPU 编程(CUDA、Triton 或类似技术)
LLM 推理框架(vLLM、TensorRT-LLM、FasterTransformer)
分布式系统或并行计算
了解:
GPU 架构和性能分析
量化或模型优化
MoE 或大规模模型系统

AI 洞察

优缺点分析

  • 前沿技术栈:直接接触LLM推理、MoE、GPU最新优化技术,技术含金量高
  • 大厂平台:英特尔全球资源,有机会参与顶级AI系统研发,积累项目经验
  • 技能全面:覆盖从模型层到硬件层的全栈优化,锻炼系统性思维
  • 技术难度大:需要同时掌握算法、系统和硬件知识,学习曲线陡峭
  • 工作强度预期:涉及性能调优和论文复现,可能需要投入大量时间进行实验
  • 竞争压力:岗位对学历和研究能力要求高,候选人多为顶尖高校硕博
  • 适合对LLM推理性能有强烈好奇心和钻研精神、喜欢系统性解决复杂问题的硕博在读学生

角色解读

  • 技术深耕路径:从实习生成长为LLM推理系统专家,可转向AI编译器、高性能计算方向
  • 架构师路径:积累系统设计与优化经验,未来成为分布式AI系统的架构师
  • 研究型路径:结合学术前沿与工程实践,可向AI研究员或科学家方向发展
  • 研究并复现LLM推理、MoE等前沿论文,将其转化为实际代码并优化性能
  • 开发和优化GPU内核,使用Triton或CUDA实现高效的并行计算
  • 参与端到端推理系统构建,包括模型部署、运行时调度和分布式扩展
  • 进行性能调优,分析并改进内存访问、算子融合和通信开销
  • 扎实的Python编程能力,熟悉PyTorch和Transformer架构
  • 熟悉GPU编程(CUDA或Triton),理解GPU架构和性能分析
  • 掌握LLM推理框架(如vLLM、TensorRT-LLM)或分布式系统知识
  • 具备系统级优化思维,能够从算法到硬件层面进行性能调优

申请策略

  • 在简历中体现从论文到实现的闭环能力,展示一个完整的优化案例
  • 面试前准备好自我介绍,突出对高性能计算和LLM系统的热情
  • 突出GPU编程经验(CUDA/Triton)和性能优化项目,如实现过算子融合或加速
  • 展示对LLM推理框架的理解,如使用vLLM部署或调优经历
  • 强调学术能力:发表过相关论文或复现过前沿模型,附上GitHub链接
  • 体现系统思维:分布式训练或推理、通信优化等经验
  • 提前学习Triton编程模型和CUDA优化技巧,熟悉NVIDIA Nsight等性能分析工具
  • 深入了解LLM推理的常见优化方法(如FlashAttention、PagedAttention、量化)

面试指南

  • 从问题背景入手,再解释核心概念和实现细节,最后强调性能收益
  • 结合系统思维,说明设计选择(如内存、通信、计算)的权衡
  • 给出具体的代码或伪代码结构,展示实际编程能力
  • 请解释FlashAttention的原理及其优势
  • 如何在GPU上高效实现一个稀疏MoE层的前向传播?
  • 描述一个你优化过的PyTorch模型,用了哪些技术?
  • 对比vLLM和TensorRT-LLM的架构差异
  • 如何处理LLM推理中的KV缓存内存管理?

匹配度报告

69
综合匹配度

顶尖大厂实习,前沿LLM推理技术,高成长性,但需现场办公且工作强度较大。

适合人群
最适合追求技术前沿和快速成长的求职者,愿意投入时间攻克技术难题,对薪资和WLB要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利55
成长发展95
工作生活40
使命价值85

薪资福利匹配

55较低

薪资未在JD中披露,但作为实习岗位,英特尔提供行业内中等偏上的待遇;福利信息未提及,补偿性动机满足一般。

薪资信号未披露 (5K-10K/月)

成长发展匹配

95较高

该岗位聚焦LLM推理前沿技术,涉及GPU优化、MoE和系统级设计,技能成长空间极大;有明确的技术研究和工程实践结合,发展性动机高度满足。

技术前沿前沿/新兴技术
技术栈LLM、GPU编程、CUDA、Triton、MoE、分布式系统
业务类型profit_center

工作生活匹配

40较低

要求现场办公,且JD未提及弹性工作或WLB,工作内容涉及高强度性能调优,生活化动机满足较低。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

85较高

LLM推理是当前AI基础设施的核心方向,行业高速增长,岗位可能推动AI系统效率提升,具有较强的前沿技术使命感。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英特尔 的其他在招职位

  • AI Software Engineer Intern

    英特尔 · 上海市
    AI 估算 · 5k-10k
  • AI Software Engineer Intern

    英特尔 · 上海市
    AI 估算 · 8k-15k
  • Software Solutions Engineering Intern

    英特尔 · 北京市
    AI 估算 · 5k-10k
  • AI Software Engineer Intern

    英特尔 · 上海市
    AI 估算 · 6k-12k
  • Project Controls Engineer

    英特尔 · 成都市
    AI 估算 · 20k-35k

相似职位推荐

  • 后台开发工程师

    中国平安 · 深圳市
    AI 估算 · 25k-40k
  • 后端开发工程师(全栈开发岗)

    中国平安 · 深圳市
    AI 估算 · 20k-35k
  • 高级网络库SDK开发工程师

    快手 · 北京市
    AI 估算 · 35k-60k
  • 后端开发工程师——沈阳

    中国平安 · 沈阳市
    AI 估算 · 20k-35k
  • Java开发工程师

    中国平安 · 西宁市
    AI 估算 · 8k-15k

英特尔 的其他在招职位

  • AI Software Engineer Intern

    英特尔 · 上海市
    AI 估算 · 5k-10k
  • AI Software Engineer Intern

    英特尔 · 上海市
    AI 估算 · 8k-15k
  • Software Solutions Engineering Intern

    英特尔 · 北京市
    AI 估算 · 5k-10k
  • AI Software Engineer Intern

    英特尔 · 上海市
    AI 估算 · 6k-12k
  • Project Controls Engineer

    英特尔 · 成都市
    AI 估算 · 20k-35k

相似职位推荐

  • 后台开发工程师

    中国平安 · 深圳市
    AI 估算 · 25k-40k
  • 后端开发工程师(全栈开发岗)

    中国平安 · 深圳市
    AI 估算 · 20k-35k
  • 高级网络库SDK开发工程师

    快手 · 北京市
    AI 估算 · 35k-60k
  • 后端开发工程师——沈阳

    中国平安 · 沈阳市
    AI 估算 · 20k-35k
  • Java开发工程师

    中国平安 · 西宁市
    AI 估算 · 8k-15k