Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

iFLYTEK logo
科大讯飞
【飞YOUNG实习生】AI研究算法工程师-大模型推理引擎方向
立即应聘

【飞YOUNG实习生】AI研究算法工程师-大模型推理引擎方向

发布于 2 天前

实习/见习

合肥市
无经验要求
实习生
仅现场办公
学历未注明
研究与开发 (研发)
GPU
CUDA
量化
SGLang
vLLM
大模型推理
分布式推理
Flashattention
Pagedattention

AI 估算 · 4k–8k

实习生岗位,合肥地区科大讯飞普遍日薪200-400元,按月估算,技术前沿但无经验要求,薪资中等偏上。

职位详情

关于这个职位

这是一个科大讯飞的AI研究实习生岗位,聚焦大模型推理引擎的研发与优化

你将参与千亿/万亿级模型的推理框架设计、算子加速、分布式部署等核心工作,与业界前沿技术紧密接触
适合对Transformer推理、GPU编程有浓厚兴趣的在校生,能积累大规模系统优化经验

最低要求

深刻理解Transformer推理机制,熟练运用FlashAttention、PagedAttention等主流加速技术,具备超大模型推理性能调优实战经验

熟悉GPU/NPU异构硬件架构,掌握CUDA开发,有昇腾CANN、海光DCU、国产NPU算子开发与平台适配经验者优先
精通C++/Python,具备高性能代码开发能力,熟悉分布式推理通信与调度机制,能独立排查并解决线上推理性能与稳定性问题

工作职责

负责大模型推理框架设计与研发,主导计算图编译、算子融合、动态批处理、推理调度等核心模块优化,持续提升框架通用性与推理性能

深耕Transformer模型推理优化,落地Attention加速、模型量化、KV Cache优化、显存复用等技术,解决超大模型显存溢出、推理延迟高、吞吐低等工程痛点
负责多机多卡分布式推理系统研发,优化张量并行、序列并行及跨设备通信调度,支撑万亿级参数模型分布式高效推理
完成推理引擎及自定义高性能算子在昇腾、海光等国产AI加速卡的适配、迁移与性能调优,搭建国产化高性能推理体系
跟进业界前沿推理技术与开源框架(vLLM/SGLang/TensorRTLLM),完成技术选型、方案落地与技术沉淀,赋能业务高效迭代

优先资格

有昇腾CANN、海光DCU、国产NPU算子开发与平台适配经验者优先

AI 洞察

优缺点分析

优点

  • 处于AI大模型最前沿领域,技术含金量高,快速积累稀缺的推理优化经验
  • 科大讯飞平台大,资源丰富,有机会接触千亿参数模型真实场景
  • 团队技术氛围浓厚,可深度参与开源框架(vLLM等)的改进和贡献
  • 技术门槛高,需要扎实的系统编程和并行计算基础,学习曲线陡峭
  • 实习生转正竞争激烈,需在短时间内产出显著性能优化成果
  • 适合对AI系统底层优化有强烈兴趣、动手能力强、追求技术深度的计算机或相关专业在校生

缺点 / 挑战

  • 工作强度可能较高,大模型迭代快,需要持续跟进前沿论文和工程方案

角色解读

  • 从推理引擎优化入手,逐步成长为AI系统架构师,主导大模型部署方案设计
  • 可向AI芯片编译器、高性能计算、AI Infra等方向拓展,技术纵深广
  • 积累大模型落地经验后,可晋升为技术专家或团队leader,带领攻坚
  • 设计并优化大规模Transformer推理引擎,包括计算图编译、算子融合、动态批处理等核心模块
  • 落地FlashAttention、模型量化、KV Cache等加速技术,解决大模型推理的显存和延迟瓶颈
  • 研发多机多卡分布式推理系统,优化张量并行、序列并行及通信调度,支撑万亿参数模型
  • 完成推理引擎在国产NPU(昇腾、海光)上的适配与性能调优,建设国产化推理体系
  • 深入理解Transformer推理机制,熟悉FlashAttention、PagedAttention等主流加速方法
  • 掌握CUDA编程,有GPU/NPU异构开发经验,能编写高性能算子
  • 精通C++/Python,具备系统级性能优化能力,熟悉分布式通信与调度
  • 了解vLLM、SGLang、TensorRTLLM等开源推理框架,能进行技术选型和落地

申请策略

  • 在简历中量化优化成果(如延迟降低X%,吞吐提升Y倍),体现工程能力
  • 了解科大讯飞的大模型业务方向(如星火大模型),在面试中展示与业务的结合思考
  • 突出Transformer模型推理或部署相关项目经验,如通过量化、剪枝等提升推理速度
  • 强调CUDA编程或算子优化经历,附上GitHub链接或性能数据
  • 展示分布式系统或高性能计算相关竞赛或研究,如并行计算优化案例
  • 系统学习CUDA编程和GPU架构,完成NVIDIA DLI课程或相关项目
  • 动手部署vLLM或TensorRTLLM,尝试修改源码优化一个小算子或调度策略
  • 阅读FlashAttention、PagedAttention等论文,并实现简化版本加深理解

面试指南

  • 先阐述核心原理,再结合具体场景说明如何解决实际痛点,最后量化效果
  • 对于优化类问题,按'问题分析→多种方案对比→选择最优→实现细节'的结构回答
  • 请解释FlashAttention的原理和相比标准Attention的优势
  • 如何优化一个大模型推理的显存占用?请列出至少三种方法
  • 描述CUDA中共享内存的使用场景,并举例说明如何用它优化矩阵乘法
  • 在多机分布式推理中,如何解决通信瓶颈?请给出你的思路
  • 如果让你在vLLM中增加一个新特性(如某算子融合),你会如何设计?
  • 复习Transformer架构和推理优化技术,重点理解FlashAttention、PagedAttention、量化等

职位点评

61
综合评分

科大讯飞大模型推理实习生,前沿技术栈、发展性极强,但薪资一般且需现场高强度投入。

更适合这类人
最适合以技术成长和前沿探索为核心动机的求职者,薪资和WLB相对次要。
表现最好
成长发展
相对薄弱
工作生活
薪资福利50
成长发展95
工作生活40
使命价值60

薪资福利

50较低

实习生薪资处于行业中等水平,福利未明确提及,但科大讯飞作为上市公司有一定保障,整体补偿性一般。

薪资信号未披露(AI估算:4K-8K/月)

成长发展

95较高

工作内容涉及大模型推理最前沿技术,接触万亿级模型优化,技能成长空间极大,且有开源框架跟进,发展性极高。

技术前沿前沿/新兴技术
技术栈Transformer、FlashAttention、PagedAttention、CUDA、分布式推理、量化、vLLM、SGLang、TensorRTLLM、昇腾CANN
成长机会跟进业界前沿推理技术与开源框架
业务类型ambiguous

工作生活

40较低

仅现场办公,合肥科技园,未提及弹性工作或WLB,大概率需高强度投入,生活化动机满足度较低。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值

60中等

大模型推理属于高速增长赛道,但岗位偏向技术工程,社会价值中性,创新程度为积极采用新技术。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

科大讯飞 的其他在招职位

  • 中级采购工程师

    科大讯飞 · 合肥市
    AI 估算 · 10k-15k
  • 【飞YOUNG实习生】AI测试工程师

    科大讯飞 · 合肥市
    AI 估算 · 2k-4k
  • 【飞YOUNG实习生】Harness产品经理

    科大讯飞 · 合肥市
    AI 估算 · 4k-6k
  • 飞凡计划-研发方向(J12884)

    科大讯飞 · 安徽省·合肥市
    AI 估算 · 15k-25k
  • 飞凡计划-营销方向(J12883)

    科大讯飞 · 安徽省·合肥市
    AI 估算 · 10k-15k

相似职位推荐

  • 微信支付-大模型风控算法工程师

    腾讯 · 深圳市
    AI 估算 · 35k-60k
  • 魔方工作室-动作生成算法工程师-角色动画方向

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 运动健康算法工程师-实习-2027届

    小米 · 深圳市
    AI 估算 · 5k-8k
  • Principal Algorithm Engineer

    采埃孚 · 上海市
    AI 估算 · 50k-80k
  • Lead Engineer, Modeling & Simulation

    特灵 · 上海市
    AI 估算 · 25k-40k

科大讯飞 的其他在招职位

  • 中级采购工程师

    科大讯飞 · 合肥市
    AI 估算 · 10k-15k
  • 【飞YOUNG实习生】AI测试工程师

    科大讯飞 · 合肥市
    AI 估算 · 2k-4k
  • 【飞YOUNG实习生】Harness产品经理

    科大讯飞 · 合肥市
    AI 估算 · 4k-6k
  • 飞凡计划-研发方向(J12884)

    科大讯飞 · 安徽省·合肥市
    AI 估算 · 15k-25k
  • 飞凡计划-营销方向(J12883)

    科大讯飞 · 安徽省·合肥市
    AI 估算 · 10k-15k

相似职位推荐

  • 微信支付-大模型风控算法工程师

    腾讯 · 深圳市
    AI 估算 · 35k-60k
  • 魔方工作室-动作生成算法工程师-角色动画方向

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 运动健康算法工程师-实习-2027届

    小米 · 深圳市
    AI 估算 · 5k-8k
  • Principal Algorithm Engineer

    采埃孚 · 上海市
    AI 估算 · 50k-80k
  • Lead Engineer, Modeling & Simulation

    特灵 · 上海市
    AI 估算 · 25k-40k