iFLYTEK logo
科大讯飞
AI研究算法工程师-大模型训推框架优化方向(J12669)

AI研究算法工程师-大模型训推框架优化方向(J12669)

发布于 大约 15 小时前

普通员工/个人贡献者

合肥市
无经验要求
全职员工
仅现场办公
硕士
研究与开发 (研发)
PyTorch
CUDA
量化
分布式训练
大模型
SGLang
vLLM
推理加速
Megatron

AI 估算 · 20k–30k

科大讯飞上市大厂,合肥算法岗硕士起薪约20-30K,13薪,考虑大模型方向溢价,薪资具有竞争力。

职位详情

关于这个职位

该职位主要参与科大讯飞星火大模型的训练与推理框架优化,涉及量化、并行技术、算子优化等前沿技术,支撑云端和嵌入式场景的AI业务

你将接触到vLLM、Megatron等主流框架,并有机会在超大集群上解决实际效率问题
适合对LLM底层技术有热情、具备C++/Python和分布式系统基础的硕士及以上在校生

最低要求

届重点院校硕士及以上学历,计算机、信号处理、自动化、应用数学等相关专业,具备一定的数理统计、模式识别、图像处理等理论知识

推理方向掌握C/C++和数据结构,了解大语言模型,有CUDA/AscendC/BangC等使用经验优先
训练方向掌握Python/Pytorch,了解工程加速技术,掌握大模型并行训练技术优先
对大模型训练和推理框架有使用和掌握者优先,如vLLM、SGLang、Megatron等,有AI芯片效率优化和使用经验者优先
学习能力强,可快速学习掌握新的方案,对LLM的业界新技术和新算法有求知欲

工作职责

负责多个领域的大模型推理加速算法在云端和嵌入式场景研发,包括量化、PD分离、算子优化等技术,支撑讯飞主要的云端和嵌入式推理业务,提升用户体验,降低部署成本

负责多个领域的大模型训练方案的设计和研发,基于超大训练集群,针对不同任务设计高效分布式系统,联合芯片底座优化训练效率,支撑讯飞星火大模型的长时稳定训练
负责跟进业界最前沿技术方案(并行技术、量化技术、MoE算法、稳定性保障等),结合实际任务需求和硬件特性,探索业务落地场景
参与新的大模型结构的设计、性能评估,从训练和推理的成本角度参与模型结构设计和优化

优先资格

有CUDA/AscendC/BangC等使用经验优先

掌握大模型并行训练技术优先
对大模型训练和推理框架有使用和掌握者优先,如vLLM、SGLang、Megatron等
有AI芯片效率优化和使用经验者优先

AI 洞察

优缺点分析

优点

  • 接触业界前沿的大模型训练推理技术(vLLM、Megatron等),技术成长快
  • 科大讯飞平台资源丰富,可参与超大集群训练,积累高价值经验
  • 团队氛围好,鼓励探索创新,有机会发表论文或专利
  • 技术门槛高,需要同时掌握系统、算法、硬件等多领域知识
  • 合肥相比一线城市生活便利性略差,但房价友好

缺点 / 挑战

  • 大规模训练稳定性保障压力大,可能需要值班应对突发问题
  • 适合对系统软件和底层优化有强烈兴趣、自驱力强、喜欢挑战前沿技术难题的硕士/博士在校生

角色解读

  • 技术方向:从框架优化延伸到AI芯片底层优化,成为系统架构师或AI Infra专家
  • 业务方向:深入理解大模型在具体场景(语音、图像等)的落地,转向算法应用研究
  • 管理方向:带领团队负责训练/推理平台建设,晋升技术经理或总监
  • 负责大模型推理加速(量化、算子优化等)在云端和嵌入式场景的落地,提升效率降低成本
  • 设计并优化大模型分布式训练系统,保障星火大模型在超大集群上的稳定训练
  • 跟进业界前沿技术(并行、量化、MoE等),结合硬件特性探索业务应用
  • 参与新模型结构设计,从训练推理成本角度评估优化方案
  • 扎实的C/C++或Python编程能力,熟悉数据结构和算法
  • 了解大模型基本架构,对Transformer、并行策略等有认知
  • 有CUDA/AscendC等GPU编程经验,或使用过vLLM/Megatron等框架
  • 较强的学习能力,能快速掌握新技术并对LLM领域保持热情

申请策略

  • 关注科大讯飞星火大模型的最新进展,面试中能表达对业务的见解会加分
  • 准备好1-2个能体现系统优化能力的项目案例,并数据量化效果
  • 突出C/C++或Python编程项目经历,尤其是涉及性能优化的部分
  • 如果有CUDA或分布式训练相关项目(如用PyTorch DDP/FSDP训练过模型),务必详细描述
  • 强调对大模型的热情,比如复现过LLaMA等模型,或阅读过相关论文
  • 提前学习CUDA编程和GPU架构知识,可以做一些小算子优化练习
  • 熟悉vLLM或Megatron源码,了解其核心设计思路

面试指南

  • 对于技术原理类问题:先定义概念,再说明关键步骤或公式,最后结合实际场景谈优化
  • 对于项目经历类问题:用STAR法则(情境、任务、行动、结果),重点突出行动中的技术选择和效果量化
  • 请解释Transformer中的自注意力机制计算过程,如何优化?
  • 你用过哪些分布式训练框架?谈谈对Megatron-LM或DeepSpeed的理解
  • 如何对一个大模型进行量化?量化后精度损失如何评估?
  • 描述一次你解决性能瓶颈的经历,具体使用了哪些工具和方法?
  • 你知道哪些大模型推理加速技术?对比vLLM和TensorRT-LLM的异同
  • 复习CUDA编程基础和GPU内存层次结构,手写一个简单的kernel

匹配度报告

76
综合匹配度

科大讯飞大模型算法岗,前沿技术栈,高成长性,但WLB一般。

适合人群
该职位最适合追求技术成长和行业影响力的求职者,愿意接受现场办公和一定工作强度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活60
使命价值80

薪资福利匹配

75中等

薪资水平在合肥具有竞争力,作为校招岗位福利齐全,但相比一线互联网大厂仍有差距。

薪资信号未披露(AI估算:20K-30K/月)

成长发展匹配

90较高

岗位技术前沿,涉及大模型核心优化,成长空间极大,且有导师制和内部培训机会。

技术前沿前沿/新兴技术
技术栈大模型、推理加速、CUDA、Python、PyTorch、vLLM、SGLang、Megatron、量化、分布式训练、AscendC
业务类型profit_center

工作生活匹配

60中等

办公地点在合肥高新区,现场办公为主,未提及弹性工作,互联网企业通常有一定加班强度。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

80较高

参与国产大模型建设,推动AI技术落地,社会影响力较大,且行业处于高速增长期。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs