大模型推理研发实习生(J98277)

🤖 AI 估测:¥8K-15K

发布时间:5 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型推理性能优化的实习岗位
你将参与百度文心大模型及飞桨深度学习平台推理框架的设计、开发与优化工作,涉及CPU/GPU深度优化、前瞻技术调研以及异构高性能计算平台研发
该职位要求你具备扎实的C++/Python和CUDA编程能力,并对AI算法和主流框架有深入理解

工作职责

负责百度文心大模型的推理性能优化
参与飞桨深度学习平台(PaddlePaddle)推理框架的设计、开发和业务支持
负责深度学习框架的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作
负责深度学习推理框架前瞻技术的跟踪调研,实现技术创新突破
参与深度学习框架的易用性优化工作,使开发者能够以更简单的方式实现各类任务,降低学习成本和开发成本
负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化

最低要求

热爱编程,精通C++/Python,精通CUDA编程
具有独立开发能力,精通计算机体系结构,有汇编级别开发经验,对AI算法和主流框架有丰富的应用或开发经验
了解FlashAttention、PagedAttention、MoE、Chunked Prefill 等大模型核心技术
掌握大模型量化(如 AWQ、GPTQ等)、稀疏(如DSA、SWA等)、投机解码(如Egale系列)等加速技术
了解大模型通信算子(如Allreduce 等)及计算通信 overlap 实现
有分离式部署(PD分离)开发经验
软素质:
目标驱动,并有探索精神
团队协作及沟通能力
具备分析和解决问题的能力
有极强的学习能力和知识迁移能力

👍优先资格

精通PaddlePaddle、Pytorch等主流开源框架,做过源码级优化移植等工作,有vLLM、SGLang、TensorRT-LLM等大模型推理框架的使用或优化经验