大模型异构训练推理研发工程师(J98932)

🤖 AI 估测:¥25K-40K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

该职位专注于大模型在国产GPU上的训练与推理优化,是AI基础设施领域的前沿技术岗位
你将负责从底层硬件适配到上层框架优化的全链路工作,为大模型的国产化落地提供核心技术支持

工作职责

大模型在国产GPU上的训练和推理的优化
大模型在国产GPU芯片的软硬件平台和算子的加速优化
AI大模型推训优化的前沿技术研究和产品落地
搭建与维护评估基础设置,为大模型推训提供快速且准确的评估反馈

最低要求

本科及以上学历,计算机相关专业,27届毕业生优先,表现优异者有转正机会
优秀的编码能力,熟悉Python/C/C++至少一项,有扎实的算法及数据结构基础,有良好的编程习惯
熟悉容器工作原理,容器运行时、容器网络等技术
熟悉PyTorch,了解Megatron、vLLM等大模型训推框架,做过测试、开发等工作
有独立的分析问题和解决问题的能力,有强烈的责任心,较强的学习能力和沟通能力

👍优先资格

对GPU芯片架构有一定了解者优先,有大规模训练推理实践经验者优先
具备以下至少一个领域的深度实践经验优先:推理优化:负载均衡、模型压缩(蒸馏/量化)、缓存策略、异构计算加速
训练优化:分布式训练、显存优化(如Zero/Offload)、混合精度、MoE架构调优