工作职责: 1、负责 Ai infra相关技术的研发与优化,重点围绕大模型训练、推理、部署等环节,搭建高效、稳定、可扩展的技术架构,保障大模型在实际应用中的性能与效率
2、深入研究大模型底层技术原理,包括但不限于分布式训练框架(如 Megatron - LM、DeepSpeed 等)、模型压缩与加速技术(如量化、剪枝、蒸馏)、推理引擎优化等,解决大模型在大规模数据处理和高并发场景下的技术难题
3、参与大模型基础设施的规划与建设,涵盖计算资源(GPU、TPU 等)管理、存储系统优化、网络架构设计等,提升资源利用率,降低大模型研发与应用的成本
4、与算法团队、业务团队紧密协作,理解业务需求,将 Ai infra 技术与实际业务场景深度融合,为大模型在各业务领域的落地提供坚实的技术支撑,例如为智能推荐、自然语言处理、计算机视觉等业务场景定制专属的大模型基础设施解决方案