硬件架构选型与设计:根据公司AI业务场景(大模型训练、AIGC、推荐系统等),主导GPU/AI加速器的架构评估与选型决策,制定符合业务需求的解决方案
性能评估与优化:深入研究AI算法(深度学习、CV、NLP、多模态等)的计算特征,建立GPU/异构硬件的性能评测体系,输出优化建议并推动落地,提升训练与推理效率
技术趋势洞察:跟踪多元GPU/AI芯片的技术演进,结合公司业务战略,规划硬件技术路线图
软硬件协同优化:与算法团队、系统团队深度协作,开展算子优化、显存优化、通信优化等工作,打通从算法需求到硬件性能的全链路
技术方案落地:撰写技术方案文档,推动硬件选型决策的标准化与规模化复制,支持AI业务快速迭代