深度参与数据中心网络架构设计工作,完成从网络规划到建设交付的全流程,结合公司业务发展节奏,助力网络性能的持续优化与迭代
参与数据中心交换机、路由器、负载均衡等网络设备的日常运维,涵盖事件响应、应急处理,以及网络带宽使用分析与调优,保障网络稳定运行
负责数据中心AI场景下GPU集群通信架构设计与开发,优化多卡/多机通信性能,提升分布式训练效率
研究并实现GPU与网络设备的协同工作,解决通信延时、带宽瓶颈等关键问题
跟进网络前沿技术(如SDN、IPv6、RDMA等),基于业务需求开展技术调研、方案设计,推动新技术在数据中心网络场景落地应用,为业务创新提供网络技术支撑
配合团队收集、整理网络基础数据,参与网络健康度分析、故障率与容量水位等运营数据梳理,助力优化线下工程流程,提升整体网络运营效率