重点参与大规模作业下的网络故障诊断与性能调优,快速定位分布式环境中的节点与通信问题
参与设计并研发面向AI训练、推理及数据传输的高性能网络系统,提升多节点分布式任务的通信效率与稳定性
负责用户态网络协议栈、零拷贝通信、网络IO加速等关键组件的实现与调优,深入底层进行性能挖掘
跟踪并整合先进硬件能力(如智能网卡、RDMA等),对接驱动与固件层,实现网络通信的极致优化
构建高性能网络与平台系统的深度融合机制,提升系统整体可观测性与运维效率
探索并推动高速网络技术的创新,持续降低通信延迟、提升带宽利用率