与算法团队深度协作,参与 下一代 GLM 大模型架构设计与系统实现,推动模型结构与系统效率的协同优化
构建 大模型推理成本分析与模拟系统,从算力、通信、KV cache、并行策略等维度优化推理效率
设计与优化 超大规模训练基础设施(万卡级),提升训练稳定性、资源利用率与训练效率
探索 MoE、Sparse Attention、长上下文等新架构在训练与推理系统中的高效落地
你将参与
下一代 GLM 系列基础模型(百亿到万亿参数级) 的系统设计
万卡规模训练系统 的优化与稳定性工程
推理系统的 极致效率优化(吞吐 / 延迟 / 成本)
新型模型结构(MoE / Sparse Attention / 长上下文)的 系统级实现与优化