基于前沿 SOTA 模型训练与推理优化原理,深入理解模型结构与设计理念,将训练与推理优化方法工程化落地,为客户提供系统化的加速解决方案,提升整体训练及推理效率
面向自研芯片适配主流大模型,基于深度学习训练/推理框架特性开发或调优关键算子,持续提升模型在芯片上的性能与精度表现,并为客户提供芯片选型与应用支持
负责面向 CPU/GPU/ASIC 等多元计算架构的通用编译系统设计、编译优化及相关前沿技术攻关
跟踪业界前沿技术发展,参与 LLM、强化学习、Agent 等开源社区建设,参与原创算法或系统方向探索