基于 LLM 与 Agent 框架,构建能够理解工程师需求并自动生成高性能 DSL Kernel 代码的智能体原型,覆盖任务拆解、工具调用与多轮推理等核心能力
将需求理解、代码生成与验证反馈串联为可迭代的工作流,通过 Profiling 数据分析定位瓶颈,推动 Agent 系统在真实场景下的落地效果持续提升
将生成的 Kernel 自动接入现有训练/推理框架,覆盖算子注册、显存管理、通信原语嵌入等工程环节,形成端到端的集成链路
参与芯片 DSL 核心模块的设计与开发,抽象数据搬移以及计算通信语义,为上层 Kernel 编写提供更简洁、灵活的表达能力