作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题
主要关注比SFT泛化效果更好的强化学习
能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标
能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent
作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案
最好是探索一套通用可扩展的 Agentic Workflow 解决方案