负责游戏创作场景下Agent的架构设计与效果优化,优化工具调用、上下文管理、任务分解链路,提升端到端创作成功率与可控性
探索Agentic RL与Post-Training在游戏开发领域的应用,构建CodeRL、Reward System等Agentic RL Infra
通过SFT、RLHF、DPO等手段对模型进行游戏创作领域任务的后训练
构建面向游戏开发全流程的Context Engineering系统,设计并落地游戏项目级上下文管理方案:包括但不限于资产库索引、关卡布局语义化表示、设计文档/策划案的结构化召回、历史修改记录的压缩与注入等,确保Agent在长链路任务中的准确性
搭建端到端Agent评测体系与数据闭环,定义游戏创作场景的自动/半自动评估指标
探索日志回放、用户行为反馈转训练数据、模型与数据共进化的Self-Improving机制
持续跟踪LLM、多模态、Multi-Agent、Code Generation、AI游戏开发工具链前沿进展,能够将前沿技术落地至项目,形成专利/论文/方法论沉淀