负责Post-training工具链开发: 负责千帆MAAS平台大模型SFT、蒸馏、强化学习(RL)等后训练环节的工具链开发,提升大规模训练的稳定性与执行效率
负责RLaaS能力落地: 参与“强化学习即服务(RLaaS)”的方案调研与实现,通过解耦算力资源与算法逻辑,让内外部客户能够高效低成本在自身业务数据上启动高效率的 RL 训练
提升平台易用性与扩展性: 快速定位并解决用户线上问题,将高频业务需求沉淀为平台通用功能,通过组件化设计优化工具链的复用性
前沿技术落地: 跟踪调研业内主流后训练技术,负责将其转化为平台核心能力,保持产品的技术领先性