参与抖音前后端与移动端Agent运行环境建设,构建万级高并发、秒级低延迟训推评一体环境,支持资源智能调度
保障Agentic RL Scaling过程中,高并发环境的稳定性,提升计算资源利用率
参与打造抖音下一代通用Agentic RL基建,建设Agent多轮交互、Multi-Agent协作/对抗、动态环境适应等复杂场景强化能力,支持各类Agent低成本接入RL
主导核心技术攻关,提升训推效率,缓解RL推理负载不均衡导致的Bubble
研究极致显存优化方案、低精度量化、算子优化、异构硬件计算等,与算法同学协作,通过算法和工程Co-Design提升训练稳定性
紧跟业界前沿技术,提出创新思路和方向,并探索新技术在抖音训推评场景落地