负责机器学习开发平台的服务端开发,包括不限于训练、推理、微调、SDK开发等
负责 MLOps、LLMOps 系统的开发,设计并实现 AI workflow 产品,提高用户使用效率,提升 GPU 利用率
设计和实现 AI 平台业务系统,包括基础架构/工具链/组件等基础设施,以及落地业务功能需求
构建智能队列管理系统,结合池化能力实现弹性配额、动态优先级调整等功能,最大化提升资源利用率,满足LLM/VLM等大模型训练需求
构建AI沙箱环境,支持多模态数据采集、RL训练及Agent应用快速落地,为算法研发提供高效、安全的实验底座