统一调度:负责联邦集群与多集群调度等核心方案的设计与落地,解决跨机房、跨集群的资源统一调度、任务分发、数据流量问题,实现在离线资源合池和应用多机房部署
容器化:推动各场景容器化,包括在线服务、大数据离线任务、中间件等场景,提供技术方案和问题解决支持
在离线混部:深入研究并落地在离线混部技术方案,通过作业调度、负载分级、资源隔离等技术提升集群资源利用率,平衡在线服务稳定性与离线任务效率
调度器优化:负责调度相关组件的开发和优化,包括负载感知、重调度、弹性伸缩、资源画像的实现与迭代,以提升集群资源利用率与业务稳定性
资源池管理:设计并落地多层级、多维度的资源池管理体系,实现资源的弹性供给、成本优化与可视化