计算机相关专业,本科及以上学历,3-5 年分布式系统或AI推理相关工作经验
具备丰富的推理服务性能优化经验:KVCache 管理、调度策略优化、PD 分离、模型量化、模型并行等
熟练使用 Kubernetes 进行容器化部署,了解 Volcano等GPU资源调度系统
掌握 Go/Python 等编程语言,具备良好的代码规范和系统设计能力
具备推理链路端到端性能分析与故障排查能力,能够在高并发、大规模场景下保障服务稳定运行
熟悉至少一种大模型推理主流框架(vLLM、SGLang、TensorRT-LLM、Dynamo等)
良好的团队协作能力和独立解决复杂问题的能力,能承受一定工作压力