硕士及以上学历,计算机、软件工程、人工智能等相关专业优先
具备较丰富的大语言模型/文生图/视频生成等推理服务优化经验
了解 KV-Cache / Page Attention / Speculative Decoding 等 LLM 推理优化方案
熟练掌握 Linux 环境下的 C/C++ 与 Python 语言,具备良好的代码规范和系统设计能力
熟练使用 Kubernetes/Docker 等容器化与服务化工具,了解 Ray 等调度框架,具备大规模集群部署与调度经验
具有独立解决问题的能力,良好的团队合作精神及沟通能力