计算机相关专业本科及以上学历,扎实的编程能力,熟练掌握Python/Java/Go中的至少一种,能独立开发分布式测试工具、自动化测试框架
了解大规模分布式训练原理,熟悉PyTorch、TensorFlow、DeepSpeed等至少一种训练框架
了解 Llama、Qwen、ChatGLM 等主流大模型特性
了解云原生体系,掌握Kubernetes、Docker的使用
具备 GPU 硬件基础认知,了解 GPU 算力、显存调度机制等
精通接口测试、性能测试、兼容性测试等,能独立设计万卡级集群压力测试、故障注入测试、稳定性测试方案
具备 CI/CD 集成测试经验
精通数据结构与算法,逻辑思维缜密,具备复杂分布式场景下的问题分析与定位能力,拥有 owner 意识和跨团队协作能力
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信