【大模型引擎】
精通Python或C/C++开发,具备优秀的数据结构与算法能力,代码规范高效,具备良好的工程实践和团队协作能力
熟悉深度学习基础理论和主流模型架构,能熟练使用TensorFlow/PyTorch等框架进行模型开发和训练
掌握CUDA编程和GPU加速技术,具备模型性能调优经验
了解主流分布式训练框架
【算力调度】
本科及以上学历,计算机、数学、通信等相关专业,3年以上相关工作经验,具备大规模GPU集群运维及优化经验
熟练掌握Golang/Python等语言,熟悉Kubernetes、Kubeflow等云原生技术栈
深入理解调度器原理(如kube-scheduler),能持续优化集群资源使用效率并快速定位问题
责任心强,抗压能力突出,工作积极主动,具备良好的问题解决和团队协作能力
【样本引擎】
本科及以上学历,3年以上工作经验
精通Java/Scala/Python至少一门语言,熟悉Linux/Unix开发环境,具备优秀的编码能力和工程质量意识
熟悉Spark/Flink/Iceberg/Hudi等大数据技术及TensorFlow/PyTorch等AI框架