【大模型引擎】
精通Python或C/C++开发,具备优秀的数据结构与算法能力,代码规范高效,具备良好的工程实践和团队协作能力
熟悉深度学习基础理论和主流模型架构,能熟练使用TensorFlow/PyTorch等框架进行模型开发和训练
掌握CUDA编程和GPU加速技术,具备模型性能调优经验,有国产AI芯片开发经验者优先
了解主流分布式训练框架,具有分布式系统开发或优化经验者优先
【算力调度】
本科及以上学历,计算机、数学、通信等相关专业,3年以上相关工作经验,具备大规模GPU集群运维及优化经验,有万卡集群管理或国产AI芯片经验者优先
熟练掌握Golang/Python等语言,熟悉Kubernetes、Kubeflow等云原生技术栈,具备二次开发经验
深入理解调度器原理(如kube-scheduler),有GPU调度研发经验,能持续优化集群资源使用效率并快速定位问题
责任心强,抗压能力突出,工作积极主动,具备良好的问题解决和团队协作能力
【样本引擎】
本科及以上学历,3年以上工作经验,有算法IO优化、特征平台建设经验或开源社区贡献者优先
精通Java/Scala/Python至少一门语言,熟悉Linux/Unix开发环境,具备优秀的编码能力和工程质量意识
熟悉Spark/Flink/Iceberg/Hudi等大数据技术及TensorFlow/PyTorch等AI框架,有源码级二次开发经验者优先
具备优秀的业务理解、沟通协作能力,学习能力强,工作积极主动
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信