南京航空航天大学高性能计算平台(以下简称平台)是依托工信部十三五信息化专项--南京航空航天大学智慧校园建设的校级科学仪器公共平台。平台包括CPU:18864个计算核心、GPU:132张卡,计算能力约达3Pflops(每秒千万亿次),超100Gb计算与存储网络,4Pb分布式存储。平台包含了CPU1队列(部署于“长空1号”)、CPU2队列(部署于“长空2号”)、GPU队列(部署于“AI深度学习平台”),可提供CPU计算和GPU计算所需资源。
长空1号:2020年6月建成,包含CPU计算节点62个,每个节点配置2颗intel Xeon Gold 6248 CPU,合计2480核,双精度浮点计算性能198.4Tflops;GPU节点有12个(3台4卡节点),配置均为NVIDIA Tesla V100,双精度浮点计算能力924Tflops。
长 空 1 号 | 设备 | 型号 | 规格 | 数量 |
CPU队列 | 浪潮NF5468M5 | CPU:2 ╳ Intel Xeon Gold 6248(2.5G,20C) 内存:12 ╳ DDR4-2933(16G) 硬盘:1 ╳ 480TD_SSDSC2KB(480G) | 33 | |
浪潮NF5280M5 | CPU:2 ╳ Intel Xeon Gold 6248(2.5G,20C) 内存:12 ╳ DDR4-2933(32G) 硬盘:1 ╳ 480TD_SSDSC2KB(480G) | 29 | ||
GPU队列(4卡) | 浪潮NF5468M5 | CPU:2 ╳ Intel Xeon Silver 4210(2.4G,10C) GPU:4 ╳ NVIDIA Tesla V100 内存:12 ╳ DDR4-2933(16G) 硬盘:1 ╳ 480TD_SSDSC2KB(480G) | 3 | |
并行存储 | Lenovo DSS-G-D3248 | GPFS存储:2Pb 总实测持续读写带宽:≥20GB/s 单CPU计算节点单线程实测持续顺序读写带宽:≥4GB/s | 1 |
长空2号:2022年9月建成,包含CPU计算节点256个,每个节点配置2颗intel Xeon Platinum 8358 CPU,合计16384核心,双精度浮点计算性能1363.15Tflops。
长 空 2 号 | 设备 | 型号 | 规格 | 数量 |
CPU队列 | 浪潮NF5280M6 | CPU:2 ╳ Intel Xeon Platinum 8358(2.6G,32C) 内存:16 ╳ ECC REG DDR4 3200MHz(32G) 硬盘:1 ╳ 480GB企业级SSD 高速网卡:ConnectX®-6 VPI adapter card, 100Gb/s (HDR100, EDR IB and 100GbE) 带内管理:双端口10Gbps万兆网卡(含SFP+光模块) 带外管理:1个1Gbps IPMI专用管理网口 CPU双精度浮点计算性能:1363.1488Tflops(万亿次) | 256 | |
并行存储 | Lenovo DSS-G-D3248 | GPFS存储:2Pb 总实测持续读写带宽:≥20GB/s 单CPU计算节点单线程实测持续顺序读写带宽:≥4GB/s | 1 |
AI深度学习平台:AI深度学习平台是基于学校高性能计算平台硬件基础,面向人工智能、深度学习、大模型训练等领域的算力调度平台,功能涵盖数据集、算法、框架和模型的分类管理,并提供TensorFlow、PyTorch等常用深度学习框架和库。平台2024年5月正式上线运行,包含64张NVIDIA Tesla V100 GPU卡(16台4卡GPU节点),适合开展大规模数据处理与分析、复杂算法训练等。
AI 深度 学习 平台 | 设备 | 型号 | 规格 | 数量 |
GPU队列(4卡) | 浪潮NF5468M5 | GPU:4* Tesla-V100-PCIe-32GB CPU:2* Intel(R) Xeon(R) Silver 4210R CPU @ 2.40GHz 10C 内存:12* 16G-DDR4-2933MT/s 硬盘:1* 480G企业级SSD 带内管理:双端口10Gbps万兆网卡(含SFP+光模块) 带外管理:1个1Gbps IPMI专用管理网口 | 16 |