天河一号作为863“高效能计算机及网格服务环境”重大项目“千万亿次高效能计算机系统研制”课题成果,在性能上成为中国的第一个千万亿次超级计算机。在2009年9月,国防科技大学研制成功了我国首台千万亿次超级计算系统"天河一号" ,其峰值性能达每秒1206万亿次双精度浮点运算。
天河一号现场图片
"天河一号"是在国家863 "高效能计算机及网格服务环境"重大项目"千万亿次高效能计算机系统研制"课题的催动下的成果,并且获得了国家超级计算天津中心的青睐,现部署于天津市滨海新区,作为国家超级计算天津中心的业务主机以及中国国家网格计算主结点。
下面我们来看一下"天河一号"的具体配置:
6144个通用处理器;
5120个加速处理器
内存总容量98TB ;
点点通信带宽40Gbps ;
共享磁盘总容量为1PB 。
天河一号的硬件系统包含:计算阵列、加速阵列、服务阵列,以及互连通信子系统、I/O存储子系统和监控诊断子系统等。其计算阵列共有2560个计算结点 ;每个计算结点集成2个Intel CPU,配32GB内存。加速阵列共有2560个结点;每个加速结点含2个AMD GPU、 2GB显存。服务阵列方面共有512个结点;每个服务结点含2个Intel EP CPU、32GB内存。互连通信子系统方面是采用两级Infiniband QDR互连;单个通信链路的通信带宽为40Gbps、延迟1.2μs。I/O存储子系统采用的是全局分布共享并行I/O系统结构;磁盘总容量为1PB。监控方面,天河一号采用的是分布式集中管理结构,实现全系统的实时安全监测、系统控制和调试诊断等功能。
下图为整个系统的分布图:
天河一号的软件系统由操作系统、编译系统、资源管理系统和并行程序开发环境等四部分组成 。操作系统采用的是64位Linux,主要面向高性能并行计算、支持能耗管理、虚拟化和安全隔离等进行了针对性设计。编译系统方面,天河一号可以支持C、C++、Fortran77/90/95、Java语言;支持OpenMP、MPI并行编程;提供异构协同编程框架,高效发挥CPU和GPU的协同计算能力。详情见下图:
天河一号在资源管理方面也具有诸多优势,它可以提供全系统资源统一视图,实现多策略资源分配与作业调度,有效提高资源利用率和系统吞吐率。其并行程序开发环境可以提供一体化图形用户界面,支持应用程序的调试和性能分析。
天河一号在技术方面的特点表现为以下几点*峰值性能1.206PFlops,LINPACK测试性能563.1TFlops@575MHz,超过2009年6月TOP500第四位 ;
*系统能效为431.7MFlops/W,超过2009年6月Green500第五位 。
*操作系统符合B2级安全标准,提供基于隔离的用户安全工作环境
*提供统一的全系统资源管理视图、友好的系统管理使用界面、一体化的并行应用集成开发环境和虚拟化的网络计算环境
除此之外,天河一号还具有极广泛的应用领域:
--石油勘探数据处理;
--生物医药研究;
--航空航天装备研制;
--资源勘测和卫星遥感数据处理;
--金融工程数据分析;
--气象预报和气候预测;
--海洋环境数值模拟;
--短临地震预报;
--新材料开发和设计;
--土木工程设计;
--基础科学理论计算等。
文章来源:服务器在线