工作动态

我校曙光TC5000A高性能计算平台通过验收

发布人:发表时间:2009-12-10点击:

本网讯(李建军报道:)2009年10月14日,中国地质大学(武汉)组织专家组在网络技术与远程教育学院对曙光TC5000A高性能计算平台项目进行了设备验收。专家组在听取项目汇报和实地考察及现场演示的基础上,对该项目进行了详细的审核评议。认为:曙光TC5000A高性能计算平台项目论证充分,实施严谨,运行正常,同意该项目通过验收。

曙光TC5000A高性能计算平台项目是“地球系统过程与矿产资源”优势学科创新平台建设项目的子项目之一,项目负责人:吕国斌教授;网络与教育技术中心负责建设及设备运行管理。设备招标编号:DDZBHW[2009]063,总投资人民币400万元。

随着我校教学科研及学科建设的发展,高性能计算的应用范围越来越广,各学院自行组建的计算工具远远满足不了实际需要。建设一个高水平的功能强大的满足全校教学科研和学科建设需求的高性能计算平台势在必行。为此,学校从211建设项目拨出专项经费,实施我校高性能计算平台建设。

为了保证该项目顺利进行,从学校领导、相关院所、项目实施部门到每个工作人员都十分重视该项目建设的每一个环节。特别是项目的前期考察和论证工作做到了目标明确,理由充分,满足需要,技术领先。在考察调研的基础上于2007年4月30日进行了第一次论证汇报;并确定该项目列985建设专项;2008年10月15日对建设规划进行专题汇报;2009年6月4日对项目通过了设备论证;2009年6月26日组织专家对高性能计算平台进行了技术规格论证,形成了招标工作会议纪要;2009年7月16日对评标的技术指标(基础性指标和重要指标)进行了论证;2009年6月17日发布高性能计算系统招标公告7月17日开标。最终由曙光信息产业(北京)有限公司中标,并利用暑假期间进行设备安装和软件调试。建设工程完成后进行了一个多月的磨合运行与试点操作,在各项指标达到合同技术指标的要求后,提出项目验收。

曙光TC5000A高性能计算平台硬件上:采用X86刀片集群服务器架构,Intel5530 84/AMD2380 92个节点;引入少量胖节点临时解决线性计算问题:配置两台8路四核的PC服务器;节点间的通信连接采用20G的Infiniband连接,管理网络采用1000M以太网交换机连接。采用两级存储架构,一级容量不低于10T用于计算,二级容量不低于20T用于原始数据和结果的中短期存储。存储网络采用SAN架构的光纤存储系统,一级为全光纤结构,二级为半光纤结构。采用商业化的集群管理软件实现集群管理和原有集群的整合管理。软件方面操作系统为:企业级Linux(RedHat)操作系统。整套系统包括92个计算节点、2台SMP 8路计算节点、5个I/O、双作业调度系统和一台集群管理维护节点。(CPU总数216,核数:864,最后为1264);内存规模:SMP服务器配置128G的海量内存,每一个计算节点配置内存为16G,管理节点和作业调度节点配置16G内存、每一个I/O节点配置32G内存;整个系统内存总容量是1936G;计算网络:采用业界主流的x4 DDR Infiniband作为通信网络互联全部节点,点对点单向网络带宽达到线速20Gb/s,MPI层消息传递延迟小于1.5微秒。管理和作业调度网络:采用业界领先的Force10 S50N交换机构建管理网络互联全部节点,S50拥有192Gbps背板交换容量,100Mpps包转发能力,可实现全线速无阻塞的数据交换能力,可以作为计算网的备份;存储系统:基于全局共享的可扩展并行存储架构,共配置3个数据存储节点和1个元数据节点,前端接入20Gb/s Infiniband,后端接入1套曙光高端12TB的光纤磁盘阵列,和一套曙光24TB的光纤磁盘阵列系统。6、编译系统及编程环境:提供适用于AMD多核平台的全套编译、调试软件以及数学函数库,支持标准的Fortran/C/C++编程,支持OpenMP、MPI以及OpenMP和MPI的混合并行编程;管理软件系统:提供商业版本曙光Gridveiw HPC2.0大型机综合监控管理软件,支持资源监控、系统管理、综合告警、智能报表,可以实现对系统软硬件资源的统一管理;作业调度系统:提供业界领先的PBS GridWorks HPC分布式资源管理软件系统,可有效提高系统可用性和利用效率;另外配置曙光GRIDVIEW2.0作业调度中间件模块,通过该软件可以实现跨集群调度,多种模板精细化定制,多种计算软件的集成功能。保证了技术性能上的可靠性和先进性。

曙光TC5000A高性能计算平台建设完成后,将成为以地球系统过程与矿产资源优势学科为依托,立足中国地质大学、面向地球科学及相关行业,建立一个为地球科学、矿产资源、环境科学研究、生产和经济建设服务的开放与共享的高性能计算平台;初步建立功能强大、运算快捷、存储量大的数据与计算处理中心,为各学科(特别是地学、环境、资源、工程、空间物理等学科)提供快速、可靠的计算环境和强大的计算能力,使之逐步成为我国地质、资源、能源、环境等的主要计算中心。为我校教学科研及学科发展提供软硬件、科学计算等的支撑平台;为来我校工作和合作单位的国内外人士提供必要的工作环境;为吸引高层次人才来我校工作,创造了基本的工作条件;为各学科的交叉、合作研究提供良好的支撑平台;为申报国家863、973或自然科学基金项目奠定基础;为开展省级、部级以上重大研究项目或科技攻关项目提供必要的研发环境;为高等院校、科研院所的交流、合作,提供良好的支撑环境;为我国能源、资源、环境等行业发展提供基础理论研究支撑平台,并为行业培养高素质的急需人才提供帮助。

专家组指出:“高性能计算平台”项目符合招标文件合同规定的验收指标,运行正常,同意通过该项目验收。同时希望:网络与教育技术中心认真做好高性能计算平台的管理及设备运行维护,发挥其最大效益;要求厂家按合同组织培训工作的同时,提供及时周到的技术服务。