神威·太湖之光
1. 系统简介
“神威·太湖之光”计算机系统是由国家并行计算机工程技术研究中心在国家863计划支持下研制的新一代超级计算机系统。根据 2016年6月20日国际 TOP500 排名公布的最新数据,全系统峰值运算速度为每秒12.54亿亿次,持续运算速度为每秒9.3亿亿次,均位居世界第一。性能功耗比每瓦60.5亿次,与其他相同量级计算机相比节能60%以上。“神威·太湖之光”是世界上首台峰值运算性能超过十亿亿次量级的超级计算机,也是我国第一台全部采用国产处理器构建的世界第一的超级计算机。
“神威·太湖之光”超级计算机采用了由国家“核高基”重大专项支持的“申威26010”众核处理器,该处理器由国家高性能集成电路设计中心采用自主核心技术成功研制,采用64位自主申威指令系统,260核,核心工作频率1.45GHz,峰值性能每秒超过3万次浮点结果,性能指标世界领先。
1.1用户可用资源
1.1.1国产高速计算系统:
- 申威26010处理器个数(计算节点数):40960
- 申威26010处理器核组数:163840(基本收费单位)
- 每个计算节点32GB内存,每个核组可使用8GB内存
- 峰值性能125PFlops,适合有源码的科学与工程计算
1.1.2商用辅助计算系统:
- 980台普通计算节点,每个计算节点24核心128GB内存
- 32台胖界点,每个节点8路16核心1TB内存
- 峰值性能1PFlops,提供工业设计等商用软件计算服务
1.1.3通信网络带宽:双向14GB/s
- 国产高速计算系统:14GB/s
- 商用普通计算节点:14GB/s
- 商用胖节点:28GB/s
1.2 “申威26010”众核处理器
申威众核处理器采用片上融合的异构体系结构,由4个核组构成,每个核组包括1个主核(运算控制核心)和64个从核(核心阵列)。整芯片共260个计算核心。
主核主频为1.45GHz,每核组内存8GB,L1 CACHE大小为32KB,L2CACHE(数据CACHE和指令CACHE混合)大小为 256KB。
从核主频为1.45GHz,可以通过gld/gst直接离散访问主存,也可以通过DMA方式批量访问主存,从核阵列之间可以采用寄存器通信方式进行通信。从核局部存储空间大小为64KB,指令存储空间为16KB。
1.3语言环境
- 基础编程语言
- C
- C++
- Fortran
- 并行编程语言/接口
- MPI 3.0
- OpenMP 3.1
- OpeanACC 2.0
- 加速线程库
- 用户使用环境
- 并行开发环境
- SWACC编译系统
- MPI支撑环境
- 基础编程环境/工具
- 基础编译系统
- C
- C++
- Fortran
- 基础函数库
- 基础数学库
- 高性能扩展数学函数库
- 性能优化工具
- 自动向量化/并行化
- 基础编译系统
1)基础编程语言
提供主流的基础编程语言支持,包括:C语言,支持C99标准。C语言,支持 C++03 标准,并提供支持C++11标准的SWGCC编译环境(从核不支持 C++)。 Fortran语言,支持Fortran2003标准中主要的功能,满足实际课题需求。
2)并行编程接口
提供与国际接轨的并行编程标准支持,包括MPI3.0、OpenMP3.1、Pthreads、 OpenACC2.0,支持消息并行模型、共享编程模型、加速编程模型,满足科学计算课题移植和开发的多样性需要。同时提供自主设计的加速线程库编程接口,满足部分追求极致性能的课题开发需求。
3)用户使用环境
提供并行开发环境,以图形界面的方式提供编辑、编译、调试、性能监测于一体的使用环境。同时支持以字符界面的方式使用SunwayOpenACC编译系统、MPI支撑环境等完成基本的开发过程,满足不同用户的使用习惯。
4)基础编程环境
基础编程环境是所有上层语言及工具的基础,提供基础语言、主从异构编程、基础函数库、自动向量化/并行化等支持,提供丰富高效的编译优化功能。
1.4用户使用模式
系统所提供的主要的用户使用模式公两种:
- 核组私有模式:“神威·太湖之光”上主要使用的模式。
- 全片共享模式:满足部分课题的大内存需求。
每种模式中可支持多种具体的使用方式,具体如下表所示。