按关键词阅读: 大学 XX 方案 系统 集群 计算 性能
1、国防科技大学理学院物理系高性能计算集群系统方案Confidential(秘密)国防科技大学理学院物理系高性能计算集群系统方案2008.01Written By ShinyTech湖南生力科技有限公司1999,2008All Rights Reserved目 录1.集群需求描述32.集群系统介绍32.1.集群系统介绍32.2.Beowulf集群架构介绍43.集群系统方案描述53.1.引言53.2.整体架构设计63.3.集群软件以及网络结构73.3.1.使用SIS(System Installer Suite)安装和维护集群系统73.3.2.使用C3工具方便管理节点83.3.3.使用PBS(Por 。
2、table Batch System)来管理作业93.3.4.使用pfilter确保安全性103.3.5.使用NTP(Network Time Protocol)来同步系统时钟103.3.6.使用MPICH或者LamMPI编写高性能程序113.3.7.使用环境切换器(Switcher)切换环境113.3.8.使用OPIUM同步帐号123.3.9.系统结构图134.方案关键点134.1.系统规模及性能要求134.2.异构硬件环境144.3.集群网络结构选择144.4.存储节点的使用154.5.管理节点的HA配置151. 集群需求描述根据与科大物理系科研人员的沟通 , 我们了解到课题组目前计算机系统有 。
3、如下一些特点:1 计算能力分散:目前课题组总共有15台左右的PC服务器用于原子物理方面的科学计算 , 这些服务器目前由不同的小组或者老师单独使用 。
2 目前的IT架构不能很好的支持科研工作:据科研人员反映 , 目前的服务器计算能力 , 在运算某些数据时往往需要一周甚至一个月的时间 , 因此他们希望能提高运算速度 。
3 目前IT环境比较杂:据了解目前的15台服务器型号和生成时间参差不齐 , 操作系统主要有RedHat Linux以及Fedora各个版本 , 开发语言主要是基于MPI框架的Fortran 。
由于系统环境不一致 , 导致应用程序开发和使用很难做到通用 , 影响工作效率 。
根据以上情况 , 本次项目需要为课题组构建一个高性能计算 。
4、集群系统 , 通过集群系统达到聚合计算能力、提高作业运算效率、整合开发环境的目的 。
2. 集群系统介绍2.1. 集群系统介绍在计算机领域 , 集群(cluster)这个名词已经越来越被大家熟悉 , 特别是在科学计算领域 。
什么是集群?简单地说就是把许多计算机通过高速网络和软件互联在一起作为一个单独的计算机来使用的计算机系统 。
Linux竞争力很强的原因之一 , 是它可以运行于普通的PC机上 , 不需要购买昂贵的专用硬件设备 。
目前 , 越来越多的网站利用Linux操作系统提供邮件、Web、文件存储、数据库等服务 。
随着人们对Linux服务器依赖的加深 , 对其可靠性、负载能力和计算能力也倍加关注 。
Linux集群技术应运而生 , 在几台 。
5、运行Linux的PC机上 , 只要加入相应的集群软件 , 就可以组成具有超强可靠性、负载能力和计算能力的Linux集群 。
最常见的三种集群类型包括“高性能科学集群”、“负载均衡集群”和“高可用性集群” 。
1. 科学集群:通常 , 它是并行计算的基础 , 一般通过高速网络来连接一组单处理器或多处理器 PC , 并且在TCP/IP层上进行通信以运行并行应用程序 。
因此 , 您会常常听说又有一种便宜的 Linux 超级计算机问世了 。
但它实际是一个计算机集群 , 其处理能力与真的超级计算机相当 , 通常一套集群的软硬件配置开销要远远低于专用的超级计算机 。
2. 负载均衡集群:负载均衡集群正如其名称所暗示的 , 使负载可以在计算机集群中尽可能平均 。
6、地分摊处理 。
该负载可能是需要均衡的应用程序处理负载或网络流量负载 。
这样的系统非常适合于运行同一组应用程序的大量用户 。
每个节点都可以处理一部分负载 , 并且可以在节点之间动态分配负载 , 以实现平衡 。
对于网络流量也如此 。
通常 , 网络服务器应用程序接受了太多入网流量 , 以致无法迅速处理 , 这就需要将流量发送给在其它节点上运行的网络服务器应用 。
还可以根据每个节点上不同的可用资源或网络的特殊环境来进行优化 。
3. 高可用性集群:高可用性集群的出现是为了使集群的整体服务尽可能可用 。
如果高可用性集群中的主节点发生了故障 , 那么这段时间内将由次节点代替它 。
次节点通常是主节点的镜像 , 所以当它代替主节点时 , 它可以完全接管其身份 ,。
7、并且因此使系统环境对于用户是一致的 。
2.2. Beowulf集群架构介绍Beowulf集群提供了一种使用COTS(Commodity off the shelf)硬件构造集群系统以满足特殊的计算需求的方法 。
这里的COTS是指象PC和以太网这种广为应用的标准设备 , 它们通常可以由多家厂商提供 , 所以通常有很高的性价比 。
来源:(未知)
【学习资料】网址:/a/2021/0419/0021967585.html
标题:XX|XX大学高性能计算集群系统方案