集群分为哪几种?集群的区别在于哪里

集群分为哪几种?集群的区别在于哪里,第1张

专家谈模拟集群与数字集群区别——模拟集群通信指采用模拟音进行通信整系统内没数字制技术使通信连接更靠少集群通信系统供应商采用数字信令使集群通信系统用户连接比较靠、联通速度所提高且系统功能相应增模拟集群通信系统实际信令数字制要指由于模拟集群通信系统采用数字信令段间内些产商或内代理商广用户意或意宣传其产品数字集群通信系统甚至别撰文称些系统数字集群通信系统实际起误导作用间量用户读者都能确认识所并没受影响——20世纪90代数字集群通信没力宣传发展些公司(内、外都)集群通信采用数字信令意或意哄骗用户说系统已经数字化实际真数字集群通信系统要各环节都数字处理除数字信令外其重要址式、音编码技术、调制技术等实现数字通信需要采用些新技术配合同步技术、检错纠错技术及集技术等些较新技术各种移通信般都采用或选用——数字通信技术数字集群通信系统比较重要部数字移通信模拟移通信同处先数字通信设备模拟通信设备主要差异谈起附图数字移通信系统移台简要框图图看二者主要差异处射频部即数字通信设备具模数变换、音编码、信道编码解码、数字调制解调及自适应均衡等单元部件音编码、信道编码数字调制数字移通信系统几重要部音编、解码模拟音变二进制数字码接收端再收数字码原模拟音程称信源编、译码信道编码则数字信息码再按特别规律增加些冗余码元程用信道传输抗噪声或干扰造误码保护信息靠传输通称纠(检)错编码解码则收端逆程
 集群英文名称Cluster通俗说集群种技术:系统连接起使台服务器能够像台机器工作或者看起像台机器采用集群系统通提高系统稳定性网络数据处理能力及服务能力
群集概念难理解群集计算机联接起形整体更利用设备资源项新兴技术标题: 作者:os7200 间:2011-07-22 00:00 实际群集布式计算类型群集集群都意思
都翻译Cluster 标题: 作者:vip00111 间:2011-07-22 00:00 概念 标题: 作者:moko39848381 间:2011-07-22 00:00 看9楼目看沙发反两越看越能真习惯看:lol 标题: 作者:cheng575104691 间:2011-07-22 00:00 谢谢听各位解释我概解1 标题: 作者:banielqiu 间:2011-07-22 00:00 目前见 Cluster (丛集)架构两种种 Web / Internet cluster system种架构主要数据放置同主机面亦即由部主机同负责项服务;另外种则所谓平行运算平行运算其实同运算工作交给整 Cluster 面所 CPU 进行同步运算功能由于使用 CPU 运算能力所加快运算速度目前比较见于平行运算功能通需要超级计算机面才看些超级计算机主要用文、军事、物理等需要精密、量运算工作考虑稳定性则通用 Unix 系统面硬件架构
高用性群集系统使应用程序服务能够发硬件或软件故障仍继续运行高用性系统使用户受软件故障及系统处理设备 (SPU)、磁盘或局域网 (LAN) 组件故障影响某组件现故障由冗余组件接管 *** 作群集其高用性系统负责协调各组件间切换标题: 作者:fedola 间:2011-07-22 00:00 习~~ 标题: 作者:chihaili2009 间:2011-07-22 00:00 群集服务器组独立服务器运行群集服务并象单系统运作通运行着Windows 2003 Server或Windows 2000 Server服务器编组组群集服务器资源应用程序提供高靠性、扩展性管理性
群集服务器目故障或断电情况保证客户应用程序资源访问群集某服务器由于故障或维护缘故用资源应用程序移其用群集节点
于群集系统使用高用性容错性由于容错技术提供高度恢复能力容错服务器通使用高度硬件冗余加特定软件任意单硬件或软件故障提供近于即恢复功能些解决案本高于群集解决案前者要提供余硬件并处于空闲状态等待故障现容错服务器主要用于支持高品质、高速处理场合票据交换所、自柜员机(ATM)或股票交易
群集服务保证停顿 *** 作数执行关键任务应用程序提供足够靠性群集服务监视应用程序资源并自数故障状态识别恢复使用群集管理工作负荷提供更柔性并提高整系统用性
集群 简单说集群(cluster)组计算机作整体向用户提供组网络资源些单计算机系统集群节点(node)理想集群用户意识集群系统底层节点看集群系统非计算机系统并且集群系统管理员随意增加删改集群系统节点
1)同种或若干种物某种程度恒定占据某区广泛且具社性微细差异用词该词各种同意义态用表示群或群落或种群;则用表示单位集团意植物指全面物则明显指哺乳类、鸟类及蚁、蜂等社性昆虫集群内体社结合程度各同区永久性集群(permanent colony)、季节性集群(seasonalcolony)及繁殖集群(breeding colony)等进由同种形集群称种内集群(intraspe-cific colony);由二种形集群称种间集群(interspecific colony)集群词没述意义指先迁入新群体或指社昆虫同巢穴集团
(2)特指述群体
(3)细菌霉菌培养细胞特称菌落
双机热备技术基于共同文件系统建立两台计算机内容完全致跳作用让主机解否存服务否健全旦双机种任何跳消失责另台主机立即接替继续提供服务目前双机软件主要内用处理跳交换资料并确保跳所服务相关

集群主要分成三大类 (高可用集群, 负载均衡集群,科学计算集群)
高可用集群( High Availability Cluster)
负载均衡集群(Load Balance Cluster)
科学计算集群(High Performance Computing Cluster)
1、高可用集群(High Availability Cluster)
常见的就是2个节点做成的HA集群,有很多通俗的不科学的名称,比如”双机热备”, “双机互备”, “双机”。高可用集群解决的是保障用户的应用程序持续对外提供服务的能力。 (请注意高可用集群既不是用来保护业务数据的,保护的是用户的业务程序对外不间断提供服务,把因软件/硬件/人为造成的故障对业务的影响降低到最小程度)。
2、负载均衡集群(Load Balance Cluster)
负载均衡系统:集群中所有的节点都处于活动状态,它们分摊系统的工作负载。一般Web服务器集群、数据库集群和应用服务器集群都属于这种类型。
负载均衡集群一般用于相应网络请求的网页服务器,数据库服务器。这种集群可以在接到请求时,检查接受请求较少,不繁忙的服务器,并把请求转到这些服务器上。从检查其他服务器状态这一点上看,负载均衡和容错集群很接近,不同之处是数量上更多。
3、科学计算集群(High Performance Computing Cluster)
高性能计算(High Perfermance Computing)集群,简称HPC集群。这类集群致力于提供单个计算机所不能提供的强大的计算能力。
高性能计算分类: 
31、高吞吐计算(High-throughput Computing)
有一类高性能计算,可以把它分成若干可以并行的子任务,而且各个子任务彼此间没有什么关联。象在家搜寻外星人( SETI@HOME – Search for Extraterrestrial Intelligence at Home )就是这一类型应用。
这一项目是利用Internet上的闲置的计算资源来搜寻外星人。SETI项目的服务器将一组数据和数据模式发给Internet上参加SETI的计算节点,计算节点在给定的数据上用给定的模式进行搜索,然后将搜索的结果发给服务器。服务器负责将从各个计算节点返回的数据汇集成完整的 数据。因为这种类型应用的一个共同特征是在海量数据上搜索某些模式,所以把这类计算称为高吞吐计算。
所谓的Internet计算都属于这一类。按照 Flynn的分类,高吞吐计算属于SIMD(Single Instruction/Multiple Data)的范畴。
32、分布计算(Distributed Computing)
另一类计算刚好和高吞吐计算相反,它们虽然可以给分成若干并行的子任务,但是子任务间联系很紧密,需要大量的数据交换。按照Flynn的分类,分布式的高性能计算属于MIMD(Multiple Instruction/Multiple Data)的范畴。
下面说说这几种集群的应用场景:
高可用集群这里不多作说明。
想Dubbo是比较偏向于负载均衡集群,用过的猿友应该知道(不知道的可以自行了解一下),Dubbo同一个服务是可以有多个提供者的,当一个消费者过来,它要消费那个提供者,这里是有负载均衡机制在里面的。
搜索引擎Elasticsearch比较偏向于科学计算集群的分布计算。
而到这里,可能不少猿友都知道,集群的一些术语:集群容错、负载均衡。
我们以Dubbo为例:
集群容错(>sina

Bigtable 是一个分布式的结构化数据存储系统,它被设计用来处理海量数据:通常是分布在数千台普通服务器上的PB 级的数据。Google 的很多项目使用Bigtable 存储数据,包括Web 索引、GoogleEarth、Google Finance。这些应用对Bigtable 提出的要求差异非常大,无论是在数据量上(从URL到网页到卫星图像)还是在响应速度上(从后端的批量处理到实时数据服务)。
Bigtable 已经实现了下面的几个目标:适用性广泛、可扩展、高性能和高可用性,Bigtable 是一个稀疏的、分布式的、持久化存储的多维度排序Map。

图一:一个存储Web 网页的例子的表的片断。行名是一个反向URL。contents 列族存放的是网页的内容,anchor 列族存放引用该网页的锚链接文本(alex 注:如果不知道HTML 的Anchor,请Google一把)。CNN 的主页被Sports Illustrater和MY-look 的主页引用,因此该行包含了名为“anchor:cnnsicom”和“anchhor:mylookca”的列。每个锚链接只有一个版本(alex 注:注意时间戳标识了列的版本,t9 和t8 分别标识了两个锚链接的版本);而contents 列则有三个版本,分别由时间戳t3,t5,和t6 标识。


Bigtable 通过行关键字的字典顺序来组织数据。表中的每个行都可以动态分区。每个分区叫做一个”Tablet”,Tablet 是数据分布和负载均衡调整的最小单位。

列族
Webtable 有个列族language,language 列族用来存放撰写网页的语言。
我们在language 列族中只使用一个列关键字,用来存放每个网页的语言标识ID。Webtable 中另一个有用的列族是anchor;这个列族的每一个列关键字代表一个锚链接,如图一所示。Anchor 列族的限定词是引用该网页的站点名;Anchor 列族每列的数据项存放的是链接文本。访问控制、磁盘和内存的使用统计都是在列族层面进行的。

时间戳
不同版本的数据通过时间戳来索引。Bigtable 时间戳的类型是64 位整型。
Bigtable 可以给时间戳赋值,用来表示精确到毫秒的“实时”时间;用户程序也可以给时间戳赋值。如果应用程序需要避免数据版本冲突,那么它必须自己生成具有唯一性的时间戳。数据项中,不同版本的数据按照时间戳倒序排序,即最新的数据排在最前面。为了减轻多个版本数据的管理负担,我们对每一个列族配有两个设置参数, Bigtable 通过这两个参数可以对废弃版本的数据自动进行垃圾收集。用户可以指定只保存最后n 个版本的数据,或者只保存“足够新”的版本的数据(比如,只保存最近7 天的内容写入的数据)。

Bigtable支持的其他特性
1、Bigtable 支持单行上的事务处理,利用这个功能,用户可以对存储在一个行关键字下的数据进行原子性的读-更新-写 *** 作。
2、Bigtable 允许把数据项用做整数计数器。
3、Bigtable 允许用户在服务器的地址空间内执行脚本程序
4、Bigtable 可以和MapReduce一起使用,MapReduce 是Google 开发的大规模并行计算框架。我们已经开发了一些Wrapper 类,通过使用这些Wrapper 类,Bigtable 可以作为MapReduce 框架的输入和输出。

Bigtable依赖于google的几项技术。用GFS来存储日志和数据文件;按SSTable文件格式存储数据;用Chubby管理元数据:
Bigtable是建立在其它的几个Google基础构件上的。BigTable 使用Google 的分布式文件系统(GFS)存储日志文件和数据文件。BigTable 集群通常运行在一个共享的机器池中,池中的机器还会运行其它的各种各样的分布式应用程序,BigTable 的进程经常要和其它应用的进程共享机器。BigTable 依赖集群管理系统来调度任务、管理共享的机器上的资源、处理机器的故障、以及监视机器的状态。
BigTable 内部存储数据的文件是Google SSTable 格式的。SSTable 是一个持久化的、排序的、不可更改的Map 结构,而Map 是一个key-value 映射的数据结构,key 和value 的值都是任意的Byte串,从内部看,SSTable 是一系列的数据块(通常每个块的大小是64KB,这个大小是可以配置的)。。SSTable 使用块索引(通常存储在SSTable 的最后)来定位数据块;在打开SSTable的时候,索引被加载到内存。每次查找都可以通过一次磁盘搜索完成:首先使用二分查找法在内存中的索引里找到数据块的位置,然后再从硬盘读取相应的数据块。也可以选择把整个SSTable 都放在内存中,这样就不必访问硬盘了。

BigTable 还依赖一个高可用的、序列化的分布式锁服务组件,叫做Chubby。Chubby有五个活跃副本,同时只有一个主副本提供服务,副本之间用Paxos算法维持一致性,Chubby提供了一个命名空间(包括一些目录和文件),每个目录和文件就是一个锁,Chubby的客户端必须和Chubby保持会话,客户端的会话若过期则会丢失所有的锁。

Bigtable 包括了三个主要的组件:链接到客户程序中的库、一个Master主服务器和多个Tablet片 服务器。
Bigtable会将表(table)进行分片,片(tablet)的大小维持在100-200MB范围,一旦超出范围就将分裂成更小的片,或者合并成更大的片。每个片服务器负责一定量的片,处理对其片的读写请求,以及片的分裂或合并。片服务器可以根据负载随时添加和删除。这里片服务器并不真实存储数据,而相当于一个连接Bigtable和GFS的代理,客户端的一些数据 *** 作都通过片服务器代理间接访问GFS。主服务器负责将片分配给片服务器,监控片服务器的添加和删除,平衡片服务器的负载,处理表和列族的创建等。注意,主服务器不存储任何片,不提供任何数据服务,也不提供片的定位信息。

客户端需要读写数据时,直接与片服务器联系。因为客户端并不需要从主服务器获取片的位置信息,所以大多数客户端从来不需要访问主服务器,主服务器的负载一般很轻。

Master 服务器主要负责以下工作:为Tablet 服务器分配Tablets、检测新加入的或者过期失效的Table 服务器、对Tablet 服务器进行负载均衡、以及对保存在GFS 上的文件进行垃圾收集。除此之外,它还处理对模式的相关修改 *** 作,例如建立表和列族。

我们使用一个三层的、类似B+树的结构存储Tablet 的位置信息。

第一层是一个存储在Chubby 中的文件,它包含了Root Tablet 的位置信息。这个Chubby文件属于Chubby服务的一部分,一旦Chubby不可用,就意味着丢失了root tablet的位置,整个Bigtable也就不可用了。
第二层是root tablet。root tablet其实是元数据表(METADATA table)的第一个分片,它保存着元数据表其它片的位置。root tablet很特别,为了保证树的深度不变,root tablet从不分裂。
第三层是其它的元数据片,它们和root tablet一起组成完整的元数据表。每个元数据片都包含了许多用户片的位置信息。

片的数据最终还是写到GFS里的,片在GFS里的物理形态就是若干个SSTable文件。下图展示了读写 *** 作基本情况。

BigTable和GFS的关系
集群包括主服务器和片服务器,主服务器负责将片分配给片服务器,而具体的数据服务则全权由片服务器负责。但是不要误以为片服务器真的存储了数据(除了内存中memtable的数据),数据的真实位置只有GFS才知道,主服务器将片分配给片服务器的意思应该是,片服务器获取了片的所有SSTable文件名,片服务器通过一些索引机制可以知道所需要的数据在哪个SSTable文件,然后从GFS中读取SSTable文件的数据,这个SSTable文件可能分布在好几台chunkserver上。
一个简化的Bigtable结构图:

结构图以Webtable表为例,表中存储了网易、百度和豆瓣的几个网页。当我们想查找百度贴吧昨天的网页内容,可以向Bigtable发出查询Webtable表的(combaidutieba, contents:, yesterday)。

假设客户端没有该缓存,那么Bigtable访问root tablet的片服务器,希望得到该网页所属的片的位置信息在哪个元数据片中。使用 METADATAWebtablecombaidutieba 为行键在root tablet中查找,定位到最后一个比它大的是 METADATAWebtablecombaidu>

市面上存在两种数据库负载均衡的思路:1

基于数据库连接的负载均衡:例如总共有100个数据库连接,50个连接登录到数据库机器A,另外50个连接登录到数据库机器B,这样每个连接中接下来的所有请求全都是发往同一台数据库机器的

这种数据库负载均衡的思路模拟了WEB上的负载均衡方法,但是由于WEB连接是短时间连接(连接建立后,获取需要的HTML等资源后,连接马上被关闭),而数据库连接是长时间连接(连接建立后,可长时间保持,客户可不停向数据库发送SQL请求,数据库做出回答,如此不断循环直到连接被人为或因错而断开为止),因此这种数据库负载均衡思路存在着明显的缺点:有可能会发生绝大部分的请求压力都集中到某台数据库机器上去,从而使得负载均衡效果失效

2

基于批处理请求的负载均衡:在建立数据库连接的时候,会同时与每台数据库服务器建立连接,之后针对客户端的每次请求,都会根据负载均衡算法,独立地选出某个数据库节点来执行这个请求

此种思路符合数据库长时间连接的特征,不存在上面所述的基于连接的负载均衡方法的缺点

市面上的负载均衡厂商,既有基于连接的,也有基于批处理请求的,用户需仔细辨别才能找到自己想要的合适产品


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zz/10565450.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-09
下一篇2023-05-09

发表评论

登录后才能评论

评论列表(0条)

    保存