
对于一台服务器而言,一个非常重要的方面就是它的“可用性”,即所选服务器能满足长期稳定工作的要求,不能经常出问题。其实就等同于Sun所提出的可靠性(Reliability)。
因为服务器所面对的是整个网络的用户,而不是单个用户,在大中型企业中,通常要求服务器是永不中断的。在一些特殊应用领域,即使没有用户使用,有些服务器也得不间断地工作,因为它必须持续地为用户提供连接服务,而不管是在上班,还是下班,也不管是工作日,还是休息、节假日。这就是要求服务器必须具备极高的稳定性的根本原因。
一般来说专门的服务器都要7X24小时不间断地工作,特别像一些大型的网络服务器,如大公司所用服务器、网站服务器,以及提供公众服务iqdeWEB服务器等更是如此。对于这些服务器来说,也许真正工作开机的次数只有一次,那就是它刚买回全面安装配置好后投入正式使用的那一次,此后,它不间断地工作,一直到彻底报废。如果动不动就出毛病,则网络不可能保持长久正常运作。为了确保服务器具有高得“可用性”,除了要求各配件质量过关外,还可采取必要的技术和配置措施,如硬件冗余、在线诊断等。
如需了解更多,请访问蛙云官网wayuncn
专业领域十余载,倾情奉献
一次沟通,终生陪伴
什么是服务水平协议从本质上看,SLAs是用户和服务提供商签订的正式契约,它可以是合同中的一个组成部分,也可以是附属于主合同的与主合同有相同效力的说明性文件。其根本目的是让合作各方在项目运行之前达成一个清晰的共同的愿景,同时建立一定的机制,限制各方的败德行为、鼓励各方努力达到或超过事先设定的愿景。
服务水平协议的内容
1对服务的描述
在这一部分要明确用户和服务商之间的关系,双方各自应承担的义务。要说明服务中包含哪些项目,哪些项目应排除在外。对用户的需求也要有量化的估计,例如需要说明租用线路的平均流量和峰值流量。用户选择外包电信服务的重要因素之一是期望得到可扩展性,所以SLAs中既要有对现实需求的描述,也要有对可预计的未来需求的明确描述,服务商要承诺满足这些未来的需求。
在服务的过程中,用户可能需要追加一些临时性的服务项目,虽然无法罗列出所有可能的情形,但是在SLAs中要指定对这些服务的定价原则,例如要求合同以外项目的定价不高于服务商的媒体报价的60%。
2对服务质量的描述
服务商一般都能提出许多描述服务质量的技术指标,有些指标对用户没有多少实在的意义,而有些对用户的业务运作关系密切的指标则可能会被有意无意地“遗漏” 掉。所以用户需要找出最能符合自己业务需求的服务水平指标。常用的有:性能指标,如带宽、误码率等;可用性指标,如每个月线路正常的时间比率;及时性指标,如开通服务所需的时间、故障恢复所需的时间等。
3服务质量的度量和报告机制
即使是像带宽这样常见的技术指标也可能在用户和服务商那里有不同的理解,所以SLAs中要明确对服务质量的测试点和测试方法,有时还要指定测试仪器和评价标准。用户需要根据指标来对服务商进行评价,更需要根据指标的时间序列及早发现变化的趋势并做好准备工作。在现实运行中常常由服务商来进行服务质量的测定,所以需要在SLAs中规定服务商提交报告的周期以保障用户能及时了解到最新的情况。
4惩罚和奖励机制
SLAs中需要规定当服务商没有达到约定的服务质量时应被扣除部分服务费用或赔偿损失。值得注意的是,这一条款的首要目的是促使服务商保障服务质量而不是为用户提供意外损失保险,所以制订赔偿的额度应以对服务商的经济影响为基础,而不应以用户遭受的损失为基础(往往用户的直接损失不大,而间接损失又难以衡量)。除此之外,SLAs中还应该包括激励条款,即规定服务质量超过约定水平时给予服务商一定的经济奖励。只有将赔偿和奖励结合起来才能真正使服务商的利益和用户的利益保持一致,从而使服务商有提高服务质量的经济动因。
赔偿和奖励条款都要可量化,例如约定的某个指标是99%,那么根据条款应能明确而无争议地知道达到98%或100%时应如何处理。由于质量评价指标很多,通常只选取最重要的几条作为奖惩的评判依据。
5争议的解决和合作结束机制
通常合同中都有争议发生时申请仲裁或提起诉讼的相关条款,但执行了这些条款也就意味着合作的失败和双方的损失。SLAs中的争议条款则有所不同,它规定的是在合作过程中双方对一些具体事件的处理方式和原则,例如服务商应将哪些事件通知给用户组织的哪个人,多长时间召开一次联席会议,通过这样一种规范化的途径让双方进行充分的交流,可以最大程度地争取合作能顺利地进行下去。
当然,由于各种原因,仍有相当多的服务合同需要提前结束,也常常会引起纠纷,导致合作双方的进一步损失。一份好的SLAs要明确指出合作的结束条件和结束后双方专有投资的归属等问题的解决方式,通过合作开始前的细致工作免除合作结束时的纠纷。SLAs主要针对长期的专业服务,合作双方已经为合同的签订付出了相当高的交易成本,有时还要发生对专用设备的投资,所以存在合同结束机制并不会使双方轻率地作出结束合同的决定。
电信服务中的服务水平协议
各类SLAs都应包含上文所述5个方面的内容,不过这5个方面在不同的行业有其具体的表现形式。1998年,帧中继论坛(Frame Relay Forum,现在是MPLS and Frame Relay Alliance)发布了服务水平定义实施协议(Service Level Definitions Implementation Agreement),规定了延迟、帧传送率、数据传送率和服务的可用性等4个方面的评价指标、评价方法并给出了相关的SLAs框架,自此以后SLAs才得到了产业界的广泛关注。所以,虽然SLAs普遍适用于需要规范用户和服务商行为的各种场合,在不同的行业都可以得到应用,但它与电信服务业有着天然的联系。下面以网络服务和主机托管服务为例来说明电信服务SLAs中特有的条款,并对有关安全的条款单独加以讨论。
1网络服务的SLAs
网络服务的SLAs要关注网络本身和网络特征两方面的内容。
从网络本身来看,有些用户可以接受IP网络“尽力服务”的模式,而有些用户则需要更有保障的专线服务。在SLAs中要指明将使用通过何种基础设施来实现网络服务,用户需要据此来评估可能得到的性能和运行中的风险,例如2M的DDN线路和2M的MPLS 线路毕竟有着本质的区别。
从网络特征来看,要约定可用性、带宽、丢包率和延迟等指标。平均可用时间和线路中断的时刻都是可用性指标,线路中断发生在工作时间或是夜间,对不同的用户有着不同的影响,需要对特定的用户作出特定的承诺。带宽是一个简单而易引发争议的指标,可能指的是用户到运营商接入设备的带宽,也可能是端到端的带宽,或是一个最大可用带宽,无论哪种情况,都要通过指标的定义和网络结构的描述让用户和服务商保持相同的理解。5%以下的丢包率对于普通的Web应用来说都是可以接受的,而在这种情况下VoIP的效果却已经相当劣化了,所以需要在SLAs中对后一类用户承诺更低的丢包率。延迟通常用RTT来描述,如果要支持多媒体应用,就需要在SLAs中明确这是一个平均值还是最大值,抖动的幅度有多大;若用户租用线路的目的是连接自动柜员机的话,这个指标就可以宽松得多了。
2主机托管和维护服务的SLAs
主机托管和维护服务是运营商的新的业务增长点,其特有的SLAs条款主要集中在服务器的可用性、服务器的管理和数据备份等方面。可用性是指除去离线维护时间后服务器正常提供服务的时间占某个区段的比例,虽然可用性越高越好,但将其定为995%至999%则更为现实一些。服务器的管理要指明服务商是否负责对服务器性能的调整,服务商对服务器崩溃的事件应在多长的时间内做出反应,服务器在多长的时间内能恢复正常工作。备份条款要规定数据备份的周期和方式,是否要求异地保存备份介质,某些高端的服务还可能要求服务商提供异地的灾难备份中心,以保障在发生地震、水灾等事件的情况下能继续开展业务。
3有关安全的SLAs
电信服务中的安全有可用性、保密性、数据一致性、身份确认和不可抵赖等多重含义,各类电信服务中都会涉及到安全性的问题。它一方面与用户和服务商有关,另一方面也与不可控制且难以预见的第三方(如黑客)有关。仅仅用各种指标对安全性的结果加以度量是不够的,也是不公平的,而用户也需要确信自己真正能得到某种级别的安全性保障。所以合理的SLAs安全条款既要规定安全性的结论性指标,也需要规定具体的安全措施,主要包括对安全性的说明,管理措施和安全事件处理流程等方面的内容。
安全性说明要分清楚用户和服务商各自的责任。例如要规定哪一方对数据进行加密,在传输或存储的哪一个环节进行加密;在哪些环节发生的问题由服务商负责,做出何种赔偿;服务商是否应对用户的地址分配负保密责任。
服务商在管理措施条款中承诺具体的管理规范,例如员工的筛选和培训制度,数据中心保安制度,保留系统审计和日志的技术方案,等等。细节内容可能非常繁杂, SLAs中指出采用某个 *** 作手册上的规定就可以了,但相关的 *** 作手册应该作为SLAs的附件,用户和服务商应对其有明确而一致的理解。
安全性事件多数是不期而遇的,SLAs中要定义以下机制:①服务商要保留足够多的系统日志;②服务商应能及早发现异常现象并在约定的时间内开始解决问题;③ 服务商要在约定的时间内通知用户;④服务商有义务配合对安全事件的调查,特别是当调查涉及到服务商员工的情况下更是如此。
SLAs明确了用户和服务商的权利和义务,对双方的行为都有了更多的约束,能够创造更好的合作氛围,是一种双赢的安排。对当前的中国电信服务业来说,引入SLAs至少有三方面的好处:
1电信服务成为许多用户开展日常业务不可或缺的基础设施,用户变得更加成熟,既需要更高水平的服务又能够区分不同的服务质量。SLAs满足了用户的这一要求。
2 电信服务业竞争加剧,虽然尚未打破寡头垄断的局面,但用户毕竟有了选择的余地。各服务商都为争取客户投入了大量的资源,推出了各种优惠措施,不过服务质量始终是理智的用户——特别是集团用户关注的焦点,服务商需要通过某种方式让用户认同其服务质量,SLAs正是令人信服的质量依据。
3 随着用户规模的扩大,ARPU值反而降低。为促使高端用户贡献更多的利润,服务商推出了花样繁多的VIP计划,但多数VIP计划与价格折扣相关,对增加利润的作用有限。SLAs能直观地反映用户对服务质量的期望,由于对服务质量要求较高的用户的价格需求d性较小,根据不同的SLAs级别对服务进行差别定价有利于服务商获取更高的利润。
可以断言,中国的电信服务业会越来越多地用SLAs来保障服务的质量。但也应该指出,如果仅将SLAs作为一种营销口号而没有具体的技术和管理措施跟进的话,从长期来看将不利于行业的健康发展。而且它仅是一种契约上的安排,只有当用户和服务商按约定定期对执行情况进行评估,及时发现问题并及时调整时,它才能真正发挥出应有的作用。
企业网站作为企业对外的名片之一。那么作为运行网站服务的基石——服务器有哪些性能方面的要求呢?我们平时使用的PC机能作为企业网站的载体吗?
网站服务器是指在互联网数据中心中存放网站的服务器。网站服务器主要用于网站在互联网中的发布、应用,是网络应用的基础硬件设施。这是一种高性能计算机,作为互联网的结点,储存、解决互联网上90%的数据信息。因此,网站服务器也被称作互联网的核心。
服务器的组成与微型机基本上类似,有cpu、硬盘、运行内存、数据总线等。它们是对于实际的网络技术应用特殊设计构思的,因此网站服务器与PC机在解决水平、稳定、系统可靠性、安全系数、扩展性、可管理性等层面存有着挺大的差别。所以我们在搭建企业网站的时候,尽量不要选择普通PC机作为网站服务器。
稳定性方面的需求。PC机是指个人计算机,它在稳定性方面只考虑到绝大多数个人用户对稳定性方面的需求,没有充分考虑到企业用户的这方面需求,所以在稳定性方面,PC机根本不能与专业服务器相比。网站服务器通常要求724不间断正常工作。一旦服务器出了问题,哪怕重启一次都将给企业带来巨大的损失。
可用性方面的需求。可用性是指服务器的各方面的性能。服务器的可用性要明显高于普通PC机的。网站服务器随时随地都可以保证服务项目,并使客户随时随地能够取得服务项目的水平,以及从系统异常中快速恢复正常的水平。高可用性服务器系统应当具有在运作时可对重要部件开展热插拔的水平,如SCSI磁盘阵列,在开关电源依然接入且服务器系统位于正常情况下运作的情形下,能用新磁盘更换问题磁盘;高可用性服务器系统有时候也应用冗余部件。
扩展性方面的需求。在扩展性方面,PC机更是不可与服务器相提并论了。企业用户对服务器的扩展性需求要远比普通用户的扩展性需求高许多,因为企业用户的应用需求都是在不断变化的。随着企业网络应用的增加、网络规模的扩大,都将可能需要提高服务器的性能。这时就可能需要安装更多的内、外部组件,如扩展处理器数量、扩展内行,容量、扩展内/外部硬盘数量、扩展网卡容量,以及扩展其他内/外部板卡设备等。
在管理方面,普通PC机一般是不提供太多的工具软件的,最多是像温度、风扇转速之类的监控,这对于企业服务器来说是明显不够的。在专业服务器中,通常会提供各种功能强大的专业系统监控和网络管理工具。这些专业工具不仅可以全面监控服务器系统本身,而且还可管理连接在服务器上的网络设备,甚至用户。这是普通PC机无法实现的。
网站服务器对网站服务器的系统可靠性、系统可用性、扩展性、便捷性、可管理性等方面需求很高。所以企业在建站时选择服务器,也一定要先了解清楚服务器的性能。
linux运维监控工具有很多,常见的工具如下:1 zabbix:是一个基于Web界面的提供分布式系统监视以及网络监视功能的企业级开源解决方案。Zabbix能监视各种网络参数,保证服务器系统的安全运营,并提供灵活的通知机制以让系统管理员快速定位,解决存在的各种问题。
2 Nagios:是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的状态,交换机路由器等网络设备,打印机等。在系统或服务状态异常时发出邮件或短信报警时间通知运维人员,在状态恢复后发出正常的邮件或短信通知。
3 Anturis:是一个基于云平台的Saas平台,可监控Windows、Linux服务器,网站和IT基础架构,通过全面的监控解决方案列表,让管理员快速了解整体主机或者服务器瓶颈与风险。
4 SeaLion:是一个基于云的Linux服务器监控工具,也是通过统一的仪表盘监控所有服务器指标,它只需几分钟即可完成设置,具有即时报警功能。
5 lcinga:是一个免费的开源监控系统,可以检查服务器资源的可用性,它会记录服务器问题并在停机的时候通知您。
6 Munin:是一个网络和系统监控工具,可帮助您分析服务器资源趋势,旨在成为一个即插即用的解决方案,安装后无需太多额外工作即可收集关键信息。
7 Monit:是一个用于管理和监控Unix系统的开源工具。可以进行自动维护和维修,如果出现错误情况,还可以自动触发保护行为。
8 Pingdom:可以对互联网上很多地方的服务器以及网站进行监控,以保证他们可以有效的运行;通过Pingdom,可以对电子邮件的服务器、FTP服务器、受密码保护的那些网站进行监控。
对于一台服务器而言,一个非常重要的方面就是它的“可用性”,即所选服务器能满足长期稳定工作的要求,不能经常出问题。其实就等同于Sun所提出的可靠性(Reliability)。
因为服务器所面对的是整个网络的用户,而不是单个用户,在大中型企业中,通常要求服务器是永不中断的。在一些特殊应用领域,即使没有用户使用,有些服务器也得不间断地工作,因为它必须持续地为用户提供连接服务,而不管是在上班,还是下班,也不管是工作日,还是休息、节假日。这就是要求服务器必须具备极高的稳定性的根本原因。
一般来说专门的服务器都要7X24小时不间断地工作,特别像一些大型的网络服务器,如大公司所用服务器、网站服务器,以及提供公众服务iqdeWEB服务器等更是如此。对于这些服务器来说,也许真正工作开机的次数只有一次,那就是它刚买回全面安装配置好后投入正式使用的那一次,此后,它不间断地工作,一直到彻底报废。如果动不动就出毛病,则网络不可能保持长久正常运作。为了确保服务器具有高得“可用性”,除了要求各配件质量过关外,还可采取必要的技术和配置措施,如硬件冗余、在线诊断等。
如需了解更多,请访问蛙云官网wayuncn
专业领域十余载,倾情奉献
一次沟通,终生陪伴
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)