
如何提升IT运维工作便利性
方法/步骤1结合IT运维中的重点难点热点问题,深入推进IT运维自动化工具的开发。
2实现设备的远程监控和批量 *** 作、资源变更的自动发现等功能。
3安全整治完善批量化运维 *** 作的手段,适配更多相对复杂的场景,完善自运行、自验证的相关功能。
4建立智能分析、故障预判发现等单场景、多场景的智能运维能力。
5进一步推进口令集中管理范围,实现强制性的统一认证、密码的动态化管理。
6建立账号及口令管理的长效机制,消除弱口令。实现自动化运维能力,单场景、多场景的AI运维能力
7基础设施信息通过手机应用等方式,实现CMDB的IP、归属等信息的方便查询,方便一线日常运营维护。
由于信息技术的渗透性和先导性,信息技术已成为国内外企业战略决策的制定和调整、生产经营过程中的计划、组织、管理和控制不可或缺的重要工具以及公司核心技术的主要载体,信息技术促进了生产经营过程的集成化和科学化,从而成为各公司降低成本、维持技术领先地位的战略举措。
近年来,国内外各企事业单位都十分重视信息化建设,把加快信息化建设作为提高生产经营管理水平、促进业务流程优化、加强内部控制、提高决策质量和效率的重要手段。结合中国石油发展战略和业务需求,中国石油出台了统一的“十一五”信息技术总体规划,F5(企业信息系统管理)项目便是“十一五”信息技术总体规划中的一项,目标是建立集成的监控管理平台和统一、完善的运维管理体系,提高中国石油信息技术基础设施的可靠性和性能,从而保证中国石油各业务系统的高可用性,彻底改善IT服务的管理水平,提高客户满意度,降低IT服务支持成本。
被动的传统IT运维管理
市场研究机构Gartner调查发现,在导致IT基础设施出现故障的原因中,源自技术或产品方面的因素其实只占了 20%,而因为运维管理方面的原因则占到80%,可见IT系统运维及管理是相当重要的。企业每年对IT部门投资都不少,但是得到的效益却没有体现,问题仍然时常发生,感觉好像所有的投入都打了水漂。
企业的IT运维部门是一个吃力不讨好的部门,因为IT运维就是在后台默默地保证信息系统的正常运行,只有在问题发生的时候才想到还有IT部门的存在。这种现象是由于IT运维管理还处于传统模式,即无相应的运维监控软件或者是仅仅单独使用某项监控软件而没有联合使用。这种传统的IT运维管理是被动的管理,是孤岛式的管理,是与业务应用没有联动的管理。
1被动管理
传统的IT运维管理是救火式的管理。通常是用户先于IT人员发现问题,然后再找到IT部门要求解决问题。这是由于传统的IT管理采用人工方式管理基础设施,网络管理是从各种IT基础设备出发的,仅仅是保障各类IT设备如服务器、数据库、存储设备、交换机等等基础设施的正常运行。
不采用任何管理软件,仅仅靠运维人员定期轮询,或者执行某项命令来检查设备,在系统规模较小时,只要参与运维的技术人员足够负责,人工运维方式是可以满足日常运维需要的。但是,当应用系统达到一定的规模后,这种运维方式的弊端就暴露出来了。轮询一遍要花费几个小时,这样,轮询周期越长也就代表越需要更久才能发现故障。这种被动式管理IT导致有了问题不能及时发现。
2 无关业务、孤岛管理
有些企业虽然采用某一种或几种监控软件来监控IT基础设施,但这些监控软件都各自独立运作,没有进行对业务的整合监控。如果用户投诉业务应用不畅通,很难定位故障源,到底是网络、应用程序、数据库还是其他后台系统出了问题,或者是各部门踢皮球,都说自己所负责的设备正常
好一些的IT主管会把各个部门集合到一起开会,讨论问题根源。传统的IT运维管理方式是各类设备的管理各自为政,丝毫没有关联性。处理故障不便于追根溯源。每个人的精力有限,在专业应用系统赖以生存的各基础设施支撑单元上很难做到专、精、准的多面手角色,加之由于管理范围的界定和监控手段的限制,运维人员很难直接判定问题是出在基础网络、系统服务器、数据库还是应用系统自身,故障难以定位将直接导致业务恢复时间的推迟,影响业务系统的正常运行,大大降低服务质量。
将IT运维与业务相关联
IT运维是在后台默默地保证各项业务应用系统的正常运行。IT运维工作是无形的,怎样把这种无形的运维变为有形、甚至量化,这就要把IT的运维与业务相关联。传统的IT运维管理中,基础设施的运维工作不能和业务相结合,仅仅是在设备管理的层面上。这就导致IT管理的成绩没有体现。想想看,如有业务应用不正常,那网络或者服务器之类的任何一种基础设备的正常运行又有什么用呢业务应用是“1”,设备是“0”,没有了正常通畅的业务应用,那其他的都是空谈。只有在业务应用畅通的前提下,基础设施管理才有意义,才能体现IT运维管理的价值。
因此我们需要帮助企业IT:部门了解用户使用感受,关联真实用户感受和系统性能,指导问题事件定位和原因诊断 。
企业信息化发展过程首先是基础架构建设阶段,这个阶段主要是采购一些硬件和应用软件。随着采购的不断扩大,企业的IT组件不断完备,IT系统初具规模,这就产生了IT运维和管理的要求,即网络和系统监控(NSM)阶段,监控网络连通性和系统可用性,此阶段主要还是对IT设备的监控。随着企业业务日趋复杂,IT系统进一步扩大,这时就产生了对IT服务流程进行管理的需求,上升到第三阶段,即IT服务管理(ITSM)的阶段。以上三个阶段都是IT间接产生业务价值的阶段,对业务的顺畅起辅助监控的作用。
企业业务系统对IT系统依赖的不断增强,企业开始关心IT服务对业务带来的影响,强调从业务目标角度出发来管理IT,也就是到达第四个阶段――IT与业务融合的阶段,即BSM(Business Service Management,业务服务管理)阶段。企业可以根据业务目标对IT服务进行调整,以确保IT能够支持业务目标,从而直接产生业务价值(如图2所示)。
如今各类重要的IT应用系统相继在中国石油发挥着举足轻重的作用,所以IT应用系统的可用性尤其重要,例如ERP、OA、邮件、门户等各类重要的系统如果出现中断,都会给企业造成大量的经济损失,所以除了需要对各类应用系统部署冗余的设备以备保证其高可用性,同时也需要对应用系统进行监控和管理,并且进行关联管理。业务系统的可用性是由底层的各类基础设施的状态所决定的,因此建立一个有效的业务模型,将与某个业务相关的底层IT基础设施关联起来,该业务模型能够有效地定位故障根源。这样ERP的管理员只需要关心ERP业务的可用性,而没有必要去关注每台主机的性能参数和启动的进程,不但大大节约了运维时间,而且也提高了运维效率,使故障持续时间大大缩短了。
基于BSM的IT运维
当前中国石油IT运维管理的需求就是从业务出发,建立基于BSM解决方案的新型IT运维。
新型的IT运维管理系统要做得到的就是基于BSM架构的业务管理。
首先,要实时掌控最终用户对IT服务的使用体验,根据制定好的SLA(Service Level Agreement,服务等级协议)来管理业务服务的质量,这样就可以根据业务影响和SLA来对IT服务进行管理。
其次,通过端对端的应用交易时间测量,实现业务要求端对端的可见性;从最终用户的角度,来测量业务服务的响应性能,主动帮助运维人员在第一时间发现问题,以便在问题对用户造成不利影响之前,及时得到隔离、诊断和修复,把它们对业务的干扰降到最低。
第三,提供业务服务、应用及底层IT系统构架部件之间的映射关系。这种解决方案通常会基于一种称为CMDB(Configuration Management Database,配置管理数据库)来实现。通过服务依存关系映射技术,来展现业务服务、应用和底层IT系统构架部件之间的动态关系,这样就增进了对各种IT元素的掌控和理解。
第四, 借助业务服务与IT基础设施的依存关系,对告警事件进行管理。当IT系统的组件产生告警时,结合收集上来的底层的IT系统告警事件,对它们进行过滤、关联、聚合,根据对业务服务影响的严重性,来进行排序处理。
传统意义上的CMDB是服务流程中的一部分,是ITIL中最重要、最核心的概念之一,在以业务为核心的IT运维中,CMDB也是业务建模的主要工具。CMDB通过自动发现工具收集和一定范围的IT基础架构基础信息,包括配置项和关系,建立IT基础架构模型;并通过端到端的业务服务拓扑图来可视化展示业务系统所有部件和关联关系。
把这四方面的功能整合起来,从最终用户的角度来衡量业务影响和风险;自动发现业务服务、应用和底层IT系统构件,并建立依存关系;理解用户感受,监控用户业务响应时间 ,在用户受影响之前发现问题,以求满足下列功能:
1 通过基于角色的业务视图,提供业务流和服务的可见性;
2 从最终用户的角度来衡量业务影响和风险;
3 设置和检测业务过程的SLA,了解应用性能对业务的影响;
4 24×7小时端到端监控,从浏览器到后台实时监控所有交易;
5 理解用户感受,监控用户业务响应时间 ,在用户受影响之前发现问题;
6 主动发现和按优先级管理关键业务问题;
7 通过自动把业务和底层运营信息建立关联来缩短平均问题修复时间;
8 自动发现业务服务、应用和底层IT系统构件,并建立依存关系;
9 通过联合的CMDB,来为IT环境提供一个“统一的真实数据”视图,这样就可以为用户提供一个主动的、以业务为中心的BSM解决方案,帮助用户极大地改善业务服务的性能和可用性,降低服务突然中断带来的风险。
提升IT部门的作用
以前,IT运维部门救火队式的混乱状况导致无法判断IT运维总体表现的好坏。而IT部门又是公认的成本中心,这就导致了在很多企业中IT部门总是承受着很多批评,IT人员的工作热情也不高。
而现在,IT运维部门实现了主动发现问题、提前处理故障;IT运维管理与实际的业务应用挂钩,IT运维部门的工作由无形化为有形;促进IT部门从成本中心向利润中心转变,这一切既有利于IT人员发挥其工作热情,也有利于IT部门在整个企业地位的提升。
中石油的IT运维管理就是要基于BSM模式来建设,F5项目就是要实现基于业务来管理IT,也就是要提高信息技术基础设施的可靠性和性能,降低支持成本,对基础设施的规划进行最佳的决策和采用更好的系统支持策略。同时,获取与业务运行相一致的信息技术服务与实践,整合网络、系统、数据库和应用系统管理等关键业务,从而服务于数据大集中趋势下数据中心运维模式的建立和各专业应用日常运维的需要。
随着全球经济一体化时代的到来,信息技术服务行业标准已经成为打造良性市场竞争与促进经济发展的重要战略工具。10年前,欧盟、美国、加拿大的标准化战略相继出台。2006年,日本也由首相亲自组织研究制定本国的国际标准综合战略。
从各国对标准的重视程度可以看出,国家信息技术服务标准的出台,对整个行业的发展,乃至全国经济具有举足轻重的作用。
标准出台势在必行
目前,我国在信息化基础建设方面取得了举世瞩目的成绩。信息化基础建设初级阶段的完成,使企业对IT运维服务的需求急剧提升,旨在保证企业IT系统稳定运行,助其发挥极大效益的IT运维服务迎来了发展机遇。不过,由于整个市场缺乏统一标准与规范,用户无法明确传递服务需求,也不能清晰衡量定义服务价值和质量,再加上服务商服务水平良莠不齐,极大制约了我国的IT服务产业的发展。因此,国家出台IT信息技术服务标准势在必行。
2009年4月23日,为规范和引导信息技术服务业的发展,工业和信息化主管部门在京成立信息技术服务标准(ITSS)工作组(以下简称工作组)。工作组的主要任务是根据我国信息技术服务业发展现状和趋势,提出信息系统建设、信息技术运维、信息技术服务管理、信息技术治理、软件即服务(SaaS)、软件应用服务等方面的标准需求,研究并建立我国信息技术服务标准体系,制定信息技术服务领域的相关标准。
据悉,此次标准制定工作在借鉴ISO20000、ITIL等国际标准和规范的同时,还结合了我国信息技术服务业发展现状,提出了符合我国实际国情的信息技术服务标准体系。东南亚的一些国家表示,在我国信息技术服务标准出台后,他们可能会借鉴我国的标准。这是国际对我国即将出台的信息技术服务标准的高度认同。
IT运维服务标准或打头阵
在系统集成资质十周年大会上,《信息技术服务标准(ITSS)白皮书》(第一版)正式发布,标志着我国IT服务标准进入了标准出台前的准备阶段,信息技术服务业标准缺乏的局面将逐步改善。
据悉,用户呼声最高,进展颇为顺利的IT运维服务标准或有可能率先推广认证。此次IT运维服务标准由工业和信息化主管部门牵头,神州数码集成服务SBU作为运维专业组组长单位,组织相关国内龙头企业及产学研用多方编写制定。该标准围绕用户和服务商在运维服务过程中的关键要素,从IT运维服务组织准入条件和相应能力,交付管理、服务响应、数据中心规范、桌面及外围设备规范等方面着手展开。用户可参照标准选择和评价服务商的IT运维服务能力及水平,明确服务内容和价值,确保服务满足自身IT运维服务需求。服务商如能遵从标准示范,构建适用的运维服务体系,则能够有效提升自身IT运维服务能力和水平。
IT运维服务相关标准的推出将帮助IT运维服务行业形成长效机制,提升整体IT服务市场的经济效益,促进IT服务产业蓬勃发展。
标准出台促行业健康发展
为使IT运维服务标准能够真正服务于供需双方,并促进IT运维服务市场健康持续发展,在标准制定过程中,以神州数码为首的IT运维服务标准工作组充分尊重行业发展规律,提供了适宜合理的运维服务组织能力评估关键指标和运维服务相关标准规范,确保了大多数立足用户,注重发展的企业能够以健康有序的状态提升自我能力。目前,我国大约有1万余家IT服务提供商,其中大部分是中小型企业。随着IT运维服务标准未来的出台与落地,一些资质缺失、能力落后、客户服务意识淡薄的企业必然会被淘汰;而从长远来看,通过运维服务标准充分发挥业内优秀企业示范作用,形成优胜劣汰,将实现更为有效的资源配置,有利于IT运维服务行业整体竞争力与客户价值的提升。
信息技术运维服务标准专业组负责人、神州数码集成服务SBU服务产品部总经理马洪杰表示:“目前,服务产品化、标准化和品牌化已经成为IT服务行业的趋势。在IT运维服务标准制定过程中,神州数码集成服务SBU与其他兄弟企业一道,对我国IT运维服务市场的现状进行了深入探讨,并在标准需要具有的广泛性、公平性和实践性等方面形成共识。IT运维服务标准的出台,将切实服务于用户和企业双方,帮助服务行业形成长效机制,为服务产业的长期、稳定、高效发展奠定基础。”
关于市场和IT合作的障碍,有三分之二的市场高管认为,首要的原因在于IT部门给予他们的优先级不够。
只有四分之一的市场高管在选择和部署市场解决方案时考虑到企业的IT部门、呼叫中心及后台办公支持。
报告还摘录了一些受访者的话:
一位IT高管说:“市场部门把特定的项目看作是结果,而不是已经存在可以重复使用的系统。” 一位市场高管说:“市场团队的活动,经常受到IT部门支持不力或者系统问题的困扰。”
只有4%的市场高管和7%的IT高管认为自己“抢占数字市场信心十足”。CMO Council副主席Liz Miller说,她所接触到的高管,很少会去接触最前沿的技术,他们只是在试图追赶竞争对手。
Accenture的数字市场分析师Brian Whipple说,技术变革的实现――例如改进分析能力,增加社交网络和移动设备等新的数据源,加强整合――通常都是落后技术本身6~18个月的。他们为此推出了“统一数据骨干网”的概念,让客户数据有统一的入口,这样企业可以更加灵活地采集数据,发掘市场机会。
Whipple说,IT部门和营销部门都需要利用好数据。他举了一个网络零售商的例子:这些网络零售商都有足够的网站访问量,所以市场计划就是要在这些虚拟的商店里出售一定比例的东西。在技术实现方面,所有运营需要的性能也都能够满足。
但是,Whipple说,很多用户都花了2~7分钟来看,东西的确都很棒,但依然有很大比例的用户看完之后没有购买就离开了。CMO因此责怪网站的导航设计太笨拙,需要客户填入太多的信息。而CIO则责怪营销策略,认为他们带来的访客都不是会在网上购物的人,完全是在浪费市场资源。
Whipple认为:“这就是典型的例子,他们各自拿着数据按照自己的理解去解读问题原因。”
CIO应该如何做
一些CIO在帮助其公司推进数字市场未来。
United Stationers的CIO Dave Bent让更小的零售商依托于他们的电子商务系统,给分包商一种新的收益源,并提供更好的客户服务。
Royal Caribbean的CIO Bill Martin在使用实时销售数据来检查哪些商品被人购买了,并统计购买者的信息,以便能够提供个性化的服务。
Wet Seal是一家女性服装零售商,其IT和营销团队建立了一个平台,可以在网站上让客户试穿衣服,并可以共享到客户的Facebook上,或者使用iPhone在店里查看关于某件衣服的评论。接下来,他们还规划如何让没有xyk的客户,使用智能手机来付费购买他们的衣服。
Accenture和CMO Council在报告中提供了大量方法来改善CIO和CMO的关系,特别是那些关注数字市场的公司。例如,让CEO参与、认识到没有什么事情能够一劳永逸。CMO Council认为,要在流程的早期开始协作,但不要过于关注这些新技术的测试,因为你永远都跟不上这些日新月异的技术。
差不多,但也不能说完全都是!只不过运维工作在CIO的工作中占有的比重比较大而已。现在国内的企业运维状况基本上就下面两个情况!
1、国内现有的IT运维服务商有超过90%都是做“损坏-维修”服务,比如直接去客户公司解决问题,而在国外这种直接的服务方式成本会很高,并且效率很低下。如果能够通过自动化进行IT运维管理,能够节省大量的成本以及提高管理效率,而卡西亚正是据此提供了一套完整的自动化解决方案。
2、国内并不是没有实现IT运维自动化,只是更多时候是处于初级阶段。
另外关于运维自动化方面,目前有很多的优秀的企业运维自动化软件供应商,平台解决方案也是五花八门的。卡西亚等都是技术比较成熟的典范。卡西亚(Kaseya)是全球领先的 IT 系统管理软件提供商,成立于2000年,总部现位于瑞士洛桑,是一家专注于IT运维管理的IT服务商
以上就是关于如何提升IT运维工作便利性全部的内容,包括:如何提升IT运维工作便利性、业务应用:IT运维管理的核心 把业务指标分解到it运维中、IT运维服务标准即将出台业内企业迎来发展新机遇_IT运维等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)