如何提高IT运维水平?

如何提高IT运维水平?,第1张

ITIL即IT基础架构库(Information Technology Infrastructure Library,信息技术基础架构库),这玩意儿跟运维有很大的关系,是一套标准和规范。适用于IT 服务管理(ITSM),为企业的IT服务管理实践提供了一个客观、严谨、可量化的最佳实践的标准和规范。

ITIL诞生于国外,当时是需要针对部门人数众多,对业务保障要求高的电信、金融等行业的IT和业务进行有序化,透明化的管理,所以诞生了 ITIL标准。ITIL标准的核心思想是通过将IT管理流程化,提高工作人员的工作效率,提高IT服务质量,更好的让IT系统为业务提供服务,从而为业务系统的稳定运行保驾护航。ITIL标准的底层是对IT基础设施的管理,最上层是对业务系统的流程化管理。

ITIL可以将IT部门的运营效率提高25-30%,同时带来以下商业价值:

确保IT流程支撑业务流程,整体上提高了业务运作的质量;

通过事故管理流程、变更管理流程和服务台等提供了更可靠的业务支持;

客户对IT有更合理的期望,并更加清楚为达到这些期望他们所需要付出的成本;

提高了客户和业务人员的生产率;

提供更加及时有效的业务持续性服务;

客户和IT服务提供者之间建立更加融洽的工作关系;

提高了客户满意度。

当前国内IT运维管理现状

从IT运维管理的由来和两者的关系不难看出,当前国内大多数IT服务厂商强调的IT运维管理概念,其实就是在网络管理基础之上的拓展,包涵的范围不仅限于网络管理,是对整个IT系统和业务所涉及到的范围进行运维管理。但各IT服务供应商的产品对这个概念的体现不尽相同。至少在目前,实际上它还是网络管理(或者称之为IT基础架构管理)外加部分应用服务管理和业务管理的含义,只是说法不同而已。

随着企业IT系统的日益成熟和复杂,企业的关注点已从单点管理到综合管理角度的转变,从关注单一网络到对业务系统的关注。原因在于,越来越多的企业意识到,业务系统涉及环节逐渐增多,单一的网络运维管理已经不足以满足管理需求,需要落实如何保障业务系统的各个环节。在满足对IT资源进行统一管理,降低运行成本、提高突发事件应对能力、提高服务质量和效率的基础上,更需要保障业务系统的正常运行,才可以保证IT投资的价值体现。同时,在国内IT 管理领域,伴随着用户IT规模的扩大、IT技术的发展和用户需求的提高,原有的网络管理系统已经远远不能满足当前的用户需求。

在这样一个前提下,IT运维管理的概念和产品被国内知名的网络运维管理厂商率先推出。可以说,它的出现就是对当前用户需求的一种有效诠释。这个时期的IT管理,被称之为IT运维管理,这时候的IT管理人员称之为IT运维人员。

ITIL与IT运维管理的关系

ITIL与IT运维管理的关系ITIL诞生于国外,当时是需要针对部门人数众多,对业务保障要求高的电信、金融等行业的IT和业务进行有序化,透明化的管理,所以诞生了ITIL标准。ITIL标准的核心思想是通过将IT管理流程化,提高工作人员的工作效率,提高IT服务质量,更好的让IT系统为业务提供服务,从而为业务系统的稳定运行保驾护航。

就像文章开始说到的一样,企业最初设定IT部门进行IT管理的目的,就是希望通过IT部门能够发现和解决各种来自底层基础设施的问题,从而为保障网络的正常运转,为企业提供优质的IT服务。但随着企业IT系统和业务的不断发展,企业用户发现,单纯的通过对底层IT基础设施管理无法解决底层网络与上层业务系统之间的脱节问题。这也就是ITIL标准当初遇到的问题,最初主要是用来对IT部门的人员进行流程化和规范化的管理的,但它忽视了对底层平台的管理及对业务系统的保障,脱离了用户实际需要的ITIL,就像是空中楼阁,高不可及。近年来,为了更加贴近IT运维管理部门的工作需要,ITIL开始与企业的业务系统保障结合起来,形成了所谓BSM的管理模式,目的是使得ITIL能够更好的为企业的IT运维管理提供服务。

但问题在于,无论从哪个角度来讲,ITIL标准仅仅是一套方法论,没有告诉我们具体的流程该怎么做。而实际上这个流程是建立在对日常IT管理过程中,如何发现问题,如何解决问题的经验积累的基础上。但企业要实现ITIL需要的是结果,不会过多的关注这个过程怎么样。因此,这就需要IT管理的供应商来解决这个问题。那么,怎么发现问题,又怎么解决问题,这就需要通过IT管理供应商提供的IT运维管理系统来解决。通过IT运维管理系统来发现和解决各种来自IT系统的问题,保证企业的网络和运行在网络上的业务系统正常运转。在这个过程中,进行不断的经验积累,然后才能在此基础上实现ITIL的流程化管理。

在未来的网络运维中,网络运维部门或者机构应该主动地去适应这种发展趋势,除了苦练内功、提高维护效率之外,更重要的是如何加强人性化服务,提高用户可感知的满意度。一方面维护队伍要加强对各类网络中相关设备和应用系统的熟悉程度和维护水平,另一方面,网络运维部门或者机构的维护力量和社会力量在网络运维方面尝试合作将是一个新的趋势。 IT运维管理软件的标准指标 对网维护管理的要求应站在企业的高度,从多方面进行简要的逻辑分析。立足运营资源、运营能力和核心流程,网络运维管理标准指数可分成三类:第一类是关键性能指标KPI(Key Performance Indicator),反映网元层设备的性能。第二是关键质量指标KQI(Key Quality Indicator),由不同网元设备的KPI值集合而成,反映单一业务的质量。第三为服务等级协议SLA(Service Level Agreement),由KQI值集合而成,分成内部组织间的等级服务协议和最终用户间的服务等级协议。从这三类指标可看出,网络维护管理与引进的设备质量、网管系统质量、不同部门间的协作管理密切相关。 IT运维管理软件的优势 为了满足企业IT运维管理的类似上述需求,一款好的网络运维管理软件,是基于ITIL的最佳实践经验,为用户提供运维管理流程,并提供了基于ITIL的岗位定义、流程设计工具、表单设计工具、基于ITIL的流程模板和各种元素库,帮助企业在进行IT运维管理工作时,不仅能够有效的、有序的进行事故管理、问题管理、配置管理、变更管理、发布管理,达到服务支持的目的,也能够提供服务级别管理、可用性管理、能力管理,达到服务交付的目的。 除此之外,还提供了报表及KPI。报表按照服务台&事故管理、变更管理、配置管理和发布管理进行分类展示,并支持首页展现公告信息、外出信息、待办、待阅等信息。 提供的上述功能在很大程度满足了业务发展和用户的需求对网络运维管理提出了较高要求。业务创新必须与业务提供方式、业务保障方式统一协调。提供个性化、多样化的综合服务是可持续发展的必由之路。在运维管理观念上,强化维护就是服务,是面向客户服务的重要环节,是核心流程的重要组成部分;在组织管理模式上,应以核心流程最优化为核心,在均衡协调水平流程与职能组织管理的基础上寻求效率与成本的最优化;在管理指标上,应提炼并完善KPI、KQI、SLA各项指标,作为综合考核的依据。 目前,网络运维在管理模式、服务指标、运作效率、维护成本等方面已经取得了明显进步,但仍存在较大的发展空间。在技术条件具备的前提下,应逐步实施由分散化的管理转向集中化管理。 全方位IT运维管理软件提升网络效率 目前网络的运维管理总体上还落后于业务的发展。这有技术方面的因素,但更多的是管理方面的原因。应通过规范建设符合要求的网管系统,根据网络发展规模和业务系统的需要系确定合理的运维管理模式,明确KPI、KQI、SLA指标及其内在的相互关系来优化网络运维。 在网管系统建设方面,网的核心层、汇聚层网络由于设备制式相对单一,网管系统基本设备随设备引入,网络设备的这些特点,决定了对其管理与监控的难度与复杂性。宽带网管系统功能应满足业务、网络管理的需要,对宽带接入网管系统的要求可以归纳为:1可扩展性与稳定性。网管系统体系结构能根据宽带网的发展规模进行平滑系统升级与扩容,对规模较大的网络能够进行全面监控与管理;稳定性高,满足运营要求。2安全性高、可靠性强。3可用性。能对设备、资源、终端用户实现有效管理。4系统开放与标准化。提供灵活简单的接口便于与宽带运营系统的其他子系统(业务支撑系统)进行有效的互 *** 作,同时能对多个厂家设备进行有效的监控与管理。 在运维系统、管理模式健全的情况下,必须确定相应的运维管理指标,并组织实施基于运维的价值链,确定KPI、KQI、SLA指标及内在相互关系,不断满足客户的要求。 业务与IT运维管理软件协调一致 由此可见,运维管理应立足于业务价值链去构建合理的服务模式、运维管理模式,网络设备规范性、稳定性以及网管监控系统的标准性、可用性提供技术基础,将促进业务发展的速度。目前的运维管理的标准化模式、考核管理指标是至关重要的。业务开展与运维管理协调一致才能发挥综合运营优势。建设标准化的模式可以减少各地在运维过程中不必要的探讨和试验,网络运行过程中,同步进行运维管理的策划、事件。

多结合实际案例,建议结合IT运维管理软件来逐步提升。

一款好的软件会让你事倍功半,比如易维帮助台,整合了多种渠道以及请求,还有故障统计分析报表等功能,使沟通协作更加紧密,对故障/请求的响应-解决-跟踪-监控-分析等更加及时有效,对供应商、IT部门工程师的服务水平和工作绩效进行量化、监控和考核。能从流程、组织结构、应用场景等方面适配你的应用

现在的企业几乎都是互联网办公,网络一旦出现问题,会对公司业务造成重大损失。而很多公司主业也不是IT,对网络问题不大懂,对于公司的网络问题往往都是请一个运维工程师处理。这些工程师有相应的专业能力,但管理人员的“不懂行”却让运维工作存在很多问题,主要有这五点:

1、缺乏有效的知识积累和共享,造成 *** 作维护效率低下,类似的故障和问题仍然在不断发生,不断解决着,同时一旦某些掌握关键信息和技能的人发生意外状况(如生病,离职等),整个日常维护可能面临严峻的考验。

2、工程师的维护职责不是很清楚,每个人都大概知道自己该做什么,但是某个具体事情到底该谁负责,却没有明细定位。

3、IT网络运维人员大多没有养成记录习惯,每个月汇总报告时,对自己的工作量、所维护系统的整体情况还是一头雾水。而且纸质的故障处理报告信息要素不全,统计和查询都是头痛的问题。

4、运维人员几乎很少能准时下班,处理突发技术故障的事情也时有发生。运维人员往往像“救火队员”一样去处理故障。 在“救火式”的IT管理维护模式下,很难有效地进行服务管理,无法保证IT服务的有效性和一致性,IT管理往往处于无序状态。

5、对于运维工程师的工作绩效缺乏客观考核依据。他们到底做了哪些事情哪些事情还没有做工作完成的时效性怎么样解决问题的质量怎么样这些问题,只能凭印象得出一个个模糊的答案。

如何解决以上问题

如何解决以上提到的问题是目前许多企业用户需要解决的问题,但首要关注的问题应是如何建立专业化分工的IT运维体系。

1、细化用户角色,力求提高运维效率

运维人力分工管理包含人员、岗位、角色等信息,如果这些信息没有统一规划,就无法进行统一配置。网络管理中的角色是根据ITIL标准进行划分的,是把IT运维各种事情(包括人员、资源、突发事故)分成不同级别和不同运维 *** 作,以便有效的配置运维人力资源。因此,对于企业而言,IT运维的专业化分工本质上是对IT运维人力资源配置的优化。例如,明确运维事件分级处理流程,明确运维人员的职责、权限、义务和绩效考核标准。事实上许多实践也证明,明确每种运维事件的专业化分工处理流程,可以大大减少IT运维 *** 作的随意性和混乱性,并能大大提高运维中的人力资源效率。

2、设立IT运维服务台,规范IT流程

在网管软件中,一般提供自助服务和运维服务台,自助服务台的作用是,给用户报故障,评价IT人员解决问题是否负责等。运维服务台是为了确定运维等级和引入优先处理原则。运维服务台主要承担:运行值班、故障监控、接受请求、工单派发及问题解决过程中的监测等工作内容。服务台就像是传统产业生产车间的调度分配员,它会不断的根据事件的等级进行匹配分工和调度。例如发生任何一个突发运维事件时,服务台会先检查并进行分类流转处理。运维人员可分为一线普通维护、二线技术专家和三线厂商专家。一线人员作为第一级问题处理人员,主要解决常规的运维问题;在一线人员不能解决的情况下,二线技术专家将迅速介入问题解决过程;三线技术专家来自产品供应商,由二线技术专家申请三线厂商专家的介入,使问题解决时间能够大大缩短。

3、FAQ和知识库,最大限度节省人力成本

提供FAQ和知识库两种方式,知识库是指对网络运维中的典型故障事件和常见问题解答的自助式处理流程。当出现故障时,用户先在自助式知识库寻找解决方法。如果问题没有得到解决,则用户利用服务台申请维护,用户申请将会移交给相应的负责人,负责人第一时间建立服务档案并一直实时监控,直到问题得到圆满的解决。因此,自助式知识库能帮助运维人员节省大量的时间,从而节省人力成本支出。

最后,专业的事情要用专门的人员来做,还要配合专业的方法。运维工程师是以技术为主的群体,他们往往关注于IT问题本身,主要通过提升自身技术实力来解决问题,不太关注技术之外的事情。这种情况下不可避免的会出现一些问题,这就需要管理人员来解决了。

IT运维管理系统至少应该具备下面几个特点: 统一的运行展现:可以给运维管理人员提供网络管理、业务应用管理、机房环境等资源监控系统的集中展现与处理平台,这即方便运维人员 *** 作,也解决了IT系统的统一协调问题; 问题的管理功能:可以帮助运维人员查明突发事件或错误产生的根本原因,并制定解决问题的方案和防止错误再次发生的有效措施; 变更的管理:通过分析、计划、执行和回顾四个阶段,最大限度控制变更的风险,保持企业IT部门和客户之间的信息沟通,这不但降低了对人的依赖,而且还实现了运维的量化、标准化管理。

根据我10几年的经验,做好高效IT运维,应该从以下几方面着手:

转变思想观念,培养业务意识

业务意识是一个说起来容易、但做起来很难的事情,网络上流传的一个经典的不同薪水秘书的工作描述,就是业务意识的一个具体体现。培养业务意识的一个基本方法是经常思考自己的工作如何对业务产生帮助,下图是一个标准的IT运维工程师每天面对的事情,不同的意识产生不同的工作效果。

IT工程师每天要处理大量的基础设施故障和性能问题,工作强度大,技术更新快,经常把自己搞的疲惫不堪。工程师们需要从业务的角度来思考自己的工作,也需要从业务的角度来展现自己的工作。

如上图所示,IT工程师通过对基础设施的维护工作,看到的不是简单的CPU、内存和磁盘的使用率,而是IT对业务的影响,看到的是产品开发进度、订单流程、供应商的效率等等,IT工程师就获得了成长,完成了思想的转变,建立了业务的意识,具备了职业更上一层的条件。

2 时间优先,兼顾成本

时间和成本是做决策时需要考虑到的两个基本因素,生活中每天都要面对,比如要不要上新东方的英文培训班,要不要上达内的IT培训班等等,都会涉及到时间和成本的分配问题。

很多人认为“成本”是其中需要第一考虑的要素,然而过多考虑成本的结果就是会失去很多的机会,无论个人还是企业都是如此。所以IT工程师在考虑日常工作的时候,要积极参与企业的IT决策,更多的从时间的角度来考虑问题。

比如在考虑IT管理类产品的时候,就会面临开源产品和商业产品的考虑,开源的产品初始成本低,后续成本高,出了问题全靠自己摸索;商业产品初始成本高,后续成本固定,有原厂商的支持,可靠性好。引入开源产品,短期内看起来好像帮助企业省了钱,长期来看,企业付出的成本更高。另外,当工程师沉溺于开源产品的学习和使用的时候,个人失去了培养业务意识的大量时间,即使把开源产品用的非常好,也不会给企业创造更多的业务价值。

3 多看行业报告,培养前瞻性思想

行业内的一些公司,比如Gartner、IDC、Forrester等经常性的会发布对于行业前瞻性的预测报告,工作之余,多看看这些报告,就会保持对行业未来和新鲜知识的敏感性,敏感性又会培养对行业和工作的洞察力,而洞察力是领导者需要具备的基本特征,有了洞察力,就距离职业晋升又进了一步。

4 多学习,多培训,多考证

现在提倡终身学习的理念,尤其在快速变化的IT领域,不主动学习就会落伍,所以要多多参加培训和学习,在年轻的时候攒钱不是第一位的,培养个人能力,获得职业提升是更重要的。IT工程师们在向金字塔顶端发展的过程中,需要学习的东西是非常多的,如:项目管理、ITIL管理实践、ITOM/APM/NPM/ITOA/DevOps/BSM/ITSM、各种层出不群的新技术等,各个细分领域存在大量的专业知识和技能需要掌握。

5 提升职业贡献

在转变思想观念,提升个人职业技能的同时,还要经常想办法来提升个人的职业贡献,获得职业晋升和薪水翻倍的最重要一点还是要看职业贡献。职业贡献和岗位是紧密联系在一起的,转变了工作意识,提升了职业技能,一方面在同样的岗位上可以为公司做出更多的贡献,另一方面也会获得新的重要岗位工作的机会,为公司做出贡献的机会大大增加。

以上就是关于作为运维人你还不知道ITIL吗全部的内容,包括:作为运维人你还不知道ITIL吗、IT运维管理软件的优势有哪些、如何提高IT运维水平等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/langs/8850631.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-22
下一篇2023-04-22

发表评论

登录后才能评论

评论列表(0条)

    保存