服务器网络常见故障处理

服务器网络常见故障处理,第1张

服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。下面分别举例说明各类软件故障的维修方法。
有一台HP LH6000R服务器,配置为双PIII XEON 700带2M高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:“Voltage Regulator Module (VRM) over/under-voltage 288V/0V”。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。维护人员立刻使用其它LH6000R上的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。
FIRMWARE升级方法是,在服务器的NAVIGATOR(导航光盘)中提取CPU管理板(CMC)FIRMWARE的刷新程序,程序为FLASHEXE,然后将从网上下载的LH6KCBIN(CPU管理板的FIRMWARE)拷贝到一张DOS启动盘上,用这张盘启动服务器。然后在DOS下运行”FLASH /CMC A:LH6KCBIN”,刷新完成后重新启动服务器后即可。这种升级方法也适合刷新系统BIOS等,只是FLASH命令的参数不同以及更新FIRMWARE及BIOS文件名不同,参数请参考服务器的说明。
任何一款服务器的FIRMWARE及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程序就很完善,而应该经常更新服务器的FIRMWARE及BIOS,只是在升级之前应该小心谨慎,错误的升级方法会导致严重的后果。
目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种 *** 作系统下的驱动程序,方便了客户在各种 *** 作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。
当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序BUG会导致系统速度变慢,CPU占用率变高,无法正常使用某些功能等;驱动程序的BUG会导致死机、与某些软件有冲突,磁盘工作不稳定等。查看管理程序是否出错的最好的办法就是在系统中首先禁止此类管理工具,再观察服务器是否还是异常。由于管理工具是随着系统启动而启动的,所以应首先避免它的启动。以WINDOWS NT4为例,就首先在管理工具服务中禁用某些服务器软件服务,再修改注册表中的启动项即可。如果是驱动程序有问题的话,就以安全模式进入系统,看是否正常。但是需要注意的是,在安全模式中,系统速度变慢是正常的(特别是磁盘I/O方面)。
服务器的管理人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。
相比之下,软件冲突造成的故障判断比较困难,需要管理人员有比较丰富的经验以及敏锐的观察力。
曾经有一位朋友告诉我说,他有一台浪潮的服务器无法安装SQL SERVER 2000,已经重装N次NT了,排除是系统故障。而这唯一的服务器又将作为非常重要数据库服务器,因此非常着急。于是我陪着朋友去了他的公司查看。
这台服务器所在的机房是非常标准、完善的机房,我检查了这台服务器的情况,发现并没有硬件上的故障,于是排除了光驱读盘力差的可能。但是,朋友刻的SQL SERVER 2000光盘引起了我的怀疑,我让他拿出了正版的SQL SERVER安装,结果还是不行。
在安装的过程中,没有出现丝毫错误,可就是在运行的时候会自动退出,没有任何提示。但是,我在管理工具中的事件查看器的系统日志中却发现了一条信息:windataexe导致一个无效的数据溢出。Windata是朋友自己编写的一个程序,而且是随 *** 作系统启动而启动的程序。我立即结束掉这个进程后,再运行SQL一切正常。
对于此类软件故障, *** 作员最好先查看有关的日志,看看系统中是否有可疑的进程。目前的服务器无论是高端还是低端,对于SQL等标准程序的支持是相当可靠的,所以排除的重点就是结束可疑进程。
还有一种软件故障是人为因素造成的,它一般是人为误 *** 作(包括没按 *** 作流程的 *** 作)、意外关机(包括电源突然不供电)或非正常关闭应用程序造成的。
人为误 *** 作因素只要加强管理都可以避免此类故障发生。在这里就详细说明意外关机或非正常关闭程序造成故障的方法。
正常关闭系统程序非常重要,尤其是WEB服务器。我的一个朋友就是因为没有正常关闭系统程序而经历了一次数据损坏甚至丢失的经历。我的朋友是使用的HP web hosting server appliance,因此我向他提供了一些使用规则。
这些方法对于服务器的维护非常有效,主要包括了正确的关闭系统程序、怎样避免数据丢失以及非正常关闭系统后的恢复方法。下面以我朋友的HP web hosting server appliance为例(使用的是UNIX,但思路对于其它 *** 作系统均有效)。
正确关机的过程包括通过按动Power键来使系统断电,你应该一直按住电源开关持续几秒钟才能使系统进入正常的关闭过程中。
另外,为了避免数据丢失,你应该按照如下的步骤 *** 作:
· 经常备份Web Hosting Server Appliance的数据,可以通过网络管理界面来完成。
· 安装第二块硬盘并与原来的硬盘设置成镜像,
一旦Server Apliance未能正确关闭,并无法重起,请按如下 *** 作恢复:
1 当appliance已经断电时,连接一条非modem的串口线(可在机盒中找到)到背面的控制口上。
2 连接串口线的另一头到一台运行Windows的PC的串口上。
3 运行超级链接程序(HyperTerminal),并设置端口的参数为19200, n-8-1, Flow control - None 你可以看到appliance的控制提示,并要求你输入管理员口令。
4 重起appliance,等到提示“LILO boot:”,按住Tab键5秒钟,直到提示变为“boot:”。
5 敲入"emergency"并回车。此时需要耐心等待几分钟。然后,登录提示又将出现,此时,LCD屏又能正常工作了。
6 在LCD屏上选择一个随机的密码(此密码只是用于紧急恢复时用)
翻至Defaults… 并按右箭头键选中。
翻至Root Password…并按右箭头键选中。
翻至Random 并按右箭头键选中,会提示一个随机产生的密码。
记下此密码。
翻至Yes并按右箭头键选中,系统密码会立刻更改。
7 回到超级链接的控制屏,登录appliance,用"root"用户名和刚才的密码,此时会出现“#”提示。
8 为修复分区,请按如下方法 *** 作:
对于sa1100,按顺序输入:
[…]#: fsck /dev/hda5
[…]#: fsck /dev/hda6
[…]#: fsck /dev/hda7
对于sa1120,按顺序输入:
[…]#: fsck /dev/sda5
[…]#: fsck /dev/sda6
[…]#: fsck /dev/sda7
当所有的分区都被修复后,应回到“#”提示符下。
9 输入“reboot”重新启动系统。
如果系统仍无法启动,请记录下控制屏显示的内容并求助技术支持。
对于服务器的软件故障,只要平时管理员注意维护,应该是可以避免的。

众所周知,服务器是需要全年365×24H不间断的运行 ,而且它承载着多种复杂的应用,加之服务器也远在机房内。租用服务器后, 很多用户会碰到各种各样的问题。其中有一些很简单,但却弄的客户苦不堪言的问题,例如服务器频繁重启就是其中一项。耀磊花楹为大家整理了一些常见重启故障以及解决方法,供大家参考。
 一、 硬件问题

 ①  增添新硬件(硬盘、刻录机等)后功率超出电源输入的额定功率。我们可以更换一个更大功率的电源。
 ②  超负荷运行,CUP资源占用过高,需要更大功率供电时,电源由于过载而引起电源保护。同样,可以更换一个更大功率的电源。
 ③  刻录盘/硬盘内部电路或者损坏。由于光驱/硬盘内部电路问题,或者损坏了,就会导致服务器在运行过程中突然重启。这时候就需要我们检查这些硬件设备,进行更换。
 ④  主板故障。主板出现故障的情况很少,一般都是与RESET相关的电路出现故障;插槽虚焊,接触不良。个别芯片、电容元件的损害。像这种比较少见的问题如果发生了,就比较麻烦,需要专业的人员进行检察、维修。
 ⑤  CUP温度过高、内存热稳性不佳。当服务器超负荷运行,或者内部积灰较多,都会导致CUP温度过高,而自动重启。内存当上升到一定温度时,由于热稳性不良,也将不能正常工作,而出现死机或者重启。我们可以经常清洁服务器内部的灰尘,或者改良散热系统。
 二、[endif]软件问题

 ①  病毒一直都是服务器的一大威胁。像感染“冲击波”病毒时,系统会经常提示将在1分钟后自动重启。木马程序可以远程控件服务器的一举一动,当然,包括重启咯。我们需要清除病毒,或者重装系统。
 ②  软件冲突。在同时启动2某两个或者以上的软件时,系统会发生重启。我们可以再启动软件前,打开任务管理器,看个软件的资源占用过高,找到后卸载。
 ③  系统文件损坏、驱动问题。由于 *** 作失误、或者系统自身问题,导致系统文件被损坏,比如Win2000 kernel32dll、win98 fonts这些系统文件非常容易出问题,系统在启动时会因无法加载这些系统文件而强迫重启。面对这类问题,我们可以覆盖安装或者重新安装。
我耀磊花楹

河南耀磊商务

您好!比特捷科技很高兴为您解答这个问提
一、美国服务器系统问题;
因为美国机房注重版权,所以美国独立服务器装的系统都是正版的英文系统,可能大家对英文不是很精通,在使用的时候不是很方便,为此我们负责给你安装简体中文包,这样就可以很方便的管理,一般装的是win2003系统+简体中文包,我们这个系统不收取任何使用费用。
二、美国服务器攻击问题;
美国服务器一般都没有硬防,购买前要咨询清楚如果遇到攻击的情况会怎样处理,如果这点没注意,可能会遭受到机器被没收之痛,机房的一般处理方法是暂时把IP给屏蔽。
三、美国服务器的流量问题;
由于中国和美国的国情不同,国内服务器带宽贵,美国服务器流量贵,美国的服务器都是有流量限制的,在购买美国服务器的时候注意一下机器的月流量是多少,然后根据自己的网站需要,购买合适自己网站流量使用的一款机器。
四、美国服务器故障处理问题;
如果是因为中美海底光缆问题,导致的机器丢包或是其他速度问题,这是客观原因,idc服务商是无力解决的;唯一的方法就是等待处理;如果是服务器不能远程或者要求重启服务器等,我们都会以最快的响应时间为你排忧解难!
五、美国服务器投诉问题;
刚才也提到了,美国注重版权,如果是机器上面放的网站或是软件,被投诉的话,机房处理起来也是比较严肃的,所以之前也需要咨询,机房处理的一般方法是联系客户让客户把被投诉网站尽快转移走,iis上面的域名绑定也删除。

服务器不稳定的主要原因:
一:本地网络问题
如果我们在访问网站的时候突然发现很慢,很卡。我们首先要做的就是检查一下自身本地的网络环境是不是有问题。可以利用ping一下已知的知名域名,ping值出来之后,如果ping值很大,则可能是自己本地的网络环境有问题。反之ping值小,则是美国服务器出现问题了。
二:所在机房问题
网站加载速度过慢时,如果确认本地网络没有问题,还有可能是问题出现在美国服务器所在机房,机房的设备是完善的,但是也不能避免机房出现异常。当机房受到恶意攻击的时候,也会导致美国服务器变慢。另外也要检查一下机房的主干网络是否有异常。如果美国服务器托管了,那么我们可以联系机房的运维人员排查一下什么问题,推荐相关阅读:选择美国服务器应该注意哪些事项
三:运营商国际路由问题
当我们所使用的网络,运行商的路由或者提供的服务出现问题也会导致美国服务器变慢。特别是我们使用国外美国服务器的用户会经常遇到这类问题。当数据在传输的过程中,出现丢包或者无法连接路由时,用到这类网线的美国服务器速度就会很慢。这种情况并不是美国服务器本身出现问题,也不是本地网络出现问题,只需要等运营商修复网络即可。
四:资源不足和美国服务器中毒
我们要知道当美国服务器剩余空间不足时,会导致程序在运行的时候cpu或者内存过载,导致美国服务器速度变慢。遇到这类问题,我们可以尝试优化系统,关闭美国服务器上没必要运行的软件和程序。如果此类事件经常发生,那么我们就应该要升级美国服务器的整体配置了。另外,美国服务器如果遭受到恶意攻击也会导致美国服务器变慢。所以我们选择美国服务器的防火墙和所在机房的安全防护级别也是至关重要的。

造成服务器异常的原因
有好多种
1、服务器所在的机房设备出现故障
2、用户 *** 作不当
3、病毒侵害
4、服务器故障
5、网络故障
二、服务器常见的异常问题及解决办法
1、机房设备故障引发的服务器不能正常运行
在机房配备专业人员做好日常管理和维护,及时检查和购买新的设备或者服务器。
2、用户 *** 作不当引发的异常
公司要雇用专业人员管理和维护好服务器,降低出现故障的几率,以便第一时间能够及时处理问题,降低风险,减少损失。
3、网站打不开、被跳转、网站显示错误等
这时候可以下载专业的正版查毒软件,对电脑进行定期的全面病毒查杀,以绝后患。
4、用户无法打开网页
出现这种问题,可以耐心等候一段时间再进行再次访问,也可以多刷新几遍网页试试,并赶紧对服务器进行修复。
5、被DNS劫持出现的网络故障
这种情况是电脑上的其他应用都可以正常运行,但是网站却打不开,很有可能就是网站被DNS劫持了,需要重新设置或修改DNS地址。
6、系统蓝屏、频繁死机、重启、反映速度迟钝
服务器的结构与普通电脑的构成是十分相似的,出现这种情况是感染了病毒引起的,也有可能是系统漏洞、软件冲突、硬件故障等原因造成的。遇到这种问题就要及时杀毒,修复系统漏洞和硬件故障,清理缓存垃圾。
7、远程桌面连接超出最大连接数
如果登录后忘记注销服务器默认允许的2个连接,而是直接关闭远程桌面,这种时候可能就要重启服务器,并且是在高峰期的话,就很容易造成损失。这种异常问题,就要利用“mstsc/console”指令进行强行登陆,具体 *** 作就是打开“运行”框,输入“mstsc/v:xxxxxxxxxxxx(服务器IP)/console”,即可强行登陆到远程桌面。
8、出现无法删除的文件
如果这些无法删除的文件还在运行中,可以重启电脑,然后删除。另一种办法是,运行CMD,输入“arrtib-a-s-h-r”和想要删除的文件夹名,最后输入“del”,这样想要删除的文件夹即可删除,但是运行该命令后无法恢复,要谨慎使用。
9、系统端口隐患
对于服务器来说,首先要保证的就是它的稳定性和安全性。因此,我们只要保留的是服务器最基本的功能就可以了,声卡一般都是默认禁止的。我们不会用到很多功能,也不需要很多的端口支持。这时候,我们就关掉一些不必要的、风险大的端口,例如3389、80等端口,用修改注册表的方式将其设置成不特殊的秘密端口,这样可以消除服务器端口的安全隐患。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zz/12898008.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2025-08-28
下一篇2025-08-28

发表评论

登录后才能评论

评论列表(0条)

    保存