
8K系列是开机自检时按Ctrl+A,LSI系列是Ctrl+C或者Ctrl+H,在这些配置工具里可以查看硬盘的大小,属性什么的,还有阵列状况,也可以对硬盘做一些初始化之类的配置。
要说明的是8K卡是有硬盘校验功能的,LSI的卡没有。服务器硬件故障诊断与排除的十大方法
一、主板
l CMOS清除
l 除了可清除口令外,如果机器使用一段时间后,BIOS自检出现不正常的提示,可以先做CMOS清除试一下。有时系统出现一些提示,CMOS清除会起到意想不到的作用。
l 服务器开机无显,可能与主板有关,需要有经验的工程师作判断。
l 板卡、线缆与主板接触不好,会导致机器不启动。
l 在开机无显时,可以移去内存,开机如果有内存报警的声音(可以查服务器手册判断内存报警提示),一般可以判断主板BIOS可以引导。
二、 硬盘故障诊断
l 检查硬盘的电源电缆插接是否正确,牢固,松动导致检测不到硬盘。
l 如果有多个硬盘,但找不全,排除接触问题,检查硬盘的ID号设置是否相同。
l 感觉硬盘有问题,可以做硬盘的校验,不会破坏数据,如果提示出错或校验时非常不流畅,硬盘一般有问题,具体如何 *** 作参见服务器手册。
l 感觉硬盘有问题,也可以做硬盘的低级格式化,注意会破坏硬盘数据。如果提示出错,硬盘有故障。
l 硬盘原来工作正常,现在发出异常声音,硬盘检测不到或工作不稳定,基本可以断定硬盘有故障。
三、 内存常见问题
l 系统安装不成功或在系统安装过程正常的情况下,安装应用软件困难,无缘无故死机或重起,请检测内存好坏。
l BIOS自检出现奇偶校验错,清除CMOS后,依然如故,内存问题可能性较大。
l 系统持续运行挂起,检测系统资源使用情况,利用率高居不下,内存需要扩充或优化系统( *** 作系统、应用系统)
4开机无显
四、 网卡常见问题
l 接网线后,网卡指示灯不亮,首先检查网线等网络设备是否有问题,换线,换接口,排除此类问题,可以判断网卡有故障。
l 网卡驱动安装完后,网络不通
l 网卡驱动程序错误
l 网络设置错误,具体细节见网络方面知识。
l 在100M/1000M速率下不能正常工作
l Switch、hub端口和网卡端口设置模式为AUTO
l 网卡与SCSI控制器公用中断
五、 服务器加电不启动
l 请检查电源的转换开关是否符合用户所在国家的用电标准(一般应拨在220V档位上)。
l 请检查插座接触是否良好
l 请检查内存和CPU等是否安装正确,接触良好。
l 请检查所有电缆连接得是否正确。
六、 系统自检时出现错误提示
l 系统在启动过程中进行自检,如果出现错误,系统将给出提示。根据错误提示,分析错误原因,以尽量缩小嫌疑范围。这时请你
l 检查BIOS设置是否正确。
l 所有电缆是否连接正常,外设的连接和固定是否正常。
l 分析出现错误的硬件,有针对性地排除嫌疑硬件的故障
七、 显示器无显示
l 当显示器没有显示,但是服务器启动,键盘,驱动器和其它外设自检正常。
l 确定显卡是否有问题;
l 检查显示器的信号线和电源线插接是否正确,牢固;
l 调节显示器的对比度和亮度显示是否正常;
l 切断服务器电源和显示器的电源,检查显示器的信号线电缆的接头针是否弯曲
八、 键盘和鼠标不工作
l 检查鼠标和键盘电缆的接头是否插接正确,并注意接头针是否弯曲。
l 检查鼠标在 *** 作系统的控制面板中的设置是否正常。
l 清洁鼠标的滚动球和驱动轮
l 更换鼠标或键盘测试
九、 光驱不工作
l 检查是否有光盘在光驱里面。
l 用优质光盘测试
l 检查光驱的电源电缆接插是否正确,牢固。
l 检查光驱在系统设置中是否被正确设置。
十、 服务器系统常见故障分析
案例一:服务器开机无显示
显示器电源;主机电源;主机是否可加电;主机内部件接触问题;主板自检;定位部件
案例二:服务器系统安装不成功
确认 *** 作系统兼容性列表;确认安装方法;检查安装介质;
记录安装方法和错误信息向厂家或技术人员咨询
案例三:服务器系统频繁出错
回忆服务器以前工作情况;察看系统日志中的报错记录;察看任务管理器的异常进程
软件问题排除;硬件问题逐步定位。对服务器来说,硬盘因为其机械结构,是最容易出现故障的设备。但恰恰是这最容易出现故障的设备中,存储着对企业来说最至关重要的IT资源——数据。一旦硬盘出现故障,会给企业带来重大的损失。据统计,为了解决硬盘故障带来的损失,目前全球每年的数据恢复市场价值大约在千亿美元——而这仅仅是是企业损失的一小部分。近年来,为了解决这一问题衍生出了大量的技术如:Raid、双机热备等。但这些技术都是在基于增加磁盘的数量的方式来尝试解决问题,降低了数据丢失的概率,但同时大大增加了运维成本,提高了管理的难度。
为此,蚁巡运维平台尝试引入一种新的方式,通过远程实时监控服务器硬盘的健康状态,达到在不增加硬件成本和管理成本的基础上保障数据安全的做法。通过蚁巡运维平台,可以自动发现安装了SMART标准技术的硬盘并远程监控其磁盘的健康指标。
SMART的全称为“Self-Monitoring Analysis and Reporting Technology”,即“自我监测、分析及报告技术”。支持SMART技术的硬盘可以通过硬盘上的监测指令和主机上的监测软件对磁头、盘片、马达、电路的运行情况、历史记录及预设的安全值进行分析、比较。当出现安全值范围以外的情况时,就会自动向用户发出警告。几乎所有主流的硬盘,包括固态硬盘都支持这一技术。但该技术只适用于单机环境,且必须手工获取数据,使用该技术防止硬盘故障的管理成本很高。而在蚁巡中,可以批量的、远程的、实时的监控使用了该技术的硬盘,大大降低了管理成本。
同时,通过蚁巡还可以获得硬盘的使用时间、使用次数等基本指标数据。可以有效的评估硬盘的使用情况,从而进一步评估设备的使用率、寿命等信息。
据统计,通过这项技术,可以提前发现超过60%的硬盘故障,给企业带来的价值无可估量。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)