
2 服务器意外断电导致磁盘阵列故障;
3 服务器阵列上的磁盘出现物理故障,如:电路板坏、磁头损坏、盘面坏、坏扇区、固件坏等;
4 管理员在维护服务器过程中由于误 *** 作导致硬盘盘序出现错误;
5 raid在同步数据或者重建过程中,同组raid阵列中有其他硬盘掉线导致同步失败;
6 配置raid阵列信息出错等误 *** 作导致数据丢失。
二、RAID5磁盘阵列故障后需要注意哪些问题
1 RAID5磁盘阵列出现故障或者数据丢失后建议不要盲目进行rebuild *** 作。
Rebuild *** 作就是利用阵列的校验功能,根据阵列内其他正常硬盘内的数据,将损坏硬盘的数据进行计算生成并同步到热备盘中。这种 *** 作适合阵列中有1块硬盘掉线的情况,一旦阵列中有2块硬盘出现故障掉线了,则通常掉线顺序有先有后,如果在第一块硬盘掉线后服务器已经进行过写入 *** 作的话,此时第一块掉线的硬盘数据已经久不更新,rebuild只能对先掉线的磁盘做Rebuild,如果对后掉线的磁盘进行重建 *** 作,部分阵列虽然能正常工作,但数据错乱,一些文件不能打开,给用户带来不可挽回的损失。
2 如果有硬盘掉线不建议盲目进行强制上线 *** 作。
在北亚数据恢复中心恢复的raid5数据恢复案例中,有部分raid阵列数据丢失原因是因为阵列中有一块硬盘离线以后没有及时更换硬盘,此后服务器出现故障或者正常重启,原本离线的硬盘重新上线,而原本在线的硬盘反而故障离线,数据不能正常使用。
用户对后离线的硬盘进行强制上线 *** 作,磁盘阵列进行自动同步,导致数据新旧混乱,服务器数据丢失。因为原来离线的盘又自动上线,大多数阵列卡会检验校验信息,一旦发现校验信息不正确,会重新计算校验信息,致使不能缺盘恢复数据,将会数据恢复失败。
3 千万不要进行初始化 *** 作。
初始化是一种类似于低级格式化的 *** 作,一旦对阵列进行初始化 *** 作,那么这个阵列内所有硬盘的底层数据将全部被清零,此时将导致阵列数据无法恢复。
4 重新配置磁盘阵列信息时要保证与原始配置信息一致。
如果需要重新配置磁盘阵列信息时,一定要注意与原始配置信息保持一致,一旦重新配置的参数与原始信息不一致,将导致阵列内多数文件无法打开,造成数据丢失。并且多数服务器都有重新配置阵列信息后自动初始化的功能,这将导致数据无法恢复。
5 在进行数据恢复尝试前请务必对服务器内的所有硬盘进行扇区级的镜像备份,避免破坏原始数据,如果有条件,可以联系数据恢复中心获取技术指导。
三、RAID5故障数据恢复方案
1 镜像服务器内所有数据。
按照一定的顺序将服务器内的所有硬盘进行排序编号,然后将每块硬盘进行镜像备份,也可以将服务器携带至北亚数据恢复中心,由数据恢复工程师进行镜像 *** 作。
2 将镜像文件交给数据恢复中心进行底层数据分析,重组raid阵列,导出用户数据。
3 对导出的所有数据进行验证,确认无误后重新搭建服务器环境,将恢复的数据迁移回服务器内即可。题主是否想询问“服务器更换硬盘盘符会变是怎么回事”?新硬盘的盘符与原来的硬盘不同。根据查询相关公开信息显示,服务器更换硬盘盘符会变是因为新硬盘的盘符与原来的硬盘不同,这是由于新硬盘的分区方式、格式化方式或其他因素造成的。
以ext4文件系统为例,设计的时候分为4个部分
由于 ls -l 获取的是i节点记录的数据使用的数据块个数,而 du 则是通过i节点获取实际大小, 所以 ls -l 和 du 显示的数据大小不同。
RAID全称是Redundant Array of Independent Disks,也就是磁盘阵列,通过整合多块硬盘从而提升服务器数据的安全性,以及提高数据处理时的I/O性能。
RAID目前常用的是RAID5, 至少需要3块硬盘,其中一块硬盘用于奇偶校验,保证数据安全,其余硬盘同时读写,提高性能。此外,你还需要知道最原始的是RAID0,同时将数据读写到所有硬盘里,速度就变成了原来的N倍。RAID1至少需要两块盘,其中一块硬盘是另外硬盘的镜像。它不提高读写效率,只提高了数据安全性。RAID10是RAID0和RAID1的组合。
目前的服务器都配备了硬件RAID卡,因此在为服务器增加或更换硬盘时,需要 格外注意 ,
fdisk只能对不多于2TB的硬盘进行分区
假如你的硬盘大于2TB,那么会输出如下信息
提示信息中的警告中,就建议"Use parted(1) and GUID partition table format (GPT)"
因此,对于大于2TB的硬盘就需要用 parted 进行分区
输出信息如下
创建新的GPT标签,例如
设置单位
创建分区, 比如我将原来的10T分成2TB和8TB
查看分区表
输出如下
退出
此时会提示"Information: You may need to update /etc/fstab" /etc/fstab 用于设置开机硬盘自动挂载。如果硬盘被拔走了,而 /etc/fstab 没有修改,那么会就提示进行修复模式。
在挂载硬盘之前,需要先对磁盘进行格式化。使用的命令为 mkfs , 使用 -t 指定文件系统,或者用 mkfsxxx ,其中xxx就是对应的文件系统。文件系统有如下几类
目前最流行的是ext4和xfs,足够稳定。其中xfs是CentOS7之后的默认文件系统。
之后用 mount 进行硬盘挂载,分别两种情况考虑
一种是新建一个文件路径,进行挂载。
另一种是挂载一个已有目录,比如说临时文件目录 /tmp 挂载到新的设备中。
第一步: 新建一个挂载点,将原有数据移动到该目录下
第二步: 删除原来的 /tmp 下内容
第三步: 重新挂载
和mount相关的文件如下
此外mount在挂载的时候还可以设置文件系统参数,例如是否支持磁盘配额,对应 -o 参数
第零步: 检查服务器是否具备RAID阵列卡,如果有,则需要先为硬盘做RAID。
第一步: 使用 fdisk -l 检查硬盘是否能被系统检测到
第二步(可选): 假如需要 硬盘分区 ,则用 fdisk/gdisk/parted 对硬盘划分磁盘
第三步: 使用mkfs进行磁盘 格式化 ,有如下几种可选,
第四步: 用mkdir新建一个目录,然后用mount将格式化的硬盘挂载到指定目录下。卸载硬盘,则是 umout
第五步: 修改 /etc/fstab 将硬盘在重启的时候自动挂载。 注意 : 如果硬盘不在了,则需要将对应行注释掉,否则会进入到emergency模式。
版权声明 :本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 40 国际许可协议 (CC BY-NC-ND 40) 进行许可。
服务器报硬盘告警。客户进行过拔插硬盘,告警仍存在;进行过对掉硬盘,对调后两块物理盘都失联。处理过程:1查看sel日志,确实有disk0和disk8插拔互换过的记录。
2确认该机型为8x25SAS/SATA+12x25NVMe硬盘配置,disk0是SAS/SATA接口,disk8是PCIE接口,disk0和disk8互换后,接口不兼容都会识别不到。
3告知客户排查链路,用新的SAS/SATA硬盘插入disk0确认是否硬盘问题;如果不是硬盘问题的话,再排查raid卡-sas线缆-背板链路是否异常。
4客户更换新的SATA硬盘,disk0告警消失,能正常识别。
鲲鹏服务器是贵州云上鲲鹏科技有限公司发布的产品。2021年5月27日,2021数博会“贵州·进而有为——华为云城市峰会暨贵州数字峰会2021”上拓维信息旗下贵州云上鲲鹏科技有限公司正式发布贵州首台鲲鹏服务器——“兆瀚”云上系列服务器。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)