linux – 如果我强制ZFS分离没有有效副本的热备份会怎么样?

linux – 如果我强制ZFS分离没有有效副本的热备份会怎么样?,第1张

概述我有一个由6个RAIDZ组成的ZFS池.其中一个RAIDZ降级,原因是单个RAIDZ中的两个磁盘松散合在一起足以使ZFS无法在第二个磁盘发生故障之前从第一个故障中恢复.以下是重启后不久“zpool status”的输出: pool: pod2 state: DEGRADEDstatus: One or more devices has experienced an error resultin 我有一个由6个RAIDZ组成的ZFS池.其中一个RAIDZ降级,原因是单个RAIDZ中的两个磁盘松散合在一起足以使ZFS无法在第二个磁盘发生故障之前从第一个故障中恢复.以下是重启后不久“zpool status”的输出:
pool: pod2 state: DEGRADEDstatus: One or more devices has experIEnced an error resulting in data        corruption.  Applications may be affected.action: Restore the file in question if possible.  Otherwise restore the        entire pool from backup.   see: http://www.sun.com/msg/ZFS-8000-8A scrub: resilver in progress for 0h6m,0.05% done,237h17m to goconfig:        name                                                 STATE     READ WRITE CKSUM        pod2                                                 DEGRADED     0     0 29.3K          raIDz1-0                                           ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F165XG    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F1660X    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F1678R    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F1689F    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F16AW9    ONliNE       0     0     0          raIDz1-1                                           ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F16C6E    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F16C9F    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F16FCD    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F16JDQ    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F17M6V    ONliNE       0     0     0          raIDz1-2                                           ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F17MSZ    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F17mxe    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F17XKB    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F17XMW    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F17ZHY    ONliNE       0     0     0          raIDz1-3                                           ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F18BM4    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F18BRF    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_W1F18XLP    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F09880    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F098BE    ONliNE       0     0     0          raIDz1-4                                           DEGRADED     0     0 58.7K            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F09B0M    ONliNE       0     0     0            spare-1                                          DEGRADED     0     0     0              disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F09BEN  UNAVAIL      0     0     0  cannot open              disk/by-ID/scsi-SATA_ST3000DM001-1CH_W1F49M01  ONliNE       0     0     0  837K resilvered            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F0D6LC    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F0CWD1    ONliNE       0     0     0            spare-4                                          DEGRADED     0     0     0              disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F09C8G  UNAVAIL      0     0     0  cannot open              disk/by-ID/scsi-SATA_ST3000DM001-1CH_W1F4A7ZE  ONliNE       0     0     0  830K resilvered          raIDz1-5                                           ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-1CH_Z1F2KNQP    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F0BML0    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F0BPV4    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F0BPZP    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F0BQ78    ONliNE       0     0     0          raIDz1-6                                           ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F0BQ9G    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F0BQDF    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F0BQFQ    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F0CW1A    ONliNE       0     0     0            disk/by-ID/scsi-SATA_ST3000DM001-9YN_Z1F0BV7M    ONliNE       0     0     0        spares          disk/by-ID/scsi-SATA_ST3000DM001-1CH_W1F49M01      INUSE     currently in use          disk/by-ID/scsi-SATA_ST3000DM001-1CH_W1F4A7ZE      INUSE     currently in use          disk/by-ID/scsi-SATA_ST3000DM001-1CH_W1F49MB1      AVAIL             disk/by-ID/scsi-SATA_ST3000DM001-1ER_Z5001SS2      AVAIL             disk/by-ID/scsi-SATA_ST3000DM001-1ER_Z5001R0F      AVAIL   errors: 37062187 data errors,use '-v' for a List

当第一个磁盘发生故障时,我用热备件替换它,它开始重新启动.在重新启动完成之前,第二个磁盘发生故障,因此我用另一个热备份替换了第二个磁盘.从那以后它将开始重新启动,完成大约50%,然后开始吞噬内存,直到它全部吃完并导致 *** 作系统崩溃.

此时升级服务器上的RAM并不是一个简单的选择,我不清楚这样做是否可以保证解决方案.我知道在这个阶段会有数据丢失,但如果我可以牺牲这个RAIDZ的内容来保留池的其余部分,这是一个完全可以接受的结果.我正在将此服务器的内容备份到另一台服务器,但内存消耗问题每48小时左右强制重启(或崩溃),这会中断我的rsync备份,并重新启动rsync需要时间(它可以一旦它确定它停止的地方就恢复,但这需要很长时间).

我认为ZFS试图处理两个备用替换 *** 作是内存消耗问题的根源,因此我想删除其中一个热备件,以便ZFS可以一次处理一个.但是,当我尝试分离其中一个备件时,我得到“无法分离/ dev / disk / by-ID / scsi-SATA_ST3000DM001-1CH_W1F49M01:没有有效的副本”.也许我可以使用-f选项来强制 *** 作,但我不清楚它的确切结果是什么,所以我想看看是否有人在继续之前有任何输入.

如果我可以让系统进入一个稳定的状态,它可以保持足够长的时间运行以备份完成,我计划将其关闭以进行大修,但是在目前情况下,它会陷入一些恢复循环.

解决方法 现在你可以分离UNAVAIL磁盘,ZFS不再使用它们了.

您在RAIDZ-1设置中有两个故障磁盘.您很可能正在查看一些数据丢失,并准备从备份中恢复.

另外,在我使用OpenSolaris / Solaris11时,RAIDZ已经证明非常不稳定.我建议不要在任何类型的生产工作量中使用它.

另外,为了强化ewwhite所说的,FUSE不是你最好的选择.我借此机会迁移到更稳定的东西(也许是FreeBSD 10).

总结

以上是内存溢出为你收集整理的linux – 如果我强制ZFS分离没有有效副本的热备份会怎么样?全部内容,希望文章能够帮你解决linux – 如果我强制ZFS分离没有有效副本的热备份会怎么样?所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/1044023.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-05-24
下一篇2022-05-24

发表评论

登录后才能评论

评论列表(0条)

    保存