RAID-Pagina3

Uit Linuxdocs.nl
Ga naar: navigatie, zoeken

Problemen zoeken en de array herbouwen

Een defecte schijf herkennen

Geen mysterische of rottige dingen hier. Een kijkje in de standaard logboeken is genoeg om een defecte schijf te herkennen.

Het is altijd een must voor /var/log/messages om complete schermen te vullen met logboodschappen, wat er ook gebeurd. Maar als een disk faalt, dan worden grote en vele kernel errors gerapporteerd. Hier zijn wat "smerige" voorbeelden van een defecte disk

   kernel: scsi0 channel 0 : resetting for second half of retries.
   kernel: SCSI bus is being reset for host 0 channel 0.
   kernel: scsi0: Sending Bus Device Reset CCB #2666 to Target 0
   kernel: scsi0: Bus Device Reset CCB #2666 to Target 0 Completed
   kernel: scsi : aborting command due to timeout : pid 2649, scsi0,-
   channel 0, id 0, lun 0 Write (6) 18 33 11 24 00
   kernel: scsi0: Aborting CCB #2669 to Target 0
   kernel: SCSI host 0 channel 0 reset (pid 2644) timed out - trying harder
   kernel: SCSI bus is being reset for host 0 channel 0.
   kernel: scsi0: CCB #2669 to Target 0 Aborted
   kernel: scsi0: Resetting BusLogic BT-958 due to Target 0
   kernel: scsi0: *** BusLogic BT-958 Initialized Successfully *** 

Vaak zien ze er ook wel zo uit.

   kernel: sidisk I/O error: dev 08:01, sector 1590410 
   kernel: SCSI disk error : host 0 channel 0 id 0 lun 0 return code = 28000002 

Of zo:

   kernel: hde: read_intr: error=0x10 { SectorIdNotFound }, CHS=31563/14/35, sector=0
   kernel: hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error }

En, zoals verwacht, de klassieke /proc/mdstat zal ook wat problemen prijsgeven

   Personalities : [linear] [raid0] [raid1] [translucent]
   read_ahead not set
   md7 : active raid1 sdc9[0] sdd5[8] 32000 blocks [2/1] [U_]

Herbouwen van een array na een drive crash

Indien u een defecte schijf heeft gevonden. Volg dan de volgende stappen om deze fout te fixen:

  1. Sluit het systeem af en verwijder all kabels
  2. Vervang de defecte disk
  3. Sluit alles aan en start de pc weer op
  4. Geef de opdracht raidhotadd /dev/mdX /dev/sdX. Om de nieuwe schijf aan het systeem op te geven en de array te herstellen
  5. Neem een biertje terwijl het systeem de array aan het herbouwen is.

En dat is het.

Dat wil zeggen "meestal" is dat alles. Tenzij u geen geluk heeft en de RAID array onbruikbaar is geworden, omdat er nog een 2e disk defect is geraakt. Het kan namelijk gebeuren dar meerdere schijven op 1 bus defect raken, doordat de ene defecte disks de IDE/SCSI bus met zich mee nam. De andere disken, die dan nogwel prima werken, zijn niet langer te bereiken door de RAID software, omdat de IDE/SCSI BUS in de war/defect is geraakt, waardoor de andere schijven ook down zijn. Bij een RAID-5 array is een disk verliezen nog geen ramp. Het verliezen van 2 of meer schijven is echter fataal.
Alhowel deze meest rampzalige gebeurtenis nog nooit eerder is gebeurd naar mijn weten, kan het mogelijk zijn.

Wat kunt u doen als er meerdere schijven defect raken

Het volgende kan gebeurd zijn:

  • Een host adapter sterft en neemt tegelijkertijd 2 disken mee
  • Alle schijven op een SCSI bus kunnen niet langer meer worden benaderd na het falen van 1 disk
  • Een kabel schiet los

Kort gezegd: Meestal krijgt u dan het tijdelijke falen van meerdere schijven in 1 keer; achteraf zijn de RAID superblocks niet meer te initializeren en kunt u de RAID array niet langer meer benaderen.

Als u gebruik maakt van mdadm, moet u het volgende proberen:

[root@linuxdocs.nl tmp]# mdadm --assemble --force

Als dat niet werkt dan is er nog maar 1 oplossing: Herschrijf uw array met mkraid --force.

Om dit werkend te krijgen, dient u te beschikken over een werkend en up2date /etc/raidtab bestand. Als dit bestand precies overeenkomt met uw array, dan doet dit waarschijnlijk niet wat u had verwacht, maar zal zeer waarschijnlijk alle data op de schijven wissen!

Neem een kijkje in de systeemlogboeken die worden gegenereerd als u probeert de array te herbouwen.

Als u mkraid opgeeft zonder failed-disk, dan zal de herstelprocedure onmiddelijk beginnen met het herbouwen van de array - niet noodzakelijk wat u zult willen op dit moment

Met failed-disk Kunt u exact specificeren welke schijven u wilt activeren en waarschijnlijk met verschillende combinaties voor de beste resultaten. Trouwens, mount alleen het bestandssysteem in alleen lezen mode als u dit wilt gaan proberen



How-TO's | Hoofdpagina | Linux Nieuws | Externe links | Help