erlug
[Top] [All Lists]

[Erlug] Problemi di dischi o di kernel? O di mainboard?

To: ERlug - Lista Pubblica <erlug@xxxxxxxxxxxxxx>
Subject: [Erlug] Problemi di dischi o di kernel? O di mainboard?
From: Fabio Muzzi <kurgan@xxxxxxxxxx>
Date: Tue, 21 Apr 2009 01:58:33 +0200

Mi sta cominciando a venire il dubbio che i problemi che sto avendo con i dischi siano almeno in parte colpa del kernel di Lenny.

E` curioso come in due giorni nel mio server sia saltato prima sda e poi sdb. (dischi di marche e modelli diversi) Ed e` altrettanto curioso che una volta ributtato i dischi siano apparentemente di nuovo "visibili".

Per la cronaca, il setup e` con 4 dischi sata.

sda e sdc sono Raptor (md0 e md1)

sdb e sdd sono Hitachi (md2)


Ieri salta sda, lo forzo di nuovo online, e oggi ri-salta. Questa volta non posso piu` accedervi, mi da` errori di questo tipo:

[522055.528465] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE,SUGGEST_OK


Stanotte salta sdb, anche lui non e` piu` accessibile, e riporta:

[635682.284946] end_request: I/O error, dev sdb, sector 0
[635726.452110] sd 0:0:1:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK,SUGGEST_OK


Mi sono salvato il "dmesg", che e` anche pieno di timeout, reset sul bus SATA, eccetera.


Quindi ho fatto il reboot, dopo aver scambiato di posto i dischi sulle porte del controller, per vedere che cosa succede.

Vedo i dischi, ovviamente i raid sono degradati. Ho lanciato il rebuild di tutti i RAID, voglio vedere cosa combina.

Vorrei capire se per caso e` un problema di porte sulla mainboard o di dischi. Ma a meno che non saltino di nuovo entro breve tempo i due dischi che erano saltati ieri, comincio a pensare che sia il kernel.





--

Fabio "Kurgan" Muzzi

La diagnosi del tecnico:   Bisogna riavviare tutti i PC dell'azienda

<Prev in Thread] Current Thread [Next in Thread>