Mi sta cominciando a venire il dubbio che i problemi che sto avendo con
i dischi siano almeno in parte colpa del kernel di Lenny.
E` curioso come in due giorni nel mio server sia saltato prima sda e poi
sdb. (dischi di marche e modelli diversi) Ed e` altrettanto curioso che
una volta ributtato i dischi siano apparentemente di nuovo "visibili".
Per la cronaca, il setup e` con 4 dischi sata.
sda e sdc sono Raptor (md0 e md1)
sdb e sdd sono Hitachi (md2)
Ieri salta sda, lo forzo di nuovo online, e oggi ri-salta. Questa volta
non posso piu` accedervi, mi da` errori di questo tipo:
[522055.528465] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK
driverbyte=DRIVER_SENSE,SUGGEST_OK
Stanotte salta sdb, anche lui non e` piu` accessibile, e riporta:
[635682.284946] end_request: I/O error, dev sdb, sector 0
[635726.452110] sd 0:0:1:0: [sdb] Result: hostbyte=DID_BAD_TARGET
driverbyte=DRIVER_OK,SUGGEST_OK
Mi sono salvato il "dmesg", che e` anche pieno di timeout, reset sul bus
SATA, eccetera.
Quindi ho fatto il reboot, dopo aver scambiato di posto i dischi sulle
porte del controller, per vedere che cosa succede.
Vedo i dischi, ovviamente i raid sono degradati. Ho lanciato il rebuild
di tutti i RAID, voglio vedere cosa combina.
Vorrei capire se per caso e` un problema di porte sulla mainboard o di
dischi. Ma a meno che non saltino di nuovo entro breve tempo i due
dischi che erano saltati ieri, comincio a pensare che sia il kernel.
--
Fabio "Kurgan" Muzzi
La diagnosi del tecnico: Bisogna riavviare tutti i PC dell'azienda
|