Inloggen
Registreren

Inloggegevens vergeten

Storingen
Storingen » Overzicht » [UPDATE 7] Problemen 2e harde schijf, testserver opnieuw onbepaalde tijd offline
[UPDATE 7] Problemen 2e harde schijf, testserver opnieuw onbepaalde tijd offline

 

Status Gesloten / opgelost
Starttijd storing Woensdag 24 augustus 2011, 22:00:00
Verwachte oplostijd Zondag 28 augustus 2011, 17:00:00
Opgelost om Zondag 28 augustus 2011, 16:35:14

De testserver geeft sinds de schoonmaakbeurt nog steeds rare problemen.Op een gegeven moment doen veel netwerkgerelateerde programma's het ineens niet meer of spuwen hun data op een verkeerde manier uit. De problemen lijken na analyses van logboeken te wijzen op problemen met de 2e harde schijf, de schijf waar onder andere de websites op staan. Ivm de planning kan verdere analyse pas morgenavond plaatsvinden en blijft de testserver sowieso tot die tijd offline.

Tijdens het bekijken van de Windows logboeken kom ik zeer veel meldingen tegen met o.a.

Er is een fout ontdekt op apparaat \Device\Harddisk2\D tijdens een wisselbestandsbewerking.

En een foutmelding van "atapi" dat een IDE driver mogelijk verouderd is.

Verder zag ik de partities van de schijf niet meer in de Windows verkenner terug vlak voor het uitschakelen van de testserver.

Het lijkt er op dat de 2e schijf òf niet correct aangesloten is na de schoonmaak of defect is / defect aan het raken is. Gezien het feit dat het nu laat op de dag is en dat ik morgen normaal moet werken zal het op zijn vroegst morgenavond worden voordat ik verder onderzoek kan doen. Tot die tijd is de testserver dus sowieso offline.

Update 1 (26-08-2011 13.45 uur):

De harde schijf lijkt toch defect. Ook los aangesloten met een USB-to-IDE adapter op mijn Windows 7 laptop krijg ik de zelfde foutmeldingen:

Het stuurprogramma heeft een controllerfout gevonden in \Device\Harddisk1\DR1.

De schijf doet het momenteel nog wel en ik probeer zoveel mogelijk nu direct te backuppen (uiteraard nooit eerder gedaan voor deze schijf...) waarbij de websites het eerste gebackupped worden.

Ik heb nog een ongebruikte back-up schijf liggen van (uit mijn hoofd) 500GB. Alles overzetten zal tijd in beslag nemen.

Update 2 (26-08-2011 17.42 uur):

De back-up schijf was inderdaad plm. 500GB. Er was echter 1 probleem: de schijf is een SATA schijf en de oude schijf was een IDE schijf. Ik heb nog nooit een SATA schijf zelf aangesloten, maar eens moet de eerste keer zijn.

Er moesten nogal wat tie-wraps doorgeknipt worden om wat stroomkabels te kunnen verleggen. Ook moest de diskettedrive losgemaakt worden om daarop een andere stroomkabel aan te kunnen sluiten, want anders kon ik met de stroomkabels niet bij het harde schijven gedeelte komen.

Eenmaal geïnstalleerd duurde de herkenning van de schijven in de BIOS erg lang en starte de testserver niet op. Ik was even vergeten dat er een jumper los gemaakt moest worden als er maar 1 schijf aan de IDE kabel moet hangen. Tijdens het troubleshooten van dit alles heb ik in het BIOS scherm ook gelijk maar even een wake-up feature aangepast zodat de testserver weer uit zich zelf kan opstarten nadat de UPS na voldoende is opgeladen bij een stroomuitval.

Na de problemen om Windows überhaupt opgestart te krijgen kwamen nieuwe problemen om de hoek kijken: ondanks dat MySQL niets met de defecte schijf te maken heeft wilde MySQL op geen enkele wijze opstarten. Aanvankelijk kon ik geen foutmeldingen vinden, maar na enkele malen herconfigureren bleken er problemen te zijn om het InnoDB gedeelte op te starten. Daar ik MyISAM ipv InnoDB voor mijn databases gebruik heb ik InnoDB uitgeschakeld. MySQL is weer opgestart. Ik kom echter nog wel een foutmelding tegen bij het raadpleken van een specifieke tabel in een specifieke database van een testwebsite. Het is dus nog even afwachten wat de gevolgen verder nog zijn. Als die tabel het enige probleem is, dan zijn de problemen nog te overzien.

Op dit moment van schrijven heb ik net de nieuwe schijf ingedeeld in 2 partities en is de PC nog bezig met formateren van de partities op de schijf. Je begrijp dat dat met 500GB een poos gaat duren. Na plm. een kwartier tijd staan de 2 partities op nog maar 5% geformateerd. In het slechtste geval zou dit 5 uren kunnen duren (100/5)*0,25=5 (0,25 = 1 kwartier).

Aangezien ik morgenmiddag geen tijd heb voor de testserver en er nog heel veel GB's verplaatst moet worden van de backup naar de nieuwe schijf in de testserver verwacht ik op zijn vroegst pas morgenavond klaar te zijn met de hele operatie.

Update 3 (26-08-2011 19.56 uur):

Het formateren van beide partities staat nu op ongeveer 26%.

Overigens is mailen wel gewoon mogelijk aangezien de mailserverapplicatie en benodigde bestanden op de schijf zonder problemen stond.

Update 4 (27-08-2011 00.54 uur):

Het formateren duurt veel langer dan ik dacht en is nu rond de 77%. Ik zal hier niet op blijven wachten ivm mijn nachtrust en vannacht zal de testserver aan blijven staan. De maildiensten blijven daar door ook bereikbaar. Dit alles echter zonder UPS.

Overdag zal de testserver offline staan en 's avonds ga ik kijken of ik de gebackupte bestanden weer kan terugplaatsen.

Update 5 (27-08-2011 02.59 uur):

Het formateren is 3 uren later dan verwacht eindelijk voltooid. Ik heb er toch op gewacht aangezien ik de testserver op een locatie aan heb staan waar ik hem niet onbeheerd vannacht aan wil laten staan. Het formateren is om 17.30 uur begonnen en heeft nu bij elkaar dus 9,5 uur geduurd. Nooit gedacht dat 500GB formateren zo langzaam zou gaan...

Morgen zsm verder met de hersteloperatie.

Update 6 (28-08-2011 01.40 uur):

Alle bestanden zijn weer teruggezet vanuit de back-up en de sites lijken nu weer correct te draaien. Ook de FTP-server lijkt correct te draaien.

De testserver gaat nog een nachtje en ochtend offline. Morgenmiddag controleer ik de hele boel nog even en als alles dan toch in orde lijkt te zijn zal ik de testserver weer op zijn definitieve plek aansluiten en online laten.

Update 7 (28-08-2011 16.31 uur):

De testserver staat weer op zijn oorspronkelijke plek en aan de UPS. Nu met alle randapparatuur aangesloten komt hij wel traag door de BIOS en bootproces van Windows heen, maar het lijkt nog voldoende goed te gaan. Deze traagheid heeft mogelijk te maken met een aantal lange externe kabels aan de testserver voor de verbinding met een via internet bedienbaar stopcontact en een verbinding met een weerstation.

Alle diensten zouden nu weer moeten functioneren.

 

  Plaatsingsinformatie  
 
Geplaatst door Joen in Storingen op
Woensdag 24 augustus 2011, 23:59:47.

Gewijzigd door Joen op
Zondag 28 augustus 2011, 16:36:04

 
  OpenShare icon Delen  
 
Twitter Tweet deze storing op Twitter
Facebook Deel deze storing op Facebook
LinkedIn Deel deze storing op LinkedIn
E-mail Mail deze storing naar iemand
Link Reguliere en verkorte link van deze storing
 
  Tags  
  Klik op een tag om te zoeken naar meer storingsberichten met de zelfde tag.

testserver / offline / harde / schijf / storing / 2e / tweede / I/O / read / write / error / fout / ontdekt / wisselbestandswerking / Device / Harddisk2 / schoonmaak / defect / =