För kännedom – Serverprob


De senaste dagarna har min blogg drabbats av timslånga avbrott i driften. Det har berott på att en Raid varit trasig hos webbhotellet och den ska vara utbytt nu, eller i vart fall borttagen.

Rimligen betyder det att systemet ska fungera som det ska framöver. // Jinge


4 svar till “För kännedom – Serverprob”

  1. Jinge: Det låter som en dålig ursäkt. Raid-diskar är konstruerade just för att de inte skall krascha. Fråga dom vilken slags Raid de har. Om de har mirroring och striping så kan de ju byta ut felande diskar utan att någon påverkas. Det är hela vitsen med RAID eller Redundant Array of Inexpensive Disks.

  2. Det var två av sammanlagt fem diskar som hade fel. Det var väl orsaken till att striping/mirroring inte fungerade som det skulle. Först när de felande diskarna togs bort så funkade systemet igen. Den drabbade burken var den som innehöll MySQL-databasen. Inte bloggen.. Men bloggen svarade inte utan det var WP:s feltext som kom upp.

  3. Hej Lennart!

    Det är klart det är en dålig ursäkt – hårdvara och dess administratörer ska vara mer robust än så där. :-)

    Men nu är det faktiskt, som Jinge skrev, så att det är TVÅ diskar (av sex) i samma RAID5-set som har fått sig en kyss samtidigt (p g a ett trasigt kraftaggregat) och ger ifrån sig sporadiska läsfel på diverse sektorer. Maximal osis m a o.

    Det gör som bekant (eftersom jag bara har enkel paritet och ingen hot spare) att det inte går att upprätthålla dataintegriteten på volymen.
    Men så långt inga problem, eftersom databaserna ligger på en annan raidad volym (och självklart backas upp regelbundet).

    Jag har dock inte hunnit byta ut de skjutna diskarna ännu, så raidsetet har varit offline ett tag.

    Igår blev jag hur som helst tvungen att boota om servern av andra skäl, och då hade jag glömt bort det trasiga raidsettet – så servern satte glatt och hjälpsamt igång att automatiskt återskapa pariteten på volymen.

    Men eftersom den efter ett gäng timmars tuggande stötte på två trasiga sektorer i samma stripe så gjorde servern det enda raka – den gjorde panic (unixvärldens motsvarighet till windows blåskärm) och tvärnitade.

    Sen tog det dessvärre ett tag innan jag kunde komma tillbaks till kontoret och fixa det, därav det ganska långa avbrottet på bl a Jinges blogg.

    Så så låg det till med den saken. Två delar hårdvaruproblem, en del mänskliga faktorn.

    För ingen är ju dessvärre helt felfri, inte ens jag. ;-)

    Mvh,
    /Benny Löfgren – Jinges webhost.