Don’t wanna miss anything?
Please subscribe to our newsletter
actueel

Henk Strikkers Henk Strikkers,
28 February 2017 - 09:37
‘Dinsdagochtend was het systeem weer operationeel, maar de problemen waren niet opgelost’

En toen ging het vorige week maandag mis. Wat gebeurde er precies?

‘Maandag 20 februari rond zes uur in de avond is het platform gecrasht. We hebben de hele nacht gewerkt om de veertig systemen die van het platform afhankelijk zijn weer online te krijgen en dat lukte: dinsdagochtend was het systeem weer operationeel. De problemen waren echter niet opgelost.’

 

Dat is geweten. Twee dagen later ging het weer mis. Was dat hetzelfde probleem?

‘Dat kan ik niet met zekerheid zeggen, maar naar mijn inschatting hadden de problemen die woensdagavond laat ontstonden wel een verband met die van maandag. Rond elf uur op donderdagochtend hadden we het systeem uiteindelijk weer operationeel, maar we hebben toen met het UvA-HvA-crisisteam besloten om de rest van de dag het systeem niet beschikbaar te maken. We hebben met man en macht gezocht naar fouten in het systeem en een aantal fouten gevonden en opgelost.’

‘Zaterdagnacht is vanuit allerlei internationale opslagplaatsen apparatuur opgestuurd’

Dat was niet voldoende. Zaterdag gebeurde het weer.

‘Toen kwam inderdaad de derde klapper. Op zaterdag rond half drie crashte het weer en kregen we het systeem op geen enkele manier meer aan de praat. We zijn de hele dag bezig geweest en hebben er ook Dell-ingenieurs bijgehaald, maar delen van de hardware waren gewoon kapot, fysiek stuk. Om elf uur ’s avonds hebben we gebeld met mensen van Dell in de Verenigde Staten, Ierland en Zweden en in dat gesprek werd bevestigd dat het nodig was om hardware te gaan vervangen. Daarvoor is nog diezelfde nacht apparatuur vanuit allerlei internationale opslagplaatsen opgestuurd. Die kwamen, net zoals een van de meest ervaren engineers van Dell, om zondagochtend om 9 uur aan in Amsterdam. De ingenieurs zijn drie uur bezig geweest om de kapotte hardware eruit te halen en de nieuwe te plaatsen en om zondag was het om zes uur weer up and running.’

 

De vraag der vragen is natuurlijk of het nu echt is opgelost en of we de komende tijd geen storingen meer hoeven te verwachten.

‘Het control center van Dell in Dublin heeft met de hele installatie meegekeken en heeft tot op heden geen fouten meer kunnen vinden. Tegelijkertijd weten we dat de geplande firmware-update niet uitgevoerd is.’

 

Hoe lang kan een systeem dat vierenhalf jaar oud is nog mee?

‘We waren al van plan om het platform in de loop van 2017 of 2018 te vervangen en dat gaan we nu vervroegen. Het nieuwe systeem hadden we eigenlijk al geselecteerd. Het lijkt toeval, maar precies vorige week hadden we gepland om een proof of concept, een soort prototype, op dit nieuwe systeem uit te voeren. Dat doen we nu zo snel mogelijk. Als we er een klap op geven duurt het zeker nog enkele weken voordat dat nieuwe systeem daadwerkelijk operationeel is. Dat kan waarschijnlijk zonder dat we het voo­r langere tijd uit de lucht moeten halen, dus dat is winst.’

website loading