De ICT-storing bij Prorail in het eerste weekend van juni riep allerlei overwegingen bij mij op. Zoals de eerste crisiswet: crisis is koffie + kroketten. Maar belangrijker nog is dat deze storing een signaal is. Een signaal dat we moeten leren omgaan met onzekerheden.
Op de grens van het weekend van 4 naar 5 juni werd de Treinverkeersleiding in Amsterdam overvallen door een ICT-storing. Na de gebruikelijke herstelpogingen gaf het systeem het na een paar uur alsnog op. Het was niet veilig om door te rijden en dus moest het treinverkeer rondom Amsterdam worden gestaakt. Dat was een logische beslissing. Veiligheid gaat in dit soort gevallen altijd voor.

Daarna moest de uitwijk in Utrecht worden opgestart. Dat proces duurde zo’n vier uur. In de loop van de maandag kwam de boel zo weer langzaam op gang. Het euvel werd diezelfde week nog gevonden, zodat in de nacht van 9 op 10 juni de Treinverkeersleiding weer op zijn eigen stek aan de slag kon gaan.
Als ik dit schrijf is het 10 juni en is er geen recent nieuws meer te vinden over de ICT-storing. Daaruit concludeer ik dat het incident nu kennelijk zonder problemen is afgesloten.
Het evalueren kan beginnen.
Crisiskrant
Maar wie goed keek deze week zag dat die evaluatie al proactief was begonnen. Als redacteur van de Crisiskrant volg ik natuurlijk alles in de pers wat tot een crisis kan leiden en zodoende viel mijn oog op een uitgekiende reconstructie in de Volkskrant van 9 juni 2023.
Uitgekiend, omdat dit interview met de ICT directeur Arjen Boersma een goed voorbeeld is van wat ik in dit blog Blue Ocean Crisiscommunicatie heb genoemd. Dat komt er in het kort op neer dat je een rustige plek moet zoeken om proactief de discussie naar je toe te trekken. Laat anderen reageren op jou, in plaats van dat jij moet reageren op de rest. Zo kom je voor het incident uit, in plaats van dat je er achteraan moet rennen.
Je zou het ook framen kunnen noemen. En daar is helemaal niks mis mee.
Glimlachend las ik dus het verhaal van ProRail en hun ICT directeur. Geschreven als een spannend verhaal met een vreedzaam begin, een onverwachte gebeurtenis en daarna dappere ICT’ers die het kwaad bevochten, zich terugtrokken op een nieuwe linie en daarna alsnog het beest wisten te temmen; één of ander lullig stukje hardware dat net niet kapot genoeg was om direct op te vallen en zodoende vanuit zijn loopgraafje de boel in het honderd kon laten lopen.
Doch dat was buiten de onversaagde ridders van ProRail gerekend. Het boosaardige transcievertje werd alsnog ingerekend. Eind goed, al goed. Directeur Boersma kon eindelijk aan zijn welverdiende gekoelde Paulaner beginnen, die al sinds zondag in de koelkast lag te wachten.

Wij herkennen hier natuurlijk direct de dramaboog van Freytag in. Ik zeg: goed gedaan van Prorail.
Tijd voor wat overwegingen bij deze ICT-storing.
Overwegingen bij een ICT-storing
Deze overwegingen zijn geen waardeoordeel en slechts gebaseerd op verhalen uit de krant en wat eigen ervaringen. Zie het meer als associaties, alsof we zojuist een oefening hebben afgerond en nu met elkaar reflecteren. Eigenlijk zoals de barmhartige onderzoeker zich zou moeten opstellen.
- De eerste trigger uit het verhaal was die Paulaner. Dat was mijn kennismaking met de Duitse weizenbieren. Geen blond, geen wit maar wel lekker. Na veel evaluaties geef ik toch de voorkeur aan Erdinger.
- Personenvervoer is in de loop der jaren een complexe business geworden. De vraag steeg harder dan het aanbod en er zijn daarom veel ondersteunende systemen nodig om het benodigde volume te managen. Dat betekent dat er op 100% moet worden gedraaid om alles voor elkaar te krijgen. Elke nulproductie, hoe kort ook, moet verderop weer worden gecompenseerd, wat onherroepelijk tot verstoringen leidt: de productie loopt uit, er blijven mensen over of er moet worden geannuleerd. Veel meer keuze is er eigenlijk niet.
- Er is sprake van wat ik een metastabiel evenwicht noem. Je moet het totale systeem schragen met maatregelen om de gewenste doelen te realiseren. Zonder die schragen lukt het niet. Maar die schragen vormen een faalfactor op zichzelf. In zo’n vol systeem is een ICT-storing meer of minder niet ongewoon. Kortom, een metastabiel evenwicht heeft een grotere kans op falen dan een stabiel systeem met hetzelfde volume.
- Je krijgt gewoon meer single points of failure. Meer plekken in je proces die de boel voor 100% kunnen platleggen.
- Daarnaast is er sprake van de kwetsbaarheidsparadox, ook wel als veiligheidsparadox aangeduid. Dankzij die hulpmiddelen kun je verder en harder dan je had gekund zonder. Maar de consequentie is ook dat je dieper in de penarie zit als de boel ermee stopt. Niet alleen de kans is dus groter bij een metastabiel systeem, ook het effect neemt enorm toe. Het is een fragiel systeem geworden.
- Eigenlijk zijn er maar drie beheersstrategieën voor dit probleem: redundantie (in tijd en ruimte), multifunctionaliteit (of flexibiliteit, ook goed) en recovery. Nou ja, OK, vier: een combinatie van die drie.
- Maar die moet je wel vooraf inregelen. Anders loopt het alsnog in het honderd. Denk niet dat je er lekker al improviserend uitkomt. Dat kom je niet.
- Over redundantie en multifunctionaliteit ga ik het nu niet hebben. Wel over recovery. Want dat is namelijk disruptiemanagement. Hoe ga ik om met een verstoorde treinenloop en manage ik de drie effecten uitloop, annuleringen en overblijvers?
- De eerste stap is het onderkennen van de verschillende soorten incidenten die zich verstopt houden in de ongewenste gebeurtenis. Emergency, disruptie, dreiging en crisis, je leest er alles over in dit blog.

- De ICT-storing is in deze terminologie van de ongewenste gebeurtenis een emergency. Je hebt speciale vakkennis nodig, een oplosstrategie, opschaling, (externe) servicepartijen en ga zo maar door. Voor het publiek is dit een onzichtbaar noodgeval. Mooi uit de doeken gedaan in het verhaal van de Volkskrant. In ieder geval een tipje ervan.
- Wat wel zichtbaar is, is de disruptie. Die komt in de krant, op TV en social media. Overal foto’s en plaatjes van een falend incidentmanagement. In dit geval verwacht je dus minimaal twee teams die aan de slag gaan. De ene met de emergency, de andere met de disruptie. Uit het verhaal lees ik daar verder niets over. Maar the absence of evidence is niet the evidence of absence.
- Ik zou persoonlijk meerdere disruptieteams inzetten. Bij elk getroffen station één. Wie weet is dat ook wel gebeurd. Hoe dan ook zijn de verschillen tussen de aanpak op Amsterdam en Utrecht wel opvallend.
- Hier heeft de NS natuurlijk ook een rol in. Ook in ons vak is het een bekend vraagstuk. Valt de opvang van passagiers bij de airline (NS) of airport (Prorail)? En wat is de rol van de overheid hierin? Is er in deze een taak weggelegd voor het proces bevolkingszorg? Waar liggen de grenzen? (altijd ergens anders dan in het plan staat).
Dynamieken
- Zodra je twee of meer incidenten hebt geformuleerd, gaan die ieder hun eigen weg met hun eigen dynamiek. Het hangt met elkaar samen, beïnvloedt elkaar maar niet in seriële causale verbanden. Het is dus onmogelijk om zo’n disruptie vanuit één plek te besturen met slechts één opschalingsniveau. Ook op je disruptiemanagement zal je moeten opschalen, niet alleen bij emergencies.
- Krijg je dan niet heel veel teams? Ja. Maar dat is de consequentie van je ontwerpkeuzes. Als je over onvoldoende redundantie en multifunctionaliteit beschikt, moet je dus een ruimvallende recoveryjas aantrekken. En die ook oefenen.
- En ook niet vergeten: personenvervoer = veel mensen = veel social media. Wie personen vervoert, vervoert ook meningen. Bij een disruptie zijn de getroffenen geen slachtoffer, maar actor. Zelfstandige eenheden in een zwerm met een communicatie capability die ver uitsteekt boven wat jij als organisatie in je eentje aan kan.
- Dan hebben we het nog niet eens over crisismakelaars gehad.
- Regel dus vrienden voor je ze nodig hebt.

- Wat elke crisismanager verder moet weten is de eerste crisiswet: crisis is koffie + kroketten. Regel in het redelijke gratis versnaperingen, maaltijden, koffie, veldbedden of whatever je kan verzinnen. Personenvervoer is zorg voor mensen. Ook als de boel stilvalt.
- Wat Prorail natuurlijk prima voor elkaar heeft is die back-up. Die deed het gewoon na vier uur.
- Hooguit zou je kunnen zeggen dat dat proces eerder opgestart had kunnen worden. Parallel Amsterdam herstarten en Utrecht opstarten. Let hierbij wel op de retrospectieve vertekening. Achteraf lijkt zoiets logisch. Maar hoe vaak zijn er geen vergelijkbare verstoringen die wel na een uur zijn opgelost?
De belangrijkste overweging bij deze ICT-storing is dat we moeten leren omgaan met onzekerheden. Zowel de aanbieders van personenvervoer als de gebruikers. Als er zo’n enorm en nog steeds groeiend beroep wordt gedaan op vervoersmodaliteiten, dan stuit elk systeem op enig moment op een grens waar meer technische oplossingen geen uitkomst meer gaan brengen. Dan moet je dus het systeem aanpassen, of accepteren dat het af en toe niet gaat zoals je wilt.
In die zin is deze ICT-storing dus ook een signaal. Laat dat niet verloren gaan.