Operations
Storingsintake scoren: voice agent, desk of hybride model
Een CV-ketel uitgevallen in Voorburg, zondagochtend 06:47. Drie storingsintake-modellen op tafel voor een installatiebedrijf onder €8M — zo scoren we ze.

Het is 06:47 op een zondag in november. Een CV-ketel in Voorburg slaat niet aan. De eigenaresse heeft een zesjarige die sinds 06:20 huilt. De storingsintake-rotatie bij haar installatiebedrijf begint pas maandag om 07:30. De voicemail stuurt haar naar een app. De app stuurt haar naar een formulier. Om 09:00 krijg jij het telefoontje van haar partner, die in het bestuur van de VvE zit.
Jij bent de directeur. Elk kwartaal stelt de operations lead een andere versie van dezelfde vraag: zetten we Claude op een Plantronics-headset en laten we hem de call aannemen, houden we de drie-persoonsrotatie aan die we altijd hebben gehad, of gaan we hybride — agent neemt op, escaleert naar een werkvoorbereider op de calls die het verdienen.
Elke optie heeft een verdediger in de kamer. Elke verdediger heeft een getal dat zijn verhaal flatteert. Wij gebruiken een vierregelige scoringsmethode voor deze beslissing. Hij kiest de winnaar niet voor je. Hij maakt het antwoord verdedigbaar — naar de directie, naar de verzekeraar, en naar de Inspectie SZW als iemand ooit vraagt waarom een spoed in een wachtrij bleef hangen.
De drie configuraties op tafel
A — Claude voice agent op een Plantronics-headset
Een 24/7 SIP-lijn naar een Twilio- of Voys-trunk, live getranscribeerd, de agent triageert tegen de installatiegeschiedenis van de klant, classificeert op NEN 1010-foutcategorieën, identificeert risicocategorie (gas, elektra, water) en boekt óf een onderhoudsslot óf belt de spoed-monteur op roulatie. Het Plantronics-stuk is geen metafoor. De agent draait op dezelfde headset die de werkvoorbereider gedragen zou hebben, dus als de agent overdraagt, zit de audio-context al in de kamer. Geen model hoort wat een werkvoorbereider hoort in de derde zin van een paniekgesprek. Het kan wel alles transcriberen, elke keer.
B — Drie-persoons servicedesk-rotatie
Twee werkvoorbereiders en één junior planner, ATV-diensten roulerend door de week, 07:00–19:00 doordeweeks, 08:00–14:00 op zaterdag, voicemail-naar-telefoonaanname op zondag. Dit is het model dat jouw concurrenten in Naaldwijk en Bodegraven nog steeds draaien, en het model waar de meeste installatiebedrijven in deze omzetcategorie stilletjes op terugvallen als het agent-gesprek te politiek wordt. Het werkt. Het is ook het model dat jouw Voorburg-incident hierboven produceerde.
C — Hybride agent-first met werkvoorbereider hand-off
Agent neemt eerst op. Hij verzamelt de acht velden die de werkvoorbereider gevraagd zou hebben — adres, ketelmerk, type melding, foutcode op het display, tijdsduur, water uit ketel ja/nee, gasgeur ja/nee, contactvoorkeur — classificeert risico en routeert alleen naar een mens als de call aan één van zeven escalatieregels voldoet. De werkvoorbereider ziet het transcript voordat de call op haar headset binnenkomt. Ze begint niet koud.
Kosten per melding bij 2.640 storingen per maand
2.640 storingen per maand zijn 88 per dag, gemiddeld 3,7 per uur. De curve is bruut. Maandag 07:00–10:00 draagt grofweg 22% van het weekvolume. Zondagmiddag draagt zo'n 1,8%. Die asymmetrie sloopt het pure rotatiemodel op kosten en laat het agent-only-model op de spreadsheet goedkoper lijken dan het is.
De kostenregel die we op de one-pager voor de directie zetten:
A: agent B: rotatie C: hybride
Kosten per melding ~€0,94 ~€4,10 ~€1,62
Doorlooptijd tot slot 11 min 14 min 9 min
Spoed-escalatie agent⇒pieper mens direct agent⇒wvb
Zondag 06:00–10:00 gedekt voicemail gedekt
Maandag 07:00–10:00 rij oké overflow rij oké
Gas-cat audit trail transcript handmatig transcript + wvb-akkoord
De cijfers zijn waar een Nederlands installatiebedrijf in deze omzetcategorie na ongeveer zes maanden op uitkomt: telefonie (Voys of Twilio), modelinference (Sonnet op de caller-facing flow, Haiku op transcriptie-opschoning en classificatie), plus ongeveer 0,3 FTE werkvoorbereider voor de hand-off-kant van het hybride model. Jouw getallen verschillen ±30%. De methode niet.
A — alleen voice agent — lijkt op het oog de evidente winnaar op kosten per melding. Dat is hij ook, op kosten per melding. Niet op de totale kosten van fout zitten. De volgende paragraaf is waarom.
NEN 1010-verantwoording onder de Arbo-RI&E
Dit is het stuk dat de kostenspreadsheet niet hardop zegt. Een storingsintake op een huisinstallatie valt onder de verantwoordelijkheid van de klant, maar zodra jouw monteur aankomt, verwacht de Arbeidsomstandighedenwet dat jouw RI&E het risico dat hij of zij tegenkomt heeft afgewogen. NEN 1010 regelt de installatie. Jouw RI&E regelt hoe jouw mensen die installatie benaderen. De intake is de brug — de plek waar je beslist wat jouw monteur moet verwachten als de bestelbusdeur dichtschuift.
Wanneer de intake de risicoclassificatie ondermijnt — agent besluit dat het een Cat. II-melding is, monteur komt zondagmiddag aan en verwacht een routinematige reset, loopt een smeulende hoofdverdeler tegemoet — komt verantwoording neer op drie vragen:
- Was de intake end-to-end auditeerbaar? Bewaarde je het transcript en het classificatiepad dat het systeem volgde?
- Was de classificatieregel zelf gedocumenteerd en versiebeheerd op het moment dat de call binnenkwam? Of veranderde de regel afgelopen dinsdag en heeft niemand het opgeschreven?
- Zat er een mens in de loop op het beslismoment dat ertoe deed, met genoeg context om het oneens te zijn met het model?
Model A faalt op (3) in de cases die het meest pijn doen. Model B slaagt op (3) bij elke call maar faalt stilletjes op (1) en (2) — rotatiepersoneel classificeert in zijn hoofd, de regel staat in een Slack-thread uit 2024, niets wordt gelogd op een manier die een verzekeraar zou accepteren. Model C slaagt op alle drie als je het goed bedraadt.
Hybride is de enige configuratie waarin je de Inspectie SZW een versiebeheerde prompt, een volledig transcript en de aantekening van de werkvoorbereider kunt overhandigen — alles binnen ongeveer dertig seconden nadat het verzoek in je inbox is geland.
Een pure voice-agent-intake op gas-gerelateerde storingen is alleen verdedigbaar als de agent 100% van de gas-cat-calls naar een mens escaleert voordat er wordt uitgereden. Wij hebben één Nederlands installatiebedrijf deze regel preventief zien instellen, drie nadat het bijna misging, en nul voordat er überhaupt een agent in de loop zat.
Zondagochtend-eigenaarschap als de agent een compromis sluit
Eigenaarschap van de prompt-repo is een benoemde rol of het is geen rol. Anthropic's eigen verhaal over building effective agents komt steeds op hetzelfde punt uit: de mensen om een agent heen moeten eigenaar zijn van zijn beslissingen, niet alleen van zijn output. Wie de prompt bezit, bezit ook de rollback als de agent op zondagochtend een compromis sluit. Als je die persoon niet kunt benoemen op zondag om 07:00, heb je geen agent in productie. Je hebt een onbeheerde stem in een wachtrij.
Het compromis waar wij om geven, is niet dat het model een onderdeelnummer hallucineert. Dat is irritant en gemakkelijk te vangen. Het compromis waar wij om geven, is dat het model de verkeerde urgentiecategorie kiest. Cat. III behandeld als Cat. II is een klantklacht. Cat. II behandeld als Cat. III is een lijkschouwer. Het hele punt van de scoringsmethode is om jouw bedrijf uit die tweede zin te houden.
Eigenaarschap moet benoemd zijn voordat je live gaat. Twee rollen, op één pagina:
- Model A: de directeur bezit de prompt en de uitruk, want er is niemand anders. Dit overleeft één bijna-incident niet.
- Model B: de roulerende planner bezit de call en de uitruk. Verdedigbaar. Traag bij volumepieken. Klapt om op zondag.
- Model C: de werkvoorbereider op roulatie bezit de uitruk. De technisch directeur bezit de prompt. Twee benoemde mensen, twee aparte verantwoordelijkheden, beide vastgelegd in het kwaliteitshandboek voordat de eerste call binnenkomt.
Agents zijn betrouwbaar voor zover de mensen eromheen een snelle, heldere, gedocumenteerde escalatieroute hebben. Tooling redt je niet van een onbeheerde spoed. Er is geen tijdelijk Cloudflare-account voor een installatiebedrijf dat vergat te benoemen wie opneemt.
Het scoringsblad dat we de directie overhandigen
Dit is de ene pagina die de directievergadering ingaat. De wegingen zijn van ons en we kijken ze elke twaalf maanden opnieuw. De jouwe moeten jouw spoed-mix en jouw verzekering weerspiegelen.
Dimensie Weging A B C
Kosten per melding 25% 9 4 8
Doorlooptijd tot slot 15% 7 5 9
Zondag-/feestdagdekking 15% 9 2 9
NEN 1010-audit trail 20% 4 5 9
Arbo-RI&E-verantwoording 15% 3 7 9
Eigenaarschap bij spoed 10% 4 7 8
--- --- ---
Gewogen totaal 6,4 4,7 8,6
Kolom A wint op kosten en dekking en verliest alles wat voor een rechter belandt. Kolom B wint op eenvoud en verliest op volume en weekend. Kolom C is het antwoord voor bijna elk installatiebedrijf in deze omzetcategorie — niet omdat hij glanzend is, maar omdat hij de enige configuratie is die boven de 7 scoort op de twee regels die een bijna-incident overleven.
Als jouw scoringsblad een ander antwoord geeft — stel B wint op een 2.000-meldingenbodem omdat jouw spoed-mix voor 60% planned-maintenance follow-up is in plaats van echte storingen — is dat ook prima. De methode is de methode. Het punt is dat de directie kan zien waarom.
Toen wij de storingsintake-agent bouwden voor een klimaat-installatiebedrijf bij Zoetermeer, was waar we keer op keer tegenaan liepen de gas-cat-escalatieregel. De agent was goed in het kalmeren van de beller — te goed. De werkvoorbereider kreeg minder zondagescalaties dan ze had moeten krijgen. We losten dit op door de gas-cat-escalatie als harde, niet-onderhandelbare routeerregel in de prompt te zetten, niet als modeloordeel. Schets jij dezelfde beslissing voor je eigen bedrijf, dan staan op onze voice agents-pagina de architectuurschets en de zeven escalatieregels die we nu standaard draaien.
Open een spreadsheet. Zet je laatste 60 storingen op een rij. Markeer bij elke melding of een werkvoorbereider hem anders zou hebben geclassificeerd dan de intake deed. De ratio die je krijgt is jouw weging voor regel 4 van de tabel hierboven. Dat is het kleinste verdedigbare ding dat je deze week kunt doen, en het is genoeg om het gesprek in de volgende directievergadering te starten.
Kern
Hybride agent-first-intake wint omdat het de enige configuratie is die je een transcript, een versiebeheerde regel en een benoemde mens geeft op de calls die uiteindelijk voor de rechter belanden.
FAQ
Wat kost een voice agent voor storingsintake daadwerkelijk bij 2.640 meldingen per maand?
Kosten per melding komen na zes maanden uit op ongeveer €0,94 voor agent-only en €1,62 voor hybride bij dat volume. Trunkkeuze en modelmix verschuiven dit met grofweg 30%.
Hoe is NEN 1010 van toepassing op een AI-voice agent?
NEN 1010 regelt de installatie, niet de intake. De intake valt onder jouw RI&E. Bewaar transcripten, versiebeheer je classificatieregels en route 100% van de gas-cat-calls naar een mens voordat er wordt uitgereden.
Wie moet de uitruk van de spoed-monteur bezitten als de agent een compromis sluit?
Benoem twee mensen in het kwaliteitshandboek voordat je live gaat: de werkvoorbereider op roulatie bezit de uitruk, en de technisch directeur bezit de prompt. Twee handtekeningen, één pagina.
Waarom hybride in plaats van pure agent of pure rotatie?
Pure agent is het goedkoopst per melding en niet verdedigbaar op gas-cat. Pure rotatie klapt om in het weekend en bij volumepieken. Hybride houdt ongeveer 70% van de kostenwinst en zet een mens op de calls die er echt toe doen.