Operations
AI-pilots bij kleine maakbedrijven: kiezen in week één
Dertig mensen. Eén werkvloer. Eén week om de pilot te kiezen die dag negentig wel of niet overleeft. Dit is de scorelijst die we echt gebruiken.

Maandagochtend, 9:15. We zitten bij een plaatwerkerij in Brabant. Tweeëntwintig mensen, twee CNC-machines, één parttime boekhoudster die over zes maanden met pensioen gaat. De eigenaar leest al achttien maanden over AI-agents op LinkedIn. Hij wil dat er één voor vrijdag aan het werk is. We hebben vijf werkdagen, en iemand van ons moet hem vertellen welke ene taak hij moet kiezen.
We kiezen niet op basis van demokwaliteit. We kiezen op basis van een scorelijst die zo'n veertig van dit soort weken heeft meegemaakt. Hij scoort op twee dingen: uren bespaard per euro bouwkosten, en hoe netjes je hem terugdraait op dag negentig. Dat tweede getal slaan de meeste studio's over. Het is ook het getal dat bepaalt of de pilot het eerste kwartaal overleeft.
De lijst, voordat AI ter sprake komt
De week begint op papier. We lopen met de operations lead over de werkvloer en noteren elke bureautaak die vaker dan één keer per week voorkomt. Niet 'hier kunnen we AI voor inzetten'. Gewoon de taak: wie doet 'm, hoe vaak, hoe lang, waardoor begint hij, waardoor eindigt hij.
Een typische lijst bij een klein maakbedrijf ziet er zo uit:
- Offerteaanvragen per mail, vier tot acht per dag, ongeveer vijftien minuten per stuk.
- Orderbevestigingen aan leveranciers, drie tot vijf per dag, vijf minuten.
- Voorraad hertellen na een klus, dagelijks, vijfentwintig minuten.
- Telefoontjes voor openstaande facturen, vrijdags, negentig minuten.
- Materiaalcertificaten archiveren, per zending, tien minuten.
- Productieplanning bijwerken, twee keer per dag, twintig minuten.
- 'Waar blijft mijn order' beantwoorden, vijf tot tien per dag, vier minuten.
- Schadefoto's vastleggen, per incident, twaalf minuten.
Tien tot vijftien regels is normaal. De lijst komt van de mensen die het werk doen, niet van de eigenaar. De lijst van de eigenaar weegt altijd te zwaar op wat hém persoonlijk irriteert, en dat is zelden de pilot met de hoogste waarde.
Scoren op twee assen
Elke taak krijgt twee cijfers, op een schaal van één tot vijf.
Uren bespaard per euro bouwkosten. We schatten in hoeveel uren per jaar we eraf denken te kunnen halen, en delen dat door de all-in kosten van de bouw (ons werk, plus het modelgebruik, plus de kleine tooling eromheen). Een vijf betekent een verhouding boven de 0,04 uur per euro, ruwweg veertig bespaarde uren per €1.000. Een één betekent onder de 0,005.
Terugdraai-gemak op dag negentig. Als we de agent op dag negentig om 09:00 uitzetten, hoe rommelig is dan de opruim. Een vijf betekent 'uit, niemand merkt het, geen losse data, geen externe partij geraakt'. Een één betekent 'twee systemen rekenen er nu op, het team is het handmatige proces vergeten, en de leverancier mailt naar het adres van de agent alsof het een mens is'.
Vermenigvuldig de twee cijfers. Pak de hoogste. Dat is je pilot.
Het gaat niet om de rekensom. Het gaat om de discipline. De score dwingt het gesprek naar de twee dingen die ertoe doen, en weg van de dingen die er niet toe doen: demoglans, nieuwigheid, wat de eigenaar vorige maand op een conferentie zag.
Een pilot met fantastische bespaarde uren en miserabel terugdraai-gemak is geen pilot. Dat is een huwelijk.
Eerst de terugdraai-schets, dan de bouwschets
We tekenen de terugdraai voordat we de agent tekenen. Twee kolommen op één pagina.
Linkerkolom: elk systeem, elke persoon en elke externe partij die de agent gaat raken. Rechterkolom: wat ieder van hen doet op dag negentig als we de agent om 09:00 uitzetten.
Bij een agent die openstaande facturen najaagt voor een klein maakbedrijf, leest de rechterkolom als volgt:
- Boekhoudpakket: ongemoeid, nooit aangepast.
- Boekhoudster: krijgt om 09:05 de export van openstaande posten per mail, dezelfde workflow als voorheen.
- Klanten: krijgen niets meer vanaf het adres van de agent; we sturen de inbox twee weken door naar de boekhoudster.
- Bank: ongemoeid.
- Interne Slack: het agent-kanaal valt stil, geen berichten meer.
Staat er ergens 'we moeten data migreren' of 'de leverancier moet opnieuw onboarden', dan klopt de pilot niet. De terugdraai moet op één pagina passen. Lukt dat niet, dan is de agent sneller in het bedrijf gegroeid dan hij verdiend heeft.
De killswitch is de eerste commit
Voordat we de prompt schrijven, schrijven we de uit-knop. Eén environment variable, default false. Een status-endpoint dat de eigenaar vanaf zijn telefoon kan aanroepen. Een logregel die precies print wat verstuurd zou zijn, op het moment dat de schakelaar uit staat.
# week één, commit één
export AGENT_ENABLED=false
node agent.js --dry-run
# logs: "would send: 'Hi, a friendly nudge on invoice 2026-0412...'"
Niets nieuws onder de zon. Het is config-discipline toegepast op agents, op dezelfde manier waarop de twelve-factor app configuratie als eerste-klas input behandelt. En het is wat Martin Fowler een release toggle noemt: een vlag wiens enige taak is om het nieuwe gedrag uit te zetten zonder een nieuwe deploy.
De eigenaar ziet de dry-run op dinsdag. Hij keurt de toon goed. Woensdagochtend zetten we de schakelaar om. Donderdagmiddag draait de pilot, en de rest van de week is voor de terugdraai-oefening, niet voor nieuwe functies.
Waarom uren-per-euro wint van enkel bespaarde uren
De verleiding in week één is om de taak te kiezen die de meeste uren bespaart, punt. Dat geeft een 22-mans bedrijf de verkeerde pilot. De goede pilot is die met de beste verhouding, want een maakbedrijf onder de dertig mensen kan zich geen bouw veroorloven die een tweede bouw nodig heeft om in de lucht te blijven. Een agent van €4.000 die 250 uur per jaar bespaart, wint op dag negentig van een agent van €40.000 die 800 uur per jaar bespaart. De kleinere agent laat ruimte voor de tweede pilot in maand twee, en een derde in maand vier.
Dit is ook waarom we het zware spul in week één links laten liggen. RAG over de constructietekeningen, voice agents aan de balie, alles wat een integratie van zes cijfers vraagt. Die komen in maand vier of maand zes, nadat drie kleine winsten het budget en het vertrouwen hebben verdiend.
Dag negentig, wat we echt meten
Drie cijfers, uit dezelfde spreadsheet die de eigenaar al gebruikt.
- Uren die er echt af zijn, niet geschat. Opgehaald uit een wekelijkse check-in van twee minuten met de persoon van wie de taak was.
- Netto kosten: bouw, plus modelkosten, plus onze onderhoudsretainer.
- Incidenten: alles wat de agent deed waar achteraf een mens voor moest opruimen.
Haalt de echte uren-per-euro 60% van onze schatting, dan blijft de pilot staan. Lukt dat niet, dan draaien we terug. De meeste studio's draaien nooit terug, en zo betaalt een klein maakbedrijf €1.200 per maand voor een agent die in week zes stilletjes opgehouden is bruikbaar te zijn.
Bij de veertien agents die we in productie hebben staan, hebben we twee keer teruggedraaid. Beide keren was het bedrijf opgelucht, niet beschaamd. Het gesprek was bij allebei hetzelfde: 'fijn dat we het nu weten, en niet pas in maand negen'.
De versie van vijf minuten
Toen we voor een maakbedrijf in Helmond een agent bouwden die openstaande facturen najaagt, liepen we tegen het volgende aan: het reply-to adres van de agent was binnen drie weken stilletjes het primaire contact van de leverancier geworden. De terugdraai-test op dag negentig pikte dat op. We stuurden het adres terug naar de boekhoudster voor de overschakeling, en de leverancier merkte de verandering nooit. Dat soort klein reparatiewerk is het grootste deel van wat goede procesautomatisering in de praktijk is.
Eén audit die je vanmiddag kunt doen: pak de eerstvolgende drie taken waar je team voor 11:00 over heeft geklaagd, en schrijf voor elk de beschrijving van de uit-knop. Die met de kortste beschrijving is je pilot voor week één.
Kern
Een pilot die je op dag negentig niet schoon kunt uitzetten, is geen pilot. Dat is een huwelijk. Scoor eerst de terugdraai, dan pas de bespaarde uren.
FAQ
Hoe lang duurt week één eigenlijk?
Vijf werkdagen, één daarvan op de werkvloer. Kost het invullen van de scorelijst meer dan een dag, dan was de takenlijst niet concreet genoeg. Loop nog een keer over de vloer.
Wat als de hoogst scorende pilot niet de pilot is die de eigenaar wil?
Laat beide scores aan de eigenaar zien. De beslissing is aan hem. Onze taak is om de terugdraai-kosten zichtbaar te maken voordat hij tekent, niet om zijn keuze te overrulen.
Waarom scoor je terugdraai-gemak juist op dag negentig?
Negentig dagen is lang genoeg om de agent in de routines te laten zakken, en kort genoeg dat het oorspronkelijke handmatige proces nog in het spiergeheugen zit. De meeste spijt over een agent komt hier naar boven.
Wat is een redelijk bouwbudget voor een eerste pilot?
Voor een maakbedrijf onder de dertig mensen, tussen €3.000 en €8.000 all-in. Alles wat daarboven zit, vraagt om bewijs ter waarde van een tweede pilot, en dat heb je per definitie nog niet.