Strategy

AI-paniek in non-fictie: 17 fouten die een redacteur fixt

Zeventien manieren waarop een Nederlandse non-fictie-uitgever de AI-paniek verkeerd aanpakt, gerangschikt op welke fouten een redacteur in één prompt fixt en welke een corpus-rebuild kosten.

Jacob Molkenboer· Oprichter · A Brand New Company· 18 jun 2026· 8 min

Zeventien crème indexkaarten op ivoor papier, messing clip, groen lint, rood lakzegel, messing potlood, leren hoek.

23:14 op een dinsdag. De redacteur bij een Nederlandse non-fictie-uitgever met een omzet tussen vijftien en achttien miljoen zit aan haar derde koffie. De najaarscatalogus sluit vrijdag om twaalf uur 's middags. Veertig hoofdstukken liggen in haar inbox, vorig weekend gegenereerd door een ghostwriting-agent die de CTO opzette nadat het bestuur een Hacker News-thread had doorgestuurd met de titel 'AI killed self-help nonfiction.' Elk hoofdstuk is technisch in orde. Geen ervan is leesbaar. De boegbeeldauteur wiens backlist ze moesten verlengen, weet er nog niets van.

Dit is het moment waarop wij gebeld worden.

De verkeerde vraag

De thread op HN had niet helemaal ongelijk. De goedkoopste non-fictie is nu gratis, en een midlist-zelfhulpauteur concurreert niet langer met drie andere midlist-zelfhulpauteurs. Ze concurreert met een Notion-template en een gesprek van veertig minuten met Claude. Het bestuur dat die thread op een zondag las, had niet ongelijk om iets te voelen. Ze hadden ongelijk in wat ze maandag moesten doen.

'Vóór het najaar een AI-lijn lanceren' is geen antwoord op de vraag. De vraag is: wat verandert een AI-tool nu écht voor een backlist-uitgever wiens unit economics afhangen van een naamauteur, het oog van een copyeditor, en een verkoper die de inkoper bij Bruna bij voornaam kent?

Die vraag kun je beantwoorden. Maar dan moet je eerst stoppen met hoofdstukken genereren.

Hoe je deze lijst leest

We hebben inmiddels editorial-assist-werk gedaan voor drie uitgevers in Nederland en België. Dezelfde zeventien fouten komen in elke afgebroken v1 terug. We hebben ze gegroepeerd op wat het kost om ze te fixen.

Tier 1-fouten draai je terug met één promptaanpassing terwijl de redacteur naast je zit. Tier 2-fouten vragen om een aanpassing in de redactionele pipeline — een tweede agent, een nieuwe stap, een ander output-schema — maar geen werk aan de data. Tier 3-fouten betekenen dat het retrieval-corpus onder de agent verkeerd is opgezet, en de enige eerlijke fix is opnieuw beginnen. Zit je vijf dagen voor een catalogusdeadline, dan kun je Tier 1 en stukken van Tier 2 nog afhandelen. Tier 3 is een Q1-gesprek, geen najaarsgesprek.

Tier 1: terug te draaien met één promptaanpassing

1. Vragen om 'een gezaghebbende stem'. Elke slechte ghostwriting-prompt begint zo. Het resultaat is het LinkedIn-essay-register: zelfverzekerd, bronloos, middelmatig. Vervang het door drie korte alinea's van je échte auteur en de regel 'match dit register, inclusief de stukken die onzeker aanvoelen'.

2. Geen voorbeelden van de huisstijl. Je huis heeft een stijl — wel of geen puntkomma's, koppen als zin of als label, voet- of eindnoten. Zonder drie tot vijf voorbeeldalinea's in de system prompt valt het model terug op een trans-Atlantische blogstem die in geen enkele Nederlandse uitgeverscatalogus voorkomt.

3. Temperature op 1.0 omdat de CTO 'creatief' dacht. Voor non-fictieproza waarin de feiten vastliggen en alleen de formulering mag variëren, zit de sweet spot tussen 0.4 en 0.6. Boven de 0.8 krijg je het hoofdstuk waarin de auteur 'een winter in Lapland doorbracht', wat ze niet deed.

4. Geen leesniveau vastgelegd. Nederlandse populaire non-fictie zit rond CEFR B2. Zonder 'schrijf op CEFR B2, zinnen onder de twintig woorden, één idee per alinea' in de system prompt schrijft het model op C1-richting-C2 en haakt je lezer af in de boekhandel.

5. Geen lengte-cap per hoofdstuk. Een frontlist-hoofdstuk telt 2.800 tot 4.200 woorden. Zonder cap produceert de agent hoofdstukken van 7.000 woorden die allemaal sterk beginnen en in de tweede helft uiteenvallen. De prompting-gids van Anthropic behandelt lengte- en structuurcontrole met voorbeelden — lees 'm voor je je volgende system prompt schrijft.

Tier 2: redactionele pipeline-aanpassingen

6. Alles in één pass genereren. Eén model in één call vragen om research, structuur, schrijven én zelfredactie te doen, is hetzelfde als een junior schrijver vragen om kant-en-klare kopij op te leveren vanuit een briefing. Splits het op in een keten van vier stappen: outline-agent, draft-agent, editor-agent, factcheck-agent. Elke stap krijgt zijn eigen prompt, eigen output-schema en één dependency stroomopwaarts. De factcheck-agent leest alleen de citaten van de draft zelf; als één claim geen opgeloste bron heeft, gaat het hoofdstuk terug naar draft voordat het ooit de inbox van de redacteur bereikt.

7. Geen factcheck-stap. De agent gaat een Nederlandse onderzoeker aan de Universiteit Leiden verzinnen met een plausibele naam en een gefabriceerde studie uit 2019. Haal elke claim door een retrieval-gebonden checker en weiger hoofdstukken met onopgeloste citaten. Laat de copyeditor niet de factchecker van laatste redmiddel zijn; in week drie heb je haar opgebrand.

8. Dezelfde prompt voor elk hoofdstuk. Veertig hoofdstukken uit één prompt leveren je veertig hoofdstukken op die hetzelfde lezen. Geef de rol van het hoofdstuk in het boek — opener, verdieping, case study, recap — mee als parameter, en laat de prompt daarop vertakken.

9. Geen voorbeelden van de auteursstem in retrieval. De drie eerdere boeken van de auteur zijn de meest signaalrijke trainingsdata die je hebt, en de duurste om te vervangen. Embed ze, splits ze per alinea in chunks, en voer bij elke draft-call twee of drie opgehaalde alinea's mee als voice anchors.

10. De agent behandelen als schrijver in plaats van als research assistant. Dit is de filosofische fout die onder de meeste andere zit. De agent is goed in 'vind elke claim in het corpus over carrièreswitches op latere leeftijd, groepeer per argument, breng tegenstrijdigheden naar boven'. Hij is slecht in 'wees Bregman'. Gebruik 'm voor het eerste werk. Betaal je auteur om het tweede te doen.

11. Geen bronbehoud in de output. Als de output van je agent platte prozatekst is, kan de copyeditor niets verifiëren. Forceer een gestructureerde output waarin elke alinea de chunk-ID's meedraagt waaruit ze is gedraft. De lezer ziet ze nooit; de redacteur en de jurist wel.

12. Geen lezerspersona. 'Schrijf voor de nieuwsgierige algemene lezer' is hetzelfde als 'schrijf voor niemand'. Pin een concrete persona vast — de 52-jarige die het vorige boek van je auteur op Schiphol kocht — in de system prompt, en het proza wordt strakker in één pass.

Tier 3: corpus volledig opnieuw bouwen

Dit zijn de fouten die pijn doen. Heeft je agent één van deze problemen, dan kun je de najaarslijn niet op deze fundering uitbrengen. Je kunt nog wel iets kleiners en eerlijkers brengen: een editorial-assist tool voor je levende auteurs, met het corpus dat je al hebt, anders ingezet.

13. Het retrieval-corpus bestaat uit volledige PDF's, niet semantisch gechunkt. Een boek van 280 pagina's chunken per pagina is waardeloos voor retrieval. Chunk op argumentgrenzen — meestal 400 tot 800 tokens, met respect voor alineabreuken — en retrieval geeft je de juiste twee alinea's terug in plaats van de juiste twee pagina's.

14. Geen metadata op chunks. Elke chunk heeft minimaal nodig: auteur, boek, jaar, genre, register, taal en licentiestatus. Zonder die metadata kun je de retrieval niet filteren, en put de agent uit je managementtitel uit 1998 terwijl hij uit je klimaatangst-boek van 2023 zou moeten putten.

15. Gelicentieerde en niet-gelicentieerde bronnen in dezelfde index. De agent weet niet uit welke bronnen je het recht hebt om af te leiden. Mengt je index je eigen backlist met gescrapete Goodreads-recensies en een paar PDF's die de stagiair downloadde, dan is elke output juridisch radioactief. Aparte indices, harde ACL's, en een log van welke chunks elk hoofdstuk gebruikte. De AI Act van de EU (Verordening 2024/1689) verplicht je om de herkomstvraag te kunnen beantwoorden. De jurist van je auteur ook.

16. Verkeerd embedding-model. Is je corpus voor 90% Nederlands en heb je het ge-embed met een Engels-getuned model, dan is je retrieval lauw en vertelt je CTO het bestuur dat 'RAG niet werkt'. Gebruik een meertalig embedding-model dat Nederlands in zijn benchmarktabel noemt. Opnieuw embedden bij een overstap gaat sneller dan je denkt — meestal een weekend, geen kwartaal.

17. Helemaal geen provenance-spoor. Als de auteur wiens stem je hebt ge-ghostschreven schriftelijk vraagt wat er is gebruikt om hoofdstuk elf te genereren, moet je dat met één klik kunnen beantwoorden. Logt je pipeline niet per alinea welke chunks zijn opgehaald, welke prompts liepen en welke modelversies de tekst produceerden, dan heb je een aansprakelijkheid gebouwd en die een product genoemd.

Waarschuwing

De fout die carrières breekt, is niet het genereren van slechte hoofdstukken. Het is slechte hoofdstukken uitbrengen onder de naam van een levende auteur zonder haar akkoord op elke zin. Niet doen.

Wat je voor vrijdag doet

Sluit de catalogus deze week en zit je op fout vijftien, dan is het antwoord niet 'toch uitbrengen en in het voorjaar excuses aanbieden'. Het antwoord is: trek de AI-lijn uit de najaarscatalogus en breng iets kleiners en waarachtigs in zijn plaats. Bijvoorbeeld de volgende titel van je sterkste levende auteur, met een editorial-assist agent die haar helpt met structuur en factcheck, draaiend op enkel de fixes van Tier 1 en Tier 2.

Dat is een minder spannende bestuursupdate dan 'we hebben een AI-imprint gelanceerd'. Het is ook een bestuursupdate die je volgend jaar opnieuw kunt geven, met dezelfde auteur nog steeds onder contract.

De vijf-minuten audit

Voor je iets anders doet, open de system prompt die je team gebruikt en check drie dingen. Staan er echte voorbeeldalinea's in van een echte auteur uit jouw huis? Is de hoofdstuklengte gecapt? Vertelt 'ie het model voor welk register en leesniveau de output bedoeld is? Mist één van die drie, dan zit je in Tier 1-territorium en kun je de outputkwaliteit van de agent het komende uur met 30% verhogen. Zitten ze er alle drie wel in en blijft de output vlak, dan zit het probleem in Tier 2 of Tier 3, en is de rest van deze gids je kaart.

Toen we afgelopen voorjaar een editorial-assist agent bouwden voor een Nederlandse non-fictie-uitgever, liepen we tegen fout 16 aan: het corpus was Nederlands, de embeddings Engels, retrieval gaf niets bruikbaars terug, en de CTO had geconcludeerd dat de techniek niet werkte. We embedden in één weekend opnieuw met een meertalig model, hielden de rest van de pipeline overeind, en dezelfde agent gaf voortaan de alinea terug die je daadwerkelijk wilde — de architectuur staat op onze pagina over AI-agents.

Open je system prompt. Zoek het woord 'gezaghebbend'. Verwijder het. Plak er drie alinea's van je auteur in. Dat is het werk van vandaag.

Kern

De meeste AI-mislukkingen in non-fictie zijn prompt-fouten die een redacteur in een uur fixt. Slechts een handvol dwingt een corpus-rebuild af — weet vóór vrijdag wat in welke categorie zit.

FAQ

Moet een Nederlandse uitgever onder de €18M in 2026 nog een AI-non-fictielijn lanceren?

Niet als zelfstandige imprint. Als editorial-assist-laag achter je levende auteurs wel. De economics werken; het merkrisico van een geghostschreven frontlist niet.

Waarom is een Nederlandstalig corpus zo bepalend?

De meeste embedding- en reasoning-modellen zijn primair op Engels getuned. Is je corpus voor 90% Nederlands en is je model niet meertalig, dan is retrieval zwak en lijkt de agent kapot terwijl het echte probleem in de index zit.

Welke van de zeventien fouten kan een redacteur fixen zonder developer?

Alle vijf Tier 1-fouten en delen van Tier 2 — alles wat in de system prompt of de redactionele review-stap leeft. Tier 3 vraagt engineering.

Wat is de kleinste nuttige editorial-assist agent die dit kwartaal de moeite waard is?

Een research- en structuur-agent voor één levende auteur: hij brengt claims naar boven, vindt tegenstrijdigheden, schetst een outline. De auteur schrijft het proza. Drie weken werk, geen corpus-rebuild.

Hoe gaan we om met de EU AI Act voor AI-gegenereerde non-fictie?

Log provenance per alinea: welke chunks zijn opgehaald, welke prompts liepen, welke modelversies produceerden de tekst. Houd gelicentieerde en niet-gelicentieerde bronnen in aparte indices met harde toegangscontroles.

strategyai agentsragknowledge baseworkflowoperations

Iets bouwen?

Start een project