RAG

RAG of fine-tuning: 8 documenttypen bij advocatuur-intake

Sorteer de intake van een advocatenkantoor in acht documenttypen, en de vraag RAG of fine-tuning wordt minder een geloofsstrijd. Dit is de rubric die wij gebruiken.

Jacob Molkenboer· Oprichter · A Brand New Company· 5 jun 2026· 6 min

Open eiken kaartenbak met manilla tabbladen, koperen tussenschot met groen labeltje, cremekleurige kaarten met touwtje.

Het is acht uur op een dinsdagavond. De intake-paralegal van een Rotterdams handelskantoor heeft zevenendertig PDF's klaarstaan in een SharePoint-map. Een concept-opdrachtbevestiging. Een conflictmemo uit 2017. Twee artikelen uit het BW die de partner letterlijk geciteerd wil zien. Een oude NDA van een cliënt. Zes mails van de prospect. Een sjabloon voor een dagvaarding. Een urenomschrijving die de partner heeft afgekeurd omdat 'het niet klinkt als ons kantoor.' Ze wil de hele stapel in een LLM gooien en naar huis.

De vraag die de partner de volgende ochtend bezighoudt is niet of AI de stapel kan lezen. Die is: gaan we een model fine-tunen op twintig jaar van ons werk, of zetten we een retrieval-laag op een kant-en-klaar model?

Het antwoord ligt in de stapel zelf. Sorteer de documenten in acht typen en de vraag beantwoordt zichzelf binnen een uur.

Twee technieken, twee verschillende vragen

Fine-tuning leert een model een patroon. RAG geeft een model een document. Van buiten lijken ze op elkaar, want allebei laten ze het model slimmer klinken over jouw kantoor, maar ze lossen verschillende problemen op en ze falen op verschillende manieren.

Een fine-tune bakt stijl, structuur en terugkerende redeneerpatronen in de gewichten. Het is de juiste keuze als je wilt dat een model klinkt als het kantoor zonder dat je er expliciet om vraagt. Het is de verkeerde keuze als de feiten elke maandag veranderen. Een thread op Hacker News van vorige week over het fine-tunen van een LLM om docs te schrijven alsof het 1995 is, is de helderste illustratie: een paar duizend voorbeelden van toon leverden een model op dat consistent in het gewenste register schreef, zonder prompt-engineering-circus. Toon is waar fine-tunes voor zijn. De fine-tuning-guide van OpenAI is een redelijke plek om je mentale model te verankeren als je er nog nooit een hebt gedraaid.

Retrieval augmented generation doet het omgekeerde. Het model blijft generiek. Je bouwt een index over de daadwerkelijke documenten van het kantoor, en het systeem trekt tijdens runtime de relevante chunks de prompt in. RAG is de juiste keuze als je een letterlijk citaat nodig hebt, een actueel wetsartikel, een specifiek dossier, of een bronvermelding die controleerbaar moet zijn. Het overzicht van Pinecone behandelt de bewegende delen goed.

Nu de acht typen.

Documenten die om retrieval vragen

Wetten, jurisprudentie en regelgeving

Deze zijn lang, openbaar en moeten exact geciteerd worden. Een fine-tune gaat parafraseren. Een geparafraseerd wetsartikel in een memo is een beroepsaansprakelijkheidsclaim die wacht op zijn dossiernummer. Indexeren, opdelen per artikel, ophalen, citeren. Niets anders.

Conflictcheck-memo's en de partijengraph

Een conflictcheck vraagt: hebben we ooit, ergens in het kantoor, in de afgelopen tien jaar tegen deze wederpartij geprocedeerd. Dat is een gestructureerde lookup op een database met partijen, geen creatieve schrijftaak. RAG met een echte SQL of graph query eronder, geen vector similarity, wint van iedere andere aanpak. Vector search mist stilletjes 'Acme Holdings BV' als de nieuwe zaak 'Acme Holding NV' zegt.

Intakeformulieren en dossierfeiten

Elke zaak heeft een uniek feitencomplex. Het model heeft de feiten nodig tijdens inference, niet in zijn gewichten. Zet het intakeformulier in de context window. Fine-tune je op intakeformulieren, dan eindig je met een model dat een plausibel klinkende cliëntsituatie hallucineert die niet bestaat.

Documenten die om een fine-tune vragen

Opdrachtbevestigingen

Opdrachtbevestigingen zijn voor 90% boilerplate die subtiel verschilt per jurisdictie, praktijkgroep en voorkeur van de partner. Het kantoor heeft er honderden. De structuur is stabiel. De toon is die van het kantoor. Dit is het leerboekvoorbeeld voor het fine-tunen van een klein model op het corpus en het de eerste versie laten schrijven, zodat de partner nog drie clausules hoeft te corrigeren in plaats van twaalf.

Interne precedent-memo's

De manier waarop jouw kantoor redeneert over een non-concurrentiegeschil, of een uitstoot op grond van artikel 2:336 BW, staat in geen enkel leerboek. Die zit in de hoofden van drie senior associates en een stapel interne memo's van twaalf jaar terug. Dat redeneerpatroon is precies wat een fine-tune goed vastlegt. Het risico: had de senior associate ongelijk in 2018, dan heeft de fine-tune in 2026 met overtuiging ongelijk. Cureer je trainingsset.

Waarschuwing

Fine-tune nooit op documenten die levende wetsartikelen citeren. Het artikel verandert, de gewichten niet. Je levert een model op dat met overtuiging een ingetrokken artikel uit 2019 aanhaalt in een memo van 2026.

De hybride documenten

Processtukken en dagvaardingen

Een processtuk heeft de toon van het kantoor, een jurisdictie-gebonden structuur en zaakspecifieke feiten. Fine-tune het model op de processtijl van het kantoor. Haal de feiten van deze zaak op tijdens runtime. Haal het actuele procesrecht apart op. Drie signaalbronnen, één output. De integratie is het grootste deel van het werk.

Cliëntcorrespondentie

Toon is kantoor-specifiek. Status is zaak-specifiek. Een fine-tune handelt de toon af. RAG handelt de status af. De splitsing laat je het mailregister van een partner aanpassen zonder de dossierpipeline opnieuw te bouwen, en andersom.

Urenregistratie en factuuromschrijvingen

Dit is het documenttype waarover partners echt ruzie maken. '0,4, beoordeling concept-SPA, telefoon met K.' is de shorthand van het kantoor. Fine-tune op die shorthand. Maar het model moet weten welke SPA, welke K, welk gesprek. Haal dat op uit het dossier. Een fine-tune alleen verzint een geloofwaardige omschrijving voor een gesprek dat nooit plaatsvond, en de cliënt ziet dat terug op de factuur.

Een rubric van vijf minuten

Stel voor elk documenttype in je intake drie vragen en schrijf het antwoord op.

Verandert het antwoord per zaak? Zo ja, dan heb je retrieval nodig.
Telt stijl zwaarder dan feitelijke juistheid? Zo ja, dan kun je fine-tunen.
Levert een parafrasering juridisch risico op? Zo ja, dan retrieval en alleen retrieval.

Tel de antwoorden op over alle acht typen. Wint retrieval er meer dan vijf, begin met RAG. Wint fine-tune er meer dan vier, dan heb je een sterke huisstijl en een stabiel corpus; begin daar. De meeste kantoren komen uit op een hybride, en dat is prima. De verkeerde zet is om eerst de techniek te kiezen en dan te vragen welke documenten erbij passen.

Hier is de beslissing in pseudo-code, zoals we hem op een whiteboard schetsen voordat we ook maar één regel agent-code schrijven.

def route(doc_type, query, matter_id):
    if doc_type in {"statute", "case_law", "intake_form", "conflict_party"}:
        return rag(query, index=firm_index[doc_type])

    if doc_type in {"engagement_letter", "precedent_memo"}:
        return fine_tuned_model(query)

    # Hybrid: pleadings, correspondence, billing
    style = fine_tuned_model(query)
    facts = rag(query, index=firm_index["matter"], filter={"id": matter_id})
    return compose(style, facts)

Het slot

De partner wil de volgende ochtend geen architectuurdiagram zien. Hij wil zijn opdrachtbevestiging zien, geschreven in zijn toon, met het juiste artikel uit het BW erin, en de naam van de prospect correct gespeld. Die ene output is een stapeling van drie verschillende beslissingen. Toen we eerder dit jaar de dossierrouterings-agent bouwden voor een Nederlands procesrechtkantoor, was de verrassing hoeveel van het werk in het sorteren van documenten in de acht bakken hierboven zat; het kiezen van het model was de makkelijke helft. Diezelfde sortering zit achter elke AI-agent die we opleveren voor juridische en operationele teams.

Vijf minuten vandaag: open je intake-map, tel de documenttypen en zet één letter achter elk type (R voor retrieve, F voor fine-tune, H voor hybride). Die lijst is de spec voor wat je hierna bouwt.

Kern

Fine-tuning leert een model hoe het kantoor klinkt. RAG vertelt het wat vandaag waar is. Een advocatenkantoor heeft beide nodig, netjes gescheiden per documenttype.

FAQ

Wanneer wint fine-tuning het echt van RAG voor een advocatenkantoor?

Als het corpus stabiel is, de toon zwaarder telt dan het feit, en een parafrasering geen juridisch risico oplevert. Opdrachtbevestigingen en interne precedent-memo's zijn de leerboekvoorbeelden.

Kunnen we een model fine-tunen op wetsartikelen?

Nee. Wetsartikelen veranderen, modelgewichten niet. Je levert een model op dat met overtuiging ingetrokken artikelen citeert. Houd wetten in een retrieval-index waar je ze in minuten kunt bijwerken, niet in weken.

Hoe pakken we factuuromschrijvingen aan?

Hybride. Fine-tune op de shorthand en toon van het kantoor. Haal de daadwerkelijke dossieractiviteit op uit je urenregistratiesysteem. Een fine-tune alleen verzint plausibel werk dat nooit gedaan is.

Is één basismodel genoeg voor alle acht documenttypen?

Meestal wel. Hetzelfde basismodel kan zowel fine-tuned als retrieval-augmented output leveren door tijdens runtime te routeren op documenttype. Je scheidt de technieken, niet de modellen.

ragai agentsknowledge basestrategyarchitecture

Iets bouwen?

Start een project