Strategy

AI-keuze voor mkb: Bedrock vs Azure vs Fable gescoord

Een rubric voor Nederlandse bedrijven onder €25M die kiezen tussen Bedrock, Azure Foundry en Fable, gescoord op tokenkosten, AVG en inkooppolitiek.

Jacob Molkenboer· Oprichter · A Brand New Company· 13 jun 2026· 6 min

Drie messing gewichtjes op ivoorkleurig papier, één met groen lint, naast een gevouwen crèmekleurige indexkaart.

Een financieel directeur in Eindhoven belde ons vorige maand met drie leveranciersdecks open op haar scherm. Eén was AWS die de Anthropic-familie op Bedrock pitchte. Eén was opnieuw AWS, nu met de Fable-lijn achter een VPC endpoint. Eén was Microsoft met Azure Foundry, het bestaande enterprise agreement netjes weggewerkt in de appendix. Inkoop wilde vrijdag een memo. De CTO wilde een antwoord waar ze zich over twee jaar niet voor hoefden te schamen.

Dit stuk is de rubric die we met haar doorliepen. Het is geen benchmark. Het is de methode die we gebruiken als een Nederlands B2B-dienstenbedrijf onder de €25M omzet voor dezelfde keuze staat: waar laat je een AI-feature draaien die per maand tussen de 30 en 50 miljoen tokens verwerkt, met een AVG-audit op de stoep.

De drie paden in gewone taal

De decks zien er uitwisselbaar uit. De platformen niet.

Anthropic-modellen op AWS Bedrock. Geserveerd vanuit eu-central-1 (Frankfurt), eu-north-1 (Stockholm) of eu-west-3 (Parijs). Modelversies lopen een week of twee achter op de directe API van de leverancier. AWS tekent de verwerkersovereenkomst. Training opt-out staat tegenwoordig standaard aan, maar bevestig het even in de console voordat je tekent.

Fable op AWS via een VPC endpoint. Zelfde leveranciersfamilie, ander distributiepad. PrivateLink houdt verkeer van het publieke internet af, en dat is de enige reden waarom de meeste CISO's erom vragen. De doorvoerplafonds liggen hoger dan de on-demand quota van Bedrock. De facturatie is lastiger te overzien, omdat cross-AZ datakosten laat in de rekening opduiken.

Microsoft Azure Foundry. Een andere modellijn binnen Microsofts tenancy. EU-dataresidentie staat in het standaardcontract. Het deprecatieritme wordt bepaald door Microsoft, niet door de modelleverancier, en historisch hebben ze modellen sneller uitgefaseerd dan AWS.

De tokenrekensom bij 38M per maand

Op dit punt zou je in de meeste blogposts een tabel met lijstprijzen krijgen. Hier niet. Lijstprijzen verschuiven elk kwartaal, en bij dit volume zijn niet de kopprijzen de regels die je rekening bepalen.

Neem een typische RAG-verdeling van 27M input tokens en 11M output tokens. Op een mid-tier model komen alle drie de platformen in dezelfde bandbreedte uit: zo'n €250 tot €600 per maand op lijstprijs. Het verschil zakt onder de 15% zodra je rekening houdt met:

Prompt caching, die herhaalde context met 50% tot 90% korting wegzet bij elke provider die het ondersteunt.
Provisioned throughput, dat pas rendeert boven ongeveer 80M tokens per maand. Daaronder is on-demand goedkoper.
Cross-region datatransport, dat Azure vaak verstopt in de rekening en dat Bedrock als aparte regel weergeeft.

Het eerlijke antwoord: kosten zijn bij dit volume zelden de doorslag. Het getal dat je aan inkoop geeft, is het all-in maandbedrag met caching aan, niet de input/output-prijs die in een slidefooter past.

Let op

Als je leverancier je per-1M-token tarieven gaf zonder het cached-input tarief, is de offerte onvolledig. Voor de meeste RAG-workloads is het cached tarief de echte prijs.

AVG-houdbaarheid, audit voor audit

Hier valt de keuze echt. Je auditor stelt in willekeurige volgorde drie vragen:

Waar staat de data, in rust, onderweg en in het context window van het model?
Wie heeft er toegang toe, op welke juridische grondslag en voor hoe lang?
Kun je een getekende verwerkersovereenkomst overleggen die specifiek AI-verwerking dekt, niet alleen algemene cloud?

Alle drie de platformen kunnen 'ja' antwoorden. Standaard doet geen van drieën dat. Het auditrisico zit bijna nooit in het platform. Het zit in de configuratie: staat je default region op eu-central-1, is de training opt-out doorgezet op elk account in de organisatie, noemt je verwerkersovereenkomst inference, worden logs versleuteld met een sleutel die je zelf beheert.

Schrems II is nog niet weg. AWS en Microsoft zijn beide aangesloten op het EU-US Data Privacy Framework, wat je juridische dekking geeft voor doorgiften, maar een grondige auditor vraagt alsnog om een Transfer Impact Assessment. Zorg dat je er een klaar hebt liggen. Twee pagina's is genoeg.

De meest voorkomende auditbevinding bij bedrijven van dit formaat: prompts met persoonsgegevens worden zonder bewaartermijn naar CloudWatch of Azure Monitor gelogd, terwijl de privacyverklaring 30 dagen aanhoudt. Fix dat op dag één. Lees de richtlijnen van de Autoriteit Persoonsgegevens over AI voordat je auditor het doet.

Wie de modelversie-pin uitlegt

Dit is de vraag die inkoop als laatste stelt en die jij als eerste moet beantwoorden. AI-modellen worden uitgefaseerd. Het model dat je agent vandaag gebruikt, gaat over 12 tot 24 maanden uit de lucht. De stuurgroep wil weten wat er dan gebeurt.

Het inhoudelijke antwoord heeft drie delen:

Bedrock publiceert een publieke deprecatiekalender, doorgaans met 6 maanden aankondiging. Je herpint een model-ID in je infrastructure-as-code.
Fable-achtige VPC-deployments volgen dezelfde kalender, maar zitten strakker vast aan de release notes van de leverancier zelf. De migratie is meestal een wijziging van één regel.
Azure Foundry bepaalt zijn eigen uitfaseerschema. In het verleden bewoog dat sneller dan AWS. Je herpint tegen een andere familie als de lijn wordt opgeheven.

Het politieke antwoord is belangrijker. Iemand in je team moet de deprecatie-aankondiging lezen zodra die binnenkomt, de migratie plannen en aan een niet-technische directie uitleggen waarom de agent die op Model X draaide nu op Model Y draait. Als die persoon bestaat, zijn alle drie de platformen prima. Bestaat die persoon niet, dan wint standaard het platform met de langste runway en de stevigste professional-services-relatie.

Het open-source-argument speelt hier ook mee. De recente Hacker News-discussie waarom open source AI moet winnen is geen zijspoor: een zelf gehost Llama-achtig model op je eigen GPU's lost de pin-vraag op door het schema bij je eigen ops-team te leggen. Het levert ook nieuwe problemen op (eval pipelines, GPU ops, een aparte audit trail) waar we apart over schrijven.

De rubric, in één scherm

We scoren vijf assen van 1 tot 5, gewogen per bedrijf. De cijfers tellen minder dan het gesprek dat elke as afdwingt.

axes:
  - name: cost_at_actual_volume      # all-in, caching aan, geen lijstprijs
    weight: 1
  - name: avg_audit_defensibility    # DPA, residentie, opt-out, logs
    weight: 3
  - name: operational_burden         # wie onderhoudt de versie-pin
    weight: 2
  - name: procurement_frictionless   # bestaand contract, sole-source memo
    weight: 2
  - name: model_fit                  # doet het model het werk eigenlijk wel
    weight: 3

decision_rule: |
  Kies de hoogste gewogen som, toets daarna tegen
  de auditor-vraag en de "wie legt het uit"-vraag.

Drie checks voordat je iets tekent:

Als je AVG-score op een platform onder de 4 zit, fix dan de configuratie vóór de handtekening, niet erna.
Als je inkoopscore je hoogste is, vraag jezelf af of je het platform kiest of de makkelijke memo.
Als je model-fit score onder de 3 zit, doet geen ander getal er nog toe. De agent gaat niet werken.

Wat we voor het Eindhovense bedrijf deden

Ze kozen voor Bedrock in Frankfurt, niet omdat het op kosten het hoogst scoorde (dat deed het niet), maar omdat hun AWS-accountmanager binnen 24 uur het deprecatiebeleid op papier had, en het bestaande AWS-contract een inkoopstap van vier weken wegnam. We hielpen ze de Transfer Impact Assessment opstellen en de modelversie in Terraform vastpinnen. Als we AI-agents bouwen voor bedrijven van dit formaat, zit het knelpunt bijna nooit in het model. Het zit in het papierwerk dat bepaalt welk model je überhaupt mag gebruiken.

Begin bij de auditor-vraag. Scoor je drie opties op één pagina. Leg die pagina eerst bij inkoop neer, daarna pas bij engineering.

Kern

Op dit volume is de prijs niet doorslaggevend. AVG-houdbaarheid en wie het deprecatiebeleid in handen heeft, bepalen de inkoopstem.

FAQ

Geeft Bedrock of Azure Foundry betere AVG-houdbaarheid?

Goed geconfigureerd is de houdbaarheid gelijkwaardig. Het auditrisico zit in je configuratie (regio, opt-out, scope van de DPA, log-retentie), niet in de naam van het platform.

Is per-token kosten de juiste manier om deze platformen te vergelijken?

Niet bij 38M tokens per maand. Cached input tarieven en cross-region datatransport bepalen de echte rekening. Gebruik het all-in maandbedrag met caching aan, niet het kopprijsje.

Hoe lang hebben we voordat ons vastgepinde model wordt uitgefaseerd?

Reken op 12 tot 24 maanden. AWS Bedrock publiceert lifecycle-aankondigingen met ongeveer 6 maanden waarschuwing. Azure heeft in het verleden modelversies op kortere termijnen uitgefaseerd.

Moet een Nederlands bedrijf onder de €25M overwegen om een open model zelf te hosten?

Soms. Zelf hosten haalt de deprecatie-vraag weg, maar voegt GPU ops, eval pipelines en een nieuwe audit trail toe. De moeite waard als vierde kolom als je ops-team de capaciteit heeft.

ai agentsstrategyarchitectureoperationssecuritybusiness

Iets bouwen?

Start een project