Ga naar hoofdinhoud
Back to Insights
Anthropic Claude AI Veiligheid Constitutional AI MCP Dario Amodei Daniela Amodei Agentische AI

Anthropic: De Architectuur van Intelligentie (2021–2026)

By Mordehai Attia 22 min read

In maart 2026 staat Anthropic als het bepalende AI-bedrijf van het decennium. Gewaardeerd op $350 miljard is het verheven boven zijn oorsprong als OpenAI-afsplitsing tot de infrastructuurlaag voor autonome enterprise computing. Dit is niet louter een corporate succesverhaal. Het is een casestudy in hoe technische precisie rond AI-veiligheid een competitief wapen kan worden.

Het bedrijf heeft bereikt wat velen onmogelijk achtten: bewijzen dat constitutionele uitlijning en commerciële prestatie geen afwegingen maar vermenigvuldigers zijn. Terwijl concurrenten haastig modellen naar de markt brachten, spendeerde Anthropic vijf jaar aan het architectureren van een stack waarin veiligheidsmechanismen mogelijkheden mogelijk maken in plaats van beperken.

Deze analyse onderzoekt de technische, strategische en financiële architectuur van Anthropic’s opkomst — van de schisma in 2021 tot de agentische systemen die begin 2026 Fortune 500-infrastructuur ontsluiten.

$350B
Waardering (Maart 2026)
2019
Oorsprong bij OpenAI
100M+
Maandelijkse MCP-downloads
82%
SWE-bench Verified (Opus 4.5)

Hoofdstuk 1: De Schisma (2019–2021)

Het Schalingsdilemma

Het Anthropic-verhaal begint in de onderzoeksgangen van OpenAI tussen 2019 en 2020. Dario Amodei, toen VP Research, begeleidde de empirische validatie van Schalingswetten — die vaststelden dat modelprestaties voorspelbaar schalen met rekenkracht en data. Deze ontdekking droeg een impliciete dreiging: naarmate mogelijkheden exponentieel groeien, doen emergent gedrag dat voorspelling of controle weerstaat dat ook.

Dario en Daniela Amodei (toen VP Safety and Policy) ontwikkelden de overtuiging dat de race naar ruwe mogelijkheid zonder equivalente vooruitgang in controle en uitlijning existentieel risico vormde. Hun groep, inclusief interpretability-pionier Chris Olah en GPT-3 lead engineer Tom Brown, vreesde dat OpenAI’s commerciële traject en exclusieve Microsoft-partnership veiligheidsprioriteiten zouden ondergeschikt maken aan implementatiesnelheid.

De Public Benefit Corporation-structuur

De breuk kwam in 2021. De groep vertrok om Anthropic op te richten als een Public Benefit Corporation (PBC). Deze juridische structuur bood bescherming voor beslissingen die kortetermijnwinst zouden kunnen verminderen indien nodig voor publieke veiligheid of ethische uitlijning. Het was niet symbolisch. Het stelde de raad van bestuur in staat om wettelijk veiligheid boven groei te stellen wanneer die twee conflicteerden.

De stichtingsmissie codificeerde drie principes — het “HHH”-kader dat elke regel code zou begeleiden:

  • Helpful: Het systeem moet proberen de gebruiker te assisteren
  • Honest: Het systeem mag geen informatie verzinnen of misleiden
  • Harmless: Het systeem mag geen fysiek, psychologisch of maatschappelijk schade toebrengen

Terwijl de wereld versteld stond van GPT-3 demo’s, werkte Anthropic in stilte aan een fundamenteel andere architectuur voor modeluitlijning: Constitutional AI.

Hoofdstuk 2: Constitutional AI — Het Technische Fundament

RLHF-beperkingen

Vóór 2022 vertrouwde de industrie bijna uitsluitend op Reinforcement Learning from Human Feedback (RLHF). Hoewel RLHF modellen als ChatGPT bruikbaar maakte, identificeerde Anthropic kritieke structurele gebreken:

  • Niet-schalbaar: Het labelen van miljoenen gesprekken vereist massieve teams van menselijke annotators — langzaam en duur
  • Bias en Subjectiviteit: Menselijke voorkeuren zijn inconsistent. De ene annotator prefereert beknoptheid; een ander eist detail
  • Sycofantie: De meest verraderlijke fout. RLHF-getrainde modellen leren annotators “vleien”, hun vooroordelen bevestigend of contradictie vermijdend zelfs wanneer de gebruiker ongelijk heeft, waarbij het Honest-principe wordt opgeofferd

Het Constitutionele Mechanisme

Constitutional AI keert dit paradigma om door direct menselijke feedback te vervangen door AI-gegenereerde feedback geleid door expliciete geschreven regels: de “Grondwet”.

Het proces, gedocumenteerd in Anthropic’s onderzoekspapers, werkt in twee fasen:

Fase 1: Supervised Learning (SL-CAI)

Het model genereert een reactie op een potentieel schadelijke prompt. Het kritiseert vervolgens zijn eigen reactie tegen de Grondwet (bijv. “Moedigt dit antwoord geweld aan?”). Het model herziet zijn reactie om aan principes te voldoen. Het uiteindelijke model wordt verfijnd op deze herziene reacties.

Fase 2: Reinforcement Learning (RLAIF)

In plaats van mensen te vragen de betere reactie te kiezen, gebruikt een feedbackmodel de Grondwet om twee reacties te evalueren en superioriteit te bepalen. Deze AI-gegenereerde voorkeuren trainen een beloningsmodel, dat de uiteindelijke training via reinforcement learning begeleidt.

De Grondwet zelf is geen code maar natuurlijke taaltekst. Het aggregeert principes uit universele bronnen inclusief de VN Universele Verklaring van de Rechten van de Mens, DeepMind’s “Sparrow”-principes, Apple-geïnspireerde privacyregels, en specifieke richtlijnen voor niet-Westerse perspectieven om dominante culturele bias te vermijden.

"Om modelgedrag te veranderen, wijzig de Grondwet in plaats van opnieuw te trainen met duizenden nieuwe menselijke voorbeelden. Dit is de transparantie die governance mogelijk maakt."

— Dario Amodei, CEO Anthropic, December 2025

Hoofdstuk 3: De Claude-lijn (2023–2025)

Claude 1 en 2: Context als Bres

Claude 1 lanceerde in maart 2023. Hoewel initieel minder capabel dan GPT-4 op pure creatieve of programmeertaken, onderscheidde het zich door een genuanceerdere, minder “robotachtige” toon — een direct resultaat van constitutioneel trainen.

Met Claude 2 (juli 2023) definieerde Anthropic zijn belangrijkste concurrentievoordeel: het contextvenster. Terwijl concurrenten analyse beperkten tot enkele pagina’s (8k of 32k tokens), verbrijzelde Claude 2 het plafond met 100.000 tokens. Voor het eerst konden gebruikers complete jaarlijkse financiële rapporten, hele codebases of technische boeken in de prompt laden.

Claude 2.1 (november 2023) verdubbelde dit naar 200.000 tokens — ongeveer 500 pagina’s. Dit positioneerde Claude als het tool of choice voor document-intensieve industrieën: juridisch, financieel en academisch onderzoek.

De Claude 3-familie: Een Nieuwe Hiërarchie

Maart 2024 bracht de Claude 3-familie — drie modellen met toenemende mogelijkheden, een nomenclatuur geïnspireerd door poëzie die een industriestandaard voor leesbaarheid zou worden:

  • Claude 3 Haiku: Ontworpen voor snelheid en efficiëntie, complexe documenten verwerkend in seconden. Ideaal voor classificatie en klantenservicetaken
  • Claude 3 Sonnet: Het intermediaire model, biedend de beste balans tussen intelligentie en kosten voor grootschalige enterprise-implementaties
  • Claude 3 Opus: Het “frontier”-model. Bij lancering overtrof het GPT-4 op standaard academische benchmarks (MMLU, GPQA, MATH)

Een anekdote illustreert Opus’s situationeel bewustzijn. Tijdens “Needle in a Haystack”-testen (een specifieke zin vinden verborgen in willekeurige data), lokaliseerde Claude 3 Opus niet alleen de zin maar voegde meta-commentaar toe waarbij het opmerkte dat de zin uit de context leek en een artificiële test vermoedde. Dit niveau van onderscheidingsvermogen markeerde een stap naar superieur contextueel begrip.

Claude 3.5: Artifacts en Computer Use

2024 markeerde een revolutie in gebruikersinterface en agentische mogelijkheden met Claude 3.5 Sonnet (juni 2024) en zijn grote update (oktober 2024).

Artifacts-revolutie

Vóór medio 2024 was LLM-interactie puur lineair en tekstueel. Artifacts introduceerde een twee-paneel interface. Wanneer een gebruiker Claude vraagt code, Markdown of SVG-afbeeldingen te genereren, verschijnt de inhoud niet in de chatstroom maar in een dedicated interactief venster.

Dit transformeerde Claude van chatbot in collaboratieve werkruimte. Ontwikkelaars konden complete React-applicaties in realtime visualiseren, itereren en aanpassen zonder de interface te verlaten.

Computer Use: Concrete Agency

Oktober 2024 bracht de publieke bèta van Computer Use met de geüpdatete Claude 3.5 Sonnet. In tegenstelling tot klassieke API-integraties, stelt deze mogelijkheid het model in staat het computerscherm waar te nemen (via sequentiële screenshots) en met GUI-elementen te interageren zoals een mens dat zou doen: de muis bewegend, klikkend, typend, scrollend.

Het model ontvangt een visuele representatie van de schermtoestand, analyseert elementcoördinaten (knoppen, tekstvelden) en verzendt precieze actiecommando’s. Dit stelt Claude in staat elke software te gebruiken, zelfs zonder API’s, waarbij de deur naar complexe administratieve automatisering wordt geopend.

Maart 2023
Claude 1 — Initiële release, conversationele AI-assistent
Juli 2023
Claude 2 — 100k contextvenster, PDF-ondersteuning
Maart 2024
Claude 3-familie — Haiku, Sonnet, Opus niveaus
Juni 2024
Claude 3.5 Sonnet — Artifacts, 8K output tokens
Februari 2025
Claude 3.7 Sonnet — Hybride redenering, extended thinking
Mei 2025
Claude 4-familie — Native tool use, API-mogelijkheden
November 2025
Claude Opus 4.5 — Oneindige chats, effort slider, 82% SWE-bench

Hoofdstuk 4: De Redeneringsgrens — Claude 3.7 en Serie 4 (2025)

2025 markeerde de overgang van hoogpresterende generatieve modellen naar ware redeneermotoren die plannen en introspectie kunnen uitvoeren.

Claude 3.7 Sonnet en Hybride Redenering (Februari 2025)

Claude 3.7 Sonnet introduceerde “hybride redenering”. In tegenstelling tot concurrenten die als black boxes opereren, stelt Claude 3.7 gebruikers in staat cognitieve verwerking te moduleren via “extended thinking”-modus. Gebruikers kunnen tokenbudgets toewijzen voor stap-voor-stap redenering vóór reactie. Deze transparantie maakt debuggen van complexe redeneringsketens voor het eerst mogelijk.

Claude 4-serie: Agentische Volwassenheid (Mei–Augustus 2025)

De Claude 4-familie, gelanceerd in mei 2025, consolideerde winsten in tooling. Deze modellen waren native ontworpen voor interactie met de externe omgeving.

Claude Opus 4 en Sonnet 4 introduceerden geavanceerde API-mogelijkheden inclusief tools voor veilige code-uitvoering en native MCP-protocolconnectoren.

Claude Opus 4.1 (augustus 2025) focuste op software-engineering. Dit model behaalde 74,5% op SWE-bench Verified zonder extended thinking-functies, waarbij ruwe mogelijkheid om echte softwareonderhoudstickets op te lossen werd bewezen.

Claude Opus 4.5 (November 2025)

Het jaar eindigde met wat velen beschouwen als het meesterwerk van deze generatie: Claude Opus 4.5. Dit model duwt grenzen op meerdere fronten:

  • Oneindige Chats: Elimineert contextvensterfouten in lange gesprekken, waarbij projectgeschiedenis over maanden wordt behouden zonder geheugendegradatie
  • Effort Slider: Een “Laag, Medium, Hoog”-regeling voor enterprise kostenbeheer — lage inspanning voor e-mailsamenvattingen, hoge inspanning voor complexe architectuur
  • Absolute Prestatie: 82,0% op SWE-bench Verified in high-power modus, waarbij het de standaard voor autonome programmering wordt

Hoofdstuk 5: Model Context Protocol — Het Zenuwstelsel

Als de Claude-modellen de “hersenen” van het ecosysteem zijn, is het Model Context Protocol (MCP) het centrale zenuwstelsel. Geïntroduceerd eind 2024 en alomtegenwoordig in 2025, adresseert MCP het kittigste probleem in toegepaste AI: datafragmentatie.

Het Verbonden Model-probleem

Vóór MCP vereiste het verbinden van een LLM met externe data (SQL-database, GitHub-repo, Google Drive) het bouwen van aangepaste integratiepipelines voor elke tool. Elk enterprise herontdekte het wiel om hun AI interne documenten te laten lezen. Onderzoekers noemen dit het “geïsoleerde model”-probleem.

Technische Architectuur

MCP lost dit op door een open standaard voor te stellen — vergelijkbaar met USB-C voor AI. De architectuur vertrouwt op een strikte tripartiete relatie:

  • MCP Host: De applicatie waar de AI resideert — Claude Desktop, een IDE, of aangepaste agent-tool. De orchestrator
  • MCP Client: Geïntegreerd in de host, beheert communicatie en onderhoudt beveiligde verbinding
  • MCP Server: De revolutionaire component. Een lichtgewicht adapter die data blootstelt van een specifieke bron (lokale bestanden, Slack API, Postgres-database) in gestandaardiseerd formaat

Communicatie gebruikt JSON-RPC-protocol, getransporteerd via standaard input/output-streams (stdio) voor lokale tools of HTTP voor remote tools.

Deze ontkoppelde architectuur heeft diepgaande implicaties: een ontwikkelaar schrijft een “Google Calendar MCP Server” één keer. Deze server werkt dan direct met Claude, ChatGPT, of elke MCP-compatibele agent zonder code-wijziging.

Component Rol Voorbeeld
Host Orchestreert AI en tools Claude Desktop, IDE, Aangepaste Agent
Client Beheert verbindingen Geïntegreerd in host-applicatie
Server Blootstelt data/tools GitHub, Postgres, Slack-adapters

Adoptie en Impact

In maart 2026 heeft MCP-adoptie 100 miljoen maandelijkse downloads van servers en connectoren overschreden. Het protocol wordt native ondersteund door officiële SDK’s in Python, TypeScript, Java en C#, waarbij integratie in bestaande enterprise-infrastructuur wordt vergemakkelijkt.

De operationele impact is onmiddellijk: in plaats van context te kopiëren-plakken in chatvensters, ontdekt Claude dynamisch beschikbare tools op het systeem van de gebruiker en queryt ze op aanvraag, waarbij tokenverbruik wordt verminderd en responsrelevantie wordt vergroot.

Hoofdstuk 6: Van Chat naar Werk — Claude Code en Cowork

Als 2024 het jaar van gesprek met AI was, is 2025–2026 het jaar van werken ermee. Anthropic structureerde zijn productaanbod om chatbots voorbij te gaan en gespecialiseerde “digitale collega’s” te bieden.

Claude Code: De Autonome CLI-engineer

Aanvankelijk gelanceerd in onderzoeksfase en daarna gegeneraliseerd met de Claude 4-serie, is Claude Code een CLI-tool ontworpen voor ontwikkelaars. In tegenstelling tot editor-geïntegreerde code completion-assistenten (zoals vroeg GitHub Copilot), leeft Claude Code in de terminal. Het bezit agent-autonomie:

  • Navigatie en Exploratie: Kan bestandsbomen verkennen om onbekende projectarchitectuur te begrijpen
  • Levenscyclusbeheer: Kan tests uitvoeren, foutmeldingen analyseren, fixes voorstellen en Git-operaties beheren (commit-creatie, Pull Request-beheer)
  • Diepe Integratie: Integreert native met VS Code en JetBrains-suite, waarbij vloeiende samenwerking wordt mogelijk gemaakt waarbij de AI complexe wijzigingen voorstelt die de ontwikkelaar valideert

Claude Cowork: De Generalistische Office-agent

12 januari 2026 markeerde AI’s entree in generalistisch kantoorwerk met Cowork (aangeduid als “Taken” in de interface). Cowork breidt agentische logica uit buiten code naar administratief werk.

Beveiligde Architectuur: Om voor de hand liggende veiligheidsredenen draait Cowork in een geïsoleerde virtuele machine (VM) op de desktop van de gebruiker (aanvankelijk macOS). Dit zorgt ervoor dat de agent, terwijl het toegang heeft tot benodigde lokale bestanden, opereert in een sandbox die onbedoelde of kwaadwillige wijziging van het host-besturingssysteem voorkomt.

Multi-stap Mogelijkheden: Cowork excelleert in taken die logisch ketenen vereisen. Voorbeeld: “Analyseer deze map met 50 PDF-facturen, extraheer datums en bedragen naar een Excel-bestand, creëer een draaitabel per leverancier en stel een samenvattende e-mail op met de drie grootste uitgaven.”

Agent-coördinatie: Onder de motorkap kan Cowork sub-agenten instantiëren om werk te paralleliseren, waarbij uitvoeringstijd voor repetitieve taken drastisch wordt verminderd.

Mobile Ecosysteem

Parallel aan desktopproducten zorgde Anthropic voor Claude-ubiquiteit via native iOS en Android-applicaties, regelmatig geüpdatet om de nieuwste multimodale mogelijkheden te omvatten. Deze apps dienen als ingangspunten voor datacapture (foto’s, spraaknotities) verwerkt door Sonnet of Haiku-modellen in de cloud, waarbij naadloze continuïteit tussen desktop en mobile wordt gegarandeerd.

Hoofdstuk 7: Het Financiële en Strategische Fort

Anthropic’s technologische opkomst werd vergezeld door een eveneens verfijnde financiële en partnerschapsstrategie, ontworpen om onafhankelijkheid tegenover tech-giganten te waarborgen.

Exponentiële Waarderingstraject

De cijfers getuigen van absolute marktvertrouwen in Anthropic’s visie:

  • September 2023: Amazon investeert $4 miljard, gevolgd door Google met $2 miljard
  • Eind 2024–begin 2025: Een Serie F-financieringsronde van $13 miljard stuwt waardering naar $183 miljard. Anthropic genereerde al geannualiseerde inkomsten van meer dan $5 miljard — een van de snelste groeitrajecten in technologiegeschiedenis
  • Januari 2026: Financiële rapporten bevestigen dat Anthropic een nieuwe $10 miljard financieringsronde afrondt. Geleid door Singapore’s soevereine fonds (GIC) en Coatue, brengt deze ronde de enterprise-waardering naar $350 miljard
  • Maart 2026 Update: Na de Cowork-lancering heeft enterprise-adoptie versneld. Anthropic rapporteert nu 8 miljoen betaalde enterprise seats over Claude for Work-abonnementen, met ARR (Annual Recurring Revenue) die $8 miljard nadert. Het bedrijf behoudt zijn PBC-structuur terwijl het governance-mechanismen vestigt die veiligheidsonderzoekers vetorecht geven over modelreleases

Deze financiële kracht is cruciaal: het stelt Anthropic in staat de exorbitante kosten van trainen van next-generation modellen te financieren zonder afhankelijk te zijn van een enkele weldoener.

De Cloud-Agnostic Strategie

In tegenstelling tot OpenAI, waarvan het lot intiem verbonden is met Microsoft’s Azure-infrastructuur, koos Anthropic voor niet-uitlijning. Door massieve investeringen van Amazon (AWS) en Google (GCP) te accepteren zonder totale exclusiviteit te verlenen, bereikte Anthropic een geopolitieke meesterzet. Claude-modellen zijn native beschikbaar op Amazon Bedrock en Google Vertex AI.

Deze alomtegenwoordigheid is een belangrijk verkoopargument voor Fortune 500-bedrijven die “vendor lock-in” vrezen. Ze kunnen Claude gebruiken waar hun data ook resideert, of het nu bij Amazon of Google is, waarbij flexibiliteit wordt geboden die concurrerende modellen moeilijk kunnen evenaren.

Het Maart 2026 Landschap

Drie maanden in 2026 heeft Anthropic’s positie zich versterkt:

  • MCP is infrastructuur geworden: Grote SaaS-leveranciers (Salesforce, SAP, Workday) leveren nu native MCP-servers. Enterprise IT-afdelingen rapporteren 40% reductie in integratiekosten bij implementatie van AI-agenten
  • Cowork vroege resultaten: 500.000 organisaties ingeschreven voor de Cowork-bèta. Gemiddelde taakvoltooiingstijd voor administratieve workflows gereduceerd met 65% vergeleken met handmatige verwerking
  • Veiligheidsleiderschap: Terwijl concurrenten regelgevend toezicht ondergaan voor modelgedrag, is Anthropic’s constitutionele aanpak een sjabloon geworden. De EU AI Act-implementatierichtlijnen refereren expliciet naar Constitutional AI als “best practice” voor high-risk AI-systemen

De Toekomst van Digitale Agency

In vijf jaar transformeerde Anthropic een ethische bezorgdheid in een technologische supermacht. Door weigeren veiligheid op te offeren voor snelheid, bewees het bedrijf dat uitlijning (via Constitutional AI) de sine qua non was van prestatie op schaal.

Met Claude Opus 4.5-implementatie, MCP-standaardisatie en de komst van de Cowork-agent verkoopt Anthropic niet langer alleen conversationele AI. Het levert de werkinfrastructuur van de toekomst. Het bedrijf slaagde erin een ecosysteem te bouwen waar AI niet louter een browser-chatbot is maar een geïntegreerde actor die tools kan manipuleren, complexe contexten kan begrijpen en taken kan uitvoeren met gecontroleerde autonomie.

Naarmate 2026 vordert, is de vraag niet langer of Claude kan concurreren met GPT. De vraag is hoe de wereldeconomie zich zal aanpassen aan deze nieuwe digitale workforce — beveiligd door grondwet en verbonden door protocol — die Dario en Daniela Amodei geduldig hebben gebouwd.

De architectuur is compleet. De implementatie is begonnen.

Inhoudsopgave