AI en Data - Waarom de datalaag alles bepaalt
Deze blog is nog in concept-fase en wordt mogelijk nog aangepast voor publicatie.
AI is niet beter dan de data waarop het draait. Een slimme datalaag is geen nice-to-have, maar de absolute basis voor verantwoorde AI in de overheid. En die datalaag moet je NU goed inrichten - niet pas als je AI wilt toevoegen.
AI is Geen Oplossing voor Slechte Dataβ
Laten we beginnen met een harde waarheid: AI verzint niets nieuws. Het extrapoleert, het zoekt patronen, het voorspelt - maar het creΓ«ert geen feiten uit het niets.
Wat gebeurt er met slechte data?β
Inconsistenties worden versterkt
- Als je data tegenstrijdigheden bevat, leert AI die patronen
- Resultaat: onbetrouwbare voorspellingen
Bias komt uit data, niet uit "AI"
- AI heeft geen eigen vooroordelen
- Het spiegelt de vooroordelen in de trainingsdata
- Garbage in, garbage out
Extrapolatie van fouten
- Een fout in brondata verspreidt zich door AI-toepassingen
- EΓ©n verkeerde aanname β vele verkeerde conclusies
Argument: AI versterkt dataproblemen, het lost ze niet op.
De Common Ground Datalaagβ
Common Ground is niet voor niets begonnen met het op orde brengen van de datalaag. De architectuurprincipes zijn:
1. Registraties als Bronβ
Single source of truth
- Elk gegeven heeft één autoritatieve bron
- Geen duplicatie van data
- Geen tegenstrijdige versies
Bronregistraties
- BRP voor persoonsgegevens
- BAG voor adressen
- Specifieke registers voor specifieke domeinen
2. Scheiding van Data en Applicatiesβ
Data in bronnen
- Applicaties hebben geen eigen data-opslag
- Data blijft in gecontroleerde registers
- API's voor toegang
Voordelen:
- Data is herbruikbaar
- Consistentie gegarandeerd
- EΓ©n plek om kwaliteit te borgen
3. Standaardisatie en Hergebruikβ
Open standaarden
- Afspraken over datamodellen
- Gestandaardiseerde API's
- Eenduidige definities
Common Ground componenten
- Herbruikbare bouwblokken
- Gedeelde definities
- Gezamenlijke ontwikkeling
Waarom AI Andere Eisen Stelt aan Dataβ
Traditionele applicaties kunnen vaak prima werken met "redelijk goede" data. AI vraagt om meer:
1. Context is Cruciaalβ
AI moet begrijpen in welke context data gebruikt mag worden:
- Wat betekent dit veld?
- Hoe actueel is deze informatie?
- Welke privacy-restricties zijn er?
- Hoe betrouwbaar is de bron?
2. Relaties Tussen Data en Documentenβ
AI profiteert enorm van relaties:
- Koppeling tussen gestructureerde data en documenten
- Verbanden tussen verschillende registers
- Historische context en tijdlijnen
Voorbeeld: Een AI die helpt met subsidieaanvragen moet weten:
- Wie de aanvrager is (BRP)
- Waar het bedrijf gevestigd is (BAG + Handelsregister)
- Welke eerdere aanvragen er waren (Zaaksysteem)
- Welke regels van toepassing zijn (Regelingenregister)
3. Metadata, Herkomst en Actualiteitβ
Voor verantwoorde AI is metadata essentieel:
- Wanneer is deze data aangemaakt/gewijzigd?
- Door wie is het ingevoerd?
- Waarvoor mag het gebruikt worden?
- Hoe lang is het geldig?
Argument: AI vraagt om betekenisvolle data, niet alleen opslag.
AI Meenemen in Nieuwe Registersβ
Hier komt de cruciale boodschap: ontwerp registers nu al met AI in gedachten.
Niet: AI als Laagje Achterafβ
β Register bouwen zoals altijd
β Data opslaan in eigen formaat
β Later proberen AI toe te voegen
β Tegen problemen aanlopen
Wel: AI-Proof van Grond Afβ
β
Denk na over hergebruik
β
Documenteer betekenis van velden
β
Bouw in metadata en herkomst
β
Maak data geschikt voor analyse Γ©n uitvoering
β
Leg relaties expliciet vast
Praktisch Voorbeeld: Een Subsidieregisterβ
Traditioneel ontwerp:
Subsidie {
id: 12345
naam: "Subsidie duurzaam bedrijf"
bedrag: 50000
status: "Toegekend"
}
AI-proof ontwerp:
Subsidie {
id: 12345
naam: "Subsidie duurzaam bedrijf"
beschrijving: "Volledige tekst van regeling..."
voorwaarden: ["zzp", "duurzaamheid", "max-omzet-100k"]
bedrag: {
waarde: 50000,
valuta: "EUR",
type: "eenmalig"
}
status: {
huidige: "Toegekend",
datum: "2025-01-10",
door: "ambtenaar@gemeente.nl",
reden: "Voldoet aan criteria"
}
relaties: {
aanvrager: "bsn:123456789",
locatie: "bag:id",
regelgeving: "regeling:id",
besluiten: ["zaak:id"]
}
metadata: {
geldig_van: "2025-01-01",
geldig_tot: "2025-12-31",
herkomst: "Gemeenteraadsbesluit 2024-12",
privacy_niveau: "vertrouwelijk"
}
}
Waarom is dit beter voor AI?
- Context is expliciet
- Relaties zijn traceerbaar
- Herkomst is bekend
- Machine-leesbare voorwaarden
- Rijke metadata
De Strategische Keuzeβ
Verkeerd Ontwerpen = Jaren Achterstandβ
Als je nu registers bouwt zonder AI in gedachten:
- Kosten: Later compleet herbouwen
- Tijd: Jaren vertraging in AI-adoptie
- Kwaliteit: Suboptimale AI-toepassingen
- Risico: Vendor lock-in bij AI-oplossingen
Goed Ontwerpen = Toekomstige Innovatieβ
Als je nu AI-proof bouwt:
- Toekomst: Makkelijk AI toevoegen
- Hergebruik: Data werkt voor mens Γ©n machine
- Kwaliteit: Betere AI door betere data
- Flexibiliteit: Vrijheid in AI-keuzes
Argument: Wie nu verkeerd ontwerpt, beperkt AI voor jaren. Wie nu goed ontwerpt, maakt toekomstige innovatie mogelijk.
OpenRegister: AI-Proof Data-opslagβ
Bij Conduction ontwikkelen we OpenRegister - een open source data-oplossing voor Nextcloud waar je:
- Documenten kunt opslaan
- Gestructureerde data kunt beheren
- Documenten en data aan elkaar kunt relateren
- Het geheel kunt vectoriseren voor AI
Dit is een voorbeeld van hoe je data vanaf het begin AI-ready kunt inrichten.
Kritische Vraagβ
Als we onze datalaag niet van meet af aan AI-proof maken, bouwen we dan niet aan een digitaal fundament dat niet toekomstbestendig is?
Moeten we nu niet wat meer investeren om straks geen dure inhaalslag te hoeven maken?
Het antwoord is duidelijk: ja. Investeren in een goede datalaag nu bespaart tien keer zoveel later.
Conclusieβ
AI begint niet bij modellen, maar bij datakeuzes.
De meest geavanceerde AI ter wereld is nutteloos op slechte data. De eenvoudigste AI kan waardevol zijn met goede data.
Common Ground biedt de architectuur. Open standaarden bieden de interoperabiliteit. Registers die vanaf het begin AI-proof worden ontworpen bieden de basis.
De boodschap aan iedereen die nu registers of data-oplossingen bouwt: denk nu al aan AI. Niet als optie, maar als ontwerpprincipe.
Want de datalaag die je vandaag bouwt, bepaalt de AI-mogelijkheden van morgen.
Volgende blog: AI en Techniek - Veilige integratie met MCP
Gerelateerd: Common Ground | OpenRegister
