Wat doet AI met je gegevens?
AI-modellen doen grofweg drie dingen:
-
Ze verwerken jouw input in het werkgeheugen van het gigantische AI-robotbrein.
Alles wat je invoert, wordt gebruikt om een zo goed mogelijk antwoord te geven. Dat gebeurt online en op basis van de training die het AI-model eerder heeft gehad. De servers van AI zijn AVG-proof. Alleen: deze werkgeheugenomgeving — waarin jouw opdracht samenkomt met de trainingsdata — is zó enorm dat het niet 100% afgeschermd kan worden.Dit is de reden waarom AI-gebruik op dit moment niet volledig AVG-proof is.
-
Daarna slaan ze de informatie op in jouw chatgeschiedenis, zodat jij het later terug kunt zien.
Op basis daarvan personaliseert de AI je interacties. Deze gegevens worden alleen opgeslagen in jouw persoonlijke account en zijn niet zichtbaar voor andere gebruikers. Ze worden ook niet direct gebruikt voor het trainen van het AI-model, tenzij je daarvoor toestemming hebt gegeven.
-
Als je het niet hebt uitgeschakeld in de instellingen, gebruikt AI jouw data om toekomstige systemen te trainen.
Daarbij worden je interacties geanonimiseerd en gevectoriseerd — dat betekent dat de specifieke inhoud wordt omgezet in abstracte patronen, waardoor je gegevens minder direct herkenbaar zijn. Wil je niet dat AI wat je zegt opneemt in zijn openbare robotbrein? Dan moet je dit expliciet uitschakelen. Dat kan momenteel alleen als je een betaald ChatGPT-account hebt.
Hoe Ai-modellen leren van data: het verschil tussen training en fine tuning.
AI-modellen leren eerst van openbare data tijdens een eenmalige training vóór de lancering. Daarna kunnen ze doorlopend slimmer worden via fine-tuning met gebruikersinput – en precies daar komt jouw data in beeld.
Waar traint AI zijn informatie op?
Des te meer informatie AI-modellen in zich opnemen des te slimmer ze worden. De intelligentie van AI-modellen komt voort uit patroonherkenning. Hierdoor kun je stellen dat hoe meer informatie AI in zich op neemt des te beter het zich kan verwoorden en antwoorden kan geven van hogere kwaliteit. Deze informatie haalt AI uit het internet. Het trekt het volledige internet leeg om te leren van de teksten en hun inhoud te ontcijferen. AI gebruikt als trainingsdata:
- Wetenschappelijke artikelen
- Blogs en websites
- Openbare boeken
- Forums
- Video’s
- Conversaties met AI (tenzij je dit hebt uitgezet).
OpenAI en andere AI producenten breken vaak regels omtrent trainingsdata
Niet alle informatie waar AI op is getraind is legaal. Zo zijn er veel zogenaamde schaduwpagina’s waar AI gebruik van maakt om zijn training af te ronden. Zo mag AI wettelijk niet zijn trainingsdata stoelen op die van professionele nieuwszenders of onderzoeksrapporten, maar wanneer een andere pagina plagiaat heeft gepleegd op deze bron informatie en AI bedrijven de schaduwpagina gebruiken als trainingsdata IPV de oorspronkelijk bron kunnen de bedrijven hier met moeite iets tegen doen. In een onderzoek van LG AI research zijn 2.852 datasets geanalyseerd en hiervan bleek slechts 19% van de data legaal gewonnen te zijn.
Wat weet AI over mij? en wat is AI fine tuning?
De kennis die AI over jouw heeft zal een mix zijn van trainingsdata – dit bestaat uit alles wat AI online over jou kan vinden – en fine tuning. Fine tuning is de informatie die AI heeft onthouden van jou uit eerdere chat gesprekken. Ben je benieuwd wat AI allemaal van jouw heeft onthouden uit je eerdere gesprekken? Klik op je profielnaam, ga naar instellingen – daar vind je het tablad personalisatie. Hier kan je AI’s geheugen beheren.
Let op: dit artikel is tot stand gekomen samen met AI.