Krijg nou wat: ChatGPT maakt gebruik van Rading Nul om te leren

Kunstmatige intelligentie – het is een wondere wereld. Ga maar na: om Nederlandse woorden en zinnen te leren maken en om dingen over Nederland te leren, gebruikt de chatbot ChatGPT lesmateriaal en tot dat lesmateriaal behoort . . . . . . Rading Nul!

Daar kwam ik achter dankzij  de jongste editie van opinieweekblad De Groene Amsterdammer. Daarin staat een artikel over hoe ChatGPT leert omgaan met het Nederlands en feiten in het Nederlandse taalgebied (Nederland en Vlaanderen). Het leidt, zo las ik, tot schendingen van auteursrecht en de privacywetgeving en tot het rondpompen van complottheorieën, (ander) nepnieuws en extreem-rechtse opvattingen.

Zo is voor het Nederlandse taalgebied Docplayer.nl de door ChatGPT meest gebruikte website om te leren. Van alle Nederlandse woorden, zinnen en gegevens die ChatGPT verzamelt, komt 3,6 procent van Docplayer.nl. Die website is bedacht door de Russische internetondernemer Vladimir Nesterenko.

Kwalijke reputatie

De website heeft een zeer kwalijke reputatie. In 2017 concludeerden de Autoriteit Persoonsgegevens, de politie en het Nationaal Cybersecurity Centrum dat Docplayer.nl de Nederlandse wetgeving overtreedt, aldus De Groene Amsterdammer. Om maar eens iets te noemen: Docplayer.nl gapt doodleuk materiaal van achter de betaalmuren van dagbladen.

De Groene bekeek de MC-4 dataset van Google waarvan Chat GPT gebruik maakt. Daaruit kwam onder meer naar voren dat de chatbot voor zijn Nederlandstalige sectie Docplayer.nl het meest gebruikt, dat dat weliswaar bedenkelijk is (wetsovertredingen), maar anderzijds wel verklaarbaar. Die website bevat ongeveer 1,5 miljard woorden en dus ook heel veel combinaties van woorden. Kunstmatige intelligentie kan daarvan dus aardig wat te leren.

Ter vergelijking: op de tiende plek in de door de Groene bekeken lijst van door ChatGPT gebruikte websites staat nieuwssite nu.nl. Die helpt ChatGPT aan 0,3 procent van zijn materiaal. Volgens de lijst bevat nu.nl zo’n 137,9 miljoen woorden.

Nieuwsgierig

Nieuwsgierig Aagje als ik soms ben, heb ik eens gekeken of Rading Nul (rading-0.nl) ook in de ChatGPT-leerlijst voorkomt. En wat denkt u? Jazeker! Niet op de honderdste plaats en zelfs niet op plek duizend, maar op plaats 30.460. Op het moment waarop De Groene zaken inventariseerde, was Rading Nul goed voor 0,0004 procent van het ChatGPT-lesmateriaal.

En de gemeentelijke website wijdemeren.nl? Die staat duizenden plekken lager dat Rading Nul op plaats 34.833 en is goed voor 0,0003 procent van het ChatGPT-lesmateriaal.

Grappig om te zien: kunstmatige intelligentie maakt van Rading Nul 33 procent meer gebruik dan van wijdemeren.nl – voor zover ChatGPT daarvoor althans maatgevend zou zijn.

Bescheidenheid

Een kleine proefneming noopt Rading Nul echter weer tot bescheidenheid. Zo vroeg ik ChatGPT: ‘Wat is wijdemeren.nl voor website?’ Daarop kwam een keurig antwoord, dat begon met: ,,wijdemeren.nl is de officiële website van de gemeente Wijdemeren in Nederland.’’ Ook werd uitgelegd wat voor soort informatie daar te vinden is.

Dan de vraag ‘Wat is rading-0 voor website?’ ChatGPT’s antwoord: ,,Het spijt me, maar ik kan geen informatie vinden over de website rading-0.nl.’’ Dat lijkt overigens minder te zeggen over Rading Nul dan over kunstmatige intelligentie, althans over ChatGPT. De chatbot zegt rading-0.nl niet te kennen maar betrekt er wel lesmateriaal. Om met het voormalige tv-programma Jiskefet te spreken: Raarrrr.

Burgemeester

Ter controle heb ik daarom ook Wijdemerens burgemeester even aan ChatGPT ‘gevoerd’. Vraag: Wie is de burgemeester van Wijdemeren? Trefzeker antwoord: Crys Larson. Heel goed.

Maar op de vraag ‘Wie is Crys Larson?’ stamelt ChatGPT: ,,Het spijt me, maar ik kan geen informatie vinden over Crys Larson.’’ Burgemeester, trek het u niet aan, want u bevindt zich in het goede gezelschap van rading-0.nl – even aannemende dat u dat goed gezelschap vindt. 😉

Eén gedachte op “Krijg nou wat: ChatGPT maakt gebruik van Rading Nul om te leren”

  1. Ik heb ChatGPT een paar keer gebruikt, o.a. om wat achtergrondinformatie te krijgen voor een privé-verslag dat ik schreef over een excursie die ik onlangs maakte. De conclusie: soms komt er wat bruikbaars uit, maar soms baarlijke onzin. Ondanks de hype in allerlei media ben ik dus bepaald niet onder de indruk.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze site gebruikt Akismet om spam te verminderen. Meer informatie over hoe uw reactiegegevens worden verwerkt.