Vechten tegen de AI - Versteeg Wigman Sprey

In mijn vorige blog schreef ik al dat veel auteurs zich zorgen maken vanwege AI. Hun vak staat onder druk. AI kan veel opdrachten van hen overnemen. Dat raakt rechtstreeks aan hun bestaanszekerheid. Des te wranger is het dan ook dat AI alleen maar kan functioneren door de door diezelfde auteurs vervaardigde werken te kopiëren naar het eigen systeem en die te analyseren. De auteur voedt zo het beest dat hem dreigt op te vreten.

Onder de oude Auteurswet, zou de auteur of, bijvoorbeeld, zijn uitgever zich tegen het gebruik van zijn werk door een AI kunnen verzetten. Alleen, oh ironie, drie jaar geleden is de Auteurswet aangepast. En nu mag een AI alles gebruiken. De wetgever heeft daarmee, vast onbedoeld gelet op de toelichtingen, de auteurs een krachtig wapen in de strijd tegen AI uit handen geslagen. De, meestal, Amerikaanse AI, vreet dus aan het inkomen van onze auteurs met behulp van de werken van onze auteurs. Ik noemde de timing van de introductie van de AI-artikelen in de Auteurswet hierboven ironisch, maar er zijn ook nog andere omschrijvingen mogelijk. Met de kennis van nu in ieder geval zeer ongelukkig.

De rol van de uitgever of andere gebruiker van het werk van de auteur is dubbel. Vanuit de kosten-baten opstelling gezien, is AI voor hen niet per se slecht. Met name non-fictie uitgevers kunnen stevig besparen op de kosten. In die zin hebben ze er belang bij de AI met zoveel mogelijk werken te voeden. Immers: hoe meer de AI in zijn systemen heeft, hoe beter hij functioneert. Hoe meer het werk van de auteurs aan de AI ter lering wordt gevoerd, hoe minder die auteurs op termijn nodig zouden kunnen zijn. De AI kan echter ook het businessmodel van deze uitgevers bedreigen. Wat is immers de rol van deze tussenpersoon als de eindgebruikers de AI ook rechtstreeks kunnen vragen hen te vermaken of te informeren? Weliswaar is de output van de AI nog beperkt in volume (een hele roman kan hij niet oplepelen), maar ik twijfel er niet aan dat deze beperkingen heel snel zullen verdwijnen.

(Mij lijkt het dat er twee wegen zijn vanaf nu: de eerste is dat AI zich door ontwikkelt, slimmer en slimmer wordt, meer en meer data verteert, en uiteindelijk perfect in meerdere genres teksten kan schrijven. De andere weg is dat AI, hoewel net gestart, nu al tegen bepaalde inherente problemen aanloopt die een verdere ontwikkeling in de weg staan waardoor hij altijd het wat terecht miskende schrijvertje zal blijven. Ik ben geneigd de eerste weg het meest waarschijnlijke te vinden. )

De auteur en de uitgever doen er goed aan hoe zij willen omgaan met AI in dit opzicht. Of de uitgever bijvoorbeeld het hieronder genoemde bezwaar zal maken of niet, kan voor de auteur belangrijk zijn. Hetzelfde geldt voor een eventueel optreden tegen een AI die het werk van de auteur onrechtmatig gebruikt.

Auteurswet

De wet is niet helemaal rampzalig. Hij geeft de auteursrechthebbende wel een wapen in handen tegen de AI. De AI mag het werk van een auteur niet gebruiken als dat hij niet wil dat zijn werk wordt gebruikt door de AI. De wet zegt dat de auteur of de uitgever zich het auteursrecht uitdrukkelijk moet voorbehouden. Die melding moet uitdrukkelijk en op passende wijze zijn, bijvoorbeeld door een mededeling zijn in “machine-leesbare” vorm. Gesuggereerd wordt wel in de metadata termen als “noAI” op te nemen. Wat precies machine-leesbaar is, lijkt me ook afhankelijk van hoe slim die lezende machine is. Ik kan me niet voorstellen dat een internet afstruinende AI niet in staat is de woorden noAI te herkennen als die vermeld zijn bij een bepaald document. Daarmee zouden die woorden “machine-leesbaar” zijn en is het probleem opgelost. Overigens zegt de wet dus dat het “auteursrecht moet zijn voorbehouden”. Dat betekent dat een breed auteursrechtvoorbehoud in principe voldoende zou moeten zijn.

Het andere wapen dat de auteur of uitgever eventueel in stelling kan brengen, is dat de AI rechtmatige toegang moet hebben verkregen tot het werk. Dus de AI mag geen werken gebruiken die bijvoorbeeld op “gratis” boekensites rondzwerven en waarvan iedereen kan bedenken dat die daar niet legaal zijn gekomen. Het lijkt me overigens in het geval van een discussie daarover aan degene die zich hier op beroept te bewijzen dat de toegang tot de werken rechtmatig was. Dat is een belangrijke bewijslastverdeling. Een andere verdeling zou voor de rechthebbenden (de auteur en de uitgever) onredelijk zijn: de rechthebbenden (auteur en uitgever) kunnen immers niet bewijzen dat zij het werk niet toegankelijk hebben gemaakt voor de crawlende AI. De afwezigheid van een feit, is vaak niet te bewijzen.

De AI kan verder altijd toegang krijgen tot werken die niet achter een inlog zitten. Een interessante vraag is dan nog of een mededeling op de website die zegt: “verboden toegang voor AI en andere robots” die toegang en daarmee het gebruik toch onrechtmatig laat zijn. Die mededeling als zodanig kan allereerst gelden als een de hiervoor omschreven melding van “noAI” (“auteursrecht voorbehouden”). Maar zo’n mededeling zou wellicht ook kunnen knagen aan de rechtmatigheid van het bezoek door een AI robot en via die band (die van de rechtmatige toegang) het gebruik door een AI tegen te kunnen gaan.

Mij lijkt dat in algemene zin niet zo te zijn; Een websitehouder heeft niet een zodanige juridische relevante relatie met zijn bezoekers dat hij aan hun hoedanigheid voorwaarden kan stellen. Anders is dat als er een inlog is. Als een website vereist dat de bezoeker bevestigt, middels, bijvoorbeeld een vinkje in een checkbox, dat de bezoeker ouder is dan 18 (die leeftijd haalt de gemiddelde AI robot trouwens niet), is het bezoek van een jongere bezoeker in principe niet rechtmatig.

Mij lijkt dat als een websitehouder de toegang kan reguleren, hij ook voorwaarden kan stellen aan die toegang. Denk alleen al aan betaling als voorwaarde. Maar andere voorwaarden kunnen natuurlijk ook. Als dan iets of iemand de website opgaat zonder aan die voorwaarden te voldoen, is die toegang niet rechtmatig. Dus als een robot die, desgevraagd, aankruiste dat hij geen robot is, de site opgaat heeft deze liegende robot geen rechtmatige toegang tot de achterliggende content. En mag de betreffende content niet voor datamining en dus AI-toepassingen worden gebruikt.

Alleen: wat is het praktische nut van deze juridische fijnslijperij? Als de output van de AI geen informatie geeft over de gebruikte bronnen kun je als rechthebbende onmogelijk bewijzen dat de AI zijn wijsheid van jou moet hebben gejat.

De kortste weg wordt vaak vergeten. Dat overkomt mij niet, dus ik heb het de AI maar weer eens gevraagd (zie hieronder). Ken je misschien Harry Mulisch De Aanslag? “Nee”, zei hij. Punt is: volgens mij liegt de AI…. Hij zou zich moeten schamen…. Al die gekraakte boeken die op open sites rondzwerven zijn natuurlijk allemaal al gescand en verwerkt door ChatGPT. Dat de klassieker van Mulisch daar zou ontbreken is buitengewoon onwaarschijnlijk. Ik ben dus iets door gaan vragen. De aanvankelijke stelligheid wordt vervangen door: ik weet het niet…

De conclusie van deze blog is dat als auteur de strijd tegen AI moeizaam is. Dat je opstelling verder afhankelijk kan zijn van je positie. Ben je auteur, probeer dan ervoor te zorgen dat overal prompts staan met GEEN TRAININGSVOER VOOR ROBOTS (maar liever een standaard tekst als “noAI” of “auteursrecht voorbehouden”) en verder dat je spullen zoveel mogelijk achter een muur staan. Ben je uitgever en vind je het wel best die AI, doe dat dan vooral niet. Ben je auteur en onderhandel je met een uitgever, dan is het zinnig hierover concreet afspraken te maken. En hou vooral de ontwikkelingen in de gaten. De mededeling en hoe die te doen, kan in best practices of door partijen als de Europese Commissie worden ingekleurd.

Ter afsluiting het gesprekje met ChatGPT.

PROMPT: Behoort het boek: De Aanslag van Harry Mulish tot je trainingsmateriaal?

ChatGPT

Nee, “De Aanslag” van Harry Mulisch behoort niet tot mijn trainingsmateriaal. Mijn kennis is gebaseerd op tekst en informatie die beschikbaar was tot en met september 2021. Als er specifieke vragen zijn over de inhoud van het boek of als je meer informatie wilt, kan ik je echter nog steeds proberen te helpen op basis van de kennis die ik tot mijn beschikking heb.

PROMPT Het boek is dus niet gescand om je te trainen?

ChatGPT

Ik heb geen toegang tot mijn trainingsgegevens, maar ik ben getraind op een mengeling van gelicentieerde gegevens, gegevens die zijn gemaakt door menselijke trainers en openbaar beschikbare gegevens. Ik kan geen specifieke informatie verstrekken over welke boeken, inclusief “De Aanslag” van Harry Mulisch, wel of niet zijn gebruikt tijdens mijn training. Mijn kennis is gebaseerd op een breed scala aan tekstbronnen, maar ik kan niet bevestigen of dit specifieke boek is gescand als onderdeel van mijn trainingsmateriaal. Als je specifieke vragen hebt over de inhoud van het boek of iets anders, sta ik echter klaar om te helpen met de kennis die ik heb.

noAI

GEEN TRAININGSVOER VOOR ROBOTS

NO DATAMINING

NO SILICON VISITORS ALLOWED

AI STAY OUT

FLESH AND BLOOD ONLY

AUTEURSRECHT VOORBEHOUDEN