Algoritmernes hemmeligheder og vejen til kunstig intelligens
Bevidsthed er, hvordan det føles at være sig selv,
Skriver forfatteren i bogens allersidste kapitel med den fascinerende overskrift: En hjerne, der tænker på sig selv. Vi er inde i vanskeligt farvand, for der findes ikke en almindeligt anerkendt videnskabelig definition af bevidsthed, og hermed er det morgendagens kunstige intelligens, der behandles i bogens sidste del ud af tre. Del 2 tager fat i kunstig intelligens i dag, og første del fortæller om, hvordan det hele begyndte med de tre store matematikere Kurt Gödel (1906-78), Alan Turing (1912-54) og John von Neumann (1903-57) - alle tre aktive i et par årtier midt i det 20. århundrede, og de gode historier om hver af de tre står i kø her i bogen for at forklare, hvad der ligger bag deres fortjente berømmelse. Selve begrebet artificial intelligence, AI, opstod såmænd under en sommer workshop på et amerikansk college i 1956.
I praksis blev den kunstige intelligens første gang for alvor udnyttet til skak, hvor computeren Deep Blue sejrede over den regerende verdensmester Garri Kasparov 10. februar 1996. Siden da er det gået hurtigt, for skak er jo et spørgsmål om tal og beregninger, men hvad med kunst? Jo, i 2022 lykkedes det en kunstner at smugle et billede skabt af kunstig intelligens ind i en konkurrence - og maskinen gik af med sejren, uden at nogen anede, hvad der foregik. Men, trøster Inga Strümke: selv de bedste chatbots er mekaniske papegøjer, der recirkulerer, hvad vi end har fodret dem med.
I midten af 1980’erne var der voksende begejstring for såkaldte ekspertsystemer, men her er problemerne til at få øje på, hvis ikke man har sat nogle begrænsninger ind. F.eks. anbefalede et sådant system en alt for høj dosis medicin i alt for mange dage til en patient med kolera. Heldigvis blev det opdaget og patienten reddet, men det var vist ikke maskinens, men et menneskes, fortjeneste. Den slags fejl er forhåbentlig nu fortid.
Hvordan underviser man så en maskine? Det gennemgår Strümke detaljeret med mange eksempler, og det kan bedst beskrives som den gamle leg Tampen brænder. Maskinen får stillet en lang række opgaver, og svarene tildeles points efter, hvor tæt dens svar kommer på det, som mennesket bag har markeret som rigtigt.
Men før maskinen kan beregne/besvare noget som helst, skal den jo fodres med data. Her viser det sig, at de data, der er indlæst, hyppigt ikke er fordelt statistisk korrekt for eksempel i forhold til køn, race eller alder - og forfatteren gennemgår, hvor svært det er at finde frem til ’den sande fordeling’. Læseren kan her lære en hel del om bias, altså forudindtagethed, slagside, som skyldes metodiske fejl eller ubevidste præferencer, og også om hvor let det er f.eks. bare sige ’at data har bias’, selvom det er indsamlingsprocessen bag data, som har bias. Så er der det såkaldte the long tail problem. Her handler det om hændelser, der er meget sjældne, og derfor kun er repræsenteret helt ude i enden af en graf, men som - hvis de faktisk indtræffer - er katastrofale. Det er utroligt svært at få alle data med, som computeren nogensinde (måske med tusinder af års mellemrum) kan tænkes at få brug for - vi er slet ikke endnu fremme ved kunstig intelligens - men på vej. Så er vi ovre i bogens anden del:
Kunstig intelligens i dag. Hvad med maskiner, der næsten forstår det, de kigger på (hvad vi så ellers mener med ’forstår’? Det er jo netop der, vi er nået til i dag, når vi kan åbne telefonen, som ’genkender’ os uden brug af kodeord. Vi er altså nået fra et syn i den virkelige verden til tal i computeren. Men igen: forstår maskinen det, den ser på? Hvad sker der, hvis en Tesla kører bag ved en lastbil med et stort maleri af en mark på bagsmækken? ’ Her har maskinlæring stadig langt igen’, skriver Inga Strümke, og vi er tilbage ved det menneskelige ansvar. Også her er der mange gode historier - for eksempel den om et program, der var fantastisk til at skelne mellem billeder af en ulv og billeder af en husky (en hunderace, der faktisk ligner ulve en del). En anden historie handler om, hvordan tilstrækkeligt mange data indsamlet typisk fra sociale medier opdagede symptomer på alvorlige sygdomme hos mennesker, der endnu ikke havde fået stillet en diagnose - en indviklet sag, for medens nogle måske på denne måde kan reddes fra sygdom, vil andre få deres privatliv krænket. Læg mærke til, at det handler om kombination af data, som hver især ikke fortæller noget. Meget naturligt følges her op med et kapitel om de velkendte GDPR- regler fra 2016 samt en kommende EU-regulering af kunstig intelligens. Der venter vist et enormt arbejde forude der.
Chatbots lærer hen ad vejen - for eksempel kan en virksomhed spare udgifter til et menneske, hvis chatbotten efterhånden får samlet spørgsmål sammen, lært svarene og efterhånden bliver bedre og bedre. Det er i hvert fald teorien. Desværre lærer den så også alle de ukvemsord, der serveres for den af utilfredse kunder. En anden vinkel her er, at en chatbot kan blive næsten menneskelig. Strümke refererer et uddrag af en samtale mellem en Google-ingeniør og en af deres nyudviklede kunstigt intelligente chatbots ved navn LaMDA, som i samtalen blandt meget andet citeres for ” …jeg er klar over min eksistens…”. Men hvad er egentlig bevidsthed? Forfatteren medgiver, at det er et vagt og navnlig rasende vanskeligt begreb, men hendes lange diskussion deraf er god at fordybe sig i.
I november 2022 udkom så ChatGPT (Generative, Pre-trained, Transformer) - hvad det vil sige, forklares omhyggeligt i bogen. Alle sprogmodeller fungerer ved at gætte på eller forudsige det næste ord i en sætning. Men der er forskelle fra den ene model til den anden, forklarer forfatteren. Da ChatGPT kom frem, vakte det bestyrtelse - hvad med skriftlige opgaver i skoler og på universiteter? Jamen, der kunne da også snydes tidligere? En af forskellene er her, at plagiatkontrol jo ikke virker, fordi denne bot jo i princippet bare gætter ord og skaber en helt splinterny tekst, der aldrig før har eksisteret. Hvordan afsløres det, at teksten ikke er skrevet af et menneske? Strümke giver her eksempler, som ’illustrerer, at juraen - i lighed med etikken - har en stor udfordring i mødet med kunstig intelligens.
Bogens tredje og sidste del er også den korteste, for den handler om kunstig intelligens i morgen. Og hvad kan man vide om den? Et ord, der går igen i kapitlet er ’kontekst’ - f.eks. hvordan lade ChatGPT hjælpe en forfatter over en akut skriveblokering, men ikke lade den skrive en hel stil for en skoleelev? Og der er voldsomme risici - og de kan ikke ignoreres - allermest isnende uhyggeligt formuleret af Elon Musk: ” Hvis AI har et mål, og menneskeheden tilfældigvis skulle stå i vejen, vil AI’en tilintetgøre menneskeheden.” Så må man bare håbe, at Asimovs robotlov gælder. Den lyder: ” En robot må ikke skade et menneske eller lade et menneske komme til skade uden at gøre noget. ” Asimov var science fiction-forfatter.
Inga Strümke har en ph.d.-grad i partikelfysik og forsker i kunstig intelligens ved NTNU (Norges tekniske naturvidenskabelige universitet), og hun har her skrevet en fagligt solid og engagerende bog om et utroligt vigtigt og superaktuelt emne. Sæt god tid af til at læse den - og til at komme ind i hendes tankegang, som hele tiden lader forklaringer, eksempler og anekdoter veksle mellem hinanden. Her er virkelig meget at lære.
Bogen er oversat fra norsk og rummer en mærkelig og efter denne anmelders mening alvorlig fejl: to ord, der bruges meget i bogen, er verbet ’prædikere’ og substantivet ’prædiktion’. Her er to eksempler på ordene i deres sammenhænge: ”Vi fortsætter med at justere på data, til modellen fortæller os, at den er helt sikker på sin prædiktion” og ”Modellen blev udviklet til at prædikere, hvor meget forskellige mennesker kommer til at koste sundhedsvæsenet”. Jeg gættede jo hurtigt betydningen af de to ord, men ingen af dem står i Ordnet, som omfatter både Den danske ordbog og Ordbog over det danske sprog. Retskrivningsordbogen har dog ‘prædiktion’ med betydningen ’forudsigelse’, men kender ikke ’prædikere’. Jeg mener, det skal nævnes, fordi det er to ord, som forekommer mange gange i bogen, hvor de er væsentlige for forståelsen. Jeg har fra særdeles pålidelig norsk kilde, at ordene er helt almindelige på norsk - men det er de altså ikke på dansk.
Bogen på 288 sider er hæftet i god kvalitet og ligger fint åben på opslag. Magnus Thielsen har stået for omslagets design - det rammer fint bogens tanker! Udgiveren er Politikens Forlag.
RADIO UPDATE - radio der giver mening Blandede interviews og korte nyheder Klik på nyheder og interviews og hør dem enkeltvis - Brug søgefeltet med et ord for at finde et bestemt interview eller emne.