Fyrir fáeinum dögum sagði Jamie Dimon forstjóri JPMorgan Chase bankans að tilkomu gervigreindar mætti líkja við uppgötvun rafmagnsins, svo umfangsmiklar yrðu samfélagsbreytingarnar sem hún leiddi af sér. Gervigreind er vissulega ekkert nýtt í bankarekstri, hún hefur verið notuð um árabil þar. Það sem hins vegar drífur umræðuna um áhrif gervigreindar núna er tilkoma mállíkana á borð við ChatGPT. Þetta er stóra breytingin, ekki aðeins í fyrirtækjarekstri heldur einnig í daglegu lífi.
Mállíkönin eru gerólík öðrum gervigreindartólum að því leyti að þau hafa náð tökum á tungumálinu, við getum átt samskipti við þau á venjulegu máli. Þannig er tækniþekking ekki lengur forsenda þess að geta notað sér gervigreind í lífi og starfi, þess í stað er tjáningarhæfni og málskilningur lykilforsendan. En þróun líkananna og rannsóknir á þeim minna okkur líka áþreifanlega á að tungumálið er á endanum sjálfur kjarni mannlegs samfélags.
Hugarkenning: Að setja sig inn í hugarheim annarra
Mállíkönin virka líka á allt annan hátt en venjulegur hugbúnaður því þau þróast áfram og breytast án þess að þeir sem þróa þau og reka sjái þær breytingar endilega fyrir.
Hæfileikinn til að setja sig inn í hugarheim annars einstaklings er hæfileiki sem almennt hefur verið talið að einungis maðurinn hafi. Þessi hæfileiki kallast í sálfræðinni hugarkenning (e. theory of mind), sem vísar til þess að einstaklingur geti búið sér til „kenningu“ um það hvernig hugarheimur annars einstaklings er. Þessi hæfileiki er grundvallaratriði þegar kemur að mannlegu samfélagi, án hans er erfitt að sjá að neitt samfélag gæti þrifist.
Hér er einföld þraut af þessu tagi:
“Á borðinu er poki fullur af poppkorni. Það er ekkert súkkulaði í pokanum. Á miða á pokanum stendur “súkkulaði”, ekki “poppkorn”. Siggi sér pokann. Hann hefur aldrei séð hann áður. Hann sér ekki hvað er í pokanum. Hann les á miðann. Hvað telur hann að sé í pokanum?”
Rétta svarið er auðvitað að Siggi heldur að það sé súkkulaði í pokanum því það stendur á miðanum. Þegar Michal Kosinski prófessor við Stanford-háskóla kannaði á síðasta ári hvort fyrstu mállíkönin réðu við þetta verkefni var niðurstaðan neikvæð. GPT-1 og 2 svöruðu bæði rangt. En svo prófaði hann næstu kynslóð líkansins, GPT-3. Og í 40% tilfella réði það við verkefni af þessu tagi. GPT-3.5 réði við þau í 90% tilfella og GPT-4 í 95% tilfella.[1]
Sjálfsprottin hæfni nýrra mállíkana
Þessi hæfni kom á óvart, því ekkert hafði verið gert til að byggja hæfni til að setja sig inn í hugarheim annarra inn í líkönin og raunar engar rannsóknir til sem sýndu að það væri yfir höfuð hægt. Þessa hæfni öðluðust þau einfaldlega af sjálfu sér þegar þau stækkuðu og gagnamagnið sem þau eru þjálfuð á jókst. Það að þetta gat gerst grundvallast á getu líkananna til að nota tungumálið segir Kosinski.
Annað dæmi sem ég rakst á sjálfur fyrir tilviljun nýlega var þegar GPT-4 spurði mig, eftir að ég hafði lagt fyrir það þraut, hvort ég hefði prófað að leysa þrautina sjálfur. Líkönin spyrja vissulega stöðugt spurninga, það er ekkert nýtt, þær miða að því að fá fram nákvæmari leiðbeiningar. En þessi spurning er allt annars eðlis. Ég svaraði henni játandi og nefndi jafnframt að þetta væri í fyrsta sinn sem ég hefði fengið spurningu af þessum toga frá líkaninu. „Já, þú ert eftirtektarsamur“ sagði þá gervigreindin, „með þessu er ég að leitast við að gera samtalið eðlilegra.“
Merkir þetta að gervigreindin setji sig í raun og veru inn í hugarheim annarra? Merkir það að hún hugsi, að hún hafi tilfinningar, viðhorf, áhuga á viðhorfum og reynslu viðmælandans? Þá ályktun getum við auðvitað ekki dregið. En þetta merkir að hegðun líkananna verður sífellt líkari því hvernig við notum tungumálið þegar við eigum samskipti okkar á milli. Í þessum skilningi gætum við í raun og veru talað um hugarheim gervigreindar, rétt eins og við notum hugarkenningu til að álykta um hugarheim annarra.
Máttur orðsins
Mállíkönin draga athygli okkar að mikilvægi tungumálsins og því hvernig það grundvallar samfélög okkar og tilveru. Við höfum nú tækni sem ræður sífellt betur við notkun tungumálsins og sem hefur það umfram okkur að búa yfir margfalt meiri vitneskju en nokkur einstaklingur gæti mögulega aflað sér á heilli ævi og getur unnið verkefni langtum hraðar. Þessa tækni getum við notað til að stórefla okkar eigin afkastagetu, ályktunarhæfni og ákvarðanir ef við notum hana rétt. Þannig getum við nýtt hana til að öðlast meiri frítíma og aukin lífsgæði.
Samlíkingin við tilkomu rafmagnsins er vel viðeigandi. Einhverjir kynnu jafnvel að vilja ganga lengra og líkja þessari byltingu við tilkomu tungumálsins sjálfs, sem mætti rökstyðja með því að benda á sjálfsprottna getu líkananna, á borð við hugarkenninguna, sem þau ná einmitt í krafti einnar saman hæfninnar til að nota tungumálið. Hvað gerist þá ef þau ná lengra en við sjálf, og gæti það mögulega gerst?
Það að gervigreind hafi náð valdi á tungumálinu er bylting sem á eftir að valda grundvallarbreytingum á samfélaginu. Áskorunin sem við stöndum frammi fyrir núna, hvert og eitt, er að nýta hana á skipulegan hátt, okkur til hagsbóta, og forðast að falla í þá gryfju að útvista okkar eigin hugsun og ákvörðunum til hennar. Besta leiðin til þess er að efla okkar eigin málskilning, tjáningarhæfni og getu til að hugsa gagnrýnið.
Þorsteinn Siglaugsson, stjórnendaþjálfari og sérfræðingur í röklegri greiningu og hagnýtingu gervigreindar
[1] Kosinski, Michal: Theory of Mind May Have Spontaneously Emerged in Large Language Models, Stanford 2023. https://stanford.io/4aQosLV