Þér að segja – Einar Kárason skrifar
Við megum aldrei gleyma því hversu mikil verðmæti eru í því falin að við skulum enn, meira en þúsund árum eftir að forfeður okkar og formæður settust fyrst að á landinu, tala að mestu leyti sama tungumálið. Sem þýðir að við höfum beinan og lifandi aðgang að allri menningarsögu þjóðarinnar, við skiljum og njótum þess sem skrifað hefur verið og ort á öllum tímum í okkar sögu. Í þessari staðreynd felast okkar fjársjóðir, þarna er okkar gullforði. Hér eru ekki hallir eða fornar kirkjur með frægum steindum gluggum, gylltum turnum og líkneskjum, hér eru ekki málverk renesanstímans, ekki fornar borgir með bogasölum og steinlögðum götum – en allt sem samsvarar þessu er í bókunum okkar og textum sem við lesum og njótum eins og þar séu hugsanir okkar samtímafólks.
Menn eiga ekki að vera með sífelldar hrakspár, en verða hins vegar að minnast þess að þessi staða getur breyst á skömmum tíma; í okkar nágrannalöndum var einnig töluð þessi sama forna tunga, en það breyttist tiltölulega snöggt á síðmiðöldum fyrir áhrif voldugra þjóða eins og hinnar þýsku. Á sama hátt var íslenskan á hröðu undanhaldi fyrir tveimur til þremur öldum, þá voru málsskjöl og ýmsar frásagnir færðar til bókar á tungu sem líktist mun meira dönsku, og sama gilti um talmál í helstu kaupstöðum. Hugsa sér hvers við hefðum farið á mis ef þetta hefði gengið alla leið, og að mál okkar hefði orðið einhver dönskuafbökun?
En því leitar þetta á mig nú að margt bendir til þess að tunga okkar sé enn á ný á þannig krossgötum. Það gæti gerst nokkuð hratt að íslenskan léti undan síga sem opinbert samskiptamál, og úr því gæti þróunin orðið illviðráðanleg; við vitum til dæmis að það þýðir lítið að ætla að panta sér kaffi eða öl á íslensku á helstu veitingastöðum, og sama gildir um þá staði þar sem túrisminn er mestur, gististöðvar, samgöngumiðstöðvar, og þar eftir götunum.
En nú telja þeir sem kynnt hafa sér málin að upp séu að renna glænýir tímar í tækniþróun, og það er í tengslum við tölvur og tölvustýrð tæki sem fylgja mæltum skipunum, skilja það sem sagt er við þau. Í staðinn fyrir alls konar handstýrða virkni þá muni þessum tækjum innan skamms verða stýrt með orðum; þar er átt við öll helstu heimilistæki; menn munu ekki lengur fara með höndina á slökkvara heldur segja „verði ljós!“ – svipað muni gilda um bílana. Og svo er einnig líklegt að þeir sem skrifa texta, hvort sem það eru stutt skilaboð í gegnum síma eða lengri texta, muni ekki lengur lemja á lyklaborð heldur einfaldlega mæla það fram sem tækin og tölvurnar eiga að birta. Og að þá muni þau ein tungumál gilda sem viðkomandi tæki skilja; verði það til dæmis svo eftir, segjum, tuttugu ár að öll samskipti okkar við tæki og tölvur þurfi að fara fram á ensku, einfaldlega vegna þess að þau skilja ekki íslensku, þá er auðvitað komin upp þannig staða fyrir okkar móðurmál sem við unnendur þess getum ekki hugsað til.
Fræðimenn eins og málfræðingar skilja þessa hættu. Ég ætla að leyfa mér að vitna í grein úr Skírni eftir Eirík Rögnvaldsson prófessor:
„Á undanförnum árum hafa komið fram ýmsar skýrslur um nauðsyn þess að styrkja íslenskuna í stafrænum heimi og gera hana gjaldgenga í samskiptum okkar við tölvur og tölvustýrð tæki. Nú er þörf á aðgerðum.
Þetta merkir í fyrsta lagi að viðmót algengs hugbúnaðar (valmyndir, hjálpartextar o.s.frv.) þarf að vera íslenskt; í öðru lagi að til þarf að vera ýmiss konar hugbúnaður sem liðsinnir og leiðbeinir notendum við notkun íslensks máls (leiðréttingarforrit, þýðingarforrit, hjálparforrit fyrir fatlaða); og í þriðja lagi að unnt á að vera að nota íslensku sem samskiptamál við ýmiss konar tölvu- og tæknibúnað (upplýsingakerfi, þjónustuver, tölvustýrð tæki af ýmsu tagi).“
Hann segir svo frá opinberri málstefnu meðal annars um íslenskun notendahugbúnaðar fyrir skólakerfið og opinberar stofnanir, uppbyggingu, eflingu og opnun mállegra gagnasafna, gerð þýðingarforrita og leiðréttingarforrita, endurbótum á talgreini og talgervli, o.fl. En þótt málstefnan væri samþykkt einróma á Alþingi 12. mars 2009 fylgdu engar tillögur um að ráðist yrði í þessar aðgerðir, hvað þá að fé væri veitt til þeirra.
„Í ársbyrjun 2010 skipaði mennta- og menningarmálaráðherra þó nefnd „til að fylgja eftir stefnu um notendaviðmót á íslensku í skólum og […] gera áætlun um aðrar aðgerðir sem tilgreindar eru í málstefnunni um íslensku í tölvuheiminum“. En um það leyti sem nefndin skilaði af sér var gefin út ítarleg skýrsla undir heitinu Íslensk tunga á stafrænni öld / The Icelandic Language in the Digital Age. Þetta var afrakstur viðamikils evrópsks verkefnis, META-NET, sem stóð yfir árin 2011–2013 og tók til 30 evrópumála.
Íslenska er ekki í bráðri hættu, þrátt fyrir yfirburði enskunnar í máltækni og tölvumálvísindum. Á hinn bóginn gæti staðan gerbreyst á svipstundu þegar ný kynslóð tækninnar fer fyrir alvöru að ráða við mannlegt mál á skilvirkan hátt. […] Tungumál sem jafnvel mjög fáir tala geta lifað af, verði fullnægjandi máltæknibúnaður tiltækur. Án slíks búnaðar munu jafnvel stórþjóðatungumál verða í mikilli hættu. Eigi íslenska að vera lífvænleg þjóðtunga í þróuðum heimi verður hún að geta staðið undir kröfum upplýsingatækninnar. Fjárfesting í máltækni verður því að vera grunnþáttur í framkvæmd íslenskrar málstefnu.
Alþingi ályktar að fela mennta- og menningarmálaráðherra að skipa nefnd sérfræðinga í málvísindum og upplýsingatækni sem geri áætlun um aðgerðir er miði að því að gera íslensku gjaldgenga í stafrænni upplýsingatækni og stuðla að notkun hennar á þeim vettvangi:
að fjárfest verði í íslenskri máltækni með sérstakri langtímaáætlun til 10 ára sem styrki bæði doktorsnema og einstök tækniþróunar- og innviðaverkefni og fylgi þannig fordæmi nokkurra Evrópuþjóða sem við berum okkur gjarnan saman við. Nefndin áætlar að það þurfi um einn milljarð króna til að byggja nauðsynlegan grunn þannig að í lok áætlunarinnar verði íslenskan komin í flokk nágrannatungumála þegar litið er til stuðnings við máltækni. Þetta er vissulega mikið fé, en nefndin telur að á þessu sviði eigi þjóðin ekkert val, sé raunverulegur vilji til þess að gera Íslendingum kleift að halda áfram að nota íslensku á öllum sviðum þjóðlífsins.“
Mælir Eiríkur Brynjólfsson málfræðiprófessor.
Ég bar þetta sama mál undir Heimi Þór Sverrisson, rafmagns- og hugbúnaðarverkfræðing, og hann svaraði:
„Ég hef stundum heyrt fólk gera grín að þessum málaflokki með því að vísa til þess að það sé nú ekki mikil þörf fyrir ísskápa sem skilja mælt mál. Það er vissulega rétt, en nokkur ár eru síðan raddstýrðar þvottavélar komu á markað. Mér hefur alltaf fundist notendaviðmót þvottavéla frekar óþjált, sérstaklega þegar maður hefur í huga hversu auðvelt er að eyðileggja viðkvæmar flíkur með rangri þvottastillingu. Heimilistækin eru smátt og smátt að þróast til einföldunar með raddstýringu, hvort sem okkur líkar betur eða verr.
Önnur notkunardæmi máltækni eru kannski nærtækari. Mikill meirihluti Íslendinga eignast nú snjallsíma við tíu ára aldurinn. Þessi tæki hafa hafa þróast úr farsímum yfir í mjög öflugar handhægar sítengdar tölvur (reyndar enn með símavirkni). Það er ekki tilviljun að stórstígustu framfarir í máltækni tengjast þessum tækjum. Auk þess að vera gríðarlega útbreidd og með sívaxandi reiknigetu eru þau nærri sítengd við Internetið og hafa innbyggða góða hljóðnema, hátalara og skjái. Upphaflega voru forrit eins og Siri í Apple-símum lítið annað en einfalt viðmót ofan á leitarvél. Nú er svo komið að fjöldi símaforrita getur notað talað mál í stað þess að krefjast innslegins texta frá pínulitlu lyklaborði. Sumir vinnufélaga minna hafa þannig eingöngu sent radd-SMS í nokkur ár.
Mestur munur finnst mér sjálfum reyndar vera á tölvunotkun í akstri. Ég get auðvitað sagt símanum hvert ég vil fara, í stað þess að pikka það inn, en það sem skiptir meira máli samt er að ég hlusta á akstursleiðbeiningarnar miklu frekar en að stara á símaskjáinn. Þannig get ég fylgt leiðbeiningunum án þess að taka augun af umferðinni. Langi mig í te á miðri leið get ég líka spurt símann hvar sé best að stoppa á kaffihúsi, án þess að valda stórkostlegri hættu í umferðinni við að pota í skjályklaborðið. Oft hef ég reyndar leiðsöguna í gangi þótt ég rati ágætlega þá leið sem ég er að fara, því síminn stingur gjarnan upp á betri leið þegar eitthvað óvænt, eins og árekstur, kemur upp á leiðinni.
Eins og þú veist bý ég í Bandaríkjunum og öll þessi samskipti sem ég var að lýsa eiga sér stað á ensku. Ég hugsa aftur á móti oft um það hvað þurfi til að íslenska verði nothæf í þessu samhengi.
Okkur vantar ekki þekkingu á Íslandi til þess að vinna að þessum málum. Árið 2014 var sett á stofn sjálfseignarstofnunin Almannarómur. Að henni standa allir helstu sérfræðingar í þessum málaflokki, frá háskólum, fyrirtækjum, stofnunum og samtökum á Íslandi. Sumir aðstandendur Almannaróms höfðu á árunum 2011 og 2012 safnað 120 þúsund hljóðskrám frá um 600 Íslendingum sem var grunnur Google að greiningu á íslensku talmáli. Þessi grunnur hefur síðan verið notaður af Google í öllum raddgreiningarþjónustum sem þeir bjóða.
Það tók Google bara nokkra mánuði að bæta við stuðningi við talaða íslensku í sín kerfi vegna þess að þeir höfðu þá þegar skrifað almennan hugbúnað fyrir talgreiningu. Á Íslandi hefur ekki enn fengist fjármagn til þess að vinna úr þessum sömu gögnum, fimm árum seinna!!
Ef Ísland á ekki að sitja algerlega eftir þegar kemur að tölvusamskiptum með tali verður að vinna þessa grunnvinnu fyrir opinbert fé, því ekkert einkafyrirtæki sér sér hag í því.
Þessi grunnvinna er bara fyrsta skrefið. Til þess að tölvukerfi gagnist að einhverju marki er ekki nóg að útfæra bara talgreininguna, sem breytir hljóði í texta. Ofan á hana þarf að bæta málgreiningu sem getur „skilið“ það sem sagt er. Oftast er þessi málgreining háð samhenginu, t.d. ef verið er að taka við fyrirmælum fyrir ökuleið, eða velja tónlist til að spila. Málgreininguna þarf auðvitað einnig að þróa sérstaklega fyrir íslensku.
Gervigreind er svo síðasti meginþátturinn sem notaður er í máltækni. Gervigreindin er yfirleitt notuð á öllum stigum greiningarinnar, t.d. til að að „kenna“ hugbúnaðinum mismunandi framburð einstaklinga og útiloka ótækar setningar. Gervigreind er einnig mikilvæg þegar kemur að því að skilja heildarsamhengi og getur þá notað staðsetningu notandans og jafnvel aldur og fyrri störf, ef því er að skipta.
Mér sýnist að öll ofangreind svið séu í slíku fjársvelti á Íslandi að til vandræða horfi. Ef við viljum að íslenska verði áfram notuð í daglegu lífi og störfum verður hið opinbera að útvega það fjármagn sem þarf til að þróa þau kerfi sem nauðsynleg eru í nútíma tækniumhverfi. Að öðrum kosti verður íslenska þjóðin fljótlega algerlega tvítyngd.“
Væri um að ræða áþreifanlegri verðmæti, eins og okkar helstu byggingar sem lægju undir skemmdum, náttúruperlurnar, fiskimiðin, málverk gömlu meistaranna eða handritin fornu, þá myndu allir sjá að grípa þyrfti til aðgerða og kosta því til sem þyrfti. Og sama gildir hér, eða jafnvel enn frekar: ekkert er okkur verðmætara en þjóðtungan. Mönnum finnst einn milljarður vera há upphæð, en þetta gæti þó gerst á tíu árum, og þá erum við farin að tala um kepp í sláturtíðinni. Ný ríkisstjórn stendur og fellur með því hvort hún sinni þessu.