Ar dvidešimt pirmas amžius taps DI amžiumi?

„Bangos“ laikraščio pašnekovė dr. Agnė PAULAUSKAITĖ-TARASEVIČIENĖ yra KTU informatikos fakulteto profesorė, mokslininkė, tyrimų ir studijų mentorė, tarptautinių leidyklų mokslo publikacijų bendraautorė ir recenzentė. Mokslininkė vadovavo rengiant pirmąją Lietuvoje dirbtinio intelekto studijų programą „Dirbtinis intelektas“, o šiuo metu ne tik yra Kauno technologijos universiteto (KTU) Dirbtinio intelekto centro vadovė, bet ir aktyviai dalyvauja išryškinant dirbtinio intelekto (DI) svarbą versle, mokymo programose, visuomenės švietimo programose ir socialinėse medijose.

– Kas jums yra dirbtinis intelektas (toliau – DI), kaip jį suprantate? Lietuvos DI strategija nurodo, kaip tai veikia, pateikia išsamų aprašymą, bet nepateikia vertinimo, nepasako, kas tai yra? Tad kaip vertinate DI?

– Lietuvos DI strategija, iš tiesų, dar nėra patvirtinta. Ji taip ir liko gulėti stalčiuose, nes nebuvo įtraukta į Vyriausybės programą. Tačiau labai tikimės, kad patobulinta Lietuvos DI strategija bus patvirtinta naujos valdžios.

DI apibrėžimų tikrai yra labai daug – DI tyrimai galiausiai tapo atskira mokslo šaka, kuri apima matematiką, informatiką, fiziką, filosofiją ir labai daug kitų sričių. Man tai pirmiausia yra skėtinė, hierarchinė sistema, kuri pačiame viršuje apima algoritmus, metodikas, kurie nėra grįsti mokymusi, o ekspertinėmis žiniomis grįstos sistemos, duomenų tyrimų algoritmai ir optimizavimo algoritmai. Tai tokios sistemos, kurios nesimoko, jose sprendimai yra lengviau suprantami ir paaiškinami. Žemiau eina mašininis mokymasis – tai reiškia, kad mes duodame duomenis ir jau pačios sistemos mokosi. Ir jau pačioje apačioje eina patys sudėtingiausi mechanizmai – konvoliuciniai neuroniniai tinklai, gilusis mokymasis, kurie yra be galo sudėtingi. Tai yra tam tikra juodoji dėžė, kurios išvestį, gaunamus rezultatus dar sudėtinga paaiškinti. Jeigu viršuje yra dar lengvai interpretuojami algoritmai, po to kuo žemiau, tuo labiau einame į neištyrinėtą lauką, kuris šiandien dar nėra iki galo suprantamas. Tačiau kartu tai ir algoritmai, kurie yra padarę perversmą tam tikruose uždaviniuose, ženkliai pagerinant tikslumą.

– O kodėl tam tikrų algoritmų negalime suprasti, juk jie yra sukurti žmogaus? Kodėl negalime pažinti to žemiausio lygmens?

– Todėl, kad tie algoritmai dažniausiai yra naudojami sudėtingiems duomenims atpažinti ir atpažįsta tokias savybes, kurios yra būdingos vienai ar kitai klasei, per labai daug sluoksnių bandydami išskirti tai, kas yra bendra. Jeigu mes galime paaiškinti, kaip veikia sprendimų medis, tai su generatyviniu DI yra gana sudėtinga paaiškinti, kodėl yra gautas būtent toks rezultatas. Ir čia yra visas mokslas – aiškinamasis dirbtinis intelektas, kuris ir siekia tą padaryti, tačiau veikia dar ne visai stabiliai, dar yra tik pirminis variantas, bet mes judame link to. Tad čia ir yra pagrindinės tendencijos pasaulyje – generatyvinis DI ir aiškinamasis DI. Vienas pasižymi kūrybiškumu, o kitas atvirkščiai – bando paaiškinti, kodėl gautas vienas ar kitas rezultatas. Taigi yra dvi priešingos stovyklos – aš esu aiškinamojo DI stovykloje, o visa mūsų visuomenė šiuo metu yra susidomėjusi generatyviniu DI. Iš tiesų, atrodo, kad didžioji dalis visuomenės tik dabar suprato, kad yra DI, kuris prieš tai tikrai nebuvo toks pastebimas.

– Kaip suprantu, generatyvinio DI negalima lengvai paaiškinti dėl to, kad jis naudoja keletą skirtingų technologijų ir prieigų?

– Taip, čia yra ir gilusis mokymasis, ir Didysis kalbos modelis (angl. Large language model), turintys milijonus parametrų, kuriuos labai sudėtinga paaiškinti. Pagrindinė jo savybė – jis gali sukurti naują dalyką, naudodamasis jau turimais duomenimis, nors tai ir nėra labai unikalus veiksmas, tačiau jis visada pasižymi originalumu, nes tai, kas yra sukuriama, visada yra naujadaras, kuris kartais net nustebina. Ar tai bus gerai? Čia jau kitas klausimas. Žinoma, to tikrai negalima naudoti medicininėje diagnostikoje, ligų prognozavime ar kitose srityse, kur ypač reikia tikslumo ir pagrindimo, tačiau jeigu jis būtų naudojamas tam tikroms administravimo ar klientų aptarnavimo sritims, medikams tai būtų didelis palengvėjimas. Didieji kalbos modeliai, balso ir kalbos atpažinimo algoritmai atliktų puikią asistavimo funkciją.

– Ar gereratyvinis DI mokosi? Ar jis gali pats tobulėti?

– O ką reiškia mokosi? Algoritmai turi įvesties duomenis, tuomet parametrus, kurių reikšmes koreguojame, siekdami kuo didesnio tikslumo. Jis tuos parametrus keičia pagal tai, kokią gauna paklaidą. Jei paklaida pakankamai didelė, tada parametrai keičiami dar ir dar kartą. Jei juos pakeitus paklaida didėja, tada procesas stabdomas. Mes tai vadiname mokymusi, nes algoritmas žaidžia parametrais, tol, kol gauna kuo mažesnę paklaidą.

– Bet vis tiek yra žaidžiama tik su duomenimis, kurie yra nustatyti iš išorės?

– Taip, tik su jais. Visa laiką sakau – niekada netikėkite, kad sistema veikia 99,99 proc. Tokiu atveju iš karto turėtų būti papildoma eilutė – tik su tuo duomenų rinkiniu, su kuriuo buvo atliekami mokymai ir testavimai, nes, įvedus į sistemą kitą duomenų rinkinį, gali būti visiškai kitaip. Iš principo visada galime sukurti tokį tikslumą, nes paimame tą duomenų rinkinį, kuris idealiai atitinka, o algoritmui parenkame tik tuos parametrus, kurie tinka tik su tais duomenimis, o paėmus jau kitus duomenis, tikslumas gali būti ir 80 proc. ar 70 proc., nes visada atsiras artefaktų, su kuriais sistema dar nėra susipažinusi.

– Kaip matote aiškinamojo ir generatyvinio DI perspektyvą?

– Finansai, medicina, teisė – šiose srityse labai daug jautrių duomenų, todėl ten gali būti tik aiškinamasis DI. Šiuo metu mokslininkai dirba ir deda daug pastangų, siekdami patobulinti šiuos algoritmus ir metodikas. Tai reiškia, kad gydytojui pasakys, padarėme magnetinį rezonansą ir šioje vietoje panašu, jog žmogui reikia daryti operaciją, yra užsikimšusios kraujagyslės. Tokiu atveju DI gydytojui parodys vaizdą su išvadomis, kartu su paaiškinimu, kaip šių išvadų buvo prieita ir kokie parametrai tam turėjo didžiausią įtaką. Šioje vietoje bus labai svarbu atkreipti dėmesį į pažymėtas vietas, nes tai rodys didelę tikimybę, kad bus aptikta liga ir kad jau būtų tikslinga taikyti tam tikras intervencijas. Taip pat DI kardiologui ar radiologui galės parodyti, kiek procentų yra užsikimšusi širdies, galvos ar kita kraujagyslė. Tada gydytojas peržiūrėjęs 3D vaizdą galės spręsti – reikia ar nereikia leisti vaistus tam žmogui.

– Ar tai yra patikima?

– Tikrai patikima – tokiems medicininiams vaizdams ir duomenims taikomi daugkartiniai tikrinimai, į tai yra žiūrima labai atsakingai. Be to, tai nėra visiškai autonomiški sprendimai, kaip pavyzdžiui DI grįstas asistavimas, kurio medicinoje ir dabar gana mažai.

– Kaip suprantu, su tokiu generatyviniu DI kaip ChatGPT tai būtų neįmanoma?

– Taip, toks intelektas tikrai dar nėra patikimas visose srityse. Medicinoje jam sekasi ypač sunkiai – mes bandėme kurti sintetinius duomenis ir daryti pirštų rentgenogramą, tai gaudavosi ateivių pirštai, todėl jei iš medicininių vaizdų nekursime meno, į šias patrauklias technologijas turime žiūrėti itin atsargiai. Daug kas yra tiesiog prikuriama. Aš irgi kartais parašau, paklausiu, ko nors ChatGPT – jis tikrai daro dar labai daug klaidų ir pateikia nemažai trivialios informacijos, nors ir tobulėja. Todėl visada svarbu patikrinti gautą informaciją. Dabar prasidėjo toks katės ir pelės žaidimas – tobulėja ChatGPT, tobulėja ir detektoriai, kurie parodo, kad tekstas buvo sukurtas panaudojant DI, bet jį išbandžius paaiškėja, kad ir jis nėra visiškai patikimas.

Man dar labai įdomus ChatGPT veikimas, juk jis naudoja most likely (liet. labiausiai tikėtina) principą – ima tai, kas labiausiai tikėtina eis po kito žodžio. Tačiau internete gausu pavyzdžių, kaip jam yra sunku su, pavyzdžiui, lietuvių kalbos kirčiavimu.

Dėl šios priežasties ir turime projektą su VDU, kuris yra skirtas lietuvių kalbos tekstynams – tam yra skirta arti 10 mln. Pagrindinis projekto tikslas – pritaikyti lietuvių kalbos tekstus taip, kad užtikrintume kalbinių išteklių, naudojamų DI technologijų sprendimams, plėtrą. Didieji Lietuvos universitetai koordinuoja šiuos projektus, apimančius lietuvių kalbos tekstynus, morfologiją, žodžių tvarką sakinyje – viskas tam, kad DI naudotų kuo taisyklingesnę lietuvių kalbą ir atlieptų technologinius poreikius. Tai tikrai didelis ir sunkus darbas, bet tai bus labai svarbus žingsnis, padėsiantis sukurti daug efektyvesnius DI sprendimus lietuvių kalbai.

– Tai reiškia, kad kalba bus pritaikyta DI poreikiams ir paslaugoms?

– Taip, tai bus labiausiai orientuota į paslaugas sektoriuose, kur tikslingas aptarnavimas yra grįstas balso atpažinimo modeliais – pavyzdžiui, mediciną. Kai senas žmogus, kuris jau nebe taip gerai girdi ar mato, ateis į kliniką ir norės užsisakyti vieną ar kitą paslaugą, paklausti, kur galima rasti tam tikros srities gydytoją ar kabinetą, jis galės balsu valdyti jį aptarnaujančią sistemą. Taigi šių projektų tikslas yra pasiekti, kad DI vartojama kalba būtų tokia, kokią vartoja žmogus.

– Tačiau aš kartais stebiuosi, kaip gerai ChatGPT rašo lietuviškai.

– Iš tiesų, kiek jis turi duomenų ir kokio dydžio specialistų komandos ten dirbo, yra įspūdinga. Mes tokių pajėgumų neturime – vien kiek daug kainuoja didelio našumo skaičiavimo sprendimai (ang. High performance computing, HPC), be to, jie naudoja ir labai daug resursų.

– Man taip pat įdomu, su kokiais lietuviškais duomenimis buvo treniruotas ChatGPT ar jam prieinama viskas?

– Taip, jam yra prieinama beveik viskas. Jis pasiima labai daug tekstų, kurie yra internetinėje erdvėje, kurių šiuo metu yra labai daug, bet, jeigu mes dar sužymėsime jam papildomai tekstynus, tai bus tikrai labai naudinga.

Tačiau ar kartais vadindami DI intelektu, mes neredukuojame to, kas protinga, į tai, kas yra efektyvu, greita ir orientuota į rezultatą? Mes jau dabar nepastebime, kad DI yra naudojamas daugybėje sričių – pavyzdžiui, sprendimų palaikymo sistemos reklamoje, versle, pramonėje. Žmogus dažnai tampa vis labiau orientuotas į procesų atlikimą, bet ne į jų apmąstymą. Kaip būtų galima protingai naudotis DI, kad jis nesumažintų kūrybiškumo, gebėjimo pačiam priimti sprendimus?

Aš pati savo kasdienybėje naudoju visus DI įrankius, nes man reikia labai daug rašyti, pavyzdžiui, man kartais reikia perfrazuoti kokį nors sakinį anglų kalba – ir kartais tikrai būna neblogai, o kartais man visai nepatinka. Kartais ieškai idėjos, rengiant kokios nors sistemos kūrimo etapus. Lygiai taip pat ne visada būna gerai. Kaip kuria paveikslėlius, man irgi visiškai nepatinka.

Ir man kartais, iš tiesų, truputį baisu, kad paskui negebėsime patys generuoti ir sudėlioti minčių, nes visą laiką prašysime, kad darbus padarytų už mus. Nenoriu sakyti, kad tapsime visai beraščiai ar nemąstysime, bet pats gebėjimas pačiam sugalvoti ir užrašyti mintis tikrai yra labai geras dalykas. Galbūt ateityje tai bus visai nevertinama? Pavyzdžiui, anksčiau pastovumas, lojalumas, gebėjimas daug metų išdirbti vienoje vietoje buvo suprantami kaip vertingi dalykai. Šiandien yra vertinama rotacija ir gebėjimas naudotis technologijomis bei įvairiais įrankiais, būti aktyviu socialinėse medijose, sekti tendencijas beveik „realiu laiku“ ir pan. Jeigu technologinis raštingumas yra žemas, tada tu prastas, neefektyvus darbuotojas. Toks jausmas, kad pirminis dalykas yra dirbti greitai, o kokybė jau eina į šoną. Tačiau šiandienos tendencijos rodo, kad tai nėra absoliuti tiesa. Pradžioje visi užsakovai, kurie ateidavo, prašydavo padėti su automatizacija, kad darbai būtų atliekami greitai ir efektyviai. Po to kilo nauja banga – žmonės ateidavo dėl projektų su klausimais, kaip prognozuoti, aptikti anomalijas, kiek prekių užsakyti, kaip ilgai jas laikyti sandėliuose – ar pagal sezoniškumą, brangumą sandėliuoti ir pan. Dabar visi uždaviniai jau yra personalizacijos – norima, kad tam klientui paslauga būtų suasmeninta, kad jį sektų, kad jam parodytų, ko jis dar gali norėti, kokių kelionių jis dar gali trokšti, ką pirkti – taigi panašu, kad ir DI srityje yra mados.

– Šiame kontekste norisi klausti, o kaip yra su teisiniu reguliavimu?

– Kitą vasarą jau įsigalios ES DI teisės aktas – tai bus pirmasis bandymas Europos Sąjungoje teisiškai reguliuoti DI. Didžiulis klausimas, kaip tai atrodys ir kokios bus to pasekmės. Šiuo metu įvairiose europinėse parodose mes esame žali ir etiški, JAV viską daro visiškai kitaip. Ten yra svarbiausia konkurencingumas, inovacijos, startuolių rėmimas ir niekas negalvoja apie reguliavimus.

Tačiau niekas dar nežino, kaip konkrečiai reguliavimas atrodys. Pavyzdžiui, jei tu paleisi produktą į rinką, kuris buvo testuotas su vienais duomenimis, o paleidus į rinką jis veiks visiškai kitaip arba testuotojai praleis vieną ar kitą svarbią informaciją. Kiek tada atsiras visokių atsakomybių – kam tai bus priskirta, kokios to pasekmės? Kiekviena šalis turi savo įsivaizdavimą, mes dabar irgi bandom tų gerųjų praktikų išmokti.

Dar labai įdomus klausimas yra, ar šis amžius taps DI amžiumi? Atrodo, kad jau buvo labai daug tokių technologijų, kurios turėjo neatpažįstamai pakeisti žmonių gyvenimą, tačiau arba mes labai greitai prie jų pripratome, arba jos buvo pamirštos, o žadėtoji revoliucija taip ir neįvyko. Kaip manote, koks likimas laukia DI?

Iš tiesų, didžioji dalis mašininio mokymosi algoritmų išliko, nes jie veikia efektyviai. Tik atsiradusios giliojo mokymosi architektūros ženkliai ištobulėjo ir labai pagerėjo vaizdų analizė, o nemaža dalis algoritmų liko klasikiniai, tik su tam tikrais patobulinimais ir atnaujinimais. Esmė yra ta, kad anksčiau nebuvo tiek daug duomenų, o kai atsirado skaitmenizacija, mes badaujantiems modeliams davėme labai daug duomenų, tad jie gavo erdvę tobulėti. Anksčiau mes moksle dirbdavome tik su teoriniais duomenimis – be to, jų sunkiai duodavo, skaitmenizuotų nebuvo, o dabar viskas yra suskaitmeninta. Tas pats ChatGPT be tiek daug atvirų duomenų nebūtų galėjęs sėkmingai veikti. Bet kadangi mes visi bendraujame viešojoje erdvėje – informacijos yra kiek tik nori. Todėl DI mokytis yra prieinamas anksčiau neįsivaizduojamas, milžiniškas informacijos kiekis.

Čia labai įdomu, kad skaitmenizacija plečiasi, tai reiškia, kad vis daugiau duomenų tampa prieinami, o tai savo ruožtu skatina ir DI plėtrą, taigi abu procesai akumuliuoja vienas kitą.

Taip pat atsirado didelio našumo skaičiavimo sprendimai (angl. High performance computing, HPC). Tai reiškia, kad dabar skaičiavimai yra atliekami ne per metus, pusę, o vos per vieną dieną. Aišku, energijos yra suvartojama labai daug. Anksčiau reikėjo net mėnesį laukti, kol apmokydavai algoritmą, įdėdamas į jį labai daug duomenų, nes vaizdų apdorojimas yra ypatingai daug skaičiavimo resursų reikalaujantis uždavinys. Pavyzdžiui, duodavai milijoną duomenų ir nurodydavai, kad yra penkios klasės, tarkim, viena iš tų penkių yra vėžys ir tu turi ją atpažinti tarp visų kitų. Dabar su naujais resursais šiuos procesus mes galime gerokai sutrumpinti.

– Taip pat norisi paklausti ir apie privatumą – turbūt daugeliui taip būna, kad kalbi su kuo nors viena ar kita tema, o po to naršai telefone ir nustembi, kad tau rodo būtent tai, apie ką kalbėjai. Kiek tai yra etiška?

– Iš tikrųjų, DI rekomendacijos UNESCO yra jau seniai išleistos ir aš pati buvau toje grupėje, atlikau mokslinę lietuvių kalbos redakciją. Jose yra nurodoma, kad turi būti užtikrinta, kad visos šalys galėtų naudotis DI technologijų privalumais (ypač medicinos sektoriuje), taip pat DI turi būti aiškinamasis ir pan. Bet tai yra tik rekomendacijų lygmuo. Taip pat konkurencija turėtų vykti etiškai, reikėtų atsižvelgti į asmens duomenų apsaugą, taip pat turėtų būti nurodyta, kad paveikslas ar kitas turinys yra kurtas su DI – visi šie principai jau seniai yra priimti UNESCO. Įsigaliojus ES DI aktui visi šie reikalavimai taps privalomi.

– Tai reiškia, kad tai, ką mes dabar patiriame, yra dar nereguliuojama?

– Taip, ES DI teisės aktas įsigalios maždaug tik už metų.

– Ar tai reiškia, kad po metų taip jau nebebus?

– Tik tuo atveju, jei produktas sukurtas Europoje, – reguliuosime tik šiuos produktus. Aš labai tikiuosi, kad šiuo metu kuriami produktai jau bus reguliuojami, o naudojamiems produktams taip pat turėtų atsirasti vienoks ar kitoks tikrinimas, dedami vieni ar kiti sertifikavimo ženklai ir pan.

– O nauji teisės aktai, ar jie draus, ribos tam tikras veiklas?

– Šioje vietoje labai svarbu išlaikyti balansą, kad beribodami nestabdytume inovacijų pažangos. Iš mūsų jau juokiasi JAV – sako, jūs reguliuokitės, o mes pardavinėsim savo produktus už milijardus. Tai čia yra svarbiausia, kad pažanga nesustotų ir kad pats reguliavimas būtų atsakingas, kad neapsikrautume savitiksle biurokratija ir išlaidomis. Tai man kelia didžiausią susirūpinimą, nes dabar visi tik spėlioja, kas čia bus, kas mūsų laukia.

– Jūs taip pat dalyvavote UNESCO DI rekomendacijų teikimo ir vertinimo procese, ar galėtumėte daugiau apie tai papasakoti ir kaip UNESCO siekia užtikrinti etišką DI?

– Iš esmės, pagrindinis dalykas, kurio siekia UNESCO – lygybė tarp šalių, kad mažėtų socialinė ir ekonominė atskirtis, bet manau, kad, deja, neišvengsime to – natūralu, kad tos šalys, kurios DI sprendimų turi daugiau, yra pranašesnės. Turėtų būti lygybė, kad visos šalys galėtų vienodai prieiti prie technologijų, tačiau medicinoje visada išliks didelė atskirtis, nes diagnostika jau yra labai pažengusi, brangi ir yra grįsta DI sprendimais. Tad tai galės sau leisti tik tie, kurie gydysis privačiose klinikose ar turės brangų sveikatos draudimą.

– Ar galėtumėte pabaigai trumpai pristatyti KTU DI centro veiklą – kokie yra ilgalaikiai ir trumpalaikiai centro tikslai? Kaip sekasi juos įgyvendinti?

– Kai buvo atidarytas šis centras, pirminis tikslas buvo iš fundamentinių, mokslinių tyrimų pereiti į praktinius, nes mes, mokslininkai, kartais gyvename komforto zonoje – turime teorinius tyrimus ir tuo viskas pasibaigia kartais. Dažnai jie taip ir nugula stalčiuje ir labai gaila, nes būna tikrai gerų idėjų – jeigu kažkas apsiimtų jas komercializuoti, turėtume puikių sprendimų Lietuvoje. Todėl mano tikslas, kad mes iš tikrųjų dirbtume ne tik mokslinį tiriamąjį darbą, bet ir realiai pritaikomus produktus. Žinoma, tai irgi yra reikalinga, bet mes labiau siekiame praktinio pritaikymo, kuris atlieptų realias Lietuvos problemas. Ateityje ir studijos, ir tyrimai, ir projektų rašymai – visa tai vyks jau naujame „SustainLivWork“ centre tvariam gyvenimui ir darbui.

– Ką jis darys?

– Daugiausia bus dirbama pramonės, medicinos, transporto ir energetikos srityse. Mes kursime tvarius sprendimus visiems šiems sektoriams. Vienoje vietoje turėsime daug DI infrastruktūros, laboratorijas, DI tyrėjų ir kt. Projektas bus įgyvendintas per šešerius metus, dabar praėjo tik pirmieji metai ir po to centras jau pradės generuoti pajamas, teiks paslaugas, kurios bus komercinės. Taigi mes tapsime vienu DI centru, kadangi nėra tikslinga turėti kelis, nes Lietuvoje ir taip didelė fragmentacija. Naujame centre tikimės daryti tikrai labai daug – turėsime testavimo laboratorijas, kursime ir išbandysime naujus algoritmus, apdorosime duomenų rinkinius ir pan. Visa tai bus skirta tam, kad mūsų privataus ir viešojo sektoriaus sprendimai būtų tvaresni. Tikimės, kad 2026 m. viduryje statybos jau bus baigtos ir mes galėsime pakviesti į didžiausio DI centro Baltijos šalių regione atidarymą.

Kalbėjosi Augustas KALINAUSKAS

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Daugiau straipsnių

Skip to content