Apie dirbtinį intelektą kalbame ir skaitome kasdien. Jo taikymas, poveikis mūsų kasdienybei, santykiams, moralei ir savęs suvokimui šiandien ir ateityje – aktualios diskusijų temos visuomenėje, kurias įvairiais kampais pastaruoju metu nagrinėjo ir ateitis.lt autoriai. Visgi, DI technologijoms sparčiai keičiantis ir aprėpiant vis naujas sritis, svarbu geriau suprasti DI veikimą, plėtros perspektyvas ir aktualiausias problemas bei galimus jų sprendimo scenarijus. Apie tai kalbamės su Kauno technologijos universiteto (KTU) Dirbtinio intelekto centro vadove, Informatikos fakulteto profesore dr. Agne Paulauskaitė-Tarasevičiene.
Kas jums yra dirbtinis intelektas (toliau – DI), kaip jį suprantate? Lietuvos DI strategija teigia, kad „DI – tai sistemos, kurios demonstruoja protingą ir sumanų elgesį, analizuodamos savo aplinką ir darydamos gana savarankiškus sprendimus tikslui pasiekti“. Tačiau tai yra labai techninis apibūdinimas, jis nurodo tik kaip DI veikia, bet nepateikia vertinimo, nepasako, kas tai yra? Tad kaip vertinate DI?
Lietuvos DI strategija, iš tiesų, dar nėra patvirtinta. Ji taip ir liko gulėti stalčiuose, nes nebuvo įtraukta į Vyriausybės programą. Tačiau labai tikimės, kad patobulinta Lietuvos DI strategija bus patvirtinta naujos valdžios.
DI apibrėžimų tikrai yra labai daug – DI tyrimai galiausiai tapo atskira mokslo šaka, kuri apima matematiką, informatiką, fiziką, filosofiją ir labai daug kitų sričių. Man tai pirmiausia yra skėtinė, hierarchinė sistema, kuri pačiame viršuje apima algoritmus, metodikas, kurie nėra grįsti mokymusi, o ekspertinėmis žiniomis grįstos sistemos, duomenų tyrimų algoritmai ir optimizavimo algoritmai. Tai tokios sistemos, kurios nesimoko, jose sprendimai yra lengviau suprantami ir paaiškinami. Žemiau eina mašininis mokymasis – tai reiškia, kad mes duodame duomenis ir jau pačios sistemos mokosi. Ir jau pačioje apačioje eina patys sudėtingiausi mechanizmai – konvoliuciniai neuroniniai tinklai, gilusis mokymasis, kurie yra be galo sudėtingi. Tai yra tam tikra juodoji dėžė, kurios išvestį, gaunamus rezultatus dar sudėtinga pasiškinti. Jeigu viršuje yra dar lengvai interpretuojami algoritmai, po to kuo žemiau, tuo labiau einame į neištyrinėtą lauką, kuris šiandien dar nėra iki galo suprantamas. Tačiau kartu tai ir algoritmai, kurie yra padarę perversmą tam tikruose uždaviniuose, ženkliai pagerinant tikslumą.
O kodėl tam tikrų algoritmų negalime suprasti, juk jie yra sukurti žmogaus? Kodėl negalime pažinti to žemiausio lygmens?
Todėl, kad tie algoritmai dažniausiai yra naudojami sudėtingiems duomenims atpažinti ir atpažįsta tokias savybes, kurios yra būdingos vienai ar kitai klasei, per labai daug sluoksnių bandydami išskirti tai, kas yra bendra. Jeigu mes galime paaiškinti, kaip veikia sprendimų medis, tai su generatyviniu DI yra gana sudėtinga paaiškinti, kodėl yra gautas būtent toks rezultatas. Ir čia yra visas mokslas – aiškinamasis dirbtinis intelektas, kuris ir siekia tą padaryti, tačiau veikia dar ne visai stabiliai, dar yra tik pirminis variantas, bet mes judame link to. Tad čia ir yra pagrindinės tendencijos pasaulyje – generatyvinis DI ir aiškinamasis DI. Vienas pasižymi kūrybiškumu, o kitas atvirkščiai – bando paaiškinti, kodėl gautas vienas ar kitas rezultatas. Taigi yra dvi priešingos stovyklos – aš esu aiškinamojo DI stovykloje, o visa mūsų visuomenė šiuo metu yra susidomėjusi generatyviniu DI. Iš tiesų, atrodo, kad didžioji dalis visuomenės tik dabar suprato, kad yra DI, kuris prieš tai tikrai nebuvo toks pastebimas.
Kaip suprantu, generatyvinio DI negalima lengvai paaiškinti dėl to, kad jis naudoja keletą skirtingų technologijų ir prieigų?
Taip, čia yra ir gilusis mokymasis, ir Didysis kalbos modelis (angl. Large language model), turintys milijonus parametrų, kuriuos labai sudėtinga paaiškinti. Pagrindinė jo savybė – jis gali sukurti naują dalyką, naudodamasis jau turimais duomenimis, nors tai ir nėra labai unikalus veiksmas, tačiau jis visada pasižymi originalumu, nes tai, kas yra sukuriama, visada yra naujadaras, kuris kartais net nustebina. Ar tai bus gerai? Čia jau kitas klausimas. Žinoma, to tikrai negalima naudoti medicininėje diagnostikoje, ligų prognozavime ar kitose srityse, kur ypač reikia tikslumo ir pagrindimo, tačiau jeigu jis būtų naudojamas tam tikroms administravimo ar klientų aptarnavimo sritims, medikams tai būtų didelis palengvėjimas. Didieji kalbos modeliai, balso ir kalbos atpažinimo algoritmai atliktų puikią asistavimo funkciją.
Ar gereratyvinis DI mokosi? Ar jis gali pats tobulėti?
O ką reiškia mokosi? Algoritmai turi įvesties duomenis, tuomet parametrus, kurių reikšmes koreguojame, siekdami kuo didesnio tikslumo. Jis tuos parametrus keičia, pagal tai, kokią gauna paklaidą. Jei paklaida pakankamai didelė, tada parametrai keičiami dar ir dar kartą. Jei juos pakeitus paklaida didėja, tada procesas stabdomas. Mes tai vadiname mokymusi, nes algoritmas žaidžia parametrais, tol, kol gauna kuo mažesnę paklaidą.
Bet vistiek yra žaidžiama tik su duomenimis, kurie yra nustatyti iš išorės?
Taip, tik su jais. Visa laiką sakau – niekada netikėkite, kad sistema veikia 99,99 proc. Tokiu atveju, iš karto turėtų būti papildoma eilutė – tik su tuo duomenų rinkiniu, su kuriuo buvo atliekami mokymai ir testavimai, nes įvedus į sistemą kitą duomenų rinkinį, gali būti visiškai kitaip. Iš principo, visada galime sukurti tokį tikslumą, nes paimame tą duomenų rinkinį, kuris idealiai atitinka, o algoritmui parenkame tik tuos parametrus, kurie tinka tik su tais duomenimis, o paėmus jau kitus duomenis, tikslumas gali būti ir 80 proc. ar 70 proc., nes visada atsiras artefaktų, su kuriais sistema dar nėra susipažinusi.
Kaip matote aiškinamojo ir generatyvinio DI perspektyvą?
Finansai, medicina, teisė – šiose srityse labai daug jautrių duomenų, todėl ten gali būti tik aiškinamasis DI. Šiuo metu mokslininkai dirba ir deda daug pastangų, siekdami patobulinti šiuos algoritmus ir metodikas. Tai reiškia, kad gydytojui pasakys, padarėme magnetinį rezonansą ir šioje vietoje panašu, jog žmogui reikia daryti operaciją, yra užsikimšusios kraujagyslės. Tokiu atveju DI gydytojui parodys vaizdą su išvadomis, kartu su paaiškinimu, kaip šių išvadų buvo prieita ir kokie parametrai tam turėjo didžiausią įtaką. Šioje vietoje bus labai svarbu atkreipti dėmesį į pažymėtas vietas, nes tai rodys didelę tikimybę, kad bus aptikta liga ir kad jau būtų tikslinga taikyti tam tikras intervencijas. Taip pat DI kardiologui ar radiologui galės parodyti, kiek procentų yra užsikimšusi širdies, galvos ar kita kraujagyslė. Tada gydytojas peržiūrėjęs 3D vaizdą galės spręsti – reikia ar nereikia leisti vaistus tam žmogui.
Dar labai įdomus klausimas yra, ar šis amžius taps DI amžiumi? Atrodo, kad jau buvo labai daug tokių technologijų, kurios turėjo neatpažįstamai pakeisti žmonių gyvenimą, tačiau arba mes labai greitai prie jų pripratome, arba jos buvo pamirštos, o žadėtoji revoliucija taip ir neįvyko. Kaip manote, koks likimas laukia DI?
Iš tiesų, didžioji dalis mašininio mokymosi algoritmų išliko, nes jie veikia efektyviai. Tik atsiradusios giliojo mokymosi architektūros ženkliai ištobulėjo ir labai pagerėjo vaizdų analizė, o nemaža dalis algoritmų liko klasikiniai, tik su tam tikrais patobulinimais ir atnaujinimais. Esmė yra ta, kad anksčiau nebuvo tiek daug duomenų, o kai atsirado skaitmenizacija, mes badaujantiems modeliams davėme labai daug duomenų, tad jie gavo erdvę tobulėti. Anksčiau mes moksle dirbdavome tik su teoriniais duomenimis – be to, jų sunkiai duodavo, skaitmenizuotų nebuvo, o dabar viskas yra suskaitmeninta. Tas pats ChatGPT be tiek daug atvirų duomenų nebūtų galėjęs sėkmingai veikti. Bet kadangi mes visi bendraujame viešojoje erdvėje – informacijos yra kiek tik nori. Todėl DI mokytis yra prieinamas anksčiau neįsivaizduojamas, milžiniškas informacijos kiekis.
Taip pat norisi paklausti ir apie privatumą – turbūt daugeliui taip būna, kad kalbi su kuo nors viena ar kita tema, o po to naršai telefone ir nustembi, kad tau rodo būtent tai, apie ką kalbėjai. Kiek tai yra etiška?
Iš tikrųjų, DI rekomendacijos UNESCO yra jau seniai išleistos ir aš pati buvau toje grupėje, atlikau mokslinę lietuvių kalbos redakciją. Jose yra nurodoma, kad turi būti užtikrinta, kad visos šalys galėtų naudotis DI technologijų privalumais (ypač medicinos sektoriuje), taip pat DI turi būti aiškinamasis ir pan. Bet tai yra tik rekomendacijų lygmuo. Taip pat konkurencija turėtų vykti etiškai, reikėtų atsižvelgti į asmens duomenų apsaugą, taip pat turėtų būti nurodyta, kad paveikslas ar kitas turinys yra kurtas su DI – visi šie principai jau seniai yra priimti UNESCO. Įsigaliojus ES DI aktui visi šie reikalavimai taps privalomi.
Tai reiškia, kad tai, ką mes dabar patiriame yra dar nereguliuojama?
Taip, ES DI teisės aktas įsigalios maždaug tik už metų.
Ar tai reiškia, kad po metų taip jau nebebus?
Tik tuo atveju, jei produktas sukurtas Europoje – reguliuosime tik šiuos produktus. Aš labai tikiuosi, kad šiuo metu kuriami produktai jau bus reguliuojami, o naudojamiems produktams taip pat turėtų atsirasti vienoks ar kitoks tikrinimas, dedami vieni ar kiti sertifikavimo ženklai ir pan.
O nauji teisės aktai, ar jie draus, ribos tam tikras veiklas?
Šioje vietoje labai svarbu išlaikyti balansą, kad beribodami nestabdytume inovacijų pažangos. Iš mūsų jau juokiasi JAV – sako, jūs reguliuokitės, o mes pardavinėsim savo produktus už milijardus. Tai čia yra svarbiausia, kad pažanga nesustotų ir kad pats reguliavimas būtų atsakingas, kad neapsikrautume savitiksle biurokratija ir išlaidomis. Tai man kelia didžiausią susirūpinimą, nes dabar visi tik spėlioja, kas čia bus, kas mūsų laukia.
Ar galėtumėte pabaigai trumpai pristatyti KTU DI centro veiklą – kokie yra ilgalaikiai ir trumpalaikiai centro tikslai? Kaip sekasi juos įgyvendinti?
Kai atsidarė šis centras pirminis tikslas buvo iš fundamentinių, mokslinių tyrimų pereiti į praktinius, nes mes mokslininkai kartais gyvename komforto zonoje – turime teorinius tyrimus ir tuo viskas pasibaigia kartais.. Dažnai jie taip ir nugula stalčiuje ir labai gaila, nes būna tikrai gerų idėjų – jeigu kažkas apsiimtų jas komercializuoti, turėtume puikių sprendimų Lietuvoje. Todėl mano tikslas, kad mes, iš tikrųjų, dirbtume ne tik mokslinį tiriamąjį darbą, bet ir realiai pritaikomus produktus. Žinoma, tai irgi yra reikalinga, bet mes labiau siekiame praktinio pritaikymo, kuris atlieptų realias Lietuvos problemas. Ateityje ir studijos, ir tyrimai, ir projektų rašymai visa tai vyks jau naujame „SustainLivWork“ centre tvariam gyvenimui ir darbui.
Ką jis darys?
Daugiausiai bus dirbama pramonės, medicinos, transporto ir energetikos srityse. Mes kursime tvarius sprendimus visiems šiems sektoriams. Vienoje vietoje turėsime daug DI infrastruktūros, laboratorijas, DI tyrėjų ir kt. Projektas bus įgyvendintas per šešis metus, dabar praėjo tik pirmieji metai ir po to centras jau pradės generuoti pajamas, teiks paslaugas, kurios bus komercinės. Taigi mes tapsime vienu DI centru, kadangi nėra tikslinga turėti kelis, nes Lietuvoje ir taip didelė fragmentacija. Naujame centre tikimės daryti tikrai labai daug – turėsime testavimo laboratorijas, kursime ir išbandysime naujus algoritmus, apdorosime duomenų rinkinius ir pan. Visa tai bus skirta tam, kad mūsų privataus ir viešojo sektoriaus sprendimai būtų tvaresni. Tikimės, kad 2026 m. viduryje statybos jau bus baigtos ir mes galėsime pakviesti į didžiausio DI centro Baltijos šalių regione atidarymą.