Sidebar

Handwritten English recognition cropSkaitmeninės humanitarikos (SH) plėtra yra svarbi šiuolaikinių mokslinių tyrimų dalis. Suprasdami jos reikšmę, Vilniaus universiteto (VU) Filologijos ir Istorijos fakultetai Lietuvos mokslų tarybai (LMT) pateikė bendrą projektą, kuriuo siekiama atnaujinti mokslinių tyrimų infrastruktūrą ir artimiausiu metu įkurti SH laboratoriją. Tuo tikslu VU buvo įdiegtos naujos SH priemonės, leidžiančios mokslininkams analizuoti istorinius šaltinius ir kitokio pobūdžio medžiagą taikant šiuolaikinius metodus.

Dr. Sergii'us Gurbychas, VU podoktorantūros stažuotojas, baigęs Heidelbergo žydų studijų universitetą ir finansuojamas pagal Ekonomikos atgaivinimo ir atsparumo planą „Naujoji Lietuvos karta“, plačiau papasakojo ir aptarė SH, jos įrankius, jų funkcionalumą ir naudą universitetui. Mokslininkas turi aštuonerių metų patirtį taikant SH metodus.

Kas yra SH ir kokia jos nauda humanitarams?

Dr. S. Gurbychas sako, kad SH yra plati akademinė sritis. Jai apibūdinti tinka skėčio sąvoka, kuri apima tiek teorinius, tiek praktinius aspektus. Praktinį aspektą sudaro įvairios priemonės ir metodai, o teorinis aspektas apima kritišką šių priemonių ir metodų analizę.

„SH mokslai yra plati tarpdisciplininė sritis. Skirtingi tyrėjai nagrinėja skirtingus dalykus, tokius kaip vaizdai, tekstai, vaizdo ir garso įrašai, taikydami SH metodus tokiose srityse kaip istorija, menas ar kultūros studijos. Be akademinės bendruomenės, įvairių šakų specialistai, pavyzdžiui, leidybos, žiniasklaidos ir duomenų analizės, taip pat taiko SH metodus savo darbuose, – pažymi jis. – SH kaip mokslinė šaka oficialiai atsirado maždaug prieš 30 metų, dešimtojo dešimtmečio pabaigoje. Iki 2010-inių vidurio padaugėjo akademinių publikacijų, kuriose aprašomos SH metodikos, o daugelis universitetų įsteigė SH centrus ir padidino susijusių projektų finansavimą. Šiandien stebime naują bangą, kurią paskatino didžiųjų kalbos modelių (LLM), tokių kaip GPT, „Gemini“, „Claude“ ir LLaMA, atsiradimas. Šie dirbtinio intelekto modeliai keičia tekstų analizę, istorinius tyrimus ir kultūros studijas, pristatydami naujas metodikas ir galimybes.“

Dr. S. Gurbychas, dešimt metų studijavęs ir atlikęs tyrimus Vokietijoje ir Jungtinėse Amerikos Valstijose, kur SH yra plačiai taikoma, pabrėžia šių metodų veiksmingumą: „SH leidžia tyrėjams dirbti daug greičiau. Pavyzdžiui, jei mokslininkui reikia perskaityti knygą, kelis tekstus ar visą tekstyną, kad surastų pagrindines sąvokas ir išanalizuotų jų kontekstą, šis procesas pareikalautų daug pastangų ir laiko. Tačiau paprasta programa ar sukurta pagal užsakymą gali atlikti šią užduotį per kelias sekundes. Todėl SH sutaupo ir laiko, ir nemažai techninio darbo. Be to, ji leidžia magistrantams analizuoti medžiagą, kurią paprastai nagrinėti sugeba tik keli ekspertai, dažnai turintys savo mokslinių interesų.“

Kaip veikia SH?

• Duomenų rinkimas – fizinių objektų konvertavimas į skaitmeninę formą.
• Duomenų apdorojimas – išgauto skaitmeninio turinio analizė.
• Vizualizavimas – tyrimo rezultatų pateikimas įvairiais vizualiniais formatais.

„Pavyzdžiui, istoriniuose tyrimuose dirbame su fiziniais objektais – archyviniais dokumentais. Pirmajame etape nuskenuodami ir taikydami optinį teksto atpažinimą šią medžiagą suskaitmeniname. Tai leidžia mums gauti tekstą elektroniniu formatu, tinkamu tolesnei analizei“, – pasakoja dr. S. Gurbychas.

Antrajame – duomenų analizės etape naudojamas įrankis priklauso nuo tyrimo tikslo. Mokslininkai gali pasitelkti lingvistinę analizę, statistinę analizę ar kitus metodus, kiekvienai tyrimo rūšiai naudodami skirtingas priemones: „Pavyzdžiui, norėdami ieškoti raktažodžių tekstyne, galime naudoti konkordanso įrankį – programą, kuri nustato konkrečių žodžių vietas ir pateikia jų kontekstą. Be to, galime parašyti pasirinktinį kodą, kad išryškintume visus miestų pavadinimus, asmenvardžius ar kitus svarbius žodžius tekstuose.“

Trečiąjį etapą dr. S. Gurbychas apibūdina kaip žemėlapių kūrimą. Juose tyrėjai surašo visus tekste minimus geografinius pavadinimus – tai leidžia jiems vizualizuoti geografinį pasiskirstymą dokumentuose ir nustatyti dėsningumus, kurie gali būti nepastebimi iš paprasto miestų sąrašo. Šiuose žemėlapiuose tyrėjai gali pažymėti istorines tiriamojo laikotarpio valstybių sienas ir gauti papildomų įžvalgų. Žinoma, taip pat galima kurti grafikus, diagramas ir kitas vizualizacijas, iliustruojančias tyrimo rezultatus.

Sergii

Ar sunku naudoti SH?

Paklaustas, ar sudėtinga naudotis SH metodais, dr. S. Gurbychas paaiškina, kad vieni metodai, programos ir įrankiai lengvesni, o kiti – sudėtingesni. Pavyzdžiui, jei studentas pradeda skaitmeninti dokumentus, jam nėra būtina jokia išankstinė patirtis. Jie gali tiesiog pradėti skenuoti ir skaitmeninti. Atlikti optinį ženklų atpažinimą taip pat nesudėtinga, nes tai galima padaryti vos keliais mygtukų paspaudimais.

„Tačiau jei kalbame, pavyzdžiui, apie ranka rašyto teksto atpažinimą, jau reikia tam tikros techninės patirties ir žinių, nes tai susiję su specializuotomis platformomis ir programine įranga. Taigi priklauso nuo to, kokį metodą naudosime. Yra daug įvairių priemonių – vienos jų yra paprastos, o kitoms gali prireikti valandų praktikos ar net oficialių kursų, kad išmoktume tinkamai jomis naudotis“, – sako VU mokslininkas.

Jis priduria, kad plačios ir galingos programos, galinčios atlikti daug užduočių, tokių kaip kurti žemėlapius, diagramas ar atlikti pažangią teksto analizę, gali būti gana brangios. Tad norint jomis naudotis reikia universiteto lėšų.

„Tačiau kai kurios priemonės, pavyzdžiui, konkordanso programinė įranga, leidžianti naudotojams analizuoti tekstynus ir nagrinėti pagrindinių terminų kontekstą, yra nemokamos. Taip yra todėl, kad daugelis tyrėjų kuria individualias priemones, atitinkančias jų konkrečius poreikius. Ilgainiui jie supranta, kad šios priemonės galėtų būti naudingos platesnei auditorijai, todėl padaro jas viešas ir nemokamas“, – sako mokslininkas.

Ką reikia padaryti norint naudoti SH

Jei tyrėjai niekada nėra naudoję SH, dr. S. Gurbychas rekomenduoja pradėti nuo įvadinio kurso, pavyzdžiui, SH101, skirto pradedantiesiems. „Jiems derėtų turėti „žemėlapį“ – aiškų supratimą apie tai, kokį darbą galima atlikti ir kokių priemonių galima gauti nemokamai. Kai išsiaiškins galimybes, nustatys, kokių priemonių jiems reikia, ir išmoks, kaip jomis veiksmingai naudotis.

Nustatę, kokių SH priemonių reikia tikslui pasiekti, tyrėjai gali išmokti jomis naudotis internetiniuose kursuose arba iš „YouTube“ mokomųjų vaizdo įrašų. Pirmiausia jie turi suprasti, kam ta priemonė skirta ir kokiu tikslu ją naudos. Iš pradžių nereikia jokios programavimo patirties. Kai kurie įrankiai gali atlikti visas reikiamas užduotis, tačiau jie, sakyčiau, yra bendros paskirties.

Jei norite pritaikyti įrankį konkretiems poreikiams ir nemokėti už programinę įrangą, galite naudoti savo kodą. Tačiau paprasčiausiais atvejais galite paprašyti didžiųjų kalbos modelių, pavyzdžiui, „ChatGPT“ arba „Gemini“, pagalbos. Jie jums sukurs kodą, tačiau jūs turite žinoti, kaip jį panaudoti, pateikti įvestį (pvz., savo teksto tekstyną) ir apdoroti išvestį. Žinoma, būtų geriau, jei suprastumėte kodą ir nepasikliautumėte vien tuo, ką pateikia „ChatGPT“. Kad galėtumėte visapusiškai juo naudotis, turėtumėte žinoti, kaip keisti kodą ir pritaikyti jį savo konkretiems tikslams“, – aiškina dr. S. Gurbychas.

Aptardamas kai kurių įrankių gebėjimą analizuoti sudėtingus tekstus su keliomis prasmėmis, VU mokslininkas pažymi, kad sparčiai tobulėjant dirbtniam intelektui, įskaitant tokių pažangių modelių kaip „ChatGPT“ atsiradimą, dabar įmanoma – bent jau iš dalies – sukurti įrankius, kurie gali „skaityti tarp eilučių“ ir aptikti tokius elementus kaip ironija, metafora ar net propaganda. „Pavyzdžiui, dirbtinis intelektas gali atpažinti nuorodas į Bibliją ar kitus klasikinius tekstus ir netgi tam tikru laipsniu aptikti ironiją. Taigi po metų greičiausiai sulauksime programų, kurios leis daug efektyviau interpretuoti paslėptas prasmes. Tokios priemonės labai priklauso nuo dirbtinio intelekto“, – sako jis.

Pokalbio pabaigoje dr. S. Gurbychas pažymi, kad bendradarbiaujant Istorijos fakultetui ir Filologijos fakultetui buvo pradėta vykdyti SH laboratorijos programa. Pagal ją kas dvi savaites jis rengia seminarus, kuriuose daugiausia dėmesio skiriama darbui su konkrečiais įrankiais. Pirmasis seminaras vyks vasario 6 d. ir bus skirtas „Transkribus“ – platformai, padedančiai optiškai atpažinti ranka rašytą tekstą.

 

 

Siekdami užtikrinti jums teikiamų paslaugų kokybę, Universiteto tinklalapiuose naudojame slapukus. Tęsdami naršymą jūs sutinkate su Vilniaus universiteto slapukų politika. Daugiau informacijos