Spacy modelių naudojimas istoriniams ir filologiniams tyrimams - 2025-04-17
- 2025-04-17 17:00
Balandžio 17 d. 17:00 val. kviečiame bendruomenės narius į dirbtuves, skirtas vardinių esybių atpažinimui (NER) naudojant Spacy kalbų modelius (https://spacy.io/usage/facts-figures).
Skirtingai nuo didelių kalbos modelių (LLM), tokių kaip ChatGPT ar Gemini, Spacy kalbos modeliai negeneruoja teksto, o yra skirti struktūrinei tekstų analizei ir anotavimui. Iš esmės, kalbos modelis yra matematinis modelis, išmokytas tam tikros kalbos tekstais, kuris analizuoja žodžius ir jų tarpusavio ryšius. Spacy modeliai sukurti daugeliui kalbų, įskaitant lietuvių kalbą, ir gali būti taikomi istoriniams bei filologiniams tyrimams.
Dirbtuvių metu nagrinėsime šių modelių galimybes, ypač jų gebėjimą atpažinti vardines esybes, tokias kaip asmenvardžiai, geografinės vietovės, organizacijos, datos, įvykiai, adresai ir net meno kūriniai. Analizuosime du atvejus, kurie parodė šio metodo produktyvumą moksliniuose tyrimuose. Taip pat aptarsime įvairius teksto anotavimo metodus, įskaitant vardinių esybių žymėjimą konteksto nustatymui.
Planuojama trukmė: 45 min.
Tikslinė auditorija: Šios dirbtuvės skirtos tiems, kurie nėra susipažinę arba tik pradeda susipažinti su Spacy kalbų modeliais. Programavimo įgūdžių nereikia. Darbas su modeliu vyks per Google Colab. Dalyviui būtina turėti Google paskyrą (pvz., Gmail).
Dirbtuvių metu dalyviai turės galimybę eksperimentuoti su modeliais naudodami pasirinktus tekstus. Jei neturite bendrojo prisijungimo prie VU sistemos, rekomenduojama atsinešti savo „Windows“ nešiojamąjį kompiuterį ir literatūrinį arba negrožinės literatūros tekstą lietuvių arba anglų kalba .txt formatu praktiniams užsiėmimams. Lietuvių literatūros kūrinių .txt formatu daug galima rasti, pvz., čia: https://www.epaveldas.lt/collections/21.
Laikas: balandžio 17 d., 17:00–18:00.
Vieta: Filologijos fakultetas, A4 auditorija (2)
Registracija >>
Seminarą anglų kalba ves Sergii Gurbych, Istorijos fakulteto podoktorantūros stažuotojas, .