Skaitmeniniai kalbos duomenys ir intelektinės technologijos

Tyrimų kryptys

Šio klasterio mokslininkų atliekami tyrimai, projektai ir publikacijos yra tarpdisciplininio pobūdžio, jungiantys lingvistų ir informatikų pajėgas, čia kryžiuojasi kompiuterinės lingvistikos, dirbtinio intelekto ir skaitmeninės humanitarikos temos. Klasteryje bendradarbiauja Humanitarinių mokslų fakulteto Kompiuterinės lingvistikos centro (https://klc.vdu.lt) ir Informatikos fakulteto (http://if.vdu.lt/) mokslininkai.

Klasterio moksliniai tyrimai būtini kalbai skaitmeninti ir lietuvių kalbos technologijoms kurti. Ryškiausios tyrimų kryptys: lietuvių kalbos terminologija ir pastoviųjų žodžių junginių analizė, lietuvių kalbos morfologijos ir sintaksės tyrimai, teksto analizė ir vertimas, lietuvių šnekos anotavimas ir atpažinimo tyrimai, lietuvių kalbos fonetinių ypatybių ir fonotaktikos tyrimai ir kt.

Vienas iš klasterio prioritetų yra kalbos duomenų ruošyba ir jų atviroji prieiga, nes daugeliui šiuolaikinių statistinių ir mašininio mokymosi tyrimų reikia daug kokybiškai parengtų kalbos duomenų. Kompiuterinės lingvistikos centras koordinuoja Lietuvos atstovavimą tarptautinėje mokslo infrastruktūroje CLARIN ERIC, tam tikslui įkurtas CLARIN-LT centras (https://clarin-lt.lt) ir mokslo ir studijų institucijų konsorciumas.  CLARIN-LT centras ir saugykla užtikrina lietuvių kalbos duomenų kūrimą ir atvėrimą.

Klasteryje vykdama intensyvi projektinė veikla. Daugelis klasteriui priklausančių mokslininkų dalyvavo vykdant tokius projektus kaip pirmasis anglų–lietuvių mašininis vertimas (IIVP, http://vertimas.vdu.lt), Resilience for Survivability (ReSIST), „Švietimo ir mokslo terminų automatinis identifikavimas (ŠIMTAI 2)“, „Lietuvių kalbos pastoviųjų junginių automatinis atpažinimas (PASTOVU)“, „Užsienio baltistikos centrų ir Lietuvos mokslo ir studijų institucijų bendradarbiavimo skatinimas“, SEMANTIKA, SEMANTIKA-2 ir daugelį kitų.

Klasterio nariai

Doktorantai

Apgintos daktaro disertacijos klasterio tematika