Please use this identifier to cite or link to this item:https://hdl.handle.net/20.500.12259/57512
Full metadata record
DC FieldValueLanguage
dc.contributor.authorRimkutė, Erika-
dc.contributor.authorBielinskienė, Agnė-
dc.contributor.authorBoizou, Loic-
dc.contributor.authorUtka, Andrius-
dc.coverage.spatialLT-
dc.date.accessioned2018-10-07T01:22:28Z-
dc.date.available2018-10-07T01:22:28Z-
dc.date.issued2017-
dc.identifier.otherVDU02-000022160-
dc.identifier.urihttps://hdl.handle.net/20.500.12259/57512-
dc.description.abstractPranešime pristatomi du anotuoti lietuvių kalbos tekstynai, parengti Vytauto Didžiojo universiteto Kompiuterinės lingvistikos centre (KLC). Anotuoti tekstynai – pagrindiniai ištekliai, be kurių neapsieinama plėtojant kalbos technologijas. Jie paprastai naudojami kitiems natūraliosios kalbos ištekliams ir įrankiams kurti tokiose srityse, kaip automatinio kalbos atpažinimo sistemos, automatizuotas vertimas ir pan. Morfologiškai anotuotas tekstynas MATAS rengtas 2002–2014 metais. Jį sudaro 1,6 mln. žodžių iš įvairių stilių tekstų. Tekstynas parengtas 1 mln. žodžių tekstyno, sudaryto 2006 m., pagrindu pritaikant statistinius modelius. Tekstynui anotuoti naudotas KLC parengtas morfologinis anotatorius. Tekstynas yra sužymėtas dviem formatais: KLC sukurtu formatu ir tarptautiniu TEI P5. Morfologinės pažymos, sudarytos remiantis MULTEXT-East formato (http://nl.ijs.si/ME/V4/msd/html/index.html) pavyzdžiu, kur kiekviena santrumpa atitinka konkrečią morfologinę kategoriją (nuo 2 iki 14). Sintaksiškai anotuotas tekstynas ALKSNIS, kaip aukso standartas tolesniems tyrimams ir ištekliams, parengtas 2016 m. Šį tekstyną sudaro 2355 sakiniai (apie 30 tūkst. žodžių), imti iš įvairių stilių tekstų. Tekstyno anotavimas paremtas automatinio morfologinio ir sintaksinio anotavimo principais, pritaikytas sintaksinių priklausomybių (angl. dependencies) modelis. Sintaksiniu analizatoriumi, kuris sukurtas KLC Haskell kalba, automatiškai sugeneruoti priklausomybių medžiai (angl. dependency trees) pateikiami grafiškai medžio principu, kur kiekviena medžio viršūnė atitinka sakinio žodį, skyrybos ženklą ar kitą sakinio vienetą. Priklausomybių ryšiai tarp žodžių yra nurodomi briaunomis, o prie kiekvieno žodžio sutrumpintai pateikiama morfologinė ir sintaksinė informacija. Sintaksinei informacijai nurodyti naudojama 18 sintaksinių pažymų ir jų variantų, pvz.,[...]lt
dc.description.sponsorshipHumanitarinių mokslų fakultetas-
dc.description.sponsorshipKompiuterinės lingvistikos centras-
dc.description.sponsorshipLituanistikos katedra-
dc.description.sponsorshipUžsienio kalbų, lit. ir vert. s. katedra-
dc.description.sponsorshipVytauto Didžiojo universitetas-
dc.format.extentp. 20-21-
dc.language.isolt-
dc.relation.ispartofSkaitmeniniaikalbos ištekliai, jų plėtros kryptys ir panaudos galimybės: 24-oji tarptautinė mokslinė Jono Jablonskio konferencija; Lietuvių kalbos institutas, 2017 m. rugsėjo 29 d.: pranešimų tezės. Vilnius : Lietuvių kalbos institutas, 2017-
dc.subjectAnotuoti lietuvių kalbos tekstynailt
dc.subjectKalbos technologijoslt
dc.subjectMorfologinis anotatoriuslt
dc.subject.otherFilologija / Philology (H004)-
dc.titleLietuvių kalbos morfologiškai ir sintaksiškai anotuoti tekstynailt
dc.typeKonferencijų tezės nerecenzuojamuose leidiniuose / Conference theses in non-peer-reviewed publications (T2)-
dc.date.updated2018-11-07T14:29Z-
local.object{"source": {"code": "vdu", "handle": "22160"}, "publisher": {"other": ["Lietuvių kalbos institutas"], "list": false}, "db": {"clarivate": false, "scopus": false, "list": false}, "code": "T2", "subject": ["H004"], "country": "LT", "language": "lt", "area": "H", "original": true, "pages": 2, "sheets": 0.143, "timestamp": "20181107142934.0", "account": {"year": 2017, "late": false}, "na": 4, "nip": 0, "affiliation": [{"contribution": 0.25, "aip": 1, "country": ["LT"], "rel": "aut", "org": [{"create": true, "contribution": 0.25, "name": "Vytauto Didžiojo universitetas", "id": "111950396", "level": "0", "type": "uni", "research": "1", "status": "1", "unit": {"name": "Humanitarinių mokslų fakultetas", "id": "03", "level": "1", "type": "fak", "research": "1", "status": "1", "unit": {"name": "Lituanistikos katedra", "id": "0309", "level": "2", "type": "kat", "research": "1", "status": "1"}}}], "id": "5F66ED51FB9A0B0BA8F6B008ED671F03", "lname": "Rimkutė", "fname": "Erika", "status": "1", "orcid": "0000-0003-0858-8593", "name": "Rimkutė, Erika"}, {"contribution": 0.25, "aip": 1, "country": ["LT"], "rel": "aut", "org": [{"create": true, "contribution": 0.25, "name": "Vytauto Didžiojo universitetas", "id": "111950396", "level": "0", "type": "uni", "research": "1", "status": "1", "unit": {"name": "Humanitarinių mokslų fakultetas", "id": "03", "level": "1", "type": "fak", "research": "1", "status": "1", "unit": {"name": "Kompiuterinės lingvistikos centras", "id": "0315", "level": "2", "type": "cen", "research": "1", "status": "1"}}}], "id": "1F983BCE042DD72AEF2360E29A6BE5F5", "lname": "Bielinskienė", "fname": "Agnė", "status": "1", "orcid": "0000-0002-9209-2605", "name": "Bielinskienė, Agnė"}, {"contribution": 0.25, "aip": 1, "country": ["LT"], "rel": "aut", "org": [{"create": true, "contribution": 0.25, "name": "Vytauto Didžiojo universitetas", "id": "111950396", "level": "0", "type": "uni", "research": "1", "status": "0", "unit": {"name": "Humanitarinių mokslų fakultetas", "id": "03", "level": "1", "type": "fak", "research": "1", "status": "0", "unit": {"name": "Užsienio kalbų, lit. ir vert. s. katedra", "id": "0311", "level": "2", "type": "kat", "research": "1", "status": "0"}}}], "id": "C02D3F15322ADA66070838AE46EC7DA3", "lname": "Boizou", "fname": "Loic", "status": "0", "name": "Boizou, Loic"}, {"contribution": 0.25, "aip": 1, "country": ["LT"], "rel": "aut", "org": [{"create": true, "contribution": 0.25, "name": "Vytauto Didžiojo universitetas", "id": "111950396", "level": "0", "type": "uni", "research": "1", "status": "1", "unit": {"name": "Humanitarinių mokslų fakultetas", "id": "03", "level": "1", "type": "fak", "research": "1", "status": "1", "unit": {"name": "Lituanistikos katedra", "id": "0309", "level": "2", "type": "kat", "research": "1", "status": "1"}}}], "id": "34EF95F72D554FE7365A76C3F2338B19", "lname": "Utka", "fname": "Andrius", "status": "1", "name": "Utka, Andrius"}]}-
local.typeT-
item.fulltextWith Fulltext-
item.grantfulltextopen-
crisitem.author.deptLituanistikos katedra-
crisitem.author.deptLituanistikos katedra-
crisitem.author.deptKompiuterinės lingvistikos centras-
crisitem.author.deptLituanistikos katedra-
Appears in Collections:Universiteto mokslo publikacijos / University Research Publications
Files in This Item:
marc.xml7.1 kBXMLView/Open

MARC21 XML metadata

Show simple item record
Export via OAI-PMH Interface in XML Formats
Export to Other Non-XML Formats

Page view(s)

174
checked on Mar 29, 2020

Download(s)

12
checked on Mar 29, 2020

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.