Straipsnyje pristatome Seimo posėdžių stenogramų tekstyną, parengtą specialiu formatu, tinkančiu įvairiems autorystės nustatymo tyrimams. Tekstyną sudaro apie 111 tūkstančių tekstų (24 milijonai žodžių), kurių kiekvienas atitinka vieną parlamentaro pasisakymą eilinės sesijos posėdžio metu bei apima 7 Lietuvos Respublikos Seimo kadencijas: nuo 1990 metų kovo 10 dienos iki 2013 metų gruodžio 23 dienos. Pasisakymų tekstai sugrupuoti pagal autorius į 147 grupes, todėl tinka individualių autorių autorystės nustatymo tyrimams; jie suskirstyti pagal autorių amžiaus grupes, lytį ar politines pažiūras, todėl tinka autorių profilio sudarymo tyrimams. Trumpas tekstas neatskleidžia jo autoriaus kalbėjimo stiliaus, yra daugiaprasmiškas kitų autorių atžv...
Šiame duomenų rinkinyje kaupiamos Lietuvos Respublikos Seimo debatų stenogramos. Stenogramos parsiun...
Šiame duomenų rinkinyje kaupiamos Lietuvos Respublikos Seimo posėdžių debatų stenogramos. Stenogramo...
This document presents the first edition of the Polish Sejm Corpus – a new specialized resource cont...
Online ISSN 2029-8315Straipsnyje pristatome Seimo posėdžių stenogramų tekstyną, parengtą specialiu f...
In our paper we present a corpus of transcribed Lithuanian parliamentary speeches. The corpus is pre...
This paper reports the first authorship attribution results based on the automatic computational met...
Extraction of demographic, cultural background characteristics or psychometric traits about an autho...
Magistro darbe yra sprendžiamas autorystės nustatymo uždavinys, taikant mašininio mokymo metodus ski...
ISSN (print): 1650-3638This paper reports the first authorship attribution results based on the effe...
This paper presents the ParlaMint corpora containing transcriptions of the sessions of the 17 Europe...
Straipsnyje aptariama kreipimosi raiškos kaita Lietuvos parlamentiniame diskurse 1923, 1990 ir 2013 ...
The corpus consists of recordings from the Chamber of Deputies of the Parliament of the Czech Republ...
This is a repository for the corpus of transcripts of parliamentary debates in the National Council ...
Šiame duomenų rinkinyje kaupiamos Lietuvos Respublikos Seimo debatų stenogramos. Stenogramos parsiun...
Šiame duomenų rinkinyje kaupiamos Lietuvos Respublikos Seimo posėdžių debatų stenogramos. Stenogramo...
This document presents the first edition of the Polish Sejm Corpus – a new specialized resource cont...
Online ISSN 2029-8315Straipsnyje pristatome Seimo posėdžių stenogramų tekstyną, parengtą specialiu f...
In our paper we present a corpus of transcribed Lithuanian parliamentary speeches. The corpus is pre...
This paper reports the first authorship attribution results based on the automatic computational met...
Extraction of demographic, cultural background characteristics or psychometric traits about an autho...
Magistro darbe yra sprendžiamas autorystės nustatymo uždavinys, taikant mašininio mokymo metodus ski...
ISSN (print): 1650-3638This paper reports the first authorship attribution results based on the effe...
This paper presents the ParlaMint corpora containing transcriptions of the sessions of the 17 Europe...
Straipsnyje aptariama kreipimosi raiškos kaita Lietuvos parlamentiniame diskurse 1923, 1990 ir 2013 ...
The corpus consists of recordings from the Chamber of Deputies of the Parliament of the Czech Republ...
This is a repository for the corpus of transcripts of parliamentary debates in the National Council ...
Šiame duomenų rinkinyje kaupiamos Lietuvos Respublikos Seimo debatų stenogramos. Stenogramos parsiun...
Šiame duomenų rinkinyje kaupiamos Lietuvos Respublikos Seimo posėdžių debatų stenogramos. Stenogramo...
This document presents the first edition of the Polish Sejm Corpus – a new specialized resource cont...