Teksto skaidymo įvairaus tipo segmentais metodai yra plačiai naudojami teksto apdorojimui. Segmentuojant naudojami tiek statistiniai, tiek formalieji metodai. Disertacijoje pristatomas naujas segmentavimo tipas ir metodas - segmentavimas pastoviaisiais junginiais - ir pateikiami taikymai įvairiose teksto apdorojimo srityse. Taikant pastoviųjų junginių segmentavimą leksikografijoje atskleidžiama, kaip objektyviai ir greitai galima analizuoti labai didelius tekstų archyvus aptinkant vartojamą terminiją ir šių automatiškai identifikuotų terminų svarbumą ir kaitą laiko tėkmėje. Ši analizė leidžia greitai nustatyti svarbius metodologinius pokyčius mokslinių tyrimų istorijoje ir nustatyti pastarojo meto aktualias tyrimų sritis. Tekstų klasifika...
The paper overviews the process of compilation of the first corpus-based Dictionary of Lithuanian Ph...
The aim of the research presented here is to report on a corpus-based method for discourse analysis ...
Väitekiri kuulub statistilise masintõlke valdkonda ja käsitleb selle ühte komponenti - tõlkemudelite...
Este artículo evalúa un nuevo método de segmentación en un sistema de traducción automática estadíst...
Darbo tyrimo objektas – kolokacijos ir jų tyrimo metodai. Pagrindinis darbo tikslas – išanalizuoti s...
Šis darbs ir izstrādāts par tēmu Teksta attēla segmentācija, kas ir pirmais posms dažādu teksta gaba...
This report evaluates the impact of using a novel collocation segmentation method for phrase extract...
This paper describes the 2010 phrase-based statistical machine translation system developed at the T...
This study evaluates the impact of integrating two different collocation segmentations methods in a ...
Monografija priklauso tarpdisciplininei tekstynų ir kompiuterinės lingvistikos sričiai, skirta dažna...
Tyrimo objektas - neįprastos kolokacijos grožinės literatūros kūriniuose. Tyrimo tikslas – išsiaiški...
L’objectif des études théoriques et expérimentales présentées dans ce travail était de cerner à l’ai...
Pirmasis automatizuoto garsynų anotavimo etapas – suformuoti pradinę garso signalo segmentavimo tašk...
In this paper we present an algorithm that detects, recognizes and annotates sentence boundaries and...
Bakalaura darbs ir uzrakstīts latviešu valodā uz 51 lappuses. Tas satur 25 attēlus, 2 tabulas, 28 at...
The paper overviews the process of compilation of the first corpus-based Dictionary of Lithuanian Ph...
The aim of the research presented here is to report on a corpus-based method for discourse analysis ...
Väitekiri kuulub statistilise masintõlke valdkonda ja käsitleb selle ühte komponenti - tõlkemudelite...
Este artículo evalúa un nuevo método de segmentación en un sistema de traducción automática estadíst...
Darbo tyrimo objektas – kolokacijos ir jų tyrimo metodai. Pagrindinis darbo tikslas – išanalizuoti s...
Šis darbs ir izstrādāts par tēmu Teksta attēla segmentācija, kas ir pirmais posms dažādu teksta gaba...
This report evaluates the impact of using a novel collocation segmentation method for phrase extract...
This paper describes the 2010 phrase-based statistical machine translation system developed at the T...
This study evaluates the impact of integrating two different collocation segmentations methods in a ...
Monografija priklauso tarpdisciplininei tekstynų ir kompiuterinės lingvistikos sričiai, skirta dažna...
Tyrimo objektas - neįprastos kolokacijos grožinės literatūros kūriniuose. Tyrimo tikslas – išsiaiški...
L’objectif des études théoriques et expérimentales présentées dans ce travail était de cerner à l’ai...
Pirmasis automatizuoto garsynų anotavimo etapas – suformuoti pradinę garso signalo segmentavimo tašk...
In this paper we present an algorithm that detects, recognizes and annotates sentence boundaries and...
Bakalaura darbs ir uzrakstīts latviešu valodā uz 51 lappuses. Tas satur 25 attēlus, 2 tabulas, 28 at...
The paper overviews the process of compilation of the first corpus-based Dictionary of Lithuanian Ph...
The aim of the research presented here is to report on a corpus-based method for discourse analysis ...
Väitekiri kuulub statistilise masintõlke valdkonda ja käsitleb selle ühte komponenti - tõlkemudelite...