Področje procesiranja naravnega jezika je pomembna in obsežna panoga računalništva, vendar je večina obstoječih orodij razvitih in prilagojenih za obdelavo angleških besedil. Razvili smo orodje za statistično analizo velikih jezikovnih korpusov, ki upošteva značilnosti slovenščine kot močno pregibnega jezika. Današnji besedilni korpusi lahko vsebujejo tudi več milijard besed, zato je bil velik del pozornosti namenjen razvoju učinkovitih paralelnih algoritmov, s katerimi bo moč tako obsežne zbirke v razmeroma kratkem času obdelati tudi na običajnih računalnikih. Z orodjem smo analizirali korpus Gigafida, ki vsebuje 1,2 milijarde besed, na več nivojih: na nivoju besednih nizov, nivoju besed, n-gramov, predpon in končnic ter tudi besedotvorne ...
Slovenian language was analysed many times, but most of this research focuses on the grammatical sid...
Cilj diplomske naloge je prilagoditev sistema Moses za statistično strojno prevajanje iz angleščine ...
Prispevek podaja pregled zanimivih tujih raziskovalnih izsledkov s področja korpusnega prevodoslovja...
Natural language processing is an important area of computational linguistics and artificial intelli...
Natural language processing is an important area of computational linguistics and artificial intelli...
In the paper some interesting data about the distribution of letters, words and sentences from the t...
In the last decade, corpus linguistics has finally established itself as a separate research startin...
In the last decade, corpus linguistics has finally established itself as a separate research startin...
Gigafida 2.0, with about 1.1 billion words, is a reference corpus of written Slovene text published ...
Ovaj diplomski rad daje uvid u problematiku predviđanja niza riječi prilikom obrade prirodnog jezika...
Slovensko besedje so v preteklosti jezikoslovci zbirali in dopolnjevali ter izdali v mnogih splošnih...
Avtor ugotavlja, da sta v 18.stol. obstajala na današnjem slovenskem ozemlju dva knjižna jezika - os...
Sloleks je leksikon besednih oblik, ki v strukturirani bazi podatkov vsebuje slovenske besede in nji...
The availability of large collections of text (language corpora) is crucial for empirically supporte...
Slovenian language was analysed many times, but most of this research focuses on the grammatical sid...
Slovenian language was analysed many times, but most of this research focuses on the grammatical sid...
Cilj diplomske naloge je prilagoditev sistema Moses za statistično strojno prevajanje iz angleščine ...
Prispevek podaja pregled zanimivih tujih raziskovalnih izsledkov s področja korpusnega prevodoslovja...
Natural language processing is an important area of computational linguistics and artificial intelli...
Natural language processing is an important area of computational linguistics and artificial intelli...
In the paper some interesting data about the distribution of letters, words and sentences from the t...
In the last decade, corpus linguistics has finally established itself as a separate research startin...
In the last decade, corpus linguistics has finally established itself as a separate research startin...
Gigafida 2.0, with about 1.1 billion words, is a reference corpus of written Slovene text published ...
Ovaj diplomski rad daje uvid u problematiku predviđanja niza riječi prilikom obrade prirodnog jezika...
Slovensko besedje so v preteklosti jezikoslovci zbirali in dopolnjevali ter izdali v mnogih splošnih...
Avtor ugotavlja, da sta v 18.stol. obstajala na današnjem slovenskem ozemlju dva knjižna jezika - os...
Sloleks je leksikon besednih oblik, ki v strukturirani bazi podatkov vsebuje slovenske besede in nji...
The availability of large collections of text (language corpora) is crucial for empirically supporte...
Slovenian language was analysed many times, but most of this research focuses on the grammatical sid...
Slovenian language was analysed many times, but most of this research focuses on the grammatical sid...
Cilj diplomske naloge je prilagoditev sistema Moses za statistično strojno prevajanje iz angleščine ...
Prispevek podaja pregled zanimivih tujih raziskovalnih izsledkov s področja korpusnega prevodoslovja...