V vsakdanjem življenju se v večini primerov srečujemo z nestrukturiranimi podatki v obliki besedil iz različnih virov. Število teh iz dneva v dan narašča, zato obstaja vse večja potreba po njihovi organizaciji in kategorizaciji. Pri teh podatkih je najpomembnejša njihova predpriprava na uporabo v algoritmih strojnega učenja. Za ustrezno pripravo besedila lahko uporabimo različne metode/tehnike predprocesiranja – besedilo pretvorimo v male črke, iz njega odstranimo stop-besede, nad posameznimi besedami uporabimo krnjenje, lematizacijo, besede sestavljamo v fraze različnih dolžin (uni-grame, bi-grame, tri-grame) ali pa jih na primer pretvorimo v vektorsko obliko (ang. word embedding). S pomočjo laboratorijskega eksperimenta smo ugotovili, da ...
Veliki faktor kvalitete algoritama strojnog učenja su podaci. Njihova količina i kvaliteta su često ...
V svetu vseprisotnega računalništva se s kopičenjem naprav ter množično uporabo družbenih omrežij, e...
Text classification (TC) is the task of automatically assigning documents to a fixed number of categ...
S pojavom novih kanala i tehnologija poput društvenih mreža, mobilnog računarstva i internetskog ogl...
U današnje vrijeme na raspolaganju je velika količina podataka a većina se nalazi u nestrukturirano...
U ovom radu analizirana je uspješnost nekoliko klasifikacijskih algoritama strojnog učenja u ovisnos...
V diplomski nalogi sta predstavljena algoritma za gradnjo podatkovnih struktur, ki hranita dolga bes...
The diploma thesis focuses on unstructured textual data preprocessing in relation to text mining. A ...
Pretraživanje informacija i klasifikacija teksta dvije su discipline unutar dubinske analize teksta ...
Pogosto uporabniki interneta dobijo rezultat iskanja, ki vsebuje širok spekter dokumentov, a le neka...
Danas, servisi e-Uprave u različitim oblastima koriste question answer sisteme koncepta u pokušaju d...
Gručenje je uporabna tehnika strojnega učenja. Velika količina podatkov, ki so na voljo odpira mnogo...
Práce se zabývá zefektivněním procesu vytěžování znalostí z dat. Zaměřuje se na optimalizaci pořadí ...
Zbog postojanja vrlo velike količine tekstualnih dokumenata potrebno ih je, radi brže, jeftinije i l...
Informacijski sustav je integrirana i koordinira mreža komponenti koje se kombiniraju kako bi pretvo...
Veliki faktor kvalitete algoritama strojnog učenja su podaci. Njihova količina i kvaliteta su često ...
V svetu vseprisotnega računalništva se s kopičenjem naprav ter množično uporabo družbenih omrežij, e...
Text classification (TC) is the task of automatically assigning documents to a fixed number of categ...
S pojavom novih kanala i tehnologija poput društvenih mreža, mobilnog računarstva i internetskog ogl...
U današnje vrijeme na raspolaganju je velika količina podataka a većina se nalazi u nestrukturirano...
U ovom radu analizirana je uspješnost nekoliko klasifikacijskih algoritama strojnog učenja u ovisnos...
V diplomski nalogi sta predstavljena algoritma za gradnjo podatkovnih struktur, ki hranita dolga bes...
The diploma thesis focuses on unstructured textual data preprocessing in relation to text mining. A ...
Pretraživanje informacija i klasifikacija teksta dvije su discipline unutar dubinske analize teksta ...
Pogosto uporabniki interneta dobijo rezultat iskanja, ki vsebuje širok spekter dokumentov, a le neka...
Danas, servisi e-Uprave u različitim oblastima koriste question answer sisteme koncepta u pokušaju d...
Gručenje je uporabna tehnika strojnega učenja. Velika količina podatkov, ki so na voljo odpira mnogo...
Práce se zabývá zefektivněním procesu vytěžování znalostí z dat. Zaměřuje se na optimalizaci pořadí ...
Zbog postojanja vrlo velike količine tekstualnih dokumenata potrebno ih je, radi brže, jeftinije i l...
Informacijski sustav je integrirana i koordinira mreža komponenti koje se kombiniraju kako bi pretvo...
Veliki faktor kvalitete algoritama strojnog učenja su podaci. Njihova količina i kvaliteta su često ...
V svetu vseprisotnega računalništva se s kopičenjem naprav ter množično uporabo družbenih omrežij, e...
Text classification (TC) is the task of automatically assigning documents to a fixed number of categ...