Cilj rada je klasifikacija tekstualnih dokumenata pomoću algoritma stroja potpornih vektora i n-gramskog rječnika. Prvo smo definirali pojmove iz linearne algebre i optimizacije koji su potrebni za razumijevanje obrađenih tema u radu. Objašnjen je pojam klasifikacije teksta te pristupi: “Bag of words” i “Bag of n-grams”. Također je opisana matematička pozadina algoritma stroja potpornih vektora te njegova implementacija u programskom jeziku Python. Za analizu smo koristili dvije kolekcije tekstualnih dokumenata, pri čemu smo trening i test skup podijelili u omjeru 50 : 50. Nakon što smo napravili rječnik n-grama, proveli smo testiranje te smo usporedili rezultate klasifikacije za navedene pristupe.The aim of this work is to classify text do...