Ideja ovoga diplomskoga rada bila je ispitati hipotezu učinkovitijeg izbora komentara s Reddita za predikciju ličnosti. Jedna hipoteza bila je koristiti evaluativni jezik. Autori koriste evaluativni jezik kako bi evaluirali objekte. Budući da literatura ne definira jasno evaluativni jezik i zbog nedostatka istraživanja evaluativnog jezika u području obrade prirodnoga jezika, u radu definiramo evaluativni jezik kao stav autora prema objektu. Na temelju leksikona koji sadrži riječi za izricanje stava filtriramo evaluativne komentare s Reddita. Za filtiranje samoopisa koristimo psihološki upitnik IPIP-NEO. Zatim implementiramo tradicionalne modele strojnog učenja poput stroja potpornih vektora, slučajnih šuma i logističke regresije i dubokih m...