Za izvlačenje korisnih informacija iz velike količine podataka potrebne su sofisticirane metode pretraživanja podataka. U slučaju sustava odgovaranja na upit potrebne su metode obrade upita, dohvaćanja podataka i odabira prikladnog odgovora. Ovaj rad bavi se izvlačenjem rečenice iz baze znanja koja predstavlja odgovor na pitanje upućeno sustavu. Većina rada posvećena je mjerenju semantičke sličnosti između pitanja i potencijalnog odgovora na hrvatskom jeziku. Implementirano je nekoliko tehnika reprezentiranja rečenica vektorom. Rad zaključuje da je običan TF-IDF vektor rečenice i kosinusna sličnost rečenica i dalje najbolja metoda usporedbe rečenica s obzirom na robusnost metode i lakoću korištenja.For large amounts of textual information t...