U radu su opisani principi rada s tokovima podataka u stvarnom vremenu. Opisana su osnovna svojstva koja aplikacije koje obrađuju tokove podataka trebaju imati. Kao izvor podataka u stvarnom vremenu odabran je Twitter StreamingAPI te su opisane njegove najbitnije značajke. Zatim su uspoređeni radni okviri Apache Spark i Apache Flink te je napravljen eksperiment kojim se utvrđuje kašnjenje obrade događaja u tim radnim okvirima u ovisnosti o količini generiranih događaja. Na kraju je implementiran sustav koji je u mogućnosti u stvarnom vremenu geografski pratiti objave s društvene mreže Twitter. Implementirani sustav sastoji se od dvije glavne komponente. Jedna vrši obradu u stvarnom vremenu, a druga povijesnu obradu. Na kraju su izrađene geo...