Obrada velikih podataka zahtijeva korištenje posebnih platformi koje omogućavaju paraleliziranu i raspodijeljenu obradu velikih podataka. Spark je danas jedna od vodećih platformi za velike podatke. R je vodeći programski jezik za statistiku i eksploratornu analizu podataka uz ograničenje da tradicionalno radi s podacima koji su učitani u radnu memoriju. R i Spark se mogu integrirati u moćan radni okvir za analizu velikih podataka i izradu prediktivnih modela uz pomoć paketa sparklyr. Osnovna ideja korištenja R-a kao sučelja prema Sparku je da se sva računanja obavljaju u Spark grozdu, dok R prima rezultate od Sparka.Processing big data requires specialized platforms for parallel and distributed computing. Spark is today one of the most imp...