Al generarse cada día una gran cantidad de datos, surge la necesidad de contar con herramientas capaces de analizar ese gran cúmulo de información. Al no encontrar un manual que mostrara la forma de implementar un ambiente Big Data, el cual resulta una buena opción para el análisis de datos de gran tamaño, se realizó este proyecto. El objetivo principal del proyecto fue realizar una guía para la implementación de un algoritmo de clustering con Apache Spark utilizando el lenguaje Scala en un entorno Big Data y tomando como caso de estudio K-means. Primeramente, se instaló Hadoop junto a una versión compatible de Apache Spark. Para comprobar que las herramientas funcionaban de manera adecuada, se hicieron pequeñas pruebas que demostraron qu...
El enfoque tradicional (crsip) de la clasificación de datos por medio de particiones usando técnicas...
El objetivo principal de este proyecto es la implementación sobre Spark de una herramienta para anál...
MapReduce + Hadoop es un modelo de programación que es utilizado por disímiles empresas que se dedic...
Al generarse cada día una gran cantidad de datos, surge la necesidad de contar con herramientas capa...
[ES] En este TFG describiremos el concepto de big data y las arquitectura y componentes de las herr...
En vista de la problemática que existe hoy en día respecto los grandes cúmulos de datos que se gener...
Resumen: El campo de la computación distribuida ha tenido una gran influencia sobre los sistemas ac...
El Big Data es una gran compilación de datos en medio electromagnético que permite que exista un gra...
El Big Data es una gran compilación de datos en medio electromagnético que permite que exista un gra...
Actualment vivim en l’era de a informació, en un món on cada dia es generen milers i milers de dades...
En este proyecto se estudian diferentes técnicas de clustering para el manejo de datos con un grado ...
Actualment, a la nostra societat i en tot el món, es generen grans volums de dades cada dia. L'emmag...
Actualment vivim en l’era de a informació, en un món on cada dia es generen milers i milers de dade...
El enfoque tradicional (crsip) de la clasificación de datos por medio de particiones usando técnicas...
Actualment vivim en l’era de a informació, en un món on cada dia es generen milers i milers de dade...
El enfoque tradicional (crsip) de la clasificación de datos por medio de particiones usando técnicas...
El objetivo principal de este proyecto es la implementación sobre Spark de una herramienta para anál...
MapReduce + Hadoop es un modelo de programación que es utilizado por disímiles empresas que se dedic...
Al generarse cada día una gran cantidad de datos, surge la necesidad de contar con herramientas capa...
[ES] En este TFG describiremos el concepto de big data y las arquitectura y componentes de las herr...
En vista de la problemática que existe hoy en día respecto los grandes cúmulos de datos que se gener...
Resumen: El campo de la computación distribuida ha tenido una gran influencia sobre los sistemas ac...
El Big Data es una gran compilación de datos en medio electromagnético que permite que exista un gra...
El Big Data es una gran compilación de datos en medio electromagnético que permite que exista un gra...
Actualment vivim en l’era de a informació, en un món on cada dia es generen milers i milers de dades...
En este proyecto se estudian diferentes técnicas de clustering para el manejo de datos con un grado ...
Actualment, a la nostra societat i en tot el món, es generen grans volums de dades cada dia. L'emmag...
Actualment vivim en l’era de a informació, en un món on cada dia es generen milers i milers de dade...
El enfoque tradicional (crsip) de la clasificación de datos por medio de particiones usando técnicas...
Actualment vivim en l’era de a informació, en un món on cada dia es generen milers i milers de dade...
El enfoque tradicional (crsip) de la clasificación de datos por medio de particiones usando técnicas...
El objetivo principal de este proyecto es la implementación sobre Spark de una herramienta para anál...
MapReduce + Hadoop es un modelo de programación que es utilizado por disímiles empresas que se dedic...