La recent popularització d'un paradigma més centrat en les dades en l'àmbit de aprenentatge automàtic ha fet que l'estudi de la qualitat de les representacions de les variables s'hagi convertit en un tema molt rellevant. En aquest treball, es realitza una exploració de diferent tipus de formes per representar text en variables aplicades a un problema de Processat del Llenguatge Natural, on s'avalua la seva eficàcia. El mètode proposat consisteix en analitzar diversos factors que poden afectar a la qualitat de les representacions del text en variables i avaluar si són rellevant o no. S'estudien principalment dues formes de representació: model Bag of Words i els word embeddings.The recent popularization of a more data-centric paradigm in mac...