En este trabajo hemos afrontado la tarea de similitud de textos multilingüe mediante representaciones vectoriales de las palabras. Hemos experimentado con varias colecciones de textos con pares de frases en español e inglés, adaptando dos técnicas basadas en word embeddings que han mostrado su eficacia en la similitud de textos monolingüe: la agregación de vectores y el alineamiento. La agregación permite construir una representación vectorial de un texto a partir de los vectores de las palabras que lo componen, y el algoritmo de alineamiento aprovecha los word embeddigs para decidir el emparejamiento de palabras de los dos textos a comparar. En el proceso se han utilizado dos estrategias distintas: usar traductores automáticos para poder a...
Cross-lingual embeddings are vector space representations where word translations tend to be co-loca...
En este artículo se presenta un sistema para asistir en el etiquetado de entidades con nombre y pal...
[EN] This paper presents a proposal for extracting parallel corpora from Wikipedia on the basis of s...
En este trabajo hemos afrontado la tarea de similitud de textos multilingüe mediante representacione...
En este trabajo mostramos cómo una representación vectorial de palabras basada en word embeddings pu...
En este trabajo mostramos cómo una representación vectorial de palabras basada en word embeddings pu...
Cross-lingual word embeddings aim to bridge the gap between high-resource and low-resource languages...
Word embeddings are word representations in the form of vectors that allow to maintain certain seman...
Word embeddings have become a standard resource in the toolset of any Natural Language Processing p...
Cross-lingual word embeddings are becoming increasingly important in multilingual NLP. Recently, i...
Cross-lingual word embeddings are becoming increasingly important in multilingual NLP. Recently, i...
Cross-lingual embeddings are vector space representations where word translations tend to be co-loca...
En este artículo se describe un método nuevo y sencillo para utilizar fuentes de información bilingü...
One of the notable developments in current natural language processing is the practical efficacy of ...
To work with textual data, machine learning algorithms, in particular, neural networks, require word...
Cross-lingual embeddings are vector space representations where word translations tend to be co-loca...
En este artículo se presenta un sistema para asistir en el etiquetado de entidades con nombre y pal...
[EN] This paper presents a proposal for extracting parallel corpora from Wikipedia on the basis of s...
En este trabajo hemos afrontado la tarea de similitud de textos multilingüe mediante representacione...
En este trabajo mostramos cómo una representación vectorial de palabras basada en word embeddings pu...
En este trabajo mostramos cómo una representación vectorial de palabras basada en word embeddings pu...
Cross-lingual word embeddings aim to bridge the gap between high-resource and low-resource languages...
Word embeddings are word representations in the form of vectors that allow to maintain certain seman...
Word embeddings have become a standard resource in the toolset of any Natural Language Processing p...
Cross-lingual word embeddings are becoming increasingly important in multilingual NLP. Recently, i...
Cross-lingual word embeddings are becoming increasingly important in multilingual NLP. Recently, i...
Cross-lingual embeddings are vector space representations where word translations tend to be co-loca...
En este artículo se describe un método nuevo y sencillo para utilizar fuentes de información bilingü...
One of the notable developments in current natural language processing is the practical efficacy of ...
To work with textual data, machine learning algorithms, in particular, neural networks, require word...
Cross-lingual embeddings are vector space representations where word translations tend to be co-loca...
En este artículo se presenta un sistema para asistir en el etiquetado de entidades con nombre y pal...
[EN] This paper presents a proposal for extracting parallel corpora from Wikipedia on the basis of s...