Com a expansão da Internet nos últimos anos, surgem textos na web de diversas fontes, acarretando um aumento na quantidade de idiomas. Ao se deparar com um destes textos, um problema relevante consiste em saber qual é o idioma dele. Este trabalho tem como objetivo abordar o problema da identificação do idioma de textos, como posts de blog e jornais online, entre inglês e português, utilizando técnicas e abordagens provenientes da área de Recuperação de Informação. A detecção de linguagem é uma variação da classificação de textos, e aqui será utilizado o treinamento com aprendizado supervisionado. A detecção de idioma é feita por três esquemas de ponderação diferentes: tf-idf, booleano e tf, além de analisar o melhor desempenho quanto ao uso...
Este artigo pretende apresentar o percurso metodológico seguido na busca de Expressões Idiomáticas d...
This paper describes the development and implementation of a practical and efficient methodology to ...
Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificid...
Com a expansão da Internet nos últimos anos, surgem textos na web de diversas fontes, acarretando um...
Atualmente a web é um ambiente em que pessoas postam e buscam informações sobre os mais diversos tóp...
O trabalho objetiva estabelecer princípios de uma linguagem clara para melhorar a inteligibilidade d...
This paper aims to explain certain language phenomena remarkable for example in the Internet. These ...
For low resource languages, collecting sufficient training data to build acoustic and language model...
Web 2.0 has allowed a never imagined communication boom. With the widespread use of computational an...
ABRAHÃO, Viviane de Moraes. U ok w dis? Analysing language attitudes towards internet english. Revis...
This paper brings some of the results obtained in a research conducted in 2010 which aimed at identi...
In the digital environment, hypertext builds the news. A language is consolidated in the last two de...
The study reports the results of the exploration of a machine-readable corpus of Brazilian Portugues...
Training language model made from conversational speech is difficult due to large variation of the w...
Given that the media exerts influence on texts, this study aimed to analyze the language of news blo...
Este artigo pretende apresentar o percurso metodológico seguido na busca de Expressões Idiomáticas d...
This paper describes the development and implementation of a practical and efficient methodology to ...
Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificid...
Com a expansão da Internet nos últimos anos, surgem textos na web de diversas fontes, acarretando um...
Atualmente a web é um ambiente em que pessoas postam e buscam informações sobre os mais diversos tóp...
O trabalho objetiva estabelecer princípios de uma linguagem clara para melhorar a inteligibilidade d...
This paper aims to explain certain language phenomena remarkable for example in the Internet. These ...
For low resource languages, collecting sufficient training data to build acoustic and language model...
Web 2.0 has allowed a never imagined communication boom. With the widespread use of computational an...
ABRAHÃO, Viviane de Moraes. U ok w dis? Analysing language attitudes towards internet english. Revis...
This paper brings some of the results obtained in a research conducted in 2010 which aimed at identi...
In the digital environment, hypertext builds the news. A language is consolidated in the last two de...
The study reports the results of the exploration of a machine-readable corpus of Brazilian Portugues...
Training language model made from conversational speech is difficult due to large variation of the w...
Given that the media exerts influence on texts, this study aimed to analyze the language of news blo...
Este artigo pretende apresentar o percurso metodológico seguido na busca de Expressões Idiomáticas d...
This paper describes the development and implementation of a practical and efficient methodology to ...
Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificid...