O objetivo geral desta pesquisa é analisar técnicas para aumentar a acurácia de classificadores construídos a partir de bases de dados desbalanceadas. Uma base de dados é desbalanceada quando possui muito mais casos de uma classe do que das outras, portanto possui classes raras. O desbalanceamento também pode ser em uma mesma classe se a distribuição dos valores dos atributos for muito assimétrica, levando à ocorrência de casos raros. Algoritmos classificadores são muito sensíveis a estes tipos de desbalanceamentos e tendem a valorizar as classes (ou casos) predominantes e a ignorar as classes (ou casos) de menor freqüência. Modelos gerados para bases de dados com classes raras apresentam baixa acurácia para estas classes, o que é problemát...
Algoritmos de aprendizado de máquina são frequentemente os mais indicados em uma grande variedade de...
Dissertação de Mestrado em Engenharia e Ciência de Dados apresentada à Faculdade de Ciências e Tecno...
Uma tarefa crucial em detecção de anomalias é a seleção de atributos. Entretanto, o alto desbalancea...
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciênc...
A maioria das ferramentas de classificação assume que a distribuição dos dados seja balanceada ou co...
Em tarefas de classificação de dados, existem limitações que podem prejudicar o desempenho de alguns...
In this work we propose the development of an approach capable of improving the results obtained by...
Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaA ...
Resumo: A classificação tem o objetivo de rotular eventos e objetos de acordo com classes preestabel...
Classificadores têm sido largamente aplicados nos mais diversos campos científicos e industriais, em...
Em muitos problemas práticos de classificação, o conjunto de dados a ser utilizado para a indução do...
Machine learning classification algorithms tend to perform poorly in datasets with class imbalance. ...
A detecção de novidades é um problema com um grande número de aplicações. Em algumas aplicações, o f...
Os recentes avanços da ciência e tecnologia viabilizaram o crescimento de dados em quantidade e disp...
Abstract. There is an increasing interest in application of evolutionary algo-rithms to induce class...
Algoritmos de aprendizado de máquina são frequentemente os mais indicados em uma grande variedade de...
Dissertação de Mestrado em Engenharia e Ciência de Dados apresentada à Faculdade de Ciências e Tecno...
Uma tarefa crucial em detecção de anomalias é a seleção de atributos. Entretanto, o alto desbalancea...
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciênc...
A maioria das ferramentas de classificação assume que a distribuição dos dados seja balanceada ou co...
Em tarefas de classificação de dados, existem limitações que podem prejudicar o desempenho de alguns...
In this work we propose the development of an approach capable of improving the results obtained by...
Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaA ...
Resumo: A classificação tem o objetivo de rotular eventos e objetos de acordo com classes preestabel...
Classificadores têm sido largamente aplicados nos mais diversos campos científicos e industriais, em...
Em muitos problemas práticos de classificação, o conjunto de dados a ser utilizado para a indução do...
Machine learning classification algorithms tend to perform poorly in datasets with class imbalance. ...
A detecção de novidades é um problema com um grande número de aplicações. Em algumas aplicações, o f...
Os recentes avanços da ciência e tecnologia viabilizaram o crescimento de dados em quantidade e disp...
Abstract. There is an increasing interest in application of evolutionary algo-rithms to induce class...
Algoritmos de aprendizado de máquina são frequentemente os mais indicados em uma grande variedade de...
Dissertação de Mestrado em Engenharia e Ciência de Dados apresentada à Faculdade de Ciências e Tecno...
Uma tarefa crucial em detecção de anomalias é a seleção de atributos. Entretanto, o alto desbalancea...