SciELO - Scientific Electronic Library Online

 
vol.24 issue4Interaction of the local wind within a valley with the large-scale flow - analysis of two case studiesComparison of precipitation products for South America author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

Share


Revista Brasileira de Meteorologia

Print version ISSN 0102-7786

Abstract

SALVADOR, Henrique Gonçalves; CUNHA, Adilson Marques Da  and  CORREA, Cleber Souza. Vedalogic: um método de Verificação de Dados Climatológicos Apoiado em Modelos Minerados. Rev. bras. meteorol. [online]. 2009, vol.24, n.4, pp.448-460. ISSN 0102-7786.  http://dx.doi.org/10.1590/S0102-77862009000400007.

Neste artigo, apresenta-se um Método de Verificação de Dados Climatológicos Apoiado em Modelos Minerados - VEDALOGIC para o Instituto de Controle do Espaço Aéreo Brasileiro (ICEA). O VEDALOGIC consiste de uma verificação de dados, utilizando-se de modelos criados com algoritmos de Mineração de Dados. O Método utiliza modelos de clustering, gerados a partir de uma série histórica, que propiciam a identificação de grupos homogêneos em uma Base de Dados Climatológicos (BDC). A partir desses modelos, torna-se possível a detecção de inconformidades nos dados, denominadas pontos estranhos (outliers). Após a detecção de um outlier, este é classificado/predito, de acordo com o modelo de árvore de decisão, gerado também a partir de uma série histórica. O valor encontrado com base na árvore de decisão é adotado como sugestão para a correção do outlier, contribuindo com a consistência dos dados no BDC. Neste artigo, utilizam-se os seguintes algoritmos: Expectation-Maximization (EM) e K-means para clustering; e REPTree e M5P para classificação/predição. Para a verificação da eficiência do VEDALOGIC, inseriram-se, artificialmente, dados ruidosos em um conjunto de dados, os quais foram todos detectados pelo VEDALOGIC, que sugeriu valores para correção com uma precisão média superior a 98%.

Keywords : Mineração de Dados; Banco de Dados Climatológicos; Clustering; Verificação de Dados.

        · abstract in English     · text in Portuguese     · Portuguese ( pdf epdf )

 

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License