Acessibilidade / Reportar erro

Métodos de aprendizado de máquina para dados de imputação hidrológica: análise da qualidade de ajuste do modelo em sistemas hidrográficos do Pacífico - Equador

Resumo

Métodos computacionais baseados em aprendizado de máquina tiveram amplo desenvolvimento e aplicação em hidrologia, especialmente para modelagem de sistemas que não possuem dados suficientes. Dentro deste problema faltam séries de dados que não devem ser necessariamente descartadas. Isso é feito por meio da imputação das mesmas obtendo-se conjuntos completos. Por este motivo, esta pesquisa propõe uma comparação de técnicas de aprendizagem computacional para identificar aquelas mais adequadas aos sistemas hidrográficos do Pacífico do Equador pelo interesse representado pelo estudo destes sistemas por complementaridade hidrológica. Para a elaboração desta investigação foram utilizados os registros hidrometeorológicos das estações de monitoramento localizadas nas bacias dos rios Esmeraldas, Cañar e Jubones durante 22 anos, compreendidos entre 1990 e 2012. As variáveis imputadas foram precipitação e vazão. Foram utilizadas máquinas de aprendizagem automática do módulo Python Scikit_Learn; esses módulos integram uma ampla gama de algoritmos de aprendizagem automatizados, como Linear Regression e Random Forest. Finalmente, foram obtidos resultados que levaram a um erro quadrático médio útil mínimo para Random Forest como um método de imputação de aprendizado de máquina automático que melhor se ajusta aos sistemas e dados analisados.

Palavras-chave:
aprendizado de máquina; imputação de dados; sistemas hidrográficos

Instituto de Pesquisas Ambientais em Bacias Hidrográficas Instituto de Pesquisas Ambientais em Bacias Hidrográficas (IPABHi), Estrada Mun. Dr. José Luis Cembranelli, 5000, Taubaté, SP, Brasil, CEP 12081-010 - Taubaté - SP - Brazil
E-mail: ambi.agua@gmail.com