Imputação múltipla em grandes dados identificáveis para pesquisa educacional: um exemplo do sistema brasileiro de avaliação educacional

Maria Eugénia Ferrão Paula Prata Maria Teresa Gonzaga Alves Sobre os autores

Resumo

Quase todos os estudos quantitativos em aferição, avaliação e pesquisa educacional são baseados em conjuntos de dados incompletos, que têm sido um problema há anos sem solução única. O uso de grandes dados identificáveis apresenta novos desafios para lidar com valores ausentes. Na primeira parte deste artigo, apresentamos o estado-da-arte do tópico na literatura científica educacional brasileira e como os pesquisadores têm tratado os dados omissos. Em seguida, usamos o software de acesso livre para analisar dados do mundo real, a Prova Brasil 2017, para várias unidades da federação, e documentamos como pressuposto de dados omissos completamente aleatórios pode afetar os resultados estatísticos, as interpretações e implicações subsequentes para políticas e práticas. Concluímos com sugestões diretas para qualquer pesquisador de educação sobre a aplicação de rotinas R para realizar o teste de hipóteses de dados omissos completamente aleatórios e, se a hipótese nula for rejeitada, como implementar a imputação múltipla, que parece ser um dos métodos mais apropriados para manipular dados ausentes.

Prova Brasil; Dados omissos; R; Imputação múltipla

Fundação CESGRANRIO Rua Santa Alexandrina 1011, Rio Comprido, 20261-235 Rio de Janeiro - RJ - Brasil, Tel.: + 55 21 2103 9600, Fax: + 55 21 2103 9600 r.338, - Rio de Janeiro - RJ - Brazil
E-mail: ensaio@cesgranrio.org.br