Resumo
Ao publicar um artigo em conjunto com outros autores, inicialmente deve-se formar vínculos pela colaboração entre eles, o que pode ser caracterizado como uma rede de colaboração científica. Nesse contexto, os trabalhos representam as arestas e os autores representam os nós, formando uma rede. Nesse momento surge a seguinte dúvida: Como a evolução da rede ocorre ao longo do tempo? Para responder a essa pergunta, é necessário entender quais fatores são essenciais para a criação de uma nova conexão. O objetivo deste artigo é prever conexões em redes de coautoria formadas por doutores com currículos registrados na Plataforma Lattes nas áreas de Ciências da Informação e Biologia. Para tanto, as seguintes etapas são executadas: inicialmente os dados são extraídos e organizados. Essa etapa é fundamental para a continuidade do processo. Em seguida, as redes de coautoria são geradas tomando como base artigos publicados em conjunto. Posteriormente, os atributos a serem utilizados são definidos e as métricas são calculadas. Por fim, algoritmos de aprendizado de máquinas são utilizados para estimar futuras colaborações científicas nas áreas selecionadas. Atualmente, a Plataforma Lattes possui 6,6 milhões de currículos de pesquisadores e representa um dos repositórios científicos mais relevantes e reconhecidos em todo o mundo. Como resultado, os algoritmos “florestas aleatórias” e “regressão logística” apresentaram as maiores taxas de acerto, e o atributo “atração preferencial” foi identificado como mais influente no surgimento de novas colaborações científicas. Através dos resultados, é possível estabelecer a evolução da rede de colaborações científicas de pesquisadores em nível nacional, auxiliando as agências de desenvolvimento na seleção de futuros pesquisadores destacados.
Palavras-chave
Redes de coautoria; Plataforma Lattes; Repositórios de dados científicos