Resumo
Este artigo apresenta uma estratégia para extrair o significado de palavras em diferentes contextos, utilizando algoritmos classificadores, como kNN, WiSARD e 1NN, combinados com um modelo de linguagem robusto. O objetivo central é investigar como o termo “arquivo” é empregado em artigos jornalísticos e de que forma essa utilização reflete a valorização do trabalho de arquivistas. Para isso, foram analisados textos publicados no jornal “A Tribuna” entre os anos de 2003 e 2017. O método adotado envolve a classificação automática das frases que contêm o termo “arquivo”, dividindo-as em onze categorias que representam diferentes interpretações desse termo. A pesquisa foi realizada por meio de um algoritmo de classificação, que foi treinado para identificar padrões semânticos nas frases. Trata-se de uma análise de dados textuais extraídos de um acervo digital de um periódico, sem a participação direta de sujeitos humanos. Os resultados apontam que a combinação do modelo de linguagem com a rede neural melhora significativamente o desempenho da classificação, superando métodos tradicionais em métricas como precisão e recall. Além disso, a análise mostrou que o termo “arquivo” é amplamente utilizado em diferentes contextos pelos jornalistas, revelando múltiplos significados e ressaltando a relevância dos arquivistas no processo de organização e registro documental. A abordagem proposta demonstra potencial para ser aplicada em outros domínios, contribuindo para a automação da inferência semântica e a classificação de grandes volumes de dados textuais.
Palavras-chave
Significado contextual; Aprendizado de máquina; Processamento de linguagem natural; Classificação semântica; Análise de texto
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Source: Elaborated by authors (2024).
Source: Elaborated by authors (2024).
Source: Elaborated by authors (2024).
Source: Elaborated by authors (2024).