Acessibilidade / Reportar erro

pyHDB - ferramenta heurística para a Hemeroteca Digital Brasileira: utilizando técnicas de web scraping para a pesquisa em história

pyHDB - heuristic tool for the Brazilian Newspaper Digital Library: using web scraping technics for Historical research

Resumo:

Este artigo tem como objetivo analisar a relação entre ferramentas e interfaces de busca em repositórios de fontes digitais e a construção do conhecimento histórico na era digital. Para tanto, é analisada a pyHDB: ferramenta heurística para a Hemeroteca Digital Brasileira da Biblioteca Nacional, caracterizando-se seus aspectos técnicos, metodológicos e heurísticos. Tal ferramenta é um programa de computador escrito com a linguagem de programação Python e que utiliza técnicas de web scraping. Foi criada com o objetivo de auxiliar pesquisadores no processo de construção e registro metodológico, gerando relatórios e fornecendo dados tabulares e data sets a partir dos parâmetros de busca definidos. Primeiramente, são analisados de forma crítica os resultados produzidos pela interface gráfica da Hemeroteca Digital Brasileira. Em seguida, a pyHDB é apresentada detalhadamente, tanto em seus aspectos éticos e técnicos quanto em termos de possibilidades analíticas, por meio de três exemplos de busca. Por fim, nas considerações finais, discorre-se acerca das vantagens do desenvolvimento e uso de ferramentas metodológicas digitais para a pesquisa histórica.

Palavras-chave:
Metodologia da história; Heurística; História Digital

Sociedade Brasileira de Teoria e História da Historiografia (SBTHH) Rua do Seminário, s/n, Centro. , CEP: 35420-000, Tel: +55 (31) 3557 9423 - Mariana - MG - Brazil
E-mail: sbthh@yahoo.com.br