SciELO - Scientific Electronic Library Online

 
vol.40 issue1Disciplinary integration in information science: unsaid things about this familiar strangerOrganizational proposal of a file of administration for managerial organizations author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Ciência da Informação

Print version ISSN 0100-1965

Abstract

GOMES, Georgia Regina Rodrigues  and  MORAES FILHO, Rubens de Oliveira. CADWeb: categorização automática de documentos digitais. Ci. Inf. [online]. 2011, vol.40, n.1, pp. 68-76. ISSN 0100-1965.  http://dx.doi.org/10.1590/S0100-19652011000100005.

Com a evolução da tecnologia da informação e a disseminação de documentos digitais na Web, faz-se necessário criar meios que forneçam um mecanismo de organização de tais documentos, facilitando sua busca e recuperação. Em bibliotecas digitais ou repositórios de obras eletrônicas, por exemplo, existe a necessidade de uma ferramenta que possa classificar automaticamente os documentos, visto que o processo de classificação (categorização) é feito de forma manual. Esta ferramenta será de grande importância no apoio à catalogação. Este artigo apresenta o desenvolvimento de uma ferramenta que tem como objetivo principal classificar automaticamente documentos digitais em categorias preestabelecidas, nas quais cada documento pertencerá a uma ou mais categorias de acordo com seu conteúdo, tornando assim mais eficaz e rápida a classificação. Na elaboração da ferramenta foram utilizadas técnicas e algoritmos de mineração de textos, sendo definidas no estudo de caso algumas categorias e termos relacionados, tais como informática, direito e física, para validar a ferramenta.

Keywords : Tecnologia da informação; Categorização; Biblioteca digital; Mineração de texto; Documentos digitais.

        · abstract in English     · text in Portuguese     · pdf in Portuguese