Acessibilidade / Reportar erro

Avaliação de critérios para seleção de sintagmas nominais com valor para a recuperação da informação

Evaluation of selection criteria for noun phrases with relevance for information retrieval

Resumo

O presente estudo avalia critérios para seleção de sintagmas nominais mais representativos do conteúdo de documentos jurídicos em língua portuguesa. A metodologia da pesquisa consistiu em revisão de literatura brasileira e experimento. No experimento foram aplicados dez critérios de seleção aos sintagmas nominais extraídos de um conjunto de resumos de teses e dissertações. Os critérios foram avaliados quanto à eficácia na seleção de sintagmas nominais relevantes para a recuperação da informação. Por meio do experimento, foram identificados como mais eficazes os critérios de eliminação de sintagmas nominais considerados stopwords ou contendo pronomes no núcleo, e os critérios de seleção por posição de ocorrência, nível do sintagma nominal, inverso da frequência nos documentos e frequência de ocorrência em um documento.

Palavras-chave
Indexação automática; Informação jurídica; Representação da informação; Seleção de sintagmas nominais; Sintagmas nominais

Pontifícia Universidade Católica de Campinas Núcleo de Editoração SBI - Campus II - Av. John Boyd Dunlop, s/n. - Prédio de Odontologia, Jd. Ipaussurama - 13059-900 - Campinas - SP, Tel.: +55 19 3343-6875 - Campinas - SP - Brazil
E-mail: transinfo@puc-campinas.edu.br