Acessibilidade / Reportar erro

O desempenho terminológico dos descritores em Ciência da Informação do Vocabulário Controlado do SIBi/USP nos processos de indexação manual, automática e semi-automática

Terminological performance of information science descriptors of the SIBI/USP Controlled Vocabulary in manual, automatic and semi-automatic indexing processes

Resumos

Avaliou-se o desempenho terminológico, nos processos de indexação manual, automática e semi-automática, dos descritores, do Vocabulário Controlado do SIBi/USP, que representam o domínio da Ciência da Informação. Concluiu-se que os atuais descritores em Ciência da Informação do Vocabulário Controlado do SIBi/USP para representar adequadamente o conteúdo do corpus indexado devem ser ampliados e contextualizados através de definições terminológicas, de maneira a atender as necessidades de informação de seus usuários.

Indexação; Indexação automática; Indexação semi-automática; Terminologia; Vocabulário controlado


The terminological performance of the descriptors representing the Information Science domain in the SIBI/USP Controlled Vocabulary was evaluated in manual, automatic and semi-automatic indexing processes. It can be concluded that, in order to have a better performance (i.e., to adequately represent the content of the corpus), current Information Science descriptors of the SIBi/USP Controlled Vocabulary must be extended and put into context by means of terminological definitions so that information needs of users are fulfilled.

Indexing; Automatic indexing; semi-automatic indexing; Terminology; Controlled vocabulary


ARTIGOS

O desempenho terminológico dos descritores em Ciência da Informação do Vocabulário Controlado do SIBi/USP nos processos de indexação manual, automática e semi-automática

Terminological performance of information science descriptors of the SIBI/USP Controlled Vocabulary in manual, automatic and semi-automatic indexing processes

Vania Mara Alves LimaI; Vera Regina Casari BoccatoII

IProfessora Doutora do Departamento de Biblioteconomia e Documentação da Escola de Comunicações e Artes da Universidade de São Paulo- DBD/ECA-USP

IIProfessora Assistente do Departamento de Ciência da Informação do Centro de Educação e Ciências Humanas da Universidade Federal de São Carlos - DCI/CECH-UFSCar e Doutoranda do Programa de Pós-graduação em Ciência da Informação da UNESP - Campus de Marília

RESUMO

Avaliou-se o desempenho terminológico, nos processos de indexação manual, automática e semi-automática, dos descritores, do Vocabulário Controlado do SIBi/USP, que representam o domínio da Ciência da Informação. Concluiu-se que os atuais descritores em Ciência da Informação do Vocabulário Controlado do SIBi/USP para representar adequadamente o conteúdo do corpus indexado devem ser ampliados e contextualizados através de definições terminológicas, de maneira a atender as necessidades de informação de seus usuários.

Palavras-chave: Indexação; Indexação automática; Indexação semi-automática; Terminologia; Vocabulário controlado.

ABSTRACT

The terminological performance of the descriptors representing the Information Science domain in the SIBI/USP Controlled Vocabulary was evaluated in manual, automatic and semi-automatic indexing processes. It can be concluded that, in order to have a better performance (i.e., to adequately represent the content of the corpus), current Information Science descriptors of the SIBi/USP Controlled Vocabulary must be extended and put into context by means of terminological definitions so that information needs of users are fulfilled.

Keywords: Indexing; Automatic indexing; semi-automatic indexing; Terminology; Controlled vocabulary.

1 Introdução

As Tecnologias de Informação e Comunicação (TICs) contribuem para o desenvolvimento de processos e instrumentos aplicados ao tratamento da informação documentária.

No âmbito do tratamento temático da informação, a utilização dessas tecnologias possibilita o desenvolvimento de softwares para a construção, manutenção e gerenciamento de linguagens documentárias, bem como a automação da atividade de indexação, visando à otimização dos procedimentos e dos recursos aplicados na representação e recuperação da informação.

Nesse sentido, estudos sobre a temática indexação automática e semi-automática são desenvolvidos com o intuito de agilizar a indexação de fontes de informação, dentro de um cenário em que os usuários se apresentam cada vez mais exigentes na recuperação da informação condizente com suas necessidades de busca.

Associadas a essa realidade, as linguagens documentárias construídas de acordo com os princípios e métodos estabelecidos pela terminologia propiciam a compatibilidade entre a linguagem do usuário e a utilizada pelo sistema de recuperação da informação.

Dessa forma, este estudo tem por objetivo avaliar o desempenho terminológico, nos processos de indexação manual, automática e semi-automática, dos descritores do Vocabulário Controlado do Sistema Integrado de Bibliotecas da Universidade de São Paulo (SIBi/USP), que representam o domínio da Ciência da Informação, constituído nesse instrumento pelas áreas da Biblioteconomia e Documentação, Arquivística e Museologia.

O Vocabulário Controlado do SIBi/USP é uma linguagem documentária construída, a partir de procedimentos terminológicos e documentários, pelos bibliotecários do SIBi/USP, com a participação de especialistas de todas as áreas do conhecimento abrangidas pelos seus descritores. Essa linguagem documentária permite a representação e a recuperação dos conteúdos documentários presentes nos acervos das 42 bibliotecas que compõem o SIBI/USP.

Essa avaliação compara e analisa os resultados obtidos quando da indexação manual, automática e semi-automática dos resumos das teses e dissertações defendidas no período de janeiro de 2002 a dezembro de 2007 no Programa de Pós-Graduação em Ciência da Informação da Escola de Comunicações e Artes da Universidade de São Paulo (ECA/USP).

Na indexação automática aplicamos o "Sistema de Indización Automático" (SISA) desenvolvido pelo Professor Isidoro Gil Leiva da Universidade de Múrcia, na Espanha. O SISA seleciona automaticamente os descritores a serem atribuídos a um texto, a partir de sua comparação com o vocabulário controlado de um sistema de informação e com uma lista de palavras consideradas vazias, ou seja, palavras sem significação, como conectivos, artigos, etc. Além disso relaciona em lista à parte os termos candidatos a descritores, isto é, palavras que não estão no vocabulário controlado, mas que apresentam várias ocorrências no texto indexado.

O corpus desse estudo é constituído:

1. dos descritores atribuídos pelos indexadores humanos às dissertações e teses defendidas no PPGCI entre 2002 2 2007, quando inseridas no Banco de Dados Bibliográficos da USP (DEDALUS);

2. dos descritores atribuídos automaticamente pelo SISA aos resumos dessas dissertações e teses;

3. dos descritores atribuídos semi-automaticamente pelo SISA, ou seja, aqueles descritores selecionados por indexador humano a partir dos descritores atribuídos automaticamente pelo SISA em conjunto com os termos candidatos indicados pelo programa como possíveis descritores.

2 Procedimentos terminológicos na construção do Vocabulário Controlado do SIBi/USP - VOCAUSP

De acordo com Lara (2004, p. 232) a linguagem documentária é "[...] uma linguagem especialmente construída para organizar e facilitar o acesso e a transferência da informação". O Vocabulário Controlado do SIBI/USP, como toda linguagem documentária, é um instrumento de organização e recuperação da informação, construído com a finalidade de propiciar a representação e a recuperação dos conteúdos informacionais dos documentos cadastrados no Banco de Dados Bibliográficos da USP (DEDALUS), a partir de subsídios teóricos e metodológicos da Análise Documentária e também da Terminologia.

A Terminologia, segundo Dubuc (1999), permite identificar e analisar o vocabulário de uma determinada especialidade e, se necessário, criar e normalizar termos em situações concretas de funcionamento. Assim, a terminologia estuda, teoricamente, os termos e seus respectivos conceitos, os sistemas de conceitos e sua representação.

Tálamo, Lara e Kobashi (1992, p. 1999) afirmam que:

[...] cabe à terminologia, desse modo, operar ao nível sintático-semântico, produzindo terminologias específicas de acordo com o estado-da-arte de cada campo considerado. Tais repertórios ou listas de termos especializados de um domínio particular são acompanhados de definições que remetem o termo ao seu referente [...].

Dentro desse contexto, a Terminologia possui três correntes teóricas básicas que fundamentam esses princípios, a saber (BARROS, 2004):

1. Teoria Geral da terminologia (TGT): tendo uma função conceptual ou cognitiva, é relacionada com a análise e descrição da terminologia, mais especificamente com os estudos, a harmonização e a organização dos domínios, através da sistematização dos termos, e é representada por seu principal teórico Eugen Wüster;

2. Teoria Comunicativa da Terminologia (TCT): apresentada por Maria Tereza Cabré (1993), prioriza a função comunicacional da linguagem, relacionando-se com a comunicação e com a transferência do conhecimento. Essa transferência possibilita a atualização das terminologias através do discurso científico e técnico;

3. Socioterminologia: valoriza os aspectos sociais da linguagem de especialidade e parte do pressuposto de que a "prática terminológica é inseparável tanto do conhecimento do espaço da ação onde ela se dá, quanto das práticas de linguagem que visa modificar ou assegurar" (GAUDIN, 1993, 9. 212) apudBARROS, 2004, p. 69). Nos estudos de François Gaudin (1993), observa-se que essa teoria valoriza a identidade específica de indivíduos, com a finalidade de resgatar línguas em processo de extinção.

Isso posto, e segundo Boccato (2005, p. 53):

A função da terminologia é a de promover consistência das relações lógico-semânticas na construção de linguagens documentárias, sendo igualmente consideradas as unidades da linguagem natural e das linguagens dos especialistas para a construção de representações adequadas de conceitos por meios de termos.

A terminologia tem grande importância nos estudos e na elaboração da linguagem documentária; e esta, como um instrumento comunicador de mensagens e mediador da recuperação da informação documentária, tem um papel fundamental no tratamento e na recuperação da informação.

A terminologia, enquanto ciência de estudo dos termos, e mais especificamente a TGT, é um dos referenciais teóricos utilizados para a construção do Vocabulário Controlado do SIBi/USP; ao mesmo tempo em que as terminologias, enquanto conjuntos das entidades lexicais típicas das áreas do conhecimento, abrangidas por essa linguagem documentária, são utilizadas como referentes de seus descritores.

De acordo com a TGT, o objeto de estudo da Terminologia são os conceitos, sendo que os termos ou os símbolos são apenas suas formas designativas. São os conceitos que apresentam relações entre si dentro de um mesmo domínio e podem ser organizados em uma estrutura, formando um conjunto sistematizado (BARROS, 2004).

O estabelecimento das relações entre os conceitos de um domínio norteia a metodologia para a manutenção do Vocabulário Controlado do SIBi/USP, pois, segundo Lima, Boccato et al. (1998, p. 2), essa linguagem documentária pretende uma maior equivalência entre os assuntos adotados em cada biblioteca a partir da aproximação às terminologias das áreas do conhecimento envolvidas.

Esse princípio possibilita ao Vocabulário Controlado do SIBi/USP tornar-se uma linguagem documentária intermediária, constituída de uma estrutura lógico-semântica que atua efetivamente como um instrumento normatizador básico na atividade de indexação do sistema de informação.

A estrutura conceitual de cada domínio no Vocabulário Controlado do SIBi/USP é constituída pelas terminologias das área coletadas, a partir de materiais bibliográficos e instrumentos técnicos/especializados, como tesauros de áreas, sistemas de classificação, dicionários e glossários, entre outros, além da verificação da estrutura curricular de cada unidade de ensino e/ou pesquisa, bem como a realização de consulta aos especialistas de área.

Procurou-se eliminar as redundâncias e termos ambíguos, elaborando-se fichas terminológicas para determinar os termos preferenciais, incluir qualificadores, notas de escopo e operadores de equivalência (VER), realizando a normalização dos termos e garantindo a homogeneidade formal e a univocidade da relação termo-conceito (UNIVERSIDADE DE SÃO PAULO, 2006).

Um grupo gestor, formado por bibliotecários do SIBi/USP e técnicos do DT/SIBi que contam com a assessoria de professores especialistas em Linguagens Documentárias do Departamento de Biblioteconomia e Documentação da ECA/USP, garante a continuidade do processo, a manutenção e o gerenciamento do Vocabulário Controlado do SIBi/USP.

3 A indexação manual, automática e semi-automática

A indexação é o processo de análise documentária que tem por finalidade identificar o assunto de que trata o documento e representá-lo através de descritores de uma linguagem documentária, de maneira a permitir a sua recuperação pelos usuários de um sistema de informação.

Chaumier (1988, p. 63) define indexação como a "operação que consiste em escrever e caracterizar um documento, com o auxílio da representação dos conceitos nela contidos". Essa operação pode ser realizada por um indexador humano, sendo nesse caso denominada na literatura indexação manual; por um programa de computador, sendo denominada indexação automática; ou ainda por um programa de computador e depois revista por um indexador humano, sendo denominada indexação semi-automática.

Na indexação manual o indexador, em um primeiro momento, realiza a leitura documentária para a identificação e a seleção dos conceitos expressos em um documento e, a seguir, representa ("traduz") esses conceitos selecionados em descritores da linguagem documentária adotada pelo Sistema de Informação (BOCCATO, 2005).

Na indexação automática, segundo Santos e Ribeiro (2003), um programa de computador, adotando critérios de freqüência, extrai palavras, expressões ou radicais de palavras do texto para representar o seu conteúdo como um todo.

Lancaster (2004, p. 286-290) define dois tipos diferentes de indexação automática. A indexação por extração automática e a indexação por atribuição automática.

Na indexação por extração automática, palavras ou expressões que aparecem no texto são extraídas, por um programa de computador, e utilizadas para representar o conteúdo do texto como um todo, adotando-se critérios de freqüência, posição e contexto (LANCASTER, 2004, p. 286). O programa vai contar as palavras num texto, desde que ele tenha sido cotejado com uma lista de palavras proibidas, a fim de eliminar palavras não-significativas (artigos, preposições, conjunções, etc.), e em seguida ordenar essas palavras segundo a frequência de sua ocorrência. As palavras com maior número de ocorrências são escolhidas como os descritores do documento.

Na indexação por atribuição automática é necessário desenvolver, para cada termo a ser atribuído, um "perfil" de palavras ou expressões que costumam ocorrer frequentemente nos documentos às quais um indexador humano atribuiria esse termo. Se a cada termo de um vocabulário controlado correspondesse um perfil desses, seria possível utilizar programas de computador para cotejar as expressões importantes num documento (essencialmente aquelas que fossem extraídas segundo critérios de freqüência) com essa coleção de perfis, atribuindo um termo ao documento sempre que esse perfil do documento coincidisse com o perfil dos termos (LANCASTER, 2004, p. 289).

Lancaster (2004, p. 312) considera que apesar da indexação automática não alcançar o nível de desempenho obtido por indexadores humanos, esse tipo de processo poderá reduzir a carga de trabalho desses indexadores ao realizar uma atribuição preliminar.

Segundo Pinto (2001, p. 227), a indexação semi-automática seria a combinação da indexação manual com a indexação automática. Inicialmente, o sistema realiza uma indexação automática dos documentos levando em conta as ocorrências das palavras mais freqüentes no texto. Em um segundo momento, o indexador humano refina a lista dos descritores propostos pelo sistema fazendo os ajustes e/ou complementações necessárias.

4 Metodologia

Para a avaliação do desempenho terminológico dos descritores em Ciência da Informação do Vocabulário Controlado do SIBi/USP nos processos de indexação manual, automática e semi-automática, utilizamos como corpus 70 resumos das dissertações e teses, defendidas no Programa de Pós-Graduação em Ciência da Informação da Escola de Comunicações e Artes da Universidade de São Paulo, cadastradas no Banco de Dados Bibliográficos da USP (DEDALUS), no período de janeiro de 2002 a dezembro de 2007. A delimitação do período deve-se ao fato de que a implantação do Vocabulário Controlado do SIBi/USP - VOCAUSP ocorreu em outubro de 2001.

Utilizamos para indexação automática e semi-automática o software "Sistema de Indización Automático" (SISA), desenvolvido pelo professor Isidoro Gil Leiva da Universidade Múrcia na Espanha (GIL LEIVA, 1999). A escolha desse software se deu pela interface facilitadora de seu sistema; por permitir a comparação entre os termos presentes em um resumo e no texto completo de um artigo, com uma lista de descritores previamente escolhidos; e por eliminar, também a partir de uma lista pré-estabelecida, as palavras consideradas "vazias", isto é, palavras sem significação como conectivos, artigos, etc, além de relacionar como termos candidatos palavras que não estão relacionadas como descritores, mas que apresentam várias ocorrências no título e no resumo.

Originalmente o SISA traz como default uma lista de descritores, em espanhol, compilados a partir dos seguintes tesauros em espanhol: "Tesauro em documentacíon e informacíon", Tesauro de la UNESCO e "Vocabulário controlado em bibliotecologia, ciência de la informacíon y temas afins" (GIL LEIVA, 1999, p.106). Assim como também uma lista de palavras vazias. Por esse motivo, o primeiro passo foi o de preparar e inserir no SISA essas respectivas listas em português, a partir dos descritores e termos genéricos da Ciência da Informação retirados do Vocabulário Controlado do SIBI/USP, e ao mesmo tempo traduzir lista de palavras vazias do espanhol, inserindo pequenas alterações.

O SISA exige que todos os textos a serem indexados estejam no formato txt e marcados com os seguintes parâmetros (SISA, s.d.):

- #CTI# e #FTI# para identificar o título;

- #CR# e #FR# para identificar o resumo;

- #CTE# e #FTE# para identificar o texto do artigo.>

Assim, capturamos cada resumo do DEDALUS, salvando-o no formato txt e inserindo em cada um as citadas marcas.

Nesse estudo, por termos acesso apenas aos resumos das dissertações e teses, o resumo foi repetido entre os parâmetros para o texto completo, pois o SISA só realiza a indexação quando existe um corpus entre todos os parâmetros.

Após a preparação das listas e do corpus, realizamos a indexação automática e salvamos em um arquivo os descritores atribuídos pelo software a cada um dos resumos.

Posteriormente, realizamos a indexação semi-automática. Isto é, a partir da leitura do resumo, avaliamos os descritores atribuídos automaticamente a cada um pelo SISA, assim como os termos candidatos à indexação indicados pelo software, optando por aqueles que, de acordo com o nosso entendimento do resumo, representavam mais adequadamente o seu conteúdo informacional. Os resultados são apresentados a seguir.

5 Resultados

A partir dos dados obtidos foi possível elaborar um quadro comparativo (Anexo 1 ANEXO 1 - Quadro dos descritores atribuídos aos resumos ) onde para cada resumo indicamos: os descritores atribuídos na indexação manual realizada durante o cadastramento no DEDALUS; os descritores atribuídos automaticamente pelo SISA; e os descritores atribuídos por nós, os quais configuram uma indexação semi-automática.

Esse quadro nos permitiu visualizar graficamente, conforme os QUADROS 1, 2 e 3 e os GRÁF. 1, 2 e 3, a coincidência entre os diferentes processos de indexação, e avaliar o desempenho terminológico dos descritores.







No QUADRO 1 observa-se que a grande maioria dos resumos, 67%, não obteve nenhum descritor coincidente entre a indexação manual e a indexação automática; 27% dos resumos apresentaram apenas 1 descritor coincidente nos dois processos de indexação e 6% dos resumos apresentaram 2 descritores coincidentes nos dois processos de indexação.

A coincidência dos descritores pode ser observada no GRÁF. 1.

O QUADRO 2 apresenta os resultados de descritores coincidentes nos processos de indexação manual e de indexação semi-automática, onde 51% dos resumos apresentaram coincidência de 1 descritor; 29% não apresentaram nenhum descritor coincidente, 16% dos resumos coincidem em 2 descritores e 4% coincidem em 3 descritores.

No GRÁF. 2 podemos visualizar os resultados apresentados no QUADRO 2.

No QUADRO 3 observamos a coincidência de descritores entre a indexação automática e a indexação semi-automática, onde 51% dos resumos não apresentam descritores coincidentes nos dois processos, 38% apresentam apenas um descritor coincidente, 10% dos resumos apresentam 2 descritores coincidentes, 1% apresenta 3 descritores coincidentes e 1% apresenta 5 descritores coincidentes.

No GRÁF. 3 visualizamos os resultados apresentados no QUADRO 3.

A partir desses resultados, e analisando os descritores selecionados nos 3 processos de indexação apresentados no ANEXO I ANEXO 1 - Quadro dos descritores atribuídos aos resumos , relacionamos algumas considerações, não apenas sobre os processos de indexação realizados, como também sobre o objeto do processo de indexação, ou seja, os resumos, e ainda sobre a ferramenta utilizada no processo, o SISA. Os resultados indicam também as áreas que são objeto do maior número de dissertações e teses nas linhas de pesquisa do Programa de Pós-graduação de Ciência da Informação da ECA/USP.

Em alguns casos infere-se que os resumos não foram elaborados adequadamente, pois, na indexação semi-automática o indexador identificou o assunto tratado na dissertação ou tese e esse assunto fazia parte do Vocabulário, mas não foi indexado pelo SISA por não ter sido nomeado no resumo, como no exemplo, a seguir.

Exemplo 1 - clique para ampliar

Observa-se que novos termos, que aparecem nos resumos como novos assuntos do domínio, não foram ainda incorporados pelo Vocabulário como descritores na área da Ciência da Informação, como por exemplo:

INFORMAÇÃO DOCUMENTÁRIA

PRINCÍPIO MONOGRÁFICO

LINGUÍSTICA DOCUMENTÁRIA

ALFABETIZAÇÃO DIGITAL

COMUNIDADES VIRTUAIS

O termo Ação Cultural não foi indexado, por não estar incluído no VOCAUSP no domínio da Ciência da Informação, mas sim no domínio das Ciências Sociais, como podemos observar no esquema a seguir:

CH764.5 - SOCIOLOGIA

CH764.5.2 - CULTURA

CH764.5.2.9 - POLÍTICA CULTURAL

CH764.5.2.9.7 - AÇÃO CULTURAL

Verifica-se também que o software não reconhece os descritores compostos, como, por exemplo, Ciência da Informação, quando no texto surge também o termo Informação. Isso ocorre porque Informação também é um descritor do Vocabulário e acaba sendo contado isoladamente. Consequentemente obtém um maior número de ocorrências.

6 Considerações finais

Durante o processo de avaliação do desempenho terminológico dos descritores em Ciência da Informação do Vocabulário Controlado do SIBi/USP, identificamos alguns ruídos na recuperação da informação realizada devido a problemas não só dos resumos inseridos no sistema de informação, DEDALUS, como também da linguagem documentária utilizada nesse sistema para indexação de seus registros, e ainda das limitações da ferramenta utilizada na indexação automática e semi-automática.

Consideramos que em alguns casos os resumos não são elaborados adequadamente, não permitindo uma indexação automática e dificultando também uma indexação semi-automática; isso porque na maioria das vezes são elaborados pelos autores e não por profissionais da área da CI, e não utilizam em seu corpus a terminologia do domínio no qual estão inseridos. Isso pôde ser observado no processo de indexação semi-automática, quando o indexador identificou o assunto tratado na dissertação ou tese e esse assunto fazia parte do Vocabulário, mas não foi indexado pelo SISA, por não ter sido nomeado no resumo. No caso de resumos elaborados adequadamente, a indexação automática representou satisfatoriamente o conteúdo informacional do documento, mas conclui-se pela necessidade de um tratamento anterior dos registros a serem cadastrados em uma base de dados.

Com relação à linguagem documentária, apesar de ter sido construída a partir de procedimentos terminológicos, ela ainda necessita ser aprimorada, no sentido de dar uma maior consistência terminológica aos seus descritores. Isso pode se observado pela inexistência, no Vocabulário Controlado do SIBi/USP, de novos termos, que aparecem nos resumos como novos assuntos do domínio e não foram ainda incorporados pelo Vocabulário como descritores na área da Ciência da Informação. Outro problema identificado foi que a linha de pesquisa Ação Cultural não se encontra adequadamente representada no Vocabulário no domínio da Ciência da Informação e sim no domínio da Sociologia. Isso demonstra a necessidade de inserção de áreas interdisciplinares, o que levaria a uma proposta de inserção de todo o Vocabulário Controlado do SIBi/USP no SISA.

Com relação ao SISA, ao processar apenas arquivos em txt o programa fica limitado ao que se encontra disponível nesse formato, o que também leva à necessidade de preparo do corpus a ser indexado. O aprimoramento do programa para indexar textos em outros formatos, mais especificamente o pdf, seria de grande valia para os sistemas de informação, visto que a maioria dos repositórios de textos completos se encontra nesse formato.

Consideramos que a utilização do SISA na indexação semi-automática é a mais adequada, pois permite ao indexador avaliar novos termos que surgem como termos candidatos à indexação e que representam em muitos casos novas fronteiras do conhecimento que vem sendo desenvolvido na área, estando presentes nas terminologias das áreas de domínio.

Dessa maneira, a indexação semi-automática permite atualizar os instrumentos de indexação de um Sistema de Informação, já que indica, através dos termos candidatos, a atualização terminológica de uma determinada área do conhecimento.

O desempenho terminológico dos termos depende da atualização terminológica da linguagem documentária a ser utilizada nos processos de indexação. A partir dos resultados obtidos podemos considerar que os atuais descritores em Ciência da Informação do Vocabulário Controlado do SIBi/USP, para obterem um melhor desempenho, ou seja, representarem adequadamente o conteúdo do corpus indexado, devem ser ampliados e ainda contextualizados através de definições terminológicas, para que possam responder efetivamente às necessidades de informação de seus usuários.

A resposta para a representação adequada dos conteúdos informacionais presentes nas bases de dados parece estar na reunião dos esforços de três áreas: a Terminologia, a Análise documentária e a Informática.

Recebido em 25.08.2008

Aceito em 12.03.2009

  • BARROS, L. A. Curso básico de terminologia São Paulo: Edusp, 2004. 185p.
  • BOCCATO, V. R. C. Avaliação de linguagem documentária em Fonoaudiologia na perspectiva do usuário: estudo de observação da recuperação da informação com protocolo verbal. 2005. 239 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2005.
  • BOCCATO, V. R. C. Avaliação de linguagem documentária em Fonoaudiologia na perspectiva do usuário: estudo de observação da recuperação da informação com protocolo verbal. 2005. 239 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2005.
  • CABRÉ, M. T. La terminología: teoria, metodología, aplicaciones. Barcelona: Antártica/Empúres, 1993. 529 p.
  • CHAUMIER, J. Indexação: conceito, etapas e instrumentos. Revista Brasileira deBiblioteconomia e Documentação, São Paulo, v. 21, n. 1/2, p. 63-79, jan./jun. 1988.
  • DUBUC, R. ¿Qué es la terminología?: Manual de terminología. Providencia: Ril Ed., 1999.
  • GAUDIN, F. Socioterminologie: dês problèmes sémantiques aux pratiques institutionnelles Rouen: Université de Rouen, 1993 apud BARROS, L. A. Curso básico de terminologia São Paulo: Edusp, 2004. 185 p.
  • GIL LEIVA, I. La automatizacíon de la indización de documentos Gijón (Asturias): Ediciones Trea, 1999.
  • LANCASTER, F. W. Indexação e resumos: teoria e prática. 2. ed. Brasília: Briquet de Lemos, 2004. 452 p.
  • LARA, M. L. Linguagem documentária e terminologia. Transinformação, Campinas, v. 16, n. 3, p. 231-240, set./dez. 2004.
  • LIMA, V. M. A.; BOCCATO, V. R. C. et al. Atualização da lista de assuntos USP: compatibilização de linguagens documentárias. Ciência da Informação, São Paulo, v. 25, n. 2, p. 177-181, mai/ago. 1996.
  • PINTO, V. B. Indexação documentária: uma forma de representação do conhecimento registrado. Perspectivas em Ciência da Informação, Belo Horizonte, v. 6, n. 2, p. 223 - 234, jul./dez. 2001.
  • SANTOS, G. C.; RIBEIRO, C. M. Acrônimos, siglas e termos técnicos: Arquivística, Biblioteconomia, Documentação, Informática. Campinas: Átomo, 2003. 277 p.
  • SISA: Sistema de Indizacíon Semi-Automático: guia de usuário. Múrcial: [s.n.] 1998. 16p.
  • TÁLAMO, M. F. G. M.; LARA, M. L. G.; KOBASHI, N. Y. Contribuição da terminologia para a elaboração de tesauros. Ciência da Informação, Brasília, v. 21, n. 3, p. 197-200, set./dez. 1992.
  • UNIVERSIDADE DE SÃO PAULO. Vocabulário Controlado do SIBi/USP Disponível em: <http://www.usp.br/sibi>. Acesso em: 11 mar. 2008.
    » link

ANEXO 1  - Quadro dos descritores atribuídos aos resumos

Datas de Publicação

  • Publicação nesta coleção
    30 Jun 2009
  • Data do Fascículo
    Abr 2009

Histórico

  • Recebido
    25 Ago 2008
  • Aceito
    12 Mar 2009
Escola de Ciência da Informação da UFMG Antonio Carlos, 6627 - Pampulha, 31270- 901 - Belo Horizonte -MG, Brasil, Tel: 031) 3499-5227 , Fax: (031) 3499-5200 - Belo Horizonte - MG - Brazil
E-mail: pci@eci.ufmg.br