Acessibilidade / Reportar erro

A representação temática de imagens digitais da NASA no Flickr as contribuições dos sistemas de organização do conhecimento

RESUMO

O crescimento das redes sociais e a forma de representar os seus recursos tornou-se objeto de diversos estudos na Ciência da Informação (CI). A imagem digital carrega uma dificuldade em relação a sua representação temática nessas redes sociais. Assim, o problema deste estudo consiste em investigar a recuperação da informação nas redes sociais, principalmente em redes que disponibilizam imagens digitais. Objetiva-se analisar as contribuições do Sistema de Organização do Conhecimento - SOC - da National Aeronautics and Space Administration - NASA, na representação temática de imagens digitais disponibilizadas em redes sociais do Flickr. Utilizou-se como metodologia a abordagem exploratória e descritiva, o que oportunizou o levantamento bibliográfico dos aspectos teóricos e a análise da terminologia em imagens digitais na NASA do Flickr. Por isso, foram analisados os termos de representação temática não controlados descritos por folksonomias e os termos controlados advindos do tesauro da NASA. Como resultados da análise destaca-se os desafios gerados no uso da folksonomia na representação temática de imagens digitais e as vantagens do uso do SOC nos processos de representação temática e recuperação da informação nesses ambientes. Conclui-se que as folksonomias representam livremente os termos e refletem a realidade terminológica de uma comunidade; enquanto que os SOC contribuem para um controle de vocabulário e recuperação da informação mais precisa.

PALAVRAS-CHAVE:
Sistemas de organização do conhecimento; Imagens digitais; Folksonomia; Recuperação da informação

ABSTRACT

The growth of social networks and the way of representing their resources has become the subject of several studies in Information Science (IS). The digital image carries a difficulty in relation to its thematic representation in these social networks. Thus, the problem with this study is to investigate the retrieval of information on social networks, especially on networks that make available digital images. The objective is to analyze the contributions of the Knowledge Organization System - KOS - of the National Aeronautics and Space Administration - NASA, in the thematic representation of digital images made available on Flickr’s social networks. The exploratory and descriptive approach was used as methodology, which enabled the bibliographical review of theoretical aspects and the analysis of terminology in digital images at NASA’s Flickr. Therefore, the terms of non-controlled thematic representation described by folksonomies, and the controlled terms from the NASA thesaurus were analyzed. As results of the analysis, the challenges generated by the use of folksonomy in the thematic representation of digital images, and the advantages of using KOS in the processes of thematic representation and information retrieval in these environments are highlighted. It is concluded that folksonomies freely represent terms and reflect the terminological reality of a community, while KOS’ contribute to a control of vocabulary and more accurate information retrieval.

KEYWORDS:
Knowledge organization systems; Digital images; Folksonomy; Information retrieval

1 INTRODUÇÃO

A evolução das tecnologias, seja em relação a hardwares, softwares ou meios de transmissão de dados, proporcionou uma mudança social e cultural. Pessoas, empresas, órgãos públicos e organizações não governamentais passaram a compartilhar textos, imagens, áudios e vídeos nas redes sociais. Embora essa realidade tenha originado uma nova forma de representação social, a folksonomia e a Indexação Social, na qual os usuários ou consumidores dos recursos são responsáveis por fazer a representação temática dos recursos (HASSANMONTERO, 2006), o campo de estudos da Ciência da Informação - CI, se depara com novos ambientes informacionais que podem fazer uso de instrumentos de representação do conhecimento.

Redes sociais são objetos altamente dinâmicos, crescem e mudam rapidamente ao longo do tempo através da adição de novas relações, significando o aparecimento de novas interações na estrutura social subjacente (LIBEN-NOWELL; KLEINBERG, 2007LIBEN-NOWELL, David; KLEINBERG, Jon. The link-prediction problem for social networks. Journal of the American Society for Information Science and Technology, v. 58, n. 7, p. 1019-1031, May, 2007.). O Flickr, por exemplo, está voltado para a disponibilização de imagens digitais, o processo de representação pode acarretar alguns inconvenientes no processo de busca e recuperação desses recursos. A inclusão de muitos termos na representação temática de uma imagem digital, atribuídos pelo usuário da rede social, não é garantia de uma boa busca e recuperação. O problema é a falta de critérios ao selecionar os termos para as representações, uma vez que em um determinado recurso pode haver muitos termos indexadores enquanto em outros esses termos são mínimos ou não descrevem realmente o recurso, que no caso trata-se de uma imagem digital.

O autor Hassan-Montero (2006) ressalta o seguinte ponto de vista em relação ao uso de linguagem natural nas representações temáticas como folksonomia e Indexação Social:

[...] é feito em linguagem natural não controlada, e na maioria dos casos com motivações egoístas, haverá uma proporção significativa de termos ou tags vazios de significância coletiva. Ou seja, o usuário frequentemente atribuirá tags que só fazem sentido para si mesmo, às quais devemos adicionar os problemas conhecidos de polissemia e sinonímia.

Ao uso de termos não controlados e estabelecidos pelos usuários, foi atribuído o nome folksonomia. Para Wal (2006), as folksonomias podem ser definidas como “sistemas orgânicos baseados na atribuição livre e pessoal de etiquetas às informações ou objetos visando a organização e recuperação”.

Segundo Ferneda (2012FERNEDA, Edberto. Introdução aos modelos computacionais de recuperação de informação. Rio de Janeiro: Editora Ciência Moderna, 2012., p.13), “a função da recuperação é representar o conteúdo dos documentos do corpus e apresentá-los ao usuário de uma maneira que lhe permita uma rápida seleção dos itens que satisfazem total ou parcialmente a sua necessidade de informação [...].”

A recuperação da informação em ambientes cuja representação não foi controlada por nenhum instrumento de representação, como ocorre nas redes sociais, apresenta uma eficiência reduzida do processo.

Sendo assim, é possível encontrar problemas em relação à recuperação da informação nas redes sociais, principalmente em redes que disponibilizam imagens digitais que, por si só, carregam certa dificuldade em relação a sua própria representação.

Assim, o objetivo deste artigo é analisar as contribuições do Sistema de Organização do Conhecimento - SOC - da National Aeronautics and Space Administration - NASA, na representação temática de imagens digitais disponibilizadas em redes sociais do Flickr.

Utilizou-se como metodologia a abordagem exploratória e descritiva, o que oportunizou o levantamento bibliográfico dos aspectos teóricos e a análise da terminologia em imagens digitais na NASA do Flickr. Assim, foram analisados os termos de representação temática não controlados descritos por folksonomias e os termos controlados advindos do tesauro da NASA.

Foram utilizadas como amostras as representações feitas pela NASA, que é uma referência mundial em imagens aeroespaciais, no Flickr, nas quais inicialmente aplicou-se termos não controlados e, posteriormente, termos do tesauro de domínio. Guimarães (2014, p.16) apresenta domínio como a categorização inerente à organização do conhecimento, na medida em que a partir da identificação de um conjunto de traços comuns é possível reunir coisas semelhantes e separar diferentes.

2 SOC E A REPRESENTAÇÃO TEMÁTICA

Quando se trata do termo conhecimento, é impossível deixar de considerar o fato deste estar em constante evolução, aumentando e passando por adaptações, conforme necessário. O conhecimento adquirido é relacionado a algo previamente armazenado na memória do indivíduo, algo que seja capaz de compreender e tirar conclusões. Após isso, pode ser transformado na informação, veiculado por diversas fontes, e novamente em conhecimento, o sujeito pode então classificá-lo.

Registrar o conhecimento é imprescindível para os avanços científicos e da sociedade. Porém, como o conhecimento é incremental e mutável, é muito importante que haja alguma forma de organizar tais conhecimentos. Uma das áreas de estudo da CI é a forma registrar o conhecimento de maneira estruturada, com o objetivo de tornar o processo de recuperação da informação mais eficiente. Segundo Hjørland (2003, p.87), organizar e recuperar registros é a base da CI:

[...] Organização do Conhecimento significa especialmente a organização de informações em registros bibliográficos, incluindo índices de citações, registros de texto completo e a Internet. A Ciência da Informação é basicamente sobre a melhor maneira de construir tais registros bibliográficos, bem como a maneira ideal de utilizar os registros fornecidos.

Os Esquemas de Representação do Conhecimento são ferramentas criadas para melhorar o processo de organização e representação dos conteúdos dos recursos informacionais, com o objetivo de facilitar o processo de recuperação da informação. Carlan e Medeiros (2011CARLAN, Eliana; MEDEIROS, Marisa Bräscher Basílio. Sistemas de organização do conhecimento na visão da Ciência da Informação. Revista Ibero-Americana de Ciência da Informação, Brasília, DF, v. 4, n. 2, p. 53-73, ago./dez. 2011. Disponível em: https://repositorio.unb.br/bitstream/10482/12867/1/ARTGO_SistemasOrganizacaoConhecimento.pdf. Acesso em: 22 nov. 2018.
https://repositorio.unb.br/bitstream/104...
, p. 55) afirmam que:

[...] esquemas de representação do conhecimento são instrumentos que fazem a tradução dos conteúdos dos documentos originais e completos, para um esquema estruturado sistematicamente [...] com a finalidade principal de organizar a informação e o conhecimento e [...] facilitar a recuperação das informações contidas nos documentos.

Ao buscar uma forma de organizar o registro do conteúdo dos recursos informacionais, implicitamente, o que se pretende é criar uma estrutura lógica que facilite a recuperação temática do que se deseja, de forma eficiente e unívoca, entre outros aspectos. Nos tópicos seguintes, aborda-se as ferramentas tesauro, ontologia e folksonomia, seus conceitos e como podem contribuir no processo de representação temática de imagens digitais.

2.1 Tesauro

O tesauro é uma das ferramentas dos SOC que proporciona ao profissional da CI, e

áreas afim, um conjunto de termos padronizados, por controle de vocabulário, para melhorar o processo de registro do conhecimento e recuperação da informação. Sobre a definição de tesauros, Cervantes (2009CERVANTES, Brígida Maria Nogueira. A construção de tesauros com a integração de procedimentos terminográficos. Marília/SP: UNESP, 2009. Disponível em: https://www.marilia.unesp.br/Home/Pos-Graduacao/CienciadaInformacao/Dissertacoes/cervantes_bmn_do_mar.pdf. Acesso em: 22 nov. 2018.
https://www.marilia.unesp.br/Home/Pos-Gr...
) relata que o tesauro pode ser visto como um instrumento de mediação capaz de permitir que bibliotecários indexadores, bibliotecários de serviço de referência e informação e usuários de um sistema de informação especializado compartilhem de um mesmo vocabulário.

Porém, os termos contidos em um determinado tesauro podem sofrer variações de significado dependendo do domínio em que são empregados, mas podem ser entendidos a partir da área de conhecimento a que pertencem. Um exemplo é o termo “manga”, que no tesauro da Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA), refere-se ao fruto da mangueira. Por outro lado, se aplicado ao tesauro de vestuários, refere-se à parte da roupa que cobre os braços.

Diversos tesauros podem ser encontrados na Web, dentre eles do Ministério da Infraestrutura, do Folclore e Cultura Popular Brasileira, do Supremo Tribunal Federal, do Tribunal Superior Eleitoral, o Tesauro de Objetos do Patrimônio Cultural nos Museus Brasileiros, entre outros. Além dos nacionais, há diversos outros tesauros como o da United Nations Educational, Scientific and Cultural Organization (UNESCO), da United Nations Bibliographic Information System (UNBIS) e da NASA. Este último selecionado para ser utilizado como referência durante o estudo desenvolvido.

2.2. Ontologia

Uma ontologia representa de forma estruturada e lógica os conceitos, os relacionamentos e as restrições existentes entre eles. Conforme Ferneda e Dias (2017FERNEDA, Edberto; DIAS, Guilherme Ataíde. OntoSmart: um modelo de recuperação de informação baseado em ontologia. Perspectivas em Ciência da Informação, Belo Horizonte, v. 22, n. 2, p. 170-187, jun. 2017. ISSN 19815344. doi:http://dx.doi.org/10.1590/19815344/2081. Disponível em: http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/2081. Acesso em: 18 jan. 2019.
http://dx.doi.org/10.1590/19815344/2081...
, p. 175) “[…] ontologia é uma estrutura conceitual que visa representar formalmente os conceitos e suas relações, regras e restrições lógicas de um determinado domínio”.

Segundo Jacob (2003JACOB, Elin K. Ontologies and the semantic web. Bulletin of the American Society for Information Science and Technology, Apr./May, 2003. Disponível em: https://onlinelibrary.wiley.com/doi/pdf/10.1002/bult.283. Acesso em: 19 jan. 2019.
https://onlinelibrary.wiley.com/doi/pdf/...
, p.20), as ontologias não são novas na Web. Qualquer esquema de metadados é uma ontologia que especifica o conjunto de características físicas e/ou conceituais de recursos que tenham sido considerados relevantes para uma determinada comunidade de usuários.

Para Silva, Santos e Ferneda (2013SILVA, Renata Eleuterio da; SANTOS, Renata Eleuterio da; FERNEDA, Edberto. Modelos de Recuperação de Informação e Web Semântica: a questão da relevância. Informação & Informação, João Pessoa, v. 18, n. 3, p. 27-44, out. 2013. ISSN 1981-8920. doi:http://dx.doi.org/10.5433/1981-8920.2013v18n3p27. Disponível em: http://www.uel.br/revistas/uel/index.php/informacao/article/view/12822. Acesso em: 17 dez. 2018.
http://dx.doi.org/10.5433/1981-8920.2013...
, p. 28), “a importância das ontologias na recuperação da informação é proporcionar e ampliar a busca do usuário para uma gama maior de possíveis opções relevantes”.

Como as redes sociais não impõe qualquer tipo de restrição de vocabulário durante o processo de descrição dos recursos, a utilização de ontologias de domínio poderia proporcionar uma gama de significados aos termos aplicados em diversas situações.

Uma vez definido o domínio, esta ferramenta pode ser utilizada como referência para o desenvolvimento de sistemas informatizados autômatos, com o objetivo de ser o modelo norteador do entendimento, compreensão, dos conceitos e termos aplicados na representação, independente do domínio.

2.3. Folksonomia

No cenário social em que muitas pessoas, empresas e instituições públicas têm acesso a equipamentos de informática e aos meios de comunicação, a possibilidade de criação de novas formas de registros de dados na Web surge como consequência destas mudanças. Gírias, símbolos, neologismos, abreviações e diversas formas de expressão podem ser utilizadas para representar algo.

A palavra folksonomia foi criada por Thomas Vander Wal em 2004, quando mesclou as palavras folk (povo) com taxonomy (taxonomia), ou seja, taxonomia criada pelo povo. Wal (2006) explica que:

folksonomia é o resultado de marcações pessoais livres de informações e objetos (qualquer coisa com uma URL) para sua própria recuperação. A marcação é feita em um ambiente social (compartilhado e aberto a outros). O ato é que a marcação é feita pela pessoa para consumir as informações.

Conforme Santarém Segundo e Vidotti (211, p. 286):

O propósito principal da Folksonomia neste contexto é permitir que usuários comuns criem labels/tags que possam descrever ou apontar para o conteúdo que estão inserindo durante o autoarquivamento de documentos digitais [...] de modo que os recursos possam ser recuperados posteriormente pelo próprio usuário ou ainda por outros [...].

Elucidada a questão da falta de padronização de termos para a representação inerente ao conceito da folksonomia, é possível o entendimento da complexidade no processo de indexação automática em redes sociais e em ambientes digitais que permitem a utilização de vocabulários não controlados. Este é o caso do Flickr, que permite a todos os usuários registrar as informações referentes às imagens postadas, sem qualquer tipo de ferramenta para auxiliar neste processo.

No caso específico da NASA, que faz utilização do Flickr, isso acontece de forma mais controlada, para fins de recuperação mais precisa, uma vez que tem tradição em representação de objetos informacionais e possui um tesauro de domínio. Porém, há algumas situações nas quais imagens que constam no repositório oficial da agência não aparecem no Flickr oficial dela. Todavia, algumas dessas estão registradas por usuários comuns, sem qualquer preparo profissional, o que gera ambiguidades e inconsistências.

2.4. Tratamento da Informação: Representação Temática e Recuperação

Basicamente, o tratamento da informação aborda questões que dizem respeito ao processo de representação de documentos, sejam físicos ou digitais, seja de forma a descrevêlos fisicamente ou os assuntos neles contidos. Toda forma de representação tem o objetivo de permitir a recuperação das informações pelo usuário. Segundo Dias (2001DIAS, Eduardo Wense. Contexto digital e tratamento da informação. Rio de Janeiro: DataGramaZero - Revista de Ciência da Informação, 2001. Disponível em: http://www.brapci.inf.br/_repositorio/2010/01/pdf_8df58fec78_0007466.pdf. Acesso em: 20 jan. 2019.
http://www.brapci.inf.br/_repositorio/20...
, p. 3), tratamento da informação é definido como:

[...] a função de descrever os documentos, tanto do ponto de vista físico quanto do ponto de vista temático [...] resulta na produção de representações [...] que não apenas se constituem de unidades mais fáceis de manipular num sistema de recuperação da informação, como também representam sínteses que tornam mais fácil a avaliação do usuário quanto à relevância que o documento integral possa ter [...].

Uma das formas de se representar um recurso é pela representação temática ou por assunto, que objetiva apresentar o conteúdo presente no documento para que o usuário pesquisador possa analisar sua relevância para ele. Para Souza (2013SOUZA, Brisa Pozzi de. Representação Temática da Informação Documentária e sua Contextualização em Biblioteca. Revista Brasileira de Biblioteconomia e Documentação, São Paulo, v. 9, n. 2, p. 132-146, nov. 2013. ISSN 1980-6949. Disponível em: https://rbbd.febab.org.br/rbbd/article/view/249. Acesso em: 10 dez. 2018.
https://rbbd.febab.org.br/rbbd/article/v...
, p. 139) ela é:

[...] percorrida pelo catalogador, através do processo de análise de assunto, que tem o objetivo de propiciar o entendimento do conteúdo, [...] por um processo que realmente contribua para a identificação condizente do assunto abordado no documento.

Segundo Kuramoto (2002KURAMOTO, Hélio. Sintagmas Nominais: uma nova proposta para a recuperação de informação. DataGramaZero - Revista de Ciência da Informação, Rio de Janeiro, v.3, n.1, 2002. Disponível em: https://ridi.ibict.br/bitstream/123456789/150/1/KuraData2002.pdf. Acesso em: 16 jan. 019.
https://ridi.ibict.br/bitstream/12345678...
), um dos grandes desafios encontrados na recuperação de informação é como atender às necessidades de informação do usuário de forma rápida e precisa. Para Ferneda (2003FERNEDA, Edberto. Recuperação de informação: análise sobre a contribuição da Ciência da Computação para a Ciência da Informação. 2003. Tese (Doutorado em Ciência da Informação e Documentação) - Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2003. doi:10.11606/T.27.2003.tde-15032004-130230. Disponível em: https://teses.usp.br/teses/disponiveis/27/27143/tde-15032004-130230/publico/Tese.pdf. Acesso em: 23 jan. 2019.
https://teses.usp.br/teses/disponiveis/2...
, p. 14), a recuperação da informação é:

[...] para uns, a operação pela qual se seleciona documentos, a partir do acervo, em função da demanda do usuário. Para outros consiste no fornecimento, a partir de uma demanda definida pelo usuário, dos elementos de informação documentária [...] pode ainda ser empregado para designar a operação que fornece uma resposta mais ou menos elaborada a uma demanda [...].

Portanto, representação e recuperação são fortemente relacionadas, se há falhas na representação, consequentemente, a recuperação é insatisfatória. A representação temática de imagens digitais, principalmente em redes sociais, é um desafio, pois a qualidade do registro está diretamente ligada ao indexador, que neste caso pode ser qualquer usuário, com ou sem conhecimento de controle de termos para facilitar a recuperação.

3. ANÁLISE DA TERMINOLOGIA EM IMAGENS DIGITAIS NA NASA DO FLICKR

O Flickr é uma rede social que permite a seus usuários armazenar e compartilhar digitalmente fotos, imagens, ilustrações, desenhos e vídeos, além de possibilitar a criação de álbuns e galerias. Assim como toda rede social, os usuários podem seguir outros usuários, curtir postagens, entrar em contato, favoritar e deixar comentários. Foi desenvolvido em 2004 pela empresa canadense Ludicorp que, em 2005, foi adquirido pelo Yahoo!, e em abril de 2018, foi vendido à empresa SmugMug.

Diversas instituições utilizam o Flickr para disponibilizar imagens digitais, dentre elas a Library of Congress, George Eastman Museum, Amsterdam Museum, NASA, entre outras.

3.1. Repositório Oficial da NASA e o Flickr

O repositório oficial da NASA, que armazena imagens digitais, tanto da terra quanto de outros planetas e objetos espaciais, capturadas por satélites. Na página inicial, apresenta uma interface simples. São exibidos vários blocos com imagens digitais e textos informativos sobre as missões e novidades que acontecem na agência. A figura 1 mostra o repositório após ser realizada uma busca com o termo em inglês jupter.

Figura 1
Repositório digital da NASA ao buscar o termo Jupter

A mesma busca foi realizada no Flickr e apresentou resultados distintos. A figura 2 mostra os resultados obtidos com o termo jupter na rede social. Foi possível observar a presença de registros oficiais da NASA bem como de usuários comuns.

Figura 2
Flickr ao buscar o termo Jupter

Um repositório em um domínio específico, como o oficial da NASA, tem um desempenho superior em relação a um repositório de propósito geral, como é o caso do Flickr. Por este motivo, não é feito qualquer tipo de comparativo entre as duas ferramentas, pois isso tornaria inválido os resultados.

As buscas apresentadas nos próximos tópicos foram realizadas no Flickr, para tanto, foram definidas as seguintes etapas:

  • Na primeira busca foram utilizados os termos “Big Planet Neptune”, comuns no domínio aeroespacial, utilizados termos que não constam no tesauro da NASA;

  • Na segunda e terceira buscas, foi utilizado o tesauro oficial da agência, o NASA THESAURUS VOLUME 1 Hierarchical Listing With Definitions; E então, montadas as seguintes estratégias “Giant Gas Planet Neptune” e “Celestial Giant Gas Planet Neptune”, todas as palavras constam no tesauro da agência.

Para a observação dos resultados foram selecionados os 105 primeiros registros exibidos, analisados o assunto ou termo com o qual a imagem digital foi indexada.

3.2. Recuperação de imagens com Base em Registros Folksonômicos

Para realização da primeira busca, foi considerado que o usuário tivesse interesse em imagem digital do planeta Netuno, por isso, a expressão utilizada foi “Big Planet Neptune”, na qual apenas a palavra “big” não se encontra relacionada a “planet Neptune” no tesauro da NASA. Não foram definidos quaisquer tipos de restrições ou filtros avançados. A figura 3 mostra parte dos resultados exibidos.

Figura 3
Pesquisa com Big Planet Neptune

Ao final da busca, o sistema retornou 887 itens, contudo, foram analisados os 105 primeiros, por considerar um número suficiente para este estudo. Dos 105 objetos recuperados foi possível observar que apenas uma das imagens digitais exibidas continha a captura fotográfica do planeta Netuno, ainda que na expressão de busca tenham sido utilizados os termos “planet” e “Neptune”. Isso significa que a relevância foi inferior a 1%.

Todas as imagens digitais recuperadas continham em suas descrições todas as palavras utilizadas na busca. A inconsistência nos resultados obtidos deve-se às variações na qual os termos foram empregados na representação. Por exemplo, Neptune, em uma imagem digital referia-se ao planeta, em outra ao nome de um instituto de pesquisas, em outra a um monumento e em outra ao nome de uma pessoa.

3.3. Recuperação no Flickr Utilizando Tesauro da NASA

Antes de realizar a segunda busca, foi cadastrada uma nova imagem digital do planeta Netuno, retirada do site da NASA, mas editada para fácil identificação na recuperação.

Durante o processo de representação da imagem digital, foram utilizados os termos recomendados no NASA THESAURUS. O quadro 1 mostra como ficou o resultado final do registro da imagem no site.

Quadro 1
Dados e valores utilizados no registro da imagem digital

3.4. Recuperação de imagens com Base em Registros Utilizando Tesauro

Para realização da segunda busca, a expressão utilizada foi “Giant Gas Planet Neptune”, com todos os termos descritos no tesauro da NASA. Não foram definidos quaisquer tipos de restrições ou filtros avançados. A figura 4 mostra parte dos resultados exibidos.

Figura 4
Pesquisa com Giant Gas Planet Neptune

Ao final da busca, o sistema retornou 105 resultados que atenderam à pesquisa, um universo 88% menor que a primeira, considerando o total recuperado anteriormente. Ao analisar os 105 itens retornados observou-se que 12 dos objetos exibidos continham a captura do planeta Netuno, uma relevância pouco maior que 11%.

Na terceira busca, foi utilizado um termo a mais, consultado no tesauro da NASA, o termo Celestial. Em relação à segunda busca obteve-se resultados significativos, conforme apresentado na figura 5.

Figura 5
Pesquisa com Celestial Giant Gas Planet Neptune

Ao final da busca o sistema retornou um total de 18 itens, um universo 82% menor que a segunda e 97% menor que a primeira. Ao analisar os objetos recuperados observou-se que 3 imagens digitais exibidas eram do planeta Netuno, relevância pouco maior que 16%.

As diferenças apresentadas entre a segunda e a terceira busca apresentaram uma diferença significativa, principalmente ao observar os resultados recuperados, isso com a utilização de apenas um termo a mais na expressão de busca.

Assim, apresenta-se como resultados da análise os desafios gerados no uso da folksonomia na representação temática de imagens digitais e as vantagens do uso do SOC no processos de representação temática e recuperação da informação nesses ambientes.

5 CONSIDERAÇÕES FINAIS

A compreensão de como construir e usar as ferramentas disponíveis de SOC, tanto os conceitos teóricos quanto as aplicações práticas, podem fazer uma diferença significativa na qualidade da representação temática e recuperação de imagens no ambiente digital.

Há que se questionar a liberdade ao representar as imagens digitais, vídeos, áudios, entre outros, nas redes sociais. Tratam-se de recursos informacionais complexos de serem representados e que também comportam a questão da subjetividade em suas representações temáticas. Além disso, a falta de vocabulários controlados e ontologias, além da utilização de folksonomias na indexação, refletem um vocabulário não especializado, que pode ser vazio de significado conceitual, mas ao mesmo tempo podem representar os termos mais utilizados por uma comunidade.

A falta de comprometimento na representação temática desses recursos, em especial da imagem digital conforme abordada neste estudo, pode refletir também a falta de interesse com a qualidade da representação, o que vai impactar diretamente nos resultados da recuperação. É fato que, em um ambiente aberto como uma rede social, espera-se pouca ou nenhuma imposição, ou restrição, aos seus usuários devido aos interesses das empresas.

Outro fator a ser considerado é a dificuldade de criação de ferramentas de SOC, como os tesauros e as ontologias, em ambientes totalmente abertos. Instrumentos de representação do conhecimento são construídos com base em uma área do conhecimento, para que seja possível padronizar os termos utilizados. É uma situação paradoxal ter um ambiente livre no qual seja imposto um controle de vocabulário no momento da representação do recurso.

Entretanto, os resultados obtidos na análise deste estudo demonstram que, mesmo em um ambiente de rede social é possível, em alguns casos, utilizar instrumentos de SOC para a melhoria da indexação e recuperação. Profissionais envolvidos com a representação devem atentar-se ao processo de representação temática da informação, utilizar, quando possível, tesauros de domínios específicos para consultar e utilizar os termos controlados estabelecidos. Os resultados da análise elaborada neste estudo demonstraram que em uma busca por termos livres os resultados obtidos não são tão relevantes e precisos quanto os obtidos em buscas realizadas com os termos do tesauro.

Portanto, considera-se neste estudo que a representação temática de imagens digitais a partir do uso de tesauros, um instrumento dos SOC, pode contribuir significativamente para uma recuperação com maior eficiência, precisão e qualidade. Enquanto que as folksonomias, próprias de redes sociais, trazem uma representação mais livre de uma imagem digital e, ao mesmo tempo, refletem a realidade terminológica de uma comunidade.

REFERÊNCIAS

  • CARLAN, Eliana. Sistemas de organização do conhecimento: uma reflexão no contexto da Ciência da Informação. Brasília/DF: UNB, 2010. Disponível em: https://repositorio.unb.br/bitstream/10482/7465/1/2010_ElianaCarlan.pdf Acesso em: 15 nov. 2018.
    » https://repositorio.unb.br/bitstream/10482/7465/1/2010_ElianaCarlan.pdf
  • CARLAN, Eliana; MEDEIROS, Marisa Bräscher Basílio. Sistemas de organização do conhecimento na visão da Ciência da Informação. Revista Ibero-Americana de Ciência da Informação, Brasília, DF, v. 4, n. 2, p. 53-73, ago./dez. 2011. Disponível em: https://repositorio.unb.br/bitstream/10482/12867/1/ARTGO_SistemasOrganizacaoConhecimento.pdf Acesso em: 22 nov. 2018.
    » https://repositorio.unb.br/bitstream/10482/12867/1/ARTGO_SistemasOrganizacaoConhecimento.pdf
  • CERVANTES, Brígida Maria Nogueira. A construção de tesauros com a integração de procedimentos terminográficos. Marília/SP: UNESP, 2009. Disponível em: https://www.marilia.unesp.br/Home/Pos-Graduacao/CienciadaInformacao/Dissertacoes/cervantes_bmn_do_mar.pdf Acesso em: 22 nov. 2018.
    » https://www.marilia.unesp.br/Home/Pos-Graduacao/CienciadaInformacao/Dissertacoes/cervantes_bmn_do_mar.pdf
  • DIAS, Eduardo Wense. Contexto digital e tratamento da informação. Rio de Janeiro: DataGramaZero - Revista de Ciência da Informação, 2001. Disponível em: http://www.brapci.inf.br/_repositorio/2010/01/pdf_8df58fec78_0007466.pdf Acesso em: 20 jan. 2019.
    » http://www.brapci.inf.br/_repositorio/2010/01/pdf_8df58fec78_0007466.pdf
  • FERNEDA, Edberto. Introdução aos modelos computacionais de recuperação de informação. Rio de Janeiro: Editora Ciência Moderna, 2012.
  • FERNEDA, Edberto. Recuperação de informação: análise sobre a contribuição da Ciência da Computação para a Ciência da Informação. 2003. Tese (Doutorado em Ciência da Informação e Documentação) - Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2003. doi:10.11606/T.27.2003.tde-15032004-130230. Disponível em: https://teses.usp.br/teses/disponiveis/27/27143/tde-15032004-130230/publico/Tese.pdf Acesso em: 23 jan. 2019.
    » https://teses.usp.br/teses/disponiveis/27/27143/tde-15032004-130230/publico/Tese.pdf
  • FERNEDA, Edberto; DIAS, Guilherme Ataíde. OntoSmart: um modelo de recuperação de informação baseado em ontologia. Perspectivas em Ciência da Informação, Belo Horizonte, v. 22, n. 2, p. 170-187, jun. 2017. ISSN 19815344. doi:http://dx.doi.org/10.1590/19815344/2081 Disponível em: http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/2081 Acesso em: 18 jan. 2019.
    » http://dx.doi.org/10.1590/19815344/2081» http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/2081
  • GUIMARÃES, José Augusto Chaves. Análise de domínio como perspectiva metodológica em organização da informação. Ciência da Informação, Brasília, v. 43, n. 1, june 2015. ISSN 1518-8353. Disponível em: http://revista.ibict.br/ciinf/article/view/1415 Acesso em: 15 mai. 2020.
    » http://revista.ibict.br/ciinf/article/view/1415
  • HASSAN-MONTERO, Yusef. Indización social y recuperación de información. No Solo Usabilidad Journal, 2006. Disponível em: http://www.nosolousabilidad.com/articulos/indizacion_social.htm Acesso em: 16 jan. 2019.
    » http://www.nosolousabilidad.com/articulos/indizacion_social.htm
  • HJØRLAND, Birger. Fundamentals of knowledge organization. Knowledge Organization, v. 30, n. 2. p. 87-111. Disponível em: http://ppggoc.eci.ufmg.br/downloads/bibliografia/Hjorland2003.pdf Acesso em: 17 nov. 2018.
    » http://ppggoc.eci.ufmg.br/downloads/bibliografia/Hjorland2003.pdf
  • JACOB, Elin K. Ontologies and the semantic web. Bulletin of the American Society for Information Science and Technology, Apr./May, 2003. Disponível em: https://onlinelibrary.wiley.com/doi/pdf/10.1002/bult.283 Acesso em: 19 jan. 2019.
    » https://onlinelibrary.wiley.com/doi/pdf/10.1002/bult.283
  • KURAMOTO, Hélio. Sintagmas Nominais: uma nova proposta para a recuperação de informação. DataGramaZero - Revista de Ciência da Informação, Rio de Janeiro, v.3, n.1, 2002. Disponível em: https://ridi.ibict.br/bitstream/123456789/150/1/KuraData2002.pdf Acesso em: 16 jan. 019.
    » https://ridi.ibict.br/bitstream/123456789/150/1/KuraData2002.pdf
  • LANCASTER, Frederick Wilfrid. Indexação e resumos: teoria e prática. 2. ed. Brasília/DF: Briquet de Lemos, 2004.
  • LIBEN-NOWELL, David; KLEINBERG, Jon. The link-prediction problem for social networks. Journal of the American Society for Information Science and Technology, v. 58, n. 7, p. 1019-1031, May, 2007.
  • SANTARÉM SEGUNDO, José Eduardo.; VIDOTTI, Silvana Aparecida Borsetti Gregorio. Representação iterativa e folksonomia assistida para repositórios digitais. Rio de Janeiro: Liinc em Revista, v.7, n.1, 2011. Disponível em: http://revista.ibict.br/liinc/article/view/3300/2916 Acesso em: 19 jan. 2019.
    » http://revista.ibict.br/liinc/article/view/3300/2916
  • SILVA, Renata Eleuterio da; SANTOS, Renata Eleuterio da; FERNEDA, Edberto. Modelos de Recuperação de Informação e Web Semântica: a questão da relevância. Informação & Informação, João Pessoa, v. 18, n. 3, p. 27-44, out. 2013. ISSN 1981-8920. doi:http://dx.doi.org/10.5433/1981-8920.2013v18n3p27 Disponível em: http://www.uel.br/revistas/uel/index.php/informacao/article/view/12822 Acesso em: 17 dez. 2018.
    » http://dx.doi.org/10.5433/1981-8920.2013v18n3p27» http://www.uel.br/revistas/uel/index.php/informacao/article/view/12822
  • SOUZA, Brisa Pozzi de. Representação Temática da Informação Documentária e sua Contextualização em Biblioteca. Revista Brasileira de Biblioteconomia e Documentação, São Paulo, v. 9, n. 2, p. 132-146, nov. 2013. ISSN 1980-6949. Disponível em: https://rbbd.febab.org.br/rbbd/article/view/249 Acesso em: 10 dez. 2018.
    » https://rbbd.febab.org.br/rbbd/article/view/249
  • TRISTAO, Ana Maria Delazari; FACHIN, Gleisy Regina Bóries; ALARCON, Orestes Estevam. Sistemas de classificação facetados e tesauros: instrumentos para organização do conhecimento. Ci. Inf., Brasília, v. 33, n. 2, p. 161-171, agosto 2004..https://doi.org/10.1590/S0100-19652004000200017 Disponível em: http://www.scielo.br/pdf/ci/v33n2/a17v33n2.pdf Acesso em: 13 jan. 2019.
    » https://doi.org/10.1590/S0100-19652004000200017» http://www.scielo.br/pdf/ci/v33n2/a17v33n2.pdf
  • WAL, Thomas Vander. Folksonomy Definition and Wikipedia. 2005. Disponível em: http://www.vanderwal.net/random/entrysel.php?blog=1750 Acesso em: 17 jan. 2019.
    » http://www.vanderwal.net/random/entrysel.php?blog=1750
  • WIKIPEDIA. Flickr. Disponível em https://pt.wikipedia.org/wiki/Flickr Acesso em: 21 jan. 2019.
    » https://pt.wikipedia.org/wiki/Flickr
  • JITA:

    ID. Knowledge representation.

Datas de Publicação

  • Publicação nesta coleção
    18 Set 2023
  • Data do Fascículo
    2020

Histórico

  • Recebido
    01 Mar 2020
  • Aceito
    11 Maio 2020
  • Publicado
    18 Maio 2020
Universidade Estadual de Campinas Rua Sérgio Buarque de Holanda, 421 - 1º andar Biblioteca Central César Lattes - Cidade Universitária Zeferino Vaz - CEP: 13083-859 , Tel: +55 19 3521-6729 - Campinas - SP - Brazil
E-mail: rdbci@unicamp.br