Indexação morfossemântica de imagens no contexto da saúde visando à recuperação de informações

Morphosemantic indexing of health-related images to improve information retrieval

Resumos

No campo da saúde, os dispositivos de captura de imagens estão cada vez mais especializados, e atualmente pode-se registrar imagens nunca antes concebíveis, como aquelas do interior do corpo humano, as imagens em movimento concernentes às doenças, aos órgãos internos, ou à maneira de dormir. O acesso a essas imagens, no entanto, nem sempre é possível, não apenas por motivos éticos, como também pela falta ou deficiência no tratamento informacional dessas fontes. Este artigo apresenta reflexões sobre os modelos de tratamento e organização de imagens e sua aplicabilidade ao campo da saúde, mostrando alguns sistemas.

indexação morfossemântica de imagens; indexação por atributos visuais; indexação por atributos verbais; Sistema de Indexação e Recuperação Morfossemântica de Informações Imagéticas


The area of health boasts an increasingly specialized range of methods for taking images, while previously inconceivable images can now be recorded, such as of the inside of a human body, moving images of diseases, internal organs, or the way we sleep. However, these pictures are not always readily available, not only for ethical reasons, but because the information from these sources is not always processed well or even at all. This article discusses how images can be treated and organized and how this can be applied to the area of health, demonstrating a few systems.

morphosemantic indexing of images; indexing by visual attributes; indexing by verbal attributes; System for the Morphosemantic Retrieval and Indexation of Information from Images


ANÁLISE

Indexação morfossemântica de imagens no contexto da saúde visando à recuperação de informações* * Este artigo é baseado no Relatório Final do Projeto de Pesquisa em Produtividade (PQ) intitulado Processamento e Representação de Informações de Imagens Medicais.

Morphosemantic indexing of health-related images to improve information retrieval

Virginia Bentes Pinto

Professora do Departamento de Ciências da Informação / Universidade Federal do Ceará. Rua Coronel Alves Teixeira, 910, apto. 304. 60130-000 Fortaleza - CE - Brasil. vbentes@ufc.br

RESUMO

No campo da saúde, os dispositivos de captura de imagens estão cada vez mais especializados, e atualmente pode-se registrar imagens nunca antes concebíveis, como aquelas do interior do corpo humano, as imagens em movimento concernentes às doenças, aos órgãos internos, ou à maneira de dormir. O acesso a essas imagens, no entanto, nem sempre é possível, não apenas por motivos éticos, como também pela falta ou deficiência no tratamento informacional dessas fontes. Este artigo apresenta reflexões sobre os modelos de tratamento e organização de imagens e sua aplicabilidade ao campo da saúde, mostrando alguns sistemas.

Palavras-chave: indexação morfossemântica de imagens; indexação por atributos visuais; indexação por atributos verbais; Sistema de Indexação e Recuperação Morfossemântica de Informações Imagéticas.

ABSTRACT

The area of health boasts an increasingly specialized range of methods for taking images, while previously inconceivable images can now be recorded, such as of the inside of a human body, moving images of diseases, internal organs, or the way we sleep. However, these pictures are not always readily available, not only for ethical reasons, but because the information from these sources is not always processed well or even at all. This article discusses how images can be treated and organized and how this can be applied to the area of health, demonstrating a few systems.

Keywords: morphosemantic indexing of images; indexing by visual attributes; indexing by verbal attributes; System for the Morphosemantic Retrieval and Indexation of Information from Images.

Não é de hoje que as imagens são fonte importante de informação, uma vez que desempenham papel fundamental não apenas para a preservação e o estudo da memória, mas também para a recuperação e a comunicação de informações e conhecimentos no contexto teórico e prático de vários domínios do saber.

Desde a invenção do raio X, pelo físico Wilhelm Konrad Von Röntgen, no final do ano de 1895, o uso das imagens passou a fazer parte do cotidiano do campo da saúde, revolucionando as pesquisas e as práticas, pois elas portam informações que jamais poderiam ser registradas em outros suportes ou formas. Em razão do avanço das tecnologias eletrônicas e digitais, que propuseram ferramentas muito mais precisas para o registro de imagens, é possível a aquisição de imagens digitais diversas, como as de exames de tomografia, densitometria óssea, ressonância magnética etc. Reúnem-se a essas formas de imagens aquelas obtidas pelos processos tradicionais (radiografia), que também podem ser transformadas em documentos digitais. Ora, nesse campo, o acesso a certas informações somente é possível por meio da imagem, pois além de serem agregadas aos prontuários de pacientes, também podem constituir base de referência de conhecimentos, tanto para o diagnóstico e o tratamento de inúmeras patologias como para pesquisas em andamento e retrospectivas.

De um lado, as imagens desempenham importante papel no campo da saúde, pois por meio delas é possível assegurar-se de um diagnóstico, planejar e guiar um tratamento (ou, ainda, rejeitar uma hipótese inicial sobre determinada doença). De outro, também se observa que, mesmo com toda essa importância, nem sempre a imagem é percebida como tal no que concerne ao tratamento de informações (Bentes Pinto, Meunier, 2006a). Sabe-se que as fontes de informação bibliográfica, inclusive os prontuários, são utilizadas com o desenvolvimento de ferramentas - tesauros, listas de autoridades, entre outros - tanto para o tratamento de informação, mediante a indexação desse corpus de documentos, como para as buscas e a recuperação. Pouca atenção, entretanto, tem sido dada às coleções de imagens que, na sua maioria, ficam sem qualquer tratamento informacional. Além do mais, em nosso cotidiano e no seio de nossa família, muitas vezes, ao se sair das consultas, levam-se as imagens dos exames para casa e, depois de certo tempo, o destino desses documentos é o lixo. Isso ocorre porque nem sempre se tem consciência acerca do papel que tais imagens desempenham para diagnóstico e acompanhamento das doenças, muito menos para as tomadas de decisão em hospitais, clínicas ou consultórios, sejam eles médicos, odontológicos, fisioterapêuticos ou quaisquer outros. Por fim, em observações empíricas, nota-se também que a evolução de imagens no contexto da saúde trouxe nova perspectiva - a dificuldade para o tratamento, o armazenamento e a recuperação de informações registradas nesses documentos.

O tratamento informacional desses tipos de documentos requer atenção especial, pois eles são constituídos por textos verbais e não verbais e, diferentemente de outras fontes de informação, todos eles precisam ser tratados para que haja uma recuperação de dados mais eficaz. Alia-se a esse fato a atenção a ser conferida à polissemia no tratamento das informações. Afinal, trata-se de vidas, e uma falha na indexação pode comprometer tanto o paciente como o profissional da saúde. O avanço das tecnologias proporciona a obtenção de milhares de imagens digitais na área da saúde, o que demanda o desenvolvimento de sistemas de tratamento de informações contidas nesses documentos, bem como a sua gestão. Os esforços de pesquisas com esse propósito resultaram em sistemas disponíveis no mercado, entre os quais se destacam Picture Archiving and Communication Systems (Pacs), Radiology Information System (RIS), Hospital Information System (HIS) e Medical Imaging Informatics Infrastruture (MIII). O Brasil também já desenvolveu alguns, evidenciando-se o Sistema para Recuperação de Imagens por Conteúdo (Biram) e o de Recuperação de Imagens Similares (SRIS-CH).

As reflexões aqui apresentadas motivaram uma pesquisa sobre a representação indexal de imagens medicais (ecografia, radiografia, scanners, tomografias, eletrocardiogramas etc.) tendo por base as seguintes questões: (a) como as imagens, no campo da saúde, podem ser tratadas visando à representação indexal e à recuperação dessas fontes de informação?; (b) de que forma a polissemia pode ser evitada no tratamento desses documentos?; (c) que contribuições os modelos de representação indexal de imagens podem oferecer para o tratamento de imagens no campo da saúde? O interesse que ora se manifesta a respeito do tema decorre de observações empíricas sobre a literatura. É notável que as propostas de tratamento e organização desses documentos por meio dos recursos das tecnologias da informática são apresentadas, principalmente, tendo por base os atributos visuais das imagens, sem conferir a justa importância aos aspectos morfossemânticos de tais fontes documentais. Além do mais, como profissional da ciência da informação e da biblioteconomia, interesso-me também em desenvolver pesquisas, estudos e práticas sobre o tratamento e a recuperação de informações e a gestão desses documentos.

Os objetivos deste artigo são analisar as imagens priorizando sua procedência semântica; estabelecer a representação das imagens medicais em termos dos elementos que as constituem (atributos visuais); e construir um modelo de representação no contexto da indexação de imagens medicais. Na primeira parte dele encontram-se as discussões teóricas a respeito da representação indexal de imagens, levando em consideração quatro paradigmas. Em seguida, é abordada a representação de imagem no campo da saúde. Posteriormente exibe-se o modelo teórico do Sistema de Representação Indexal e de Recuperação de Informações Imagéticas (Sirimag) e, por último, as considerações finais do trabalho.

Representação indexal de imagem visual

Reflexões sobre a representação indexal de imagens

A história do tratamento de informação de imagens visuais remonta aos trabalhos de bibliotecários, arquivistas e historiadores e iniciou no fim da Primeira Guerra Mundial, em 1918, com o objetivo de facilitar o acesso às coleções de fotografias que pertenciam às universidades e aos museus. Não se pode negar, no entanto, que sob o prisma teórico a representação indexal de imagens visuais, como texto, é herdeira das reflexões das teorias da linguagem, que segundo Meunier (Aut. 1986), provêm, pelo menos, de duas correntes de pensamento: a européia e continental, apoiada na tradição lingüística e retórica e sustentada em especial por Bertin (1967), o Groupe Mu (1974) e Bassy (1974), para quem a imagem visual pode ser percebida tanto como uma linguagem quanto como um texto ou um discurso; e a britânica e americana, que se apóia na tradição lógica defendida principalmente por Beardsley (1958), Hospers (1946), Goodman (1968), Margolis (Aut. 1974) e Sircello (1972) e que se estrutura a partir da perspectiva lógico-semântica, para a qual a frase é uma "instância material no sentido de prova, exprimindo materialmente cada etapa de uma demonstração. Se, por exemplo, ela é ausente de uma dedução, a prova não funciona" (Meunier, Aut. 1986, p.13). Advogando essa idéia, Meunier toma como exemplo o quadro (pintura), e diz que ele pode ser análogo a uma grande frase constituída de

uma vasta argumentação em que cada um dos constituintes é concebido como um elemento que contribui à demonstração (narração) geral desejada pelo pintor. A semiologia pictorial contemporânea e iconográfica clássica procede assim: ela identifica um certo número de figuras, ícones, isotopias, junto às frases isoladas participando de maneira totalizante ao conjunto de mensagens simbólicas da obra. Um quadro efetua assim, à sua maneira uma (de)monstração complexa. Ele é uma prova, pois apresenta uma seqüência ordenada de fórmulas ou frases (um texto) relacionada a uma finalidade demonstrativa. (Meunier, Aut. 1986, p.13; tradução livre)

Com apoio nessa proposição, entende-se que outras imagens visuais também são grandes sentenças textuais. Elas têm forma material própria, constituída pelos atributos visuais (textura, forma, cor) e também pelos textos não verbais, como ocorre com muitas imagens, podendo ser reproduzidas principalmente com as tecnologias da informação, cada vez mais modernas e possantes. No caso das imagens do campo da saúde, além de serem uma "(de)monstração complexa" do que foi captado a respeito da estrutura de um órgão, podem apresentar indícios de uma disfunção e/ou anormalidade - biofísica, bioquímica etc.

Entende-se que são quatro os paradigmas experimentados pela representação indexal das imagens visando à recuperação de informação. O primeiro diz respeito à indexação manual e em linguagem natural, tomando por base o modelo da análise de imagem elaborado por Ervin Panofisky (1955). Nele consideram-se os níveis pré-iconográfico, iconográfico e iconológico, cuja estrutura contém as seguintes questões: quem, onde, quando, o quê e como. O segundo é o da indexação assistida (semi-automática, ou indexação de imagem por conceitos, descritores). É o paradigma da indexação controlada, no qual as 'pistas' são atribuídas com base em linguagens documentárias como tesauros ou classificações, para representar assuntos percebidos nas imagens pelos indexadores, sejam eles humanos ou não. O terceiro refere-se à indexação por conteúdo ou atributos visuais das imagens (cor, textura, forma) e pode ser chamado de indexação sintática ou 'full imagem', totalmente automática, O quarto é o da indexação mista ou semântica, que utiliza tanto os atributos visuais das imagens como as palavras, para estabelecer o sentido nas representações desses documentos; trata-se da indexação morfossemântica.

Os quatro paradigmas permitem inferir que a representação indexal de imagens pode assumir, pelo menos, três hipóteses: (a) teleológica, cujo tratamento da imagem atende a uma finalidade específica (Clement, Thonnat, mar. 1993; Clouard, et al., 1999); (b) semiótica/ontológica, na qual a imagem é tratada como signo, cuja representação indexal pode ser feita mediante sua descrição física como um todo, ou com base nos objetos que a compõem, a relação entre eles e a compreensão semântica desses objetos (Peirce, 1978; Eco, 1992; Joly, 1994); (c) fenomenológica, em que o tratamento da imagem se volta para a descrição dos objetos ou fenômenos perceptíveis em superfície (Tsotsos, 1992).

Representação indexal de imagens por termos em linguagem natural

Esse paradigma emergiu por volta dos anos 1970 e suas experiências se apoiaram no modelo de análise de imagem preconizado por Ervin Panofsky (1955), com sua concepção das categorias pré-iconográficas, iconográficas e iconológicas. Tomando por base a proposta de Panofsky, Ginette Blery (1981) criou um modelo de indexação de imagens com as seguintes facetas: objetos (quem), lugar (onde), tempo e espaço (quando), atividades e acontecimento (o que) e modos (como). Tal modelo foi utilizado também por Shatford (Spring 1986) e Johanna Smiti (jul.-dez. 1996), em que as facetas antes referidas dialogam com aquelas apresentadas por Corinne Jörgensen (1996) sob as denominações de atributos perceptíveis, interpretativos e reativos diante da imagem. O primeiro (perceptível) responde diretamente a estímulos visuais; por exemplo, a cor, a textura, a forma e os próprios objetos componentes da imagem. O segundo (interpretativo) é aquele que exige do analista a aplicação de um nível de conhecimento geral sobre a imagem, além da capacidade de inferir acerca do estilo e modelo, quando se tratar de representações imagéticas relativas a peças ou objetos de arte. O terceiro (reativo) refere-se às sensações provocadas naquele que vê ou analisa o conjunto dos signos concorrentes para a constituição da imagem. A esse respeito, pode-se evocar, mais uma vez, a noção peirciana de 'semiosis ilimitada', decorrente da fusão dos atributos aqui mencionados, presentes nas diferentes formas de percepção dos sujeitos.

A representação indexal de imagens em linguagem natural é uma prática livre, feita de maneira totalmente manual e caracteriza-se por inúmeros problemas. Não se pode, todavia, esquecer que essas dificuldades são próprias do contexto das representações, sejam elas visuais, mentais ou realizadas com o emprego de tecnologias sofisticadas, pois falar de representação é mexer sempre com questões de natureza simbólica e subjetiva. Então, mesmo que os indexadores estabeleçam a maior exaustividade representacional mediante os índices de palavras, eles jamais terão eficácia total nas respostas demandadas pelos usuários, uma vez que, conforme já mencionado, o sujeito tem sempre as próprias maneiras de perceber e nomear as coisas e os objetos do mundo. Turner (1994) corrobora essa proposta e acentua que apenas uma imagem pode comportar vários e diferentes significados, tanto para a mesma pessoa como para pessoas diferentes, segundo o objetivo e o momento de sua utilização, e em razão do dinamismo das palavras, aquelas selecionadas tanto pelos indexadores durante a atividade de indexação, quanto pelos usuários na busca de imagens. Outra dificuldade é apontada por Graham (2001, p.24-25) e se refere ao ponto de vista do indexador, que nem sempre coincide com aquele do usuário. É o caso de uma indexação sofisticada para usuários pouco especializados; ou, ao contrário, do usuário que é um especialista do domínio da imagem solicitada e a encontra indexada sob forma muito singela de representação. Ressalte-se ainda o fato de que a polissemia da própria imagem também contribui para aumentar as dificuldades na atividade de sua representação indexal, seja em relação a ela própria, seja pelas palavras escolhidas para representar o conteúdo imagético com vistas a sua recuperação posterior.

Representação indexal de imagens por descritores e conceitos

Em razão das dificuldades apresentadas no item anterior, surgiram outras proposições de indexação de imagens visuais, não mais por intermédio de termos livremente estabelecidos por indexadores, em linguagem natural, mas adotando-se a estratégia de uma linguagem controlada. Para tanto, bibliotecários e outros especialistas criaram linguagens documentárias ou controladas, dos tipos classificação, cabeçalhos de assuntos e tesauros, para reduzir as ambigüidades inerentes à linguagem natural. Assim, foram postos em prática, entre outros, os thesaurus based indexing systems, destacando-se entre eles o Iconclass, Art & Architecture Thesaurus e o Thesaurus for Graphic Materials (TGM). Essa nova maneira de indexar pode permitir o controle das polissemias das palavras, não somente durante as atividades de indexação, mas também na recuperação da informação. Convém lembrar, contudo, que tal controle nem sempre favorece a recuperação de informação. Afinal de contas, o ser humano elabora as próprias etnografias (mesmo de modo inconsciente) quando busca informações em bases de dados, embora os gestores desses recursos tracem caminhos ou pistas a serem seguidas pelos usuários durante a 'garimpagem das imagens' nos sistemas de recuperação de informação (SRI). Como representar, por meio de palavras, detalhes bem precisos dos componentes formais das imagens visuais, a exemplo das atitudes e dos gestos? De que modo representar detalhes anatômicos ou sentimentos expressos em uma imagem visual? De acordo com Rui, Huang e Chang (1999), há duas grandes dificuldades para o tratamento manual ou semi-automático de imagens visuais: a primeira diz respeito ao tamanho das coleções de imagens e à complexidade do trabalho demandado para descrever manualmente as imagens. A outra se refere à riqueza de conteúdos registrados nas imagens e à subjetividade humana de percepção desses conteúdos.

Representação indexal por conteúdo morfológico (atributos visuais)

Em razão do aumento das imagens digitais ou escaneadas, da ineficácia das respostas às buscas em bases e bancos de imagens, assim como do avanço das pesquisas interdisciplinares (teóricas e aplicadas), foram propostas outras formas de indexar e recuperar imagens - dessa feita, pelo conteúdo. Para tal, foram construídos os Content-Baseds Image Retrieval (CBIR), capazes de estabelecer automaticamente a representação indexal de imagens, levando em conta toda a sua superfície e ancorados em atributos visuais como cor, textura, forma e luminosidade. Em lugar das palavras, sempre utilizadas em sistemas tradicionais e também naqueles baseados em linguagem controlada, nesse novo paradigma a representação indexal se efetua pelos componentes visuais da imagem. Para Vailaya, Jain e Zhang (1998), os atributos visuais das imagens podem ser classificados em 'gerais' e 'específicos'. Os primeiros contemplam cores, texturas e formas das imagens, e os segundos levam em conta somente os aspectos particulares, como por exemplo um olho, um dedo, um dente, uma assinatura, um rosto, uma porta. Tais atributos podem ser empregados em um domínio particular bem especifico, como é o caso das áreas de saúde, gestão bancária, polícia e arquitetura.

As primeiras experiências com o uso do CBIR foram feitas por Toichi Kato (1992) em uma coleção do Art Museum. Seu objetivo foi a representação e recuperação automática de imagens tomando como atributos a cor e o contorno. O sistema CBIR oferece paletas contendo três das tonalidades tradicionais - vermelho, verde e azul -, conhecidas como 'rgb' (red, green, blue). Além das cores, o CBIR também oferece paletas de forma ou de textura. Nestas, os indexadores e usuários têm a oportunidade de escolher os tons, as formas e as texturas que sabem ou acreditam estar presentes na imagem, combinando-as na forma dos discursos (índex de cores, texturas ou formas em lugar das palavras) para que estes possam indexar e recuperar a imagem. Feito isso, as ferramentas do CBIR traduzem-nos em seqüências de vetores de intensidades de pixels numéricos, com o objetivo de representar o conteúdo de uma entidade e fornecer informações. A utilização dos vetores se explica, pois o grande tamanho das imagens dificulta sua indexação automática apenas pelos atributos mencionados. Mediado por esses vetores, o CBIR busca extrair as informações das imagens a fim de caracterizar seu conteúdo global ou particular. Após o primeiro tratamento, as imagens são matematicamente estruturadas e comparadas entre si, para se avaliar suas semelhanças visuais por ocasião das buscas em coleções de imagens.

Ao avaliar a eficácia do uso dos sistemas CBIR para indexação e recuperação de imagens, Armitage e Enser (1997, p.290) assinalaram que as falhas dos primeiros sistemas decorrem do fato de eles somente utilizarem atributos visuais para a representação indexal e a recuperação de informação. Com efeito, o grande problema é conseqüente da distância entre o que as tecnologias oferecem e as necessidades de informação dos seus usuários. Para esses autores, "the vast majority of users do not want to retrieve images simply on the basis of similarity of appearance. They need to be able to locate pictures of a particular type (or individual instance) of object, phenomenon, or event" [A grande maioria dos usuários não quer recuperar imagens simplesmente com base na similiaridade da aparência. Eles precisam ser capazes de localizar imagens de um tipo particular (ou exemplo individual) do objeto, fenômeno ou evento]. Corroborando essa opinião, Eakins e Graham (1999, p.8) enfatizam:

A eficácia de todos os sistemas CBIR atuais é inerente à limitação do sistema que opera somente em nível primitivo de características. Nenhum deles pode pesquisar eficazmente, por exemplo, por uma foto de um cão - embora algumas perguntas com conteúdo semântico possam ser asseguradas especificando-se os termos primitivos. Uma cena de praia, por exemplo, pode ser recuperada especificando-se grandes áreas de azul, no alto da imagem, e amarelo, no fundo. Há uma evidência que combina características primitivas da imagem com as palavras-chave dos textos ou dos hyperlinks, o que pode superar alguns desses problemas; pouco se sabe sobre como tais características podem melhor ser combinadas para a recuperação. (tradução livre)

Além do mais, a complexidade para estabelecer a representação indexal de imagens apenas com base nos atributos visuais reside, exatamente, na escolha dos referidos atributos, pois, como assinalam Angheben et al. (2005, n.p.), o conteúdo de uma imagem é portador de uma semântica bastante diferente e, naturalmente, varia

segundo o observador (grande público, amador ou especialista) e além do mais independentemente da língua dos usuários. ... as dificuldades cientificas ocorrem na recomposição da informação de alto nível inclusa na imagem e descrita pela semântica associada. Essa recomposição resulta de duas operações: uma primeira fase da decomposição (segmentação) e a segunda de refinamento da decomposição. (tradução livre)

Ora, quando tratamos de textos verbais estamos diante de palavras ou conjuntos de palavras estruturadas logicamente que lhes fornecem sentido. Então podemos dizer que neles há uma evidência de organização lógico-semântica estabelecida pelo autor, mesmo que necessariamente o sentido do consumo seja dado pelo receptor. Com o texto não verbal (imagem ou som), não se tem o hábito de perceber tais detalhes de forma evidente, daí a complexidade no tratamento informacional desses documentos. Estudando a semântica das imagens, Stéphane Bissol (2005, p.20-21) apresentou cinco categorias de conhecimentos que podem ser observadas na representação indexal e na recuperação de imagens visuais: (a) conhecimento sobre a aparência visual do objeto; (b) conhecimento específico sobre a aparência do objeto; (c) conhecimento sobre as relações entre os objetos; (d) conhecimento sobre as relações entre as instâncias específicas dos objetos contidos nas imagens e uma cena determinada; (e) conhecimentos não visuais (subjetivos) sobre os objetos. Todas essas categorias podem ser responsáveis pelo aumento do silêncio ou do ruído na representação indexal e na recuperação de informações registradas em imagens visuais, pois o ângulo de percepção visual é ligado às 'leituras de mundo' feitas por cada um. Portanto essa percepção não é desconectada de crenças, de concepções de mundo e, evidentemente, da cultura de cada qual. Residem aí dificuldades para se efetuar o tratamento de informações de documentos imagéticos.

Na realidade, nos primeiros CBIR, assim como ainda em alguns contemporâneos, a proposição de representação indexal e de recuperação de informação percebe as imagens visuais como 'objetos fechados', o que contribui para aumentar o 'fosso ou gap semântico' dessas fontes. De acordo com Smeulders et al. (2000, p. 1353; tradução livre), "o gap semântico está na falta da coincidência entre a informação que pode ser extraída dos dados visuais e a interpretação que os mesmos dados têm para um usuário em uma situação dada". Essa passagem vem ao encontro de inúmeras pesquisas que mostram que somente o uso de atributos visuais para a representação indexal e a recuperação de informações de documentos imagéticos não é suficiente e muito menos eficaz, pois, como exposto anteriormente, a exemplo dos textos verbais, as imagens são tão polissêmicas quanto estes - ou, quem sabe, muito mais -, já que são constituídas por uma infinidade de textos imbricados em formas, cores e texturas, estruturados morfossemanticamente. Isso também é valido para o campo da saúde, cujas imagens sempre são acompanhadas de textos verbais para que os diagnósticos sejam compreendidos, principalmente pelo sujeito leigo.

Representação indexal de imagens por conteúdo morfossemântico

Com base nas experiências com a tecnologia CBIR e considerando as dificuldades encontradas para estabelecer uma representação indexal eficaz de imagens visuais, os pesquisadores e criadores de softwares desenvolveram outros sistemas mais performáticos, cujo objetivo é, entre outros, a indexação semântica de imagens, também chamada mista ou indexação e recuperação de informação por conteúdo morfológico e semântico. Nesta nova possibilidade, são levados em consideração, além dos atributos visuais de cor, forma, textura etc., os descritores dos tesauros, das listas de autoridades, das ontologias, ou, ainda, os termos da linguagem natural. Quer dizer, estas proposições associam os textos verbais e os não verbais a fim de obter uma indexação e uma recuperação de informação imagética híbrida, com objetivo de obter melhores resultados. Com efeito, trata-se de uma aliança entre os critérios do CBIR e as palavras, visando construir uma representação indexal de imagens com melhor qualidade, com apoio em dois atributos: os visuais - como textos não verbais - e os textos verbais, pois somente os atributos visuais podem não ser suficientes para fornecer uma representação indexal de melhor qualidade.

Representação indexal de imagem no campo da saúde

Todas as áreas do saber foram atingidas pelas chamadas tecnologias da informação e da comunicação (TICs), inclusive o campo da saúde, principalmente no que diz respeito à evolução dos dispositivos de captura de imagens e das inúmeras possibilidades dos diagnósticos, os quais somente podem ser efetuados por intermédio desses documentos. Exames antes nunca imaginados são feitos hoje com segurança tal, que é quase impossível apresentar estatísticas de erros nos diagnósticos, tanto no que diz respeito aos exames de imagens das patologias (ecografia, scanner, tomografia, densitometria, raio X), como aos exames laboratoriais.

As tecnologias da informática têm possibilidades de registrar imagens jamais imaginadas, quer dizer, aquelas internas ao corpo dos seres vivos - as imagens em movimento concernentes às doenças, aos órgãos internos, à maneira de dormir ou de reagir diante de um estímulo. É possível notar, igualmente, os movimentos do feto, dos neurônios, do coração, dos pulmões, do sangue. Enfim, com as tecnologias digitais nada parece escapar ao mundo das imagens. Por intermédio dessas tecnologias, é ainda possível registrar as imagens relativas a toda a ação da disputa dos espermatozóides em favor da criação da vida. Renaud (1997) argumenta que, no universo eletrônico, não somos de maneira nenhuma brechtien; pelo contrário, estamos mesmo é em meio a uma confusão:

na Einfühlung, esta espécie de empatia é constitutiva da relação do que denominamos 'as novas imagens'. Essas novas imagens, que parecem estranhas, são as mais antigas que se possam imaginar, pois sua função não é se colocar como uma imagem como tal, mas, ao contrário, como um mundo completo no qual a diferença, a distinção, é totalmente abolida e onde o sujeito e sua própria imagem acabam por se misturar de maneira quase orgânica. Estamos, por conseqüência, em uma confusão procurada e desejada, cujo universo da simulação construiu as condições de possibilidade, porém que testemunha muito bem aquilo que Serge Daney chama a 'terceira idade da imagem'. (Renaud, 1997, n.p; tradução livre)

A adoção das ferramentas de tecnologias na área de saúde também contribui para a constituição e integração de sistemas de informação que visam à melhoria na qualidade dos serviços e no atendimento dos pacientes, a exemplo dos já mencionados Hospital Information System (HIS), o Radiology Information System (RIS) e o Picture Archiving and Communication System (Pacs). Na realidade, embora cada um deles tenha objetivos diferentes, visam, de modo geral, a produção, armazenamento, organização, recuperação e gestão de imagens, fazendo com que as informações dos pacientes e suas respectivas imagens sejam compartilhadas tanto local como remotamente. O tratamento, a organização e o armazenamento de imagens são realizados pelos PAC. De acordo com Lehmann et al. (Feb. 2000), os PAC atuais são de fundamental importância para a pesquisa por palavras-chave, nome do paciente, número do exame e data - informações relevantes para a equipe de saúde. Contudo esses sistemas ainda não contemplam, em suas estratégias de busca, a indexação e a recuperação de imagens visuais, o que põe em xeque a sua eficácia, pois em muitos casos o acesso às imagens é de vital importância para o profissional da saúde, particularmente para médicos, odontólogos e fisioterapeutas.

O American College of Radiology (ACR) e a National Electrical Manufactures Association (Nema) instituíram, na década de 1980, um comitê cuja finalidade era desenvolver um padrão digital de informações e imagens no campo da saúde. Esse comitê publicou uma primeira versão em 1985, denominada ACR-Nema 300-1985 (ou ACR-Nema versão 1.0). A segunda versão foi editada em 1988 e denominada ACR-Nema 300-1988 (ou ACR-Nema versão 2.0). De acordo com Halasz e Schwartz (1990), embora os sistemas desenvolvidos tivessem como ponto-chave a recuperação e a comunicação de imagens no contexto da saúde, foi necessário criar um padrão para que se pudesse obter êxito nos objetivos. Assim, em 1993, publicou-se a terceira versão do padrão, nomeada Digital Imaging and Communication in Medicine (Dicom), que, entre outras finalidades, define a forma de efetuar o armazenamento e a transmissão de imagens no campo da saúde de maneira padronizada. Lee e Shan (1990) afirmam que com o Dicom é possível obter as imagens digitais, uma vez que esse padrão é gerado pelos equipamentos atuais que utilizam imagens do campo da saúde, como tomografia computadorizada, ressonância magnética, ultra-sonografia e mamografia.

Note-se que, ao mesmo tempo que as imagens são cada vez mais importantes para a área da saúde, as dificuldades para o seu acesso se tornam muito maiores (Brender, Nohr, Mcnair, 2000). Somente para se ter noção desse crescimento, Glatard, Montagnat e Magnin (2004) constataram que, em um departamento radiológico de médio porte, a produção anual de imagens corresponde, em média, a 12 mil imagens por dia. Imagine-se o montante de imagens produzidas nos grandes hospitais e clínicas de todo o mundo. Por outro lado, a legislação mundial da saúde estabelece que, da mesma forma que os textos verbais dos prontuários, as imagens precisam ser armazenadas e conservadas por várias dezenas de anos. Por exemplo, a Resolução CFM 1.639/2002 (Brasil, 10 jul. 2002) defende a guarda de prontuários durante mais de vinte anos, e como imagens costumam integrar esses documentos, o prazo se estenderia a elas também.

A evolução de imagens no campo da saúde trouxe outro problema: as dificuldades de tratamento, armazenamento e recuperação das informações nelas registradas. Indexá-las requer atenção especial, pois além do texto não-verbal (imagem propriamente dita), os laudos são constituídos de textos verbais, e todos precisam ser tratados a fim de se obter uma recuperação com maior eficácia. Alia-se a esse fato a atenção que se deve ter quanto à polissemia no tratamento das informações dessas imagens. Afinal, elas dizem respeito a vidas, e uma falha na indexação que comprometa a recuperação pode trazer prejuízos tanto para o paciente como para o profissional da saúde. Todos esses obstáculos ocorrem porque, diferentemente das fontes de informação bibliográfica contempladas com as linguagens terminológicas (tesauros, listas de autoridades, Classificação Internacional das Doenças - CID-10), pouca atenção é concedida às coleções de imagens, tanto para o tratamento de informação como para as formas de busca e recuperação.

Conforme apresentado na primeira parte deste artigo, a representação indexal de imagens foi tradicionalmente efetivada, nos diversos domínios de conhecimento, por meio do emprego de palavras, sejam elas em linguagem natural ou controlada (tesauros, cabeçalhos de assuntos etc.). Sabe-se também que é prática corrente o tratamento de informações bibliográficas no campo da saúde (livros, artigos, fontes terminológicas sobre doenças, códigos de doenças e prontuários de pacientes), com destaque para a iniciativa pioneira da Biblioteca Nacional de Medicina dos Estados Unidos, que lançou, em 1986, o projeto Unified Medical Language System (UMLS), que tem por fim a unificação da terminologia medical. Mesmo com todo esse cuidado, ainda assim se enfrentam problemas de indexação de textos verbais na área da saúde, pois o UMLS jamais cobrirá na sua inteireza a terminologia do domínio da saúde. Conforme Tuttle et al. (1989), a grande contribuição do UMLS é chamar a atenção para a importância de registrar as relações entre os termos utilizados nos diferentes léxicos e nomenclaturas, uma vez que isso é indispensável para a área de saúde. Para esses autores, são os novos recursos de informação, denominados meta-thesaurus, cujo objetivo é transcender as terminologias específicas e as classificações, que favorecerão as conexões entre bases de dados de pacientes (prontuários) e bases de dados bibliográficas - além das imagens, é claro. Também conforme os mesmos autores, o Medical Subject Headings (MeSH), a Classificação Internacional de Doenças (CID-10) e o Systematized Nomenclature of Medicine (Snomed) podem ser considerados meta-thesaurus. De acordo com McCray (1989), o meta-thesaurus é estruturado como uma rede de tipos semânticos e categorias de termos nele contidos. Nessa rede são definidas as hierarquias dos objetos, que herdam, automaticamente, as propriedades das classes superiores a que pertencem. Portanto, podem ser percebidos como uma pseudo-ontologia.

Mesmo com todas as iniciativas de padronização da terminologia no domínio da saúde, também se verifica o uso de linguagem natural para a nomenclatura das doenças nos diagnósticos e cuidados, o que pode contribuir para o silêncio ou o ruído na recuperação da informação. Para resolver esse problema, vários sistemas de informação em saúde estão mostrando a necessidade de que esses conceitos sejam também empregados no tratamento e recuperação de documentos verbais, como é o caso das experiências do Beth Israel Hospital de Boston. De acordo com Scherrer, Assimacopoulos e Griesser (1989), esse hospital obedece as exigências da Organização Mundial da Saúde (OMS) e utiliza a CID-10 para a nomenclatura dos diagnósticos e procedimentos. Para os resultados dos exames são adotadas as terminologias do Snomed e para os dados bibliográficos, o Medline on line.

Os esforços para oferecer solução ao tratamento de textos verbais com o objetivo de fornecer respostas mais eficazes nas buscas de informação na área da saúde já estão bastante desenvolvidos. No que concerne, porém, às imagens, assim como a outros campos de conhecimentos, esse tratamento foi negligenciado durante muito tempo, tendo sido praticado de forma integral somente em alguns hospitais, sob orientação de modelos utilizados em outras imagens, ou seja, principalmente a partir das propostas de Panofisky (1955). No caso das imagens na ambiência da saúde, as primeiras experiências também foram implementadas com o emprego de palavras e com a ferramenta Pacs, tanto em linguagem natural como em linguagem controlada ou documentária. Essa maneira de tratar as imagens, no entanto, nem sempre contribuía para a sua recuperação a contento, pois existem aspectos específicos em imagens (cor, textura e forma) que precisam ser recuperados a fim de que um diagnóstico possa ser mais bem elaborado. Com a explosão de imagens proporcionada, principalmente, pelas tecnologias digitais, as primeiras experiências de representação indexal desses documentos tomando por base os atributos visuais de forma, cor e textura foram postas em prática por meio dos CBIR. Se em outros campos o uso dos CBIR traz bastante ruído na recuperação da informação, no contexto das imagens do campo da saúde essa ferramenta é de suma importância, uma vez que possibilita, além da recuperação da imagem propriamente dita, o cotejamento das imagens a fim de que sejam possíveis diagnósticos mais seguros, buscas pelos textos verbais e/ou a combinação de ambos. Em outras palavras, trata-se de uma indexação morfossemântica, sendo possível buscas de informações adotando-se ao menos três orientações: pelos atributos visuais (cores, formas, texturas, luminosidade) que compõem a imagem; pelas palavras que nomeiam as doenças percebidas nas imagens; pela combinação de textos verbais e não verbais e, também, pela individualização de cada atributo visual. Segundo Müller et al. (Feb. 2004), a recuperação por cada atributo visual é feita seguindo pelo menos três possibilidades: (a) por cada desenho ou croqui (sketch) que o usuário utiliza como 'pista' para a recuperação da informação, em que ele faz o esboço de uma imagem que se aproxima daquela que ele necessita; (b) por meio de exemplos (Query By Example - QBE), em que o usuário utiliza como 'pista' para a recuperação da informação uma imagem-modelo, similar àquela de que necessita; (c) mediante as chamadas buscas parametrizadas, nas quais as pistas utilizadas para recuperar informação são as cores, exemplificando-se as porcentagens aproximativas que formam a imagem de que se necessita.

Mesmo com todas essas possibilidades, os primeiros CBIR foram construídos sem levar em conta os aspectos semânticos, como também a especificidade dos campos de saberes, principalmente o da saúde. De acordo com Müller et al. (2004), esses sistemas são constituídos pelos seguintes módulos: interface gráfica de consulta; sistema de armazenamento e indexação de dados; medida de similaridade; extração de características; e sistema de recuperação - retrieval engine. A adaptação das ferramentas CBIR à área da saúde se fez necessária em razão da especificidade das modalidades de aquisição de imagens do campo. Por exemplo, imagem por ressonância magnética (IRM), tomografia por emissão de posições (TEP), imagens ultra-sonográficas e scanners. Essa tecnologia oferece diferentes tipos de imagens, em termos de resoluções, contrastes e emissão de sinais. Além disso, são imagens que portam informações referentes a anatomia, fisiologia e metabolismo dos pacientes. Relativamente à recuperação dessas fontes, Shyu et al. (2000) afirmam que elas são efetuadas, quase sempre, por zonas segundo a patologia mostrada na imagem. Daí a necessidade de uma indexação local que leve em conta a zona de evidência, mostrando ou não o indício da doença. Isto é o principal complicador, pois a maioria dos sistemas CBIR considera os aspectos globais da imagem e não os elementos que a compõem. Portanto, para a aplicabilidade das ferramentas CBIR ao campo da saúde é necessário que sejam feitas adaptações, uma vez que esse campo exige um nível muito alto de interpretação dos conteúdos imagéticos (Müller et al., 2004).

No Brasil, aos poucos estão sendo desenvolvidos sistemas voltados para indexar e recuperar imagens por meio de atributos visuais, tal como destacado a seguir.

- Sistema para Recuperação de Imagens por Conteúdo, conhecido como Biram, proposto como ferramenta adicional a um sistema Pacs, que atualmente apenas oferece buscas por palavras, pois a imagens baseadas em atributos visuais não podem ser recuperadas. Moreno e Furuie (2006) informam que o Biram pode funcionar como ferramenta de apoio a diagnósticos, favorecendo a recuperação de imagens, inclusive associando-as a todas as demais informações relacionadas ao exame do paciente. Por exemplo: data, local de realização, região, modalidade, laudo médico e diagnósticos, usando para isso as ferramentas de indexação. De posse das informações dos pacientes, as ferramentas do Biram podem buscar uma imagem tanto por intermédio de atributos visuais como por palavras-chave baseadas na CID-10 ou em um dicionário terminológico. A novidade desse sistema é a possibilidade de indexação e recuperação de textos verbais e não verbais, mostrando mais uma vez o poder do uso da palavra como valiosa ferramenta para a representação indexal, inclusive de imagens como grande texto, na perspectiva da recuperação de informações.

- Sistema de Recuperação de Imagens Similares (SRIS-HC), desenvolvido pela equipe do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo (HCFMRP/USP), como extensão do Sistema de Informação em Radiologia (SIR) do mesmo hospital. O SRIS-HC também constitui ferramenta adicional aos Pacs tradicionais, que não possibilitam a busca de imagens por atributos verbais. Conforme Rosa et al. (2002), esse sistema possibilita a consulta e a recuperação de imagens, associando todas as informações relacionadas ao exame do paciente, ou seja, os dados textuais dos exames (data, local de realização, região, modalidade, laudo médico e diagnósticos). As imagens são armazenadas e recuperadas por meio de suas características ou atributos visuais e também pelos textos dos laudos. Nas buscas de informação, o usuário (devidamente registrado) faz a pesquisa informando a imagem que busca e o total de imagens similares pretendidas, ou, ainda, a faixa de distância da imagem de busca. As respostas exibem as imagens em ordem crescente de similaridade, inclusive podendo-se vê-las em seu tamanho original. Também é possível visualizar os textos verbais referentes às informações do paciente e o laudo médico do exame.

Pesquisas realizadas por Giger (1999) e Giger et al. (2000) mostram que os sistemas de recuperação de informações de imagens que têm por parâmetros os atributos verbais, ou seja, uma perspectiva de conteúdos semânticos, são alternativa e complemento importante para os sistemas convencionais de busca com base em palavras-chave. Quando se trata, contudo, de sistemas de recuperação de informações de imagens baseados em atributos visuais, a escolha de uma representação adequada para as imagens, especialmente na área radiológica, demanda, além desses atributos, os textos verbais dos laudos para uma melhor recuperação, o que pede atenção especial à terminologia, mediante o uso de tesauros, de cabeçalhos de assuntos e da CID-10.

Material e método

Para o desenvolvimento da pesquisa nos valemos de vários recursos, como o levantamento de pesquisas bibliográficas, a fim de obter conhecimentos acerca da importância da imagem para o campo da saúde, a indexação de imagem e softwares de indexação de imagem no campo da saúde. Pretendia-se, entre outros objetivos, construir um modelo teórico de um sistema de representação indexal e de recuperação de imagens no âmbito da saúde, uma vez observadas as dificuldades para indexar não apenas os textos verbais espelhados nos laudos, como também os textos não verbais constituídos pelos atributos visuais de textura, cor, forma etc. que compõem as referidas imagens.

O Sistema de Representação Indexal e de Recuperação de Informações Imagéticas (Sirimag) tomou por base os modelos de indexação automática de textos verbais e também os modelos CBIR, que levam em conta os atributos visuais. Na realidade, o Sirimag apóia-se nas hipóteses de tratamento informacional de imagem, observando o seu nível perceptivo e semântico, ou seja, seus aspectos morfossemânticos - cores, formas, textura - e os conceitos oriundos das terminologias do campo da saúde, tendo por base os laudos e os prontuários, após o cotejamento com os tesauros, cabeçalhos e a CID-10.

O modelo do Sirimag

O Sirimag busca contemplar o campo da saúde, podendo ser aplicado a toda essa área de conhecimentos (medicina, odontologia, fisioterapia, enfermagem, bem como hospitais, clinicas, consultórios odontológicos, somente para citar alguns exemplos). Possibilita a indexação e a recuperação de imagens pelos atributos visuais e pelos descritores capturados dos laudos confrontados com a terminologia da área. Em outras palavras, empreende indexação e recuperação de informações morfossemânticas de imagens.

Para o contexto da saúde, o Sirimag é constituído de quatro módulos: Banco de Imagens; Banco de Textos (laudos); Laboratório de Tratamento Morfossemântico de Informações Imagéticas; e Busca e Recuperação de Informação.

O Módulo Banco de Imagens (MBI) é constituído pela coleção de imagens. Após os exames radiológicos, cardiológicos, ecográficos e aqueles computadorizados, as imagens são capturadas e armazenadas no banco de imagens da organização de saúde. Ele é constituído por funções que permitem descrever individualmente as imagens, de maneira padronizada.

O Módulo Banco de Textos Verbais (MBTV) é formado pelos laudos, sendo que cada um faz referência à imagem a ele concernente. Isso permite utilizar a imagem independentemente do dossiê inicial e favorece a construção de bancos referenciais de imagens complementares às informações dos prontuários do paciente.

No Módulo Laboratório de Tratamento de Informações Imagéticas (MLTIM) serão tratados os textos oriundos dos laudos, adotando-se as terminologias dos tesauros, os cabeçalhos da área de saúde e a terminologia da CID-10 para estabelecer a representação indexal desses documentos. Além dos textos verbais, também serão tratadas as informações referentes aos atributos visuais da imagem: cor, forma e textura - a fim de que todas as informações sejam organizadas levando-se em consideração os aspectos morfossemânticos das imagens.

O Módulo de Recuperação da Informação (MRI) oferece possibilidades de consultas pelos atributos visuais das imagens por meio da similaridade destas, dos conceitos estruturados com o apoio da terminologia e também pela combinação dos dois.

Considerações finais

Ancorando-se nos estudos efetuados no levantamento do estado da arte, entende-se que a representação indexal de imagens no campo da saúde deve ser feita de maneira diferente daquela executada em outros tipos de imagens visuais, mesmo que sejam utilizados textos verbais e não verbais. Nesse contexto fazem-se necessários e urgentes estudos e pesquisas sobre a ferramenta CBIR, o que demanda estudos interdisciplinares, notadamente com a estatística e a informática.

A consulta por atributos visuais oferece aos médicos, odontólogos e outros profissionais da saúde que trabalham com imagens possibilidades de buscar esses documentos por similaridade. De acordo com a literatura, tais atributos auxiliam os diagnósticos por imagens, uma vez que favorecem o acesso a casos semelhantes, oferecendo uma visão de um conjunto de imagens relativas ao mesmo problema. Além de poderem avaliar e comparar as imagens, os profissionais e demais usuários do sistema poderão também visualizar os diagnósticos anteriores. Tudo isso vem ao encontro da gestão de informações para a saúde em hospitais, clinicas ou qualquer unidade do gênero.

A representação indexal de imagens utilizando a interpretação dos laudos dos expertos pode contribuir sobremaneira para pesquisas na área da saúde e também para as práticas de trabalho, uma vez que é usada uma linguagem de especialidade e, portanto, uma terminologia bem específica, que será de grande valia para as buscas e a recuperação de informações. Do mesmo modo, a adoção de laudos, tesauros, cabeçalhos de assunto e CID-10, assim como a atenção aos atributos visuais das imagens podem ajudar a diminuir a polissemia das imagens e favorecer, no campo da saúde, uma recuperação de informação com maior qualidade.

É importante ressaltar o fato de que os laudos médicos são documentos bastante diferentes dos documentos tradicionais e demandam tratamento especifico, pois precisam estar associados às imagens às quais se referem, uma vez que delas são originados. Esses documentos são, portanto, de grande importância também para a área de ciência da informação, visto que demandam reflexões sobre a maneira como devem ser tratados.

Mediante o tratamento indexal de imagens pelos atributos visuais, é possível empregar as técnicas de data mining ou, mais especificamente, de image mining. Por meio delas, podemos fazer desabrochar florestas de imagens sobre determinadas doenças, o que não somente facilitará a recuperação de imagens, como também permitirá identificar a proximidade entre elas.

A representação indexal e a recuperação de imagens baseada em conteúdos está evoluindo cada vez mais como importante área de pesquisa para os campos da informática, da ciência da informação e comunicação visual. É importante frisar, também, que as organizações de saúde possuem grandes coleções de imagens em formato digital, principalmente no contexto da radiologia; nesses espaços, a busca por informação em formato digital já é uma realidade. Portanto, essas fontes precisam ser tratadas de modo que propiciem aos usuários a busca e a recuperação de informação em tempo hábil e com eficácia.

Por fim, os resultados deste estudo trazem possibilidades de continuidade da pesquisa, a fim de que o modelo teórico possa ser praticado como experiência em grande escala na perspectiva de sua validação. O estudo também abriu a possibilidade de uma pesquisa orientada para a construção de ontologias de imagens, tomando por base os laudos e a terminologia da área de saúde.

AGRADECIMENTO

Agradeço ao CNPq pelo apoio à pesquisa através da Bolsa de Produtividade.

NOTA

Recebido para publicação em agosto de 2007.

Aprovado para publicação em outubro de 2007.

  • ANGHEBEN, Marcello et al. Images médiévales et nouvelles technologies de l'information: lecture d'images et indexation par le contenu. Le médiéviste et l'ordinateur Disponivel em: http://lemo.irht.cnrs.fr/varia/images-ntic.htm Acesso em: 16 mar. 2006. 2005.
  • ARMITAGE, Linda H.; ENSER, Peter G.H. Analysis of user need in image archives. Journal of Information Science, London, v.23, n.4, p.287-299. 1997.
  • BASSY, Alain-Marie. Du texte à l'illustration: pour une sèmiologie des ètapes. Semiotica, Paris, v.11, p.297-334. 1974.
  • BEARDSLEY, Monroe C. Aesthetics: problems in the philosophy of criticism. New York: Harcourt. 1958.
  • BENTES PINTO, Virginia; MEUNIER, Jean-Guy. Les images visuelles en tant que sources d'information Relatório de estágio pós-doutoral na Université du Quebec, Montreal. 2006a.
  • BENTES PINTO, Virginia; MEUNIER, Jean-Guy. Las imágenes visuales: nuevo nicho para la construcción de bibliotecas digitales. In: Simposium Internacional de Bibliotecas Digitales, 4., 2005, Málaga. Anales... . Málaga: Universidad de Málaga. p.150-165. 2006b.
  • BERTIN, Jaques. Semiologie graphique: les diagrammes, les reseaux, les cartes. Paris: Mouton et Gauthiers-Villars. 1967.
  • BISSOL, Stéphane. Indexation symbolique d'images: une approche basée sur l'apprentissage non supervisé de régularités. Tese (Doutorado) - Université Joseph Fourier, Grenoble. 2005.
  • BLERY, Ginette. La mémoire photographique: étude de la classification des images et analyse de leur contenu à l'aide de l'informatique. Bulletin interphotothèque, Paris, n.41, p.9-34. Numéro spécial sur l'analyse de l'image fixe. 1981.
  • BRASIL. Conselho Federal de Medicina. Resolução n. 1.639 de 10 de julho de 2002. Diário Oficial, Brasília, Seção 1, p.124-125. 10 jul. 2002.
  • BRENDER, Jytte; NOHR, Christian; MCNAIR, Peter. Research needs and priorities in health informatics. International Journal of Medical Informatics, Sydney, v.58, p.257-289. 2000.
  • CLEMENT, Veronique; THONNAT, Monique. A knowledge-based approach to integration of image procedures processing. Computer Vision & Graphic Image Processiong Conference (CVGIP): image understanding, Trier, v.57, n.2, p.166-184. mar. 1993.
  • CLOUARD, Régis et al. A knowledge-based system for automatic generation of image processing programs. IEEE Transactions on Pattern Analysis and Machine Intelligence, Washington, v.21, n.2, p.128-144. 1999.
  • EAKINS, John P.; GRAHAM, Margaret E. Content-based image retrieval: a report to the joint information systems committee (JISC) technology applications programme. Newcastle upon Tyne: University of Northumbria at Newcastle / Institute for Image Data Research. 1999.
  • ECO, Umberto. Le signe Paris: Nathan. 1992.
  • GIGER, Maryellen Lisseak. Computer-aided diagnosis. In: Radiological Society of North America. Categorical course in breast imaging Oak Brook: RSNA. p.249-272. 1999.
  • GIGER, Maryellen Lisseak et al. Computer-aided diagnosis in mammography. In: Sonka, Milan; Fitzpatrick, John Michael (Ed). Handbook of medical imaging v.2. Bellingham: The International Society for Optical Engineering (SPIE). p.915-1.004. 2000.
  • GLATARD, Tristan; MONTAGNAT, John; MAGNIN, Isabelle E. Texture based medical image indexing and retrieval: application to cardiac imaging. In: Multimedia Information Retrieval, 4, 2004, New York. Proceddings... New York: MIR. p.15-16. 2004.
  • GRAHAM, Margaret E. The cataloguing and indexing of images: time for a new paradigm? Art Libraries Journal, Liverpool, v.26, n.1, p.22-27. 2001.
  • GOODMAN, Nelson. Languages of art: an approach to a theory of symbols. Indianapolis: The Bobbs-Merril, 1968.
  • GROUPE MU. Traité du signe visuel: pour une rhétorique de l'image. Paris: Seuil. 1974.
  • HALASZ, Franz; SCHWARTZ, Mayer. The dexter hypertext reference model. In: Hypertext Standardization Workshop, 1990, Gaithersburg. Proceedings.. Gaithersburg: Nist Special Publication. p.150-178. 1990.
  • HOSPERS, John Meaning and truth in the arts Carolina: University of North Carolina Press, 1946
  • JOLY, Martine. Image et les signes: approche sémiotique de l'image fixe. Paris: Nathan. 1994.
  • JÖRGENSEN, Corinne. Indexing images: testing an image description template. Disponivel em: http://www.asis.org/annual-96/electronicproceedings/ jorgensen.html Acesso: 20 out. 2005. 1996.
  • KATO, Toshikazu. Database architecture for content-based image retrieval. In: The International Society of Optical Engineering, 1992, New York. Proceedings... New York: The International Society of Optical. p.112-123. 1992.
  • LEE, Suh-Yin; Shan, Jing. Access methods of image databases. International Journal of Pattern Recognition and Artificial Intelligence, Washington, v.4, n.1, p.27-44. 1990.
  • LEHMANN, Thomas M. et al. Content-based image retrieval in medical applications: a novel multi-step approach. International Society for Optical Engineering (SPIE), Washington, v.3972, n.32, p.312-320. Feb. 2000.
  • MARGOLIS, Joseph. Pour réhabiliter la notion d'incorporation des entités culturelles : réponse à Dale Jacquette. Philosophiques, Québéc, v.13, n.2, p. 333-343. Aut. 1974.
  • MCCRAY, Alexa T. The umls semantic network. In: Symposium on Computer Applications in Medical Care (SCAMC), 1989, Washington. Proceedings....Washington: Institute of Electrical and Electronics Engineers (IEEE). p.503-507. 1989.
  • MEUNIER, Jean- Guy. Ce tableau vous parle-t-il? Protee, Québec, p.2-14. Aut. 1986.
  • MORENO, Ramon Alfredo; Furuie, Sergio Shiguemi. Biram: sistema para recuperação de imagens por conteúdo. In: Congresso Brasileiro de Informática em Saúde, 10, 2006, Florianópolis. Anais... Florianópolis: UFSC. p.554-559. 2006.
  • MÜLLER, Henning et al. A review of content-based image retrieval systems in medical applications clinical benefits and future directions. International Journal of Medical Informatics, Sydney, v.73, p.1-23. Feb. 2004.
  • PANOFSKY, Erwin. Meaning in the visual arts New York: Doubleday. 1955.
  • PEIRCE, Charles Sanders. Écrits sur le signe. Paris: Seuil. 1978.
  • RENAUD, Alain. L'image: de l'analogique au numérique (enjeux philosophiques). Disponivel em web.ina.fr/inatheque/activites/college/pdf/1997/ college_05_03_1997.pdf Acesso em: 16 set. 2005. 1997.
  • ROSA, Natália Abdala et al. Sistema de recuperação de imagens similares em um hospital universitário Disponível em: gbdi.icmc.usp.br/publicacoes.php?pubfile= rosa2002_wim_imagensporsimilaridadeemh. pdf. Acesso em: 10 dez. 2006. 2002.
  • RUI, Yong; HUANG, Thomas; CHANG, Shih-Fu. Image retrieval: current techniques, promising, directions, and open issues. Journal of Visual Communications and Image Representation, California, v.10, p.39-62. 1999.
  • SCHERRER, Jean-Raoul; ASSIMACOPOULOS, André; Griesser, Vicent. The diogene geneva experience with medical interactive encoding: the role of a micro-glossary Geneva: University Hospitals of Geneva. p.247-252. 1989.
  • SHATFORD, Sara. Analyzing the subject of a picture: a theoretical approach. Cataloging & Classification Quarterly, New York, v.6, n.3, p. 39-62. Spring 1986.
  • SHYU, Chi-Ren et al. A web-based CBIR - assisted learning tool for radiology education - anytime and anyplace. In: International Conference on Multimedia and Expo, 1, 2000. New York. Proceedings... New York: Institute of Electrical and Electronics Engineers (IEEE). p.23-26. 2000.
  • SIRCELLO, Guy. Mind & art: an essay on the varieties of expression. Princeton: Princeton University Press, 1972.
  • SMEULDERS, Arnold V.W. et al. Content based image retrieval at the end of the early years. Institute of Electrical and Electronics Engineers (IEEE): transactions on pattern analysis and machine intelligence, Washington, v.22, n.12, p.1349-1380. 2000.
  • SMITI, Johanna W. A representação da imagem. Informare, Rio de Janeiro, v.2, n.2. p.28-36. jul.-dez. 1996.
  • TSOTSOS, J.K. On the relative complexity of active vs. passive visual search. International Journal of ComputerVision, New York, v.7, n.2, p.127-141. 1992.
  • TURNER, James M. Indexing 'ordinary' pictures for storage and retrieval. Visual Resources, Eugene, v.10, n.3, p.265-273. 1994.
  • TUTTLE, Mark S. et al. Implementing meta-1: the first version of the umls metathesaurus. In: Symposium on Computer Applications in Medical Care (SCAMC), 1989. Washington. Proceedings...Washington: Institute of Electrical and Electronics Engineers. p.483-487. 1989.
  • VAILAYA, Aditya; JAIN, Anil; ZHANG, Hong Jiang. On image classification: city images vs landscapes. Pattern Recognition, San Diego, v.31, n.12, p.1921-1936. 1998.

  • *
    Este artigo é baseado no Relatório Final do Projeto de Pesquisa em Produtividade (PQ) intitulado Processamento e Representação de Informações de Imagens Medicais.

Datas de Publicação

  • Publicação nesta coleção
    14 Out 2011
  • Data do Fascículo
    Jun 2008

Histórico

  • Aceito
    Out 2007
  • Recebido
    Ago 2007
Casa de Oswaldo Cruz, Fundação Oswaldo Cruz Av. Brasil, 4365 - Prédio do Relógio, 21040-900 Rio de Janeiro RJ Brazil, Tel./Fax: (55 21) 3865-2208/2195/2196 - Rio de Janeiro - RJ - Brazil
E-mail: hscience@coc.fiocruz.br