SciELO - Scientific Electronic Library Online

 
vol.29 issue1Analysis of relationship between VEGF protein expression and colorectal câncer stagingConventional hemorrhoidectomy versus stapled hemorrhoidopexy (PPH): a retrospective study of 253 patients author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

  • Portuguese (pdf)
  • Article in xml format
  • How to cite this article
  • SciELO Analytics
  • Curriculum ScienTI
  • Automatic translation

Indicators

Related links

Share


Revista Brasileira de Coloproctologia

On-line version ISSN 0101-9880

Rev bras. colo-proctol. vol.29 no.1 Rio de Janeiro Jan./Mar. 2009

https://doi.org/10.1590/S0101-98802009000100003 

ARTIGOS ORIGINAIS

 

Estudo comparativo de modelos computacionais gerados sobre representações de imagens de coloscopia: tecido de mucosa normal VS tecido de mucosa de pólipo cólico

 

Comparative study of computacional models generated from representations of colonoscopic images: normal mucosal tissues VS mucosal tissues of colic polyp

 

 

Carlos Andres FerreroI; Huei Diana LeeII; Newton SpolaôrIII; Cláudio Saddy Rodrigues CoyIV; João José FagundesV; Renato Bobsin MachadoVI; Everton Alvares ChermanIII; Feng Chung WuVII

IPesquisador do Laboratório de Bioinformática (LABI), Universidade Estadual do Oeste do Paraná (UNIOESTE), Parque Tecnológico Itaipu (PTI), Foz do Iguaçu, PR, Brasil
IIProfessora Doutora e Coordenadora do Curso de Ciência da Computação da UNIOESTE e Coordenadora Geral do LABI - UNIOESTE, Foz do Iguaçu, PR, Brasil
IIIEstagiário do Laboratório de Bioinformática (LABI), Universidade Estadual do Oeste do Paraná (UNIOESTE), Parque Tecnológico Itaipu (PTI), Foz do Iguaçu, PR, Brasil
IVProfessor Doutor do Departamento de Cirurgia (D.M.A.D.), Serviço de Coloproctologia da Universidade Estadual de Campinas (UNICAMP), Campinas, SP, Brasil
VProfessor Doutor do Departamento de Cirurgia da Faculdade de Ciências Médicas da UNICAMP, Campinas, SP, Brasil
VIProfessor e Coordenador da Área Computacional do LABI - UNIOESTE, Foz do Iguaçu, PR, Brasil
VIIPesquisador do Serviço de Coloproctologia da Faculdade de Ciências Médicas da UNICAMP, Campinas, SP, Brasil. Professor Doutor da UNIOESTE e Coordenador da Área Médica do LABI - UNIOESTE, Foz do Iguaçu, PR, Brasil

Endereço para correspondência

 

 


RESUMO:

OBJETIVO: analisar a qualidade preditiva de modelos computacionais para a diferenciação de tecidos cólicos, construídos a partir da representação de Imagens de Coloscopia (IC) como Matrizes de Co-ocorrência (MC).
MATERIAIS E MÉTODOS: os modelos foram construídos aplicando técnicas de análise de imagens e de inteligência artificial. Foram utilizadas 67 IC, contendo pólipos, a partir das quais foram extraídas uma imagem da parte de tecido de pólipo e outra de tecido sem pólipo adjacente, totalizando 134 imagens. Para cada imagem, foram construídas MC para diferentes valores do parâmetro distância, D = 1 a 5, e extraídas 11 características de textura. Com essa representação, foram criados cinco modelos computacionais baseados em árvores de decisão. Os modelos foram avaliados utilizando: (a) validação cruzada e (b) tabelas de contingência.
RESULTADOS: na análise (a), o modelo de D = 3 apresentou o menor erro médio (22,25% ± 11,85%). Na análise (b), os modelos de D = 1 e 3 apresentaram os melhores valores de precisão.
CONCLUSÃO: os valores do parâmetro de distância D = 1 e 3 apresentaram os modelos com as melhores qualidades preditivas. Os resultados mostraram que os modelos construídos apresentaram-se promissores para a construção de sistemas computacionais de suporte à decisão.

Descritores: Colonoscopia, Polipose Intestinal, Neoplasias do Cólon, Inteligência Artificial, Interpretação de Imagem Assistida por Computador.


ABSTRACT

PURPOSE: to evaluate the predictive quality of computational models to differentiate colic tissues, based on Cooccorrurence Matrices (MC) representation of Coloscopic Images (IC).
MATERIALS AND METHODS: image analysis and artificial intelligence methods were employed to construct computational models. Sixty seven IC images, containing polyp, were considered in this work, from which a part containing a polypus and another without it were collected given origin to 134 images. For each one of these, different MC were constructed considering five distance parameters (D = 1 to 5) and the extraction of 11 texture characteristics. With this representation, five computational models were generated based on decision trees. These models were evaluated using two techniques: (a) cross-validation and (b) contingency tables.
RESULTS: for the (a) analysis, the model with D = 3 presented the smaller average error (22.25% ± 11.85%). For the (b) analysis, models with D = 1 and 3 presented the best precision values.
CONCLUSION: parameters D = 1 and 3 presented models with the best predictive qualities. Results showed that the constructed models were promising to be applied within decision making computational systems.

Key words: Colonoscopy, Intestinal Polyposis, Colonic Neoplasms, Artificial Intelligence, Image Interpretation.


 

 

INTRODUÇÃO

Exames médicos são registrados, frequentemente, em hospitais e clínicas médicas, por meio da utilização de Sistemas de Gerenciamento de Dados, os quais possibilitam que registros com informações de pacientes e de exames relacionados, sejam armazenados e consultados pelos especialistas. A descrição desses exames pode estar representada em diversos formatos, como texto, imagem e vídeo(1,2), com o objetivo de complementar os laudos médicos realizados pelos especialistas e, desse modo, prover uma descrição mais completa a respeito do estado de saúde do paciente.

Nesse sentido, imagens médicas provenientes de exames coloscópicos, por exemplo, têm sido comumente armazenadas com o intuito de prover esse complemento e dar suporte aos especialistas no diagnóstico de enfermidades. Ainda, essas imagens, podem ser analisadas por processos computacionais que permitam extrair informações relevantes a respeito das anormalidades evidenciadas por meio desse exame. Duas áreas para prover suporte a essa tarefa são: (1) Análise de Imagens e (2) Inteligência Computacional. A primeira refere-se à extração de informações relevantes em imagens e, a segunda, à busca de padrões e à construção de modelos(3), os quais permitem classificar imagens nunca antes classificadas.

No Brasil, segundo o Instituto Nacional do Câncer (INCA), o câncer colorretal constitui uma das neoplasias malignas de maior incidência na população, ocupando o quarto lugar em relação ao sexo masculino e o terceiro lugar em relação ao sexo feminino(4). De acordo com o INCA, no ano de 2008, haverá aproximadamente 12.490 casos desse tipo de câncer em homens e 14.500 em mulheres. Em relação à mortalidade média mundial, o câncer de cólon e reto, não apresenta grandes diferenças entre países desenvolvidos e países em desenvolvimento(4). A coloscopia apresentase como uma ferramenta indispensável para o diagnóstico de doenças do intestino grosso, o que torna importante a análise computacional para a identificação automática de anormalidades evidenciadas por esse exame médico.

O presente trabalho está inserido em um projeto maior, de Análise de Imagens Médicas, o qual é desenvolvido em uma parceria entre o LABI/ UNIOESTE e o SC/FCM/UNICAMP. Nesse contexto, este trabalho tem como objetivo analisar a qualidade preditiva de modelos computacionais para a diferenciação de tecidos cólicos, construídos a partir da representação de Imagens de Coloscopia (IC) como Matrizes de Co-ocorrência (MC).

 

MATERIAIS E MÉTODOS

Para a realização deste trabalho, 67 imagens de exames de coloscopia, provenientes do SC/FCM/ UNICAMP, referentes a pólipos do tipo Protruso Pediculado (de acordo com os padrões da Sociedade Japonesa do Câncer Colorretal), foram submetidas a uma metodologia que possibilita a extração de características intrínsecas de fragmentos de imagem de tecido cólico e a busca de padrões para a construção de modelos de classificação(5). Essa metodologia, a qual é apoiada por um sistema computacional desenvolvido no LABI/UNIOESTE, denominado Medical Image Analysis System (MIAS)(5,6), é constituída de quatro etapas: (1) coleta do Conjunto de Imagens (CI); (2) construção do Vetor de Características (VC); (3) construção de modelos de classificação; e (4) avaliação de modelos.

Na Etapa (1) foi realizada a coleta do conjunto de imagens para análise. Para cada imagem foram selecionadas uma parte de imagem de mucosa normal e outra de pólipo cólico (Figura 1). Desse modo, foi construído o CI contendo 134 imagens, cada uma referente a uma das partes selecionadas. Na Etapa (2) essas imagens foram submetidas ao processo de extração de características. Neste trabalho foram extraídas características de textura, baseadas em MC, as quais representam as transições de nível de intensidade entre pontos da imagem considerando uma distância e uma direção(2).

 

 

Na figura 2, é apresentado um exemplo de construção de MC a partir de uma imagem de 5 x 5 pontos e 3 níveis de intensidade(2). Na MC, as Linhas (L) e Colunas (C) representam os níveis de intensidade, e cada posição da matriz corresponde ao número de transições do nível de cinza L para nível de cinza C considerando direção 0º e distância D = 1. Desse modo, foram extraídas 11 características de textura cujos valores foram calculados a partir das MC. Essas características são representadas pelo: segundo momento angular, pelo contraste, pela correlação, por meio da variância, da entropia, do momento inverso da diferença, da soma da média, da soma da variância, da soma da entropia, da diferença da variância e da diferença da entropia(7). A extração dessas características requer a definição de três parâmetros: (a) número de níveis de cinza da imagem ou qualidade, representada por L ou C; (b) a distância D a ser considerada, que identifica o grau de aproximação da imagem; e (c) a direção, que indica a angulação de análise da imagem.

 

 

Ainda na Etapa (2), a partir das partes contidas em CI foram construídas cinco MC para cada parte, considerando valores de distância D = 1, 2, 3, 4 e 5, e extraídas as 11 características de textura mencionadas, para representar cada uma das partes a partir de um VC. Em relação à qualidade da imagem, foi determinada a não variação deste parâmetro, o qual foi fixado em 64 níveis de cinza. Assim, foram construídos cinco conjuntos de dados, CD1, CD2, CD3, CD4, CD5, os quais representam cada valor do parâmetro de distância considerado. Desse modo, os valores dos atributos de cada exemplo, desses conjuntos de dados, correspondem à média dos valores das características extraídas para as direções 0, 45, 90 e 135 graus.

Na Etapa (3) foram construídos modelos aplicando métodos de Aprendizado de Máquina, uma subárea da Inteligência Computacional que possibilita a busca de padrões em grandes conjuntos de dados e permite a geração de modelos de classificação. Um dos algoritmos computacionais para a geração de modelos é o J48, o qual consiste em uma implementação do algoritmo C4.5(8), disponibilizado pela ferramenta computacional WEKA1. Esse algoritmo consiste na divisão de conjuntos de dados multidimensionais a partir do traçado de sucessivos hiperplanos, que permitam diferenciar as classes envolvidas no problema. Desse modo, nessa etapa os modelos são construídos com o objetivo de diferenciar partes de tecido cólico normal de partes de tecido de pólipo cólico.

Ao final, na Etapa (4), foi realizada a avaliação dos modelos construídos na etapa anterior. Primeiramente foi utilizada a técnica de validação cruzada com dez partições(9), para obter uma aproximação do erro verdadeiro do modelo quanto à capacidade de predição. Posteriormente, foram construídas as tabelas de contingência para cada modelo, no intuito de extrair as medidas de Valor Preditivo Positivo (VPP), Valor Preditivo Negativo (VPN), Sensibilidade (S) e Especificidade (E)(9). A análise estatística foi realizada por meio do aplicativo GraphPad InStat®2, aplicandose o teste t student considerando um nível de significância de 95% (p-valor=0,05).

 

RESULTADOS

A tabela 1 apresenta a avaliação da precisão preditiva dos modelos construídos considerando D = 1, 2, 3, 4 e 5, de acordo com a análise dos valores de erro médio e de desvio-padrão obtidos pela validação cruzada. Essa tabela também apresenta os p-valores resultantes do teste estatístico para verificar a seleção do modelo de maior precisão.

Nas tabelas 2, 3, 4, 5 e 6, são apresentadas as tabelas de contingência dos modelos construídos considerando D = 1, 2, 3, 4 e 5, respectivamente.

Os valores de VPP, VPN, S e E correspondentes a cada modelo computacional construído são apresentados na tabela 7.

 

DISCUSSÃO

Na análise de imagens médicas é frequente a descrição de imagens conforme propriedades baseadas em cor, textura e forma(10). Em trabalho anterior analisado(11) foi realizada a classificação de exames de coloscopia de pacientes com câncer colorretal e pacientes sem essa enfermidade. As imagens coletadas foram representadas por meio de características glo

bais extraídas a partir de MC. No entanto, para a identificação de tecidos de pólipos em imagens de coloscopia é essencial a realização de uma análise local, pois por meio desse procedimento, tecidos cólicos normais e anormais poderão ser diferenciados em uma mesma imagem. Sob esse escopo, foi realizada, em trabalho anterior(12), a análise local de imagens de coloscopia contendo pólipos, utilizando o espectro de textura da imagem. Assim, essas imagens foram classificadas de acordo com a similaridade identificada entre os espectros de textura de tecidos de pólipo e de tecidos com ausência de pólipo. Todavia, confrontando as características de análise do trabalho anterior com o atualmente citado(6), neste último, as imagens foram submetidas ao processo de extração de características a partir das MC e avaliado o parâmetro de qualidade da imagem, isto é, o número de níveis de cinza a ser considerado na análise (parâmetro (a)). Com isso, concluiu-se que a qualidade da imagem e o tempo computacional de processamento são diretamente proporcionais. Entretanto, é importante ressaltar que a qualidade de imagem não representa diretamente a precisão do modelo de classificação, pois diferentes valores para cada característica podem influenciar na ordem em que o algoritmo J48 escolhe os atributos para a criação dos hiperplanos, o que resulta na construção de árvores de decisão com estruturas diferentes. De acordo com essas considerações o parâmetro (a), de qualidade da imagem, foi fixado em 64 níveis de cinza. Para avaliar a capacidade do método para construir modelos que permitam classificar tecidos de mucosa cólica de pólipo e sem pólipo, o parâmetro (b), de distância, foi avaliado neste trabalho.

A análise dos resultados, considerando a precisão preditiva obtida pelo método de validação cruzada, indicou que o modelo construído com D = 3 apresentou o menor erro médio, enquanto que o modelo correspondente ao valor de D = 5 apresentou o menor desvio-padrão. Ainda, o valor desse desvio padrão diminuiu quando a distância aproximou-se de D = 5. A partir destes resultados, constatou-se a necessidade de verificar a existência de diferença estatisticamente significativa entre os modelos, de modo que se possa comprovar, ou refutar, a superioridade do modelo que considera D = 3 em relação à precisão preditiva de cada um dos outros modelos construídos. Os erros médios considerados foram submetidos e aceitos no teste de normalidade, o que permitiu a aplicação do teste estatístico t. Este teste foi realizado com nível de significância de 95% para amostras emparelhadas.

Os p-valores obtidos a partir da aplicação do teste t para os modelos construídos com D = 1, 2, 4 e 5 foram de 0,550,0,131,0,048 e 0,101, respectivamente, conforme é apresentado na Tabela 1. Desse modo, o teste permitiu evidenciar diferença estatisticamente significativa apenas entre o modelo D = 3 e D = 4, sendo que, em relação aos outros modelos construídos, os p-valores foram maiores do que 0,05.

Com relação aos valores calculados a partir das tabelas de contingência (Tabela 7), o modelo construído com D = 1 apresentou as medidas VPP e E maiores que os outros modelos. Desse modo, foi evidenciada a capacidade do modelo de classificar fragmentos de tecidos de pólipo cólico como sendo dessa classe e de que, dado um fragmento de tecido de mucosa cólica normal, este seja classificado como tal. Por outro lado, em relação às medidas VPN e S, o modelo considerando D = 3 apresentou os maiores valores de probabilidade. Esse fato evidenciou a maior probabilidade de acerto na classificação de tecidos de mucosa cólica normal e de que, dado um fragmento de tecido de mucosa de pólipo, este seja classificado como tal.

A diferença entre a qualidade dos modelos em relação às medidas das tabelas de contingência pode ser verificada mais especificamente pelas tabelas 2 e 4, referentes às tabelas de contingência dos modelos gerados com D = 1 e 3, respectivamente, para fragmentos de tecido de mucosa de pólipo cólico e normal. Esses valores indicam que, de um total de 67 fragmentos de cada classe, o modelo de D = 1 identificou 46 fragmentos de mucosa de pólipo cólico e 56 normais, enquanto o modelo de D = 3 identificou 53 e 51, respectivamente.

Com relação à precisão de classificação dos modelos, considerando D = 1, dos 57 fragmentos classificados como de pólipo cólico, 46 foram corretos e dos 77 classificados como sem pólipo cólico, 56 foram corretos. Em relação à distância D = 3, dos 69 classificados como de pólipo cólico, 53 foram classificados corretamente e dos 65 classificados sem pólipo cólico, 51 foram classificados corretamente.

É importante ressaltar que não está sendo utilizada a forma estrutural do pólipo na imagem para análise, sendo apenas considerada a textura interna (Figura 1) dessa lesão tecidual. Desse modo, por meio da utilização de técnicas computacionais, foi possível representar esta estrutura por um conjunto de características que descrevem a textura do pólipo na imagem.

 

CONCLUSÃO

De acordo com os modelos construídos para a avaliação do parâmetro de distância, foi possível evidenciar a presença de padrões pictóricos de textura nos fragmentos de tecido pertencente à mucosa do pólipo cólico e à mucosa normal constituinte da parede do cólon. Desse modo, o valor de distância D = 3 apresentou-se como o mais adequado em relação à precisão preditiva, embora seja possível provar uma diferença estatisticamente significativa desse modelo apenas em relação ao modelo de D = 4. Além disso, esse modelo apresentou-se mais preciso em relação às medidas de VPN e S, enquanto o modelo de D = 1 apresentou-se o mais adequado para as medidas de VPP e E. É relevante salientar que o modelo referente à D = 3 apresentou o segundo melhor valor de precisão para as duas medidas. Com isso, a representação de fragmentos de tecidos cólicos por meio de atributos de textura poderá ser promissora para o auxílio na construção de modelos computacionais que permitam a diferenciação entre tecidos de mucosa de pólipo e normal.

 

AGRADECIMENTOS

Ao Programa de Desenvolvimento Tecnológico Avançado (PDTA/FPTI-BR) e à Fundação de Apoio ao Desenvolvimento Científico e Tecnológico do Paraná (ARAUCARIA).

 

REFERÊNCIAS

1. Karkanis S, Galoussi K, Maroulis D. Classification of Endoscopic Images Based on Texture Spectrum. Advance Course in Artificial Intelligence. Proceedings of Workshop on Machine Learning in Medical Applications; 1999; Chania, Grecia; p. 63-7.         [ Links ]

2. Felipe JC, Traina AJM, Traina C. Retrieval by Content of Medical Images Using Texture for Tissue Identification. Proceeding of the 16th IEEE Symposium on Computer-based Medical Systems; 2003; New York, USA; p 175-6.         [ Links ]

3. Rezende SO. Sistemas Inteligentes: Fundamentos e Aplicações. Barueri (SP), Brasil: Editora Manole; 2003.         [ Links ]

4. Instituto Nacional de Câncer (INCA). Estimativa 2008: Incidência de Câncer no Brasil. Rio de Janeiro (RJ), Brasil; 2007.         [ Links ]

5. Ferrero CA, Lee HD, Cherman E A, Coy CSR, Fagundes JJ, Góes JRN, et al. Utilização de Atributos Baseados em Textura para a Caracterização de Tecidos Cólicos em Imagens de Colonoscopia. Anais do VII Workshop de Informática Médica. 2007; Porto de Galinhas (PE), Brasil; p. 204-213.         [ Links ]

6. Ferrero CA, Spolaôr N, Lee HD, Coy CSR, Fagundes JJ, Wu FC. Estudo Comparativo de Matrizes de Co-ocorrência em Análise de Imagens Médicas: Diferenciação de Tecidos Cólicos. Anales del 11º Simposio Argentino de Informática y Salud, 37º Jornadas Argentinas de Informática; 2008; Santa Fe (SF), Argentina; p. 1-12.         [ Links ]

7. Haralick R; Shanmugam K; Dinstein I. Texture Features for Image Classification. Proceeding of IEEE Transaction on Systems, Man, and Cybernetis. 1973; 3(6): p. 610-621.         [ Links ]

8. Quinlan JR. C4.5: Programs for Machine Learning. San Mateo (CA), USA: Editora Morgan Kaufmann; 1993.         [ Links ]

9. Doria U. Introdução à Bioestatística: para simples mortais. São Paulo (SP), Brasil: Editora Elseiver; 1999.         [ Links ]

10. Howarth P, Yavlinsky A, Heesch D, Rüger S. Medical Image Retrieval Using Texture, Locality and Colour. Lecture Notes from the Cross Language Evaluation Forum. 2005; p. 740-749.         [ Links ]

11. Karkanis S, et al. Detecting Abnormalities in Colonoscopic Images by Textural Description and Neural Networks. Proceedings of Workshop on Machine Learning in Medical Applications, Advance Course in Artificial Intelligence; 1999; Chania, Greece; p. 5:59-62.         [ Links ]

12. Ferrero CA, Lee HD, Cherman EA, Coy CSR, Góes JRN, Fagundes JJ, Wu FC. Utilização de Técnicas Computacionais para a Diferenciação Cólicos em Imagens Colonoscópicas. 56º Congresso Brasileiro de Coloproctologia: Rev Bras de Coloproct 2007; Curitiba (PR), Brasil; 27: p. 45-46.         [ Links ]

 

 

Endereço para correspondência:
Carlos Andres Ferrero
Laboratório de Bioinformática (LABI)
Universidade Estadual do Oeste do Paraná (UNIOESTE)
Parque Tecnológico Itaipu (PTI)
Av. Tancredo Neves
6731 CEP: 85.856-970 / Caixa Postal: 39
Foz do Iguaçu - Paraná - Brasil
Fax: (45) 3522-3462
E-mail: anfer86@gmail.com

Recebido em 25/10/2008
Aceito para publicação em 13/11/2008

 

 

Trabalho realizado no Laboratório de Bioinformática (LABI), Universidade Estadual do Oeste do Paraná (UNIOESTE), Parque Tecnológico Itaipu (PTI), e no Serviço de Coloproctologia (SC) da Faculdade de Ciências Médicas (FCM) da Universidade Estadual de Campinas (UNICAMP).
Conflito de Interesses: nenhum Fonte de auxílio à pesquisa: Programa de Desenvolvimento Tecnológico Avançado - Fundação Parque Tecnológico Itaipu (PDTA/FPTI-BR). Termos de Concessão de Bolsa 009/2007, 041/2008 e 087/2008. Fundação de Apoio ao Desenvolvimento Científico e Tecnológico do Paraná (ARAUCARIA). Convênio 051/2007.

1 http://www.cs.waikato.ac.nz/ml/weka/
2 http://www.graphpad.com/

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License