Estudo comparativo de modelos computacionais gerados sobre representações de imagens de coloscopia: tecido de mucosa normal VS tecido de mucosa de pólipo cólico

Description
PURPOSE: to evaluate the predictive quality of computational models to differentiate colic tissues, based on Cooccorrurence Matrices (MC) representation of Coloscopic Images (IC). MATERIALS AND METHODS: image analysis and artificial intelligence

Please download to get full document.

View again

of 7
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Information
Category:

Criminal Justice

Publish on:

Views: 0 | Pages: 7

Extension: PDF | Download: 0

Share
Tags
Transcript
  23  Estudo Comparativo de Modelos Computacionais Gerados sobre Representações de Imagens de Coloscopia: Tecido de Mucosa Normal VS Tecido de Mucosa de Pólipo CólicoCarlos Andres Ferrero e Cols. Vol. 29Nº 1Rev bras ColoproctJaneiro/Março, 2009 Trabalho realizado no Laboratório de Bioinformática (LABI), Universidade Estadual do Oeste do Paraná (UNIOESTE), Parque Tecnológico Itaipu (PTI), e no Serviço de Coloproctologia (SC) da Faculdade de Ciências Médicas (FCM) da Universidade Estadual de Campinas(UNICAMP). Recebido em 25/10/2008  Aceito para publicação em 13/11/2008 Conflito de Interesses: nenhumFonte de auxílio à pesquisa: Programa de Desenvolvimento Tecnológico Avançado – Fundação Parque Tecnológico Itaipu (PDTA/FPTI-BR).Termos de Concessão de Bolsa 009/2007, 041/2008 e 087/2008. Fundação de Apoio ao Desenvolvimento Científico e Tecnológico do Paraná(ARAUCARIA). Convênio 051/2007. Estudo Comparativo de Modelos Computacionais Gerados sobreRepresentações de Imagens de Coloscopia: Tecido de MucosaNormal VS Tecido de Mucosa de Pólipo Cólico Comparative Study of Computacional Models Generated fromRepresentations of Colonoscopic Images: Normal Mucosal Tissues VSMucosal Tissues of Colic Polyp CARLOS ANDRES FERRERO 1 , HUEI DIANA LEE 2 , NEWTON SPOLAÔR 3 , CLÁUDIO SADDY RODRIGUES COY 4 ,JOÃO JOSÉ FAGUNDES 5 , RENATO BOBSIN MACHADO 6 , EVERTON ALVARES CHERMAN 3 , FENG CHUNG WU 7 1 Pesquisador do Laboratório de Bioinformática (LABI), Universidade Estadual do Oeste do Paraná (UNIOESTE),Parque Tecnológico Itaipu (PTI), Foz do Iguaçu, PR, Brasil; 2 Professora Doutora e Coordenadora do Curso de Ciênciada Computação da UNIOESTE e Coordenadora Geral do LABI – UNIOESTE, Foz do Iguaçu, PR, Brasil; 3 Estagiário do Laboratório de Bioinformática (LABI), Universidade Estadual do Oeste do Paraná (UNIOESTE), Parque Tecnológico Itaipu (PTI), Foz do Iguaçu, PR, Brasil; 4 Professor Doutor do Departamento de Cirurgia (D.M.A.D.), Serviço deColoproctologia da Universidade Estadual de Campinas (UNICAMP), Campinas, SP, Brasil; 5 Professor Doutor do Departamento de Cirurgia da Faculdade de Ciências Médicas da UNICAMP, Campinas, SP, Brasil; 6 Professor eCoordenador da Área Computacional do LABI – UNIOESTE, Foz do Iguaçu, PR, Brasil; 7 Pesquisador do Serviço deColoproctologia da Faculdade de Ciências Médicas da UNICAMP, Campinas, SP, Brasil. Professor Doutor daUNIOESTE e Coordenador da Área Médica do LABI – UNIOESTE, Foz do Iguaçu, PR, Brasil. RESUMO: Objetivo: analisar a qualidade preditiva de modelos computacionais para a diferenciação de tecidos cólicos, construídos apartir da representação de Imagens de Coloscopia (IC) como Matrizes de Co-ocorrência (MC). Materiais e Métodos: os modelos foramconstruídos aplicando técnicas de análise de imagens e de inteligência artificial. Foram utilizadas 67 IC, contendo pólipos, a partir dasquais foram extraídas uma imagem da parte de tecido de pólipo e outra de tecido sem pólipo adjacente, totalizando 134 imagens. Paracada imagem, foram construídas MC para diferentes valores do parâmetro distância, D = 1 a 5, e extraídas 11 características de textura.Com essa representação, foram criados cinco modelos computacionais baseados em árvores de decisão. Os modelos foram avaliadosutilizando: (a) validação cruzada e (b) tabelas de contingência. Resultados: na análise (a), o modelo de D = 3 apresentou o menor erromédio (22,25% ± 11,85%). Na análise (b), os modelos de D = 1 e 3 apresentaram os melhores valores de precisão. Conclusão: os valoresdo parâmetro de distância D = 1 e 3 apresentaram os modelos com as melhores qualidades preditivas. Os resultados mostraram que osmodelos construídos apresentaram-se promissores para a construção de sistemas computacionais de suporte à decisão.Descritores: Colonoscopia, Polipose Intestinal, Neoplasias do Cólon, Inteligência Artificial, Interpretação de Imagem Assistida por Com-putador.FERRERO CA; LEE HD; SPOLAÔR N; COY CSR; FAGUNDES JJ; MACHADO RB; CHERMAN EA; WU FC. Estudo Comparativode Modelos Computacionais Gerados sobre Representações de Imagens de Coloscopia: Tecido de Mucosa Normal VS Tecido de Mucosa dePólipo Cólico.   Rev bras Coloproct , 2009;29(1): 023-029.   Estudo Comparativo de Modelos Computacionais Gerados sobre Representações de Imagens de Coloscopia: Tecido de Mucosa Normal VS Tecido de Mucosa de Pólipo CólicoCarlos Andres Ferrero e Cols. 24 Vol. 29Nº 1Rev bras ColoproctJaneiro/Março, 2009 INTRODUÇÃO Exames médicos são registrados, frequente-mente, em hospitais e clínicas médicas, por meio dautilização de Sistemas de Gerenciamento de Dados, osquais possibilitam que registros com informações depacientes e de exames relacionados, sejam armazena-dos e consultados pelos especialistas. A descrição des-ses exames pode estar representada em diversos for-matos, como texto, imagem e vídeo (1,2) , com o objetivode complementar os laudos médicos realizados pelosespecialistas e, desse modo, prover uma descrição maiscompleta a respeito do estado de saúde do paciente.Nesse sentido, imagens médicas provenientesde exames coloscópicos, por exemplo, têm sidocomumente armazenadas com o intuito de prover essecomplemento e dar suporte aos especialistas no diag-nóstico de enfermidades. Ainda, essas imagens, podemser analisadas por processos computacionais que per-mitam extrair informações relevantes a respeito dasanormalidades evidenciadas por meio desse exame.Duas áreas para prover suporte a essa tarefa são: (1)Análise de Imagens e (2) Inteligência Computacional.A primeira refere-se à extração de informações rele-vantes em imagens e, a segunda, à busca de padrões eà construção de modelos (3) , os quais permitem classifi-car imagens nunca antes classificadas.No Brasil, segundo o Instituto Nacional doCâncer (INCA), o câncer colorretal constitui uma dasneoplasias malignas de maior incidência na população,ocupando o quarto lugar em relação ao sexo masculinoe o terceiro lugar em relação ao sexo feminino (4) . Deacordo com o INCA, no ano de 2008, haverá aproxi-madamente 12.490 casos desse tipo de câncer em ho-mens e 14.500 em mulheres. Em relação à mortalida-de média mundial, o câncer de cólon e reto, não apre-senta grandes diferenças entre países desenvolvidos epaíses em desenvolvimento (4) . A coloscopia apresenta-se como uma ferramenta indispensável para o diag-nóstico de doenças do intestino grosso, o que tornaimportante a análise computacional para a identifica-ção automática de anormalidades evidenciadas por esseexame médico.O presente trabalho está inserido em um pro- jeto maior, de Análise de Imagens Médicas, o qual édesenvolvido em uma parceria entre o LABI/ UNIOESTE e o SC/FCM/UNICAMP. Nesse contex-to, este trabalho tem como objetivo analisar a qualida-de preditiva de modelos computacionais para a dife-renciação de tecidos cólicos, construídos a partir darepresentação de Imagens de Coloscopia (IC) comoMatrizes de Co-ocorrência (MC). MATERIAIS E MÉTODOS Para a realização deste trabalho, 67 imagensde exames de coloscopia, provenientes do SC/FCM/ UNICAMP, referentes a pólipos do tipo ProtrusoPediculado (de acordo com os padrões da SociedadeJaponesa do Câncer Colorretal), foram submetidas auma metodologia que possibilita a extração de carac-terísticas intrínsecas de fragmentos de imagem de te-cido cólico e a busca de padrões para a construção demodelos de classificação (5) . Essa metodologia, a qual éapoiada por um sistema computacional desenvolvidono LABI/UNIOESTE, denominado  Medical Image Analysis System  (MIAS) (5,6) , é constituída de quatroetapas: (1) coleta do Conjunto de Imagens (CI); (2)construção do Vetor de Características (VC); (3) cons-trução de modelos de classificação; e (4) avaliação demodelos.Na Etapa (1) foi realizada a coleta do conjuntode imagens para análise. Para cada imagem foramselecionadas uma parte de imagem de mucosa normale outra de pólipo cólico (Figura 1). Desse modo, foiconstruído o CI contendo 134 imagens, cada uma refe-rente a uma das partes selecionadas. Na Etapa (2)essas imagens foram submetidas ao processo de ex-tração de características. Neste trabalho foram extra-ídas características de textura, baseadas em MC, asquais representam as transições de nível de intensida-de entre pontos da imagem considerando uma distân-cia e uma direção (2) .Na figura 2, é apresentado um exemplo deconstrução de MC a partir de uma imagem de 5 x 5pontos e 3 níveis de intensidade (2) . Na MC, as Linhas(L) e Colunas (C) representam os níveis de intensida-de, e cada posição da matriz corresponde ao númerode transições do nível de cinza L para nível de cinza Cconsiderando direção 0º e distância D = 1. Desse modo,foram extraídas 11 características de textura cujos va-lores foram calculados a partir das MC. Essas carac-terísticas são representadas pelo: segundo momentoangular, pelo contraste, pela correlação, por meio davariância, da entropia, do momento inverso da diferen-ça, da soma da média, da soma da variância, da somada entropia, da diferença da variância e da diferençada entropia (7) . A extração dessas características requer  25  Estudo Comparativo de Modelos Computacionais Gerados sobre Representações de Imagens de Coloscopia: Tecido de Mucosa Normal VS Tecido de Mucosa de Pólipo CólicoCarlos Andres Ferrero e Cols. Vol. 29Nº 1Rev bras ColoproctJaneiro/Março, 2009 a definição de três parâmetros: (a) número de níveisde cinza da imagem ou qualidade, representada por Lou C; (b) a distância D a ser considerada, que identifi-ca o grau de aproximação da imagem; e (c) a direção,que indica a angulação de análise da imagem.Ainda na Etapa (2), a partir das partes conti-das em CI foram construídas cinco MC para cada par-te, considerando valores de distância D = 1, 2, 3, 4 e 5,e extraídas as 11 características de textura menciona-das, para representar cada uma das partes a partir deum VC. Em relação à qualidade da imagem, foi deter-minada a não variação deste parâmetro, o qual foi fi-xado em 64 níveis de cinza. Assim, foram construídoscinco conjuntos de dados, CD 1 , CD 2 , CD 3 , CD 4 , CD 5 ,os quais representam cada valor do parâmetro de dis-tância considerado. Desse modo, os valores dos atri-butos de cada exemplo, desses conjuntos de dados,correspondem à média dos valores das característicasextraídas para as direções 0, 45, 90 e 135 graus.Na Etapa (3) foram construídos modelos apli-cando métodos de Aprendizado de Máquina, umasubárea da Inteligência Computacional que possibilitaa busca de padrões em grandes conjuntos de dados epermite a geração de modelos de classificação. Umdos algoritmos computacionais para a geração de mo-delos é o J48, o qual consiste em uma implementaçãodo algoritmo C4.5 (8) , disponibilizado pela ferramentacomputacional WEKA 1 . Esse algoritmo consiste nadivisão de conjuntos de dados multidimensionais a par-tir do traçado de sucessivos hiperplanos, que permitamdiferenciar as classes envolvidas no problema. Dessemodo, nessa etapa os modelos são construídos com oobjetivo de diferenciar partes de tecido cólico normalde partes de tecido de pólipo cólico.Ao final, na Etapa (4), foi realizada a avalia-ção dos modelos construídos na etapa anterior. Primei-ramente foi utilizada a técnica de validação cruzadacom dez partições (9) , para obter uma aproximação doerro verdadeiro do modelo quanto à capacidade de pre-dição. Posteriormente, foram construídas as tabelas decontingência para cada modelo, no intuito de extrair asmedidas de Valor Preditivo Positivo (VPP), ValorPreditivo Negativo (VPN), Sensibilidade (S) eEspecificidade (E) (9) . A análise estatística foi realizadapor meio do aplicativo GraphPad InStat ® 2 , aplicando-se o teste t student   considerando um nível designificância de 95% (  p -valor=0,05). RESULTADOS A tabela 1 apresenta a avaliação da precisãopreditiva dos modelos construídos considerando D = 1,2, 3, 4 e 5, de acordo com a análise dos valores de erromédio e de desvio-padrão obtidos pela validação cru-zada. Essa tabela também apresenta os  p -valores re-sultantes do teste estatístico para verificar a seleçãodo modelo de maior precisão.Nas tabelas 2, 3, 4, 5 e 6, são apresentadas astabelas de contingência dos modelos construídos con-siderando D = 1, 2, 3, 4 e 5, respectivamente.Os valores de VPP, VPN, S e E correspon-dentes a cada modelo computacional construído sãoapresentados na tabela 7. DISCUSSÃO Na análise de imagens médicas é frequente adescrição de imagens conforme propriedades basea-das em cor, textura e forma (10) . Em trabalho anterioranalisado (11)  foi realizada a classificação de exames decoloscopia de pacientes com câncer colorretal e paci-entes sem essa enfermidade. As imagens coletadasforam representadas por meio de características glo-  Figura 2 –  Imagem representada em três níveis de cinza comouma matriz de pixels 5x5 e a respectiva MC para a direção 0º e adistância 1.  Figura 1 – Seleção de fragmentos de tecido de mucosa normal e de pólipo cólico.   Estudo Comparativo de Modelos Computacionais Gerados sobre Representações de Imagens de Coloscopia: Tecido de Mucosa Normal VS Tecido de Mucosa de Pólipo CólicoCarlos Andres Ferrero e Cols. 26 Vol. 29Nº 1Rev bras ColoproctJaneiro/Março, 2009 bais extraídas a partir de MC. No entanto, para a iden-tificação de tecidos de pólipos em imagens decoloscopia é essencial a realização de uma análise lo-cal, pois por meio desse procedimento, tecidos cólicosnormais e anormais poderão ser diferenciados em umamesma imagem. Sob esse escopo, foi realizada, emtrabalho anterior (12) , a análise local de imagens decoloscopia contendo pólipos, utilizando o espectro detextura da imagem. Assim, essas imagens foram clas-sificadas de acordo com a similaridade identificada entreos espectros de textura de tecidos de pólipo e de teci-dos com ausência de pólipo. Todavia, confrontando ascaracterísticas de análise do trabalho anterior com oatualmente citado (6) , neste último, as imagens foramsubmetidas ao processo de extração de característicasa partir das MC e avaliado o parâmetro de qualidadeda imagem, isto é, o número de níveis de cinza a serconsiderado na análise (parâmetro (a)). Com isso, con-cluiu-se que a qualidade da imagem e o tempocomputacional de processamento são diretamente pro- Tabela 1 –    Avaliação preditiva dos modelos construídos considerando as distâncias D = 1, 2, 3, 4 e 5. Distância12345 Precisão média23,90128,29722,25329,01130,604Desvio-padrão12,36612,21611,85010,0848,369  p -valor t    student  0,5500,131-0,0480,101 Tabela 2 – Tabela de contingência do modelo construído considerando distância 1. Classificação pelo modeloTecidoTecido de pólipoTecido sem pólipoTotal De pólipo462167Sem pólipo115667Total5777134 Tabela 3 – Tabela de contingência do modelo construído considerando distância 2. Classificação pelo modeloTecidoTecido de pólipoTecido sem pólipoTotal De pólipo472067Sem pólipo184967Total6569134 Tabela 4 – Tabela de contingência do modelo construído considerando distância 3. Classificação pelo modeloTecidoTecido de pólipoTecido sem pólipoTotal De pólipo531467Sem pólipo165167Total6965134  27  Estudo Comparativo de Modelos Computacionais Gerados sobre Representações de Imagens de Coloscopia: Tecido de Mucosa Normal VS Tecido de Mucosa de Pólipo CólicoCarlos Andres Ferrero e Cols. Vol. 29Nº 1Rev bras ColoproctJaneiro/Março, 2009 porcionais. Entretanto, é importante ressaltar que aqualidade de imagem não representa diretamente aprecisão do modelo de classificação, pois diferentesvalores para cada característica podem influenciar naordem em que o algoritmo J48 escolhe os atributos paraa criação dos hiperplanos, o que resulta na construçãode árvores de decisão com estruturas diferentes. Deacordo com essas considerações o parâmetro (a), dequalidade da imagem, foi fixado em 64 níveis de cinza.Para avaliar a capacidade do método para construirmodelos que permitam classificar tecidos de mucosacólica de pólipo e sem pólipo, o parâmetro (b), de dis-tância, foi avaliado neste trabalho.A análise dos resultados, considerando a pre-cisão preditiva obtida pelo método de validação cruza-da, indicou que o modelo construído com D = 3 apre-sentou o menor erro médio, enquanto que o modelocorrespondente ao valor de D = 5 apresentou o menordesvio-padrão. Ainda, o valor desse desvio padrão di-minuiu quando a distância aproximou-se de D = 5. Apartir destes resultados, constatou-se a necessidade deverificar a existência de diferença estatisticamente sig-nificativa entre os modelos, de modo que se possa com-provar, ou refutar, a superioridade do modelo que con-sidera D = 3 em relação à precisão preditiva de cadaum dos outros modelos construídos. Os erros médiosconsiderados foram submetidos e aceitos no teste denormalidade, o que permitiu a aplicação do teste esta-tístico t  . Este teste foi realizado com nível designificância de 95% para amostras emparelhadas.Os  p -valores obtidos a partir da aplicação doteste t para os modelos construídos com D = 1, 2, 4 e 5foram de 0,550 , 0,131 , 0,048   e 0,101 , respectiva-mente, conforme é apresentado na Tabela 1. Dessemodo, o teste permitiu evidenciar diferença estatistica-mente significativa apenas entre o modelo D = 3 e D =4, sendo que, em relação aos outros modelos construídos,os  p -valores foram maiores do que 0,05 . Tabela 5 – Tabela de contingência do modelo construído considerando distância 4. Classificação pelo modeloTecidoTecido de pólipoTecido sem pólipoTotal De pólipo501767Sem pólipo224567Total7262134 Tabela 6 – Tabela de contingência do modelo construído considerando distância 5. Classificação pelo modeloTecidoTecido de pólipoTecido sem pólipoTotal De pólipo511667Sem pólipo254267Total7658134 Tabela 7 – Valores calculados a partir da tabela de contingência. DistânciaVPPVPNSE 180,70%72,73%68,66%83,58%272,31%71,01%70,15%73,13%376,81%78,46%79,10%76,12%469,44%72,58%74,63%67,16%567,11%72,41%76,12%62,69%
Related Search
Similar documents
View more...
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks