Acessibilidade / Reportar erro

Extração automatica de feições rodoviáris em imagens digitais

Resumos

Este artigo apresenta uma metodologia automática para a extração da malha viária em imagens de média- e alta-resolução. Baseia-se em duas etapas. Na primeira etapa sementes de rodovia são extraídas usando um conjunto de quatro objetos semânticos de rodovia e regras de conexão entre eles. Cada objeto semântico de rodovia é uma representação local de um segmento de rodovia aproximadamente reto. No segundo passo, duas estratégias para complementação automática da malha viária são aplicadas a fim de gerar a malha viária completa. A primeira estratégia baseia-se em duas regras básicas de agrupamento perceptivo, isto é, as regras de colinearidade e proximidade, que permitem a reconstrução seqüencial das lacunas entre cada par de sementes de rodovia desconectadas. A segunda estratégia de complementação da malha viária visa reconstruir os cruzamentos de rodovia. Basicamente, polígonos representando os cruzamentos de rodovia são extraídos. Este artigo apresenta a metodologia proposta e os resultados experimentais.

sementes de rodovia; agrupamento perceptivo; agrupamento de rodovia


This paper presents an automatic methodology for road network extraction from medium- and high-resolution images. It is based on two steps. In the first step road seeds are extracted using a set of four road objects and connection rules among them. Each road object is a local representation of an approximately straight road segment. In the second step, two strategies for road network completion are applied in order to generate the complete road network. The first strategy is based on two basic perceptual grouping rules, i.e., proximity and collinearity rules, which allow the sequential reconstruction of gaps between every pair of disconnected road seeds. The second strategy for road network completion aims at reconstructing road crossings. Basically, polygons representing the road crossings are extracted. This paper presents the proposed methodology and experimental results.

road seeds; perceptual grouping; road crossing


SISTEMAS INTELIGENTES

Extração automatica de feições rodoviáris em imagens digitais

Aluir Porfirio Dal Poz; Rodrigo Bruno Zanin; Giovane Maia do Vale

Depto. de Cartografia - FCT-UNESP, Caixa Postal 467, CEP 19060-900 - Presidente Prudente SP

RESUMO

Este artigo apresenta uma metodologia automática para a extração da malha viária em imagens de média- e alta-resolução. Baseia-se em duas etapas. Na primeira etapa sementes de rodovia são extraídas usando um conjunto de quatro objetos semânticos de rodovia e regras de conexão entre eles. Cada objeto semântico de rodovia é uma representação local de um segmento de rodovia aproximadamente reto. No segundo passo, duas estratégias para complementação automática da malha viária são aplicadas a fim de gerar a malha viária completa. A primeira estratégia baseia-se em duas regras básicas de agrupamento perceptivo, isto é, as regras de colinearidade e proximidade, que permitem a reconstrução seqüencial das lacunas entre cada par de sementes de rodovia desconectadas. A segunda estratégia de complementação da malha viária visa reconstruir os cruzamentos de rodovia. Basicamente, polígonos representando os cruzamentos de rodovia são extraídos. Este artigo apresenta a metodologia proposta e os resultados experimentais.

Palavras-chave: sementes de rodovia, agrupamento perceptivo, agrupamento de rodovia.

ABSTRACT

This paper presents an automatic methodology for road network extraction from medium- and high-resolution images. It is based on two steps. In the first step road seeds are extracted using a set of four road objects and connection rules among them. Each road object is a local representation of an approximately straight road segment. In the second step, two strategies for road network completion are applied in order to generate the complete road network. The first strategy is based on two basic perceptual grouping rules, i.e., proximity and collinearity rules, which allow the sequential reconstruction of gaps between every pair of disconnected road seeds. The second strategy for road network completion aims at reconstructing road crossings. Basically, polygons representing the road crossings are extracted. This paper presents the proposed methodology and experimental results.

Key words: road seeds, perceptual grouping, road crossing.

1 INTRODUÇÃO

O problema de extração de feições em imagens digitais tem sido, por um longo tempo, um desafio bastante grande nas mais variadas comunidades científicas. Por exemplo, Kovalevskii (1967) utilizou o algoritmo de programação dinâmica para extrair caracteres tipografados e manuscritos. Em Tommaselli (1993) o problema de extração de feições retas (segmentos de reta, como arestas internas de edificações) era de importância fundamental para determinar a posição e orientação de um sistema de visão estéreo aplicado à visão robótica. Uma aplicação na área médica é encontrada em Yamada et alii (1988), onde é descrita a extração de glomérulos em imagens de microscópio de seções renais, consistindo de formas geométricas aproximadamente circulares. Na área de Ciências Cartográficas, o problema de extração de feições tem sido de fundamental importância, há mais de duas décadas, na automação dos processos de coleta de feições cartográficas, como edifícios, rios, rodovias etc. Nesta área do conhecimento a automação é muito difícil devido à alta complexidade das cenas envolvidas, as quais são capturadas através de sensores geralmente embarcados em aeronaves e satélites, como as câmeras CCD (Charge Coupled Device) e os sistemas de varredura a laser. Neste contexto, a grande dificuldade é a atribuição do significado ao objeto de interesse (por exemplo, uma rodovia), isto porque é muito difícil entender e, após, modelar o mecanismo de visão humana num sistema de visão computacional. Após a realização do reconhecimento, o delineamento do objeto de interesse costuma ser bem mais fácil. Portanto, a tarefa de extração de feições envolve duas outras subtarefas, isto é, o reconhecimento e o delineamento. Embora estas duas subtarefas nem sempre possam ser separadas em processos de extração de feições, elas são úteis para caracterizar os métodos quanto ao nível de automação. Os métodos automáticos desempenham ambas as tarefas de reconhecimento e de delineamento mas, em se tratando de métodos semi-automáticos, é apenas inerente a tarefa de delineamento, uma vez que o reconhecimento fica a cargo da habilidade interpretativa de um operador.

O foco desse artigo é a extração automática de feições rodoviárias em imagens digitais de alta- e de média -resolução. As imagens de alta-resolução possuem, no contexto de extração de rodovias (Baumgartner et alii, 1999), resolução geométrica superior a 0,7 m. No mesmo contexto, as imagens com resolução geométrica no intervalo [0,7 m; 2,0 m] são classificadas como de média-resolução. Este artigo está organizado em 5 seções. A Seção 2 apresenta os trabalhos relacionados com o tema tratado aqui, mas com ênfase bem maior sobre os métodos automáticos. A metodologia desenvolvida para a extração automática de feições rodoviárias é apresentada na Seção 3. Os resultados experimentais são apresentados e discutidos na Seção 4. A Seção 5 finaliza o artigo com as principais conclusões.

2 TRABALHOS RELACIONADOS

O problema de extração de feições rodoviárias começou a ser investigado em meados da década de 1970, quando as imagens digitais do sensor MSS/LANDSAT tornaram-se disponíveis para a comunidade científica. Inúmeras pesquisas foram realizadas desde os trabalhos pioneiros de Bajcsy e Tavakoli (1976) e de Quam (1978).

A maior parte das metodologias encontradas na literatura é de concepção semi-automática. Neste caso, cabe ao operador a realização das tarefas de alto nível (por exemplo, o reconhecimento da feição rodoviária e fornecimento de alguns pontos sementes) e ao algoritmo computacional a realização do delineamento geométrico, que normalmente é cansativo e moroso. Estratégias baseadas em contorno ativo ou snakes (Kass et alii 1987, Neuenschwander et alii, 1997, Agouris et alii, 2000, Trinder et alii (2000)) e em otimização por programação dinâmica (Merlet e Zerubia, 1996, Gruen e Li, 1997, Dal Poz e Vale, 2003) são exemplos de metodologias semi-automáticas.

Os métodos automáticos tentam evitar totalmente a intervenção humana durante o processo de extração. Recentemente, várias soluções foram propostas.

Alguns métodos automáticos requerem a integração de informação contextual e de conhecimento a priori do objeto rodovia. Um exemplo é encontrado em Baumgartner et alii (1999), em que contexto, técnicas de agrupamento perceptivo e diferentes resoluções são usados para extrair a malha viária em imagens de alta resolução de cenas rurais. Laptev et alii (2000) aperfeiçoou esta metodologia introduzindo um tipo especial de contorno ativo, denominado ziplock, que melhorou o desempenho do método nos locais bastante perturbados por obstruções, como sombras e árvores. Hinz (2004) também combinou conhecimento a priori sobre rodovia, contexto e diferentes resoluções, só que agora para extrair a malha viária em ambiente urbanos complexos. Wessel (2004) também reporta o uso de contexto para auxiliar na extração da malha viária mas, nesse caso, em imagens SAR. Em Wang e Trinder (2000) é encontrada uma metodologia para extrair a malha viária em imagens de baixa resolução, sendo que neste caso se utilizou imagens aéreas reamostradas, ficando com resolução na ordem de 12 m. Basicamente, o método usa técnicas de detecção e extração de linhas para encontrar as candidatas às rodovias e conhecimento a priori sobre malha viária para eliminar as falsas rodovias.

Alguns métodos automáticos baseados em alguma técnica de otimização foram propostos recentemente. Youn et alii (2004) assume que a malha viária urbana possui um padrão aproximadamente regular. Com base nesta hipótese, a imagem é segmentada segundo as direções esperadas das rodovias, permitindo a obtenção de segmentos de rodovia. Um processo de otimização baseado em contorno ativo é utilizado para conectar estes segmentos e, assim, gerar a malha viária. Stoica et alii (2004) propuseram um método para extrair a malha viária em imagens do satélite de sensoriamento remoto SPOT. A malha viária é modelada como sendo uma estrutura em rede, formada por segmentos de reta conectados, dando origem a um modelo estocástico conhecido como cadeia de Markov. Este modelo é resolvido pela estimativa MAP (Máximum a Posteriori), gerando a malha completa num único passo.

Atualmente, uma tendência de pesquisa é usar dados de novos sensores para fazer frente a difícil tarefa de extração automática da malha viária usando apenas imagens pancromáticas, aéreas e de satélite. Clode et alii (2004) usaram dados LIDAR (Light Detection And Ranging), isto é, dados de altura e intensidade de retorno de pulso laser. O primeiro passo consiste em gerar um DTM (Digital Terrain Models) a partir dos dados de altura. Na seqüência, as rodovias são classificadas de acordo com a amplitude esperada para a intensidade de pulso laser e para as diferenças de altura numa vizinhança. Em Zhu et alii (2004) é proposta uma metodologia para a extração de rodovias que combina dados LIDAR e de imagens aéreas. Primeiramente, dados LIDAR são usados para extrair bordas de rodovia sombreadas por objetos altos (edifícios, árvores etc.). Isto mostra também que os dados LIDAR são também úteis para a detecção de sombras, o que depende de dados de efemérides solar. A imagem aérea é utilizada para extrair as bordas visíveis de rodovia. As informações de bordas de rodovia, obtidas com dados LIDAR, são usadas para selecionar os segmentos de bordas extraídos da imagem que estão conectados, possibilitando a reconstrução da parte sombreada usando splines. Hu et alii (2004) também combinam dados LIDAR e de imagens aéreas, uma vez que é possível, conforme ficou evidenciado pelo exemplo anterior, derivar conhecimentos de rodovia que podem se completar, facilitando a tarefa de extração. Um dos raros exemplos de uso de imagens multiespectrais no problema de extração automática de rodovias é apresentado em Gao e Wu (2004). Primeiramente, uma classificação não supervisionada é aplicada à imagem de sensoriamento remoto do satélite Ikonos para obter uma imagem binária com pixels classificados como pertencente ou não às rodovias. As rodovias são então extraídas a partir da imagem binária com as rodovias classificadas.

Finalmente, reconhecendo que sistemas automáticos para a extração de rodovia necessitam da participação do operador para complementar a malha viária extraída, Hinz e Wiedemann (2004) mostram que os resultados da extração acompanhados com indicadores de qualidade podem aumentar a eficiência do sistema de extração automática em aplicações práticas. Isto ocorre porque o operador com os indicadores de qualidade nas mãos pode acelerar consideravelmente o processo de complementação manual.

De uma forma geral, até a década de 1990 poucas pesquisas sobre extração automática de feições rodoviárias tinham sido realizadas. Neste período, só havia o grupo da Universidade Tecnológica de Munique desenvolvendo pesquisa realmente significa no tema (Baumgartner et alii, 1999, Laptev et alii, 2000). Grande parte das pesquisas versavam sobre metodologias semi-automáticas. Nos últimos 4 anos, tem-se verificado um aumento de números de trabalhos sobre o tema e, diferente da década passada, vários grupos vêm-se destacando. Provavelmente, a disponibilidade de dados de novos sensores têm estimulado novos grupos a atuarem neste tema.

3 METODOLOGIA PARA A EXTRAÇÃO AUTOMÁTICA DA MALHA VIÁRIA

A metodologia proposta para a extração automática da malha viária em imagens digitais de média- e alta- resolução baseia-se em duas etapas seqüenciais. Na primeira etapa são extraídas sementes de rodovia, tratando-se de uma representação fragmentada da malha viária. Basicamente são usados conhecimentos de caráter geométrico e radiométrico sobre a malha viária. Portanto, é nesta etapa que a malha viária é reconhecida, necessitando ainda de complementação. Estratégias de complementação automática são então usadas na segunda etapa do método, compreendendo a conexão entre sementes de rodovia e a reconstrução de cruzamentos de rodovia.

3.1 Extração de Sementes de Rodovia

A extração de sementes de rodovia baseia-se num conjunto de quatro objetos semânticos de rodovia e num outro conjunto de regras de conexão entre objetos semânticos. Cada semente de rodovia é composta de uma seqüência de objetos semânticos de rodovia conectados, sendo que geometricamente cada seqüência desse tipo pode ser estruturada como uma cadeia de quadriláteros justapostos.

3.1.1 Extração de objetos semânticos

Os objetos semânticos, aqui propostos, são definidos a partir de segmentos de reta opostos, aproximadamente paralelos, de duas linhas poligonais compatíveis com bordas de rodovia. O processo de extração de linhas poligonais baseia-se em várias etapas seqüenciais, i.e.: a detecção e o afinamento de bordas, a geração de listas ordenadas de pixels de borda e a geração propriamente dita de linhas poligonais. Devido à limitação de espaço e, também, ao fato destas etapas serem básicas em processos de extração de feições, remete-se os assuntos inerentes à literatura específica, como, por exemplo, Jain et alii (1995).

A figura 1 mostra os quatro objetos semânticos encontrados em qualquer segmento de rodovia. Na construção de um objeto semântico, o segmento de reta inferior é denominado base e o superior candidato. Para cada um dos quatro casos, os pontos extremos de ambos os segmentos de reta (pequenos círculos pretos na figura 1) são projetados ortogonalmente de um para outro, sendo que dois pontos projetados são locados (pequenas circunferências na figura 1) entre os pontos extremos do segmento oposto. Por exemplo, na figura 1(a) os pontos extremos do segmento de reta candidato são projetados ortogonalmente em dois pontos do segmento de reta base. O inverso ocorre com o caso 2 (figura 1(b)). Já em relação aos casos 3 e 4, respectivamente ilustrados na figura 1(c) e na figura 1(d), os pontos projetados são locados de forma alternada, isto é um no segmento base e o outro no candidato e vice-versa. Em todos os casos, dois pontos extremos dos segmentos base e/ou candidato e dois pontos projetados nos segmentos base e/ou candidato, são combinados para formar quadriláteros bastante próximos da forma de um retângulo. Os quadriláteros definidos nos quatro objetos semânticos são visualizados na figura 1 como áreas hachuradas. O eixo de cada quadrilátero, definido pelos dois pontos médios dos pares de vértices do quadrilátero que definem lados transversais à rodovia, coincide com um pequeno segmento de eixo de rodovia.


A grande dificuldade da metodologia para construção de objetos semânticos é a identificação de pares de linhas poligonais que delimitam regiões compatíveis com rodovia. A construção dos quatro objetos semânticos baseia-se num conjunto de regras relacionadas com conhecimentos a priori sobre rodovia. As principais regras utilizadas para identificar e construir os quatro objetos semânticos brevemente descritos acima são:

1) Regra de anti-paralelismo do gradiente: segundo o conceito de anti-paralelismo, os vetores do gradiente de dois pontos tomados sobre margens opostas de uma rodovia e situados numa mesma seção transversal de rodovia, são aproximadamente paralelos e de sentidos aproximadamente opostos. Além disso, são aproximadamente ortogonais às bordas de rodovia. Isto significa que os vetores de gradiente nos pixels de borda que geraram um determinado segmento de reta, pertencente a uma linha poligonal, são aproximadamente ortogonais ao segmento de reta sendo considerado. Consequentemente, um excelente representante dos vetores de gradiente nos pontos geradores de um segmento de reta, é o vetor do gradiente médio. Os vetores do gradiente médios para os segmentos de reta base e candidato (figura 1) são então aproximadamente anti-paralelos. Além deste resultado encerrar uma importante informação do objeto rodovia, também é bastante apropriado para a etapas posteriores de análise de imagem, pois é uma representação bastante compacta. Pela regra de anti-paralelismo, dois segmentos de reta, base e candidato, são compatíveis com um fragmento de rodovia se a regra de anti-paralelismo for satisfeita;

2) Regra de paralelismo e proximidade dos lados: por esta regra, os segmentos de reta base e candidato são possíveis constituintes de um objeto semântico se forem aproximadamente paralelos e próximos o suficiente;

3) Regra de homogeneidade: os tons de cinza de pixels pertencentes ao leito de uma rodovia não variam muito, pelo menos em segmentos menores. Assim, a área delimitada pelos segmentos de reta base e candidato deve ser aproximadamente homogênea. Além disso, a média dos tons de cinza, necessária para o cálculo da dispersão dos tons de cinza na área delimitada, geralmente possui alto valor de brilho;

4) Regra do contraste: as rodovias possuem, principalmente em imagens de média- e alta- resolução, alto contraste em relação às áreas adjacentes, não havendo então a necessidade de aplicação prévia de técnicas de melhoramento de imagem. Assim, os segmentos de reta base e candidato são admissíveis se for verificado um alto contraste da área delimitada (i.e., o quadrilátero) e as adjacências.

5) Regra de superposição: os segmentos de reta base e candidato são admissíveis somente se dois de seus pontos extremos podem ser projetados ortogonalmente no segmento de reta oposto. É esse critério que dá origem aos quatro casos mostrados na figura 1. Por exemplo, no caso 1 os dois pontos extremos do segmento de reta candidato são projetados ortogonalmente no segmento de reta base, dando origem ao quadrilátero do objeto semântico do caso 1;

6) Regra da fragmentação: linhas poligonais compostas de pequenos segmentos de reta (por exemplo, menores que a largura esperada da rodovia) ocorrem geralmente quando o objeto representado não é rodovia. Assim, os casos envolvendo pequenos segmentos não são considerados e os possíveis problemas decorrentes (por exemplo, o não reconhecimento de cruzamentos de rodovia) são tratados a posteriori, quando outros tipos de conhecimento são integrados.

A ordem de aplicação das seis regras descritas acima é importante porque pode evitar, na boa parte dos casos, a verificação de todas as regras de construção dos objetos semânticos. A primeira regra a ser aplicada é a sexta, pois permite a eliminação de uma boa parte dos casos em que não há interesse de análise. Na seqüência, a aplicação da regra de superposição permite a eliminação de um outro conjunto de casos. A seguir, podem ser aplicadas, pela ordem, a 2ª, a 1ª, a 3ª e a 4ª regra.

3.1.2 Extração de sementes de rodovia através da conexão de objetos semânticos

Cada objeto semântico pode ser considerado como uma representação local para a maior parte reta de um segmento de rodovia. O problema que se tem em mãos é, dada uma grande quantidade de linhas poligonais previamente extraídas de uma imagem, entre as quais não se conhece nenhuma inter-relação, como formar e agrupar os objetos semânticos para se ter as sementes de rodovia. A figura 2 mostra quais são as possíveis conexões à direita e à esquerda dos objetos semânticos. Todas estas possíveis conexões são entendidas a partir da análise dos objetos semânticos mostrados na figura 1. A figura 2(a) mostra que se um objeto semântico do 1º caso for extraído, espera-se extrair os objetos semânticos dos 2º e 3º casos à esquerda. O 2º caso pode ser encontrado novamente à direita, juntamente com o 4º caso. O 2º caso se conecta à esquerda com os 1º e 4º casos e à direita com os 1º e 3º casos. Nota-se que os 3º e 4º casos se auto conectam tanto a direita quanto à esquerda.


A extração automática de sementes de rodovia, através da conexão de objetos semânticos, baseia-se então na combinação entre pares de linhas poligonais previamente extraídas. À medida que os objetos semânticos vão sendo extraídos, os mesmos são conectados, possibilitando a formação de uma cadeia de quadriláteros justapostos, denominada segmento de rodovia ou, também, semente de rodovia.

A figura 3 mostra um exemplo ilustrativo, bastante simples, onde se tem uma linha poligonal base compatível com duas linhas poligonais candidatas (figura 3(a)). O processo de extração e agrupamento de objetos semânticos é mostrado nas figura 3(b) e 3(c), respectivamente. Supondo que a linha poligonal base (figura 3(a)) é combinada da direita para a esquerda, dois objetos semânticos são gerados pela combinação com a primeira linha poligonal candidata (figura 3(b))). A conexão destes dois objetos semânticos gera uma primeira semente de rodovia (figura 3(c)) que, por sua vez, pode ser segmentada em três quadriláteros justapostos. Cada eixo de rodovia é definido por pontos médios dos vértices dos quadriláteros. A combinação da linha poligonal base com a 2ª candidata (figura 3(a)) permite gerar um segunda semente de rodovia, constituída apenas de um quadrilátero (figura 3(c)). O pequeno segmento da linha poligonal base, não integrado às duas sementes de rodovia extraídas, pode ser uma informação útil para a fase seguinte do processo de extração, pois é uma evidência de que ambas as sementes extraídas são, de alguma forma, relacionadas. Por exemplo, pode indicar a presença de um cruzamento de rodovia na forma de "T" ou "Y". Portanto, a informação referente ao segmento base não integrado deve ser preservada para uso nas etapas seguintes do processo de extração.


3.2 Complementação da Malha Viária

A complementação da malha viária visa reconstruir as conexões entre as sementes de rodovia, tanto ao longo das rodovias quanto nos cruzamentos delas.

3.2.1 Conexão entre sementes ao longo das rodovias

O problema de conexão entre sementes ao longo das rodovias pode ser resolvido a partir da análise dos quadriláteros extremos das sementes de rodovia. Na realização desta tarefa, o procedimento básico é selecionar uma semente de rodovia e buscar à vante e à ré outras sementes de rodovia que podem ser seqüencialmente integradas, resultando em segmentos de rodovia maiores, apenas desconectados nos cruzamentos de rodovia. A primeira semente deve ser a maior possível, procedimento que reduz a probabilidade de se iniciar com uma falsa semente. Após a seleção da primeira semente, o processo de conexão busca à vante e à ré por sementes que satisfaçam os seguintes critérios: 1- tomando uma semente como referência, seleciona-se uma outra semente, com a condição de que uma de suas extremidades (ou quadriláteros extremos) seja a mais próxima de uma das extremidades da semente de referência; e 2- estas extremidades devem também ser suficientemente próximas e colineares. Sempre que uma conexão válida for detectada, o espaço entre ambas as sementes é preenchido através da inserção de um quadrilátero de dimensões adequadas. Isto significa que a rodovia é assumida como reta no espaço compreendido entre duas sementes, selecionadas com base nos dois critérios acima.

A estratégia brevemente descrita tem duas dificuldades básicas. Uma primeira está relacionada com a presença de falsos positivos que podem ser aceitos pelos critérios de conexão. Neste caso, quando houver mais de uma candidata a uma conexão, a semente correta é aquela que melhor concorda com as características locais da rodovia na imagem. Sendo H e C respectivamente os parâmetros de homogeneidade e contraste de uma semente de rodovia, a que é considerada correta é aquela que possuir a maior razão C/H. O parâmetro H é dado pela variância dos pixels internos de uma dada semente de rodovia. Já o parâmetro C é calculado através da diferença entre os tons de cinza médios do interior e de faixas adjacentes à direita e à esquerda da semente de rodovia considerada.

A segunda dificuldade ocorre com os cruzamentos de rodovia, visto que duas sementes de rodovia não podem ser simplesmente conectadas ao longo de regiões de cruzamentos de rodovia. Assim, a verificação de evidência da presença de cruzamentos de rodovias é necessária durante a realização do processo de conexão. A próxima subseção apresenta uma metodologia para detectar e reconstruir cruzamentos de rodovia.

A figura 4 mostra um exemplo de aplicação do processo de conexão aos resultados gerados pela metodologia de extração de sementes de rodovia. A figura 4(a) mostra as seguintes feições lineares sobrepostas sobre a imagem: 1- linhas poligonais correspondentes aos lados das sementes de rodovia e coincidentes com as bordas de rodovia; 2- linhas poligonais representando os eixos centrais das sementes de rodovia. Notar que a presença de dois postes ao longo da margem do ramo inferior da rodovia aproximadamente vertical perturbou o processo de extração de sementes de rodovia, visto que exatamente nesses locais ocorreram duas desconexões entre as sementes de rodovia extraídas. A figura 4(b) mostra que estas desconexões foram corrigidas, resultando num único segmento de rodovia.



3.2.2 Reconstrução dos Cruzamentos de Rodovia

A metodologia desenvolvida para a extração de cruzamentos de rodovia baseia-se nos resultados gerados pela metodologia de conexão de rodovia, isto é, as sementes conectadas e os respectivos eixos.

Primeiramente os eixos de rodovia são usados para calcular posições aproximadas para os cruzamentos de rodovia, denominadas pontos de referência de cruzamentos de rodovia. A posição de cada ponto de referência é calculada com base em dois critérios, um geométrico e outro radiométrico. Pelo critério geométrico, inicialmente são calculadas todas as possíveis intersecções entre eixos de rodovia não colineares, cujas extremidades estejam suficientemente próximas. Deste processo resultam agrupamentos de pontos, a partir dos quais são calculados os centros geométricos, isto é, os pontos de referência de cruzamentos de rodovia. Um exemplo é mostrado na figura 5(a), onde o ponto de referência (P) é calculado a partir de um agrupamento de quatro pontos, resultantes da intersecção de quatro pares de eixos não colineares. O critério radiométrico é, em essência, uma verificação de consistência entre o nível de cinza médio de uma vizinhança do ponto de referência e o nível de cinza esperado para um ponto de rodovia.



Os pontos de referência permitem a identificação dos quadriláteros extremos de sementes conectadas de rodovia, mais próximos dos respectivos cruzamentos de rodovia (figura 5(b)). Estes quadriláteros são elementos importantes na definição de cruzamentos de rodovias, já que estes podem ser genericamente definidos como áreas irregulares, limitadas por bordas e por quadriláteros mais próximos de cruzamentos de rodovia. Assim, o objetivo da metodologia de extração de cruzamentos de rodovias é extrair polígonos delimitando as respectivas áreas de cruzamento, conforme definição acima. Conforme mostra a figura 5(a), parte do problema pode ser resolvido através da organização de triângulos definidos pelo vértice comum P e pelos lados dos quadriláteros mais próximos de P. No exemplo da figura 5(a), o cruzamento de rodovia é representado pelo polígono definido pelos segmentos de reta e , e as linhas poligonais que conectam os vértices P8 e P1, P2 e P3, P4 e P5, e P6 e P7. A figura 4(b) mostra o resultado final obtido após a aplicação da metodologia de extração de cruzamentos de rodovia aos resultado mostrados na figura 4(b).

4 RESULTADOS EXPERIMENTAIS

A avaliação da metodologia proposta foi realizada com base em várias imagens aéreas de média- e alta-resolução. Neste artigo são apresentados os resultados obtidos com três imagens áreas, sendo duas de alta resolução e outra de média resolução. Os resultados obtidos serão analisados visual e numericamente. A análise visual baseia-se na observação dos resultados sobrepostos sobre a imagem de entrada. Entretanto, uma análise quantitativa pode ser realizada empregando-se parâmetros de qualidade (Wiedmann e Hinz, 1999). Estes parâmetros são definidos a partir de dois tipos de entidades: 1- linhas poligonais representando os eixos centrais das rodovias, extraídas automaticamente; e 2- como no item 1, só que extraídas manualmente por um operador. Estas últimas linhas poligonais são consideradas corretas. Os seguintes parâmetros de qualidade são utilizados na análise dos resultados: 1- erro médio, definido como a distância média entre as linhas poligonais extraídas automática e manualmente; 2- completeza, isto é, a razão entre a soma comprimentos das linhas poligonais extraídas automaticamente e a soma dos comprimentos das correspondentes linhas poligonais extraídas manualmente; e 3- correção, definida como a razão entre a soma dos comprimentos das linhas poligonais extraídas automaticamente de forma correta e a soma dos comprimentos de todas as linhas poligonais extraídas automaticamente. Os parâmetros de completeza e correção variam no intervalo [0; 1], sendo 1 (100%) o valor ótimo.

A figura 6 apresenta os resultados obtidos com a imagem (745 x 1007 pixels) de alta-resolução, cujas rodovias possuem largura média de 33 pixels e interceptam-se em 'X'. Neste experimento, o método gera inicialmente cadeias de quadriláteros justapostos (isto é, as sementes de rodovia) para os dez ramos da malha viária. Na seqüência, o método inicia a complementação da malha viária. Assim, a conexão das sementes de rodovia gera segmentos maiores, os quais concorrem nos três cruzamentos da malha viária. Finalmente, estes cruzamentos são reconstruídos, possibilitando a reconstrução completa da malha viária. Os parâmetros de qualidade mostram que a metodologia teve um bom desempenho com esta imagem. De fato, tanto o parâmetro de completeza quanto o de correção foram de 100%. O erro médio foi da ordem de 3 pixels, isto é, algo em torno de 10% da largura média da rodovia. À princípio, este valor para o erro médio pode ser considerado alto, mas é justificado pela dificuldade do operador em vetorizar o eixo de rodovia em imagens de alta resolução. É bom lembrar que o eixo de rodovia é uma entidade virtual, diferente de uma borda que é visível na imagem.


A figura 7 apresenta os resultados obtidos com uma outra imagem (450 x 914 pixels) de alta-resolução, exibindo rodovias com aproximadamente 30 pixels de largura. Esta imagem apresenta duas rodovias cruzando-se em 'T', ao longo das quais pode-se notar várias irregularidades, tais como: duas obstruções através de torres, sendo que uma toma completamente a rodovia; várias irregularidades nas bordas; e irregularidades geométricas na rodovia que se estende mais verticalmente, nas proximidades do limite inferior da imagem. Esta última irregularidade é a que representa maior problema para o método pois, entre o cruzamento e o limite inferior da imagem, há pouca informação compatível com os objetos semânticos de rodovia. Vale lembrar que a falta de segmentos de rodovias em um dos ramos da rodovia pode inviabilizar a reconstrução do cruzamento.


Os resultados obtidos (figura 7) mostram que o método não obteve êxito total no que se refere à extração dos segmentos de rodovia no ramo bastante afetado por irregularidades geométricas. Apenas um pequeno segmento de rodovia foi extraído na região. Nas outras partes da malha foi extraída uma quantidade satisfatória de segmentos de rodovia, uma vez que as estratégias de complementação lograram êxito no estabelecimento de conexões entre os mesmos. Em vista dos problemas geométricos, uma reconstrução total do cruzamento não foi possível, visto que um polígono representando o cruzamento não foi completamente extraído. Parte do polígono que falta não foi extraída porque o método de extração de cruzamento não encontrou uma linha poligonal que liga os vértices dos dois objetos semânticos, mais próximos em cada lado do cruzamento. Como o método de extração de cruzamento encontrou uma conexão com o segmento de rodovia situado na região inferior ao cruzamento, a solução para o problema é relativamente simples. Bastaria ligar o vértice do objeto semântico, situado noutra margem da rodovia, com o extremo da linha poligonal incompleta do cruzamento de rodovia. Esta solução não foi ainda incorporada na metodologia descrita. Para a realização da avaliação numérica, considerou-se que o método falhou na parte em que apenas um dos lados da rodovia foi extraído. Essa consideração baseia-se no fato de que apenas um segmento de linha poligonal, correspondente a uma das bordas da rodovia, não permite por si só interpolar o correspondente segmento de eixo da rodovia. Também não foi extraído um pequeno segmento de rodovia nas proximidades do limite inferior da imagem. Dessa forma, o parâmetro de completeza foi calculado em 91%. Já o parâmetro de correção obteve o valor ótimo de 100%, significando que está correto o que foi extraído. Quanto ao parâmetro de erro médio, que permite inferir sobre a qualidade geométrica dos eixos interpolados de rodovia, foi calculado um valor próximo de 3 pixels (10% da largura da rodovia). Este valor alto também se justifica pelas mesmas razões expostas anteriormente.

A figura 8 apresenta os resultados obtidos com a imagem (398x598 pixels) de média resolução, onde as rodovias manifestam-se como faixas estreitas de aproximadamente 7 pixels. Esta imagem apresenta um conteúdo favorável à aplicação da metodologia, visto que são poucas as anomalias associadas à malha, composta por duas rodovias cruzando-se em 'T'. As bordas são bem definidas e geralmente são geometricamente suaves. Existem algumas obstruções parciais, nos locais onde existem pequenos arbustos ao longo da margem direita da rodovia que se estende mais verticalmente. Entretanto, estas anomalias podem provocar apenas falhas locais, de fácil reparação pela metodologia de conexão de sementes de rodovia. Como já era esperado, a aplicação da estratégia, referente à primeira etapa da metodologia, produziu um resultado bastante favorável, com completeza acima de 90%. A aplicação das estratégias de complementação permitiu a reconstrução completa da malha, motivo pelo qual a completeza foi de 100%. O parâmetro de correção também atingiu o valor ótimo de 100%, significando que todo o resultado da extração foi validado. O erro médio para este caso foi de 0,8 pixel, implicando numa acurácia na casa do sub-pixel. Vale também ressaltar que este valor é próximo de 10% da largura média das rodovias, fato que se repetiu nos dois experimentos anteriores.


5 CONCLUSÕES E PERSPECTIVAS FUTURAS

Este artigo apresentou uma metodologia para a extração automática da malha viária em imagens de média- e de alta-resolução de cenas rurais. A metodologia baseia-se em duas etapas principais. Inicialmente são extraídas sementes de rodovia, vindo depois a complementação da malha viária. Esta última etapa consiste em encontrar as conexões entre as sementes de rodovia e em reconstruir os cruzamentos de rodovia. Os resultados obtidos mostraram que a metodologia teve um ótimo desempenho com duas das imagens usadas nos experimentos, sendo uma de média resolução (figura 8) e a outra de alta resolução (figura 6). Tanto o parâmetro de completeza quanto de correção alcançaram o valor ótimo de 100%. Devido às várias irregularidades presentes na imagem teste do segundo experimento com imagem de alta-resolução (figura 7), o valor ótimo não pode ser obtido. Entretanto, o valor obtido de 91% pode ser considerado um bom índice. Além disso, o valor obtido para o parâmetro de correção alcançou o valor ótimo de 100%. Uma regularidade que chamou a atenção foi o erro relativo (razão entre o erro médio e a largura média da rodovia) obtido nos três experimentos, que se situou em torno de 10%.

Alguns aperfeiçoamentos deverão ser realizados na metodologia proposta, podendo-se destacar a complementação automática em uma única etapa através de processos de otimização em grafo. Um outro aperfeiçoamento importante é o desenvolvimento de uma metodologia que permita a reconstrução de trevos complexos, compostos, por exemplo, de viadutos e alças de acesso lateral.

AGRADECIMENTOS

Este trabalho contou com apoio da FAPESP (Auxílio à Pesquisa coordenado pelo autor principal), da CAPES (Bolsa de Doutorado do segundo co-autor) e do CNPq (Bolsa de Produtividade em Pesquisa (PQ) do autor principal).

Artigo submetido em 21/03/2005

1a. Revisão em 16/09/2006

2a. Revisão em 28/11/06

Aceito sob recomendação do Editor Associado Prof. Ivan Nunes da Silva.

  • Agouris, P.; Gyftakis, S.; Stefanidis, A (2000). Uncertainty in Image-Based Change Detection. In: Accuracy 2000, Amsterdam, pp. 1-8.
  • Bajcsy, R; Tavakoli, M (1976). Computer Recognition of Roads from Satellite Pictures. IEEE Transaction on System, Man and Cybernetic, Vol. 6, No. 9, pp. 76-84.
  • Baumgartner, A.; Steger, C; Mayer, H.; Eckstein, W.; Ebner, H (1999). Automatic Road Extraction Based on Multi-Scale, Grouping, and Context. Photogrammetric Engineering and Remote Sensing, Vol. 66, No. 7, pp. 777-785.
  • Clode, S.; Kootsookos, P.; Rottensteiner, F (2004). The automatic extraction of roads from LIDAR data. In: The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Science, Istanbul, Vol. 35, pp. 231-237.
  • Dal Poz, A. P.; Vale, G. M (2003). Dynamic programming approach for semi-automated road extraction from medium- and high- resolution images. In: The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Science, Munique, Vol. 34, pp. 87-91.
  • Gao, J.; Wu, L (2004). Automatic Extraction of Road Networks in Urban Areas from Ikonos Imagery Based on Spatial Reasoning. In: The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Science, Istanbul, Vol. 35, pp. 331-337.
  • Grüen, A.; Li, H (1997). Semi-Automatic Linear Feature Extraction by Dynamic Programming and LSB-Snakes. Photogrammetric Engineering and Remote Sensing, Vol. 63, No. 8, pp. 985-995.
  • Hinz, S (2004). Automatic Road Extraction in Urban Scenes and Beyond. In: The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Science, Istanbul, Vol. 35, pp. 349-355.
  • Hinz, S.; Wiedemann, C (2004). Increasing Efficiency of Road Extraction by Self-Diagnosis. Photogrammetric Engineering and Remote Sensing, Vol. 70, No. 12, pp. 1457-1464.
  • Hu, X.; Tao, C. V.; Hu, Y (2004). Automatic Road Extraction from Dense Urban Area by Integrated Processing of High Resolution Imagery and LIDAR Data. In: The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Science, Istanbul, Vol. 35, pp. 320-325.
  • Hu, X.; Zhang, Z.; Tao, C. V (2004). A Robust Method for Semi-Automatic Extraction of Road Centerlines Using a Piecewise Parabolic Model and Least Square Template Matching. Photogrammetric Engineering and Remote Sensing, Vol. 70, No. 12, pp. 1393-1398.
  • Jain, R.; Kasturi, R.; Schunck, B.G (1995). Machine Vision MIT Press and McGraw-Hill, New York, USA.
  • Kass, M.; Witkin, A.; Terzopoulos, D (1987). Snakes: Active Contour Models. In: International Conference of Computer Vision, Tampa, pp. 259-268.
  • Kovalevskii, V. A (1967). An optimal recognition algorithm for some sequences of patterns. Cybernetics, Vol. 3, No. 4, pp. 62-66.
  • Laptev, I; Mayer. H; Lindeberg, T.; Eckstein, W.; Steger, C.; Baumgartner, A (2000). Automatic Extraction of Roads from Aerial Images Based on Scale Space and Snakes. Machine Vision and Applications, Vol. 12, No. 1, pp. 22-31.
  • Merlet, N.; Zerubia. J (1996). New Prospects in Line Detection by Dynamic Programming. IEEE Transaction on Pattern Analysis and Machine Intelligence, Vol. 18, No. 4, pp. 426-431.
  • Neuenschwander, W. M.; Fua, P.; Iverson, L; Szekely, G.; Kubler, O (1997). Ziplock Snakes. International Journal of Computer Vision, Vol. 25, No. 6, pp. 191-201.
  • Quam, L. H (1978). Road Tracking and Anomaly Detection in Aerial Imagery. In: Image Understanding Workshop, London, pp. 51-55.
  • Stoica, R.; Descombes, X.; Zerubia, J (2004). A Gibbs Point Process for Road Extraction from Remotely Sensed Images. International Journal of Computer Vision, Vol. 57, No. 2, pp. 121-136.
  • Tommaselli, A. M. G (1993). Um Método Recursivo Aplicado ao Problema de Localizaçăo em Visăo de Máquina Tese de Doutorado, Universidade Estadual de Campinas, FEE-UNICAMP, Campinas, SP.
  • Trinder, J. C., Maulik, U., Bandyopadhyay, S (2000). Semi-automated feature extraction using simulated annealing. In: The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Science, Amsterdam, v. 34, pp. 905-911.
  • Wessel, B (2004). Road Network Extraction from SAR Imagery Supported by Context Information. In: The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Science, Istanbul, Vol. 35, pp. 360-366.
  • Yamada, H., Merritt, C., Kasvand, T (1988). Recognition of kidney glomerulus by dynamic programming matching method. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 10, No. 5, p. 731-737.
  • Youn, J.; Bethel, J. S (2004). Adaptive Snakes for Urban Road Extraction. In: The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Science, Istanbul, Vol. 35, pp. 465-471.
  • Zhu, P.; Lu, Z.; Chen, X.; Honda, K.; Eiumnoh, A (2004). Extraction of City Roads Through Shadow Path Reconstruction Using Laser Data. Photogrammetric Engineering and Remote Sensing, Vol. 70, No. 12, pp. 1433-1440.
  • Wang, Y.; Trinder, J. C (2000). Automatic road network extraction by hierarchical grouping. In: ASPRS 2000 Annual Conference, Washington, DC, CD-ROM.
  • Wiedmann, C.; Hinz, S (1999). Automatic extraction and evaluation of road networks from satellite imagery. In: The International Archives of the Photogrammetry and Remote Sensing, Munique, Vol. 32, p. 95-100.

Datas de Publicação

  • Publicação nesta coleção
    25 Jul 2007
  • Data do Fascículo
    Mar 2007

Histórico

  • Recebido
    21 Mar 2005
  • Revisado
    28 Nov 2006
Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
E-mail: revista_sba@fee.unicamp.br