Acessibilidade / Reportar erro

Mapeamento digital de solos por redes neurais artificiais com base na relação solo-paisagem

Digital soil mapping by artificial neural networks based on soil-landscape relationships

Resumos

Técnicas de mapeamento digital podem contribuir para agilizar a realização de levantamentos pedológicos detalhados. Objetivou-se com este trabalho obter um mapa digital de solos (MDS) com uso de redes neurais artificiais (RNA), utilizando correlações entre unidades de mapeamento (UM) e covariáveis ambientais. A área utilizada compreendeu aproximadamente 12.000 ha localizados no município de Barra Bonita, SP. A partir do resultado de uma análise de agrupamento das covariáveis ambientais, foram escolhidas cinco áreas de referência para realizar o mapeamento convencional. As UM identificadas subsidiaram a aplicação da técnica de RNA. Utilizaram-se o simulador de redes neurais JavaNNS e o algoritmo de aprendizado backpropagation. Pontos de referência foram coletados para avaliar o desempenho do mapa digital produzido. A posição na paisagem e o material de origem subjacente foram determinantes para o reconhecimento dos delineamentos das UM. Houve boa concordância entre as UM delineadas pelo MDS e pelo método convencional. A comparação entre os pontos de referência e o mapa de solos digital evidenciou exatidão de 72 %. O uso da abordagem MDS utilizada pode contribuir para diminuir a falta de informações semidetalhadas de solos em locais ainda não mapeados, tomando-se como base informações pedológicas obtidas de áreas de referência adjacentes.

inteligência artificial; covariáveis ambientais; classificação supervisionada


Digital mapping techniques can help reduce the lack of soil information in areas where no 1st and 2nd order soil surveys were performed. The aim of this study was to obtain a digital soil map (DSM) by artificial neural networks (ANN) using the correlation between soil mapping units and environmental covariates. The study area of approximately 11,000 ha is located in Barra Bonita, SP, Brazil. Based on a cluster analysis of environmental covariates, five reference areas were chosen for conventional mapping. The selected soil mapping units supported the application of ANN. We used the neural network simulator JavaNNS and the backpropagation learning algorithm. Reference points were collected to evaluate the efficiency of the resulting digital map. The position in the landscape and the underlying parent material were fundamental to the recognition of the designs of the mapping units. There was good agreement between the mapping units delineated by DSM and the conventional method. The comparison between the reference points and the digital soil map showed an accuracy of 72 %. The use of the DSM approach can help reduce the lack of soil information in unmapped places, based on soil information obtained from adjacent reference areas.

artificial intelligence; environmental covariates; supervised classification


DIVISÃO 1 - SOLO NO ESPAÇO E NO TEMPO

COMISSÃO 1.3 - PEDOMETRIA

Mapeamento digital de solos por redes neurais artificiais com base na relação solo-paisagem(1 (1 ) Parte da Dissertação de Mestrado do primeiro autor apresentada ao Programa de Pós-Graduação em Solos e Nutrição de Plantas, Escola Superior de Agricultura "Luiz de Queiroz" - ESALQ/USP. Realizada com auxílio da FAPESP. )

Digital soil mapping by artificial neural networks based on soil-landscape relationships

Gustavo Pais de ArrudaI; José Alexandre M. DemattêII; César da Silva ChagasIII

IEngenheiro Agrônomo, M.Sc. Consultor da APagri Consultoria Agronômica. Avenida Curitiba, 3565, Apto.1, Bom Jesus. CEP 78890-000 Sorriso (MT). E-mail: arrudagp@hotmail.com

IIProfessor do Departamento de Ciência do Solo, ESALQ-USP. Caixa Postal 09. CEP 13418-900 Piracicaba (SP). E-mail: jamdemat@usp.br

IIIPesquisador do Centro Nacional de Pesquisa em Solos, Embrapa Solos. Rua Jardim Botânico, 1024, Jardim Botânico. CEP 22460-000 Rio de Janeiro (RJ). E-mail: chagas.rj@gmail.com

RESUMO

Técnicas de mapeamento digital podem contribuir para agilizar a realização de levantamentos pedológicos detalhados. Objetivou-se com este trabalho obter um mapa digital de solos (MDS) com uso de redes neurais artificiais (RNA), utilizando correlações entre unidades de mapeamento (UM) e covariáveis ambientais. A área utilizada compreendeu aproximadamente 12.000 ha localizados no município de Barra Bonita, SP. A partir do resultado de uma análise de agrupamento das covariáveis ambientais, foram escolhidas cinco áreas de referência para realizar o mapeamento convencional. As UM identificadas subsidiaram a aplicação da técnica de RNA. Utilizaram-se o simulador de redes neurais JavaNNS e o algoritmo de aprendizado backpropagation. Pontos de referência foram coletados para avaliar o desempenho do mapa digital produzido. A posição na paisagem e o material de origem subjacente foram determinantes para o reconhecimento dos delineamentos das UM. Houve boa concordância entre as UM delineadas pelo MDS e pelo método convencional. A comparação entre os pontos de referência e o mapa de solos digital evidenciou exatidão de 72 %. O uso da abordagem MDS utilizada pode contribuir para diminuir a falta de informações semidetalhadas de solos em locais ainda não mapeados, tomando-se como base informações pedológicas obtidas de áreas de referência adjacentes.

Termos de indexação: inteligência artificial, covariáveis ambientais, classificação supervisionada.

SUMMARY

Digital mapping techniques can help reduce the lack of soil information in areas where no 1st and 2nd order soil surveys were performed. The aim of this study was to obtain a digital soil map (DSM) by artificial neural networks (ANN) using the correlation between soil mapping units and environmental covariates. The study area of approximately 11,000 ha is located in Barra Bonita, SP, Brazil. Based on a cluster analysis of environmental covariates, five reference areas were chosen for conventional mapping. The selected soil mapping units supported the application of ANN. We used the neural network simulator JavaNNS and the backpropagation learning algorithm. Reference points were collected to evaluate the efficiency of the resulting digital map. The position in the landscape and the underlying parent material were fundamental to the recognition of the designs of the mapping units. There was good agreement between the mapping units delineated by DSM and the conventional method. The comparison between the reference points and the digital soil map showed an accuracy of 72 %. The use of the DSM approach can help reduce the lack of soil information in unmapped places, based on soil information obtained from adjacent reference areas.

Index terms: artificial intelligence, environmental covariates, supervised classification.

INTRODUÇÃO

O conhecimento sobre as propriedades e os atributos dos solos é de extrema importância para a adoção de práticas adequadas de manejo, visando a sustentabilidade do meio ambiente e maior eficiência na produção de alimentos. Problemas como erosão, contaminação do lençol freático, baixas produtividades em locais de alto potencial produtivo, entre outros fatores de caráter ambiental ou de produção, podem ser evitados ou reduzidos com o uso de informações obtidas nos mapas de solos.

Com o avanço tecnológico, algumas alternativas têm sido aplicadas para geração de dados que minimizem problemas de incompatibilidade entre a informação do solo e o manejo adotado. Tais alternativas são com base em Sistema de Informação Geográfica (SIG) e técnicas de sensoriamento remoto, aliadas ao uso de algoritmos matemáticos que estabelecem relações entre os fatores de formação do solo e a sua ocorrência na paisagem. Essa promissora estratégia de mapeamento de solos foi definida como Mapeamento Digital de Solos (MDS) (McBratney et al., 2003).

A produção de mapas pedológicos assistida por computadores vem apresentado grande desenvolvimento desde a última década (Lagacherie & McBratney, 2007). Um importante propósito do MDS é auxiliar o mapeamento convencional, reduzindo os recursos humanos, materiais para trabalhos de campo e, consequentemente, gastos e tempo necessários para a elaboração dos mapas de solos. Uma importante técnica empregada para obter mapas de solos digitais é a abordagem por Redes Neurais Artificiais (RNA). Essas redes realizam processamento de dados de maneira semelhante aos neurônios do cérebro humano (Zhu, 2000), permitindo o estabelecimento de relações matemáticas entre covariáveis ambientais e classes de solos (Coelho & Giasson, 2010).

Dentre as inúmeras covariáveis que vem sendo aplicadas no MDS, destacam-se os atributos derivados dos modelos digitais de elevação. Em trabalhos anteriores de relação solo-paisagem (Marques Júnior & Lepsch, 2000; Teramoto et al., 2001; Cunha et al., 2005), as superfícies geomórficas apresentaram estreitas correlações com as unidades de mapeamento identificadas, demonstrando a importância dessas informações para uso em trabalhos de mapeamento digital.

No mapeamento do solo por métodos convencionais o pedólogo acumula conhecimentos tácitos a respeito da ocorrência das classes de solos situados em sua região de trabalho, conforme modelos conceituais solo-paisagem. Com esses conhecimentos, esse profissional coleta evidências e gera hipóteses em relação à ocorrência dos solos, confirmando com prospecções de campo, seguindo o paradigma solo-paisagem exposto por Hudson (1992). Assim, e de acordo com esse autor, o mapeamento de solos tradicional depende da subjetividade do pedólogo e de experiências adquiridas em muitos trabalhos de campo. De maneira semelhante, a inserção de dados quantitativos que expressem os fatores de formação dos solos, em sistemas de inteligência artificial, prediz, a partir de um processo de aprendizagem semelhante, essa mesma ocorrência (Zhu, 2000; Chagas et al., 2010, 2011).

Este trabalho teve por objetivos gerar um mapa digital de solos a partir de covariáveis ambientais que apresentem relação significativa com a distribuição dos solos na área, por meio da aplicação de RNA; e avaliar o desempenho das diferentes covariáveis ambientais, aplicadas na predição das unidades de mapeamento.

MATERIAL E MÉTODOS

Caracterização da área de estudo

O trabalho foi desenvolvido em uma área localizada no município de Barra Bonita (SP), com aproximadamente 12.000 ha, entre as coordenadas UTM de 750.539 e 764.418 mE e 7.524.287 e 7.514.029 mN (fuso 22, Datum SAD 69). O clima da região, com base na classificação de Köppen, é do tipo Cwa, subtropical de altitude com inverno seco; a temperatura média máxima de 30 ºC, no mês mais quente, e média mínima de 12,2 ºC, no mais frio; e a pluviosidade média anual, de 1.471 mm. A geologia é representada pela Formação Itaqueri, composta predominantemente de arenitos de cimento argiloso; e pela Formação Serra Geral do Grupo São Bento, de basaltos, com dessecamento da cobertura arenítica do Itaqueri pela drenagem (IPT, 1981). A vegetação original de floresta latifoliada tropical semidecídua encontra-se substituída pela cultura da cana-de-açúcar.

Obtenção das covariáveis ambientais

Neste estudo, foram utilizadas as covariáveis ambientais: elevação, declividade, perfil de curvatura, plano de curvatura e índice de convergência, todas derivadas de um Modelo Digital de Elevação (MDE), com resolução espacial de 20 m, e considerados os diversos estratos geológicos e as superfícies geomórficas (Daniels et al., 1971). Gerou-se o MDE a partir da digitalização de curvas de nível equidistantes de 5 m, da hidrografia e dos pontos cotados de cartas topográficas do Instituto Geográfico e Cartográfico do Estado de São Paulo (IGC), na escala de 1:10.000, aplicando-se a função TOPO to RASTER do programa ArcGIS 9.2 (ESRI, 2006). As superfícies geomórficas foram identificadas com base nas variações do relevo, a partir da análise estereoscópica de fotografias aéreas na escala de 1:30.000, em que se reconheceram as descontinuidades ou mudanças de gradientes nas inclinações das encostas. Foram analisados, como informação complementar, o comportamento dos atributos do terreno derivados do MDE, as curvas de nível obtidas da digitalização das cartas planialtimétricas e o conhecimento da estratigrafia local, seguindo os critérios e conceitos estabelecidos por Ruhe (1969) e Daniels et al. (1971). A opção pelo uso da variável superfície geomórfica deve-se ao fato de essa informação expressar relação com a ocorrência de solos na paisagem, tornando-se intrínseca à estratégia a idade relativa dos solos (Marques Júnior & Lepsch, 2000; Teramoto et al., 2001; Cunha et al., 2005). Portanto, adicionou-se indiretamente o fator de formação do solo tempo como covariável, aliado aos fatores material de origem e relevo.

Estratégia para mapeamento digital

Foram criados arquivos do tipo raster de cada covariável na resolução de 20 m e extraídas as informações dos pixels, exceto para as superfícies geomórficas, por terem sido delineadas após essa etapa. Com isso, gerou-se uma planilha de dados, permitindo a aplicação de uma análise de agrupamento Fuzzy k-médias (Bezdek et al., 1984) (Figura 1). Essa análise tem por princípio dividir determinado conjunto de dados em vários grupos (clusters), com base em características ou atributos das entidades do conjunto (pixels). Tal técnica de classificação não supervisionada tem como característica não forçar o programador a definir regras rígidas com contatos normalmente artificiais que diminuem a habilidade de articular eficientemente soluções para problemas complexos, tão comuns em processos naturais (Tanscheit, 2011). No processamento da técnica, foi utilizado o pacote estatístico e1071 (Dimitriadou et al., 2008), implementado no programa R (R Development Core Team, 2008). Como resultado, gerou-se um mapa registrando o cluster classificado em cada pixel.


Analisando a distribuição dos clusters no mapa foram escolhidas cinco áreas de referência capazes de representar a diversidade dos clusters na região de estudo (Figura 1). Nesses locais, realizou-se o mapeamento convencional dos solos onde as unidades de mapeamento (UM) foram inicialmente delineadas, sendo coletadas amostras em 28 pontos de observação nas profundidades de 0-20 e 80-100 cm, com o uso de trado holandês, e, eventualmente, em outras profundidades em caso de solos pouco profundos. Essas amostras foram secas em estufa a 50 ºC por 48 h e peneiradas; as frações menores que 2 mm foram utilizadas para análises laboratoriais. Realizou-se a análise granulométrica a partir do método do densímetro (Camargo et al., 1986), determinando os teores de areia total, silte e argila. Para as análises químicas, determinaram-se o pH em água e em KCl e os teores de Ca2+, Mg2+, K+, Na+, Al3+, H+Al, P e matéria orgânica (MO), de acordo com Raij et al. (2001). Foram então calculadas a soma de bases (SB), capacidade de troca de cátions (CTC), saturação por bases (V%) e saturação por alumínio (m%). A cor do solo foi obtida com uma amostra úmida da TFSA, utilizando-se um colorímetro Minolta CR-300, com chip para cor Munsell (Campos et al., 2003). Considerando as características da paisagem, a geologia local e de acordo com as análises mencionadas, concluiu-se o delineamento das UM. A identificação das classes de solos em cada UM foi possível por meio da descrição morfológica de perfis representativos em trincheiras e barrancos na área de estudo, assim como pela obtenção de informações químicas e granulométricas extraídas de Coelho et al. (1994). A proximidade das áreas dos estudos possibilitou a utilização dos dados antes relatados na literatura. A classificação foi efetuada até o 3º nível categórico do SiBCS (Embrapa, 2006).

As informações das covariáveis ambientais obtidas nas áreas de referência foram então usadas nas etapas de treinamento e validação das redes neurais. A aplicação dessa técnica inicia-se com a elaboração de arquivos contendo dados para o treinamento de cada arquitetura de rede neural, bem como para a validação de cada uma delas. O arquivo de treinamento permite que o algoritmo estabeleça, por aprendizagem, relação entre as covariáveis ambientais (dados de entrada) utilizadas na rede e as UM (dados de saída). Já o arquivo de validação testa essa relação por meios estatísticos. Todos os dados das covariáveis foram reescalonados em um intervalo de 0 a 1, de acordo com Chagas et al. (2010). Em seguida, foram extraídas as informações contidas nos pixels de cada UM identificada nas áreas de referência, originando os arquivos de treinamento e de validação para cada conjunto de covariáveis ambientais testado. Tais arquivos foram gerados de maneira independente. Quanto ao tamanho de cada arquivo, procurou-se seguir as recomendações de Zhu (2000). O autor preconiza que o número de pixels coletados em cada UM deve ser 30 vezes o número de UMs estabelecido no estudo. Tal recomendação refere-se ao treinamento. No caso da validação, o número de pixels é 50 % do utilizado para o treinamento. Para algumas UM, o número total de pixels foi inferior ao somatório do necessário para a geração dos dois arquivos. Nesses casos, 70 % dos pixels da unidade foram usados no treinamento e 30 % na validação. Após coleta, os arquivos gerados foram convertidos para serem inseridos no software Java Simulator Neural Network (JavaNNS), baseado no Stuttgart Neural Network Simulator 4.2 Kernel (Zell et al., 1996).

Os conjuntos de entrada das redes neurais aplicados neste estudo foram: Todas as Covariáveis (TC), Todas exceto Declividade (TC-D), Todas exceto Elevação (TC-E), Todas exceto Geologia (TC-G), Todas exceto Índice de Convergência (TC-IC), Todas exceto Perfil de Curvatura (TC-PfC), Todas exceto Plano de Curvatura (TC-PnC) e Todas exceto Superfície Geomórfica (TC-SG). Dessa forma, pode-se avaliar a importância de cada covariável na predição das UMs pela abordagem aplicada. Por meio de tentativa e erro, o número de neurônios na única camada interna foi-se alterando a cada treinamento (Hirose et al., 1991), sempre sendo avaliado o comportamento do erro quadrático médio (EQM) como critério para a continuação ou término dos treinamentos. O EQM mede a diferença entre os valores estimados e os desejados para o treinamento. Assim, foram avaliadas 64 arquiteturas de redes neurais, diferenciadas pelo número de neurônios na camada de entrada relacionado com cada conjunto testado (TC, TC-D, TC-E, TC-G, TC-IC, TC-PfC, TC-PnC, TC-SG) e pelo número de neurônios na camada interna, que variaram entre 1 e 15. O número de neurônios na camada de saída manteve-se constante, sendo equivalente ao número de UM identificadas (nove unidades). No treinamento das RNAs, aplicou-se o algoritmo de aprendizado backpropagation, com alocação aleatória dos pesos interneurônios entre -1,0 e 1,0 e taxa de aprendizado de 0,2. O número de ciclos de aprendizagem foi de 10.000.

Na etapa de testes, realizaram-se análises estatísticas em cada uma das arquiteturas de rede treinadas. Para tanto, foram utilizados os dados do arquivo de validação gerado. Essas análises consistiram da avaliação do índice Kappa e da exatidão global, obtidos a partir de uma matriz de confusão (Congalton & Green, 1999) e da análise de uma matriz de significância obtida pelos resultados de Kappa e variância de cada rede. Por meio da aplicação do teste estatístico Z, foi possível analisar a ocorrência de diferença significativa entre os valores de Kappa provenientes da avaliação das diferentes redes neurais. Com base nos resultados estatísticos, foi feita a escolha da rede com melhor desempenho para uso no MDS.

Para generalizar as informações da rede neural optada, foram processados no software JavaNNS o arquivo referente a essa rede e um arquivo de imagem contendo os dados dos pixels dos arquivos raster. Nessa etapa, a rede escolhida, tendo sido treinada com as informações referentes à área mapeada convencionalmente, é apresentada para todos os pixels da área de estudo, contendo cada um deles as informações das covariáveis ambientais. Como resultado, cada pixel é classificado com valores de similaridade para cada UM (camada de saída). O mapa final foi obtido por meio da conversão da representação de similaridade (Zhu, 2000) para uma representação booleana. Essa conversão foi feita adicionando a cada pixel o valor correspondente à UM, que apresentou a maior porcentagem entre todas as envolvidas (Zhu, 1997). Com isso, gerou-se um arquivo de imagem final com a classificação de cada pixel, de acordo com as relações entre as UM e as covariáveis ambientais estabelecidas pela rede. A imagem foi importada para o software ERDAS Imagine 9.2, após conversão para formato compatível com o programa, permitindo sua visualização e ajuste da projeção cartográfica do MDS.

Para validar o MDS, coletaram-se 22 pontos de referência georreferenciados, nas profundidades de 0-20 e 80-100 cm, totalizando 44 amostras, distribuídas aleatoriamente sobre a área. Analisadas conforme método descrito anteriormente, tais amostras foram classificadas até o segundo nível categórico, de acordo com Embrapa (2006), mais a informação de textura. Após inserção dessas informações em um banco de dados, fez-se uma verificação do tipo "verdadeiro-falso" entre cada ponto classificado e sua respectiva localização no MDS.

RESULTADOS E DISCUSSÃO

Caracterização das unidades de mapeamento nas áreas de referência

Identificaram-se nove UM nas cinco áreas de referência: Latossolo Vermelho distrófico textura média (LVd3), Latossolo Vermelho eutrófico textura média (LVe3), Latossolo Vermelho eutrófico textura argilosa (LVe2), Latossolo Vermelho eutroférrico textura muito argilosa (LVef1), Nitossolo Vermelho eutroférrico textura muito argilosa (NVef1), Argissolo Vermelho eutrófico textura média/muito argilosa (PVe3/1), Argissolo Vermelho eutrófico textura média (PVe3/3), Cambissolo Háplico Tb eutrófico textura muito argilosa (CXbe1) e Cambissolo Háplico Ta eutrófico textura argilosa (CXve2) (Figura 2). As amostras de solos representativas de cada unidade mapeada são apresentadas no quadro 1.



De acordo com a posição no relevo e o material de origem subjacente, notou-se tendência de ocorrência de determinadas classes de solos nas áreas mapeadas. Nas posições mais elevadas e em relevo plano e suave ondulado, tendo o predomínio do arenito como material de origem, ocorrem os Latossolos Vermelhos de textura média, que estão localizados na superfície geomórfica I e são considerados os solos mais antigos da paisagem; apresentam teores de argila entre 195 e 265 g kg-1 de solo. Apesar de algumas unidades eutróficas terem sido mapeadas, predominou o caráter distrófico nesses Latossolos, com valores de CTC entre 19,2 e 20,7 mmolc kg-1 nos horizontes subsuperficiais, evidenciando o intenso intemperismo e a lixiviação a que esses solos foram submetidos nessas posições do relevo.

A transição dos Latossolos de textura média foi feita, no sentido encosta abaixo, para UM localizadas na superfície geomórfica II, apresentando acréscimos mais ou menos significativos nos teores de argila nos horizontes subsuperficias. Dessa forma, em posições intermediárias das vertentes ocorrem as UM PVe3/3, LVe2, PVe3/1 e LVef1. A diferença das características químicas e granulométricas dessas quatro unidades se fez, entre outros fatores, pela contribuição do basalto mais a jusante e do arenito mais a montante na paisagem, o que se evidenciou pelo aumento nos teores de cátions básicos, apresentando valores de soma de bases que vão de 28,5 mmolc kg-1 (LVe2) até 43,8 mmolc kg-1 (PVe3/1) e de CTC de 37,1 a 47,9 mmolc kg-1 na transição do mesmo Latossolo de textura argilosa para um Latossolo muito argiloso (LVef1) (dados de subsuperfície) (Quadro 1).

No terço final das encostas, localizado na superfície geomórfica III, e considerados os solos mais jovens da região, ocorreram os NVef1, CXbe1 e CXve2, sendo desenvolvidos dos produtos da alteração dos basaltos com menor contribuição do arenito. A presença desses solos argilosos e muito argilosos (teores entre 378 e 766 g kg-1 de solo), sobrejacentes ao material de origem basalto, confirmou o potencial desse material no fornecimento de quantidades significativas de argila como produto do intemperismo (Ghidin et al., 2006). Por sua vez, a dissecação da paisagem com consequente exposição de intrusões da rocha máfica e formação dos solos nessas condições refletiu o caráter eutrófico desses solos, em razão do predomínio de minerais ferromagnesianos oriundos do basalto (Harley & Gildes, 2000; Resende et al., 2002) (valores para soma de bases entre 37,1 e 90,7 mmolc kg-1). As condições de relevo mais íngrime ocorrentes no terço final das encostas fizeram com que a morfogênese predominasse sobre a pedogênese em alguns locais, sendo mapeadas inclusões de Neossolos Litólicos nas unidades CXbe1 e CXve2.

De maneira geral, as áreas mapeadas apresentaram comportamento similar na ocorrência de classes de solos e de suas propriedades químicas e granulométricas, no sentido da superfície geomórfica mais antiga para a mais rejuvenescida. Em uma sequência litoestratigráfica arenito-basalto localizada em área próxima a deste estudo, Coelho et al. (1994), discutindo relações solo-relevo com ênfase no material de origem, identificaram três superfícies geomórficas com características muito próximas das estabelecidas nesta pesquisa.Os autores concluíram que a distribuição das classes de solo ao longo da transecção foi determinada por associação de fatores ligados à posição topográfica e ao material de origem; a maior ou a menor contribuição dos materiais de origem, arenito e basalto, na formação dos solos, variou com a posição relativa dos solos na encosta, ficando expressa na química, mineralogia e granulometria desses.

Cunha et al. (2005) observaram variações similares a deste estudo para os atributos químicos e granulométricos, em solos de uma sequência arenítico-basáltica na região de Jaboticabal, Estado de São Paulo. Das três superfícies geomórficas identificadas, a primeira, localizada na parte mais elevada e de menor inclinação, exibiu os menores valores de CTC do solo e de teores de argila, quando comparadas às outras duas superfícies à sua jusante. Este fato foi em razão da menor contribuição do material basáltico nos solos da primeira superfície. Nas superfícies II e III, ocorreram solos eutróficos que, de acordo com os autores, confirmaram a influência do basalto rico em feldspato calco-sódico e piroxênio e, ou, o menor tempo de lixiviação de bases, uma vez que nessas superfícies se encontram os solos mais jovens.

De acordo com os resultados discutidos anteriormente, as modificações das propriedades químicas e granulométricas dos solos seguiram um padrão nas regiões estudadas, em razão da sequência litoestratigráfica e da respectiva posição na paisagem. Partindo-se do pressuposto de que esses padrões possam ser reconhecidos em áreas adjacentes, locais não mapeados, acredita-se que a predição de solos de uma região como um todo, com base em dados obtidos em áreas de referência, utilizando técnicas de classificação supervisionada, possa gerar resultado satisfatório. O fato de os resultados obtidos por Coelho et al. (1994) e os deste estudo serem muito similares, tanto nas características do relevo e da geologia quanto nas UM identificadas, e por os dois trabalhos terem sido feitos em regiões muito próximas, ratifica a premissa de predição estabelecida.

Avaliação das redes neurais artificiais

Com os resultados do índice Kappa e a variância das arquiteturas de rede com melhor desempenho em cada conjunto testado, foi calculada uma matriz de significância de Kappa (Quadro 2). Assim, foi possível comparar os diferentes resultados e optar pela rede neural a ser utilizada na geração do MDS. Os conjuntos TC, TC-IC e TC-PnC com 11, 7 e 11 neurônios na camada interna, respectivamente, não apresentaram diferenças estatísticas significativas, conforme os resultados do teste Z apresentados na matriz de significância de Kappa (Quadro 2), demonstrando que, apesar da exclusão do índice de convergência ou do plano de curvatura na camada da entrada, um bom desempenho foi mantido. Portanto, esses dois atributos tiveram menor importância na distinção entre as classes de solos para os dados em questão. Chagas et al. (2010) constataram que o plano de curvatura exibiu pouca diferenciação entre as classes, mas que foi muito importante para a separação de PVe1 e PVe4 + CXve das demais classes. No mesmo estudo, os autores obtiveram os melhores desempenhos para o índice Kappa, quando foi utilizado o conjunto com todas as covariáveis, sendo cinco atributos do terreno e três índices derivados de uma imagem Landsat7.


Os piores desempenhos encontrados ocorreram quando as covariáveis declividade e elevação foram excluídas do conjunto de entrada. Nesses casos, os melhores valores do índice Kappa foram apenas de 0,633 e 0,516, respectivamente, com 11 e 3 neurônios internos. Por apresentarem comportamento mais distinto entre as classes de solos, a declividade e a elevação foram os atributos que se destacaram na melhoria do desempenho na fase de testes, concordando com Chagas et al. (2010).

A rede neural com melhor desempenho na etapa de treinamento (TC/11) foi escolhida para gerar o MDS. A matriz de confusão (Quadro 3) gerada pela aplicação da TC/11, utilizando as amostras de validação ou teste, avaliou a capacidade dessa rede neural em discriminar as classes de solos, em razão das covariáveis ambientais; ou seja, o aprendizado obtido pela rede na etapa de treinamento é apresentado na concordância entre o que a rede classifica e o que ocorre na realidade, representando o seu potencial de reproduzir a relação solo-paisagem da área de estudo.


Nas UM CXve2, LVe3, NVef1, PVe3/1 e PVe3/3, as concordâncias, representadas pela exatidão do produtor, foram acima de 90 %. As unidades CXbe1 e LVe2 apresentaram concordâncias de 77,8 e 69,9 %, respectivamente. Essa unidade de Latossolo foi confundida em 22 dos 73 pixels com a unidade PVe3/3. Esse erro coincidiu com a dificuldade de distinção no campo entre os Argissolos e Latossolos. Os valores médios das covariáveis ambientais obtidos para essas duas unidades confirmam tal dificuldade (Figura 3), uma vez que apenas os atributos elevação e geologia evidenciaram alguma diferença. A informação geológica foi fundamental na distinção entre esses solos; a unidade LVe2 foi identificada em áreas basálticas e PVe3/3, em área de transição dessa rocha para o arenito Itaqueri.


A classe LVd3 apresentou 60,7 % de concordância, classificando erroneamente 32 pixels como LVe3 e 17 pixels como PVe3/3. Os Latossolos de textura média com caráter eutrófico apresentaram valores de saturação por bases próximos do limite que os classificariam como sendo solos distróficos. Assim, a rede neural teve dificuldade em distinguir unidades que apresentaram pequenas divergências em atributos relacionados com a classificação de um solo. A semelhança encontrada nos valores médios das covariáveis ambientais para essas três unidades (Figura 3) também justificou os pixels erroneamente classificados. Apenas nas covariáveis elevação, geologia e superfície geomórfica foram observadas diferenças. Mesmo sendo duas unidades de solos que têm como principal material de origem o arenito, a maior média obtida para a geologia na unidade LVe3, em comparação com o LVd3, indica que o basalto teve maior contribuição na formação do solo eutrófico.

Na validação da unidade LVef1, dos 118 pixels, 47 foram classificados como PVe3/1 e 26, como LVe2. Somente 29 pixels foram corretamente classificados, resultando em uma concordância de apenas 24,6 %. As três unidades ocorreram exclusivamente em áreas de basalto e sem distinção nos valores médios para os atributos índice de convergência, perfil e plano de curvatura, dificultando a discriminação entre essas unidades. Pequenas diferenças foram encontradas nos valores de declividade e superfície geomórfica, com menores médias para a unidade LVef1, enquanto para o atributo elevação, a unidade LVe2 destacou-se com maior ocorrência em maiores altitudes.

Caracterização do Mapa Digital de Solos (MDS)

Após a validação da arquitetura de rede TC/11, fez-se a generalização de suas informações para toda a área de estudo. Na figura 2,está apresentado o Mapa Digital de Solos gerado com essa abordagem.

A classificação das unidades de mapeamento na área de estudo pelas redes neurais manteve relação com as características do relevo e da litologia. Algumas unidades tiveram maior representatividade, como os LVd3, com 4.317,8 ha (39,0 %); e PVe3/3, com 3.175,9 ha (28,7 %), enquanto as unidades com as menores áreas mapeadas foram os LVef1, com 101,7 ha (0,9 %); LVe2, com 170,1 ha (1,5 %); e PVe3/1, com 189,4 ha (1,7 %). As outras unidades foram identificadas com as seguintes áreas: CXve2, com 1.584,1 ha (14,3 %); LVe3, com 1.104,2 ha (10,0 %); NVef1, com 1.087,9 ha (9,8 %); e CXbe1, com 448,8 ha (4,1 %).

Nas áreas de topo, onde ocorrem as menores declividades e maiores elevações das vertentes, com predomínio do arenito na formação dos solos, foram classificados apenas os LVd3 e LVe3. De maneira geral, esses Latossolos de textura média dão lugar aos PVe3/3, em áreas de terço médio a terço final das encostas, nas transições de arenito para basalto. Provavelmente, parte dos erros obtidos para a classe LVd3, na etapa de validação da rede TC/11, se expressou no grande número de pixels classificados como PVe3/3 no mapa digital, ressaltando a dificuldade na distinção entre essas três unidades durante as atividades de campo. Tal dificuldade é em razão tanto pela ocorrência dessas unidades em locais da paisagem muito semelhantes e adjacentes quanto pelo nível de detalhamento do mapa convencional das áreas de referência, que pode ter resultado em um número de informações insuficientes para delineamento correto das UM de difícil separação. Uma vez que cada unidade identificada atua como padrão de referência na elaboração das amostras de treinamento e validação das redes neurais, erros na determinação dos limites entre as unidades no mapa convencional refletem em uma classificação equivocada por parte da técnica digital.

Em locais com o predomínio do basalto como material de origem e nos terços finais das encostas, as principais UM classificadas foram CXbe1, CXve2 e NVef1. Invariavelmente, ambos os Cambissolos foram classificados nos locais representados pelos talvegues dos rios. A inexistência de um neurônio na camada de saída das redes neurais que representassem os leitos dos rios, e o fato desses Cambissolos terem sido mapeados em áreas adjacentes a esses locais da paisagem, justifica o resultado no mapa digital (Figura 2). Desse modo, as áreas dessas duas unidades classificadas digitalmente foram superestimadas.

A unidade LVef1, com grande representatividade no mapa convencional, não manteve o mesmo comportamento no mapa digital, sendo inclusive a UM com menor área classificada. A classificação digital dessa unidade apresentou grande confusão, principalmente com as unidades PVe3/1 e LVe2, com 39,8 e 22,1 %, respectivamente, dos pixels que deveriam ser atribuídos à unidade LVef1, sendo classificados como pertencentes a essa UM, conforme evidencia a baixa concordância obtida na matriz de confusão (etapa de validação da rede TC/11), apresentada no quadro 3. Como consequência, o processo de generalização da rede para o padrão estabelecido para os LVef1 apresentou desempenho abaixo do esperado, o que pode estar relacionado com a grande similaridade entre as covariáveis geologia, índice de convergência, perfil e plano de curvatura entre as três unidades; erro relacionado com a coleta das amostras de treinamento e validação; falta de uma ou mais covariáveis preditoras; ou até mesmo a ineficiência do classificador, que dificultou a correta discriminação destas unidades no mapa digital.

No caso de o erro estar relacionado com as amostras de treinamento e validação, melhores resultados poderiam ser obtidos para a classificação da unidade LVef1, caso fossem eliminadas amostras próximas às áreas de transição entre essa unidade e as UM LVe2 e PVe3/1 ou se fosse optado somente pela coleta das amostras de treinamento e validação nos locais dos perfis e amostras de campo, conforme sugerido por Zhu (2000).

A UM LVe2 também foi classificada em pequenas áreas da região. A distribuição dessa UM revelou coerência com o que foi constatado no mapa convencional, sendo classificada intermediando solos mais arenosos à montante e mais argilosos à jusante. Notou-se comportamento interessante para a unidade PVe3/1, em que a maior parte dos pixels com sua identificação foi localizado em cabeceiras de drenagem, condizente com uma possível causa do gradiente textural encontrado em uma das áreas de referência: presença do basalto em subsuperfície e contribuição de materiais de textura mais grosseira, localizados em posição superior da vertente (colúvio).

Validação do mapa digital de solos

Do total de pontos avaliados na classificação digital pelo uso das redes neurais, foram inferidas corretamente 16 amostras (72,7 %). Das seis amostras discordantes, três foram devidas a textura do solo, sendo idênticas as classificações até o nível de subordem. Para classificar os solos, há um sistema que estabelece limites numéricos para distinção entre classes de atributos, o que favoreceu tais erros nessas amostras; entretanto, os valores de textura obtidos para a classificação digital e a convencional foram muito próximos dos limites das classes texturais.

O resultado de concordância obtido com os pontos de referência foi semelhante ao encontrado por Zhu (2000), o qual, aplicando estratégia de mapeamento de solos com uso de redes neurais, inferiu corretamente 77 % dos 64 locais amostrados no campo. Aplicando a mesma técnica, Chagas (2006) obteve 70,8 % de acerto na classificação de 288 pontos de referência, que incluíam perfis de solos, amostras extras e pontos de observação. De acordo com o autor, o mapa produzido pela abordagem de redes neurais teve desempenho melhor que a abordagem convencional (52,7 % de concordância com os pontos de referência).

Os possíveis motivos que podem ser citados como causas das divergências na validação pontual do mapa digital de solos são: a variação dos solos pode ter ocorrido sem relação com as covariáveis ambientais utilizadas na estratégia aplicada (Chagas et al., 2010); o uso das informações geológicas pode não ter representado adequadamente a geologia da área, em razão da escala reduzida (Thomas et al., 1999); a dificuldade no processo de aprendizado das redes neurais, confundindo UM de comportamentos similares para as covariáveis ambientais (Zhu, 2000); e a obtenção de amostras para treinamento e validação das RNAs a partir de polígonos de UM oriundos de abordagem convencional, que podem não representar as unidades presentes, em razão de o nível de mapeamento efetuado ser considerado semidetalhado.

CONCLUSÕES

1. O padrão de distribuição dos solos nas áreas de referência, mapeadas de forma convencional, foi observado nos 12.000 ha estudados, quando se analisou a distribuição dos solos no mapa digital.

2. Os atributos do terreno declividade e elevação foram as covariáveis ambientais que mais se destacaram na distinção e predição das classes de solos pelas redes neurais.

3. O comportamento semelhante das covariáveis ambientais para os Latossolos e Argissolos, na região estudada, dificultou a separação dessas classes pela abordagem empregada. A mesma dificuldade foi constatada no campo, já que esses solos ocorreram em condições de relevo similares.

4. A extrapolação do conhecimento adquirido pela abordagem por redes neurais, a partir de áreas de referência, para áreas adjacentes, gerou resultados coerentes com a realidade de campo. Com isso, unidades de mapeamento foram obtidas em locais não visitados, servindo como dados preliminares para atividades que demandam esse tipo de informação.

AGRADECIMENTOS

À Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), pela bolsa de mestrado e reserva técnica concedidas. Ao pesquisador da Embrapa Solos, Waldir de Carvalho Júnior, pela colaboração na revisão do artigo.

LITERATURA CITADA

Recebido para publicação em 28 de março de 2012 e aprovado em 21 de janeiro de 2013.

  • BEZDEK, J.C.; EHRLICH, R. & FULL, W. The fuzzy c-means clustering algorithm. Comp. Geosci., 10:191-203, 1984.
  • CAMARGO, A.O.; MONIZ, A.C.; JORGE, J.A. & VALADARES, J.M. Métodos de análise química, mineralógica e física de solos do IAC. Campinas, Instituto Agronômico de Campinas, 1986. 94p. (Boletim Técnico, 106)
  • CAMPOS, R.C.; DEMATTÊ, J.A.M. & QUARTAROLI, C.F. Determinação indireta do teor de hematita no solo a partir de dados de colorimetria e radiometria. Pesq. Agropec. Bras., 38:521-528, 2003.
  • CHAGAS, C.S.; CARVALHO JÚNIOR, W. & BHERING, S.B. Integração de dados dos quickbir de atributos do terreno no mapeamento digital de solos por redes neurais artificiais. R. Bras. Ci. Solo, 35:693-704, 2011.
  • CHAGAS, C.S.; FERNANDES FILHO, E.I.; VIEIRA, C.A.O.; SCHAEFER, C.E.G.R. & CARVALHO JÚNIOR, W. Atributos topográficos e dados do Landsat7 no mapeamento digital de solos com uso de redes neurais. Pesq. Agropec. Bras., 45:497-507, 2010.
  • CHAGAS, C.S. Mapeamento digital de solos por correlação ambiental e redes neurais em uma bacia hidrográfica no domínio de Mar de Morros. Viçosa: UFV. 2006. 223p. (Tese de Doutorado)
  • COELHO, F.F. & GIASSON, E. Métodos para mapeamento digital de solos com utilização de sistema de informação geográfica. Ci. Rural, 40:2099-2106, 2010.
  • COELHO, R.M.; LEPSCH, I.F. & MENK, J.F. Relações solo-relevo em uma encosta com transição arenito-basalto em Jaú (SP). R. Bras. Ci. Solo, 18:125-137, 1994.
  • CONGALTON, R.G. & GREEN, K. Assessing the accuracy of remotely sensed data: Principles and practices. New York, Lewis Publishers, 1999. 137p.
  • CUNHA, P.; MARQUES JÚNIOR, J.; CURI, N.; PEREIRA, G.T. & LEPSCH, I.F. Superfícies geomórficas e atributos de Latossolos em uma sequência arenítico-basáltica da região de Jaboticabal (SP). R. Bras. Ci. Solo, 29:81-90, 2005.
  • DANIELS, R.B.; GAMBLE, E.F. & CADY, J.G. The relation between geomorphology and soil morphology and genesis. Adv.Agron., 23:51-87, 1971.
  • DIMITRIADOU, E.; HORNIK, K.; LEISCH, F.; MEYER, D. & WEINGESSEL, A. e1071: Misc Functions of the Department of Statistics (e1071), TU Wien, R package version 1.5-18, 2008. Disponível em: <http://cran.r-project.org/web/packages/e1071/index.html> Acesso em 23 maio 2011.
  • EMPRESA BRASILEIRA DE PESQUISA AGROPECUÁRIA - EMBRAPA. Sistema brasileiro de classificação de solos. 2.ed. Rio de Janeiro, Embrapa Solos, 2006. 306p.
  • ESRI, ArcGIS Desktop DeveloperGuideArcGIS 9. Redlands, ESRI Press, 2006. CD ROM
  • GHIDIN, A.A.; MELO, V.F., LIMA, V.C. & LIMA, J.M.J.C. Topossequências de Latossolos originados de rochas basálticas no Paraná. II Relação entre mineralogia da fração argila e propriedades físicas dos solos. R. Bras. Ci. Solo, 30:307-319, 2006.
  • HARLEY, A.D.& GILKES, R.J. Factors influencing the release of plant nutrient elements from silicate rock powders: A geochemical overview. Nutr. Cycl. Agroecosyst., 56:11-36, 2000.
  • HIROSE, Y.; YAMASHITA, K. & HIJIYA, S. Back-propagation algorithm which varies the number of hidden units. Neural Networks, 4:61-66, 1991.
  • HUDSON, B.D. The soil survey as paradigm-based science. Soil Sci. Soc. Am. J., 56:836-841, 1992.
  • INSTITUTO DE PESQUISAS TECNOLÓGICAS DO ESTADO DE SÃO PAULO-IPT. Mapa Geológico do Estado de São Paulo. Escala - 1:500.000. São Paulo, 1981. 126p.
  • LAGACHERIE, P. & McBRATNEY, A. Spatial soil information systems and spatial soil inference systems: perspectives for digital soil mapping. In: LAGACHERIE, P.; McBRATNEY, A. & VOLTZ, M., eds. Digital soil mapping: An introductory perspective. Amsterdam, Elsevier, 2007. p.3-22.
  • MARQUES JÚNIOR, J. & LEPSCH, I.F. Depósitos superficiais neocenozoicos, superfícies geomórficas e solos em Monte Alto, SP. Geociências, 19:90-106, 2000.
  • McBRATNEY, A.B.; MENDONÇA SANTOS, M.L. & MINASNY, B. On digital soil mapping. Geoderma, 117:3-52, 2003.
  • R DEVELOPMENT CORE TEAM: R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, 2008. Disponível em: <http://www.R-project.org, ISBN 3-900051-07-0>. Acesso em 23 maio 2011.
  • RAIJ, B.van.; ANDRADE, J.C.; CANTARELA, H. & QUAGGIO, J.A. Análise química para avaliação de solos tropicais. Campinas, Instituto Agronômico de Campinas, 2001. 285p.
  • RESENDE, M.; CURI, N.; REZENDE, S.B. & CORRÊA, G.F. Pedologia: Base para distinção de ambientes. Viçosa, MG, Neput, 2002. 338p.
  • RUHE, R.V. Quaternary landscape in Iowa. Ames, Iowa State University Press, 1969. 255p.
  • TANSCHEIT, R. Fundamentos da lógica Fuzzy e controle Fuzzy. Disponível em: <http://tcs.eng.br/PUC/Fuzzy/SI-Logica_Controle_Fuzzy.pdf >. Acesso em 02 jul. 2011.
  • TERAMOTO, E.R.; LEPSCH, I.F. & VIDAL-TORRADO, P. Relações solo, superfície geomórfica e substrato geológico na microbacia do ribeirão Marins (Piracicaba-SP). Sci.Agríc., 58:361-371, 2001.
  • THOMAS, A.L.; KING, D.; DAMBRINE, E. & COUTURIER, A. Predicting soil classes with parameters derived from relief and geologic materials in a sandstone region of the Vosges mountains (Northeastern France). Geoderma, 90:291-305, 1999.
  • ZELL, A.; MAMIER, G.; VOGT, M.; MACHE, N.; HÜBNER, R.; DÖRING, S.; HERRMANN, K.; SOYEZ, T.; SCHMALZL, M.; SOMMER, T.; HATZIGEORGIOU, A.; POSSELT, D.; SCHREINER, T.; KETT, B.; CLEMENTE, G.; WIELAND, J. & GATTER, J. Stuttgart neural network simulator v4.2. Stuttgart, University of Stuttgart, Institute for Parallel and Distributed High Performance Systems/University of Tübingen - Wilhelm-Schickard-Institute for Computer Science - Department of Computer Architecture, 1996. 338p.
  • ZHU, A.X. A similarity model for representing soil spatial information. Geoderma, 77:217-242, 1997.
  • ZHU, A.X. Mapping soil landscape as spatial continua: The neural network approach. Water Res. Res., 36:663-677, 2000.
  • (1
    ) Parte da Dissertação de Mestrado do primeiro autor apresentada ao Programa de Pós-Graduação em Solos e Nutrição de Plantas, Escola Superior de Agricultura "Luiz de Queiroz" - ESALQ/USP. Realizada com auxílio da FAPESP.
  • Datas de Publicação

    • Publicação nesta coleção
      03 Jun 2013
    • Data do Fascículo
      Abr 2013

    Histórico

    • Recebido
      28 Mar 2012
    • Aceito
      21 Jan 2013
    Sociedade Brasileira de Ciência do Solo Secretaria Executiva , Caixa Postal 231, 36570-000 Viçosa MG Brasil, Tel.: (55 31) 3899 2471 - Viçosa - MG - Brazil
    E-mail: sbcs@ufv.br