Seleção de modelos de variabilidade espacial para elaboração de mapas temáticos de atributos físicos do solo e produtividade da soja

Faraco, Mário Antonio; Uribe-Opazo, Miguel Angel; Silva, Edson Antonio Alves da; Johann, Jerry Adriani; Borssoi, Joelmir André

doi:10.1590/S0100-06832008000200001

Resumos

Pesquisas sobre a variabilidade espacial dos atributos do solo que influenciam a produtividade são de uma grande importância para o desenvolvimento de novas técnicas que beneficiam a agricultura. A variabilidade desses atributos pode ser avaliada por técnicas de geoestatística e auxiliar no mapeamento e manejo do solo. Este trabalho teve por objetivo avaliar a qualidade do ajuste dos modelos teóricos espaciais segundo o Critério de Informação de Akaike, de Filliben, de Validação Cruzada e o valor máximo do logaritmo da função verossimilhança, de dados da umidade do solo, da densidade do solo e da resistência do solo à penetração, nas camadas de 0 a 0,1, 0,1 a 0,2 e 0,2 a 0,3 m, e de produtividade da soja do ano agrícola 2004-2005. Os parâmetros dos modelos de variabilidade espacial foram estimados por meio dos métodos de mínimos quadrados ordinários, mínimos quadrados ponderados e máxima verossimilhança. A pesquisa foi desenvolvida em uma área de 57 ha de um Latossolo Vermelho distroférrico, utilizando-se uma malha de 75 x 75 m georreferenciada. Concluiu-se que, dos métodos de avaliação de ajustes estudados, o da Validação Cruzada foi o mais adequado para escolha do melhor ajuste do modelo de variabilidade espacial; conseqüentemente têm-se mapas temáticos mais acurados.

geoestatística; métodos de estimação; validação do ajuste

Studies on the spatial variability of soil attributes influencing crop productivity are important for the development of new technologies beneficial to agriculture. Geostatistical techniques can be used to evaluate the variability of soil attributes and contribute to soil mapping and management. The purpose of this paper was to evaluate the quality of the theoretical spatial model adjustments according to the Akaike Information and Filiben Criteria, Cross Validation and the maximum value of the log-likelihood function, of the soil humidity, of the soil density data and soil resistance to penetration, in the layers 0-0.1; 0.1-0.2; and 0.2- 0.3 m and the soybean yield in the 2004-2005 growing season. The parameters of the spatial variability models were estimated by the methods of least ordinary squares, least weighted squares and maximum likelihood. The experiment was developed in an area of 57 ha with a regionally typical distrofic Red Latosol (Oxisol). A spatially georeferenced 75 x 75 m regular mesh was used. Based on the results of the evaluation of adjustments it was concluded that the Cross Validation criterion was the most adequate to choose the best adjustment of the spatial variability model, resulting in more precise thematic maps.

geostatistics; estimation methods; adjustment validation

SEÇÃO I - FÍSICA DO SOLO

Seleção de modelos de variabilidade espacial para elaboração de mapas temáticos de atributos físicos do solo e produtividade da soja¹ 1 Parte da Tese de Mestrado em Engenharia Agrícola com Área de Concentração em Sistemas Agroindustriais da Universidade Estadual do Oeste do Paraná UNIOESTE.

Selection criteria of spatial variability models used in thematical maps of soil physical attributes and soybean yield

Mário Antonio Faraco^I; Miguel Angel Uribe-Opazo^II; Edson Antonio Alves da Silva^III; Jerry Adriani Johann^III; Joelmir André Borssoi^III

^IMestre em Engenharia Agrícola pela Universidade Estadual do Oeste do Paraná UNIOESTE. Rua Universitária 2069, CEP 85819-110 Cascavel (PR). E-mail: mafaraco@gmail.com

^IIProfessor Associado do Centro de Ciências Exatas e Tecnológicas CCET, UNIOESTE. E-mail: mopazo@unioeste.br

^IIIProfessor Assistente do Centro de Ciências Exatas e Tecnológicas CCET, UNIOESTE. E-mails: edsonaasilva@gmail.com; jerryaj@pop.com.br; jborssoi@yahoo.com.br

RESUMO

Pesquisas sobre a variabilidade espacial dos atributos do solo que influenciam a produtividade são de uma grande importância para o desenvolvimento de novas técnicas que beneficiam a agricultura. A variabilidade desses atributos pode ser avaliada por técnicas de geoestatística e auxiliar no mapeamento e manejo do solo. Este trabalho teve por objetivo avaliar a qualidade do ajuste dos modelos teóricos espaciais segundo o Critério de Informação de Akaike, de Filliben, de Validação Cruzada e o valor máximo do logaritmo da função verossimilhança, de dados da umidade do solo, da densidade do solo e da resistência do solo à penetração, nas camadas de 0 a 0,1, 0,1 a 0,2 e 0,2 a 0,3 m, e de produtividade da soja do ano agrícola 20042005. Os parâmetros dos modelos de variabilidade espacial foram estimados por meio dos métodos de mínimos quadrados ordinários, mínimos quadrados ponderados e máxima verossimilhança. A pesquisa foi desenvolvida em uma área de 57 ha de um Latossolo Vermelho distroférrico, utilizando-se uma malha de 75 x 75 m georreferenciada. Concluiu-se que, dos métodos de avaliação de ajustes estudados, o da Validação Cruzada foi o mais adequado para escolha do melhor ajuste do modelo de variabilidade espacial; conseqüentemente têm-se mapas temáticos mais acurados.

Termos de indexação: geoestatística, métodos de estimação, validação do ajuste.

SUMMARY

Studies on the spatial variability of soil attributes influencing crop productivity are important for the development of new technologies beneficial to agriculture. Geostatistical techniques can be used to evaluate the variability of soil attributes and contribute to soil mapping and management. The purpose of this paper was to evaluate the quality of the theoretical spatial model adjustments according to the Akaike Information and Filiben Criteria, Cross Validation and the maximum value of the log-likelihood function, of the soil humidity, of the soil density data and soil resistance to penetration, in the layers 00.1; 0.10.2; and 0.2 0.3 m and the soybean yield in the 20042005 growing season. The parameters of the spatial variability models were estimated by the methods of least ordinary squares, least weighted squares and maximum likelihood. The experiment was developed in an area of 57 ha with a regionally typical distrofic Red Latosol (Oxisol). A spatially georeferenced 75 x 75 m regular mesh was used. Based on the results of the evaluation of adjustments it was concluded that the Cross Validation criterion was the most adequate to choose the best adjustment of the spatial variability model, resulting in more precise thematic maps.

Index terms: geostatistics, estimation methods, adjustment validation.

INTRODUÇÃO

A geoestatística surgiu para o estudo de variáveis regionalizadas, ou seja, o estudo de uma função espacial numérica, que varia de um local para outro, com continuidade aparente e cujos valores são relacionados com a posição espacial que ocupam. Oferece técnicas para elaboração de mapas do comportamento de variáveis georreferenciadas, utilizando o método de interpolação de informações a partir de dados obtidos em locais convenientemente amostrados e modelados em um semivariograma experimental.

Para modelar um conjunto de dados com uma estrutura de correlação, considera-se um processo estocástico gaussiano {Z(s), s Î S}, em que S é um subconjunto de R^d, sendo d um espaço euclidiano d-dimensional. Supõe-se que os dados Z(s₁),..., Z(s_n) do processo são realizações conhecidas nos locais s_i, i = 1,..., n em que s_i é um vetor d-dimensional (d > 1). Supõe-se que os dados, de modo geral, podem ser escritos como Z(s_i) = µ(s_i) + Î(s_i), sendo µ(s_i) uma função determinística que descreve a componente estrutural de Z em s_i, que pode ser expressa como µ(s_i) = , sendo f_k uma função conhecida e b_k uma constante desconhecida a ser estimada, para k = 1,..., p (caso particular p = 1, µ(s_i) = b₁) e Î(s_i) é um termo estocástico, que varia localmente e depende espacialmente de Z(s_i). Assume-se que o termo estocástico Î(s_i) tem média zero e a variação entre pontos no espaço é determinada pela função covariância C(s_i, s_j) = Cov{Î(s_i), Î(s_i)} (Mardia & Marshall, 1984).

A semivariância é uma função da distância h, que é estimada em um conjunto discreto de distâncias (lags). Em termos da covariância, a função semivariância define-se como g(h) = C(0)C (h), sendo h = ||s_is_j||, C(h) = C(s_i , s_j) e C(0) = s² a variância das observações.

A partir da estimativa de g(h), ajusta-se um modelo que irá depender de parâmetros desconhecidos a serem determinados e com características espaciais. Segundo Isaaks & Srivastava (1989), a função semivariância g(h) é definida na equação 1 como:

em que Z(s) é o valor da variável medida; s Î S Ì R^d, d = 1, 2 ou 3, a localização; e h, a distância que separa duas amostras. Assim, o semivariograma experimental é um gráfico de dispersão de g(h) em função de h que permite uma análise variográfica do comportamento de Z(s) (Cressie, 1993).

O principal estimador utilizado na construção do semivariograma experimental é o dos momentos, conhecido como semivariograma de Matheron, para processos estocásticos gaussianos. Para o caso de haver pontos discrepantes, que não podem ser eliminados ou substituídos, a literatura recomenda o estimador de Cressie & Hawkins (1980).

A partir da estimativa da semivariância empírica (ou experimental), ajusta-se um modelo teórico aos pontos obtidos. Escolher um modelo adequado é obter estimadores dos parâmetros efeito pepita C₀, patamar C₀ + C₁ e alcance a, com métodos estatísticos de otimização como: mínimos quadrados ordinários, mínimos quadrados ponderados (Cressie, 1985) e máxima verossimilhança (Mardia & Marshall, 1984). Uma vez escolhido o modelo teórico de correlação espacial, resta saber se ele é eficiente para interpolar valores, permitindo estimativas confiáveis para construção de mapas temáticos (Cressie, 1985).

Os métodos de validação comparam valores teóricos do modelo geoestatístico escolhido e os valores empíricos obtidos na amostragem. Com base na análise desses erros de estimação, poderá ser selecionado o melhor modelo de semivariância. Entre os principais critérios para validação, encontram-se os de Informação de Akaike, de Filliben, de validação cruzada e o máximo valor do logaritmo da função verossimilhança.

O Critério de Informação de Akaike - AIC (Akaike's Information Criterion) procura uma solução satisfatória entre o bom ajuste e o princípio da parcimônia (Akaike, 1973). Sakamoto et al. (1986) desenvolveram estudos visando conhecer como os modelos são usados para fazer estimação. O AIC propõe verificar se dois modelos representam dados igualmente satisfatórios. Considera que, do modelo mais simples (menor valor de Â), pode-se esperar melhor desempenho para a estimação de novos dados, ou seja, o AIC impõe uma penalidade para a complexidade. O AIC é estimado por Â = 2 + 2k, em que é o logaritmo da função verossimilhança e k, o número de parâmetros do modelo ajustado. Para o caso de os dados apresentarem distribuição gaussiana de probabilidade, e se eliminadas as constantes arbitrárias, o AIC é estimado por , em que é a soma de quadrados dos resíduos e n é o número de pontos amostrais.

O Critério de Filliben (1975) para resíduos ortonormais também pode ajudar na determinação do melhor modelo geoestatístico para o ajuste. Para a j-ésima posição (j = p + 1, p + 2,..., n), pode-se estimar por krigagem ordinária o valor de (s_j) usando somente os j1 valores anteriores de dados e normalizados pelo desvio-padrão do erro da krigagem; o valor de p é obtido pela definição da função µ(s_i).

Os erros normalizados (Lee, 1994) para np variáveis são definidos como:

para j = (p + 1), ..., n, em que s_j é o desvio-padrão da estimativa da krigagem. Os np resíduos obtidos pela equação 2 são chamados de resíduos ortonormais, isto é, são não-correlacionados, linearmente independentes e têm variância unitária. No teste de Filliben (1975), calcula-se o coeficiente de correlação linear r* entre as observações ordenadas Î_(j) e a estatística das medianas ordenadas m_(i) de distribuição normal N(0,1). Quanto mais próximo r* estiver de 1, mais normal é a distribuição dos dados. Se o valor tabelado de r (Filliben, 1975) para determinado tamanho de amostra é maior do que r*, a hipótese de que os dados seguem uma distribuição normal é rejeitada para um certo nível percentual de significância. Praticamente, o que se testa é se os resíduos ortonormais seguem uma distribuição normal em determinado nível de significância.

A validação cruzada, segundo Isaaks & Srivastava (1989), é uma técnica de avaliação de erros de estimativas que permite comparar os valores previstos com os amostrados. O valor da amostra, em certa localização Z(s_i), é temporariamente descartado do conjunto de dados e, então, é feita uma previsão por krigagem no local (s_(i)), usando-se as amostras restantes. Assim, o Erro Médio por validação cruzada (EM) é obtido da equação 3:

em que n é o número de dados; Z(s_i), valor observado no ponto s_i; e (s_(i)), valor predito por krigagem ordinário no ponto s_i, sem considerar a observação Z(s_i).

Esse procedimento pode ser visto como um experimento no qual se imita o processo de estimação, ao supor que nunca se toma uma amostra naquela localização. Uma vez que a estimação é feita, pode-se compará-la ao valor da amostra que foi inicialmente removida do conjunto de dados amostrais. Este procedimento, método de "deixar um fora", é repetido para todas as amostras disponíveis.

McBratney & Webster (1986) e Cressie (1993) apresentam erro médio reduzido , desvio-padrão dos erros médios (DP_EM), desvio-padrão dos erros reduzidos (S_ER) e do erro absoluto (EA), como instrumento para avaliar modelos. O erro médio reduzido é definido pela equação 4:

em que s((s_(i))) é o desvio-padrão da krigagem no ponto s_i, sem considerar a observação Z(s_i).

O desvio-padrão dos erros reduzidos (S_ER) é obtido a partir da Equação (5):

Segundo McBratney & Webster (1986), Cressie (1993) e Mello et al. (2005), aplicando-se a condição de não-tendenciosidade, o valor populacional para o erro médio reduzido deve ser zero e o do desvio-padrão do erro reduzido igual a 1. Portanto, o valor de EM e mais próximo de zero, o valor DP_EM menor e o valor de S_ER mais próximo de um são os critérios para escolha do melhor modelo ajustado. O erro absoluto (EA) é uma medida da magnitude dos erros na unidade da variável. Conhecendo-se o conjunto de valores medidos e preditos por krigagem ordinária Z(s_i) e (s_(i)), respectivamente, foi possível definir o erro absoluto na unidade da variável estudada, pela equação 6:

Os métodos de estimação de mínimos quadrados ordinários (OLS) e mínimos quadrados ponderados (WLS1) buscam minimizar a soma de quadrados das diferenças entre valores observados e estimados. Já o método de estimação de máxima verossimilhança considerado um estimador de parâmetros assintoticamente normal, não viciado e eficiente (Cox & Hinkley, 1974) consiste em maximizar a função de densidade de probabilidade conjunta do processo Z(s) em relação aos efeitos fixos (processo estacionário) e os componentes dos efeitos aleatórios. McBratney & Webster (1986) utilizaram este método de ajuste de modelos e também afirmaram ser o mais eficiente. Mardia & Marshall (1984) desenvolveram teoria para o caso em que o termo aleatório Î(s) fosse um processo gaussiano. O melhor modelo para um processo será aquele que apresentar o maior valor de maximização do logaritmo da função verossimilhança.

O objetivo deste trabalho foi descrever os comportamentos espaciais dos dados de umidade do solo, densidade do solo e resistência do solo à penetração nas camadas de 0 a 0,1, 0,1 a 0,2 e 0,2 a 0,3 m e da produtividade da soja, pela seleção de modelos de variabilidade espacial, usando os métodos de estimação de mínimos quadrados ordinários (OLS), mínimos quadrados ponderados (WLS1) (Cressie, 1985) e máxima verossimilhança (MV) (Mardia & Marshall, 1984), segundo os critérios de Akaike, Filliben, validação cruzada e máximo valor do logaritmo da função verossimilhança (MLL). O trabalho também apresenta os mapas temáticos utilizando estrutura de dependência espacial, escolhida segundo os critérios utilizados.

MATERIAL E MÉTODOS

Os dados experimentais foram obtidos no ano agrícola 2004/2005, referentes a uma pesquisa que se desenvolveu numa propriedade localizada no município de Cascavel, Estado do Paraná, em área de produção de grãos de 57 ha, de um solo classificado como Latossolo Vermelho distroférrico. A variedade da soja semeada na área em estudo foi a COODETEC 216 (CD216). Na área experimental, cultivada sob plantio direto, foram demarcadas 100 parcelas com espaçamento de 75 x 75 m, com auxílio de um aparelho GPS, pelo método estático, com correção diferencial pós-processada, visando a sua correta localização no sistema de coordenadas geográficas Universal Transverse Mercatur (UTM), que utiliza coordenadas métricas. Em cada ponto foram: (a) coletadas amostras de solo para avaliação da umidade e densidade do solo nas camadas de 0 a 0,1, 0,1 a 0,2 e 0,2 a 0,3 m; (b) feitos furos com um penetrógrafo e registrada a resistência do solo à penetração nas camadas de 0 a 0,1, 0,1 a 0,2 e 0,2 a 0,3 m; e (c) colhida a soja da parcela e determinada a sua produtividade.

Para análise da estrutura de dependência espacial dos processos intrinsecamente estacionários e isotrópicos, utilizaram-se semivariogramas experimentais, construídos empregando-se o estimador de Matheron ou Cressie & Hawkins, caso os dados apresentem valores discrepantes, conforme o caso (Cressie, 1985). Com a finalidade de se aplicarem os critérios de validação em estudo, ajustaram-se três modelos teóricos ao semivariograma experimental: exponencial, esférico e gaussiano, considerados adequados aos dados em análise. Na estimação dos parâmetros foram usados os métodos: dos mínimos quadrados ordinários (OLS), dos mínimos quadrados ponderados (WLS1) (Cressie, 1985) e máxima verossimilhança (MV) (Mardia & Marshall, 1984). Para estimação e ajuste de modelos e avaliação de critérios de ajuste foi utilizado o software R (R Development Core Team, 2005) e, nele, o pacote geoR (Ribeiro Jr. & Diggle, 2001), ambos livres e de acordo com a licença GPL (General Public Licence).

Com a comparação entre os resultados alcançados, foram analisados os comportamentos dos critérios de Akaike, de Filliben, de validação cruzada e maior valor de maximização do logaritmo da função verossimilhança. Finalmente, construíram-se os mapas temáticos da umidade do solo, da densidade, da resistência do solo à penetração e da produtividade da soja, segundo o modelo que apresentou melhor ajuste utilizando-se os critérios de validação de modelos.

RESULTADOS E DISCUSSÃO

No quadro 1 são apresentadas as estatísticas descritivas da densidade do solo (DS), da resistência do solo a penetração (RSP) e da umidade do solo (UMD) nas camadas de 0 a 0,1, 0,1 a 0,2 e 0,2 a 0,3 m e da produtividade da soja (PROD). Para a densidade do solo, observa-se que os valores não apresentaram variações acentuadas, estando a média dentro de valores esperados para solos na região estudada: da ordem de 1,0 a 1,45 kg m^-3. Os coeficientes de variação indicam homogeneidade (CV menor que 10 %), segundo Gomes & Garcia (2002). Para as três camadas estudadas, a média e mediana foram semelhantes, mostrando que as densidades do solo não variam muito entre as camadas. Para a RSP, observou-se, na camada de 0 a 0,1 m, estatísticas de posição superiores às das outras profundidades, notadamente a média e a mediana, porém com maior homogeneidade quando comparada às outras duas camadas que tiveram valores de coeficiente de variação entre 20 e 30 %. Observa-se ainda que os valores da RSP, na camada de 0 a 0,1 m, encontram-se entre 0,671 e 4,269 MPa. Os valores mais elevados ocorreram nas parcelas 10, 92, 96 e 97.

No estudo da umidade do solo (Quadro 1), a umidade média encontrada foi de 0,369 m³ m^-3, com desvio-padrão de 0,06 m³ m^-3 e coeficiente de variação de 15,56 % para a camada de 0 a 0,1 m. Para as outras duas camadas houve aumento médio da umidade, porém nas três camadas houve média homogeneidade (CV entre 10 e 20 %), segundo Gomes & Garcia (2002).

A produtividade média da soja (Quadro 1) foi de 3,22 t ha^-1, com desvio-padrão de 0,38. O valor mínimo encontrado foi de 2,09 t ha^-1, e o máximo, de 4,09 t ha^-1. Observa-se portanto que, em média, a produtividade para a área em estudo foi superior às médias no Estado do Paraná e nacional, no ano agrícola 2004/2005, já que a produção média estadual, para essa safra, foi de 2,30 t ha^-1, e a média nacional, de 2,19 t ha^-1. O coeficiente de variação amostral (CV) encontrado para a produtividade da soja foi de 11,71 %, existindo, portanto, média homogeneidade nos dados em relação à sua média (Gomes & Garcia, 2002).

No quadro 2 apresentam-se os parâmetros efeito pepita (C₀), patamar (C₀ + C₁) e alcance (a) dos modelos ajustados para os dados de densidade do solo nas camadas de 0 a 0,1 m, 0,1 a 0,2 m e 0,2 a 0,3 m, onde se observa que os dois primeiros parâmetros (efeito pepita e patamar) apresentam semelhança nos três métodos de estimação (OLS, WLS1 e MV) para os três modelos em estudo (exponencial, esférico e gaussiano). Utilizando o método da máxima verossimilhança (MV), observa-se que os parâmetros estimados nas camadas de 0,1 a 0,2 e 0,2 a 0,3 m indicam que os modelos têm efeito pepita puro, isto é, há pouca diferença entre o efeito pepita (C₀) e o patamar (C₀ + C₁).

No quadro 3, encontram-se os resultados dos diferentes critérios de validação de ajustes dos modelos geoestatísticos. Segundo o critério AIC, o menor valor de Â para a DS na camada de de 0 a 0,1 m aponta para o modelo gaussiano estimado pelos métodos OLS e WLS1. Para a DS na camada de 0,1 a 0,2 m, o menor valor de Â indica o modelo exponencial estimado pelos métodos OLS e WLS1; para a DS na camada de de 0,2 a 0,3 m, o menor valor de Â aponta para os três modelos estimados pelo método OLS e esférico para WLS1. O critério de Filliben testou se os resíduos ortonormais seguiam uma distribuição normal a 1 %. Para o caso dos dados da DS nas camadas de 0 a 0,1, 0,1 a 0,2 e 0,2 a 0,3 m, que têm 83, 88 e 91 valores amostrados, respectivamente, os valores tabelados de r, obtidos da tabela de Filliben (1975), foram de 0,976, 0,977 e 0,978, respectivamente. Comparando com os valores r* calculados (Quadro 3), verificou-se que os valores r* são maiores do que r tabelado, indicando que a hipótese de que os dados seguem distribuição normal não foi rejeitada para um nível de 1 % de significância. Pelo critério de Filliben, para a DS nas camadas de 0 a 0,1 e 0,2 a 0,3 m todos os modelos são aceitos, e para DS na camada de 0,1 a 0,2 m, nenhum modelo foi aceito. Pelo máximo valor do logaritmo da função verossimilhança (MLL), os valores são semelhantes em cada camada, não se destacando nenhum modelo.

O critério de validação cruzada utilizando o erro médio da validação cruzada (EM), erro médio reduzido , desvio-padrão dos erros médios (DP_EM), desvio-padrão dos erros reduzidos (S_ER) e do erro absoluto (EA), apresentados no quadro 4, aplicados aos modelos em estudo, indicou, para as três camadas os modelos esférico, exponencial e exponencial, com parâmetros estimados pelos métodos WLS1, MV e OLS, respectivamente.

A figura 1 apresenta os mapas temáticos da densidade do solo (DS) nas três camadas, construídos utilizando os modelos indicados pelo critério da validação cruzada. Observa-se nesta figura (a,b,c) que, à medida que a profundidade aumenta, há diminuição na densidade do solo em [kg dm^-3].

Os semivariogramas experimentais para a variável resistência do solo à penetração (RSP), nas camadas de 0 a 0,1 e 0,1 a 0,2 m, foram calculados pelo estimador de Matheron, e para a camada de 0,2 a 0,3 m, pelo estimador de Cressie & Hawkins, por apresentarem valores discrepantes. No quadro 5 são apresentados os parâmetros efeito pepita (C₀), patamar (C₀ + C₁) e alcance (a) para os modelos ajustados para a RSP. Observou-se que esses parâmetros apresentam semelhança nos três métodos de estimação (OLS, WLS1 e MV) nos três modelos ajustados.

No quadro 6 apresenta-se avaliação dos modelos da RSP. Os valores Â do critério AIC apontaram, para a camada de 0 a 0,1 m, o modelo esférico utilizando os três métodos de estimação (OLS, WLS1 e MV); para a camada de 0,1 a 0,2 m, escolheu-se o modelo esférico com os três métodos de estimação e também o modelo gaussiano com o método de MV; para a camada de 0,2 a 0,3 m, escolheu-se o modelo esférico com o método de MV e gaussiano com os métodos OLS e WLS1. Utilizando o critério de Filliben, para a RSP nas camadas de 0 a 0,1, 0,1 a 0,2 e 0,2 a 0,3 m, com 93, 90 e 88 valores amostrados, respectivamente, e para um nível de significância de 1 %, os valores de r obtidos da tabela apresentada em Filliben (1975) foram de 0,978, 0,978 e 0,978, nessa ordem. Comparando com os valores de r* apresentados no quadro 6, verificou-se que estes são maiores do que r nas duas primeiras camadas, indicando que os erros seguem distribuição normal em um nível de significância de 1 %. Por esse critério, nas camadas de 0 a 0,1 e 0,1 a 0,2 m, todos os modelos são aceitos, mas, para a camada de 0,2 a 0,3 m, nenhum modelo foi aprovado. Pelo máximo valor do logaritmo da função verossimilhança (MLL), observa-se que os valores são semelhantes em cada camada, não se destacando nenhum modelo.

O critério de validação cruzada apresentado no quadro 7 sugeriu para a RSP a escolha dos modelos exponencial, esférico e gaussiano, respectivamente, para as três camadas. Nas três escolhas, o método de estimação de parâmetros foi o MV.

Na figura 2 são apresentados os mapas temáticos da resistência do solo à penetração nas três camadas em estudo, construídos com os modelos indicados pelo critério da validação cruzada. Observa-se que, à medida que a profundidade aumenta, há diminuição da RSP em [MPa] e homogeneização espacial da área.

No quadro 8 encontram-se os modelos ajustados e os parâmetros estimados efeito pepita (C₀), patamar (C₀ + C₁) e alcance (a) para a umidade do solo (UMD) nas três camadas em estudo. A estimação do semivariograma experimental para as camadas de 0 a 0,1 e 0,2 a 0,3 m foi calculada pelo estimador de Cressie & Hawkins, pois os dados mostraram pontos discrepantes; já na camada de 0,1 a 0,2 m, o semivariograma experimental foi calculado pelo estimador de Matheron. Observa-se também que os dois primeiros parâmetros (efeito pepita e patamar) apresentam semelhança nos três métodos de estimação (OLS, WLS1 e MV) para os três modelos ajustados.

No quadro 9 é apresentada a avaliação dos modelos da UMD. Os valores Â do critério AIC apontaram para a camada de 0 a 0,1 m os modelos exponencial, empregando método de estimação WLS1, e gaussiano, utilizando os métodos OLS e MV; para a camada de 0,1 a 0,2 m, os modelos exponencial, com método de estimação MV, e gaussiano, utilizando os métodos OLS e WLS1; e para a camada de 0,2 a 0,3 m, os modelos exponencial, utilizando método de estimação OLS, e esférico, empregando os métodos WLS1 e MV. Utilizando o critério de Filliben, para a camada de 0 a 0,1 m, a 1 %, foi escolhido o modelo gaussiano utilizando o estimador MV; na camada de 0,1 a 0,2 m, o modelo esférico com o estimador WLS1; e na camada de 0,2 a 0,3 m, nenhum modelo foi aceito. Pelo máximo valor do logaritmo da função verossimilhança (MLL), observa-se que os valores são semelhantes em cada camada, não se destacando nenhum modelo.

O critério de validação cruzada apresentado no quadro 10 sugeriu, para a umidade na camada de 0 a 0,1 m, o modelo exponencial utilizando o método de estimação de MV; na camada de 0,1 a 0,2 m, para o modelo exponencial empregando o método de estimação de OLS; e na camada de 0,2 a 0,3 m, para o modelo esférico utilizando o método de estimação de MV.

Na figura 3 são apresentados os mapas temáticos referentes à UMD nas três camadas em estudo, construídos com base nos modelos indicados pelo critério da validação cruzada.

No quadro 11 apresentam-se os modelos ajustados e os parâmetros estimados efeito pepita (C₀), patamar (C₀ + C₁) e alcance (a), para a produtividade da soja [t ha^-1]. O semivariograma experimental foi calculado pelo estimador de Matheron. Observa-se que os dois primeiros parâmetros (efeito pepita e patamar) apresentam semelhança nos três métodos de estimação (OLS, WLS1 e MV) para os três modelos ajustados.

No quadro 12, observa-se que, para a produtividade da soja, o critério AIC definiu o modelo gaussiano, com parâmetros estimados pelos métodos OLS e MV. Pelo critério de Filliben, com 66 valores amostrados, e para um nível de 1 %, o valor de r foi de 0,972 (Filliben, 1975). Por este critério, todos os modelos ajustados podem ser aceitos.

No quadro 13 é apresentado o critério de validação cruzada. Segundo este critério, escolheu-se o modelo exponencial com parâmetros estimados pelo método MV.

A figura 4 apresenta o mapa temático de variabilidade espacial da produtividade da soja, construído com base no modelo indicado pelo critério da validação cruzada. Espacialmente, verifica-se que há regiões da área em estudo com produtividade superior à das médias estadual e nacional no ano agrícola 2004-2005.

Finalmente, segundo o resumo do quadro 14, o critério da validação cruzada foi considerado o mais seletivo; já o critério de Filliben foi o mais conservador, e o critério de Akaike foi pouco conclusivo.

CONCLUSÕES

1. Os critérios de seleção por validação cruzada, Akaike, Filliben e máximo valor do logaritmo da função verossimilhança não selecionam simultaneamente um mesmo modelo, devido em parte às distintas naturezas dos critérios. A aplicação do critério de Filliben não apontou para um modelo particular em nenhum dos casos, e o critério da validação cruzada foi considerado o mais seletivo. O critério de Akaike e do máximo valor do logaritmo da função verossimilhança não foram conclusivos. O critério da validação cruzada foi considerado o mais adequado para a escolha do melhor ajuste, e os mapas temáticos foram construídos utilizando-se uma estrutura de dependência espacial, escolhida segundo esse critério, que permitiu uma noção visual do comportamento dos atributos densidade, resistência do solo à penetração, umidade e produtividade na área estudada.

2. À semelhança da construção de modelos empíricos de variabilidade espacial aos semivariogramas experimentais, em que o conhecimento do pesquisador relativo às variáveis em estudo conduz a resultados melhores, também no caso de verificação de qualidade dos ajustes o conhecimento e o bom senso do pesquisador são de grande valia.

AGRADECIMENTOS

Ao CNPq, à Fundação Araucária e à Companhia Nacional de Abastecimento CONAB, pelo apoio financeiro para a realização da pesquisa.

LITERATURA CITADA

Recebido para publicação em fevereiro de 2007 e aprovado em outubro de 2007.

AKAIKE, H. Information theory as an extension of the maximum likelihood principle. In: INTERNATIONAL SYMPOSIUM ON INFORMATION THEORY, 2., Budapest, 1973. Proceedings. Budapest, Akadêmia Kiadó, 1973. p.267-281.
COX, D.R. & HINKLEY, D.V. Theoretical statistics. London, Chapman and Hall, 1974. 532p.
CRESSIE, N. Fitting variogram models by weighted least squares. Mathem. Geol., 17:563-586, 1985.
CRESSIE, N. Statistics for spatial data. New York, John Wiley, 1993. 900p.
CRESSIE, N. & HAWKINS, D.M. Robust estimation of the variogram. Mathem. Geol., 12:115-125, 1980.
FILLIBEN, J.J. The probability plot correlation coefficient test for normality. Technometrics, 17:111-117, 1975.
GOMES, F.P. & GARCIA, C.H. Estatística aplicada a experimentos agronômicos e florestais. Piracicaba, FEALQ, 2002. v.11. 305p.
ISAAKS, E.H. & SRIVASTAVA, R.M. An introduction to applied geostatistics. New York, Oxford University Press, 1989. 561p.
LEE, S.I. Validation of geoestatistical models using the Filliben test for orthonormal residual. J. Hydrol., 158:319-332, 1994.
MARDIA, K.V. & MARSHALL, R.J. Maximum likelihood models for residual covariance in special regression. Biometrika, 71:135-146, 1984.
McBRATNEY, A. & WEBSTER, R. Choosing functions for semi-variograms os soil properties and fitting them to sample estimates. J. Soil Sci., 37:617-639, 1986.
MELLO, J.M.; BATISTA, J.L.F.; RIBEIRO JR, P.J. & OLIVEIRA, M.S. Ajuste e seleção de modelos espaciais de semivariograma visando à estimativa volumétrica de Eucalyptus grandis Sci. For., 69:25-37, 2005.
R DEVELOPMENT CORE TEAM (2005). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em: <http://www.R-project.org>. Acesso em 3 jun. 2005.
RIBEIRO JR, P.J. & DIGGLE, P.J. geoR: A package for geostatistical analysis. R-NEWS, 01, 2001. Disponível em: http://cran.r-project.org/doc/Rnews
SAKAMOTO, Y.; ISHIGURO, M. & KITAGAWA, G. Akaike information criterion statistics. New York, Springer, 1986. 320p.

1

Parte da Tese de Mestrado em Engenharia Agrícola com Área de Concentração em Sistemas Agroindustriais da Universidade Estadual do Oeste do Paraná UNIOESTE.

Datas de Publicação

Publicação nesta coleção
30 Jun 2008
Data do Fascículo
Abr 2008

Histórico

Aceito
Out 2007
Recebido
Fev 2007

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

[1] AKAIKE, H. Information theory as an extension of the maximum likelihood principle. In: INTERNATIONAL SYMPOSIUM ON INFORMATION THEORY, 2., Budapest, 1973. Proceedings. Budapest, Akadêmia Kiadó, 1973. p.267-281.

[2] COX, D.R. & HINKLEY, D.V. Theoretical statistics. London, Chapman and Hall, 1974. 532p.

[3] CRESSIE, N. Fitting variogram models by weighted least squares. Mathem. Geol., 17:563-586, 1985.

[4] CRESSIE, N. Statistics for spatial data. New York, John Wiley, 1993. 900p.

[5] CRESSIE, N. & HAWKINS, D.M. Robust estimation of the variogram. Mathem. Geol., 12:115-125, 1980.

[6] FILLIBEN, J.J. The probability plot correlation coefficient test for normality. Technometrics, 17:111-117, 1975.

[7] GOMES, F.P. & GARCIA, C.H. Estatística aplicada a experimentos agronômicos e florestais. Piracicaba, FEALQ, 2002. v.11. 305p.

[8] ISAAKS, E.H. & SRIVASTAVA, R.M. An introduction to applied geostatistics. New York, Oxford University Press, 1989. 561p.

[9] LEE, S.I. Validation of geoestatistical models using the Filliben test for orthonormal residual. J. Hydrol., 158:319-332, 1994.

[10] MARDIA, K.V. & MARSHALL, R.J. Maximum likelihood models for residual covariance in special regression. Biometrika, 71:135-146, 1984.

[11] McBRATNEY, A. & WEBSTER, R. Choosing functions for semi-variograms os soil properties and fitting them to sample estimates. J. Soil Sci., 37:617-639, 1986.

[12] MELLO, J.M.; BATISTA, J.L.F.; RIBEIRO JR, P.J. & OLIVEIRA, M.S. Ajuste e seleção de modelos espaciais de semivariograma visando à estimativa volumétrica de Eucalyptus grandis Sci. For., 69:25-37, 2005.

[13] R DEVELOPMENT CORE TEAM (2005). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em: <http://www.R-project.org>. Acesso em 3 jun. 2005.

[14] RIBEIRO JR, P.J. & DIGGLE, P.J. geoR: A package for geostatistical analysis. R-NEWS, 01, 2001. Disponível em: http://cran.r-project.org/doc/Rnews

[15] SAKAMOTO, Y.; ISHIGURO, M. & KITAGAWA, G. Akaike information criterion statistics. New York, Springer, 1986. 320p.

Brasil

Brasil

Seleção de modelos de variabilidade espacial para elaboração de mapas temáticos de atributos físicos do solo e produtividade da soja

Selection criteria of spatial variability models used in thematical maps of soil physical attributes and soybean yield

Resumos

Datas de Publicação

Histórico