SciELO - Scientific Electronic Library Online

 
vol.69 issue4Detecting monotonous trends in monthly rainfall series of the state of São Paulo, Brazil author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

Share


Bragantia

Print version ISSN 0006-8705

Bragantia vol.69 no.4 Campinas Dec. 2010

http://dx.doi.org/10.1590/S0006-87052010000400032 

METODOLOGIA E TÉCNICAS EXPERIMENTAIS

 

Excesso de zeros nas variáveis observadas: estudo de caso em experimento com brócolis

 

Excess of zero value in variables: study of case in broccoli field experiments

 

 

Alessandro Dal'Col LúcioI; Mara Rúbia Machado CoutoII; Jorge Nadir TrevisanI; Gustavo Adolfo Klippel MartinsI; Sidinei José LopesI

IDepartamento de Fitotecnia, Centro de Ciências Rurais, Universidade Federal de Santa Maria (UFSM), 97105-900 Santa Maria (RS). E-mail: adlucio@smail.ufsm.br; trevisan@smail.ufsm.br; klipmart@smail.ufsm.br; sjlopes@smail.ufsm.br
IIDepartamento de Estatística, Centro de Ciências Naturais e Exatas, Universidade Federal de Santa Maria (UFSM), 97105-900 Santa Maria (RS). E-mail: mararubiacouto@hotmail.com

 

 


RESUMO

Em olericultura o interesse é a produção de produtos comercializáveis. Nesses experimentos, comumente, são avaliadas variáveis tais como a fitomassa das cabeças e ramificações comerciais e não comerciais da planta. No entanto, essas variáveis possuem uma característica particular que está relacionada com a presença ou ausência da estrutura comercial da planta no momento da colheita, o que resulta em valores zeros para essas variáveis, gerando certa variabilidade e afetando a análise de variância dos dados. Assim, este trabalho teve por objetivo definir uma transformação adequada para as variáveis observadas em experimentos com a cultura do brócolis, realizados em diferentes épocas do ano, visando estabilizar a variabilidade gerada pela presença de valores zeros nas múltiplas colheitas. Analisaram-se quatro experimentos com a cultura do brócolis utilizando a família de transformações de Box-Cox, com uma adaptação de Yamamura apresentada em 1999, devido a presença de valores nulos. Concluiu-se que para experimentos com brócolis a transformação mais adequada para as variáveis cabeças comerciais e não comerciais, e ramificações comerciais e não comerciais foi logarítmica para cultivos no inverno, na primavera e no verão. Para cultivos no outono, a transformação indicada para as variáveis cabeças comerciais e não comerciais e ramificações não comerciais foi "inverso da raiz quarta", enquanto para ramificações comerciais, "inverso da raiz quadrada".

Palavras-chave: Transformação de dados; Box-Cox; variabilidade; análise de variância.


ABSTRACT

The major purpose of vegetable crops production systems is the profitable and economically viable yield of marketable products. Numerous field experiments with vegetable crops are carried out to determine biomass of weekly and heads production of marketable and non-marketable variables. However these variables possess the particular characteristic related to their presence or absence of the commercial structure of the plant at harvest time, what implicates in zero values for those variables, generate variability and affect variance analyses. This paper deals with the search of applicable transformations for variables studied in broccoli field experiments conducted in different planting times attempting to stabilize the variabilily resulting from the presence of zero values in multiple harvests. Due to the presence of zero values, broccoli experiments were analyzed using an adaptation of the Box-Cox transformation family found in Yamamura in 1999. The most adequate transformation found for marketable and non-marketable heads and side shoots of broccoli grown in winter, spring and summer was the logarithmical. For marketable and non-marketable heads and non-marketable side shoots for fall-grown broccoli the inverse fourth root and to marketable side shoots is a inverse square root was the indicated transformation.

Key words: Transformation of data; Box-Cox; variability; analysis of variance.


 

 

1. INTRODUÇÃO

A variabilidade da produção entre plantas pode acarretar em heterogeneidade das variâncias residuais que, para realização da análise de variância, deverá ser rejeitada para atender à pressuposição do modelo matemático da homogeneidade dos erros. Assim é assegurado o nível de significância dos testes F e os de comparação múltipla de médias. Em análises de dados experimentais com variâncias heterogêneas, o nível de significância passa a ficar acima do especificado (Conagin et al., 1993). O estudo do comportamento da média e da variância da produção ao longo de diferentes colheitas se faz necessário, bem como a interferência direta que diferentes tratos culturais realizados nos experimentos exercem nessas estatísticas, pois são fatores que podem alterar as conclusões de trabalhos científicos.

No cultivo de oleráceas, a produção das partes comercializáveis da planta é de grande interesse. No entanto, a ocorrência de valores zeros é bastante frequente, pois nem sempre existem estruturas comerciáveis a serem colhidas ou de tamanho e formato adequado para sua colheita e comercialização (Souza et al., 2002; Lorentz et al., 2005; Lúcio et al., 2008). Esta frequência de zeros gera variabilidade, o que pode provocar distorções nos procedimentos de inferência derivados da análise de variância. Um exemplo de heterocedasticidade das variâncias refere-se a dados provindos de contagens, pois algumas amostras resultam em uma variabilidade maior que a variabilidade nominal esperada pelo modelo Poisson a ser ajustado. Segundo Borgatto et al. (2006), esse fenômeno é conhecido como superdispersão, podendo ocorrer devido: à variabilidade da média, ao excesso de zero, à correlação entre indivíduos e/ou omissão de variáveis não observadas.

Nos casos da presença de superdispersão na amostra, o uso de transformações de variáveis se faz necessário para que se possa atingir a homocedasticidade na análise de variância. Em experimentos cuja resposta é observada com alta taxa de valor zero, como é o caso de experimentos com oleráceas com múltiplas colheitas, a eficácia das transformações fica prejudicada, especialmente aquelas que empregam a função logarítmica, pois o zero não pertence ao domínio dessa função. Estudos que descrevem a variabilidade de populações utilizam frequentemente a transformação logarítmica para alcançar a homocedasticidade ou a estabilidade da variância para testar os efeitos na análise de variância.

Ao se dispor de uma amostra com alta taxa de valores zero é comum o acréscimo de uma constante (c) a cada um dos dados (Banzatto e Kronka, 2006; Storck et al., 2000). A determinação do valor constante c que deve ser adicionado a variável original (Y) tem sido bastante discutida na literatura. Conforme Yamamura (1999), não há base concreta quanto às razões pelas quais a unidade é adicionada ao invés de outra constante, tais como 0,5 ou dois. Outros princípios alternativos foram propostos por Hill (1963); Griffiths (1980) e Berry (1987) para determinar o valor de c. Os procedimentos propostos por esses autores são aplicáveis em um determinado conjunto de pressupostos, os quais requerem cálculos complexos. Devido a este fato, um princípio prático foi proposto por Yamamura (1999) sugerindo como uma escolha razoável c = 0,5 se a forma da distribuição não for conhecida. O autor defende o uso de c igual 0,5 pelo motivo de que, se uma distribuição discreta definida em (0, 1, 2, ...) pode ser aproximadamente descrita por uma distribuição contínua definida em (0, ∞), quando se usa c = 0,5.

Este trabalho teve por objetivo definir uma transformação adequada para as variáveis observadas em experimentos com a cultura de brócolis, realizados em diferentes épocas do ano, visando estabilizar a variabilidade gerada pela presença de valores zeros nas múltiplas colheitas.

 

2. MATERIAL E MÉTODOS

Foram realizados quatro experimentos com a cultura do brócolis nas estações inverno, primavera, verão e outono, em Santa Maria (latitude: 29º43'21.17''S, longitude: 53º43'26.64''O e altitude: 95 m), em solo classificado como Planossolo Gley Pouco Húmico (Dalmolin e Klamt, 1997).

Cada parcela foi constituída por 14 plantas, arranjadas em linhas simples, em área total de 9,80 m2, com espaçamento de 1,00 m entre filas e 0,70 m entre plantas e os dados foram obtidos de dez plantas úteis por parcela. Utilizou-se o delineamento experimental de blocos ao acaso bifatorial com parcela subdividida no tempo e amostragem na subparcela em quatro repetições. Nas parcelas principais foram casualizadas as cultivares, sendo 15 no verão, 11 no outono e 14 no inverno e primavera e, nas subparcelas, foram casualizadas as colheitas, sendo seis no inverno, oito no outono e nove na primavera e no verão.

As aplicações de adubos, fungicidas e inseticidas foram realizadas sempre que necessário, conforme recomendação da cultura (Filgueira, 2000) e as colheitas, em dois a três repasses semanais, coletando os valores das variáveis cabeças comerciais e não comerciais, e ramificações comerciais e não comerciais. Os critérios para determinação da maturação comercial foram flores fechadas, botões florais compactos e de coloração verde intensa e pedúnculos florais sem alongamento excessivo (Correia, 1983; Filgueira, 2000). Aquelas cabeças e ramificações com flores abertas, alongamentos no pedúnculo, danos de pragas, doenças e geadas e ramificações com comprimento inferior a 15 cm foram consideradas não comerciais.

Utilizou-se a transformação Box-Cox (Box e Cox, 1964) para o conjunto de funções potências, para encontrar a transformação para estabilizar ou reduzir a variabilidade existente e normalizar os resíduos. Como para valores nulos a família de transformações de Box-Cox fica restrita, utilizou-se a variável somada a uma constante. Adotou-se o procedimento proposto por Yamamura (1999) com c = 0,5, gerando assim as expressões f (y) = , λ ≠ e f(y) = ln (y + 0,5),λ = 0

Para a escolha da melhor potência λ, considerou-se para λ valores no intervalo [-2, 2], conforme descrevem DRAPPER e SMITH (1981), sendo substituídos nas expressões Z(λ) = λ ≠ 0 ou Z(λ) = ylny, λ =0, em que o jacobiano J (λ, z)=1, gerando valores transformados (Z(λ)) para cada variável sendo, após, realizada a análise de variância para cada variável transformada. Para determinar o estimador de máxima verossimilhança (Lmax), substituiu-se a soma de quadrados residual (SSE(λ)), usado, para cada valor de λ na expressão Lmax(λ) = - , e o melhor λ foi escolhido de maneira que maximizasse Lmax e minimizasse o resíduo.

Foram obtidas as medidas descritivas e a análise de variância para as variáveis, antes e após o uso de transformação, aplicando o teste de Bartlett, conforme Steel et al. (1997), para verificar se a transformação foi suficiente para que a homocedasticidade dos erros tenha sido satisfeita e, finalmente, realizada a análise dos resíduos antes e após a transformação. Para as análises estatísticas dos dados, utilizaram-se os softwares Statistica 7.0 e SAS, em nível de 5% de significância.

 

3. RESULTADOS E DISCUSSÃO

Nas figuras 1 e 2, pode-se verificar o efeito na média e no desvio-padrão de uma taxa elevada de valores zero para rendimento de cabeças comerciais (CC) e não comerciais (CNC) e para ramificações comerciais (RC) e não comerciais (RNC) nas quatro épocas. A frequência de zeros para CNC e RNC foi muito alta, acima de 90 %, exceto para RNC no experimento no verão (60%). Abordando esse resultado com enfoque agrícola é o que se espera de uma cultivar de brócolis, com pouca colheita de cabeças e ramificações não comerciais, mas do ponto de vista da estatística experimental, esse comportamento gera alta taxa de valores zero nas amostras, para essas variáveis, o que inflaciona a variabilidade já existente entre as repetições do mesmo tratamento, alterando o erro experimental e sua estimativa (QMe).

Nas tabelas 1, 2, 3 e 4 são apresentados os vários valores de λ, a raiz do quadrado médio do erro (RQME) e a função de máxima verossimilhança (Lmax) para as quatro épocas de cultivo, respectivamente para as variáveis CC, RC, CNC e RNC. Analisando-se essas tabelas, o valor da potência λ que minimiza a RQME e mazimiza a Lmax foi 0 (zero), para os experimentos no inverno, primavera e verão, independentemente da variável observada, indicando que a melhor transformação seria a função logarítmica (y0 = log(y)). No outono, o valor de λ para RQME mínimo e Lmax máximo foi de -0,25 para todas as variáveis, exceto para ramificações comerciais em que λ = -0,50. Desta forma, para o outono, a transformação indicada para CC, CNC e RNC foi inverso da raiz quarta (y-0,25) e para RC, a transformação inverso da raiz quadrada (y-0,5). No outono, foram observados os maiores valores da média para CC e RC e uma das menores para CNC e RNC e os maiores valores QMe em todas as variáveis, quando comparados com os experimentos no inverno, na primavera e no verão. Comprova-se ser o outono a época preferencial de cultivo, mas com maior variabilidade, quando comparada com as demais épocas, concordando com os resultados observados por Trevisan et al. (2003). Esse comportamento no outono pode ser justificado pelo fato da cultura de brócolis requerer, conforme Sonnenberg (1985) e Filgueira (2000), clima ameno ou temperado, predominando no Brasil o cultivo de cultivares de outono-inverno, como o caso das cultivares avaliadas no presente trabalho.

Após a aplicação da transformação, a redução no valor do coeficiente de variação foi evidente, variando de 35% para RC no inverno até 99% para as CNC e RNC no verão (Tabela 5), indicando o efeito na redução da variabilidade existente na amostra com excesso de zeros. Com a aplicação da transformação, houve maior evidência em rejeitar a hipótese Ho para as fontes de variação avaliadas na análise de variância, principalmente referente às cultivares avaliadas, visto que em todas as variáveis, em todas as épocas, o efeito da interação entre cultivares e colheita não foi significativo, nem com a variável original mais a constante, nem com a transformação da variável mais a constante. A melhoria na precisão da inferência é uma das consequências esperadas após a aplicação de qualquer transformação de dados, fato comprovado no trabalho.

Mesmo com a redução nos valores do CV% e da maior significância no teste F na análise de variância, após a aplicação do teste de Bartlett para as variáveis transformadas, as transformações realizadas nos dados não foram suficientes para o atendimento à pressuposição da homogeneidade dos resíduos, pois se rejeitou a hipótese de homocedasticidade para todas as variáveis em todas as épocas de cultivo, apesar do aumento observado no valor do χ2 calculado para todas as situações estudadas.

As variáveis estudadas houve melhoras significativas ao atendimento à normalidade dos erros, verificado nas figuras 3 e 4, para CC e RC com os dados transformados, independentemente da época de experimentação. Mesmo se rejeitando a hipótese de homocedasticidade dos resíduos, o valor-p apresentado no teste, após a transformação, foi muito próximo do nível de significância nominal no estudo (p< 0,05), além da transformação indicada em cada situação para essas duas variáveis, indicando a melhor condição possível para transformação dos dados e homogeneidade dos erros. Portanto, é uma possibilidade que permite estabilizar a variância ou, pelo menos, reduzir esta variabilidade, auxiliando nas análises estatísticas e interpretações dos resultados deste tipo de experimento, sem comprometer a precisão experimental.

Já para as cabeças e ramificações não comerciais, os valores residuais obtidos continuaram ainda muito dispersos após a transformação dos dados (Figuras 5 e 6), indicando que esta não controlou a variação de forma efetiva. Uma explicação para este resultado é que para essas variáveis ocorreu uma frequência de valores zero muito elevada (Figuras 1 e 2) e, provavelmente, esse seja o motivo que mesmo com o emprego da transformação os resíduos ainda não estejam próximos à normalidade.

 

4. CONCLUSÕES

1. A transformação mais adequada para cabeças comerciais e não comerciais e ramificações comerciais e não comerciais de brócolis é a logarítmica para experimentos no inverno, na primavera e no verão.

2. Para experimentos no outono, a transformação indicada para cabeças comerciais e não comerciais e ramificações não comerciais é inverso da raiz quarta, enquanto para ramificações comerciais é inverso da raiz quadrada.

 

AGRADECIMENTOS

Ao CNPq pelo auxílio financeiro para a realização do trabalho e pela concessão de bolsas de produtividade em pesquisa aos autores Alessandro Dal'Col Lúcio e Sidinei José Lopes.

 

REFERÊNCIAS

BANZATTO, D.A., KRONKA, S.N. Experimentação agrícola. 4.ed. Jaboticabal: FUNEP, 2006. 246p.         [ Links ]

BERRY, D.A. Logarithmic transformations in ANOVA. Biometrics, v.43, p 439-456, 1987.         [ Links ]

BORGATTO, A.F.; DEMÉTRIO, C.G.B.; LEANDRO, R.A. Modelos para proporções com superdispersão e excesso de zeros - Um procedimento bayesiano. Revista de Matemática e Estatística, v.24, p.125-135, 2006.         [ Links ]

BOX, G.E.P.; COX, D.R. An analysis of transformations. Journal of the Royal Statistical Society, v.26, p.211-252, 1964. (Series B - Statistical Methodological)        [ Links ]

CONAGIN, A.; NAGAI, V.; IGUE, T. Efeito da falta de normalidade em testes de homogeneidade das variâncias. Bragantia, v.57, p.203-214, 1993.         [ Links ]

CORREIA, L.G. Colheita, classificação, embalagem e comercialização de brássicas. Informe Agropecuário, v.9, p.52-54, 1983.         [ Links ]

DALMOLIN, R.S.D.; KLAMT, E. Solos de textura superficial média e arenosa do RS: características, classificação e aptidão de uso agrícola. In: FRIES, M.R.; DALMOLIN, R.S.D. (Ed.). Atualização em recomendação de adubação e calagem: ênfase em plantio direto. Santa Maria: UFSM/SBCS, 1997. p.9-22.         [ Links ]

DRAPER, N. R.; SMITH, H. Applied regression analysis. New York: John Wiley, 1981. 709p.         [ Links ]

FILGUEIRA, F.A.R. Novo manual de olericultura: tecnologia moderna na produção e comercialização de hortaliças. Viçosa: UFV, 2000. 402p.         [ Links ]

GRIFFITHS, D.A. Interval estimation for the three-parameter lognormal distribution via the likelihood function. Journal of the Royal Statistical Society, v.29, p.58-68, 1980. (Series C - Applied Statistics)        [ Links ]

HILL, B.M. The three-parameter lognormal distribuition and bayesian analysis of a point-source epidemic. Journal of the American Statistical Association, v.58, p.72-84, 1963.         [ Links ]

LORENTZ, L.H.; LÚCIO, AD.; BOLIGON, A.A.; LOPES, S.J.; STORCK, L. Variabilidade da produção de frutos de pimentão em estufa plástica. Ciência Rural, v.35, p.316-323, 2005.         [ Links ]

LÚCIO, A.D.; CARPES, R.H.; STORCK, L.; LOPES, S.J.; LORENTZ, L.H.; PALUDO, A.L. Variância e média da massa de frutos de abobrinha-italiana em múltiplas colheitas. Horticultura Brasileira, v.26, p.333-339, 2008.         [ Links ]

SONNENBERG, P.E. Olericultura especial - II. 3.ed. Goiânia: Líder, 1985. 149p.         [ Links ]

SOUZA, M.F.; LÚCIO, A.D.; STORCK, L.; CARPES, R.H.; SANTOS, P.M.; SIQUEIRA, L.F.F. Tamanho da amostra para massa da massa de frutos, na cultura da abóbora italiana em estufa plástica. Revista Brasileira de Agrociência, v.8, p.123-128, 2002.         [ Links ]

STEEL, R.G.D.; TORRIE, J.H.; DICKEY, D.A. Principles and procedures of statistics: a biometrical approach. New York: McGraw-Hill, 1997. 666p.         [ Links ]

STORCK, L.; LOPES, S.J., ESTEFANEL, V.; GARCIA, D.C. Experimentação vegetal. 1.ed. Santa Maria: UFSM, 2000. 198p.         [ Links ]

TREVISAN, J.N.;MARTINS, G.A.K.; LÚCIO, A.D.; CASTAMAN, C.; MARION, R.R.; TREVISAN, B.G. Rendimento de cultivares de brócolis semeadas em outubro na região centro do Rio Grande do Sul. Ciência Rural, v.33, p.233-239, 2003.         [ Links ]

YAMAMURA, K. Transformation using (x + 0.5) to stabilize the variance of populations. Journal of Researches on Population Ecology, v.42, p.229-234, 1999.         [ Links ]

 

 

Recebido para publicação em 9 de outubro de 2008 e aceito em 13 de abril de 2010.

 

 

* Autor correspondente.

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License