Acessibilidade / Reportar erro

Transformação box-cox em experimentos com pimentão em ambiente protegido

Box-cox transformation in experiments with green pepper in protected environments

Resumos

Em olericultura, o interesse é a produção de frutos comercializáveis. Em experimentos nessa área agronômica comumente são avaliadas variáveis tais como a fitomassa e o número de frutos. No entanto, essas variáveis apresentam uma característica particular que está relacionada com sua ausência no momento da colheita. Este atributo é representado por valores zero, gerando certa variabilidade e afetando a análise de variância dos dados. Assim, teve-se por objetivo definir uma transformação adequada para as variáveis observadas em colheitas por planta de experimentos com a cultura do pimentão, realizados em ambiente protegido, visando estabilizar a variabilidade gerada pela presença de valores zero nas múltiplas colheitas dos frutos. Os experimentos foram realizados nas estações sazonais verão/outono e inverno/primavera, utilizando a família de transformações de Box-Cox, com uma adaptação apresentada em Yamamura (1999). Apesar da redução na variabilidade e a normalidade dos resíduos, observadas em todos os experimentos, o uso do método não foi eficiente para tornar as variâncias homocedásticas. Concluiu-se que para dados de colheitas por planta de experimentos com pimentão, avaliando a fitomassa e o número de frutos, a transformação indicada é a inversa da raiz quarta.

Capsicum annuum; transformação de dados; análise de variância; coeficiente de variação; variâncias heterocedásticas


The major purpose of vegetable crops production systems is the profitable and economically viable yield of marketable products. Numerous field experiments with vegetable crops are carried out to determine biomass production of marketable and non-marketable variables. However, these variables possess the particular characteristic related to their presence or absence at harvest time. Absent variables, represented by zero values, generate variability and affect variance analyses. This research deals with the search of applicable transformations for variables studied in green pepper field experiments carried out in protected environments attempting to stabilize the variability resulting from the presence of zero values in multiple harvests. The analysis was based on experiments with the green pepper crop carried out in summer-fall or winter-spring season, using an adaptation of the Box-Cox transformation family found in Yamamura (1999). Despite the reduction in variability and normal errors, observed in all experiments, the use of the method was not efficient to make the variances homocedastic. For experiments with green pepper, assessing the phytomass and number of fruits, the inverse fourth root transformation is indicated.

Capsicum annuum; data transformation; analysis of variance; coefficient of variation; heterocedastic variances


PESQUISA RESEARCH

Alessandro Dal'Col LúcioI; Mara Rubia Machado CoutoII; Sidinei José LopesI; Lindolfo StorckI

IUFSM-CCR, Depto. Fitotecnia, 97105-900 Santa Maria-RS

IIUFSM-CCR, Depto. Estatística; adlucio@smail.ufsm.br (autor correspondente); sjlopes@smail.ufsm.br; lindolfo@smail.ufsm.br; mararubiacouto@hotmail.com

RESUMO

Em olericultura, o interesse é a produção de frutos comercializáveis. Em experimentos nessa área agronômica comumente são avaliadas variáveis tais como a fitomassa e o número de frutos. No entanto, essas variáveis apresentam uma característica particular que está relacionada com sua ausência no momento da colheita. Este atributo é representado por valores zero, gerando certa variabilidade e afetando a análise de variância dos dados. Assim, teve-se por objetivo definir uma transformação adequada para as variáveis observadas em colheitas por planta de experimentos com a cultura do pimentão, realizados em ambiente protegido, visando estabilizar a variabilidade gerada pela presença de valores zero nas múltiplas colheitas dos frutos. Os experimentos foram realizados nas estações sazonais verão/outono e inverno/primavera, utilizando a família de transformações de Box-Cox, com uma adaptação apresentada em Yamamura (1999). Apesar da redução na variabilidade e a normalidade dos resíduos, observadas em todos os experimentos, o uso do método não foi eficiente para tornar as variâncias homocedásticas. Concluiu-se que para dados de colheitas por planta de experimentos com pimentão, avaliando a fitomassa e o número de frutos, a transformação indicada é a inversa da raiz quarta.

Palavras-chave:Capsicum annuum, transformação de dados, análise de variância, coeficiente de variação, variâncias heterocedásticas.

ABSTRACT

The major purpose of vegetable crops production systems is the profitable and economically viable yield of marketable products. Numerous field experiments with vegetable crops are carried out to determine biomass production of marketable and non-marketable variables. However, these variables possess the particular characteristic related to their presence or absence at harvest time. Absent variables, represented by zero values, generate variability and affect variance analyses. This research deals with the search of applicable transformations for variables studied in green pepper field experiments carried out in protected environments attempting to stabilize the variability resulting from the presence of zero values in multiple harvests. The analysis was based on experiments with the green pepper crop carried out in summer-fall or winter-spring season, using an adaptation of the Box-Cox transformation family found in Yamamura (1999). Despite the reduction in variability and normal errors, observed in all experiments, the use of the method was not efficient to make the variances homocedastic. For experiments with green pepper, assessing the phytomass and number of fruits, the inverse fourth root transformation is indicated.

Keywords:Capsicum annuum, data transformation, analysis of variance, coefficient of variation, heterocedastic variances.

O pimentão (Capsicum annuum) é uma das culturas mais indicadas para ser utilizada em ambiente protegido, situando-se entre as cinco culturas de maior área cultivada no Brasil e em outros países do mundo. Essa cultura é muito utilizada em ambiente protegido, em função da grande produtividade que pode ser alcançada nestas condições, podendo chegar a 150 t/ha, aproximadamente duas vezes o que é obtido normalmente em cultivo em campo, confirmando resultados apresentados por Andriolo et al. (1991), Cunha et al. (2002) e Cunha & Escobedo (2003).

Em cultivos olerícolas sob ambiente protegido, a maioria dos tratos culturais é realizada de forma individualizada (por planta) e o mais uniforme possível. Porém, alguns autores relatam a existência de variabilidade da produção de frutos entre as linhas de cultivo, o que pode prejudicar a condução de experimentos de pesquisa nessas condições. Souza et al. (2002) e Mello et al. (2004) relataram grande variabilidade para crescimento dos frutos de abobrinha italiana no decorrer do ciclo produtivo. Da mesma forma, Lúcio et al. (2003) observaram que em 100% das colheitas de pimentão havia heterogeneidade das variâncias entre as plantas. Já Lorentz et al. (2005), trabalhando com pepineiro, verificaram que 46% das colheitas mostraram-se com variâncias heterogêneas entre plantas, observando também grandes oscilações das médias da produção por colheita. Também, Lopes et al. (1998) relataram mudanças na concentração da produção de tomate no decorrer das colheitas e constataram diferenças de produção entre as linhas de cultivo.

A variabilidade da produção entre plantas sob cultivo protegido pode acarretar em heterogeneidade de variâncias que, para realização da ANOVA, deverão ser rejeitadas e, assim, assegurar o nível de significância dos testes F e os de comparação múltipla de médias. Em análises de dados experimentais com variâncias heterogêneas, o nível de significância passa a ficar acima do especificado (Conagin et al., 1993). Assim, se faz necessário o estudo da resposta da média e da variância da produção em ambiente protegido, ao longo de diferentes colheitas, bem como a interferência direta dos diferentes manejos culturais nessas estatísticas, pois são fatores que podem alterar as conclusões de trabalhos científicos. No entanto, a ocorrência de valores zero em experimentos com culturas olerícolas com múltiplas colheitas é frequente, pois nem sempre existem frutos a serem colhidos ou, nem sempre, estes possuem tamanho adequado para sua colheita e comercialização (Souza et al., 2002; Mello et al. 2004; Lorentz et al., 2005; Carpes et al., 2008; Lúcio et al., 2008). Nestes casos, o uso de transformações de variáveis se faz necessário, para que se possa atingir a homocedasticidade na análise de variância. Mesmo assim, a eficácia das transformações fica prejudicada, especialmente aquelas que empregam a função logarítmica, inclusive a família de transformações Box-Cox (Box & Cox, 1964). Estudos que descrevem a variabilidade de populações utilizam frequentemente a transformação logarítmica para alcançar a homocedasticidade ou a estabilidade da variância para testar os efeitos na ANOVA.

Ao se dispor de um conjunto de dados com valores iguais a zero é comum o acréscimo de uma constante (c) a cada um dos dados (Banzatto & Kronka, 1989; Storck et al., 2000). A determinação do valor constante c que deve ser adicionado à variável original (Y) tem sido bastante discutida na literatura mas, usualmente, o valor da constante que é somado a todos os dados é igual à unidade. Conforme Yamamura (1999), não há base concreta quanto às razões pelas quais a unidade é adicionada ao invés de outra constante, tais como 0,5 ou dois. Outros princípios alternativos foram propostos por Hill (1963), Griffiths (1980) e Berry (1987) para determinar o parâmetro c. Os procedimentos propostos por esses autores são aplicáveis em um determinado conjunto de pressupostos, os quais requerem cálculos complexos. Devido a este fato, um princípio prático foi proposto por Yamamura (1999) sugerindo como escolha razoável para o parâmetro c o valor 0,5, se a forma da distribuição não for conhecida. O autor defende o uso de c igual a 0,5 pelo motivo que, se uma distribuição discreta definida em 0, 1, 2, ..., pode ser aproximadamente descrita por uma distribuição contínua definida em 0, ∞ quando usa-se c= 0,5. Trabalhando com abobrinha italiana, Couto et al. (2009) adotaram esse procedimento obtendo como transformação adequada a raiz quarta tanto para o número quanto para a fitomassa dos frutos colhidos, apresentada como uma alternativa para estabilizar a variância ou, pelo menos, reduzir a variabilidade existente.

Este trabalho teve por objetivo definir uma transformação adequada para as variáveis observadas em experimentos com a cultura do pimentão, realizados em ambiente protegido, visando estabilizar a variabilidade gerada pela ausência de valores nas múltiplas colheitas dos frutos por planta.

MATERIAL E MÉTODOS

Foram realizados dois experimentos com pimentão, cultivar Vidi, nas épocas de cultivo verão/outono (época 1) e inverno/primavera (época 2), em área experimental do Departamento de Fitotecnia da Universidade Federal de Santa Maria (29°43'S, 53°43'W, altitude 95 m), tendo clima classificado como Cfa (subtropical úmido sem estação seca definida e com verões quentes) e solo classificado como Argissolo Vermelho Distrófico Arênico. Em cada época, o cultivo foi realizado em estufa plástica com dimensões de 24 m de comprimento por 10 m de largura, com 3,5 m de altura na parte central, utilizando irrigação por gotejamento, camalhões com mulching preto de PEDB de 35 micras de espessura com 0,1 m de altura e 0,4 m de largura, dez linhas de cultivo, 70 plantas cada, sendo o espaçamento de 0,6 m entre as filas e 0,3 m entre as plantas. As aplicações de fungicidas, inseticidas e as desfolhas das plantas foram realizadas sempre que necessário nas duas épocas, conforme recomendação da cultura (Filgueira, 2000).

As plantas foram identificadas com o número de ordem da linha e da planta dentro de cada linha. A definição do momento da colheita baseou-se no tamanho dos frutos, onde estes foram diariamente verificados e colhidos quando apresentaram a coloração de verde para verde azulado. Os frutos colhidos foram colocados em sacos de papel e identificados, para posterior determinação, em cada colheita, do número de frutos colhidos por planta e da fitomassa fresca, empregando-se balança digital com precisão de um grama.

Utilizou-se a metodologia Box-Cox (Box & Cox, 1964) para o conjunto de funções potências, a fim de encontrar a transformação para estabilizar ou reduzir a variabilidade existente e normalizar os resíduos. Como para valores nulos, a família de transformações de Box-Cox fica restrita, utilizou-se a variável somada a uma constante. Adotou-se o procedimento proposto por Yamamura (1999), com o parâmetro c= 0,5, gerando assim as expressões:

que é a família de transformações Box-Cox, acrescida do parâmetro c= 0,5.

Para a escolha da melhor potência λ, foram considerados valores no intervalo [-2, 2], conforme descrevem Draper & Smith (1981), sendo substituídos nas expressões:

em a quantidade (constante) é um estimador da média geométrica de Yi ou seja, do conjunto de dados e o jacobiano J(l,z)=1, gerando valores transformados (Z(λ)) para cada variável.

Foi realizada a análise de variância para cada variável transformada e para cada valor de λ, adotando o delineamento em blocos ao acaso em faixas, com o modelo matemático descrito por: Yijk = m + bj + Ai + eaij + Dk + edjk + ADik + eijk, onde Yijk = valor da variável observada, bj= efeito aleatório do bloco j (linhas de cultivo), Ai= efeito fixo do fator A (posição da planta na linha de cultivo) em faixas horizontais, eaij= efeito aleatório da interação entre o bloco j e o fator A em faixas (erro A), Dk= efeito fixo do fator D (colheitas realizadas) em faixas verticais, edjk= efeito aleatório da interação entre o bloco j e o fator D em faixas (erro D), ADik= interação entre os i níveis do fator A e os k níveis do fator D e eijk= erro experimental. Os tratamentos foram simulados com a combinação das 70 plantas em cada linha de cultivo com as 10 colheitas realizadas. Para determinar o estimador de máxima verossimilhança (Lmax), substituiu-se a soma de quadrados residual (SSE(λ)), encontrada para cada valor de λ usado, na expressão:

sendo que o melhor λ foi escolhido de maneira que maximizasse Lmax.

Foram obtidas as medidas descritivas e a análise de variância para as variáveis, antes e após o uso de transformação, aplicando o teste de Bartlett para verificar se a transformação foi eficiente para satisfazer a homocedasticidade das variâncias residuais, após eliminação do efeito de bloco e, finalmente, foi realizada a análise dos resíduos antes e após a transformação. Para a análise dos dados foi adotado 5% de probabilidade de erro.

RESULTADOS E DISCUSSÃO

A frequência de valores zero, obtidos nas colheitas para as variáveis número e fitomassa de frutos de pimentão, variou em torno de 40% no inverno/primavera (I/P) e 35% no verão/outono (V/O). Esse comportamento indica que a maior variabilidade para as variáveis estudadas foi obtida na estação de cultivo I/P, concordando com os resultados obtidos por Lúcio et al. (2003) e Lorentz et al. (2005). Essa heterogeneidade das variâncias no I/P deve-se, principalmente, à grande variabilidade existente entre o crescimento das plantas e dos frutos, causada pelas maiores variações nas condições ambientais no ambiente protegido, tais como temperatura do ar, radiação solar global, nebulosidade e umidade relativa do ar, que afetam o crescimento dos frutos e a definição do ponto de colheita dos mesmos. Na cultura do pimentão, os frutos surgem em dias diferentes de uma planta para outra, de acordo com a formação das novas brotações que despontam no decorrer do desenvolvimento das plantas, provocando um crescimento desuniforme entre os frutos (Lorentz et al., 2005). Assim, a heterogeneidade das variâncias é devida, principalmente, ao amadurecimento precoce ou tardio de alguns frutos, causados por alterações nas condições fisiológicas ou condições ambientais adversas, mais proeminentes na estação I/P.

O valor da potencia λ que minimizou a raiz do quadrado médio do erro (RQME) foi de -0,25 (Tabela 1), indicando que a melhor transformação para os dados é o inverso da raiz quarta Nesse caso, de acordo com Box & Cox (1964), a expressão:

para para λ=0 com Y>0 é equivalente a para para λ=0 quando a análise de variância é invariante com transformações lineares. A relação direta entre as variáveis fitomassa e o número de frutos colhidos pode ter sido um dos motivos para o qual se tem o mesmo valor λ para essas duas variáveis.

As medidas descritivas para o peso e o número de frutos sem e com o acréscimo da constante, antes e após a transformação, indicam que ao se aplicar a transformação na variável acrescida da constante houve uma redução no coeficiente de variação, de 78% e de 79% na variável número de frutos no I/P e V/O, respectivamente, e de 92% e 83% para fitomassa de frutos no I/P e V/O, em comparação à variável original mais 0,5, indicando uma redução da variabilidade dos dados (Tabela 2). Essa redução é interessante, pois a diminuição no desvio padrão foi muito mais evidente que o aumento na estimativa da média para o número de frutos, o que se espera de uma transformação de dados para homogeneizar variâncias.

Pelos resultados obtidos nas análises de variância para o número e a fitomassa fresca de frutos para as duas épocas de cultivo, houve também uma redução no quadrado médio do erro (QME) após o uso da transformação, da ordem de 25% e de 12% na estação V/O, respectivamente, para número e fitomassa fresca de frutos e de 98% na estação I/P para as duas variáveis estudadas (Tabela 2). Este resultado é importante, pois quanto maior o erro, menor a probabilidade de se encontrarem diferenças significativas entre médias de tratamentos. Portanto, a transformação inversa da raiz quarta para o número e o peso de frutos de pimentão permitiu uma redução na variabilidade, principalmente na estação que apresentou maior frequência de valores zero para as variáveis em estudo. Esse resultado também foi obtido por Couto et al. (2009) estudando a cultura da abobrinha italiana, com a transformação raiz quarta, evidenciando a eficácia da metodologia de transformação de dados na homogeneidades das variâncias.

A transformação inversa da raiz quarta não foi eficiente para adequar os dados à pressuposição da homogeneidade das variâncias, pois pelo teste de Bartlett rejeitou-se a hipótese de homocedasticidade para o número e a fitomassa de frutos nas duas estações de cultivo, apesar da redução no valor do χ2 calculado para as duas variáveis avaliadas. Sabe-se que muitas circunstâncias podem interferir na violação da pressuposição de homogeneidade de variância. Nesse trabalho, as variáveis avaliadas apresentaram melhoras significativas ao atendimento à normalidade dos erros com os dados transformados para ambas as variáveis (Figura 1). Mesmo rejeitando-se a hipótese de homocedasticidade destes, o nível de probabilidade apresentado no teste, após a transformação foi de p= 0,0615, muito próximo do adotado no estudo (p<0,05). A transformação inversa da raiz quarta também proporcionou a menor relação entre RQME e Lmax, indicando a melhor condição possível para transformação dos dados e homogeneidade dos erros. Mesmo não sendo confirmada a homogeneidade das variâncias, a transformação inversa da raiz quarta é uma possibilidade que permite estabilizar a variância ou, pelo menos reduzi-la, auxiliando nas análises estatísticas e interpretações dos resultados deste tipo de experimento com múltiplas colheitas, sem comprometer a precisão experimental.


Para o número e a fitomassa fresca de frutos, avaliados em colheitas por planta, em experimentos com a cultura do pimentão em ambiente protegido, a transformação indicada é a inversa da raiz quarta.

AGRADECIMENTOS

À FAPERGS, ao CNPq e ao Programa Especial de Incentivo às Publicações Internacionais/PRPGP/UFSM pelo auxílio financeiro para a realização do trabalho e pela concessão de bolsas de produtividade em pesquisa aos autores Alessandro Dal'Col Lúcio, Sidinei José Lopes e Lindolfo Storck.

(Recebido para publicação em 17 de agosto de 2009; aceito em 11 de janeiro de 2011)

(Received on August 17, 2009; accepted on January 11, 2011)

  • ANDRIOLO JL; BURIOL GA; STRECK NA; FIORIN J. 1991. Influência da proteção ambiental com estufa de polietileno transparente sobre o crescimento e desenvolvimento do pimentão. Horticultura Brasileira 21: 191-204.
  • BANZATTO DA; KRONKA SN. 1989. Experimentação agrícola. 1ed. Jaboticabal: FUNEP, 247p.
  • BERRY DA. 1987. Logarithmic transformations in ANOVA. Biometrics 43: 439-456.
  • BOX GEP; COX DR. 1964. An analysis of transformations. Journal of the Royal Society, 26: 211-252.
  • CARPES RH; LÚCIO AD; STORCK L; LOPES SJ; ZANARDO B; PALUDO AL. 2008. Ausência de frutos colhidos e suas interferências nas estimativas da fitomassa de frutos de abobrinha italiana cultivada em diferentes sistemas de irrigação. Revista Ceres 55: 590-595.
  • CONAGIN A; NAGAI V; IGUE T. 1993. Efeito da falta de normalidade em testes de homogeneidade das variâncias. Bragantia 57: 203-214.
  • COUTO MRM; LÚCIO AD; LOPES SJ; CARPES RH. 2009. Transformação de dados em experimentos com abobrinha italiana em ambiente protegido. Ciência Rural 39: 1701-1707.
  • CUNHA AR; ESCOBEDO JF. 2003. Alterações micrometeorológicas causadas pela estufa plástica e seus efeitos no crescimento e produção da cultura do pimentão. Revista Brasileira de Agrometeorologia 11: 15-26.
  • CUNHA AR; ESCOBEDO JF; KLOSOWSKI ES. 2002. Estimativa do fluxo de calor latente pelo balanço de energia em cultivo protegido de pimentão. Pesquisa Agropecuária Brasileira 37: 735-743.
  • DRAPER NR; SMITH H. 1981. Applied regression analysis New York: John Wiley, 709p.
  • FILGUEIRA FAR. 2000. Novo manual de Olericultura: tecnologia moderna na produção e comercialização de hortaliças Viçosa: UFV, 402p.
  • GRIFFITHS DA. 1980. Interval estimation for the three-parameter lognormal distribution via the likelihood function. Applied Statistics 29: 58-68.
  • HILL BM. 1963. The three-parameter lognormal distribuition and Bayesian analysis of a point-source epidemic. Journal of the American Statistical Association 58: 72-84.
  • LOPES SJ; STORCK L; HELDWEIN AB; FEIJO S; ROS CA. 1998. Técnicas experimentais para tomateiro tipo salada sob estufas plásticas. Ciência Rural 28: 193-197.
  • LORENTZ LH; LÚCIO AD; BOLIGON AA; LOPES SJ; STORCK L. 2005. Variabilidade da produção de frutos de pimentão em estufa plástica. Ciência Rural 35: 316-323.
  • LÚCIO AD; SOUZA MF; HELDWEIN AB; LIEBERKNECHT D; CARPES RH; CAVALHO MP. 2003. Tamanho da amostra e método de amostragem para avaliação de características do pimentão em estufa plástica. Horticultura Brasileira 21: 181-185.
  • LÚCIO AD; CARPES RH; STORCK L; LOPES SJ; LORENTZ LH; PALUDO AL. 2008. Variância e média da massa de frutos de abobrinha-italiana em múltiplas colheitas. Horticultura Brasileira 26: 333-339.
  • MELLO RM; LÚCIO AD; STORCK L; LORENTZ LH; CARPES RH; BOLIGON AA. 2004. Size and form of plots for the culture of the italian pumpkin in plastic greenhouse. Scientia Agricola 61: 457-461.
  • SOUZA MF; LÚCIO AD; STORCK L; CARPES RH; SANTOS PM; SIQUEIRA LFF. 2002. Tamanho da amostra para peso da massa de frutos, na cultura da abóbora italiana em estufa plástica. Revista Brasileira de Agrociência 8: 123-128.
  • STORCK L; LOPES SJ; ESTEFANEL V; GARCIA DC. 2000. Experimentação vegetal 1ed. Santa Maria: UFSM. 198p.
  • YAMAMURA K. 1999. Transformation using (x+0.5) to stabilize the variance of populations. Journal Researches on Population Ecology 42: 229-234.
  • Transformação box-cox em experimentos com pimentão em ambiente protegido

    Box-cox transformation in experiments with green pepper in protected environments
  • Datas de Publicação

    • Publicação nesta coleção
      19 Abr 2011
    • Data do Fascículo
      Mar 2011

    Histórico

    • Recebido
      17 Ago 2009
    • Aceito
      11 Jan 2011
    Associação Brasileira de Horticultura Embrapa Hortaliças, C. Postal 218, 70275-970 Brasília-DF, Tel. (61) 3385 9099, Tel. (81) 3320 6064, www.abhorticultura.com.br - Vitoria da Conquista - BA - Brazil
    E-mail: associacaohorticultura@gmail.com