Acessibilidade / Reportar erro

ANÁLISE DE REGRESSÃO EM EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS COM DADOS NÃO-BALANCEADOS: UMA SOLUÇÃO NA LINGUAGEM GLIM

Resumos

São estabelecidas as matrizes necessárias para a realização da análise de variância de experimentos em parcelas subdivididas, com dados não-balanceados e balanceados, quando os tratamentos aplicados às parcelas e os tratamentos aplicados às subparcelas são ambos fatores quantitativos, usando a teoria de modelos lineares e de modelos lineares generalizados. Foi desenvolvido um programa computacional, na linguagem GLIM, para a realização da análise.

experimentos não-balanceados; parcelas subdivididas; regressão; Glim


The necessary matrices are formed to perform the analysis of variance of split-plot designs with unbalanced data, when the treatments applied to plots and treatments applied to subplots are both quantitative factors, using the linear model theory and the generalised linear model theory. A program using GLIM was developed to perform the analysis.

unbalanced experiments; split-plot designs; regression; Glim


ANÁLISE DE REGRESSÃO EM EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS COM DADOS NÃO-BALANCEADOS:

UMA SOLUÇÃO NA LINGUAGEM GLIM

S.Z. de PINHO; M.M. MISCHAN

Depto. de Bioestatística-IB/UNESP, CEP: 18618-000 - Botucatu, SP.

RESUMO: São estabelecidas as matrizes necessárias para a realização da análise de variância de experimentos em parcelas subdivididas, com dados não-balanceados e balanceados, quando os tratamentos aplicados às parcelas e os tratamentos aplicados às subparcelas são ambos fatores quantitativos, usando a teoria de modelos lineares e de modelos lineares generalizados. Foi desenvolvido um programa computacional, na linguagem GLIM, para a realização da análise.

Descritores: experimentos não-balanceados, parcelas subdivididas, regressão, Glim

REGRESSION ANALYSIS OF SPLIT-PLOT EXPERIMENTS WITH UNBALANCED DATA: A SOLUTION USING A PROGRAM IN GLIM

ABSTRACT: The necessary matrices are formed to perform the analysis of variance of split-plot designs with unbalanced data, when the treatments applied to plots and treatments applied to subplots are both quantitative factors, using the linear model theory and the generalised linear model theory. A program using GLIM was developed to perform the analysis.

Keywords: unbalanced experiments, split-plot designs, regression, Glim

INTRODUÇÃO

Experimentos em parcelas subdivididas são frequentemente utilizados na agronomia, biologia, zootecnia, etc. É frequente, também, a utilização de tratamentos quantitativos tais como doses de nutrientes, doses de inseticidas, épocas de aplicação de tratamentos ou de coleta de material. Não é raro a perda de observações, dificultando a análise.

Quando os tratamentos são níveis de um fator quantitativo é possível desdobrar os graus de liberdade de tratamentos em efeitos de regressão.

Para a realização da análise de variância de experimentos em parcelas subdivididas, com dados não-balanceados, com tratamentos qualitativos, ver Pinho (1989 e 1990). Pinho (1990) e Pinho & Mischan (1996) apresentam um método para a realização da análise de variância quando os tratamentos aplicados às parcelas são quantitativos, desdobrando os graus de liberdade de tratamentos nos efeitos de regressão. Quando os tratamentos aplicados às subparcelas são níveis de um fator quantitativo ver metodologia descrita em Pinho & Mischan (1994).

Neste trabalho, será apresentado um procedimento e um programa utilizando o pacote de modelagem estatística interativa GLIM - Generalized Linear Interactive Modelling, para obtenção da análise de variância de experimentos em parcelas subdivididas, balanceados ou não - balanceados, quando os tratamentos aplicados às parcelas e os tratamentos aplicados às subparcelas são ambos fatores quantitativos.

Para ilustração do procedimento, consideram-se parte dos dados de peso médio do total de bulbinhos de um cultivar de cebolinha de bulbo (Allium sp.), relacionados em Kimoto (1976) e apresentados na TABELA 1. O delineamento utilizado foi em blocos casualizados, com 3 diferentes espaçamentos entre linhas (20 cm, 30 cm e 40 cm) colocados nas parcelas e 3 diferentes espaçamentos entre plantas (5 cm, 10 cm e 15 cm) nas subparcelas.

MODELO

Quando ambos os tratamentos, aplicados às parcelas (Tratamentos A - fator a) e subparcelas (Tratamentos B - fator g), são quantitativos, considera-se o modelo

(1)

onde yijk representa a j-ésima observação no i-ésimo nível do fator a e k-ésimo nível do fator g. Neste modelo m é o efeito médio comum, rj é o efeito devido ao j-ésimo bloco, (ar)ij é o efeito devido à ij-ésima observação (Resíduo a) e (ag)ik é o efeito da interação devido ao i-ésimo nível do fator a e k-ésimo nível do fator g; t1 é o efeito linear, t2 o efeito quadrático e assim por diante, para os tratamentos aplicados às parcelas, sendo possível, então, determinar os componentes de regressão linear, quadrático, cúbico, etc, até o (a-1)-ésimo grau. Para os tratamentos aplicados às subparcelas, u1 é o efeito linear, u2 o efeito quadrático e assim por diante, sendo então possível determinar os componentes de regressão linear, quadrático, cúbico, etc, até o (b-1)-ésimo grau. O parâmetro eijk representa o erro aleatório (Resíduo b). Neste modelo, tanto os (ar)ij como os eijk são considerados independentes e normalmente distribuídos com média zero e variância s2(ar) e s2(e), respectivamente.

Este modelo pode ser escrito na forma geral

(2)

onde y é o vetor das observações, X a matriz de delineamento considerando as regressões nos níveis dos dois tipos de tratamentos, aplicados às parcelas e às subparcelas, b o vetor de parâmetros correspondente e e o vetor de erros.

Para o modelo (1) o vetor de parâmetros é escrito

As matrizes X'X e X'y necessárias para a solução do sistema de equações normais são específicas para o modelo e podem ser escritas, genericamente, como a seguir, onde a notação matricial utilizada em Searle (1971) para matrizes formadas por conjuntos, os quais são representados entre colchetes.

onde p = a + r + ar + b + ab - 1

e para i = 1,...,a, j = 1,...r e k = 1,...b, l = linha e c = coluna,

ANÁLISE DE VARIÂNCIA

A análise de variância é uma combinação

D6=diag {ni.k}

c=1,...,(b-1)

das análises apresentadas em Pinho & Mischan (1996) e Pinho & Mischan (1994). O sistema é resolvido da maneira usual obtendo-se b0 e

Eliminado-se os parâmetros do modelo, da direita para a esquerda, e determinado-se R(.) toda vez que se retira um parâmetro, obtém-se a análise de variância apresentada na TABELA 2.

Os modelos lineares podem ser utilizados em experimentos em parcelas subdivididas, com mais do que uma linha de erro, uma vez que cada linha pode ser considerada como a diferença entre dois modelos lineares de efeitos fixos, Jarret (1978).

As somas de quadrados para cada causa de variação, como estabelecido na TABELA 2, podem ser obtidas pela diferença de dois desvios.

A análise de variância referente aos dados da TABELA 1 está apresentada na TABELA 3.

estimativa d.p. parâmetro 1 3,608 0,3218 A(1).B(1) 2 5,153 0,3716 A(1).B(2) 3 5,327 0,3218 A(1).B(3) 4 4,872 0,3218 A(2).B(1) 5 6,000 0,3218 A(2).B(2) 6 6,932 0,3218 A(2).B(3) 7 5,355 0,3218 A(3).B(1) 8 6,950 0,3218 A(3).B(2) 9 8,165 0,3218 A(3).B(3)

As estimativas são médias

As estimativas são médias

estimativa

d.p.

parâmetro 1 4,612 0,3191 B(1) 2 6,115 0,3333 B(2) 3 6,808 0,3191 B(3)

As estimativas são médias

estimativa

d.p.

parâmetro 1 4,655 0,3459 A(1) 2 5,935 0,3312 A(2) 3 6,823 0,3312 A(3)

PROGRAMA

O programa em GLIM, Baker et al. (1986), a seguir, realiza a análise de variância considerando regressão nos níveis do fator a e nos níveis do fator g. Os dados utilizados são os mesmos da TABELA 1.

$C Analise de regressao para experimentos em parcelas subdivididas

$C Fator quantitativo na parcela e na subparcela

$UNITS 36 $DATA Y $READ

! Dados da TABELA 1

!

! Espaçamento entre plantas

! I II 2.69 3.94 3.80 4.00 4.86 5.04 0.00 5.56 4.75 5.59 4.27 4.88 6.14 6.65 5.22 5.99 4.89 6.36 4.79 5.38 7.59 7.33 6.23 6.65 III 3.67 5.52 5.99 6.13 7.03 7.10 7.31 6.29 7.78 8.28 8.14 8.46

!

! Fator A = Espacamento entre linhas (X)

! Fator B = Espacamento entre plantas (Z)

$DATA X $READ 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 ! $DATA Z $READ 1 1 1 1 2 2 2 2 3 3 3 3 1 1 1 1 2 2 2 2 3 3 3 3 1 1 1 1 2 2 2 2 3 3 3 3

$CAL %B = 3 $ ! Numero de tratamentos B

$CAL A = %GL(3,12) :R = %GL(4,1) :B = %GL(3,4) $

$FACTOR A 3 R 4 B 3 $

$CAL W = (Y>0)

$WEIGHT W

$CAL X2=X*X

$CAL Z2=Z*Z

!

$MACRO SPLIT

$LOOK A R B X X2 Z Z2 Y $

$YVAR %1

$PRINT ;;; ` Analise de Variancia';;

` Causa de G.L. S.Q. Q.M. F';

` Variacao `;

$CAL %Z1 = %COC :%Z2 = %COL :%Z3 = %COH

$OUTPUT $TRANS $ ! Desliga

$FIT %2+%3+%2.%3+%4+%2.%4 $CAL %Q = %DV/%DF

$C %Q e o quadrado medio do erro b

$FIT $CAL %A = %DV :%C = %DF

$FIT %2+%3 $CAL %S = %DV :%D = %DF

$FIT +%2.%3 $CAL %S = %S-%DV :%D = %D-%DF :%R = %S/%D

:%P = %R !%P e o quadrado medio do erro a

$FIT $CAL %S = %DV :%D = %DF

$FIT +%3 $ ! Blocos

$USE LIN1 TXBLOCK

$FIT %3 $CAL %S = %DV :%D = %DF

!

$OUTPUT %Z1 %Z2 %Z3 $TRANS I W F H O

$PRINT `Regressao em A `

$OUTPUT $TRANS

$FIT +%5 $ ! Regressao Linear

$USE LIN1 REGL

$FIT +%6 $ ! Regressao Quadratica

$USE LIN1 REGQ

!

$FIT +%2.%3 ! Erro a

$USE LIN2 ERA

$OUTPUT %Z1 %Z2 %Z3 $TRANS I W F H O

$PRINT `Regressao em B `

$OUTPUT $TRANS

$FIT +%7 $CAL %R = %Q ! Tratamento B - Regressao Linear

$USE LIN1 REGL

$FIT +%8 $ ! Regressao Quadratica

$USE LIN1 REGQ

$FIT +%2.%4 ! Interacao A.B

$USE LIN1 TXINTER

$CAL %DV = 0 :%DF = 0

$USE LIN2 ERB

$OUTPUT %Z1 %Z2 %Z3 $TRANS I W F H O

$PRINT `Total `*INTEGER %C,4 *REAL %A,15,4

$OUTPUT $TRAN

$FIT %2.%4 - 1 ! Para A.B

$USE RESUL

$FIT %4-1 ! Para B

$USE RESUL

$FIT %2 - 1 ! Para A

$USE RESUL

$END

!

$MACRO LIN1

$CAL %S = %S - %DV :%D = %D - %DF :%M = %S/%D :%T = %M/%R

$OUTPUT %Z1 %Z2 %Z3 $TRANS I W F H O

$PRINT %1

*INTEGER %D,4 *REAL %S,15,4 *REAL %M,15,4 *REAL %T,15,4 $

$OUTPUT $TRANS $CAL %S = %DV :%D = %DF $ENDMAC

!

$MACRO LIN2

$CAL %S = %S - %DV :%D = %D - %DF :%M = %S/%D

$OUTPUT %Z1 %Z2 %Z3 $TRANS I W F H O

$PRINT %1

*INTEGER %D,4 *REAL %S,15,4 *REAL %M,15,4

$OUTPUT $TRANS $CAL %S = %DV :%D = %DF $ENDMAC

!

$MACRO TXBLOCK Blocos $END

$MACRO REGL Linear $END

$MACRO REGQ Quadratica $END

$MACRO ERA Residuo a $END

$MACRO TXINTER Interacao A.B $END

$MACRO ERB Residuo b $END

!

$MACRO RESUL

$OUTPUT %Z1 %Z2 %Z3 $TRANS I W F H O

$PRINT ;'As estimativas sao medias';

$DIS E

$OUTPUT $TRANS $ENDMAC

!

$C Chamando a macro

$USE SPLIT Y A R B X X2 Z Z2 $

Recebido para publicação em 04.10.95

Aceito para publicação em 11.01.96

  • ANDERSON, R.L. Missing-plot techniques. Biometrics v.2, n.3, p.41-47, 1946.
  • BAKER, R., CLARKE, M.R.B., FRANCIS, B., GREEN, M., NELDER, J.A., PAYNE, C.D., REESE, R.A., SWAN, A.V., WEBB, J. The GLIM system release 3.77 manual, Oxford: Numerical Algorithms Group Ltd., 1986.
  • JARRET, R.G. The analysis of designed experiments with missing observations. Applied Statistics, v.27, n.1, p.38-46, 1978.
  • KIMOTO, T. Caracterizaçăo de um novo cultivar de cebolinha de bulbo (Allium sp) e estudos de seu comportamento em funçăo de tipos de propagaçăo, épocas e espaçamentos de plantio e de sua qualidade para picles. Botucatu, 1976. 113p. Tese (Livre-Docęncia) - Faculdade de Cięncias Médicas e Biológicas de Botucatu, Universidade Estadual Paulista "Júlio de Mesquita Filho".
  • PINHO, S.Z. de. The split-plot design with missing observations. A solution using GLIM. GLIM Newsletter, n.19, p.39-44, 1989.
  • PINHO, S.Z. de. Análise de experimentos em blocos casualizados, com parcelas subdivididas, com dados năo-balanceados, considerando os efeitos de regressăo. Botucatu, 1990. 96p. Tese (Livre-Docęncia) - Instituto de Biocięncias, Universidade Estadual Paulista "Júlio de Mesquita Filho".
  • PINHO, S.Z. de; MISCHAN, M.M. Análise de regressăo em experimentos em parcelas subdivididas com dados năo-balanceados com fator quantitativo nas parcelas. Enviado para publicaçăo, 1996.
  • PINHO, S.Z. de; MISCHAN, M.M. Regression analysis for split-plot design. Subplot with quantitative factor. Enviado para publicaçăo, 1994.
  • SEARLE, S.R. Linear models New York: John Wiley, 1971. 532p.

Datas de Publicação

  • Publicação nesta coleção
    26 Fev 1999
  • Data do Fascículo
    Jan 1996

Histórico

  • Aceito
    11 Jan 1996
  • Recebido
    04 Out 1995
Escola Superior de Agricultura "Luiz de Queiroz" USP/ESALQ - Scientia Agricola, Av. Pádua Dias, 11, 13418-900 Piracicaba SP Brazil, Phone: +55 19 3429-4401 / 3429-4486 - Piracicaba - SP - Brazil
E-mail: scientia@usp.br