Acessibilidade / Reportar erro

Decomposição da interação tripla significativa utilizando o comando contrast do PROC GLM do SAS aplicado ao modelo de classificação tripla para dados balanceados

Triple interaction fractioning using PROC GLM contrast/SAS, applied to a three-way layout for balanced data

Resumos

Na análise de experimentos em classificação tripla com interação para dados balanceados, onde os fatores envolvidos podem ter níveis qualitativos ou quantitativos e a interação é significativa, é relevante a obtenção da decomposição dos graus de liberdade da interação e dos graus de liberdade dos efeitos envolvidos. No que se refere à interação tripla significativa a análise estatística tem, ainda, como objetivo testar o efeito de um dos fatores de tratamentos aninhados, em relação à combinação dos níveis dos outros fatores de tratamentos envolvidos. Através do PROC GLM do SAS é possível testar esse efeito utilizando o comando CONTRAST ou ESTIMATE. Assim, a proposta do presente trabalho é a obtenção das somas de quadrados de tais efeitos utilizando o comando CONTRAST do PROC GLM / SAS. Isso é possível através da construção da hipótese a ser testada e da aplicação do método dos contrastes ortogonais, visando a facilidade na checagem dos resultados obtidos. Para tal, são dados um exemplo numérico e o programa SAS.

experimentos em classificação tripla; interação; decomposição da interação


In a three-way analysis of variance, in which significant interaction among the involved factors is detected, it might be important to get the fractioning of the interaction degrees of freedom added to the degrees of freedom of the involved factors. In the case of a significant triple interaction, the effecet of one nested factor is usually checked against the combined effect of the remaining factors. The main aim of this research work has been to get the sum of squares of such effect through the CONTRAST command of PROC GLM, available in the SAS computer program. The feasibility of checking hypothesis and the application of orthogonal contrasts is evaluated through the checking of the obtained results. A numerical example is provided.

three-way layout; interaction; decomposition of interaction


DECOMPOSIÇÃO DA INTERAÇÃO TRIPLA SIGNIFICATIVA UTILIZANDO O COMANDO CONTRAST DO PROC GLM DO SAS APLICADO AO MODELO DE CLASSIFICAÇÃO TRIPLA PARA DADOS BALANCEADOS (1 (1 ) Recebido para a publicação em 24 de maio e aceito em 9 de dezembro de 1999. )

MARIA CRISTINA STOLF NOGUEIRA(2 (1 ) Recebido para a publicação em 24 de maio e aceito em 9 de dezembro de 1999. ); JOSÉ EDUARDO CORRENTE(2 (1 ) Recebido para a publicação em 24 de maio e aceito em 9 de dezembro de 1999. )

RESUMO

Na análise de experimentos em classificação tripla com interação para dados balanceados, onde os fatores envolvidos podem ter níveis qualitativos ou quantitativos e a interação é significativa, é relevante a obtenção da decomposição dos graus de liberdade da interação e dos graus de liberdade dos efeitos envolvidos. No que se refere à interação tripla significativa a análise estatística tem, ainda, como objetivo testar o efeito de um dos fatores de tratamentos aninhados, em relação à combinação dos níveis dos outros fatores de tratamentos envolvidos. Através do PROC GLM do SAS é possível testar esse efeito utilizando o comando CONTRAST ou ESTIMATE. Assim, a proposta do presente trabalho é a obtenção das somas de quadrados de tais efeitos utilizando o comando CONTRAST do PROC GLM / SAS. Isso é possível através da construção da hipótese a ser testada e da aplicação do método dos contrastes ortogonais, visando a facilidade na checagem dos resultados obtidos. Para tal, são dados um exemplo numérico e o programa SAS.

Palavras-chave: experimentos em classificação tripla, interação, decomposição da interação.

ABSTRACT

TRIPLE INTERACTION FRACTIONING USING PROC GLM CONTRAST/SAS, APPLIED TO A THREE-WAY LAYOUT FOR BALANCED DATA

In a three-way analysis of variance, in which significant interaction among the involved factors is detected, it might be important to get the fractioning of the interaction degrees of freedom added to the degrees of freedom of the involved factors. In the case of a significant triple interaction, the effecet of one nested factor is usually checked against the combined effect of the remaining factors. The main aim of this research work has been to get the sum of squares of such effect through the CONTRAST command of PROC GLM, available in the SAS computer program. The feasibility of checking hypothesis and the application of orthogonal contrasts is evaluated through the checking of the obtained results. A numerical example is provided.

Key words: three-way layout, interaction, decomposition of interaction.

1. INTRODUÇÃO

Os modelos de classificação tripla para dados balanceados têm-se mostrado de grande utilidade na experimentação agronômica. Segundo KUEHL (1994), as comparações entre tratamentos podem ser afetadas substancialmente pelas condições em que ocorrem, e, interpretações claras dos efeitos de um tratamento precisam ser levadas em conta para o efeito de outros tratamentos. Isso significa que a interação entre fatores pode estar presente em tais delineamentos e, sendo a interação significativa, é necessário fazer um estudo dessa interação através de sua decomposição em fatores aninhados. De acordo com HINKELMANN e KEMPTHORNE (1994), o procedimento de variar um fator, por vez, via de regra se aplica quando o objetivo é estabelecer uma lei fundamental, o que conduziria ao conhecimento detalhado do efeito de um fator, quando os outros são mantidos constantes. Nenhuma informação, no entanto, é obtida a respeito da dependência dos efeitos de um fator nos níveis para os quais os outros fatores são mantidos constantes, pelo fato de que os níveis de um fator apresentam comportamento diferenciado na presença do outro fator, e vice-versa. Segundo NOGUEIRA (1997), novamente de acordo com HINKELMANN e KEMPTHORNE (1994), outro procedimento experimental seria considerar todas as possíveis combinações de níveis simultaneamente. Isso permitiria obter informação acerca dos fatores principais e, especialmente, da interação entre os vários fatores. Tais idéias e suas aplicações práticas na experimentação agronômica, bem como na experimentação científica, de maneira geral foram introduzidas por FISHER (1935) e YATES (1937).

Assim, neste trabalho, o estudo da interação significativa é feito através da decomposição dos graus de liberdade da interação adicionados aos graus de liberdade do nível do fator aninhado.

Para a análise de dados segundo esse modelo, com interação significativa utilizando o software SAS, o resultado não é imediato, pois requer uma programação com a finalidade de se obter a referida decomposição. Isso, em geral, é feito no PROC GLM utilizando a opção BY e fixando o fator aninhado, conforme encontrado no manual do SAS/STAT (1990). O problema, nesse caso, consiste na inadequação do teste F da análise da variância, sendo necessário refazê-lo manualmente aplicando o denominador correto.

O objetivo deste trabalho é mostrar outra forma de utilização do PROC GLM do SAS, juntamente com o comando CONTRAST, na decomposição da interação, ou seja, tal decomposição será encarada como contrastes entre médias para os efeitos aninhados, sendo, dessa forma, o teste F aplicado adequadamente.

2. MATERIAL E MÉTODOS

O modelo matemático para um experimento de classificação tripla envolvendo os fatores A, B e C com interação, considerando todos os efeitos fixos em uma estrutura inteiramente ao acaso, é dado da seguinte maneira:

yijkl = m + ai + bj + dk + (ab)ij + (ad)ik + (bd)jk + + (abd)ijk + xijkl

para i = 1, , I; j = 1, , J; k = 1, , K e l = 1, , L.

onde

yijkl é o valor observado, referente ao nível i do fator A, combinado com o nível j do fator B e com o nível k do fator C, na repetição l;

m é o efeito de média geral;

ai é o efeito do nível i do fator A, definido como ai = mi.. - m, sendo mi.. a média do nível i do fator A;

bj é o efeito do nível j do fator B, definido como bj = m.j. - m, sendo m.j. a média do nível j do fator B;

dk é o efeito do nível k do fator C, definido como dk = m..k - m, sendo m..k a média do nível k do fator C;

(ab)ij é o efeito da interação de A com B, definido como (ab)ij = mij. - (m - ai - bj), sendo mij. a média do nível i do fator A, combinado com o nível j do fator B;

(ad)ik é o efeito da interação de A com C, definido como (ad)ik = mi.k - (m - ai - dk), sendo mi.k a média do nível i do fator A, combinado com o nível k do fator C;

(bd)jk é o efeito da interação de B com C, definido como (bd)jk = m.jk - (m - bj - dk), sendo m.jk a média do nível j do fator B, combinado com o nível k do fator C;

(abd)ijk é o efeito da interação de A, B e C, definido como

(abd)ijk = mijk - (m + ai + bj + dk + (ab)ij + (ad)ik + + (bd)jk)

sendo mijk a média do nível i do fator A, combinado com o nível j do fator B e com o nível k do fator C;

xijkl é o erro experimental associado a yijkl e ambos considerados independentes e identicamente distribuídos, com distribuição N(0, s2).

Outra forma de escrever o modelo adotado é:

yijkl = mijk + xijkl

com mijk = m + ai + bj + dk + (ab)ij + (ad)ik + bdjk + (abd)ijk, sendo a média da combinação do nível i do fator A com o nível j do fator B e com o nível k do fator C, para i = 1, ..., I; j = 1, ..., J e k = 1, ..., K.

Obtidos os dados e segundo o modelo matemático adotado, a principal hipótese formulada é a referente à interação A x B x C, seguida das hipóteses referentes às interações A x B, A x C e B x C, que são:

H01 = mijk - mijk' - mij'k - mi'jk + mij'k' + mi'jk' + mi'j'k - mi'j'k' = 0, para todo i ¹ i', j ¹ j' e k ¹ k';

H02 = mij. - mij.' - mi'j. + mi'j.' = 0, para todo i ¹ i', j ¹ j'

H03 = mi.k - mi.k' - mi'.k + mi'.k' = 0, para todo i ¹ i', k ¹ k',

H04 = m.jk - m.j'k - m.jk' + m.j'k' = 0, para todo j ¹ j', k ¹ k',

e testadas através da aplicação do teste F, da seguinte maneira:

sob H01.

Se a hipótese H01 for rejeitada, conclui-se que a interação A x B x C é significativa, e, que o fator A tem um efeito diferenciado na presença de cada combinação dos níveis dos fatores B com C, o mesmo ocorrendo para os efeitos dos fatores B e C. Nesse caso, a análise dos dados terá continuidade com a decomposição dos graus de liberdade das interações envolvidas, adicionados os graus de liberdade do fator aninhado. A decomposição é feita de acordo com o objetivo da pesquisa.

Supondo-se, por exemplo, que o interesse seja verificar o efeito do fator A, dada cada combinação dos níveis dos fatores B com C, isto é, estudar o efeito do fator A aninhado na combinação do nível j do fator B, com o nível k do fator C, o modelo matemático adotado agora passa a ser o seguinte:

yi(jk)l = m + bj + dk + (bd)jk + aI(jk) + xijkl

para i = 1, ..., I; j = 1, ..., J; k = 1, ..., K e l = 1, ..., L.

sendo ai(jk) o efeito do fator A, dado o nível j do fator B, combinado com o nível k do fator C, definido como ai(jk) = ai + abij + dk + (ab)ij + (ad)ik + (ad)ik = (m)i(jk) - m.jk, onde mi(jk) é a média do nível i do fator A, dado o nível j do fator B, combinado com o nível k do fator C o modelo matemático apresentado acima pode ser descrito ainda da seguinte maneira:

yi(kj)l = mi(jk) + eijkl

sendo a hipótese

H05: m1(jk) = m2(jk) = ... = mI(jk) vs. Ha: pelo menos mi(jk) ¹ mi'(jk), para i ¹ i', dado j e k, verificada através do teste F, da seguinte maneira:

sob H05

A análise dos dados com essa estrutura, através do software SAS, é feita no PROC GLM utilizando opção BY, fixando os fatores B e C, conforme encontrado no manual do SAS/STAT (1990). O problema, nesse caso, constitui-se no fato de que o teste F, obtido na análise da variância para a hipótese testada, não está calculado adequadamente, sendo necessário refazê-lo manualmente aplicando o denominador correto QM Resíduo com (IJK-1)(L-1) graus de liberdade. Uma alternativa para contornar o problema é a aplicação de contrastes ortogonais, entre médias, para os efeitos aninhados. De acordo com a ilustração dada, considera-se aplicação de contrastes ortogonais entre médias,do fator A, dado o nível j do fator B combinado com o nível k do fator C, cuja hipótese formulada para h = 1, ..., (I - 1), é a seguinte:

H06: Y(hjk) = 0 vs. Ha6: Y(hjk) ¹ 0, para h = 1, ... , (I - 1),

onde

e

Portanto:

cujo estimador não-tendencioso é e com 1 grau de liberdade. Obtém-se, ainda, que com (I-1) graus de liberdade.

A hipótese H06 será testada através do teste F, da seguinte maneira:

sob H06.

A aplicação desse método no software SAS viabiliza-se com a utilização do comando CONTRAST do PROC GLM, cuja sintaxe é dada a seguir:

CONTRAST “Y(hjk)” A ch1 ... chI A*Bch1 ... chI

A*C ch1 ... chI A*B*Cch1 ... chI

Essa linha de programação SAS fornece, como resultados, a SQY(hj) com 1 grau de liberdade e ainda o valor calculado do teste F, de acordo com o exposto, e também a PROB > F. Os demais contrastes ortogonais são estruturados dessa mesma maneira.

Assim, considerando os (I-1) contrastes ortogonais, dados um j e um k quaisquer, estruturados na maneira exposta e utilizando o comando CONTRAST com a seguinte sintaxe, teremos:

Essas (I-1) linhas de programação SAS, separadas pelas vírgulas, fornecem como resultados a , com (I-1) graus de liberdade. O valor do teste F obtido para testar a hipótese H06, para qualquer j e k, está correto e de acordo com o exposto acima.

Observa-se que as colunas representadas por (1), (2), ... , (I) referem-se aos I níveis do fator A aninhado, na combinação dos níveis j do fator B com o nível k do fator C.

3. RESULTADOS E DISCUSSÃO

Os dados que seguem (Tabela 1) referem-se à produção de matéria seca por planta de milho, g/vaso, cultivada por 35 dias em amostras de Latossolo Vermelho-Amarelo, de um experimento em esquema fatorial envolvendo quatro níveis de fontes de fósforo, dois níveis para modo de preparo e dois níveis para modo de aplicação, no delineamento inteiramente ao acaso, onde todos os fatores foram considerados de efeitos fixos.

O modelo matemático adotado é o mesmo citado na seção anterior. A principal hipótese a ser testada é referente à interação de fonte, modo de preparo e modo de aplicação, dada em H01. O quadro da análise da variância, com o teste F, é dado a seguir (Quadro 1). O programa SAS elaborado para esta análise encontra-se no fim deste item.


Pelo valor de F obtido na análise da variância observa-se que a interação de F x P x M foi significativa, podendo indicar a existência de um efeito diferenciado de fontes de fosfato (F), dada cada combinação dos níveis de modo de preparo (P) com os níveis de modo de aplicação (M). Dando seqüência à análise estatística, o procedimento aplicado consiste na decomposição da soma dos graus de liberdade da interação F x P x M com os graus de liberdade de fonte de fosfato (F), os graus de liberdade da interação F x P e os graus de liberdade de F x M, isto é: três graus de liberdade para interação F x P x M, mais os três graus de liberdade de F, mais os três graus de liberdade da interação F x P e mais os três graus de liberdade da interação F x M, totalizando 12 graus de liberdade. Desse modo temos que: 3 graus de liberdade para o efeito de F, dado o nível 1 de P com o nível 1 de M; 3 graus de liberdade para efeito de F, dado o nível 1 de P com o nível 2 de M; 3 graus de liberdade para o efeito de F, dado o nível 2 de P com o nível 1 de M, e 3 graus de liberdade para o efeito de F, dado o nível 2 de P com o nível 2 de M.

O modelo matemático adotado é o mesmo citado na seção anterior. A principal hipótese a ser testada é referente à interação de fonte, modo de preparo e modo de aplicação, dada em H01. O quadro da análise da variância, com o teste F, é dado a seguir (Quadro 1). O programa SAS elaborado para esta análise encontra-se no fim deste item.

A hipótese de interesse a ser testada é:

H05: m1(jk) = m2(jk) = = mI(jk) vs. Ha5: pelo menos mi(jk)¹ mi'(jk), para i ¹ i', dados j e k, como na seção anterior, sendo: i = 1, ..., 4 (níveis de fonte de fosfato), j = 1, 2 (modo de preparo) e k = 1, 2 ( modo de aplicação). Os resultados obtidos encontram-se no quadro da análise da variância, a seguir (Quadro 2).


Para ilustrar a obtenção dos resultados da decomposição da interação através da utilização do comando CONTRAST do PROC GLM do SAS, considera-se o efeito de fonte de P, dado o nível 1 do modo de preparo com o nível 1 do modo de aplicação, com 3 graus de liberdade, podendo ser fracionado em três contrastes ortogonais, com 1 grau de liberdade para cada um, cuja hipótese a ser testada é:

H06: Y(hjk) = 0 vs. Ha6: Y(hjk) ¹ 0, para h = 1, 2, 3; j = 1, 2 e k = 1, 2, onde com , e

Assim, em termos de programação SAS, tem-se:

A seguir é mostrado o resultado do SAS, referente ao segmento de programação utilizando o comando CONTRAST do PROC GLM, conforme ilustrado anteriormente.

Outra decomposição pode ser feita, para outros fatores, de acordo com o interesse do pesquisador.

Conforme apresentado, o procedimento de análise estatística de um experimento com três fatores com interação significativa recai na decomposição dos graus de liberdade da interação nos efeitos aninhados dos fatores envolvidos. Esse tipo de procedimento não é obtido facilmente pelos softwares disponíveis, exigindo, invariavelmente, uma programação específica para a obtenção dos resultados desejados.

No módulo STAT do software SAS, isso é diferente, pois utiliza-se o comando CONTRAST do PROC GLM, para se obter o efeito aninhado testado corretamente. Apesar disso, é necessário certo conhecimento dos conceitos básicos de estatística experimental, para que se possa fazer tal decomposição de maneira correta, a fim de se obterem os resultados convenientes para a análise.

APÊNDICE: Programa SAS

Programa SAS para Decomposição da Interação Tripla Significativa

4. CONCLUSÕES

1. Essas decomposições podem ser obtidas facilmente para níveis quantitativos e qualitativos através do software SAS que, apesar de ser um software fechado, fornece algumas condições de programação para se obterem procedimentos de análise de dados que, manualmente, seriam complexos e trabalhosos.

2. Nas versões mais recentes do SAS , tais como 6.11 e 6.12, já existe a opção SLICE do comando LSMEANS do PROC GLM, a qual fornece resultados análogos aos obtidos com o uso do comando CONTRAST, e cuja sintaxe é a seguinte:

LSMEANS F*P*M / SLICE=P*M;

Através da opção SLICE = P*M, os níveis do fator modo de preparo combinados com os níveis do fator modo de aplicação são fixados, obtendo-se, assim, o efeito de fontes de fosfato para cada combinação dos níveis de modo de preparo com modo de aplicação.

AGRADECIMENTOS

Os autores agradecem ao Prof. Dr. Luiz Ignácio Prochnow, do Departamento de Solos e Nutrição de Plantas da ESALQ/USP, pelos dados fornecidos e utilizados para ilustrar os resultados obtidos na aplicação da metodologia apresentada, e, aos revisores, pelas sugestões que aprimoraram este trabalho.

(2) Departamento de Ciências Exatas - ESALQ/USP, Caixa Postal 9, 13418-900 Piracicaba (SP)

  • KUEHL, R.O. Statistical principles of research design and analysis Belmont, California: Duxbury Press, 1994. 686 p.
  • FISHER, R.A. The design of experiments Edinburg and London: Oliver and Boyd, 1935. 260p.
  • HINKELMANN, K.; KEMPTHORNE, O. Design and analysis of experiments: introduction to experimental design. New York, John Wiley & Sons, 1994. v.1, 495 p.
  • NOGUEIRA, M.C.S. Estatística experimental aplicada ŕ experimentaçăo agronômica Piracicaba: DME/ESALQ, 1997. 250 p.
  • SAS Institute. SAS/STAT User's Guide. Version 6, 4th ed. Cary, NC, USA,1990. v.2, 846 p.
  • YATES, F. The design and analysis of factorial experiments Commnwealth Bureau of Soil Science, 1937. 95 p. (Technical Communication, 35).
  • (1
    ) Recebido para a publicação em 24 de maio e aceito em 9 de dezembro de 1999.
  • Datas de Publicação

    • Publicação nesta coleção
      10 Jan 2001
    • Data do Fascículo
      2000

    Histórico

    • Recebido
      24 Maio 1999
    • Aceito
      09 Dez 1999
    Instituto Agronômico de Campinas Avenida Barão de Itapura, 1481, 13020-902, Tel.: +55 19 2137-0653, Fax: +55 19 2137-0666 - Campinas - SP - Brazil
    E-mail: bragantia@iac.sp.gov.br