SciELO - Scientific Electronic Library Online

 
vol.35 issue5Evaluation of models to estimate variance components and genetic parameters for growth traits of Guzerá cattleEstimates of genetic parameters for test day and accumulated 305 day milk yields of first lactation Holstein cows author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

Share


Revista Brasileira de Zootecnia

Print version ISSN 1516-3598On-line version ISSN 1806-9290

R. Bras. Zootec. vol.35 no.5 Viçosa Sept./Oct. 2006

http://dx.doi.org/10.1590/S1516-35982006000700010 

MELHORAMENTO, GENÉTICA E REPRODUÇÃO

 

Arranjos para efeitos fixos e estruturas de (co)variâncias residuais para análises de medidas repetidas do peso de bovinos da raça Canchim1

 

Fixed effects arrays and residual covariance structures to analyze sequential weights of Canchim beef cattle

 

 

Fábio Luiz Buranelo ToralI; Maurício Mello de AlencarII; Alfredo Ribeiro de FreitasII

IUniversidade Federal de Mato Grosso
IIEmbrapa Pecuária Sudeste. Bolsista do CNPq

 

 


RESUMO

Este trabalho foi realizado com o objetivo de selecionar o arranjo para efeitos fixos e a estrutura de (co)variância residual que melhor representam a variabilidade dos pesos dentro do rebanho e dentro dos indivíduos, considerando-se dados de pesos de bovinos analisados como medidas repetidas. Foram utilizados dados de peso de 3.690 bovinos Canchim, obtidos ao nascimento, à desmama, aos 12 e aos 18 meses de idade. Analisaram-se diferentes arranjos para os efeitos fixos (grupos de contemporâneos e/ou efeitos principais de ano, mês ou época de nascimento e sexo do bezerro) e diferentes estruturas de (co)variâncias para os resíduos, considerando-se ou não alteração da variância residual ao longo da vida do animal e alteração da correlação entre as medidas tomadas em intervalos diferentes. Os resultados indicaram que o arranjo mais adequado dos efeitos fixos para representar a variabilidade dos pesos dos animais dentro do rebanho foi o grupo de contemporâneos formado por ano, mês e sexo do bezerro e que as melhores estruturas de (co)variâncias residuais foram a Fator Analítico de Primeira Ordem e a Não Estruturada, que consideram o aumento das variâncias com o aumento da idade do indivíduo e as correlações diferentes para cada par de medidas de peso.

Palavras-chave: dados longitudinais, efeitos principais, grupos de contemporâneos, resíduos correlacionados


ABSTRACT

The aim of this work was to evaluate arrays of fixed effects and residual covariance structures that best fit the herd and the animal variability to weights at birth, weaning, twelve and eighteen months of 3,690 Canchim animals. Different arrays of fixed effects (contemporary groups and, or the main effects of year, month or season of birth and sex) and different residual covariance structures (considering or not change of variance and of correlation between weights at different ages) were studied. The results indicated that the most adequate array of fixed effects to fit herd variability was the contemporary group of year, month and sex. The best residual covariance structures were the First-Order Factor Analytic and the Unstructured, which consider increase of residual variance as age increases and different correlation between pair of weights at different ages.

Key Words: contemporary groups, longitudinal data, main effects, residual correlation


 

 

Introdução

Vários estudos têm sido conduzidos com o objetivo de investigar a resposta de uma característica ao longo do tempo. Assim, as medidas repetidas são obtidas nos mesmos indivíduos, em tempos diferentes, e, possivelmente, sob diferentes condições experimentais. Nesses casos, pode existir uma estrutura de (co)variância única para representar a variabilidade das medidas dentro dos indivíduos de uma população, mas os parâmetros dessa estrutura podem variar entre os indivíduos (Laird & Ware, 1982).

Medidas repetidas de uma característica, como o peso em diferentes idades, avaliadas no mesmo animal, são correlacionadas entre si. A correlação e a variância dessas medidas podem variar ao longo do tempo e podem produzir uma estrutura de (co)variância complicada, a qual requer métodos estatísticos especiais para a análise (Littell et al., 1998).

Freitas et al. (2005) estudaram os pesos de bovinos das raças Nelore, Guzerá, Gir e Indubrasil sob o enfoque de medidas repetidas e sugeriram que o estudo dessas características considerando-se uma estrutura de (co)variância residual entre as medidas é mais eficiente que a análise univariada, normalmente feita por meio do procedimento GLM do SAS, a qual considera as medidas repetidas como subparcelas. Gröhn et al. (1999) estudaram o efeito da cetose sobre a produção de leite em vacas da raça Holandesa considerando a produção total de leite ajustada para 305 dias de lactação e considerando os controles de produção mensais como medidas repetidas, com estruturas de (co)variâncias residuais entre as medidas. Os autores concluíram que, por meio do segundo tipo de análise, foi possível identificar diminuição significativa da produção de leite em vacas com cetose, o que não ocorreu com a primeira análise, o que evidenciou maior eficiência da análise de medidas repetidas, em relação à análise univariada, para detectar efeitos significativos das fontes de variação.

A escolha da melhor estrutura de (co)variância residual e do modelo mais adequado é fundamental na análise de dados de medidas repetidas, caso contrário, os resultados podem ocasionar conclusões equivocadas. Segundo Littell et al. (1998), a escolha da estrutura de (co)variância para os resíduos é importante porque os erros-padrão das médias são dependentes desta escolha e, caso se opte por uma estrutura inadequada, os erros-padrão podem ser viesados.

O procedimento MIXED do SAS (SAS, 2000) disponibiliza ao usuário em torno de 40 tipos de estruturas de (co)variâncias residuais e critérios para escolha da melhor estrutura para determinado conjunto de dados. Esses critérios, em geral, incluem o valor da função de máxima verossimilhança restrita, o número de dados analisados e de parâmetros a serem estimados.

Para determinado conjunto de dados de pesos de bovinos analisados como medidas repetidas, a estrutura de (co)variância pode variar entre as diversas raças ou grupos genéticos. Freitas et al. (2005), analisando dados de nove pesagens, realizadas em intervalos trimensais do nascimento aos dois anos de idade, concluíram que a estrutura Fator Analítico de Primeira Ordem (FA(1)) foi a mais adequada para as raças Nelore e Indubrasil, enquanto a Não Estruturada (UN) foi a mais adequada para as raças Guzerá e Gir. Todavia, as estruturas que requerem a estimação de maior número de parâmetros tendem a proporcionar os melhores ajustes (Gröhn et al., 1999; Freitas et al., 2005; Lorenzo-Bermejo et al., 2003).

Este trabalho foi realizado com o objetivo de selecionar o arranjo para efeitos fixos e a estrutura de (co)variância residual que melhor representem a variabilidade dentro do rebanho e dentro dos indivíduos, utilizando-se dados de medidas repetidas do peso de bovinos da raça Canchim.

 

Material e Métodos

Os dados utilizados neste estudo foram provenientes do controle de desenvolvimento ponderal de bovinos da raça Canchim, do rebanho da Embrapa Pecuária Sudeste, localizada em São Carlos, SP. Foram analisados os dados de 3.690 animais nascidos entre os anos de 1956 e 2000 (exceto 1957 e 1999), pesados ao nascimento (PN), à desmama (P240), aos 12 (P365) e aos 18 meses de idade (P550). As idades dos animais no momento das pesagens à desmama, aos 12 e aos 18 meses de idade variaram de 180 a 300, de 305 a 405 e de 490 a 610 dias de idade e os pesos utilizados foram padronizados para as idades de 240, 365 e 550 dias, respectivamente, considerando-se o ganho de peso diário de cada animal durante o período que antecedeu cada pesagem. Para análise, foram utilizados os dados de pesos cujas classes de efeitos fixos formadas pelo ano, mês de nascimento e sexo do animal possuíam pelo menos cinco observações. Os animais foram criados em regime exclusivo de pastagens e maiores informações sobre o manejo podem ser obtidas em Mello et al. (2002).

Inicialmente, os dados foram submetidos a análises exploratórias com o objetivo de diagnosticar a qualidade. De acordo com Freitas (2003), dados de campo, principalmente em virtude de problemas de coleta, apresentam "outliers", correlações absurdas, afastamento da distribuição normal, heterogeneidade de variâncias dentro das classes de efeitos fixos e grau acentuado de assimetria e curtose, anomalias que podem omitir resultados importantes quando se utilizam procedimentos tradicionais de análises.

Os coeficientes de assimetria e curtose, as (co)variâncias e as correlações fenotípicas para os pesos observados foram calculados sem qualquer ajuste para as fontes de variação com o propósito de compará-los àqueles obtidos nas análises utilizando-se modelos mais parametrizados. A assimetria é uma forma de a distribuição dos dados ser mais viesada em uma direção que em outra. Quando se considera uma distribuição simétrica como a normal, a curtose é uma medida do grau de achatamento dessa distribuição (SAS, 2000). Ambas são importantes nas análises exploratórias dos dados (Freitas, 2003).

Posteriormente, os dados de pesos, medidos nas diferentes idades do animal, foram considerados medidas repetidas e analisados pelo seguinte modelo linear misto:

em que yiljv é a resposta do animal i, submetido aos efeitos fixos l, na idade j, filho da vaca com idade v; µ, a constante geral; ailv, o efeito aleatório do animal i submetido aos efeitos fixos l, filho da vaca com idade v; f1, o efeito do arranjo de efeitos fixos ; idj, o efeito da idade j (j = 0, 240, 365 e 550 dias); b1 e b2, os coeficientes linear e quadrático, respectivamente, do efeito da idade v, da mãe do animal i; iv e , a idade da vaca e a média de idade das vacas; e eiljv, o erro aleatório associado a cada observação.

Sob a forma matricial, o modelo pode ser representado por:

em que y = vetor de observações (14.760 x 1); X = matriz de incidência dos efeitos fixos (14.760 x número de efeitos fixos, que varia em função do arranjo de efeitos fixos considerado); b = vetor das soluções para os efeitos fixos (número de efeitos fixos x 1); Z = matriz de incidência dos efeitos aleatórios (14.760 x 3.690); a = vetor de soluções dos efeitos aleatórios (3.690 x 1); e = vetor de resíduos (14.760 x 1).

As pressuposições assumidas são:

em que G=I, sendo I uma matriz identidade de ordem 3.690 e a variância genética aditiva direta; R, uma matriz bloco-diagonal definida por C Ä I, em que C é uma matriz de (co)variâncias entre as medidas de cada animal, de dimensão quatro; I, uma matriz identidade de ordem 3.690; , a variância residual; e Ä, o produto direto de Kronecker. Os efeitos fixos foram considerados como efeitos principais e/ou como grupos de contemporâneos, analisando-se seis arranjos: um (AEF1) envolvendo os efeitos principais de ano e mês de nascimento e sexo do bezerro; dois (AEF2), os efeitos principais de ano e trimestre de nascimento e sexo do bezerro; três (AEF3), o grupo de contemporâneos composto por ano e mês de nascimento e o efeito principal de sexo do bezerro; quatro (AEF4), o grupo de contemporâneos composto por ano e trimestre de nascimento e o efeito principal de sexo do bezerro; cinco (AEF5), o grupo de contemporâneos composto por ano, mês de nascimento e sexo do bezerro; e seis (AEF6), o grupo de contemporâneos composto por ano, trimestre de nascimento e sexo do bezerro.

Estes arranjos foram estudados em conjunto com as estruturas de (co)variâncias (Tabela 1) utilizadas por Bozdogan (1987), Wolfinger (1993), Vonesh et al. (1996), Littell et al. (1998), Gröhn et al. (1999), Lorenzo-Bermejo et al. (2003) e Freitas et al. (2005).

As estruturas AR(1): auto-regressiva de primeira ordem; ARMA(1,1): auto-regressiva de primeira ordem com média móvel; CS: simetria composta; TOEP: Toeplitz; TOEP(2): Toeplitz com duas bandas; e VC: componentes de variância consideram homogeneidade de variâncias, enquanto as estruturas ARH(1): auto-regressiva heterogênea de primeira ordem; CSH: simetria composta heterogênea; FA(1): fator analítico de primeira ordem; HF: Huynh – Feldt; TOEPH: Toeplitz heterogênea; e UN: não-estruturada, consideram heterogeneidade de variâncias. Na estrutura CS, todas as covariâncias são iguais e, na VC, as covariâncias são nulas. As demais estruturas consideram diferentes covariâncias para cada par de medidas.

Para escolha do arranjo para efeitos fixos e da estrutura de (co)variância que melhor representam a variabilidade entre e dentro de animais, respectivamente, foram utilizados os critérios "-2 Residual Log Likelihood" (-2RLL) e "Consistent Akaike's Information Criterion" (CAIC), obtidos com as seguintes fórmulas (SAS, 2000; Wolfinger, 1993):

em que n = número de animais (3.690); p = posto da matriz X; k = número de observações utilizadas (14.760); e as demais matrizes e vetores como definidos anteriormente.

Os parâmetros das matrizes de (co)variâncias residuais foram estimados pelo método da Máxima Verossimilhança Restrita, observando-se que, no procedimento MIXED do SAS, o máximo é obtido pelo método de Newton-Raphson. Como critério de convergência do algoritmo de busca do ponto de máximo da função de verossimilhança restrita, adotou-se o padrão do procedimento MIXED do SAS: , em que fk= valor da função de interesse (verossimilhança restrita); gk = primeira derivada da função de interesse; e Hk = segunda derivada da função de interesse, ambos na iteração k (SAS, 2000).

O arranjo mais adequado para os efeitos fixos foi obtido por meio do teste de c2 para os critérios -2RLL e CAIC, com graus de liberdade iguais à diferença entre os graus de liberdade dos resíduos dos modelos com diferentes arranjos para efeitos fixos. Na escolha da estrutura de (co)variância mais adequada, também foi realizado o teste de c2 para os critérios de ajuste proporcionados pelo SAS, sendo o grau de liberdade do teste igual à diferença entre o número de parâmetros das estruturas em questão. Valores de -2RLL e de CAIC mais próximos de zero indicam melhor ajuste do modelo (SAS, 2000).

Após a escolha do melhor arranjo para efeitos fixos e da estrutura de (co)variância residual mais adequada, foram realizadas análises de variância unicaracterísticas para os pesos de cada idade. Os resíduos associados a cada pesagem obtidos nas análises com estruturas de (co)variância e nas unicaracterísticas foram utilizados para os cálculos dos coeficientes de assimetria e curtose.

 

Resultados e Discussão

Na Tabela 2 são apresentados as médias e os respectivos desvios-padrão, os valores mínimos e máximos e os coeficientes de assimetria e curtose e, na Tabela 3, são apresentadas as (co)variâncias e as correlações para PN, P240, P365 e P550.

As médias de pesos e os respectivos desvios-padrão para as diferentes idades mantiveram-se dentro do intervalo descrito na literatura para esta raça (Mascioli et al., 1996; ABCCAN-Embrapa-Geneplus, 2002), sugerindo que os resultados deste estudo podem ser generalizados para outros rebanhos da raça Canchim, enquanto os coeficientes de assimetria e curtose observados foram menores que os observados por Freitas (2003) para dados de campo de bovinos da raça Nelore provenientes de vários rebanhos mantidos em diferentes regiões do país. Essas diferenças podem ser atribuídas, em parte, ao fato de que os dados utilizados neste estudo foram provenientes de um rebanho experimental, enquanto aqueles utilizados por Freitas (2003) foram obtidos de rebanhos comerciais utilizando-se diferentes metodologias de pesagem.

Como demonstrado na Tabela 3, à medida que o animal fica mais velho, ocorre aumento da variância e, à medida que aumenta o intervalo das pesagens, diminui a correlação entre essas pesagens, fato relatado por Mascioli et al. (1996).

Constam na Tabela 4 os critérios de ajuste proporcionados pelo procedimento MIXED do SAS (2000) para cada arranjo de efeitos fixos, utilizando-se as estruturas de (co)variâncias com homogeneidade e com heterogeneidade de (co)variâncias, e os respectivos graus de liberdade do modelo e do resíduo associados a cada arranjo para os efeitos fixos.

Independentemente da estrutura de (co)variância residual considerada, o arranjo AEF5 proporcionou os menores valores para todos os critérios, sendo, portanto, o de melhor ajuste para a análise dos dados utilizados neste trabalho, enquanto o arranjo AEF2 proporcionou os maiores valores para os critérios, sendo, portanto, o modelo com o pior ajuste para a análise destes dados. Com base nos graus de liberdade (Tabela 4), o arranjo 5 foi o mais completo dos testados, enquanto o arranjo 2 foi o mais simples. Portanto, neste caso, recomenda-se a utilização de modelos mais parametrizados para a análise deste conjunto de dados.

O critério -2RLL ("-2 Residual Log Likelihood") apontou a estrutura de (co)variância UN como aquela que proporcionou o melhor ajuste para a análise, enquanto o critério CAIC ("Consistent Akaike's Information Criterion") apontou as estruturas UN e FA(1) como aquelas que proporcionaram os melhores ajustes, exceto para AEF2, em que a estrutura FA(1) foi significativamente melhor que a UN. Essa diferença pode ser atribuída ao fato de o CAIC ser mais rigoroso que o -2RLL por considerar, além do -2RLL, o número de parâmetros a ser estimados e de dados utilizados. A estrutura VC foi a que apresentou os maiores valores para os critérios avaliados e, portanto, foi a pior para representar a variabilidade entre as medidas de cada animal.

A escolha das estruturas FA(1) e UN para representar a variação dentro do indivíduo corrobora os resultados de Freitas et al. (2005), que, estudando dados de nove medidas de pesos de zebuínos, observaram que as estruturas FA(1) e UN foram as mais adequadas para o estudo de medidas repetidas de peso nas raças Gir e Indubrasil. Esses autores também observaram que as estruturas CSH e ARMA(1,1) foram adequadas para as raças Guzerá e Nelore, respectivamente.

Na Tabela 5 são apresentadas as matrizes de (co)variâncias e as correlações entre as medidas de cada animal fornecidas pelas estruturas FA(1) e UN.

 

 

As estruturas FA(1) e UN fornecem matrizes em que é possível observar aumento da variância ao longo da vida do animal, fenômeno reportado por Mascioli et al. (1996) e Freitas et al. (2005). Além disso, fornecem correlações diferentes para cada par de idades, que, geralmente, são menores à medida que aumenta o intervalo de pesagens. A escolha das estruturas FA(1) e UN para modelar as (co)variâncias entre as medidas de peso do mesmo animal é coerente com o fenômeno analisado e, portanto, corrobora a aplicação dos resultados obtidos neste trabalho.

Na Tabela 6 são apresentados os coeficientes de assimetria e de curtose, a média e a mediana dos resíduos para PN, P240, P365 e P550, obtidos das análises com as estruturas de (co)variâncias residuais Fator Analítico de Primeira Ordem e Não-Estruturada e das análises de variância unicaracterísticas, considerando-se o modelo com o efeito do grupo de contemporâneos de ano, mês de nascimento e sexo do bezerro (AEF5). A moda não é apresentada porque, em todos os casos, o conjunto de resíduos foi multimodal.

 

 

Os coeficientes de assimetria dos resíduos obtidos das análises utilizando-se estruturas de (co)variâncias residuais e das análises unicaracterísticas foram semelhantes, porém, observou-se redução dos coeficientes de curtose quando da utilização das estruturas de (co)variâncias em relação àqueles obtidos nas análises unicaracerísticas. Os valores obtidos foram próximos de zero e indicam que a análise de medidas repetidas para estes dados, com as pressuposições iniciais, ainda que não completamente atendidas, podem gerar resultados confiáveis.

Dessa forma, o estudo do peso dos animais como medidas repetidas pode ser mais eficiente que o dos pesos em cada idade como características diferentes, pois a utilização de estruturas de (co)variâncias residuais possibilita considerar as oscilações da variância e a correlação entre os resíduos, implicando estimação de parâmetros genéticos e/ou ambientais mais adequados e realização de testes de hipóteses mais confiáveis.

 

Conclusões

O arranjo mais adequado dos efeitos fixos para representar a variabilidade dos pesos dos animais dentro do rebanho foi o grupo de contemporâneos formado por ano, mês e sexo do bezerro.

As melhores estruturas de (co)variâncias residuais foram a Fator Analítico de Primeira Ordem e a Não-Estruturada, que consideram aumento das variâncias com o aumento da idade do indivíduo e correlações diferentes para cada par de medidas de peso.

 

Literatura Citada

ABCCAN-Embrapa-Geneplus. Sumário de touros Canchim e MA. Edição Primavera/2002. Campo Grande: Geneplus Consultoria Agropecuária LTDA, 2002. Disponível em: http:<www.canchim.com.br/dep.htm#item7>. Acesso em: 15/06/2003.        [ Links ]

BOZDOGAN, H. Model selection and Akaike's information criterion (AIC): the general theory and its analytical extensions. Psychometrika, v.52, n.3, p.345-370, 1987.        [ Links ]

FREITAS, A.R. Técnicas de análises exploratórias de dados. In: REUNIÃO ANUAL DA SOCIEDADE BRASILEIRA DE ZOOTECNIA, 40., 2003, Santa Maria. Anais... Santa Maria: SBZ/Infovia, 2003. (CD-ROM)        [ Links ]

FREITAS, A.R.; PRESOTTI, C.V.; TORAL, F.L.B. Alternativas de análises em dados de medidas repetidas de bovinos de corte. Revista Brasileira de Zootecnia, v.34, n.6, p.2233-2244, 2005 (supl.).        [ Links ]

GRÖHN, Y.T.; McDERMOTT, J.J.; SCHUKKEN, Y.H. et al. Analysis of correlated continuous repeated observations: modeling the effect of ketosis on milk yield in dairy cows. Preventive Veterinary Medicine, v.39, n.2, p.137-153, 1999.        [ Links ]

LAIRD, N.M.; WARE, J.H. Random effects models for longitudinal data. Biometrics, v.38, n.4, p.963-974, 1982.        [ Links ]

LORENZO-BERMEJO, J.; ROEHE, R.; RAVE, G. et al. Comparison of linear and nonlinear functions and covariance structures to estimate feed intake pattern in growing pigs. Livestock Production Science, v.82, n.1, p.15-26, 2003.        [ Links ]

LITTELL, R.C.; HENRY, P.R.; AMMERMAN, C.B. Statistical analysis of repeated measures data using SAS procedures. Journal of Animal Science, v.76, n.4, p.1216-1231, 1998.        [ Links ]

MASCIOLI, A.S.; ALENCAR, M.M.; BARBOSA, P.F. et al. Influência de fatores de meio sobre pesos de animais da raça Canchim. Revista da Sociedade Brasileira de Zootecnia, v.25, n.5, p.853-865, 1996.        [ Links ]

MELLO, S.P.; ALENCAR M.M.; SILVA, L.O.C. et al. Estimativas de (co)variâncias e tendências genéticas para pesos em um rebanho Canchim. Revista Brasileira de Zootecnia, v.31, n.4, p.1707-1714, 2002.        [ Links ]

STATISTICAL ANALYSIS SYSTEM - SAS. User's guide. Version 8. 2.ed. Cary: 2000. (CD-ROM)        [ Links ]

VONESH, E.F.; CHINCHILLI, V.M.; PU, K. Goodness of fit in generalized nonlinear mixed effects model. Biometrics, v.52, n.2, p.572-587, 1996.        [ Links ]

WOLFINGER, R. Covariance structure selection in general mixed models. Community of Statistics - Simulation, v.22, n.4, p.1079-1106, 1993.        [ Links ]

 

 

Recebido: 17/06/04
Aprovado: 29/05/06
Projeto financiado pela Embrapa e FAPESP.

 

 

Correspondências devem ser enviadas para: flbtoral@hotmail.com
1 Parte da dissertação de Mestrado do primeiro autor apresentada ao Programa de Pós-Graduação em Genética e Melhoramento Animal da Universidade Estadual Paulista / Faculdade de Ciências Agrárias e Veterinárias de Jaboticabal.

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License