Acessibilidade / Reportar erro

Estudo de características de produção de matrizes de corte por meio da análise de componentes principais

Study of meat-type chickens production traits by principal components analysis

Resumos

Avaliou-se o descarte de variáveis de produção, em análises de componentes principais, de três linhagens de matrizes de corte do Programa de Melhoramento Genético da Universidade Federal de Viçosa, utilizando informações de 270 aves, sendo 90 de cada linhagem. As características analisadas foram dias para postura do primeiro ovo (DPPO), taxa de postura da 22ª a 56ª semana (TP), peso médio individual na 32ª (PMI1), na 40ª (PMI2), na 48ª (PMI3), na 56ª (PMI4) e na 64ª semana (PMI5) e peso médio do ovo, obtido pela média da pesagem de três ovos na 32ª (PMO1), na 40ª (PMO2), na 48ª (PMO3), na 56ª (PMO4) e na 64ª semana (PMO5). Dos 12 componentes principais, sete apresentaram variância menor do que 0,7 (autovalor menor do que 0,7), sugerindo-se sete variáveis para descarte. As variáveis descartadas foram aquelas que apresentaram maiores coeficientes, em valor absoluto, a partir do último componente principal. Observou-se correlação linear simples e significativa entre as variáveis descartadas e as não descartadas, que indica redundância de variáveis, razão do descarte. Recomendam-se as variáveis: DPPO, TP, PM14, PMO1 e PMO4 para o estudo de características da produção de matrizes de frango de corte por meio da análise de componentes principais.

frango de corte; análise multivariada; descarte de variável; correlação


Records of 270 meat-type chickens from three lines, 90 of each one, were used to discard variables in a principal component analysis. Data were obtained from meat-type chicken lines of the genetic breeding program of the Universidade Federal de Viçosa. The following traits were evaluated: days at first egg (DFE), egg production rate (EPR) from 22nd to 56th week, body weights at 32nd (BW1), 40th (BW2), 48th (BW3), 56th (BW4), and 64th weeks of age (BW5), and average of three egg weights, at 32nd (EW1), 40th (EW2), 48th (EW3), 56th (EW4) and at 64th weeks (EW5). From the 12 principal components, seven showed variance lower than 0,7 (eigenvalue lower than 0,7), suggesting seven variables to be discarded. Variables which showed the highest coefficients, in absolute value, in the last principal component were discarded. Highly correlated variables with the smaller principal components variance explain a small part of the whole variation. In addition, discarded variables in function of the significant simple linear correlation with the nondiscorded variable, were considered redundants. The variables DFE, EPR, BW4, EW1, and EW4 are recommended for principal component analysis of broiler matrix.

broiler; discard of variable; multivariate analysis; correlation


ZOOTECNIA E TECNOLOGIA E INSPEÇÃO DE PRODUTOS DE ORIGEM ANIMAL

Estudo de características de produção de matrizes de corte por meio da análise de componentes principais

Study of meat-type chickens production traits by principal components analysis

M. YamakiI,IV; G.R.O. MenezesII,IV; A.L.C. PaivaI,IV; L. BarbosaI,V; R.F. SilvaI,V; R.B. TeixeiraII,IV,* * Autor para correspondência ( corresponding author) E-mail: rafaelzootecnia@yahoo.com.br ; R.A. TorresIII,IV; P.S. LopesIII

IAluno de pós-graduação - UFV - Viçosa, MG

IIAluno de graduação - UFV - Viçosa, MG

IIIDepartamento de Zootecnia - UFV - Viçosa, MG

IVBolsista do CNPq

VBolsista da CAPES

RESUMO

Avaliou-se o descarte de variáveis de produção, em análises de componentes principais, de três linhagens de matrizes de corte do Programa de Melhoramento Genético da Universidade Federal de Viçosa, utilizando informações de 270 aves, sendo 90 de cada linhagem. As características analisadas foram dias para postura do primeiro ovo (DPPO), taxa de postura da 22ª a 56ª semana (TP), peso médio individual na 32ª (PMI1), na 40ª (PMI2), na 48ª (PMI3), na 56ª (PMI4) e na 64ª semana (PMI5) e peso médio do ovo, obtido pela média da pesagem de três ovos na 32ª (PMO1), na 40ª (PMO2), na 48ª (PMO3), na 56ª (PMO4) e na 64ª semana (PMO5). Dos 12 componentes principais, sete apresentaram variância menor do que 0,7 (autovalor menor do que 0,7), sugerindo-se sete variáveis para descarte. As variáveis descartadas foram aquelas que apresentaram maiores coeficientes, em valor absoluto, a partir do último componente principal. Observou-se correlação linear simples e significativa entre as variáveis descartadas e as não descartadas, que indica redundância de variáveis, razão do descarte. Recomendam-se as variáveis: DPPO, TP, PM14, PMO1 e PMO4 para o estudo de características da produção de matrizes de frango de corte por meio da análise de componentes principais.

Palavras-chave: frango de corte, análise multivariada, descarte de variável, correlação

ABSTRACT

Records of 270 meat-type chickens from three lines, 90 of each one, were used to discard variables in a principal component analysis. Data were obtained from meat-type chicken lines of the genetic breeding program of the Universidade Federal de Viçosa. The following traits were evaluated: days at first egg (DFE), egg production rate (EPR) from 22nd to 56th week, body weights at 32nd (BW1), 40th (BW2), 48th (BW3), 56th (BW4), and 64th weeks of age (BW5), and average of three egg weights, at 32nd (EW1), 40th (EW2), 48th (EW3), 56th (EW4) and at 64th weeks (EW5). From the 12 principal components, seven showed variance lower than 0,7 (eigenvalue lower than 0,7), suggesting seven variables to be discarded. Variables which showed the highest coefficients, in absolute value, in the last principal component were discarded. Highly correlated variables with the smaller principal components variance explain a small part of the whole variation. In addition, discarded variables in function of the significant simple linear correlation with the nondiscorded variable, were considered redundants. The variables DFE, EPR, BW4, EW1, and EW4 are recommended for principal component analysis of broiler matrix.

Keywords: broiler, discard of variable, multivariate analysis, correlation

INTRODUÇÃO

Em muitas situações, os pesquisadores tendem a avaliar o maior número possível de características e geram, com isso, acréscimo considerável de trabalho. Quando o número de características mensuradas é grande, há possibilidade de algumas delas serem de pouca contribuição para a discriminação dos indivíduos avaliados. Neste caso, despende-se muito tempo para mensurar grande número de variáveis sem melhoria na precisão de avaliação das aves, além de tornar mais complexa a análise e a interpretação dos resultados. Assim, podem-se eliminar as características redundantes e de difícil mensuração, o que reduziria o tempo e o custo dos experimentos.

A técnica de componentes principais foi originalmente descrita por Pearson (1901) e, posteriormente, aplicada por Hotelling (1933), citado por Jolliffe (1973), em diversas áreas da ciência. De acordo com Manly (1988), o uso da técnica de componentes principais acentuou-se quando houve maior disponibilidade de recursos na área computacional. O método consiste na transformação do conjunto original de variáveis em outro, os componentes principais, de dimensões equivalentes, porém com a propriedade de que cada componente retém porcentagem da variância original e de que as variâncias são decrescentes do primeiro ao último componente principal (Morrison, 1976).

Componentes principais são combinações lineares de variáveis aleatórias ou estatísticas, que possuem propriedades especiais, em termos de variâncias. Entre essas propriedades especiais, destaca-se o fato de que o primeiro componente principal possui a máxima variância, tendo o segundo componente principal a segunda maior variância e, assim, sucessivamente, de forma que o máximo de informação, em termos de variação total, está contido nos primeiros componentes. Além disso, os componentes principais representam vetores linearmente independentes. (Anderson, 1958).

Segundo Baker et al. (1988), a análise dos componentes principais pode revelar relações não identificadas previamente e contribuir para melhor interpretação dos dados. Além disso, muitas vezes representa método para explicar a estrutura de covariância entre as várias características medidas em uma população.

Decisões acerca da seleção de animais em função de determinada característica podem ser tomadas de forma intuitiva, negligenciando seus componentes e as ligações existentes entre eles (Roso e Fries, 1995). Nesse contexto, a análise de componentes principais deve contribuir na interpretação das relações existentes entre as variáveis e, consequentemente, na tomada de decisões (Baker et al., 1988; Roso e Fries, 1995).

O trabalho teve o objetivo de, ao utilizar análises de componentes principais, avaliar as variáveis mensuradas em experimentos genéticos e estabelecer critérios para eliminação de variáveis redundantes, sem que houvesse perda apreciável na explicação da variação total do experimento.

MATERIAL E MÉTODOS

Os dados utilizados são provenientes de três linhagens de aves de corte do Programa de Melhoramento Genético da Universidade Federal de Viçosa e totalizam 270 aves avaliadas, sendo 90 de cada linha. As aves foram alojadas em gaiolas individuais na 22ª semana de idade.

Utilizando-se a matriz de correlação entre todas as variáveis mensuradas, fez-se avaliação da multicolinearidade entre as características para avaliar a dependência linear entre as variáveis, que pode redundar em matrizes singulares ou mal condicionadas.

As características analisadas foram dias para postura do primeiro ovo (DPPO); taxa de postura da 22ª a 56ª semana (TP); peso médio individual na 32ª (PMI1), na 40ª (PMI2), na 48ª (PMI3), na 56ª (PMI4) e na 64ª semana (PMI5); e peso médio do ovo obtido pela média da pesagem de três ovos na 32ª (PMO1), na 40ª (PMO2), na 48ª (PMO3), na 56ª (PMO4) e na 64ª semana (PMO5).

A análise de componentes principais consiste em transformar, a partir da matriz de correlação, um conjunto de variáveis Z1, Z2,..., Zp em um novo conjunto de p variáveis (Y1 (CP1), Y2 (CP2), Yp (CPp)) não-correlacionadas entre si e que explicam a variância total observada entre os dados (Regazzi, 2002). A idéia principal do procedimento consiste em utilizar os primeiros componentes principais, que contenham a maior variabilidade dos dados originais, descartando-se racionalmente os demais componentes e reduzindo a dimensionalidade e o número de variáveis mensuradas.

O descarte de variáveis foi feito eliminando-se a variável com maior correlação no componente principal, referente ao menor autovalor (menor variância), variável esta julgada menos importante para explicar a variação total dos dados (Regazzi, 2002), porque as variáveis altamente correlacionadas com os componentes principais de menor variância, de acordo com Mardia et al. (1997), representam variação praticamente insignificante. O critério do número de variáveis descartadas foi, conforme recomendações de Jolliffe (1973), eliminar tantas variáveis quanto for o número de componentes cuja variância (autovalor) fosse menor que 0,7. Todas as análises foram feitas utilizando o programa SAS System, versão 8.0/1999/.

RESULTADOS E DISCUSSÃO

Os resultados obtidos para os componentes principais, seus respectivos autovalores e porcentagens da variância total explicada por componente são apresentados na Tab. 1.

Dos 12 componentes principais, sete (58,3%) apresentaram variância menor que 0,7 (autovalor menor que 0,7). Assim os cinco primeiros componentes principais que explicam 77,19% da variação total foram selecionados.

Os seis primeiros componentes principais explicaram 82,8% da variação total, confirmando os resultados de Abreu et al. (1999a) que, ao analisarem a combinação de características produtivas de linhagens de matrizes de frangos de corte, também relataram que os seis primeiros componentes principais explicam mais de 80% da variação total dos dados.

Strapasson et. al. (2000), ao selecionarem variáveis na caracterização de germoplasma de Paspalum sp. por meio de componentes principais, com o intuito de descartar as variáveis consideradas redundantes ou não-discriminantes, conseguiram selecionar oito variáveis, consideradas mais importantes na explicação da variabilidade presente na coleção de acessos do germoplasma estudado.

As sete variáveis que apresentaram maiores coeficientes, em valor absoluto, a partir do último componente principal, foram descartadas, conforme apresentado na Tab. 2.

Neste estudo, as variáveis que podem ser descartadas e em ordem de menor importância para explicar a variação total dos dados são: PMI2, PMI3, PMO5, PMO2, PMI5, PMO3, PMI1.

Os resultados, apesar de se referirem à espécie diferente, assemelham-se aos encontrados por Barbosa (2003), que avaliaram 13 características de desempenho em suínos e concluíram que oito delas (61,5%) foram redundantes, portanto podiam ser descartadas.

Abreu et al. (1999b), ao trabalharem com produção de ovos de matrizes de frango de corte, obtiveram melhores resultados com os dois primeiros componentes principais que explicaram 98% da variação total dos dados. Quanto menor o número de variáveis que expliquem maior fração da variação total, maior a economia de tempo, o que é altamente desejável.

Mascioli et al. (2000), também, ao trabalharem com espécie diferente, analisaram os componentes principais (CP) para características de crescimento na raça Canchim, observaram que os dois primeiros CP foram responsáveis por mais de 75% da variação total, tanto para os ganhos como para os pesos, e concluíram que se pode utilizar a variância fenotípica para o estudo dos componentes principais. Para os pesos, a maior parte da variância total dos dados foi justificada pelo primeiro componente principal, que explicou 74,2% da variação. Esse CP contrasta animais mais pesados com animais mais leves após o nascimento e indica que a influência do peso se torna mais importante à medida que o animal envelhece, como observaram Barbosa e Smith (1988) na raça Charolês.

Adicionalmente, foi possível observar que as características sugeridas para descarte apresentaram correlação linear simples significativas com as não descartadas, ou seja, são redundantes. Por outro lado, as variáveis selecionadas apresentam menor correlação entre si (Tab. 3). Deste modo, cada característica selecionada deve ser responsável por um tipo de informação biológica exclusiva, e a ação conjunta destas será complementar para descrição geral dos indivíduos ou população estudados.

Com base nesses resultados, recomendam-se as variáveis DPPO, TP, PMI4, PMO1 e PMO4 para serem mantidas nas análises de componentes principais. Das características mensuradas de peso corporal, somente PMI4 não pode ser descartada; as demais de peso corporal são redundantes. Para peso médio dos ovos, três características podem ser descartadas, com a utilização de PMO1 e PMO4 que apresentam menor correlação quando comparadas às outras características de peso médio dos ovos. As características DPPO e TP foram pouco correlacionadas com as demais variáveis, portanto não devem ser descartadas.

CONCLUSÕES

A análise de componentes principais é efetiva e permite o descarte de sete variáveis das 12 variáveis mensuradas no experimento. Quanto menor o número de variáveis necessárias para explicar a variação total observada, mais rápida e fácil se torna a análise e resulta em importante economia de tempo.

Recebido em 23 de julho de 2008

Aceito em 27 de janeiro de 2009

  • ABREU, V.M.N.; SILVA, M.A.; CRUZ, C.D. et al. Capacidade de combinação de características produtivas de linhagens de matrizes de frangos de corte, usando a técnica de componentes principais. Rev. Bras. Zootec., v.28, p.250-257, 1999a.
  • ABREU, V.M.N.; SILVA, M.A.; CRUZ, C.D. et al. Capacidade de combinação de características de produção de ovos de linhagens de matrizes de corte usando componentes principais. Rev. Bras. Zootec., v.28, p.955-959, 1999b.
  • ANDERSON, T.W. An introduction to multivariate statistical analysis. New York: John Wiley & Sons, 1958. 374p.
  • BAKER, J.F.; STEWART, T.S.; LONG, C.R. et al. Multiple regression and principal componentes analysis of puberty and growth in cattle. J. Anim. Sci., v.66, p.2147-2158, 1988.
  • BARBOSA, L. Avaliação de características de desempenho de suínos por meio de componentes principais. In: REUNIÃO ANUAL DA SOCIEDADE BRASILEIRA DE ZOOTECNIA, 40., 2003, Santa Maria. Anais.. Santa Maria, 2003. (resumo) CDROM.
  • BARBOSA, P.F.; SMITH, W.B. Aplicação de técnicas de análise multivariada em melhoramento animal. In: REUNIÃO ANUAL DA SOCIEDADE BRASILEIRA DE ZOOTECNIA, 25., 1988,Viçosa. Anais.. Viçosa, 1988. p.240. (resumo).
  • HOTELLING, H. Review of the triumph of mediocrity in business. J. Am. Stat. Assoc., v.28, p.463-465, 1933.
  • JOLLIFFE, I.T. Discarding variables in a principal component analysis, II: real data. Appl. Stat., v.22, p.22-31, 1973.
  • MANLY, B.F.J. Multivariate statistical methods: a primer. London: Chapman and Hall, 1988. 159p.
  • MARDIA, K.V.; KENT, J.T.; BIBBY, J.M. et al. Multivariate analysis. 6.ed. London: Academic, 1997. 518p.
  • MASCIOLI, A.S.; El FARO, L.; ALENCAR, M.M. et al. Estimativas de parâmetros genéticos e fenotípicos e análise de componentes principais para características de crescimento na raça Canchim. Rev. Bras. Zootec., v.29, p.1654-1660, 2000.
  • MORRISON, DF. Multivariate statistical methods 2.ed. Singapore: McGraw Hill, 1976. 415p.
  • PEARSON, K. On lines and planes of closest fit to system of point in space. Philosophical Magazine, 1901. Disponível em <http://pbil.univ-lyon1.fr/R/pearson190.pdf/>. Acessado em: 6 mai. 2006.
  • REGAZZI, A.J. Análise multivariada. Viçosa: UFV, 2002. (Notas de aula -INF-766).
  • ROSO, V.M.; FRIES, L.A. Componentes principais em bovinos da raça Polled Hereford à desmama e sobreano. Rev. Soc. Bras. Zootec., v.24, p.728-735, 1995.
  • STRAPASSON, E; VENCOVSKY, R; BATISTA, L.A.R. Seleção de descritores na caracterização de germoplasma de Paspalum sp. por meio de componentes principais. Rev. Bras. Zootec., v.29, p.373-381, 2000.
  • *
    Autor para correspondência (
    corresponding author)
    E-mail:
  • Datas de Publicação

    • Publicação nesta coleção
      12 Maio 2009
    • Data do Fascículo
      Fev 2009

    Histórico

    • Recebido
      23 Jun 2008
    • Aceito
      27 Jan 2009
    Universidade Federal de Minas Gerais, Escola de Veterinária Caixa Postal 567, 30123-970 Belo Horizonte MG - Brazil, Tel.: (55 31) 3409-2041, Tel.: (55 31) 3409-2042 - Belo Horizonte - MG - Brazil
    E-mail: abmvz.artigo@gmail.com