Seleção de características morfofuncionais de cavalos da raça Mangalarga Marchador por meio da análise de componentes principais

Identification of morphofunctional traits in Mangalarga Marchador horse using principal component analysis

Resumos

Dados de 14.288 animais da raça Mangalarga Marchador, nascidos de 1990 a 2005, foram utilizados para avaliar a redução da dimensionalidade do espaço multivariado para características morfofuncionais, por meio da análise de componentes principais. Foram consideradas as características: altura na cernelha, altura na garupa, comprimento da cabeça, comprimento do pescoço, comprimento do dorso, comprimento da garupa, comprimento da espádua, comprimento do corpo, largura da cabeça, largura das ancas, perímetro do tórax, perímetro da canela e a pontuação da marcha. Para tais características, obtiveram-se sete componentes principais, a partir da matriz de correlação, que apresentaram variância inferior a 0,7 (autovalor inferior a 0,7). Isso sugere sete variáveis para descarte, por apresentarem maiores coeficientes de ponderação, em valor absoluto, a partir do último componente principal. A razão para isso é que variáveis altamente correlacionadas com os componentes de menor variância representam variação praticamente insignificante. Com base nesses resultados, recomendam-se as seguintes características para serem mantidas em trabalhos futuros com esta base de dados: pontuação da marcha, altura na garupa, comprimento do dorso, comprimento da garupa, largura da cabeça e perímetro da canela.

análise multivariada; andamento; descarte de variáveis; equino; medidas lineares


Records from 14,288 animals of the Mangalarga Marchador breed, born from 1990 to 2005, were used to discard morphofunctional traits in a principal component analysis. The following traits were used: height at withers, height at croup, lengths of head, neck, back, croup, hip length and body, widths of head, hip width, thorax perimeter, cannon bone circumference and gait score. For the traits considered it was observed that 7 principal components showed variation lower than 0.7; suggesting that seven variables could be discarded. The reason is that when variable are highly correlated with the principal components of smaller variance, their variation is practically insignificant. Based on those results the recommendation is to maintain the following traits for future research with this database: gait score, height at croup, length of back, length of croup, width of head and cannon bone circumference.

discard of variables; equine; gait; multivariate analysis; linear measures


ANIMAL SCIENCE AND TECHNOLOGY AND INSPECTION OF ANIMAL PRODUCTS ZOOTECNIA E TECNOLOGIA E INSPEÇÃO DE PRODUTOS DE ORIGEM ANIMAL

Seleção de características morfofuncionais de cavalos da raça Mangalarga Marchador por meio da análise de componentes principais

Identification of morphofunctional traits in Mangalarga Marchador horse using principal component analysis

C.T. MeiraI; I.G. PereiraII, * * Autor para correspondência ( corresponding author) E-mail: idalmogp@vet.ufmg.br ; M.M. FarahI; A.V. PiresIII; D.A. GarciaI; V.A.R. CruzI

IDoutorando - Faculdade de Ciências Agrárias e Veterinárias - Unesp - Jaboticabal, SP

IIEscola de Veterinária - Universidade Federal de Minas Gerais - Belo Horizonte, MG

IIIFaculdade de Ciências Agrárias - UFVJM - Diamantina, MG

RESUMO

Dados de 14.288 animais da raça Mangalarga Marchador, nascidos de 1990 a 2005, foram utilizados para avaliar a redução da dimensionalidade do espaço multivariado para características morfofuncionais, por meio da análise de componentes principais. Foram consideradas as características: altura na cernelha, altura na garupa, comprimento da cabeça, comprimento do pescoço, comprimento do dorso, comprimento da garupa, comprimento da espádua, comprimento do corpo, largura da cabeça, largura das ancas, perímetro do tórax, perímetro da canela e a pontuação da marcha. Para tais características, obtiveram-se sete componentes principais, a partir da matriz de correlação, que apresentaram variância inferior a 0,7 (autovalor inferior a 0,7). Isso sugere sete variáveis para descarte, por apresentarem maiores coeficientes de ponderação, em valor absoluto, a partir do último componente principal. A razão para isso é que variáveis altamente correlacionadas com os componentes de menor variância representam variação praticamente insignificante. Com base nesses resultados, recomendam-se as seguintes características para serem mantidas em trabalhos futuros com esta base de dados: pontuação da marcha, altura na garupa, comprimento do dorso, comprimento da garupa, largura da cabeça e perímetro da canela.

Palavras-chave: análise multivariada, andamento, descarte de variáveis, equino, medidas lineares

ABSTRACT

Records from 14,288 animals of the Mangalarga Marchador breed, born from 1990 to 2005, were used to discard morphofunctional traits in a principal component analysis. The following traits were used: height at withers, height at croup, lengths of head, neck, back, croup, hip length and body, widths of head, hip width, thorax perimeter, cannon bone circumference and gait score. For the traits considered it was observed that 7 principal components showed variation lower than 0.7; suggesting that seven variables could be discarded. The reason is that when variable are highly correlated with the principal components of smaller variance, their variation is practically insignificant. Based on those results the recommendation is to maintain the following traits for future research with this database: gait score, height at croup, length of back, length of croup, width of head and cannon bone circumference.

Keywords: discard of variables, equine, gait, multivariate analysis, linear measures

INTRODUÇÃO

Em equinos, a caracterização morfológica está intrinsecamente relacionada ao seu valor econômico, pois as medidas morfométricas podem influenciar no desempenho dos animais. Para o registro do Mangalarga Marchador na Associação Brasileira dos Criadores do Cavalo Mangalarga Marchador (ABCCMM), são avaliadas as medidas morfométricas e a pontuação da marcha, em que os animais devem obter as pontuações mínimas de expressão/caracterização e andamento para serem registrados em definitivo. Porém, para fins de seleção, é possível identificar aquelas características que realmente contribuem para a discriminação dos indivíduos.

Para tanto, a análise de componentes principais (ACP) tem sido útil na elucidação das relações estruturais entre as medidas corporais dos animais e no descarte de variáveis, possibilitando, segundo Regazzi (2002), eliminar informações redundantes em decorrência da correlação com outras variáveis presentes na análise.

Segundo Morrison (2005), cada variável original está associada ao componente principal por meio de um vetor característico, cujo valor absoluto determina a importância da característica naquele componente principal. Dessa forma, é possível identificar quais variáveis originais são passíveis de descarte, o que se faz eliminando as características associadas aos maiores coeficientes nos últimos componentes, ou seja, naqueles que explicam percentuais muito reduzidos da variância total.

Assim, de acordo com Jolliffe (1972, 1973), o número de variáveis descartadas deve ser igual ao número de componentes cuja variância (autovalor) é inferior a 0,7. Com isso, é possível eliminar variáveis redundantes que, além de serem pouco informativas, promovem acréscimo no trabalho de avaliação e não apresentam informação adicional, o que não implica uma perda significativa de informação.

Métodos de análise multivariada para o acompanhamento de resultados com experimentos genéticos em morfologia, segundo Barbosa (1993), permitem definir variáveis adequadas para o estudo de variação genética, facilitando a compreensão dos resultados dos diversos sistemas de acasalamentos e a proposição de índices de seleção.

Objetivou-se com este estudo reduzir a dimensionalidade de um conjunto de características morfofuncionais de cavalos da raça Mangalarga Marchador, por meio da análise de componentes principais, eliminando as informações de variáveis redundantes.

MATERIAL E MÉTODOS

Os dados analisados são provenientes do Serviço de Registro Genealógico da ABCCMM, compostos de 12 características lineares e pontuação da marcha. Após consistência dos dados, eliminando-se mensurações incorretas e/ou informações incompletas, avaliou-se um total de 14.288 animais nascidos entre os anos de 1990 a 2005.

As características estudadas foram: altura na cernelha (distância vertical entre o processo espinhoso da quarta vértebra torácica e o solo), altura na garupa (distância vertical entre a tuberosidade sacral do ílio e o solo), comprimento da cabeça (distância entre o vértice da cabeça e a ponta do focinho), comprimento do pescoço (distância entre a nuca, osso atlas, e o terço médio do osso da escápula), comprimento do dorso (distância entre a base da cernelha e a tuberosidade sacral do ílio), comprimento da garupa (distância entre as partes cranial da tuberosidade ilíaca e a caudal da tuberosidade isquiática), comprimento da espádua (distância entre a articulação escapuloumeral e a cartilagem escapular), comprimento do corpo (distância entre a articulação escapuloumeral e a tuberosidade isquiática), largura da cabeça (distância entre as faces externas das arcadas orbitárias), largura das ancas (distância entre a tuberosidade coxal dos ossos ilíacos), perímetro do tórax (medida do diâmetro obtido sobre os processos espinhosos da oitava e nona vértebras torácicas), perímetro da canela (medida do diâmetro no terço médio do osso metacarpiano) e a pontuação da marcha.

Os animais foram submetidos a exame zootécnico a partir dos 36 meses de idade, do qual constou a mensuração e avaliação quanto à morfologia e andamento, de acordo com a determinação do Padrão Racial. Segundo esse padrão aprovado pelo conselho deliberativo técnico da ABCCMM e pelo Ministério da Agricultura Pecuária e Abastecimento, para fins de registro definitivo na associação, o animal deverá obter, no mínimo, 50% dos pontos de expressão/caracterização e de andamento.

O andamento marchado foi analisado visualmente e com o cavaleiro quanto aos quesitos: gesto, rendimento, diagrama, estilo e comodidade; sendo a pontuação dada como um todo, e não especificamente para cada quesito. Porém, como houve mudanças nas proporções da pontuação da marcha e morfologia ao longo dos anos, foi feito um ajuste nas pontuações de marcha para colocá-las todas em uma única escala (0 a 100 pontos). Já as medidas morfométricas foram obtidas por meio de mensurações.

Para obtenção dos componentes principais utilizou-se o procedimento PRINCOMP do programa SAS (Statistical..., 2002), no qual o ponto de partida foi a matriz de correlação, em que as variáveis são padronizadas para média zero e variância igual a um. Optou-se pela utilização de uma matriz de correlação em vez de uma matriz de covariância para amenizar possíveis discrepâncias acentuadas entre as variâncias e permitir as comparações entre os autovetores em um componente. A solução, utilizando-se a matriz de correlação, é recomendada quando as variáveis são medidas em escalas muito diferentes entre si, pois essa matriz é equivalente à matriz das variáveis padronizadas (Johnson e Wichern, 1998), visto que as características lineares analisadas constam de avaliações métricas e a marcha por tabela de pontuação subjetiva.

A técnica de componentes principais, a partir da matriz de correlação, consiste em transformar um conjunto de p variáveis X1, X2,...., Xp em um novo conjunto Y1, Y2,...., Yp, em que os Y's apresentam as seguintes propriedades:

I. Cada componente principal (Yi) é uma combinação linear das variáveis padronizadas (Xj), ou seja:

onde aij são os autovetores, com i = 1, 2,.....,p e

II. O primeiro componente principal, Y1, é tal que sua variância é máxima entre todas as combinações lineares de X. O segundo componente principal é não correlacionado com o primeiro e possui a segunda maior variância. Da mesma forma, definam-se os outros p componentes principais não correlacionados entre si, ou seja:

Var(Y1) ≥ Var(Y2) ≥.......≥ Var(Yp)

III. A cada componente principal Yi existem p autovalores (λ) ordenados de forma que λ1≥ λ2≥ ..... ≥ λp.

IV. As combinações lineares formadas são não correlacionadas:

Cov(Y1,Y2) = Cov(Y1, Y3) = .... = Cov(Yp-1, Yp) = 0

A importância relativa de um componente principal foi avaliada pela porcentagem de variância total que ele explica, ou seja, a porcentagem de seu autovalor em relação ao total dos autovalores de todos os componentes, que é dado por:

O critério para descarte de variáveis utilizado foi baseado nas recomendações de Jolliffe (1972, 1973), que sugere que o número de variáveis descartadas deve ser igual ao número de componentes principais cuja variância (autovalor) é inferior a 0,7; e na sugestão de Regazzi (2002), o qual considera que a variável que apresentar o maior coeficiente em valor absoluto no componente principal de menor autovalor (menor variância) deverá ser menos importante para explicar a variância total e, portanto, passível de descarte. Assim, o processo de descarte consistiu em considerar o componente correspondente ao menor autovalor e rejeitar a variável associada ao maior coeficiente de ponderação (em valor absoluto). Então, o próximo menor componente foi avaliado. Esse processo continuou até que o componente associado ao autovalor inferior a 0,7 fosse considerado. A razão para isso é que variáveis altamente correlacionadas aos componentes principais de menor variância representam variação praticamente insignificante.

RESULTADOS E DISCUSSÃO

Os seis primeiros componentes principais explicaram 78,57% da variação total dos dados, sendo os primeiros componentes associados aos maiores autovalores, retendo, assim, maior variância dos dados.

Conforme pode ser observado na Tabela 1, sete componentes apresentaram autovalores menores que 0,7. De acordo com o critério de Jolliffe (1972, 1973), sete variáveis podem ser descartadas, pois, além de o número de componentes que apresentaram autovalores menores que 0,7 ser sete, essas variáveis estão associadas a componentes de menor importância relativa e que explicam pouco da variabilidade dos dados. A baixa variabilidade de algumas características indica que elas contribuem pouco para a discriminação entre os indivíduos.

Assim, as sete variáveis que apresentaram maiores coeficientes de ponderação, em valor absoluto, a partir do último componente principal em direção ao primeiro, foram descartadas, conforme apresentado na Tabela 2. Como o perímetro do tórax já havia sido descartado no componente principal 11 (CP11), optou-se por descartar, no componente principal 10 (CP10), a segunda característica associada ao maior coeficiente de ponderação. As variáveis sugeridas para descarte foram, respectivamente, em ordem de menor importância para explicar a variação total: altura na cernelha (AC), comprimento do corpo (CC), perímetro do tórax (PT), comprimento da espádua (CE), comprimento do pescoço (CPe), comprimento da cabeça (CCa) e largura das ancas (LA). Isso porque, além de estarem associadas a componentes que explicam muito pouco da variabilidade dos dados, apresentaram correlação linear simples significativas com as demais, fornecendo pouca ou nenhuma informação adicional e se caracterizando, assim, pela redundância (Tab. 3). Verifica-se, por exemplo, que a altura na cernelha (variável sugerida para descarte) é altamente correlacionada com a altura na garupa (0,9178); assim como o comprimento do corpo apresenta correlação alta com altura na garupa (0,7062). Esse comportamento pode ser observado para as demais características passíveis de descarte.

Pinto et al. (2005) avaliaram medidas morfométricas de potros da raça Mangalarga Marchador por meio da análise de componentes principais. Foram efetuadas 25 mensurações lineares e 11 mensurações angulares em potros e potras recém-nascidos, aos seis meses e aos 12 meses de idade. Os autores concluíram que a análise de componentes principais foi eficiente em reduzir o número de medidas morfométricas nas diferentes idades estudadas, pois não apresentaram variação importante para a discriminação dos animais, ou estão fortemente correlacionadas com alguma das outras variáveis, o que as tornam redundantes.

Os resultados de Yamaki et al. (2009) para características de produção de aves de três linhagens fêmeas de corte, mesmo sendo com espécie diferente do presente estudo, se assemelham. Dos doze componentes principais, sete apresentaram variância (autovalor) menor que 0,7, descartando, assim, sete variáveis que apresentaram redundância com as demais.

Já as características recomendadas para trabalhos futuros foram: pontuação da marcha (PM), altura na garupa (AG), comprimento do dorso (CD), comprimento da garupa (CG), largura da cabeça (LC) e perímetro da canela (PC). Pode-se observar, pela Tabela 3, que essas variáveis apresentaram menores correlações entre si.

Para que um animal possa ser registrado na ABCCMM, ele deverá obedecer a um padrão racial do qual constam avaliações do seu exterior a partir de mensurações de características morfométricas e ainda avaliação do seu andamento segundo tabela de pontuação. Levando-se em conta que algumas características apresentam mútuas correlações, a análise de componentes principais tem se mostrado uma ferramenta útil para concentrar informações disponíveis em um número reduzido de conjunto. Assim, essa análise foi usada no sentido de reduzir o número de mensurações (características) obrigatórias a serem avaliadas no momento de registro do animal. Porém, o descarte da característica altura na cernelha só será recomendado para trabalhos de pesquisas, por exemplo, pois essa característica, para a ABCCMM, é de importância para fins de registro, sendo que uma altura fora dos padrões ideais (medidas já pré-estabelecidas) é ponto de desclassificação para o registro genealógico definitivo dos animais. A estatística de componentes principais permite identificar as características a serem eliminadas, mas a escolha de qual ou quais características podem ser eliminadas cabe a uma decisão técnica. Os resultados dos componentes principais apenas indicam as características que são redundantes.

Barbosa (1993) utilizou três métodos de análise multivariada - dentre eles a análise de componentes principais - para avaliar a importância das medidas lineares entre animais campeões e não campeões da raça Mangalarga Marchador. As variáveis puderam ser reduzidas de doze para sete, sendo semelhante ao resultado encontrado no presente estudo. No caso de machos não campeões, eliminaram-se as seguintes variáveis: altura na cernelha, comprimento do corpo, comprimento da garupa, perímetro do tórax e comprimento da espádua. Para machos campeões, as variáveis descartadas foram: altura na cernelha, comprimento da garupa, comprimento da espádua, largura das ancas e perímetro da canela.

A aplicação dessa análise na espécie equina tem se mostrado eficiente em avaliar características que possam realmente discriminar os animais e usá-las em programas de seleção, o que também foi constatado por outros autores (Barbosa, 1993; Kashiwamura et al., 2001; Miserani et al., 2002; Pinto et al., 2005; Santos, 2006). Entretanto, para a escolha dos critérios de seleção a serem praticados na raça, deve-se estimar componentes de (co)variâncias genéticas para as características selecionadas. Ao conhecer a magnitude desses componentes pode-se, então, estabelecer os critérios de seleção de acordo com os objetivos da seleção. A análise de componentes principais proporcionou a identificação das características que apresentam maiores variações, que, portanto, podem responder melhor à seleção.

CONCLUSÕES

Tendo em vista os resultados obtidos, a análise de componentes principais se mostrou efetiva e permitiu o descarte de sete variáveis que apresentaram baixa variabilidade ou foram redundantes por estarem correlacionadas com as de maior importância. Assim, o menor número de variáveis necessárias para explicar a variação total resulta em economia de tempo e de recursos em futuros trabalhos que utilizarão essa mesma base de dados, sem perda significativa de informação.

AGRADECIMENTOS

À Associação Brasileira dos Criadores do Cavalo Mangalarga Marchador (ABCCMM) e a FAPEMIG pelo apoio financeiro.

Recebido em 4 de maio de 2013

Aceito em 13 de junho de 2013

  • BARBOSA, C.G. Estudo morfométrico na raça Mangalarga Marchador. Uma abordagem multivariada 1993. 76f. Dissertação (Mestrado em Zootecnia) - Universidade Federal de Minas Gerais, Belo Horizonte.
  • JOHNSON, R.A.; WICHERN, D.W. Applied multivariate statistical analysis Englewood Cliffs: Prentice Hall, 1998. 816p.
  • JOLLIFFE, I.T. Discarding variables in a principal component analysis. I: Artificial data. Appl. Stat, v.21, p.160-173, 1972.
  • JOLLIFFE, I.T. Discarding variables in a principal component analysis. II: Real data. Appl. Stat, v.22, p.21-31, 1973.
  • KASHIWAMURA, F.; AVGAANDORJ, A.; FURUMURA, K. Relationships among body size, conformation, and racing performance in Banei Draft racehorses. J. Equine Sci., v.12, p.1-7, 2001.
  • MISERANI, M.G.; McMANUS, C.; SANTOS, S.A. et al Avaliação de fatores que influem nas medidas lineares do cavalo Pantaneiro. Rev. Bras. Zootec., v.31, p.335-341, 2002.
  • MORRISON, D.F. Multivariate Statistical Methods Australia: Brooks/Cole Thomson Learning, 2005. 469p.
  • PINTO, L.F.B.; ALMEIDA, F.Q.; AZEVEDO, P.C.N. et al Análise multivariada das medidas morfométricas de potros da raça Mangalarga Marchador: Análise Fatorial. Rev. Bras. Zootec., v.34, p.613-626, 2005.
  • REGAZZI, A.J. Análise multivariada: notas de aula. Viçosa: UFV, 2002.
  • STATISTICAL Analysis Sistem - SAS, 2002. SAS Software: versão 9.0. SAS Institute Inc., Cary, NC, USA.
  • SANTOS, L.M. Morfologia e genética do cavalo Campolina. 2006. 48f. Dissertação (Mestrado em Genética) - Universidade Federal de Minas Gerais, Belo Horizonte:
  • YAMAKI, M.; MENEZES, G.R.O.; PAIVA, A.L.C. et al Estudo de características de produção de matrizes de corte por meio da análise de componentes principais. Arq. Bras. Med. Vet. Zootec., v.61, p.227-231, 2009.

Datas de Publicação

  • Publicação nesta coleção
    07 Jan 2014
  • Data do Fascículo
    Dez 2013

Histórico

  • Recebido
    04 Maio 2013
  • Aceito
    13 Jun 2013
Universidade Federal de Minas Gerais, Escola de Veterinária Caixa Postal 567, 30123-970 Belo Horizonte MG - Brazil, Tel.: (55 31) 3409-2041, Tel.: (55 31) 3409-2042 - Belo Horizonte - MG - Brazil
E-mail: abmvz.artigo@abmvz.org.br