INTRODUÇÃO:
A utilização da produção de leite no dia do controle (PLDC) em substituição à produção acumulada em até 305 dias tem sido proposta como critério de seleção. A utilização de test-day models (TDM) possibilita a inclusão de lactações incompletas, sem a necessidade de projeções, permitindo a realização de avaliações mais frequentes e, consequentemente, reduzindo o intervalo de geração (SWALVE, 1995). Entretanto, segundo BIGNARDI et al. (2010), a maior desvantagem dos TDM é a dificuldade computacional de analisar um elevado volume de dados, além da necessidade de estimar um número maior de parâmetros genéticos, uma vez que, utilizando modelo multi-característica completo, cada PLDC é considerada como uma característica distinta, aumentando linearmente o número de efeitos no modelo, de acordo com o número de controles considerados.
Com a finalidade de diminuir a demanda computacional no processo de estimação para avaliação de múltiplas características, as metodologias de componentes principais e análise de fatores têm sido propostas. Os primeiros a utilizarem a matriz de covariância com ranking reduzido para avaliação de múltiplas características entre países foram MADSEN et al. (2000). O método consistia em remover autovalores negativos, ou seja, não era um método real de redução de ranking. Posteriormente, THOMPSON et al. (2003) e KIRKPATRICK & MEYER (2004) sugeriram a estimação direta dos fatores e componentes principais, respectivamente.
Ambas as análises de fatores e de componentes principais têm como principal objetivo a redução da dimensionalidade. As diferenças entre as duas técnicas podem ser colocadas da seguinte maneira: na análise de fatores, as variáveis são expressas como combinações lineares dos fatores, enquanto que os componentes principais são funções lineares das variáveis; na análise de componentes principais, a ênfase é explicar a variância total; e, na análise de fatores, o objetivo é tentar explicar as covariâncias. A análise de componentes principais não requer pressuposições, enquanto que a análise de fatores requer várias pressuposições importantes ou fundamentais; os componentes principais são únicos, enquanto que os fatores estão sujeitos a uma rotação arbitrária e, se o número de fatores for alterado, os fatores também se alteram.
O objetivo neste trabalho foi comparar um modelo multi-característica padrão com modelos de análises de fatores e componentes principais para estimar parâmetros genéticos para a produção de leite no dia do controle de vacas da raça Holandesa
MATERIAL E MÉTODOS:
Os dados fornecidos pelo Serviço de Análises de Rebanhos Leiteiros da Universidade de Passo Fundo (SARLE/UPF) foram coletados entre os anos de 2007 e 2011. As produções de leite no dia do controle (PLDC) foram agrupadas em dez classes mensais de lactação, obtidas entre cinco e 305 dias após o parto (PLDC1 a PLDC10). O grupo de contemporâneas (GC) para as PLDC foi definido como rebanho-ano-estação do controle (1a estação: janeiro-março, 2a estação: abril a junho, 3a estação: julho a setembro e 4a estação: outubro a dezembro). Foram excluídas das análises as PLDC com mais ou menos três desvios padrão em relação à média dentro de cada GC e vacas com idade ao parto inferior a 22 e superior a 48 meses. O arquivo de trabalho constituiu-se de 4.616 registros mensais de PLDC provenientes de primeiras lactações de vacas da raça Holandesa, provenientes de 46 rebanhos (Tabela 1).
Tabela 1 : Número de controles (N), média e desvio-padrão (DP), período em dias e número de animais por grupo de contemporâneas (GC) para as características de produção de leite ao longo da lactação.

Foram realizadas análises considerando 11 diferentes modelos, como segue: multi-característica padrão (MC); cinco modelos de posto reduzido, para a matriz de covariância genética, ajustando um (CP1), dois (CP2), três (CP3), quatro (CP4) e cinco (CP5) componentes principais; e cinco modelos utilizando análise de fatores (F1, F2, F3, F4 e F5). Em todos os modelos, foram considerados os efeitos aleatórios genético aditivo e residual. Foram considerados os efeitos fixos de grupo de contemporâneos, idade da vaca ao parto (linear e quadrático) e dias em lactação (linear).
Para a análise envolvendo o modelo MC, foi utilizado o modelo linear misto: y= Xb + Zu + e, em que: y é o vetor de observações para as produções de leite no dia do controle (PLDC1 a PLDC10); b vetor de soluções para os efeitos fixos; u = vetor de soluções para os efeitos aleatórios genéticos aditivos; X e Z matrizes de incidência relacionando b e u, respectivamente, e e é o vetor do efeito aleatório residual.
Para as análises de componentes principais, o modelo MC foi reparametrizado, produzindo um modelo equivalente: y=Xb+Z*u*+e, em que: Z*=Z(INAÄQm) e u*=(INAÄQ´m)u, com Var(u*)=AÄIm e Qm=Em(Lm)1/2, em que NA é o número de animais incluído na análise; m é o número de componentes principais ajustados; E é a matriz (K x m) dos primeiros m autovetores da matriz de (co)variâncias para o efeito genético aditivo (SA), k é o número de características na análise e L é a matriz diagonal de autovalores de SA.
Para análise de Fatores (AF), o modelo MC foi decomposto, como segue: y=Xb+Z*c+Zs+e, em que: Z*=Z(INAÄGm), com Var(c)=ImÄA e Var(s)=YÄA, sendo que G é a matriz de cargas fatoriais (ordem k x m); Y é a matriz diagonal (ordem k) das variâncias dos fatores específicos (s); c é o vetor de fatores comuns de tamanho mNA; s o vetor de fatores específicos de tamanho km, e m é o número de fatores comuns ajustados.
As equações de modelos mistos para as análises de componentes principais e análises de fatores foram descritas por MEYER & KIRKPATRICK (2005) e MEYER (2009). Os componentes de (co)variâncias foram estimados pelo método da máxima verossimilhança restrita (REML), utilizando o programa Wombat (MEYER, 2006).
Os modelos foram comparados pelo logaritmo da função de verossimilhança (log L), critério de informação de Akaike (AIC), AKAIKE (1973) e critério de informação Bayesiano (BIC), SCHWARZ (1978) e análise gráfica dos parâmetros genéticos estimados. O AIC e o BIC permitem a comparação entre os modelos não hierárquicos e penalizam aqueles com maior número de parâmetros, como segue: AIC= -2log L + 2p e BIC= -2log L + p log (N - r), em que: p = número de parâmetros do modelo, N = número total de observações, r = posto da matriz de incidência dos efeitos fixos no modelo e log L = logaritmo da função de máxima verossimilhança restrita.
RESULTADOS E DISCUSSÃO:
Os valores dos critérios estatísticos para escolha de modelos, Log L, AIC e BIC, apresentados na tabela 2, aumentaram com o aumento do número de parâmetros até o CP4 e AF4, decrescendo para os modelos CP5 e AF5, indicando que o modelo de componentes principais CP4 e o modelo de análise de fatores AF4 foram mais eficientes. Ao comparar o modelo CP4 com o AF4, observa-se que o primeiro resultou em melhores valores de Log L, AIC e BIC. O modelo CP4 estimou 21 parâmetros a menos que o MC e 10 a menos que o AF4, o que diminui a demanda computacional. De acordo com MEYER (2007), quando se utiliza um número reduzido de componentes principais, uma pequena parte da variação genética não é particionada, sendo incluída no componente residual. Por outro lado, nos modelos de fatores, grande parte dessa variação é incorporada nas variâncias específicas.
Tabela 2 : Número de parâmetros (np), função de verossimilhança (LogL), critério de informação de Akaike (AIC), critério de informação Bayesiano de Schwarz (BIC) e proporção da variância genética aditiva (λ, em %), explicada pelos três primeiros autovalores para os modelos de posto completo (MC) e posto reduzido (CPn e AFn) e valores de LogL, AIC e BIC como desvios em relação ao modelo multi-característica de posto completo.

1CPn = modelo ajustando n componentes principais; MC= modelo multi-característica de posto completo; AFn = modelo de análise de fatores com n fatores. Valores em negrito indicam o melhor modelo, com base em AIC e BIC.
O número de componentes principais indicado neste trabalho foi superior ao relatado por BIGNARDI et al. (2010) e PEREIRA et al. (2013) para a raça Gir e BIGNARDI et al. (2012) para a raça Holandesa. Esses autores relataram que apenas dois componentes principais foram suficientes para modelar a estrutura de covariâncias genéticas entre as produções de leite no dia do controle.
A soma dos três primeiros autovalores, referentes à matriz de covariância genética aditiva, obtidos pelo modelo MC, explicaram 95,74% da variação genética total entre os animais (l1=61,72; l2=19,57; l3=14,45). Resultado semelhante foi observado para o modelo CP4 (Tabela 2), sendo os três primeiros autovalores responsáveis por explicar 95,90% da variação genética total (l1=61,74; l2=19,50; l3=14,60). MARDIA et al. (1997) sugeriram que os primeiros componentes principais devem explicar, pelo menos, 90% da variação total.
As variâncias genéticas aditivas, residuais e herdabilidades foram praticamente iguais para MC, CP4 e AF4 (Tabela 3). As estimativas de variância genética das PLDC obtidas para o modelo MC foram levemente inferiores às obtidas pelos modelos CP4 e AF4, para quase todo período da lactação (Tabela 3), sendo as maiores estimativas obtidas para PL1 (15,38) e PL10 (20,97). Ao contrário do observado para as variâncias genéticas, a menor estimativa de variância residual foi observada no final da lactação (PL10). A magnitude das estimativas das variâncias residuais para a maioria dos controles mensais de produção sugere a existência de grandes diferenças de meio ambiente entre os rebanhos incluídos no estudo, principalmente na primeira metade da lactação (até PL6).
Tabela 3 : Estimativas de componentes de variância e de coeficientes de herdabilidade pelo modelo multi-característica (MC), modelo ajustando os quatro primeiros componentes principais (CP4) e modelo ajustando quatro fatores (AF4), para produção de leite no mês do controle (PL1, ..., PL10).

As herdabilidades estimadas para as dez produções de leite no dia do controle, utilizando os modelos MC, CP4 e AF4, foram similares e variaram de 0,06 (PL6) a 0,65 (PL10), com erro padrão variando de 0,002 a 0,06, sendo os maiores erros observados nas PLs 9 e 10, provavelmente, devido ao menor número de observações verificado nestes meses de produção (Tabela 1). Nos três modelos, as estimativas de herdabilidade foram altas nas extremidades da curva (Tabela 3). Estes resultados não concordam com o relatado por VAN VLECK & HENDERSON (1961), os quais afirmaram que os primeiros e os últimos meses da lactação são mais sujeitos às variações temporárias de meio ambiente e que as produções do meio da lactação são mais influenciadas pelas diferenças genéticas e permanentes de meio, existentes entre as vacas. A alta herdabilidade estimada para o PL10 pode ser devida também ao menor número de observações disponíveis para esse controle, o que pode ter superestimado a variância genética aditiva presente na população para esta característica. Estimativas discordantes das obtidas neste estudo foram relatadas por BIGNARDI et al. (2008), os quais encontraram estimativas das herdabilidades para as PLDC, por análises unicaracterística, entre 0,07 e 0,19, sendo o maior valor obtido para o terceiro controle.
As estimativas de correlações genéticas obtidas pelo MC foram iguais às obtidas pelo CP4 e AF4 e variaram de 0,05 a 0,94, sendo menores que as relatadas por MELO et al. (2005), que variaram de 0,64 a 1,00. As estimativas de correlações fenotípicas entre os controles mensais de lactação foram positivas e variaram de 0,17 a 0,71, semelhantes às encontradas por BIGNARDI et al. (2008) que estimaram valores variando de 0,17 a 0,68, para a mesma raça.
CONCLUSÃO:
A estrutura de covariâncias genéticas entre as produções de leite no dia do controle pode ser ajustada utilizando um modelo de posto reduzido, contendo quatro componentes principais ou quatro fatores, pois diminui consideravelmente o número de parâmetros a serem estimados, sendo uma opção a ser adotada nas avaliações genéticas.