Resumos
Este artigo apresenta um método adaptado do estudo de repetitividade e reprodutividade (R& R) para analisar a capacidade e o desempenho de sistemas de medição, no contexto da análise de dados funcionais. Dados funcionais ocorrem quando a variável de resposta é caracterizada por uma coleção de dados que formam um perfil ou uma curva, e não por uma observação individual. O método proposto é uma alternativa ao uso de métodos tradicionais de análise, que são ineficientes para dados funcionais. O método apresenta uma adaptação da análise de variância de dois fatores. Foi usada a distância de Hausdorff como medida de proximidade entre as curvas. O método proposto foi aplicado a um estudo simulado de R& R. O estudo foi estruturado para analisar cenários em que o sistema de medição foi aprovado e reprovado. Os resultados foram comparados com os obtidos através da aplicação da ANOVA ponto a ponto nas curvas. O método proposto foi denominado de ANOVA das distâncias.
Análise de dados funcionais; Sistemas de medição; Estudos de R& R; ANOVA; ANOVA funcional
This paper presents a method to analyze the performance of measurement systems in a functional data analysis context, based on repeatability and reproducibility (R& R) studies. Functional data are a collection of data points organized as a profile or curve. The method is an alternative to traditional methods that may lead to wrong conclusions when applied to functional data. In the proposed method, hypothesis tests and two-way ANOVA were adapted to be used in measurement system analysis. The method is grounded on the use of the Hausdorff distance to measure the proximity between curves. The method proposed was applied in a simulated repeatability and reproducibility study. The study was structured such that scenarios in which the measurement system was approved and rejected were tested. Results were compared with those obtained applying traditional ANOVA point wise on the curves. The method proposed was named ANOVA of the distances.
Functional data analysis; Measurement systems; R& R studies; ANOVA; Functional ANOVA
Estudos de repetitividade e reprodutividade para dados funcionais
Repeatability and reproducibility studies of functional data
Alexandre Homsi PedottI,* * UFRGS, Porto Alegre, RS, Brasil ; Flávio Sanson FogliattoII
IUFRGS, Brasil, pedott@producao.ufrgs.br
IIUFRGS, Brasil, ffogliatto@producao.ufrgs.br
RESUMO
Este artigo apresenta um método adaptado do estudo de repetitividade e reprodutividade (R&R) para analisar a capacidade e o desempenho de sistemas de medição, no contexto da análise de dados funcionais. Dados funcionais ocorrem quando a variável de resposta é caracterizada por uma coleção de dados que formam um perfil ou uma curva, e não por uma observação individual. O método proposto é uma alternativa ao uso de métodos tradicionais de análise, que são ineficientes para dados funcionais. O método apresenta uma adaptação da análise de variância de dois fatores. Foi usada a distância de Hausdorff como medida de proximidade entre as curvas. O método proposto foi aplicado a um estudo simulado de R&R. O estudo foi estruturado para analisar cenários em que o sistema de medição foi aprovado e reprovado. Os resultados foram comparados com os obtidos através da aplicação da ANOVA ponto a ponto nas curvas. O método proposto foi denominado de ANOVA das distâncias.
Palavras-chave: Análise de dados funcionais. Sistemas de medição. Estudos de R&R. ANOVA. ANOVA funcional.
ABSTRACT
This paper presents a method to analyze the performance of measurement systems in a functional data analysis context, based on repeatability and reproducibility (R&R) studies. Functional data are a collection of data points organized as a profile or curve. The method is an alternative to traditional methods that may lead to wrong conclusions when applied to functional data. In the proposed method, hypothesis tests and two-way ANOVA were adapted to be used in measurement system analysis. The method is grounded on the use of the Hausdorff distance to measure the proximity between curves. The method proposed was applied in a simulated repeatability and reproducibility study. The study was structured such that scenarios in which the measurement system was approved and rejected were tested. Results were compared with those obtained applying traditional ANOVA point wise on the curves. The method proposed was named ANOVA of the distances.
Keywords: Functional data analysis. Measurement systems. R&R studies. ANOVA. Functional ANOVA.
1. Introdução
A análise de dados funcionais (ADF) configura-se como necessidade crescente para a Engenharia da Qualidade (EQ). A ausência de técnicas adaptadas para dados funcionais leva à utilização de métodos equivocados na otimização de produtos e processos por eles caracterizados. O emprego de métodos desenvolvidos para variáveis de respostas com valor único pode deteriorar a confiabilidade de um produto ou processo cuja otimização envolva respostas funcionais (FOGLIATTO, 2008).
A avaliação do desempenho e da capacidade de um sistema de medição (SM) envolve a análise de diferentes tipos de características de qualidade (CQs). Existem CQs para as quais o resultado da amostragem da variável de interesse é representado por uma coleção de dados que pertencem a um perfil ou uma curva. A partir desses pontos é possível estimar os parâmetros que descrevem a curva. O conteúdo informativo de uma curva é maior do que o de um ponto individual. Os valores discretos medidos são pontos de uma função dependente de outra variável, denominada indexadora. Ramsay e Silverman (2005) denominam coleções de dados dependentes de variáveis indexadoras de dados funcionais. A função que representa o conjunto de dados pode ser obtida através de um processo de interpolação, utilizando técnicas de suavização.
O estudo de repetitividade & reprodutividade (R&R) é uma ferramenta da EQ usada na análise de SMs. Nos estudos de R&R, o instrumento de medição é usado para medir repetidas vezes as amostras de um produto. A repetitividade se refere à variabilidade característica do instrumento de medição, e decorre da sua capacidade de fornecer leituras repetidas muito próximas, sob as mesmas condições. A reprodutibilidade se refere à capacidade de um SM apresentar os mesmos resultados a partir da alteração nas condições de medição, tais como mudanças de avaliadores, diferentes turnos de trabalho, ou alterações de processo. O objetivo do estudo de R&R é determinar se a variabilidade do SM é relativamente menor que a variabilidade do processo monitorado (INTERNATIONAL2008; BURDICK; BORROR; MONTGOMERY, 2003; AUTOMOTIVE... , 2002).
O método de análise mais usado em estudos de R&R é a análise de variância (ANOVA - Analysis of Variance). A ANOVA permite decompor a variabilidade do SM e avaliar a interação entre suas componentes. A estimativa da variabilidade do sistema é obtida a partir da variância do erro aleatório, dado pelas replicações. O erro de medição é composto pela dispersão do instrumento, pelo efeito do avaliador e pelo erro aleatório devido às replicações. Os critérios mais usados para avaliar a capacidade de um SM são: (i) índice de capacidade de medição (ICM1), dado como um percentual de variabilidade do processo; (ii) índice de capacidade de medição (ICM2), dado como um percentual da variabilidade da especificação do processo; e (iii) razão sinal-ruído (SNR) ou número de categorias distintas (ndc). O ICM1 indica a distorção da variação do processo devida ao SM. O ICM2 representa a habilidade do instrumento de classificar os produtos frente às especificações. O ndc reflete a capacidade do SM de discriminar categorias, dentro da variação do processo. A indústria automotiva, por exemplo, recomenda o uso do ICM1 e o ndc nas avaliações dos sistemas de medições (BARRENTINE, 2003; BURDICK; BORROR; MONTGOMERY, 2005; AUTOMOTIVE..., 2002).
A maior parte das pesquisas recentes que envolvem estudos de R&R enfoca a análise de SMs, cuja variável de resposta é dada por um valor individual. Majeske (2008) apresenta um método de análise para SMs com múltiplas variáveis de respostas independentes. O método foi aplicado a um SM formado por um dispositivo que mede diferentes CQs, simultaneamente. O método envolve a aplicação da ANOVA multivariada (MANOVA) e apresenta critérios de aceitação para os indicadores ICM1, ICM2 e ndc. Tal método, entretanto, não pode ser usado no caso de dados funcionais.
Pesquisas recentes em ADF focalizam a representação dos dados, a determinação de comportamentos padronizados e as variações entre diferentes curvas. Ferraty e Vieu (2003) empregam o estimador de Kernel para classificar curvas a categorias existentes, em algo que pode ser visto como uma análise discriminante funcional. Ramsay e Silverman (2005) apresentam as adaptações de diferentes técnicas multivariadas, tais como análise de componentes principais e modelos lineares de suavização por Splines, para o contexto funcional. Abramovich e Angelini (2006) apresentam um modelo de análise de variância para dados funcionais (FANOVA -Funcional Analysis of Variance). O modelo estabelece um procedimento para teste de significância baseado nos coeficientes de wavelet empíricos, que permite caracterizar diferentes tipos de respostas funcionais suavizadas sob alternativas não paramétricas. Tal análise funcional ancorada em testes estatísticos sobre os coeficientes de modelos ajustados às curvas está em consonância com a proposta de Kang e Albin (2000), trabalho precursor no tratamento de dados funcionais no controle estatístico da qualidade.
O controle estatístico da qualidade de dados funcionais é denominado de monitoramento de perfil (MP). O MP é um campo de pesquisa relativamente novo, mas que cresce rapidamente. O MP é usado para avaliar a estabilidade das curvas ao longo do tempo. Entre as principais demandas estão a capacidade de detectar qualquer alteração na forma da função e a simplicidade do modelo do perfil (WOODALL, 2007).
Outra adaptação para a análise de variância de dados funcionais foi proposta por Cuevas, Febrero e Fraiman (2004). Trata-se de uma abordagem funcional pura, não havendo necessidade de discretizar os pontos das curvas para a análise dos dados. A proposta está baseada no comportamento assintótico do teste F clássico da ANOVA. A expressão para o cálculo de Fapresenta no numerador a variabilidade das curvas entre os grupos e no denominador a variabilidade das curvas dentro dos grupos. O método usa um teste baseado no numerador do teste F.
O objetivo deste trabalho é adaptar a ANOVA para avaliar um SM em que variáveis funcionais são mensuradas. Para tanto, utiliza-se uma abordagem baseada no cálculo de distâncias entre curvas. Através do uso dessas distâncias, variáveis funcionais são reduzidas a variáveis simples. A ANOVA das distâncias é então testada em duas abordagens. As abordagens se diferenciam pela forma de cálculo da distância entre as curvas. Dentre as medidas de distância entre curvas disponíveis na literatura, optou-se pelo uso da distância de Hausdorff, dada a sua generalidade (HUTTENLOCHER; KLANDERMAN; RUCKLIDGE, 1993).
O método proposto contribui de forma significativa para o aumento da eficiência de estudos de R&R, onde a variável de resposta é funcional. A adaptação baseada em distâncias proposta para a ANOVA na ADF representa uma evolução sobre a abordagem tradicional, devida a Ramsay e Silverman (2005). Nela, as curvas sob análise são discretizadas em pontos ancorados na variável indexadora (por exemplo, o tempo no qual a observação foi coletada) e a análise é desdobrada em ANOVAs individuais, cada uma incidindo sobre pontos coincidentes nas curvas (por exemplo, pontos nas diferentes curvas observados no mesmo instante de tempo). A menos que as ANOVAs individuais apresentem o mesmo resultado, não será possível concluir sobre a existência ou não de diferença significativa entre as curvas. Na abordagem aqui proposta um único resultado final será obtido e a conclusão sobre o desempenho do SM decorrerá diretamente desse resultado.
A seção seguinte apresenta uma revisão sobre o teste ANOVA para dois fatores e sua aplicação em estudos de R&R. Na seção 3 é apresentada a ANOVA das distâncias, desenvolvida para a análise de estudos de R&R para variáveis funcionais. Na seção 4 são apresentados os resultados da aplicação do método proposto a dados simulados baseados em um estudo de caso em uma indústria de fabricação de pneus. A discussão dos resultados e as conclusões são apresentadas na seção 5.
2. Abordagem clássica da ANOVA em um estudo de R&R
Um experimento clássico para o estudo de R&R usa a ANOVA de dois fatores. O primeiro fator é a peça (P) e o outro, o avaliador (A). O modelo estatístico para a variável de resposta é dado pela Equação 1. O modelo clássico considera fatores com efeitos fixos. O efeito é considerado fixo quando os níveis incluem todas as possibilidades do fator; isto é, todos os avaliadores que operam o sistema são incluídos e cada avaliador avalia as mesmas peças padronizadas (MONTGOMERY; RUNGER, 2003).
Na Equação 1, xijk é o valor da variável de resposta para a observação da k-ésima repetição feita pelo i-ésimo avaliador sobre a j-ésima peça, µ é a é o valor da média geral, τi é o efeito do i-ésimo avaliador, βj é o efeito da j-ésima peça, (τβ) é o efeito da interação entre o avaliador i e a peça j, e εijk é o resíduo ou erro aleatório, normalmente distribuído e com média zero. O resíduo é dado pela diferença entre os valores observados e esperados para a variável de resposta, conforme mostra o modelo matemático da Equação 2, onde xijk é o valor observado e representa o valor médio da variável de resposta da j-ésima peça medida pelo i-ésimo avaliador. A ANOVA pressupõe observações normalmente e independentemente distribuídas, com idêntica variância nos diferentes níveis dos fatores. Segundo Montgomery (2001) e Montgomery e Runger (2003), desvios moderados da normalidade não implicam em uma violação séria do pressuposto.
O objetivo da ANOVA é testar a hipótese de igualdade das médias ou dos efeitos dos fatores e da interação serem iguais a zero. As variâncias devem ser calculadas a partir das somas quadradas dos resíduos. A soma quadrática total (SQT) é dada na Equação 3. A soma quadrática dos avaliadores (SQA) é dada na Equação 4. A soma quadrática das peças (SQP) é dada na Equação 5. A soma quadrática da interação entre os avaliadores e as peças (SQAP) é dada na Equação 6. Por fim, a soma quadrática dos resíduos (SQR) é dada na Equação 7.
A identidade que relaciona a SQT às demais somas quadráticas é dada por:
com cada termo apresentando o seguinte número s de liberdade (GDL):
As médias quadráticas de cada fator são dadas pela razão entre as somas quadradas e os GDL dos respectivos fatores. Se o efeito de um fator for significativo, o valor esperado da média quadrática do fator deve ser diferente do valor esperado da média quadrática dos resíduos. A verificação da existência de diferença significativa entre o valor esperado para a média quadrática do fator e a média quadrática dos resíduos é feita pela aplicação do teste F. O teste F é aplicado para cada fator e interação do estudo. Em geral, a interação não deve ser significativa. Neste caso, é recomendável unificar as somas quadradas. A unificação consiste em somar SQAPà SQR; da mesma forma, deve-se somar os graus de liberdade para a nova formulação. A adição das somas quadradas e o novo número de graus de liberdade geram novos valores para as médias quadráticas e correspondentes valores calculados de F (MONTGOMERY; RUNGER, 2003).
AIAG (AUTOMOTIVE..., 2002) apresenta o cálculo da decomposição da variabilidade de um SM. A repetitividade ou variação do equipamento é denominada VE. A reprodutividade ou variação dos avaliadores é denominada VA. A variação do SM é avaliada pelo cálculo do R&R. A variação total do estudo é denominada de VT. VPé a variação da peça ou processo. A variabilidade de cada fator é comparada à variabilidade total do SM. A Tabela 1 apresenta o cálculo da percentagem que cada fator contribui para a variação total do sistema. As componentes da variação do SM são representadas pelo desvio padrão 5,15 sigma. O desvio padrão é usado porque é mais fácil interpretá-lo do que a variância. No caso da MQaA ser maior que a MQA a VA deve ser considerada nula. No caso da MQAP ser maior que a MQP a VPdeve ser considerada nula. No caso da MQRser maior que a MQAP a VAP deve ser considerada nula (AUTOMOTIVE... , 2002).
Os indicadores de capacidade dos sistemas de medição são calculados da seguinte forma:
A Tabela 2 apresenta critérios de decisão recomendados para avaliação de um SM (BARRENTINE, 2003; BURDICK; BORROR; MONTGOMERY, 2005; AUTOMOTIVE... , 2002).
3. ANOVA das distâncias
Considere um estudo clássico de R&R, conforme apresentado na seção 2. O problema consiste em avaliar o desempenho de um SM cuja característica de qualidade é uma variável funcional. Na abordagem clássica a variável de resposta é medida por um valor único, dado pela Equação 1. Na ADF, a variável de resposta é medida e o resultado é um conjunto de pontos, que pertencem a um perfil ou uma curva. A cada ponto desse conjunto existe um valor associado de uma variável indexadora, usualmente o tempo no qual o valor da variável de resposta foi observado. O conjunto de valores medidos associado à variável indexadora pode ser organizado em um vetor.
Sejam I avaliadores e J peças diferentes. Cada avaliador efetua K repetições da medição de uma CQ cuja variável de resposta é funcional. A variável de resposta é formada por conjuntos de N pontos, pertencentes a um perfil ou curva. As observações da k-ésima repetição do i-ésimo avaliador sobre a j-ésima peça estão organizadas no vetor xijk, no espaço 2.
onde i = 1,..., I, j = 1,..., J, k = 1,..., K e n = 1,..., N são inteiros e positivos, e t é um número real não negativo correspondendo ao valor da variável indexadora.
Considerando que a variável de resposta é uma curva, os resíduos usados nos cálculos da variância na ANOVA devem ser determinados através de uma medida de proximidade entre curvas; uma medida possível é dada pela distância entre elas. A distância entre duas curvas pode ser calculada através da distância entre pontos representativos das curvas. Fogliatto (2008) usou a distância de Hausdorff (DH) para converter respostas funcionais em respostas simples em um contexto de otimização de experimentos com múltiplas respostas. A DH fornece uma medida da distância entre duas curvas ou conjuntos de pontos diferentes. Quanto menor a distância, maior a semelhança entre os dois conjuntos. A DH é definida como o limite superior (valor máximo) do conjunto das distâncias mínimas entre os pontos de dois vetores. A definição de DH pode variar de acordo com os objetivos; por exemplo, o operador de máximo pode ser substituído pela mediana, ou pela soma das distâncias mínimas. Souza (2008) usou diferentes medidas de distâncias para testar se a curva média de um grupo de curvas é igual a uma curva previamente conhecida.
A ANOVA das distâncias aqui proposta se baseia no cálculo da DH entre curvas observadas e curvas médias. Uma curva média é definida pelo conjunto das médias dos pontos das curvas observadas.
As distâncias entre as curvas observadas [Equação 12] e as curvas médias das Equações 13 a 16 estão associadas às variabilidades características do SM. A ANOVA das distâncias será apresentada em duas abordagens. As abordagens se diferenciam pelo cálculo da distância entre as curvas. A primeira abordagem calcula a DH através da mediana. A segunda calcula a DH através da média. Por ser uma estatística robusta, o uso da mediana resulta em uma abordagem mais conservadora, se comparada à da média.
3.1. Abordagem das medianas
A partir da Equação 3 obtém-se a soma quadrática total (SQT) dada por:
onde dijk , obtida pela Equação 18, é a DH entre cada curva observada xijk em um determinado grupo e a curva da média geral . Essa distância é equivalente ao resíduo entre o valor observado e o valor da média geral (xijk - .
sendo a distância d (, xijk) correspondente à distância euclidiana entre um ponto do vetor e um ponto do vetor xijk; considerando-se os pontos 1 e 111 essa distância seria dada por:
A Equação 20 mostra que a distância euclidiana está na base do cálculo da DH. Esse cálculo, entretanto, faz com que se perca a informação da posição da curva observada em relação à curva média. Isto é, duas curvas diferentes podem ter a mesma DH, porém estarem em posições simétricas em relação à curva média. A alternativa para não perder essa informação é atribuir um sinal a cada distância calculada. O sinal será positivo se o valor da resposta do ponto for maior que o valor da curva média, no mesmo instante t, e negativo se menor. A informação do sinal deve ser usada para a verificação dos pressupostos de normalidade dos resíduos. Os resíduos sâo dados pelas distâncias entre as curvas observadas xijk e as curvas médias ij. Para uma melhor exatidão do teste F da ANOVA os valores dos resíduos devem apresentar distribuição normal e variância constante. Desvios moderados da suposição de normalidade não afetam significativamente o resultado do teste.
A Figura 1 apresenta um desenho esquemático das distâncias definidas pelas Equações 18 e 19. As retas tracejadas representam as distâncias de um ponto da curva média para cada ponto de uma curva individual. A menor distância foi representada pela reta de linha sólida. Um valor mínimo de distância deve ser associado a cada ponto da curva média. Esses dados formam o conjunto de N distâncias usadas no cálculo da mediana.
A soma quadrática dos avaliadores (SQA) é obtida a partir da Equação 4, sendo dada por:
onde () é a distância entre a curva média i... de cada avaliador e a curva da média geral dada por:
sendo a distância d
...ndefinida na Equação 20.Da Equação 5 se obtém a soma quadrática das peças (SQP), dada por:
onde () é a distância entre a curva média .j. de cada peça e a curva da média geral , dada por:
sendo a distância d(...n
.j.) definida na Equação 20.A soma quadrática para a interação entre os avaliadores e as peças (SQAP) corresponde à diferença das distâncias dadas pelas Equações 25 e 28, sendo dada por:
onde
j (i...) é a distância entre a curva média _ das K repetições e a curva média i... do respectivo avaliador i, dada por:
sendo a distância d(i...n, ij) definida pela Equação 20.
Por fim, a soma quadrática dos resíduos (SQR) é obtida a partir da Equação 7, sendo dada por:
onde dixijk (ij) é a distância entre cada curva observada xijk e a curva média ijk dos respectivos avaliador i e peça j, dada por:
sendo a distância d() definida pela Equação 20.
Existem duas alternativas para o cálculo de SQR. A primeira alternativa é usar diretamente a Equação 30. A segunda é usar a identidade associando a Equação 8 às Equações 17, 21, 24 e 27. As duas alternativas podem levar a resultados diferentes. A diferença ocorre porque o valor esperado usado na Equação 30 pode variar de curva para curva. Por exemplo, se a DH da observação x111 estiver associada ao tempo t = t (n = 1) da curva média 11 Kj e a DH da observação x112 estiver associada ao tempo t = t2(n = 2) da curva média 11 , os valores esperados de 11.n usados no cálculo da Equação 32 serão diferentes; isto é, 11.1 ≠ 11.2 . Essa diferença depende da variação ao longo de t.
A escolha da primeira alternativa pode levar a pequenos desvios na identidade da Equação 8. A escolha da segunda alternativa pode levar a uma pequena distorção no valor de SQR. A escolha da fórmula de cálculo do método deve levar em conta o impacto nos erros tipo I e II. O número de GDL deve ser calculado de acordo com a Equação 9. As médias quadráticas são dadas pela Equações 34 a 37.
Se o efeito de um fator for significativo, o valor esperado da média quadrática do fator deve ser diferente do valor esperado da média quadrática dos resíduos. A tabela da ANOVA para o modelo da Equação 1 é apresentada na Tabela 3. O teste F determina se os efeitos do avaliador, da peça e da interação são significativos. Se o valor calculado da estatística F (FCAL) for maior que o valor tabelado de F, deve-se rejeitar a hipótese nula. Caso o efeito da interação não seja significativo, a tabela da ANOVA deve ser reformulada para unificar a variância da interação à variância dos resíduos.
A Tabela 3 fornece as informações suficientes para avaliar o desempenho do SM. A avaliação é baseada no cálculo das percentagens que cada componente contribui para a variação total do SM. Tais percentagens são calculadas conforme apresentado na Tabela 1. A capacidade do SM deve ser avaliada pelos indicadores ICM1 e o ndc, descritos nas Equações 10 e 11. Os critérios de aprovação devem ser os mesmos apresentados na Tabela 2.
3.2. Abordagem da média
A distância dada pela mediana pode não apontar valores extremos em pontos específicos das curvas, o que poderia levar a uma interpretação equivocada dos resultados. Uma alternativa seria substituir o operador de mediana usado nas Equações 18, 22, 25, 28 e 31 pelo operador de média. Para diferenciar as distâncias calculadas nas duas abordagens, denota-se a distância calculada através da média por dªaijk() . O cálculo das somas quadráticas segue o mesmo procedimento da abordagem da mediana. A SQT, por exemplo, é dada pela Equação 37. Com isso, a tabela ANOVA para essa abordagem é similar àquela apresentada na Tabela 3. Os critérios de aprovação devem ser os mesmos apresentados na Tabela 2.
onde dªaijk() é a DH entre cada curva observada xijk em um determinado grupo e a curva da grande média , dada pela Equação 38.
sendo a distância d () definida pela Equação 20.
4. Aplicação prática
Esta seção apresenta o resultado da aplicação dos métodos propostos na seção 3 a um estudo de R&R. O estudo foi baseado no caso de um fabricante de pneus, que avalia a qualidade dos produtos através da viscosidade da borracha. A medição é feita em um reômetro de laboratório. O reômetro é um instrumento que permite medir as propriedades viscoelásticas da borracha. O instrumento fornece a curva reométrica de vulcanização da borracha como resultado. A partir da curva reométrica são obtidos os valores usuais para caracterização da borracha. Uma característica viscosa é dada pelo torque suportado por uma amostra de borracha em função do tempo. As medidas de torque são tomadas em diferentes instantes do tempo de vulcanização.
Com base em dados reais do fabricante de pneus, verificou-se que a curva de vulcanização da borracha segue o modelo de Weibull, apresentado na Equação 40. Os dados foram ajustados através de modelos de regressão não linear.
Nessa equação, X representa o torque, β0, β1β2 e β3 são os coeficientes experimentais do modelo e t o tempo em minutos. A partir desse modelo, é possível determinar o valor do torque em qualquer tempo no intervalo modelado, o que permite que a curva de vulcanização seja comparável em intervalos fixos de tempo.
O objetivo da simulação aqui apresentada foi gerar curvas correspondentes às K medições dos I avaliadores efetuadas sobre as Jpeças de referência. Foram gerados dados para a obtenção de quatro cenários no contexto da avaliação de um SM. No primeiro cenário foram geradas curvas tal que o estudo de R&R resultasse na aprovação do SM. No segundo cenário foram simuladas curvas que resultaram na reprovação do SM. Neste caso, o SM foi reprovado devido ao efeito do avaliador. No terceiro cenário foram geradas curvas que resultaram na reprovação do SM, devido ao efeito do equipamento de medição. Nesses três cenários iniciais, o resultado da avaliação do SM utilizando a ANOVA das distâncias ou a ANOVA ponto a ponto é concordante. No quarto cenário simulado foram geradas curvas que novamente resultaram na reprovação do SM devido ao efeito do equipamento de medição, mas onde os resultados da ANOVA das distâncias e da ANOVA ponto a ponto divergem. As duas abordagens propostas na seção 3 foram usadas na análise de cada cenário simulado. Os resultados foram sempre comparados com aqueles obtidos utilizando a ANOVA ponto a ponto nas curvas, seguindo a proposta de Ramsay e Silverman (2005).
O estudo simulado de R&R envolve a avaliação de um SM com 2 avaliadores e 5 peças. Cada avaliador efetua 5 repetições da medida, cuja variável de resposta é funcional. A variável de resposta é formada por curvas compostas de 11 pontos. A primeira fase do processo de simulação foi a obtenção de 5 curvas de referência correspondentes às 5 peças de referência. As curvas de referência foram obtidas a partir do modelo da Equação 40. A Tabela 4 apresenta os parâmetros de ajuste β0, β1β2 e β3 de cada curva de referência usados para o estudo simulado. A Figura 2 apresenta a forma das curvas. As curvas não representam, necessariamente, a variação do processo.
A segunda fase do processo de simulação foi a geração das curvas observadas para cada cenário.
Para simular os valores medidos, foram adicionados dois termos de erro aleatório à Equação 40. Foram usados erros aleatórios seguindo uma distribuição normal com parâmetros u e O2. O primeiro termo de erro corresponde à influência do avaliador sobre o SM; o segundo corresponde ao erro característico do equipamento de medição. O erro do equipamento de medição foi dividido em três fatores, devido a diferenças de escala dentro do perfil que caracteriza a variável de resposta funcional. A Tabela 5 apresenta os parâmetros das distribuições dos termos de erro usados em cada cenário. O erro SM1 corresponde ao erro do SM para os valores de t menores que 1,6 minuto; o erro SM2 corresponde ao erro do SM para os valores de t entre 1,6 e 2,2 minutos; o erro SM3 corresponde ao erro do SM para valores de t maiores que 2,2 minutos.
Em todos os cenários, o teste Kolmogorov-Smirnov de normalidade não rejeitou a hipótese de normalidade dos dados, a um nível de confiança de α = 0,05. Da mesma forma, em todos os cenários simulados o efeito da interação não foi significativo; os termos de SQAP foram assim unificados aos da SQR.
4.1. SM aprovado
A Tabela 6 apresenta os resultados dos testes de hipóteses que compõem a ANOVA utilizando a abordagem das medianas, na seção 3.1, das médias, na seção 3.2, e da ANOVA ponto a ponto; os resultados nos três casos foram muito similares. O teste Fmostra que há efeito significativo para a variação das peças nos três casos. O efeito dos avaliadores não foi significativo. Foi usada a Equação 30 para o cálculo da SQR.
Na segunda coluna da Tabela 6, tem-se o resultado dos estudos de R&R (valores em percentual do indicador ICM1 da Tabela 2, para as três abordagens. Os valores apresentados aprovam o SM com folga nos três casos, já que todos estão abaixo do valor limite de 10%. Também não há conflito de resultados na ANOVA ponto a ponto (que inicia em t= 0,8 e termina em t= 2,8). As três colunas seguintes informam os resultados dos testes de hipótese que compõem a ANOVA de dois fatores. H0 A, H0 P, e H0 AP correspondem à hipótese nula da não existência de efeito do avaliador, da peça e da interação entre avaliador e peça, respectivamente. Somente a rejeição de H0 é informada na tabela, a um nível de confiança de a = 0,05. A última coluna da Tabela 6 traz o desvio na identidade da Equação 8.
A Tabela 7 apresenta os indicadores de capacidade e desempenho do SM no cenário aprovado, para as duas primeiras abordagens.
O resultado da Tabela 7 é compatível com o cenário simulado. O SM foi aprovado nas duas abordagens. O desvio na identidade da Equação 8 não se fez notar até a quinta casa após a vírgula. Considerando os critérios de aprovação da Tabela 2, o SM foi aprovado.
4.2. SM reprovado devido à VA
A Tabela 8 apresenta os resultados dos testes de hipóteses que compõem a ANOVA utilizando a abordagem das medianas, das médias e da ANOVA ponto a ponto. É possível observar a grande similaridade nos resultados das três abordagens. O teste Fpermite concluir pela existência de efeito significativo para a variação das peças e dos avaliadores nas três abordagens.
A Tabela 9 apresenta os indicadores de capacidade e desempenho do SM no cenário de reprovação devido à VA, para as duas primeiras abordagens.
O resultado da Tabela 9 é compatível com o cenário simulado. O SM foi reprovado nas três abordagens. A fonte de variação que mais contribuiu para a reprovação foi a VA. O desvio na identidade da Equação 8 apresentou valores maiores, se comparados aos da Tabela 6. Considerando os critérios de aprovação da Tabela 2, o SM foi reprovado.
4.3. SM reprovado devido à VE
A Tabela 10 apresenta os resultados dos testes de hipóteses que compõem a ANOVA utilizando a abordagem das medianas, das médias e da ANOVA ponto a ponto. As duas primeiras abordagens apresentam valores similares de %R&R, os quais divergem daqueles obtidos na ANOVA ponto a ponto. Nas três abordagens reprova-se o SM, com o teste F mostrando efeito significativo para a variação das peças.
A Tabela 11 apresenta os indicadores de capacidade e desempenho do SM no cenário de reprovação devida à VE, para as duas primeiras abordagens.
O resultado da Tabela 11 é compatível com o cenário simulado. O SM foi reprovado nas três abordagens. A fonte de variação que mais contribuiu para a reprovação foi a VE. O desvio na identidade da Equação 8 apresentou valores maiores do que aqueles da Tabela 8. Considerando os critérios de aprovação da Tabela 2, o SM foi reprovado.
4.4. SM reprovado devido à VE e com resultados inconclusivos na ANOVA ponto a ponto
A Tabela 12 apresenta os resultados dos testes de hipóteses que compõem a ANOVA utilizando a abordagem das medianas, das médias e da ANOVA ponto a ponto. As três abordagens apresentam valores distintos de %R&R, os quais podem ser explicados analisando o gráfico das curvas resultantes da simulação na Figura 3. As curvas plotadas são as médias sobre todas as replicações obtidas em cada grupo de avaliador e peça, além das duas curvas identificadas no gráfico (média geral e a curva do avaliador 1 sobre a peça 1 na primeira replicação). De t = 1,6 a t = 2,2 (aproximadamente 35% dos pontos) verifica-se variabilidade excessiva nas curvas. Essa variabilidade gera os resultados da ANOVA ponto a ponto que reprova o SM no intervalo. Como a ANOVA aprova o SM nos demais instantes, que são a maioria, uma decisão seria aprovar o SM. Essa conclusão é obtida na primeira abordagem, que utiliza a mediana, sendo assim mais conservadora. A segunda abordagem, baseada na média, aprova o SM porém colocando-o na região de aprovação condicional (entre 10% e 30%). Esse exemplo deixa claros as características de cada abordagem e os problemas de decisão que podem decorrer do uso da ANOVA ponto a ponto.
A Tabela 13 apresenta os indicadores de capacidade e desempenho do SM no cenário de reprovação devida à VE, para as duas primeiras abordagens.
A Tabela 14 apresenta uma comparação entre os desvios na identidade da Equação 8 observados em cada cenário. O desvio mais próximo de zero ocorreu no cenário em que o SM foi aprovado; tal cenário foi gerado com os menores valores de erro aleatório, conforme pode-se verificar na Tabela 5. Os maiores desvios ocorreram para o cenário do SM reprovado devido à VE1, o qual foi gerado com a maior variação do erro aleatório. Esse resultado se justifica já que o aumento da variação do SM aumenta a probabilidade de diferentes valores esperados serem usados no cálculo da SQR, definida pela Equação 30. O desvio também aumenta quando se altera o método de cálculo da mediana para a média. Entretanto, no geral a magnitude do desvio não é suficiente para levar a uma conclusão errônea na ANOVA, conforme pode-se constatar analisando a ANOVA ponto a ponto em cada caso.
5. Conclusão
A avaliação do desempenho de produtos e processos industriais que envolvem a análise de dados funcionais configura-se como necessidade crescente na área da Engenharia da Qualidade. Dados funcionais ocorrem quando uma observação da variável de resposta de interesse não é dada por um valor individual, mas por uma coleção de dados que formam um perfil ou curva. Produtos e processos caracterizados por variáveis funcionais devem ser analisados através de métodos apropriados a esse tipo de variável. Uma análise apropriada deve considerar conjuntamente todos os pontos observados na curva.
O método da ANOVA das distâncias proposto nesse artigo é uma adaptação do estudo tradicional de R&R para contemplar o tratamento e análise de dados funcionais. O método apresenta apenas um resultado final, no qual estão considerados todos os pontos da curva. O principal elemento da proposta foi a utilização da distância de Hasudorff (DH) como medida de proximidade entre curvas. No contexto de uma ANOVA, a medida de proximidade das curvas está para o nível de variação do SM como a medida de dispersão está para uma variável simples. Um método detalhado por equações e tabelas foi desenvolvido para avaliar as componentes da variação de um SM em que os dados são curvas.
A ANOVA das distâncias soluciona os problemas causados pelo uso equivocado de métodos para variáveis simples em estudos de R&R nos quais a variável de resposta é funcional. A ANOVA das distâncias pode ser usada com facilidade em planilhas eletrônicas comuns, sem a necessidade de programas computacionais complexos (como comprovam as planilhas programadas para o estudo de caso na seção 4, disponíveis mediante solicitação).
Algumas questões relevantes que surgiram no decorrer dessa pesquisa podem ser apontadas como sugestões relacionadas ao desdobramento dos métodos apresentados: (i) a generalização da ANOVA das distâncias para projetos experimentais incluindo variáveis funcionais com mais de dois fatores; (ii) adaptação do método para uso em ensaios destrutivos; (iii) investigação da influência do número de pontos usados na análise das curvas sobre o cálculo das somas quadráticas da ANOVA; e (iv) investigar a aplicabilidade do método para diferentes formas e características das variáveis funcionais..
Recebido 03/11/2010; Aceito 19/10/2011
- ABRAMOVICH, F.; ANGELINI, C. Testing in mixed-effects FANOVA models. Journal of Statistical Planning and Inference, v. 136, p. 4326-4348, 2006. http://dx.doi.org/10.1016/j.jspi.2005.06.002
- AUTOMOTIVE INDUSTRY ACTION GROUP - AIAG. Measurement Systems Analysis. 3rd ed. Detroit: Chrysler Corporation; Ford Motor Company and General Motors Corporation, 2002.
- BARRENTINE, L. B. Concepts for R&R studies. 2nd ed. Milwaukee: ASQ, 2003.
- BURDICK, R. K.; BORROR, C. M.; MONTGOMERY, D. C. Design and analysis of gauge R&R studies: making decisions with confidence intervals in random and fixed ANOVA models. Philadelphia; Alexandria: ASA-SIAM Series on Statistics and Applied Probability, 2005.
- BURDICK, R. K.; BORROR, C. M.; MONTGOMERY, D. C. A Review of Methods for Measurement Systems Capability Analysis. Journal of Quality Technology, v. 35, p. 342- 354, 2003.
- CUEVAS, A.; FEBRERO, M.; FRAIMAN, R. An ANOVA test for functional data. Computacional Statistics & Data Analysis, v. 47, p. 111-122, 2004. http://dx.doi.org/10.1016/j.csda.2003.10.021
- FERRATY, F.; VIEU, P. Curves discrimination: a nonparametric functional approach. Computational Statistics & Data Analysis v. 44, p. 161-173, 2003. http://dx.doi.org/10.1016/S0167-9473(03)00032-X
- FOGLIATTO, F. S. Multiresponse optimization of products with functional quality characteristics. Quality and Reliability Engineering International, v. 24, n. 8, p. 927- 939, 2008. http://dx.doi.org/10.1002/qre.939
- HUTTENLOCHER, D. P.; KLANDERMAN, G. A; RUCKLIDGE, W. J. Comparing images using the Hausdorff distance. IEEE Transactions on Pattern Analysis and Machine Intelligence, v. 15, p. 850-863, 1993. http://dx.doi.org/10.1109/34.232073
- INTERNATIONAL VOCABULARY OF METROLOGY - VIM. Basic and general concepts and associated terms. 3rd ed. Joint Committee for Guides in Metrology, 2008. http://dx.doi.org/10.1590/S0103-65132007000300002
- KANG, L.; ALBIN, S. L. On-line monitoring when the process yields a linear profile. Journal of Quality Technology, v. 32, p. 418-426, 2000.
- MAJESKE, K. D. Approval Criteria for Multivariate Measurement System. Journal of Quality Technology, v. 40, p. 140-153, 2008.
- MONTGOMERY, D. C.; RUGER, G. C. Applied Statistics and Probability for Engineers. 3rd ed. New York: John Wiley and Sons, 2003.
- MONTGOMERY, D. C. Design and Analysis of Experiments. New York: John Wiley and Sons, 2001.
- RAMSAY, J. O.; SILVERMAN, B. W. Functional data analysis. 2nd ed. New York: Springer, 2005.
- SOUZA, C. P. E. Testes de hipóteses para dados funcionais baseados em distâncias: um estudo usando splines. 2008. Dissertação (Mestrado em Estatística)-Universidade Estadual de Campinas, Campinas, 2008.
- WOODALL, W. H. Current research on profile monitoring. Produção, v. 17, p. 420-425, 2007.
Datas de Publicação
-
Publicação nesta coleção
09 Nov 2012 -
Data do Fascículo
Set 2013
Histórico
-
Recebido
03 Nov 2010 -
Aceito
19 Out 2011