## Print version ISSN 0103-6513

### Prod. vol.22 no.4 São Paulo Sept./Dec. 2012  Epub Aug 21, 2012

#### http://dx.doi.org/10.1590/S0103-65132012005000059

Probabilidade do erro do tipo I nas cartas X e S de Shewhart sob não normalidade

Probability of type I error in X and S Shewhart Control Charts under non-normality

André Luis KorzenowskiI, *; Liane WernerII

Iandre@korzenowski.com, FAMAT/PUCRS, Brasil
IIbliane@producao.ufrgs.br, PPGEP/UFRGS, Brasil

RESUMO

Palavras-chave: Gráficos de controle de Shewhart. Suposição de normalidade. Erro do tipo I. Robustez.

ABSTRACT

The purpose of this article was to examine the performance of Shewhart average and standard deviation control charts in relation to the probability of type I error at the occurrence of normality assumption violation. A simulation of a series of 500,000 samples (subgroups) of sizes n=3, 5, 7, 10, 15, 20 and 25 was performed. The samples were simulated from the following distributions: Normal, Binomial, Poisson, Exponential, Chi-square, Gamma and Weibull. It was possible to find that, in non-normal data, there was an increase in the probability of type I error on the average chart of all simulated distributions. The minimum sample size required is related to the degree of asymmetry of the data distribution and, in some cases, not even n=25 presented satisfactory results. In the S chart, the increased probability of type I error is significantly higher for almost all distributions simulated and its performance is influenced not only by the type of distribution but also by the sample size.

Keywords: Shewhart control charts. Normality assumption. Type I error. Robustness.

1. Introdução

Considerando testes de hipóteses estatísticos, a abordagem em relação às probabilidades de erro é afirmar que comete-se erro do tipo I quando rejeitamos a hipótese nula e ela é verdadeira. Em contrapartida, o erro do tipo II ocorre quando não rejeitamos a hipótese nula e ela é falsa. No caso de cartas de controle, alarmes falsos são erros do tipo I e pontos que o gráfico assinala sob controle quando o processo está fora de controle são erros do tipo II. Em geral, o erro do tipo II é mensurado em cartas de controle através do número médio de observações necessárias para identificar que o processo passou ao estado fora de controle (ARL).

O não atendimento das suposições tem gerado certa discussão na literatura, principalmente no caso da presença de autocorrelação (PEDRINI; TEN CATEN; MOREIRA JUNIOR, 2008; JARRET; PAN, 2007; CAULCUTT, 1995; ALWAN; ROBERTS, 1988). Os estudos citados abordam como efeitos principais do não atendimento das suposições o aumento do ARL e o elevado número de alarmes falsos.

Lin e Chou (2005a) afirmam que dados não normais são comumente encontrados em processos industriais. De fato, grande parte das séries observadas nas linhas de produção deve apresentar algum problema relacionado às suposições das cartas de controle. Montgomery (2001) e Mulliken e Johnson (1992), considerando modelos lineares de análise de variância, afirmam que afastamentos da suposição de normalidade não são problemas efetivos devido ao fato de esses modelos apresentarem robustez frente a desvios moderados da normalidade. Os autores destacam que, neste caso, observam-se apenas leve aumento no erro do tipo I e leve redução no poder do teste F da análise de variância. Moore (1957) sugere que, em relação à carta de médias () de Shewhart, os erros dependem do grau de não normalidade e também do tamanho da amostra (ou subgrupo) e então, em geral, esses erros podem ser reduzidos utilizando-se um tamanho de amostra maior. Isso ocorre porque, segundo Wheeler e Chambers (1986), se as medidas observadas são normalmente distribuídas, a média amostral também será normalmente distribuída. Entretanto, se as medidas não são normalmente distribuídas, a distribuição da média amostral será aproximadamente normal quando a amostra for suficientemente grande, de acordo com o teorema do limite central (LIN; CHOU, 2005b; WHEELER; CHAMBERS, 1986).

Por outro lado, Moore (1957) sugere que os erros não serão reduzidos no caso de medidas de variabilidade, tal como a utilizada no gráfico de amplitude (gráfico R) de Shewhart, independente do tamanho da amostra utilizado. Segundo o autor, a magnitude dos erros do tipo I e II é grande e varia enormemente de acordo com o nível de significância nominal envolvido. Ainda que o nível de erro nominal seja tão pequeno quanto 5%, o desvio padrão estimado pela amplitude pode apresentar uma diferença de até 44% no nível de significância envolvido (MOORE, 1957).

A prática usual em utilizar cartas e S de Shewhart consiste em coletar amostras de tamanhos iguais de um processo em um intervalo de tempo constante (LIN; CHOU, 2005a; STOWMBOS et al., 2000). Seja X a variável de qualidade de interesse, e suponha que f0(χ) seja a distribuição de probabilidade de X, indexada por θ um vetor de um ou mais parâmetros. Um processo estável em operação com θ=θ0 é dito um processo estatisticamente sob controle. Entretanto, se algo ocorrer no processo que altere θ para um valor diferente de θ0, então o processo será dito fora de controle. Essa variação deve ser suficientemente grande para que a observação esteja além dos limites de controle baseados na distribuição de probabilidade de X. Esse resultado, além dos limites de controle, é tão pouco provável para θ=θ0 que se pode concluir que, nessas condições θ¹θ0 (COSTA; EPPRECHT; CARPINETTI, 2005; STOWMBOS et al., 2000).

Considerando que uma série de dados independentes e identicamente distribuídos, observados ao longo do tempo em um processo produtivo, pode ser modelada através de um modelo linear, então as idéias expostas por Montgomery (2001) e Mulliken e Johnson (1992) podem ser aplicadas ao contexto do controle de qualidade. Assim o questionamento que surge é: como desvios em relação à normalidade afetam o comportamento das cartas de controle e S de Shewhart em relação ao erro do tipo I?

Cox (1954) efetuou um estudo com objetivo de predizer a média e o coeficiente de variação da amplitude em pequenas amostras aleatórias (n < 5) de uma população com dadas medidas de curtose e assimetria. Além disso, procurou mostrar como esses resultados podem ser utilizados para avaliar o efeito da não normalidade em aplicações comuns da amplitude. Sua principal conclusão é que, se a curtose é conhecida, é possível realizar uma correção para a não normalidade nos métodos que utilizam as amplitudes em pequenas amostras, tais como a carta de controle para amplitude de Shewhart (gráfico R). No seu conjunto, ainda segundo Cox (1954), esses métodos são menos afetados pela não normalidade do que métodos que utilizam variâncias em pequenas amostras.

Segundo Nagendra e Rai (1971), a eficiência de uma carta de controle em detectar alterações no nível da série depende principalmente de três fatores: o tamanho da série da carta, o tamanho da amostra e o intervalo de amostragem. Assim, os autores estabelecem uma função que minimiza o custo de identificar essas variações no nível da série buscando um tamanho de amostra e intervalo entre amostragens ótimos. Esses valores são identificados, entre outros fatores, em função dos limites de controle que são construídos sobre a suposição de normalidade. Segundo os autores, frequentemente variáveis aleatórias industriais não aderem ao modelo de distribuição normal e isso afetaria o tamanho da amostra e o intervalo entre amostragens ótimo. Os autores identificam que, para valores fixos de custos, o tamanho da amostra aumenta quanto maior a assimetria e praticamente permanece o mesmo em relação a variações na curtose das distribuições não normais experimentadas.

Yourstone e Zimmer (1992) analisaram o efeito da assimetria e curtose nas cartas de controle para médias e dentre as suas conclusões pode-se destacar que aumentando a curtose, aumenta o número de alarmes falsos. Além disso, verificaram que a assimetria leva a um deslocamento da média gerando, por consequência, sinais de dados não conformes.

Chan, Hapuarachchi e MacPherson (1998) comparam as cartas de controle e R com a família da distribuição de probabilidade de Tukey. Dentre as conclusões obtidas pelos autores, a pertinente a este estudo refere-se às distribuições que apresentam as caudas mais pesadas, e verificaram que as cartas de controle não são adequadas nessa situação.

Stowmbos e Reynolds (2000) investigaram o comportamento das cartas de Shewart X e MR além de outros gráficos para medidas individuais, utilizando as distribuições: normal, t de Student, gamma e exponencial, e também dados autocorrelacionados. Dentre suas conclusões é importante destacar para este estudo que, à medida que as distribuições se tornam mais assimétricas, o ARL0 (average run lenght) diminui, indicando que os alarmes falsos irão ocorrer antecipadamente, resultando em perda de confiança no sistema das cartas de controle. Destaca-se que o ARL0 é determinado como o inverso da probabilidade de erro do tipo I da carta em questão. Desse modo, em um ARL0 menor está implícito um aumento dessa probabilidade. Além disso, eventualmente pode ocorrer diminuição da produtividade e consequente aumento dos custos. Considerando que os dados apresentam um comportamento estacionário, os autores contabilizaram o número de pontos que é necessário para detectar um deslocamento (ARL1). As cartas X e MR revelaram que, para pequenos deslocamentos da média µ (menor que um desvio padrão) e/ou pequenos acréscimos em Σ (menos que 50%), os valores da medida de deslocamento para as distribuições t de Student e gamma são consideravelmente menores que quando esta for obtida para as cartas de controle sobre a suposição de normalidade.

Lin e Chou (2005b) efetuaram um estudo comparando o efeito de dados provenientes das distribuições t de Student e qui-quadrado χ2 no comportamento da carta de controle de parâmetros variáveis (VP ). Segundo os autores, com pequenas amostras, o gráfico VP apresenta pequeno risco de falsos alarmes quando o processo encontra-se sob controle. Quando o VP utiliza tamanhos de amostra maiores, a distribuição amostral da média é aproximadamente normal e, portanto, o efeito da não normalidade pode ser ignorado. Lin e Chou (2005b) concluem após alguns exemplos numéricos que, quando ignorado o efeito da não normalidade e ajustando os limites do modo tradicional, a taxa de alarmes falsos pode ser intolerável.

Desse modo, o objetivo deste artigo é apresentar os resultados de um procedimento de simulação de Monte Carlo onde é verificada a probabilidade de erro do tipo I em cartas de controle e S de Shewhart quando da violação da suposição de normalidade. Nesse enfoque, observa-se também o comportamento das cartas de controle em relação a diferentes tamanhos de amostra. A seção 2 mostra a metodologia adotada na simulação deste estudo. A seção 3 apresenta a discussão e os resultados obtidos via simulação Monte Carlo. A seção 4 traz as considerações finais sobre os resultados encontrados e sugestões de novas pesquisas.

2. Metodologia

Destaca-se que a maior parte dessas distribuições tem aplicações na área de Engenharia de Produção. É o caso das distribuições exponencial, gamma e Weibull, por exemplo. Essas distribuições são importantes nos estudos de confiabilidade e delas originaram-se as leis de falhas exponencial e de Weibull (MEYER, 1983). Apesar de simétrica e similar à distribuição normal padrão, a distribuição t de Student foi utilizada no estudo de Lin e Chou (2005b) que comparou o comportamento de algumas variações de cartas de média, principalmente o gráfico para médias de parâmetros variáveis (VP ). Além das distribuições t com 4, 10 e 30 graus de liberdade, Lin e Chou (2005b) também simularam três distribuições gamma, com parâmetro de forma (Κ) igual a 4, 2 e 1 e parâmetro de escala (θ) igual a 1. Destaca-se que a distribuição gamma (1,1) é a distribuição exponencial com média igual a 1. A Tabela 1 apresenta as funções de probabilidade e os respectivos parâmetros utilizados nessa simulação.

Como algumas distribuições são casos particulares de outras, como, por exemplo, a distribuição exponencial para a gamma ou a Weibull para a gamma, e consequentemente para a exponencial, buscou-se parametrizar as distribuições de modo que apresentassem características distintas em relação aos 3 primeiros momentos centrais, ou seja, média, variância e assimetria. Do mesmo modo, buscou-se parametrizá-las de forma que as distribuições não obtivessem boa aproximação pela curva de distribuição normal.

O método de simulação utilizado para a estimação das probabilidades de erro do tipo I é descrito nos sete passos a seguir.

• Passo 1: Gerar uma amostra (subgrupo) de tamanho n proveniente de uma determinada distribuição de probabilidade;
• Passo 2: Calcular a média amostral e o desvio padrão amostral s para essa amostra;
• Passo 3: Repetir os passos 1 e 2 k vezes para obter k médias amostrais, denotadas por 1, 2...,k e k desvios padrão amostrais, denotados por S1, S2, ..., Sk;
• Passo 4: Grafar as k médias amostrais na carta e os k desvios padrão na carta s e contabilizar o número de pontos fora de controle em ambos as cartas, com limites construídos a 3 sigmas (desvios padrão do processo);
• Passo 5: Calcular a proporção p1i de pontos fora de controle, e a proporção p2i de pontos si fora de controle;
• Passo 6: Repetir os passos 1 a 5 para os tamanhos de amostra n = 3, 5, 7, 10, 15, 20 e 25; e
• Passo 7: Repetir os passos 1 a 6 para as distribuições apresentadas na Tabela 2.

O valor de k: tamanho da série foi de k = 500.000. Lin e Chou (2005b) simularam 250 séries de tamanho 20.000, num total de 5.000.000 de subgrupos. Para a carta , supondo normalidade, espera-se um alarme falso a cada 370 amostras. Simulou-se uma amostra aproximadamente 1.350 vezes maior, sendo suficiente para resultados com boa acurácia numérica. A simulação e análise dos resultados foram efetuadas com auxílio do pacote estatístico R. A Figura 1 traz os gráficos das distribuições apresentadas na Tabela 2 sobrepostos à curva normal, com média e desvio padrão idênticos aos das distribuições utilizadas na simulação.

Esta seção apresenta os resultados obtidos via simulação Monte Carlo. Inicialmente será verificado o erro do tipo I nas cartas e S para a série de subgrupos gerados a partir da distribuição normal. Na sequência serão discutidos os resultados verificados quando os dados gerados eram não normais. As Tabelas 3 e 4 apresentam as estimativas das probabilidades de erro do tipo I para as cartas e S.

Observando-se a Tabela 3, verifica-se que, no caso da distribuição normal, aproximadamente 0,27% dos valores marcados nas cartas de Shewhart apontou alarmes falsos nesses gráficos construídos com limites de controle em 3 sigmas, independentemente do tamanho da amostra. Esse resultado valida o algoritmo de simulação, pois mostra que foram obtidos os resultados esperados pela distribuição normal - P(-3<Z<+3)=0,0027. Além disso, apesar das discussões de custos na implementação de cartas de controle no controle da qualidade levantadas por Nagendra e Rai (1971), observa-se que, para dados gerados de um modelo de distribuição normal, o comportamento da carta de médias é indiferente para os vários tamanhos de amostra.

Quanto à carta S, observa-se que a probabilidade de erro do tipo I decresce para 0,27% conforme o tamanho da amostra é aumentado, atingindo esse nível para amostras de tamanho n = 15, 20 e 25. Valores de probabilidade de erro do tipo I acima de 0,27%, porém aceitáveis são observados neste gráfico para amostras de tamanho n = 7 e 10 (probabilidade de erro do tipo I aproximadamente 15% maior). Já para amostras de tamanho n = 3 e 5, o acréscimo na probabilidade de erro do tipo I é de aproximadamente 107% e 48%, respectivamente.

Verifica-se para os dados gerados a partir de todos os modelos que, para tamanhos de amostra menores, a distribuição do desvio padrão é assimétrica e que, com o aumento do tamanho da amostra, a distribuição amostral do desvio padrão também aproxima-se de um modelo normal. O que os gráficos mostram é que, no caso de dados oriundos de um modelo de distribuição normal, essa aproximação se dá de forma mais rápida, isto é, para tamanhos de amostra menores. Considerando as distribuições assimétricas, mesmo em amostra de tamanho n = 25, observa-se ainda a formação de uma cauda à direita.

4. Considerações finais

Cartas de controle são comumente usadas no controle de qualidade das indústrias modernas. A adequada utilização dessas ferramentas é fundamental para a percepção da existência de problemas nas linhas de produção. Uma carta construída sob violação de suas suposições pode acarretar vários problemas. Estudos destacam o aumento da probabilidade de erro do tipo I (alarmes falsos) na presença de dependência entre as observações (autocorrelação serial). Em relação à suposição de normalidade, ainda há carência de estudos sobre o assunto. Entre os apresentados, o objetivo geral era de comparar o comportamento entre diferentes tipos de cartas, como os estudos de Lin e Chou (2005a), por exemplo. Dessa forma, este artigo tem sua relevância por discutir o comportamento das cartas e S de Shewhart no que diz respeito ao número de alarmes falsos na violação da suposição de normalidade em diferentes tamanhos de amostra.

Os resultados apontaram que, em dados independentes e normal e identicamente distribuídos, observam-se alarmes falsos na carta na exata proporção esperada. Entretanto, quando da ocorrência de dados independentes e identicamente distribuídos, porém não normais, ocorre aumento na probabilidade do erro do tipo I. Esse erro, independentemente do tamanho da amostra, é maior. Entretanto, na maior parte dos casos a diferença diminuí com o aumento do tamanho da amostra.

No caso do gráfico S os resultados apontam que, conforme o tamanho da amostra cresce, a probabilidade do erro do tipo I também aumenta, na maior parte dos casos. Além disso, não só o erro para amostras pequenas é significativamente maior do que o nível de significância esperado, como esse erro praticamente dobra quando se considera o aumento no tamanho das amostras de 3 para 25.

Os resultados demonstram que o gráfico de Shewhart pode ser considerado robusto em relação a leves desvios da normalidade, tais como os observados nas distribuições com coeficiente de assimetria menor do que 1,5. Nessas condições, o efeito a considerar é o aumento da probabilidade do erro do tipo I, assim como ocorre nos modelos lineares discutidos por Montgomery (2001) e Mulliken e Johnson (1992). Esses resultados também foram encontrados por Yourstone e Zimmer (1992).

Para pesquisas futuras, deixa-se como sugestão verificar o comportamento dos gráficos R e S em amostras de tamanho inferior a 10 quando os dados não são provenientes de uma população com distribuição normal, para dados transformados e utilizando-se a distribuição amostral aproximada do desvio padrão ou, ainda, a distribuição original dos dados. Além disso, verificar o impacto na probabilidade dos erros do tipo I e II nas cartas de variabilidade (R e S), quando na presença de autocorrelação.

Agradecemos aos referees anônimos pelas sugestões que contribuíram significativamente para a melhoria deste trabalho.

Referências

ALWAN, L. C.; ROBERTS, H. V. Time-Series Modeling for Statistical Process Control. Journal of Business & Economic Statistics, v. 6, n. 1, p. 87-95, 1988.         [ Links ]

CAULCUTT, R. The Rights and Wrongs of Control Charts. Applied Statistics, v. 44, n. 3, p. 279-288, 1995.         [ Links ]

CHAN, L. K.; HAPUARACHCHI, K. P.; MACPHERSON, B. D. Robustness of X and R chart. IEEE Transactions on reliability, v. 37, n. 1, p. 117-123, 1998.         [ Links ]

COSTA, A. F. B.; EPPRECHT, E. K.; CARPINETTI, L. C. R. Controle estatístico de qualidade. São Paulo: Atlas, 2005.         [ Links ]

COX, D. R. The mean and coefficient of variation of range in small samples from non-normal populations. Biometrika, v. 41, n. 3-4, p. 469-48, 1954.         [ Links ]

DUNCAN, A. J. Quality control and industrial statistics. 4th ed. Chicago: Irwin Professional Publishing, 1974.         [ Links ]

JAMES, B. J. Probabilidade: um curso em nível intermediário. Rio de Janeiro: IMPA; CNPq, 1996.         [ Links ]

JARRET, J. E.; PAN, X. The quality control chart for monitoring multivariate autocorrelated processes. Computational Statistics & Data Analysis, v. 51, p. 3862-3870, 2007. http://dx.doi.org/10.1016/j.csda.2006.01.020        [ Links ]

LIN, Y.-C.; CHOU, C.-Y. On the design of variable sample size and sampling intervals charts X under non-normality. Internacional Journal of Production Economics, v. 96, p. 249-261, 2005a. http://dx.doi.org/10.1016/j.ijpe.2004.05.001        [ Links ]

LIN, Y.-C.; CHOU, C.-Y. Non-normality and the variable parameters X control charts. European Journal of Operational Research, v. 176, p. 361-373, 2005b.         [ Links ]

MEYER, P. L. Probabilidade: Aplicação à Estatística. Rio de Janeiro: LTC, 1983.         [ Links ]

MULLIKEN, G. A.; JOHNSON, D. E. Analysis of Messy Data. Boca Ratón: Chapman & Hall/CRC, 1992. v. 1: Design of Experiments.         [ Links ]

MONTGOMERY, D. Design and Analysis of Experiments. Hoboken: John Willey & Sons, 2001.         [ Links ]

MONTGOMERY, D. Introdução ao Controle Estatístico da Qualidade. Rio de Janeiro: LTC, 2004.         [ Links ]

MOORE, P. Normality in Quality Control Charts. Applied Statistics, v. 6, n. 3, p. 171-179, 1957.         [ Links ]

PEDRINI, D. C.; TEN CATEN, C. S.; MOREIRA JUNIOR, F. J. Proposal of an Alternative to Control Chart Based on Residuals. Praha: ISBIS, 2008. Book of Abstracts.         [ Links ]

NAGENDRA, Y.; RAI, G. Optimum sample size and sampling interval for controlling the mean of non-normal variables. Journal of the American Statistical Association, v. 66, n. 335, p. 637-640, 1971.         [ Links ]

STOWMBOS, Z. G. et al. The state of statistical process control as we proceed into the 21st century. Journal of the American Statistical Association, v. 95, n. 451, p. 992-998, 2000.         [ Links ]

STOWMBOS, Z. G.; REYNOLDS, M. R. Robustness to non-normality and autocorrelation of individuals control charts. Journal of Statistical Computation and Simulation, v. 66, p. 145-187, 2000.         [ Links ]

WHEELER, D. J.; CHAMBERS, D. S. Understanding Statistical Process Control. Knoxville: Statistical Process Control Inc., 1986.         [ Links ]

YOURSTONE, S. A.; ZIMMER, W. J. Non-normality and the design of control chart averages. Decisions Sciences, v. 23, n. 5, p. 1099-1113, 1992. http://dx.doi.org/10.1111/j.1540-5915.1992.tb00437.x        [ Links ]

Recebido: 21/05/2009
Aceito: 25/08/2011

* FAMAT/PUCRS, Porto Alegre, RS, Brasil