Probabilidade do erro do tipo I nas cartas X e S de Shewhart sob não normalidade

Korzenowski, André Luis; Werner, Liane

doi:10.1590/S0103-65132012005000059

Resumos

O objetivo deste artigo é verificar o comportamento das cartas de média e desvio padrão de Shewhart em relação à probabilidade do erro do tipo I quando da violação da suposição de normalidade. Foi realizada a simulação de uma série de 500.000 amostras (subgrupos) de tamanho n = 3, 5, 7, 10, 15, 20 e 25. As amostras foram simuladas a partir das distribuições normal, t de Student, exponencial, qui-quadrado, gamma e Weibull. Verificou-se em dados não normais o aumento na probabilidade de erro do tipo I na carta de médias em todas as distribuições simuladas. O mínimo tamanho da amostra necessário está relacionado ao grau de assimetria da distribuição dos dados, sendo que, em alguns casos, nem mesmo n = 25 apresentou resultados satisfatórios. No gráfico S, o aumento da probabilidade de erro do tipo I é significativamente superior em quase todas as distribuições simuladas e seu comportamento é influenciado não só pelo tipo de distribuição, mas também pelo tamanho da amostra.

Gráficos de controle de Shewhart; Suposição de normalidade; Erro do tipo I; Robustez

The purpose of this article was to examine the performance of Shewhart average and standard deviation control charts in relation to the probability of type I error at the occurrence of normality assumption violation. A simulation of a series of 500,000 samples (subgroups) of sizes n=3, 5, 7, 10, 15, 20 and 25 was performed. The samples were simulated from the following distributions: Normal, Binomial, Poisson, Exponential, Chi-square, Gamma and Weibull. It was possible to find that, in non-normal data, there was an increase in the probability of type I error on the average chart of all simulated distributions. The minimum sample size required is related to the degree of asymmetry of the data distribution and, in some cases, not even n=25 presented satisfactory results. In the S chart, the increased probability of type I error is significantly higher for almost all distributions simulated and its performance is influenced not only by the type of distribution but also by the sample size.

Shewhart control charts; Normality assumption; Type I error; Robustness

Probabilidade do erro do tipo I nas cartas X e S de Shewhart sob não normalidade

Probability of type I error in X and S Shewhart Control Charts under non-normality

André Luis KorzenowskiI, ^* * FAMAT/PUCRS, Porto Alegre, RS, Brasil ; Liane Werner^II

^Iandre@korzenowski.com, FAMAT/PUCRS, Brasil

^IIbliane@producao.ufrgs.br, PPGEP/UFRGS, Brasil

RESUMO

O objetivo deste artigo é verificar o comportamento das cartas de média e desvio padrão de Shewhart em relação à probabilidade do erro do tipo I quando da violação da suposição de normalidade. Foi realizada a simulação de uma série de 500.000 amostras (subgrupos) de tamanho n = 3, 5, 7, 10, 15, 20 e 25. As amostras foram simuladas a partir das distribuições normal, t de Student, exponencial, qui-quadrado, gamma e Weibull. Verificou-se em dados não normais o aumento na probabilidade de erro do tipo I na carta de médias em todas as distribuições simuladas. O mínimo tamanho da amostra necessário está relacionado ao grau de assimetria da distribuição dos dados, sendo que, em alguns casos, nem mesmo n = 25 apresentou resultados satisfatórios. No gráfico S, o aumento da probabilidade de erro do tipo I é significativamente superior em quase todas as distribuições simuladas e seu comportamento é influenciado não só pelo tipo de distribuição, mas também pelo tamanho da amostra.

Palavras-chave: Gráficos de controle de Shewhart. Suposição de normalidade. Erro do tipo I. Robustez.

ABSTRACT

The purpose of this article was to examine the performance of Shewhart average and standard deviation control charts in relation to the probability of type I error at the occurrence of normality assumption violation. A simulation of a series of 500,000 samples (subgroups) of sizes n=3, 5, 7, 10, 15, 20 and 25 was performed. The samples were simulated from the following distributions: Normal, Binomial, Poisson, Exponential, Chi-square, Gamma and Weibull. It was possible to find that, in non-normal data, there was an increase in the probability of type I error on the average chart of all simulated distributions. The minimum sample size required is related to the degree of asymmetry of the data distribution and, in some cases, not even n=25 presented satisfactory results. In the S chart, the increased probability of type I error is significantly higher for almost all distributions simulated and its performance is influenced not only by the type of distribution but also by the sample size.

Keywords: Shewhart control charts. Normality assumption. Type I error. Robustness.

1. Introdução

Cartas de controle são ferramentas eficientes para identificar quando um processo produtivo encontra-se fora de controle. Entretanto, essas ferramentas exigem certos cuidados na sua implementação em função de suas suposições. As principais suposições destacadas na literatura são a normalidade dos dados, a independência entre as observações e a homocedasticidade - dados identicamente distribuídos (MONTGOMERY, 2004). Por normalidade, neste contexto, entende-se que os dados coletados em certo subgrupo sejam provenientes de uma população com distribuição normal. Já independência aponta para a inexistência de autocorrelação na série de observações. Por homocedasticidade, entende-se que o processo apresente variância estável, o que faz sentido se o pressuposto de que o processo está sob controle é atendido. Nesse caso os subgrupos amostrais são identicamente distribuídos. Destaca-se que o efeito da violação dessa suposição não é muito destacada na literatura.

Considerando testes de hipóteses estatísticos, a abordagem em relação às probabilidades de erro é afirmar que comete-se erro do tipo I quando rejeitamos a hipótese nula e ela é verdadeira. Em contrapartida, o erro do tipo II ocorre quando não rejeitamos a hipótese nula e ela é falsa. No caso de cartas de controle, alarmes falsos são erros do tipo I e pontos que o gráfico assinala sob controle quando o processo está fora de controle são erros do tipo II. Em geral, o erro do tipo II é mensurado em cartas de controle através do número médio de observações necessárias para identificar que o processo passou ao estado fora de controle (ARL).

O não atendimento das suposições tem gerado certa discussão na literatura, principalmente no caso da presença de autocorrelação (PEDRINI; TEN CATEN; MOREIRA JUNIOR, 2008; JARRET; PAN, 2007; CAULCUTT, 1995; ALWAN; ROBERTS, 1988). Os estudos citados abordam como efeitos principais do não atendimento das suposições o aumento do ARL e o elevado número de alarmes falsos.

Lin e Chou (2005a) afirmam que dados não normais são comumente encontrados em processos industriais. De fato, grande parte das séries observadas nas linhas de produção deve apresentar algum problema relacionado às suposições das cartas de controle. Montgomery (2001) e Mulliken e Johnson (1992), considerando modelos lineares de análise de variância, afirmam que afastamentos da suposição de normalidade não são problemas efetivos devido ao fato de esses modelos apresentarem robustez frente a desvios moderados da normalidade. Os autores destacam que, neste caso, observam-se apenas leve aumento no erro do tipo I e leve redução no poder do teste F da análise de variância. Moore (1957) sugere que, em relação à carta de médias () de Shewhart, os erros dependem do grau de não normalidade e também do tamanho da amostra (ou subgrupo) e então, em geral, esses erros podem ser reduzidos utilizando-se um tamanho de amostra maior. Isso ocorre porque, segundo Wheeler e Chambers (1986), se as medidas observadas são normalmente distribuídas, a média amostral também será normalmente distribuída. Entretanto, se as medidas não são normalmente distribuídas, a distribuição da média amostral será aproximadamente normal quando a amostra for suficientemente grande, de acordo com o teorema do limite central (LIN; CHOU, 2005b; WHEELER; CHAMBERS, 1986).

Por outro lado, Moore (1957) sugere que os erros não serão reduzidos no caso de medidas de variabilidade, tal como a utilizada no gráfico de amplitude (gráfico R) de Shewhart, independente do tamanho da amostra utilizado. Segundo o autor, a magnitude dos erros do tipo I e II é grande e varia enormemente de acordo com o nível de significância nominal envolvido. Ainda que o nível de erro nominal seja tão pequeno quanto 5%, o desvio padrão estimado pela amplitude pode apresentar uma diferença de até 44% no nível de significância envolvido (MOORE, 1957).

A prática usual em utilizar cartas e S de Shewhart consiste em coletar amostras de tamanhos iguais de um processo em um intervalo de tempo constante (LIN; CHOU, 2005a; STOWMBOS et al., 2000). Seja X a variável de qualidade de interesse, e suponha que f₀(χ) seja a distribuição de probabilidade de X, indexada por θ um vetor de um ou mais parâmetros. Um processo estável em operação com θ=θ₀ é dito um processo estatisticamente sob controle. Entretanto, se algo ocorrer no processo que altere θ para um valor diferente de θ₀, então o processo será dito fora de controle. Essa variação deve ser suficientemente grande para que a observação esteja além dos limites de controle baseados na distribuição de probabilidade de X. Esse resultado, além dos limites de controle, é tão pouco provável para θ=θ₀ que se pode concluir que, nessas condições θ¹θ₀ (COSTA; EPPRECHT; CARPINETTI, 2005; STOWMBOS et al., 2000).

Considerando que uma série de dados independentes e identicamente distribuídos, observados ao longo do tempo em um processo produtivo, pode ser modelada através de um modelo linear, então as idéias expostas por Montgomery (2001) e Mulliken e Johnson (1992) podem ser aplicadas ao contexto do controle de qualidade. Assim o questionamento que surge é: como desvios em relação à normalidade afetam o comportamento das cartas de controle e S de Shewhart em relação ao erro do tipo I?

Cox (1954) efetuou um estudo com objetivo de predizer a média e o coeficiente de variação da amplitude em pequenas amostras aleatórias (n < 5) de uma população com dadas medidas de curtose e assimetria. Além disso, procurou mostrar como esses resultados podem ser utilizados para avaliar o efeito da não normalidade em aplicações comuns da amplitude. Sua principal conclusão é que, se a curtose é conhecida, é possível realizar uma correção para a não normalidade nos métodos que utilizam as amplitudes em pequenas amostras, tais como a carta de controle para amplitude de Shewhart (gráfico R). No seu conjunto, ainda segundo Cox (1954), esses métodos são menos afetados pela não normalidade do que métodos que utilizam variâncias em pequenas amostras.

Moore (1957) mostra como certos desvios da normalidade podem afetar as probabilidades associadas com os limites de controle obtidos pela distribuição normal. O autor destaca que o ajuste de cartas de controle, utilizando a distribuição normal quando os dados não são normalmente distribuídos, faz com que os vários níveis de probabilidade utilizados não sejam iguais aos verdadeiros níveis de probabilidade verificados. No caso da média, esses erros dependem do grau de não normalidade e também do tamanho da amostra e, em geral, podem ser reduzidos com a utilização de uma amostra maior. Por outro lado, quando avaliadas medidas de variabilidade, o autor afirma que as probabilidades de erro do tipo I e II são independentes do tamanho da amostra. Na maior parte dos casos, as estimativas do desvio padrão são subestimativas e o aumento do tamanho da amostra implica, muitas vezes, em resultados piores do que os observados com amostras menores. Moore (1957) concluiu ainda que, a não ser que a distribuição de probabilidade seja bem conhecida, subamostras em torno de 7 ou 8 são provavelmente os mais razoáveis tamanhos de amostra para uso na estimação dos parâmetros média e desvio padrão do processo quando os dados são não normais.

Segundo Nagendra e Rai (1971), a eficiência de uma carta de controle em detectar alterações no nível da série depende principalmente de três fatores: o tamanho da série da carta, o tamanho da amostra e o intervalo de amostragem. Assim, os autores estabelecem uma função que minimiza o custo de identificar essas variações no nível da série buscando um tamanho de amostra e intervalo entre amostragens ótimos. Esses valores são identificados, entre outros fatores, em função dos limites de controle que são construídos sobre a suposição de normalidade. Segundo os autores, frequentemente variáveis aleatórias industriais não aderem ao modelo de distribuição normal e isso afetaria o tamanho da amostra e o intervalo entre amostragens ótimo. Os autores identificam que, para valores fixos de custos, o tamanho da amostra aumenta quanto maior a assimetria e praticamente permanece o mesmo em relação a variações na curtose das distribuições não normais experimentadas.

Yourstone e Zimmer (1992) analisaram o efeito da assimetria e curtose nas cartas de controle para médias e dentre as suas conclusões pode-se destacar que aumentando a curtose, aumenta o número de alarmes falsos. Além disso, verificaram que a assimetria leva a um deslocamento da média gerando, por consequência, sinais de dados não conformes.

Chan, Hapuarachchi e MacPherson (1998) comparam as cartas de controle e R com a família da distribuição de probabilidade de Tukey. Dentre as conclusões obtidas pelos autores, a pertinente a este estudo refere-se às distribuições que apresentam as caudas mais pesadas, e verificaram que as cartas de controle não são adequadas nessa situação.

Stowmbos e Reynolds (2000) investigaram o comportamento das cartas de Shewart X e MR além de outros gráficos para medidas individuais, utilizando as distribuições: normal, t de Student, gamma e exponencial, e também dados autocorrelacionados. Dentre suas conclusões é importante destacar para este estudo que, à medida que as distribuições se tornam mais assimétricas, o ARL₀ (average run lenght) diminui, indicando que os alarmes falsos irão ocorrer antecipadamente, resultando em perda de confiança no sistema das cartas de controle. Destaca-se que o ARL₀ é determinado como o inverso da probabilidade de erro do tipo I da carta em questão. Desse modo, em um ARL₀ menor está implícito um aumento dessa probabilidade. Além disso, eventualmente pode ocorrer diminuição da produtividade e consequente aumento dos custos. Considerando que os dados apresentam um comportamento estacionário, os autores contabilizaram o número de pontos que é necessário para detectar um deslocamento (ARL₁). As cartas X e MR revelaram que, para pequenos deslocamentos da média µ (menor que um desvio padrão) e/ou pequenos acréscimos em Σ (menos que 50%), os valores da medida de deslocamento para as distribuições t de Student e gamma são consideravelmente menores que quando esta for obtida para as cartas de controle sobre a suposição de normalidade.

Lin e Chou (2005b) efetuaram um estudo comparando o efeito de dados provenientes das distribuições t de Student e qui-quadrado χ² no comportamento da carta de controle de parâmetros variáveis (VP ). Segundo os autores, com pequenas amostras, o gráfico VP apresenta pequeno risco de falsos alarmes quando o processo encontra-se sob controle. Quando o VP utiliza tamanhos de amostra maiores, a distribuição amostral da média é aproximadamente normal e, portanto, o efeito da não normalidade pode ser ignorado. Lin e Chou (2005b) concluem após alguns exemplos numéricos que, quando ignorado o efeito da não normalidade e ajustando os limites do modo tradicional, a taxa de alarmes falsos pode ser intolerável.

Desse modo, o objetivo deste artigo é apresentar os resultados de um procedimento de simulação de Monte Carlo onde é verificada a probabilidade de erro do tipo I em cartas de controle e S de Shewhart quando da violação da suposição de normalidade. Nesse enfoque, observa-se também o comportamento das cartas de controle em relação a diferentes tamanhos de amostra. A seção 2 mostra a metodologia adotada na simulação deste estudo. A seção 3 apresenta a discussão e os resultados obtidos via simulação Monte Carlo. A seção 4 traz as considerações finais sobre os resultados encontrados e sugestões de novas pesquisas.

2. Metodologia

Neste estudo foi gerada uma série de amostras oriundas das distribuições t de Student, exponencial, qui-quadrado (χ²), gamma e Weibull. Em todos os casos, as unidades amostrais simuladas foram independentes e identicamente distribuídas, importantes suposições dos gráficos de controle de Shewhart. Também foram geradas amostras provenientes da distribuição normal, a fim de validar o algoritmo e a qualidade do gerador de números aleatórios. Além disso, os resultados dos dados gerados a partir da distribuição normal serviram de padrão na comparação dos resultados do comportamento dos gráficos de controle.

Destaca-se que a maior parte dessas distribuições tem aplicações na área de Engenharia de Produção. É o caso das distribuições exponencial, gamma e Weibull, por exemplo. Essas distribuições são importantes nos estudos de confiabilidade e delas originaram-se as leis de falhas exponencial e de Weibull (MEYER, 1983). Apesar de simétrica e similar à distribuição normal padrão, a distribuição t de Student foi utilizada no estudo de Lin e Chou (2005b) que comparou o comportamento de algumas variações de cartas de média, principalmente o gráfico para médias de parâmetros variáveis (VP ). Além das distribuições t com 4, 10 e 30 graus de liberdade, Lin e Chou (2005b) também simularam três distribuições gamma, com parâmetro de forma (Κ) igual a 4, 2 e 1 e parâmetro de escala (θ) igual a 1. Destaca-se que a distribuição gamma (1,1) é a distribuição exponencial com média igual a 1. A Tabela 1 apresenta as funções de probabilidade e os respectivos parâmetros utilizados nessa simulação.

Thumbnail

As distribuições selecionadas, em condições especiais, podem ser aproximadas pela distribuição normal, o que, entretanto, procurou-se evitar neste estudo. Pelo teorema do limite central, a distribuição amostral da média é aproximadamente normal para tamanhos de amostra suficientemente grandes, independente da distribuição original dos dados. Considerando a estatística s, para dados normalmente distribuídos, segundo Duncan (1974) não há diferença entre computar a probabilidade para s ou s². De fato, segundo o autor, a distribuição amostral do desvio padrão também é χ². Entretanto, essa distribuição apresenta média diferente de Σ por uma constante, assim como desvio padrão . Para dados não normais, não existem fórmulas exatas para a média e desvio padrão dessa distribuição, porém aproximações razoáveis podem ser obtidas e dependerão tanto do tamanho da amostra quanto do grau de assimetria dos dados (DUNCAN, 1974; COSTA; EPPRECHT; CARPINETTI, 2005).

As características teóricas de cada distribuição de probabilidade utilizada na simulação são apresentadas na Tabela 2.

Thumbnail

Como algumas distribuições são casos particulares de outras, como, por exemplo, a distribuição exponencial para a gamma ou a Weibull para a gamma, e consequentemente para a exponencial, buscou-se parametrizar as distribuições de modo que apresentassem características distintas em relação aos 3 primeiros momentos centrais, ou seja, média, variância e assimetria. Do mesmo modo, buscou-se parametrizá-las de forma que as distribuições não obtivessem boa aproximação pela curva de distribuição normal.

O método de simulação utilizado para a estimação das probabilidades de erro do tipo I é descrito nos sete passos a seguir.

Passo 1: Gerar uma amostra (subgrupo) de tamanho

n proveniente de uma determinada distribuição de probabilidade;
Passo 2: Calcular a média amostral

e o desvio padrão amostral s para essa amostra;
Passo 3: Repetir os passos 1 e 2 k vezes para obter k médias amostrais, denotadas por

₁,

₂...,

_k e k desvios padrão amostrais, denotados por

S₁,

S₂, ...,

S_k;
Passo 4: Grafar as k médias amostrais na carta

e os k desvios padrão na carta s e contabilizar o número de pontos fora de controle em ambos as cartas, com limites construídos a 3 sigmas (desvios padrão do processo);
Passo 5: Calcular a proporção

p

_1i de pontos

fora de controle, e a proporção

p

_2i de pontos s

_i fora de controle;
Passo 6: Repetir os passos 1 a 5 para os tamanhos de amostra

n = 3, 5, 7, 10, 15, 20 e 25; e
Passo 7: Repetir os passos 1 a 6 para as distribuições apresentadas na

Tabela 2.

O valor de k: tamanho da série foi de k = 500.000. Lin e Chou (2005b) simularam 250 séries de tamanho 20.000, num total de 5.000.000 de subgrupos. Para a carta , supondo normalidade, espera-se um alarme falso a cada 370 amostras. Simulou-se uma amostra aproximadamente 1.350 vezes maior, sendo suficiente para resultados com boa acurácia numérica. A simulação e análise dos resultados foram efetuadas com auxílio do pacote estatístico R. A Figura 1 traz os gráficos das distribuições apresentadas na Tabela 2 sobrepostos à curva normal, com média e desvio padrão idênticos aos das distribuições utilizadas na simulação.

3. Resultados

Esta seção apresenta os resultados obtidos via simulação Monte Carlo. Inicialmente será verificado o erro do tipo I nas cartas e S para a série de subgrupos gerados a partir da distribuição normal. Na sequência serão discutidos os resultados verificados quando os dados gerados eram não normais. As Tabelas 3 e 4 apresentam as estimativas das probabilidades de erro do tipo I para as cartas e S.

Thumbnail

Observando-se a Tabela 3, verifica-se que, no caso da distribuição normal, aproximadamente 0,27% dos valores marcados nas cartas de Shewhart apontou alarmes falsos nesses gráficos construídos com limites de controle em 3 sigmas, independentemente do tamanho da amostra. Esse resultado valida o algoritmo de simulação, pois mostra que foram obtidos os resultados esperados pela distribuição normal - P(-3<Z<+3)=0,0027. Além disso, apesar das discussões de custos na implementação de cartas de controle no controle da qualidade levantadas por Nagendra e Rai (1971), observa-se que, para dados gerados de um modelo de distribuição normal, o comportamento da carta de médias é indiferente para os vários tamanhos de amostra.

Quanto à carta S, observa-se que a probabilidade de erro do tipo I decresce para 0,27% conforme o tamanho da amostra é aumentado, atingindo esse nível para amostras de tamanho n = 15, 20 e 25. Valores de probabilidade de erro do tipo I acima de 0,27%, porém aceitáveis são observados neste gráfico para amostras de tamanho n = 7 e 10 (probabilidade de erro do tipo I aproximadamente 15% maior). Já para amostras de tamanho n = 3 e 5, o acréscimo na probabilidade de erro do tipo I é de aproximadamente 107% e 48%, respectivamente.

Analisando os dados provenientes das distribuições não normais simuladas, no que diz respeito à carta , os gráficos de controle apresentam probabilidade de erro do tipo I maior do que o nível de significância esperado, com exceção da distribuição t de Student. Em geral, essa probabilidade diminui com o aumento do tamanho da amostra. Os dados provenientes da simulação com distribuições exponencial e χ² têm comportamento semelhante quando o tamanho da amostra varia entre 3 e 25, inclusive na magnitude da probabilidade do erro do tipo I. Observa-se ainda que, à medida que o tamanho da amostra aumenta, a probabilidade de erro do tipo I diminui, assim como em dados normalmente distribuídos. Os dados gerados a partir das distribuições gamma e Weibull apresentam probabilidades de erro do tipo I ainda menores que as das distribuições exponencial e χ², mantendo comportamento similar em relação às variações no tamanho da amostra.

A Figura 2 apresenta as densidades da distribuição amostral da média calculada em cada subgrupo simulado com tamanho de amostra n = 3, 7, 15 e 25. O gráfico da distribuição normal simulada é apresentado apenas como referêrencia. Em relação às demais distribuições utilizadas na simulação, observa-se claramente o funcionamento do teorema do limite central, onde, conforme o tamanho da amostra aumenta, a densidade dos dados aproxima-se da forma de uma distribuição normal. Destaca-se que, mesmo nas distribuições geradas com maior assimetria, para tamanhos de amostra n maiores do que 7, as densidades aproximam-se razoavelmente do modelo de distribuição normal.

O gráfico S apresenta comportamento similar para todas as distribuições não normais simuladas. No geral, a probabilidade do erro do tipo I aumenta conforme aumenta o tamanho da amostra. Amostras maiores aumentam a precisão das estimativas, porém, em relação ao coeficiente assimetria, os dados gerados com distribuições mais assimétricas são justamente aquelas distribuições que apresentam maior probabilidade de erro do tipo I nesse tipo de carta de controle. Esses resultados eram esperados devido à influência do aumento da assimetria na variabilidade da distribuição de probabilidade da estatística s, conforme Duncan (1974). Destaca-se que, em média, o erro do tipo I é substancialmente maior do que o nível de significância adotado (em alguns casos 300 vezes maior). A Figura 3 apresenta as densidades da distribuição amostral do desvio padrão calculado em cada subgrupo simulado com tamanho de amostra n = 3, 7, 15 e 25.

Considerando a probabilidade de erro do tipo I para dados gerados a partir da distribuição t de Student, Moore (1957) verificou o comportamento da carta R (baseado na medida de variabilidade amplitude) e observou que o aumento do tamanho da amostra não melhora a situação da probabilidade de erro do tipo I. Moore (1957) observa que, frequentemente, menores tamanhos de amostra apresentaram melhores resultados de comportamento do gráfico R. Os resultados do gráfico S para dados provenientes de distribuições contínuas não normais apresentam resultados similares, conforme os resultados obtidos.

Verifica-se para os dados gerados a partir de todos os modelos que, para tamanhos de amostra menores, a distribuição do desvio padrão é assimétrica e que, com o aumento do tamanho da amostra, a distribuição amostral do desvio padrão também aproxima-se de um modelo normal. O que os gráficos mostram é que, no caso de dados oriundos de um modelo de distribuição normal, essa aproximação se dá de forma mais rápida, isto é, para tamanhos de amostra menores. Considerando as distribuições assimétricas, mesmo em amostra de tamanho n = 25, observa-se ainda a formação de uma cauda à direita.

4. Considerações finais

Cartas de controle são comumente usadas no controle de qualidade das indústrias modernas. A adequada utilização dessas ferramentas é fundamental para a percepção da existência de problemas nas linhas de produção. Uma carta construída sob violação de suas suposições pode acarretar vários problemas. Estudos destacam o aumento da probabilidade de erro do tipo I (alarmes falsos) na presença de dependência entre as observações (autocorrelação serial). Em relação à suposição de normalidade, ainda há carência de estudos sobre o assunto. Entre os apresentados, o objetivo geral era de comparar o comportamento entre diferentes tipos de cartas, como os estudos de Lin e Chou (2005a), por exemplo. Dessa forma, este artigo tem sua relevância por discutir o comportamento das cartas e S de Shewhart no que diz respeito ao número de alarmes falsos na violação da suposição de normalidade em diferentes tamanhos de amostra.

Os resultados apontaram que, em dados independentes e normal e identicamente distribuídos, observam-se alarmes falsos na carta na exata proporção esperada. Entretanto, quando da ocorrência de dados independentes e identicamente distribuídos, porém não normais, ocorre aumento na probabilidade do erro do tipo I. Esse erro, independentemente do tamanho da amostra, é maior. Entretanto, na maior parte dos casos a diferença diminuí com o aumento do tamanho da amostra.

No caso do gráfico S os resultados apontam que, conforme o tamanho da amostra cresce, a probabilidade do erro do tipo I também aumenta, na maior parte dos casos. Além disso, não só o erro para amostras pequenas é significativamente maior do que o nível de significância esperado, como esse erro praticamente dobra quando se considera o aumento no tamanho das amostras de 3 para 25.

Os resultados demonstram que o gráfico de Shewhart pode ser considerado robusto em relação a leves desvios da normalidade, tais como os observados nas distribuições com coeficiente de assimetria menor do que 1,5. Nessas condições, o efeito a considerar é o aumento da probabilidade do erro do tipo I, assim como ocorre nos modelos lineares discutidos por Montgomery (2001) e Mulliken e Johnson (1992). Esses resultados também foram encontrados por Yourstone e Zimmer (1992).

Moore (1957) afirma que amostras de tamanho 7 ou 8 são as mais razoáveis para uso quando não se conhece muito acerca da distribuição dos dados. Essa afirmação, à luz dos resultados apresentados, parece demasiadamente genérica. Pode-se verificar que para a implementação desses gráficos, amostras de tamanho 10 podem apenas ser consideradas para dados com coeficiente de assimetria menor do que 1,5, considerando como efeito um aumento leve na probabilidade do erro do tipo I. No caso dos dados serem provenientes de distribuições com assimetrias mais severas (>2), como no caso das distribuições exponencial, Χ² e Weibull simuladas, torna-se necessária a utilização de amostras maiores. Stowmbos e Reynolds (2000) discutiram que, conforme aumenta o nível de assimetria da distribuição dos dados, as cartas de controle tornam-se menos confiáveis para corroborar esses resultados. As conclusões de Stowmbos e Reynolds (2000) não se confirmam quando se considera o gráfico S. A probabilidade de erro do tipo I para dados não normais nesse gráfico é significativamente superior. No caso das distribuições exponencial e Χ², a probabilidade de erro do tipo I chegou a computar erros do tipo I médios acima de 6% quando o esperado, caso os dados fossem normais, variou entre 0,56% e 0,27%, dependendo do tamanho da amostra. Apesar dos resultados apresentarem esse aumento na probabilidade do erro do tipo I, essa probabilidade é menor quanto menor for o tamanho da amostra. Destaca-se que estudos como Cox (1954) e Moore (1957) apontaram que o comportamento da carta R, recomendada para amostras menores do que 10, também sofre um aumento no número de alarmes falsos sob não normalidade. O mesmo observou-se com relação ao gráfico S.

Para pesquisas futuras, deixa-se como sugestão verificar o comportamento dos gráficos R e S em amostras de tamanho inferior a 10 quando os dados não são provenientes de uma população com distribuição normal, para dados transformados e utilizando-se a distribuição amostral aproximada do desvio padrão ou, ainda, a distribuição original dos dados. Além disso, verificar o impacto na probabilidade dos erros do tipo I e II nas cartas de variabilidade (R e S), quando na presença de autocorrelação.

Agradecimentos

Agradecemos aos referees anônimos pelas sugestões que contribuíram significativamente para a melhoria deste trabalho.

Recebido: 21/05/2009

Aceito: 25/08/2011

ALWAN, L. C.; ROBERTS, H. V. Time-Series Modeling for Statistical Process Control. Journal of Business & Economic Statistics, v. 6, n. 1, p. 87-95, 1988.
CAULCUTT, R. The Rights and Wrongs of Control Charts. Applied Statistics, v. 44, n. 3, p. 279-288, 1995.
CHAN, L. K.; HAPUARACHCHI, K. P.; MACPHERSON, B. D. Robustness of X and R chart. IEEE Transactions on reliability, v. 37, n. 1, p. 117-123, 1998.
COSTA, A. F. B.; EPPRECHT, E. K.; CARPINETTI, L. C. R. Controle estatístico de qualidade São Paulo: Atlas, 2005.
COX, D. R. The mean and coefficient of variation of range in small samples from non-normal populations. Biometrika, v. 41, n. 3-4, p. 469-48, 1954.
DUNCAN, A. J. Quality control and industrial statistics 4th ed. Chicago: Irwin Professional Publishing, 1974.
JAMES, B. J. Probabilidade: um curso em nível intermediário. Rio de Janeiro: IMPA; CNPq, 1996.
JARRET, J. E.; PAN, X. The quality control chart for monitoring multivariate autocorrelated processes. Computational Statistics & Data Analysis, v. 51, p. 3862-3870, 2007. http://dx.doi.org/10.1016/j.csda.2006.01.020
LIN, Y.-C.; CHOU, C.-Y. On the design of variable sample size and sampling intervals charts X under non-normality. Internacional Journal of Production Economics, v. 96, p. 249-261, 2005a. http://dx.doi.org/10.1016/j.ijpe.2004.05.001
LIN, Y.-C.; CHOU, C.-Y. Non-normality and the variable parameters X control charts. European Journal of Operational Research, v. 176, p. 361-373, 2005b.
MEYER, P. L. Probabilidade: Aplicação à Estatística. Rio de Janeiro: LTC, 1983.
MULLIKEN, G. A.; JOHNSON, D. E. Analysis of Messy Data. Boca Ratón: Chapman & Hall/CRC, 1992. v. 1: Design of Experiments.
MONTGOMERY, D. Design and Analysis of Experiments Hoboken: John Willey & Sons, 2001.
MONTGOMERY, D. Introdução ao Controle Estatístico da Qualidade. Rio de Janeiro: LTC, 2004.
MOORE, P. Normality in Quality Control Charts. Applied Statistics, v. 6, n. 3, p. 171-179, 1957.
PEDRINI, D. C.; TEN CATEN, C. S.; MOREIRA JUNIOR, F. J. Proposal of an Alternative to Control Chart Based on Residuals Praha: ISBIS, 2008. Book of Abstracts.
NAGENDRA, Y.; RAI, G. Optimum sample size and sampling interval for controlling the mean of non-normal variables. Journal of the American Statistical Association, v. 66, n. 335, p. 637-640, 1971.
STOWMBOS, Z. G. et al. The state of statistical process control as we proceed into the 21st century. Journal of the American Statistical Association, v. 95, n. 451, p. 992-998, 2000.
STOWMBOS, Z. G.; REYNOLDS, M. R. Robustness to non-normality and autocorrelation of individuals control charts. Journal of Statistical Computation and Simulation, v. 66, p. 145-187, 2000.
WHEELER, D. J.; CHAMBERS, D. S. Understanding Statistical Process Control Knoxville: Statistical Process Control Inc., 1986.
YOURSTONE, S. A.; ZIMMER, W. J. Non-normality and the design of control chart averages. Decisions Sciences, v. 23, n. 5, p. 1099-1113, 1992. http://dx.doi.org/10.1111/j.1540-5915.1992.tb00437.x

*

FAMAT/PUCRS, Porto Alegre, RS, Brasil

Datas de Publicação

Publicação nesta coleção
21 Ago 2012
Data do Fascículo
Dez 2012

Histórico

Recebido
21 Maio 2009
Aceito
25 Ago 2011

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

[1] ALWAN, L. C.; ROBERTS, H. V. Time-Series Modeling for Statistical Process Control. Journal of Business & Economic Statistics, v. 6, n. 1, p. 87-95, 1988.

[2] CAULCUTT, R. The Rights and Wrongs of Control Charts. Applied Statistics, v. 44, n. 3, p. 279-288, 1995.

[3] CHAN, L. K.; HAPUARACHCHI, K. P.; MACPHERSON, B. D. Robustness of X and R chart. IEEE Transactions on reliability, v. 37, n. 1, p. 117-123, 1998.

[4] COSTA, A. F. B.; EPPRECHT, E. K.; CARPINETTI, L. C. R. Controle estatístico de qualidade São Paulo: Atlas, 2005.

[5] COX, D. R. The mean and coefficient of variation of range in small samples from non-normal populations. Biometrika, v. 41, n. 3-4, p. 469-48, 1954.

[6] DUNCAN, A. J. Quality control and industrial statistics 4th ed. Chicago: Irwin Professional Publishing, 1974.

[7] JAMES, B. J. Probabilidade: um curso em nível intermediário. Rio de Janeiro: IMPA; CNPq, 1996.

[8] JARRET, J. E.; PAN, X. The quality control chart for monitoring multivariate autocorrelated processes. Computational Statistics & Data Analysis, v. 51, p. 3862-3870, 2007. http://dx.doi.org/10.1016/j.csda.2006.01.020

[9] LIN, Y.-C.; CHOU, C.-Y. On the design of variable sample size and sampling intervals charts X under non-normality. Internacional Journal of Production Economics, v. 96, p. 249-261, 2005a. http://dx.doi.org/10.1016/j.ijpe.2004.05.001

[10] LIN, Y.-C.; CHOU, C.-Y. Non-normality and the variable parameters X control charts. European Journal of Operational Research, v. 176, p. 361-373, 2005b.

[11] MEYER, P. L. Probabilidade: Aplicação à Estatística. Rio de Janeiro: LTC, 1983.

[12] MULLIKEN, G. A.; JOHNSON, D. E. Analysis of Messy Data. Boca Ratón: Chapman & Hall/CRC, 1992. v. 1: Design of Experiments.

[13] MONTGOMERY, D. Design and Analysis of Experiments Hoboken: John Willey & Sons, 2001.

[14] MONTGOMERY, D. Introdução ao Controle Estatístico da Qualidade. Rio de Janeiro: LTC, 2004.

[15] MOORE, P. Normality in Quality Control Charts. Applied Statistics, v. 6, n. 3, p. 171-179, 1957.

[16] PEDRINI, D. C.; TEN CATEN, C. S.; MOREIRA JUNIOR, F. J. Proposal of an Alternative to Control Chart Based on Residuals Praha: ISBIS, 2008. Book of Abstracts.

[17] NAGENDRA, Y.; RAI, G. Optimum sample size and sampling interval for controlling the mean of non-normal variables. Journal of the American Statistical Association, v. 66, n. 335, p. 637-640, 1971.

[18] STOWMBOS, Z. G. et al. The state of statistical process control as we proceed into the 21st century. Journal of the American Statistical Association, v. 95, n. 451, p. 992-998, 2000.

[19] STOWMBOS, Z. G.; REYNOLDS, M. R. Robustness to non-normality and autocorrelation of individuals control charts. Journal of Statistical Computation and Simulation, v. 66, p. 145-187, 2000.

[20] WHEELER, D. J.; CHAMBERS, D. S. Understanding Statistical Process Control Knoxville: Statistical Process Control Inc., 1986.

[21] YOURSTONE, S. A.; ZIMMER, W. J. Non-normality and the design of control chart averages. Decisions Sciences, v. 23, n. 5, p. 1099-1113, 1992. http://dx.doi.org/10.1111/j.1540-5915.1992.tb00437.x