SciELO - Scientific Electronic Library Online

 
vol.17 issue1Generation of constrained two-dimensional guillotine cutting patterns via dynamic programming and and/or-graph searchColumn generation methods for assignment problems author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

Share


Production

Print version ISSN 0103-6513On-line version ISSN 1980-5411

Prod. vol.17 no.1 São Paulo Jan./Apr. 2007

http://dx.doi.org/10.1590/S0103-65132007000100004 

Aplicação de método e técnica multivariados para previsão de variáveis termoambientais e perceptivas

 

Application of multivariate method and technique for prediction of thermo-environmental and perceptive variables

 

 

Anand Subramanian; Luiz Bueno da Silva; Antonio Souto Coutinho

UFPB

 

 


RESUMO

Um ambiente ergonômico ideal para exercer-se atividades bancárias precisa estar termicamente adequado, principalmente segundo a percepção térmica daqueles que realmente promovem a produtividade: os seres humanos. Esta pesquisa possibilitou conhecer-se as características termoambientais destas atividades e, a partir dos dados coletados, aplicou-se o método da Regressão Linear e a técnica exploratória Análise Discriminante para determinar quais variáveis térmicas representam melhor a sensação térmica declarada pelo trabalhador. Para isso, determinaram-se as variáveis do balanço térmico e a sensação térmica de cada trabalhador, baseando-se em normas internacionais. Constatou-se que a temperatura de bulbo seco foi a variável que representou melhor estas preferências e, em situação de conforto, 23,79ºC é a temperatura ideal para que estas atividades sejam exercidas com satisfação térmica.

Palavras-chave: Sensação térmica, variáveis térmicas, ergonomia, regressão linear, análise discriminante.


ABSTRACT

An ergonomically ideal environment for bank services needs to be thermally adequate, mainly according to the thermal perceptions of those responsible for the productivity, namely, human beings. This research has made it possible to recognize the relevant thermo-environmental characteristics of these activities and, based on the collected data, to apply the Linear Regression method and Discriminant Analysis exploratory technique to determine the thermal variables that may best represent the employee's reported thermal sensations. For this purpose, the variables of thermal balance and sensation of each worker were determined, based on available international standards. It was found that the dry bulb temperature was the one that better represented these preferences. In the comfort situation, 23.79ºC was the ideal temperature for these activities to be performed with thermal satisfaction.

Key words: Thermal sensation, thermal variables, ergonomics, linear regression, discriminant analysis.


 

 

INTRODUÇÃO

Desde o início de sua existência, o ser humano tem procurado se proteger das intempéries e buscado as melhores condições de conforto térmico. Partindo da caverna e da fogueira, chegou aos atuais sistemas de ventilação e ar condicionado atuados por controle remoto. Com o tempo, verificou que tinha mais motivação para as tarefas diárias quando o ambiente lhe proporcionava conforto; e assim viu a possibilidade de aumentar a produtividade melhorando as condições de conforto. Todavia, o conforto é função de quatro variáveis climáticas e duas pessoais que atuam simultaneamente, tornando a pesquisa bastante árdua.

Tem-se constatado a necessidade de se estabelecer relações que possibilitem predizer uma ou mais variáveis em termos de outras, ou quando se quer saber a relação entre essas variáveis. Por exemplo, as sensações térmicas declaradas subjetivamente pelos trabalhadores possuem uma forte ou fraca associação com o percentual de insatisfeitos calculados através de modelos desenvolvidos em outros países? Existem uma ou mais variáveis do balanço térmico que explicariam melhor que as outras a variação da sensação térmica declarada por trabalhadores durante uma jornada de trabalho? A relação entre os valores teóricos de sensação térmica e a percentagem de insatisfeitos (índices da norma 7730/94) pode ser ou não mais representativa do que os correspondentes valores declarados subjetivamente?

Um problema de grande importância no estudo de variáveis térmicas que possuem distribuição normal é a análise simultânea entre elas, com a finalidade de averiguar se existe alguma correlação significativa entre as mesmas ou de investigar a possibilidade de se fazer previsões a respeito de valores de uma das variáveis correlacionadas, com base no conhecimento dos valores das outras.

Como se poderia melhor controlar alguma variável que compõe o ambiente de trabalho, entre essas, as de conforto térmico e as que fazem parte do processo produtivo, sem antes fazer um minucioso estudo do grau de relação entre essas variáveis? Como descobrir os problemas provenientes da irritabilidade ocular ou do ressecamento da mucosa nasal em profissionais que exercem suas atividades em ambientes informatizados climatizados sem, primeiro, verificar a relação entre a variação da umidade do ar e o tempo da atividade realizada pelos mesmos durante várias jornadas de trabalho?

Assim, se o conhecimento prévio sobre a atividade, as características do ambiente de trabalho, o tempo de permanência do homem nesse ambiente, a realização do planejamento em conjunto de projetos lumínico e térmicos, e se as particularidades do próprio homem podem contribuir para o desenvolvimento de projetos ergonômicos de ambientes de trabalho seguros e produtivos, métodos e técnicas multivariados poderão auxiliar na previsão e determinação de variáveis e valores ideais de conforto térmico, como também avaliar se estas variáveis e estes valores estão de acordo com as preferências térmicas de trabalhadores, o que contribuiria de maneira significativa para o sucesso de projetos ergonômicos de ambientes de trabalho. Desta forma, este artigo apresenta teoricamente os modelos de regressão linear seguidos da análise discriminante, com o objetivo de prever, determinar e classificar variáveis termoambientais segundo a percepção térmica das pessoas que exercem suas atividades em um centro de processamento de dados do setor bancário.

 

CONFORTO TÉRMICO

Pode-se considerar o homem como um sistema térmico e aplicar a primeira lei da termodinâmica para analisar as parcelas de energia térmica envolvidas na interação desse sistema com o ambiente no qual está envolvido. Essas parcelas são: metabolismo, trabalho externo, convecção e evaporação que ocorrem no aparelho respiratório e na pele, assim como a radiação também na pele. Os processos realizados na pele sofrem a influência da vestimenta utilizada pela pessoa. A interação térmica homem–ambiente envolve quatro variáveis climáticas: temperatura, umidade e velocidade do ar e temperatura radiante média; e duas pessoais: metabolismo, função da atividade desenvolvida, e resistência térmica das vestes.

No balanço térmico da pessoa o saldo deve ser nulo, pois o positivo implicaria o surgimento de doenças típicas de ambientes quentes, como tontura e desfalecimento, desidratação, distúrbios cutâneos, psiconeurose, hipertermia, etc.; por outro lado, o saldo negativo pode provocar os males característicos dos ambientes frios: enregelamento dos membros, ulcerações, crises reumáticas e respiratórias e até a hipotermia. Todavia, dentro de certos limites, o sistema de termorregulação anula o saldo através de mecanismos tais como vasodilatação, vasoconstrição, sudorese e tiritar. Esses mecanismos exigem esforço do organismo, implicando desconforto. Entre os limites das faixas muito frio e muito quente, há um pequeno intervalo que caracteriza o conforto térmico, no qual o esforço do sistema de termorregulação é mínimo.

 

REGRESSÃO LINEAR

A análise de regressão consiste em um método de modelagem que avalia a relação entre uma variável dependente contínua Y e uma ou mais variáveis contínuas independentes X1, X2..., Xk. O objetivo da análise de regressão é identificar a função que descreve, da melhor forma, a relação entre essas variáveis para que se possa prever que valor a variável dependente vai assumir quando forem atribuídos valores para a variável independente (RAGSDALE, 2001).

O modelo de regressão linear simples (MRLS)

Conforme Charnet et al. (1999), seja Y uma variável aleatória de interesse, muitas vezes denominada variável resposta, e X uma variável aleatória denominada auxiliar ou regressora. O MRLS descreve a variável Y como uma soma de uma quantidade determinística e uma quantidade aleatória. A parte determinística, uma reta em função de X, representa a informação sobre Y que já se pode "esperar", apenas com o conhecimento da variável X. A parte aleatória, denominada erro, representa os inúmeros fatores que, conjuntamente, podem interferir em Y. Assim, pode-se interpretar que o erro provoca uma distorção sobre a parte determinística de Y.

Suponha que erros positivos ou negativos possam ocorrer, mais que isso, e que a variável erro tenha esperança igual a zero. Suponha, ainda, que a variância da variável erro não depende do valor específico de X. Utilizando-se b0 e b1 para denotar os coeficientes da reta; e, a variável erro; s2, a variância da variável erro; e xi, um valor específico da variável X, então o MRLS pode ser expresso como

com b0, b1 e xi constantes; E[ei] = 0 ; Var[ei] = s2 ; Cov[ei, ej] = 0, para i ¹ j e i, j = 1,...,n. Quando a condição do modelo de probabilidade do erro é a normalidade, o modelo de regressão linear simples amostral correspondente adota a equação (4) sujeita às seguintes restrições: b0, b1 e xi constantes; ei ~ n(0; s2); Cov[ei, ej] = 0 para i ¹ j e i, j = 1,...,n.

Estimadores do MRLS

Para Magalhães e Lima (2002) a estimação de bo e b1 pode ser feita através do método dos mínimos quadrados, que consiste em minimizar a soma dos quadrados dos resíduos, obtidos através da diferença entre valores observados y e valores esperados E(Y | X = x), calculados para cada X = x.

Como em geral os pontos não estão perfeitamente alinhados, escolhe-se a "melhor" reta possível no sentido de minimizar a Soma de Quadrados SQ(b0, b1), dada por:

A solução do sistema de equações envolvendo as derivadas de SQ(b0, b1), em relação a b0 e b1 fornecerá os estimadores de mínimos quadrados para b0 e b1 . Verifica-se então:

Anderson et al. (2002) definem a equação da regressão linear simples estimada da seguinte maneira:

Medidas de Variação na Regressão

De acordo com Levine et al. (2000), para examinar como a variável independente prevê bem a variável dependente em um modelo estatístico, é preciso desenvolver diversas medidas de variação. A seguir serão expostas algumas dessas medidas.

Obtenção da soma dos quadrados mínimos

A primeira medida, a Soma Total dos Quadrados, SQT, é uma medida de variação dos valores de Yi em torno de sua média aritmética . Em uma análise de regressão, a soma total dos quadrados pode ser subdividida em variações explicadas ou Soma dos Quadrados devida à Regressão, SQReg, que é atribuída à relação entre X e Y, e variações inexplicadas ou a Soma de Quadrados dos Resíduos, SQR, que é atribuída a outros fatores diferentes da relação entre X e Y.

Essas medidas de variação podem ser representadas conforme demonstração abaixo:

O Coeficiente de Determinação

Suponha que SQR, SQReg e STQ estejam bem definidas, então o coeficiente de determinação r2 é expresso, segundo Levine et al. (2000) como:

Charnet et al. (1999) ainda esclarecem que o coeficiente de determinação r2 é a proporção da variabilidade dos Ys observados explicada pelo modelo considerado em que o valor de r2 pertence ao intervalo [0;1]; e quanto mais próximo de 1, melhor o ajuste do modelo considerado.

O coeficiente de correlação

De acordo com Magalhães e Lima (2002), o coeficiente de correlação é o coeficiente entre a covariância e o produto dos desvios-padrão de X e Y, isto é:

A divisão pelo produto dos desvios-padrão, sX sY, tem a função de padronizar a medida e torná-la possível de ser utilizada para comparações com outras variáveis. Para valores próximos de ± 1, a correlação é considerada forte.

Conforme Levine et al. (2000), se uma análise de correlação está sendo realizada em um conjunto de dados, o coeficiente de correlação da amostra r pode ser calculado através da equação (12):

Pressupostos do MRLS

Os quatro principais pressupostos da regressão segundo Levine et al. (2000) são:

Normalidade – requer que os valores de Y sejam normalmente distribuídos para cada valor de X. Enquanto a distribuição dos valores de Yi em torno de cada nível de X não for extremamente diferente de uma distribuição normal, inferências sobre a linha de regressão e sobre os coeficientes de regressão não serão seriamente afetadas.

Homocedasticidade – requer que as variações em torno da linha de regressão sejam constantes para todos os valores de X. Isto significa que Y varia na mesma proporção, quando X for um valor baixo e quando X for um valor elevado.

Independência de erros – requer que o erro (diferença residual entre valores observados e previstos de Y ) deva ser independente para cada valor de X.

Linearidade – esse pressuposto estabelece que a relação entre variáveis deve ser linear. Duas variáveis poderiam perfeitamente ser relacionadas de uma maneira não-linear, e o coeficiente de correlação linear seria igual a 0, indicando não haver qualquer relação.

Teste da falta de ajuste do MRLS

Charnet et al. (1999) enfatizam que para testar estatisticamente a falta de ajuste do MRLS, precisa-se de replicações, ou seja, deve-se ter pelo menos dois valores da variável resposta para alguns valores da variável regressora.

Suponha que se tenha k valores distintos da variável regressora X: x1...,xk. Para o valor de xi observa-se ni valores da variável resposta Y, donde observações. Neste contexto usa-se a notação yij, sendo o índice i correspondente ao índice de xi e o índice j uma enumeração dos ni valores. Assim, tem-se que

As expressões acima apresentam um estimador natural para Var[Y|x], s2, que não está baseado no MRLS. Por exemplo, se observarmos y11, y12 ,...y1n1 quando X = x1, um estimador para Var[Y|x] seria dado pela variância amostral desta amostra, ou seja:

sendo a média amostral de todos os valores observados para X = x1. Pode-se definir outros estimadores através das variâncias amostrais relativas aos outros valores de X. No entanto é melhor combinar as k variâncias amostrais utilizando assim toda a amostra.

Denota-se o estimador , no qual o subscrito ep significa "erro puro", por depender da variação pura e não do MRLS, como

sendo a média amostral dos valores de Y correspondentes a X = xi. No contexto do MRLS tem-se que o estimador de VAR[Y|x] é , que depende da adequação do modelo. Através da comparação destes dois estimadores de s2, pode-se verificar a adequação do MRLS. Usando a notação acima, a equação do MRLS amostral é expressa da seguinte forma:

e a Soma de Quadrados dos Resíduos é dada por:

Nota-se que para cada valor distinto xi tem-se apenas um valor yi, não sendo necessário o segundo índice. Neste caso a SQR pode ser particionada em duas outras somas de quadrados, conforme é demonstrado abaixo:

As parcelas da expressão dada na equação (17) têm uma denominação especial:

é a Soma de quadrados dos Resíduos – SQR, representando a variação em torno da reta;

é a soma de quadrados do erro puro – SQEp, representando a variação de Y, para X fixo, independente do modelo;

é a soma de quadrados da falta de ajuste SQFa, representando a falta de ajuste do modelo.

Através da equação (17), é estabelecido que SQR = SQEp + SQFa. Note que a SQR na equação (14) é o numerador da expressão para , e a SQEp indica diferenças entre os dois estimadores e, conseqüentemente, demonstra evidências contra a adequação do MRLS. Outra interpretação é a de que quanto mais alto for o valor da SQFa pior será o ajuste do modelo, visto que se o ajuste fosse perfeito seria exatamente igual a , donde SQFa = 0, para i = 1,...,k.

Considerando os argumentos acima, pode-se construir um teste para as hipóteses:

H0 : O MRLS é adequado

H1 : O MRLS não é adequado

com base na estatística a qual, sob hipótese H0, tem distribuição F de Snedecor com (k – 2) e (nk) graus de liberdade (Teorema de Cochran). Portanto, rejeita-se a hipótese de o modelo ser adequado se a estatística do teste for maior que k2Fn k (a), o quantil (1 – a) de F com (k – 2) e (n k) graus de liberdade, para algum nível de significância prefixado.

Teste para os parâmetros da população no MRLS

De acordo com Levine et al. (2000), pode-se determinar se existe relação significativa entre as variáveis X e Y testando se b1 (a verdadeira inclinação) é igual a 0. Se essa hipótese for rejeitada, poder-se-ia concluir que há evidências de uma relação linear. As hipóteses nula e alternativa poderiam ser declaradas da seguinte maneira:

H0: b1 = 0 (não existe relação)

H1: b1 ¹ 0 (existe relação)

A estatística de teste t é igual à diferença entre a inclinação da população dividida pelo erro padrão da inclinação, conforme apresentado na equação (18).

onde

e SYX é o erro padrão da estimativa1.

Este teste segue uma distribuição t com n – 2 graus de liberdade. A hipótese de o modelo ser adequado é rejeitada se a estatística do teste for maior que o t tabelado. Vale salientar que sob a hipótese nula, b1 = 0, de modo que

Análise de Resíduos

Para Charnet et al. (1999), a análise de um modelo de regressão linear tem uma relação muito forte com a qualidade do ajuste feito, bem como com a confiabilidade dos testes estatísticos sobre os parâmetros do modelo. Nesse sentido, a análise dos resíduos tem uma importância fundamental na verificação da qualidade dos ajustes de modelos. Basicamente, essa análise fornece evidências sobre possíveis violações nas suposições do modelo, tais como a de normalidade e a homocedasticidade, e quando for o caso ainda fornece indícios da falta de ajuste do modelo proposto.

Para Levine et al. (2000), o resíduo é igual ao valor observado Yi menos o valor previsto , isto é,

Pode-se avaliar a adequação do modelo de regressão ajustado plotando os resíduos no eixo vertical e os valores correspondentes aos valores de Xi da variável independente no eixo horizontal. Se o modelo ajustado for apropriado para os dados, não haverá padrão aparente de resíduos em relação a Xi. No entanto, se o modelo ajustado não for apropriado, existirá uma relação entre os valores de Xi e os resíduos ei.

É possível calcular, também, os resíduos padronizados e os de Student. Os resíduos de Student, expressos na equação (22) são os padronizados, ajustados para a distância do valor de X médio, isto é,

onde

Esses resíduos de Student permitem considerar suas magnitudes em unidades que refletem as variações padronizadas em torno da linha de regressão.

Medindo a autocorrelação

Um dos pressupostos do modelo de regressão básico, já citado anteriormente, é a independência dos resíduos. Esse pressuposto é geralmente violado quando os dados são coletados ao longo de períodos seqüenciais de tempo, uma vez que um resíduo, em qualquer ponto no tempo, pode tender a ser idêntico a resíduos em pontos adjacentes no tempo. Levine et al. (2000) denominam este padrão presente nos resíduos de autocorrelação. Quando uma substancial correlação se encontra presente em um conjunto de dados, a validade de um modelo de regressão ajustado pode ficar seriamente comprometida.

O método mais simples para averiguar se existe autocorrelação em um conjunto de dados é plotando os resíduos ou os padronizados, em ordem cronológica. Se o efeito de uma autocorrelação positiva estiver presente, grupos de resíduos com o mesmo sinal estarão presentes e um padrão aparente será prontamente detectado.

Além dos gráficos de resíduos, a autocorrelação também pode ser detectada e medida pela utilização da estatística de Durbin-Watson. Essa estatística mede a correlação entre cada resíduo e o resíduo para o período de tempo imediatamente antecedente àquele de interesse. Levine et al. (2000) definem a estatística de Durbin-Watson (D) da seguinte forma:

onde ei = resíduo no período de tempo i.

Para melhor compreender o que a estatística de Durbin-Watson está mensurando, faz-se necessário examinar a composição da estatística D na equação (23). O numerador representa a diferença ao quadrado entre dois resíduos sucessivos, somados desde a segunda observação até a n-ésima observação. O denominador representa a soma dos quadrados dos resíduos. Quando resíduos sucessivos são positivamente autocorrelacionados, o valor de D irá se aproximar de 0. Se os resíduos não forem correlacionados, o valor de D estará próximo de 2.

O modelo de Regressão Linear Múltipla (MRLM)

A análise de regressão múltipla é um estudo de como a variável dependente y está relacionada com duas ou mais varáveis independentes. Pode-se afirmar que o MRLM é uma extensão do MRLS. Anderson et al. (2002) descrevem o MRLM da seguinte forma:

onde x1, x2,..., xp são constantes, b0, b1, b2,,..., bp são parâmetros denominados coeficientes de regressão parciais, e e os resíduos.

Através da extensão do método dos mínimos quadrados empregado no MRLS, pode-se chegar à equação linear da regressão múltipla, isto é,

O coeficiente de determinação múltipla

O coeficiente de determinação R2 pode ser interpretado como a proporção da variabilidade que pode ser estimada pela equação da regressão múltipla. Todavia, quando multiplicado por 100, o coeficiente de determinação múltipla pode ser interpretado como a porcentagem da variabilidade em y que pode ser explicada através da equação de regressão.

O coeficiente de determinação múltipla ajustado

Anderson et al. (2002) observaram que muitos analistas preferem ajustar o R2 para o número de variáveis independentes, a fim de se evitar superestimar o impacto de adicionar uma variável independente na quantidade de variação explicada pela equação da regressão estimada.

A estatística R2 pode ser ajustada como:

onde n representa o número de observações da amostra, k representa o número de variáveis independentes no modelo e , o coeficiente de determinação múltipla ajustado (RAGSDALE, 2001).

Testando a significância da relação entre a variável dependente e as variáveis explicativas

Como na regressão linear múltipla existe mais de uma variável explicativa, as hipóteses nula e alternativa podem ser escritas da seguinte forma:

H0: b1 = b2 = ... bn = 0 (não existe relação linear entre a variável dependente e as variáveis explicativas)

H1: Pelo menos um bj ¹ 0 (pelo menos um coeficiente de regressão não é igual a 0)

Essa hipótese nula pode ser verificada através do teste F. Quando se testa a significância dos coeficientes de regressão, a medida do erro aleatório é chamada de variância do erro, de modo que o teste F é a fração da variância decorrente da regressão dividida pela variância do erro, conforme mostra a equação (27):

onde QMReg é igual ao Quadrado Médio devido à Regressão, e QMRes o Quadrado Médio devido à variação Residual.

A regra de decisão é rejeitar H0 no nível de significância a se F > FS(P, n – P – 1), onde P é o número de variáveis explicativas no modelo de regressão, e F é a estatística de teste, a partir de uma distribuição F com n – P – 1 graus de liberdade, conforme pode ser visto na Tabela 1.

Teste para os parâmetros da população no MRLM

Para testar a hipótese de que a inclinação da população b1 é igual a 0, utilizou-se a equação (20)

Por outro lado, esta expressão pode ser escrita de uma forma mais genérica para a regressão múltipla, como

onde Sbk é o erro padrão do coeficiente de regressão bk, t corresponde à estatística t para um distribuição com n P 1 graus de liberdade, sendo P o número de variáveis dependentes na equação de regressão múltipla.

Multicolinearidade

Para Ragsdale (2001), o termo multicolinearidade é utilizado para descrever uma situação onde as variáveis independentes num dado modelo de regressão estão correlacionadas entre si. Segundo Levine et al. (2000), nessas situações, variáveis colineares não fornecem novas informações, e torna-se difícil separar o efeito dessas variáveis na variável dependente ou na variável resposta. Nesses casos, os valores dos coeficientes de regressão para as variáveis correlacionadas podem flutuar drasticamente, dependendo se as variáveis estão ou não incluídas no modelo. Um método de mensuração da colinearidade utilizado refere-se ao Fator Inflacionário da Variância (FIV) para cada variável explicativa, o qual é definido na forma da equação (29):

onde é o coeficiente de determinação múltipla da variável explicativa Xj com todas as outras variáveis X, para j = 1, 2, 3....n.

Se existirem somente duas variáveis explicativas, é somente o coeficiente de determinação entre X1 e X2. Se, por exemplo, existissem três variáveis explicativas, então seria o coeficiente de determinação múltipla de X1 com X2 e X3.

Se um conjunto de variáveis explicativas não for correlacionado, então FIVj será igual a 1. Se o conjunto for altamente correlacionado, então o FIVj poderá até exceder a 10. Marquardt apud Levine et al. (2000) sugere que se o FIVj for maior que 10, então existe demasiada correlação entre a variável Xj e as outras variáveis explicativas. No entanto, outros pesquisadores sugerem um critério mais conservador, que empregaria alternativas para a regressão dos mínimos quadrados se o FIVj exceder a 5.

 

ANÁLISE DISCRIMINANTE

Para Ragsdale (2001) a análise discriminante é uma técnica estatística que usa a informação disponível em um grupo de variáveis independentes, com distribuição normal, para prever o valor de uma variável categórica dependente. Justamente pelo fato de a variável dependente ser categórica, ou discreta, a análise discriminante se diferencia da regressão.

Segundo Malhotra (2001), os objetivos da análise discriminante são: estabelecer funções discriminantes, ou combinações lineares das variáveis independentes ou prognosticadoras, que melhor discriminem entre as categóricas da variável dependente; verificar se existem diferenças significativas entre os grupos, em termos das variáveis prognosticadoras; determinar as variáveis preditoras que mais contribuem para as diferenças entre grupos; enquadrar ou classificar os casos a um dos grupos, com base nos valores das variáveis preditoras; e avaliar a precisão da classificação.

Para Ragsdale (2001), um modelo de análise discriminante envolve combinações lineares da seguinte forma:

onde é o escore discriminante, b o coeficiente de regressão ou peso discriminante e x a variável prognosticadora ou independente.

As estatísticas associadas à análise discriminante são:

Correlação Canônica – mede a relação entre a função discriminante isolada e o conjunto de variáveis do grupo;
Centróide – é a média dos valores dos escores discriminantes de um determinado grupo;

Matriz de Classificação – é aquela que contém o total de casos classificados corretamente e mal classificados;

Coeficientes da função discriminante (não padronizados) – são os multiplicadores de variáveis, quando as variáveis estão nas unidades de medida originais;
Escores Discriminantes – corresponde aos valores de ;
Autovalor – é a razão da soma de quadrados entre grupos para a mesma soma dentro de grupos. Grandes autovalores implicam funções superiores;

Teste F teste de significância;

l de Wilks ou estatística U é, para cada prognosticador, a razão da soma e quadrados dentro dos grupos para a soma total de quadrados. Se l @ 1, então as médias dos grupos não diferem umas das outras; se l @ 0, elas diferem;

Médias de Grupos e desvios padrão de grupos – são calculados para cada prognosticador e para cada grupo;

Coeficientes da função discriminante padronizada – são usados como multiplicadores quando as variáveis foram padronizadas para média 0 e variância 1.
Correlações estruturais – representam as correlações simples entre os prognosticadores e a função discriminante;
Matriz de correlação total – se os casos são tratados como se proviessem de uma única amostra, calculando-se então as correlações, obtém-se uma matriz de correlação total.
Matriz estrutural – Correlações combinadas dentro de grupos entre variáveis discriminantes e funções discriminantes canônicas (variáveis ordenadas por tamanhos da correlação dentro da função).

A análise discriminante pode envolver dois grupos ou mais. Para a realização da mesma, podem-se adotar os seguintes estágios:

Formulação do problema – O primeiro passo da análise discriminante é formular o problema identificando os objetivos, a variável dependente e as variáveis independentes. A variável dependente deve consistir de duas ou mais categorias mutuamente excludentes e coletivamente exaustivas. Quando a variável dependente é escalonada em forma de intervalo ou razão, deve ser primeiramente convertida em categorias. As variáveis prognosticadoras devem ser selecionadas com base em um modelo teórico ou em uma pesquisa prévia. O próximo passo consiste em dividir a amostra em duas partes. Uma delas é chamada amostra de análise, que é utilizada para estimar a função discriminante. A outra é denominada amostra de validação, que é reservada para validar a função discriminante.
Estimação dos coeficientes da função discriminante – Uma vez identificada a amostra de análise pode-se estimar os coeficientes da função discriminante. Existem dois métodos amplos de abordagem. O método direto consiste em estimar a função discriminante de modo que todos os prognosticadores sejam incluídos simultaneamente. Neste caso, todas as variáveis independentes são incluídas, independentemente de seu poder discriminatório. Este método é adequado quando, com base em uma pesquisa prévia ou em um modelo teórico, o pesquisador deseja que a discriminação esteja baseada em todos os prognosticadores. Uma abordagem alternativa é o método passo a passo. Na análise discriminante passo a passo, as variáveis prognosticadoras são introduzidas seqüencialmente, com base em sua capacidade de discriminar entre os grupos. Este método é adequado quando o pesquisador deseja selecionar um subconjunto dos prognosticadores para inclusão na função discriminante.

Determinação da significância da função discriminante – Pode-se testar estatisticamente a hipótese nula, de que as médias de todas as funções discriminantes em todos os grupos sejam iguais. Uma forma de realização desse teste é baseada no l de Wilks. Testando-se simultaneamente várias funções (como é o caso da análise discriminante múltipla), a estatística l de Wilks é o produto dos l univariados de cada função. Estima-se o nível de significância com base em uma transformação qui-quadrado da estatística.

Interpretação e validação – A interpretação dos pesos ou coeficientes da discriminante é similar à do caso da análise de regressão múltipla. O valor do coeficiente para um determinado prognosticador depende dos outros prognosticadores incluídos na função discriminante. Os sinais dos coeficientes são arbitrários, mas indicam que valores de variável resultam em grandes ou pequenos valores da função associando-os a grupos particulares. Dada a multicolinearidade nas variáveis prognosticadoras, não há medida não ambígua da importância relativa dos prognosticadores na discriminação dos grupos. Com esta precaução em mente, pode-se ter alguma idéia da importância relativa das variáveis, examinando a magnitude absoluta dos coeficientes padronizados da função discriminante. De modo geral, os prognosticadores com coeficientes padronizados relativamente grandes contribuem mais para o poder discriminatório da função, em comparação com prognosticadores com coeficientes menores.

 

METODOLOGIA

Esta metodologia constou do desenvolvimento das seguintes etapas:

a) Avaliação das condições climáticas em ambientes de trabalho. Utilizaram-se equipamentos do Laboratório de Análise do Trabalho (LAT) do Departamento de Engenharia de Produção (DEP) da Universidade Federal da Paraíba (UFPB), que atendem às exigências da Norma ISO-DIS 7726/1996 (Ergonomics of The Thermal Environment – Instruments for Measuring Physical Quantities). Questionários foram distribuídos a todas as pessoas participantes da pesquisa, para registrarem as respectivas opiniões sobre sensação térmica, tipo de roupa utilizada e dados pessoais, conforme a Norma ISO 10551/1995 (Subjective Judgment Scales).

b) Verificação da normalidade das amostras coletadas através das medidas de BOX-COX. Trata-se de um teste de normalidade de Bera-Jarque, o qual é uma conseqüência do estudo feito por Shenton e Bowman em 1977, que é construído com as expressões para assimetria e curtose, de acordo com a equação (31):

onde: = Assimetria; b2 = Curtose; e c2 = Qui-quadrado.

Quando b1 e b2 são grandes, a expressão acima também é, e, por sua vez, maior que o Qui-quadrado (c2) tabelado. Ou seja, se o teste aplicado às variáveis coletadas ultrapassar o valor de 5,91, que representa 2 graus de liberdade e uma freqüência de 0,95 na tabela do Qui-quadrado, a amostra relativa à variável testada não obedecerá a uma curva normal.

c) Construção de modelo de regressão linear. Segundo Tabachnick e Fidel (1989), Levine et al. (2000), Charnet et al. (1999) e Ragsdale (2001), o modelo geral de uma equação linear pode ser expresso como uma variável dependente (VD) em função de um conjunto de variáveis independentes (VI), ou seja, pode-se expressar o valor esperado da variável dependente (VD) como função de várias variáveis regressoras (VI). Desta forma utilizou-se o modelo apresentado na equação (32), a saber:

onde:

yP =

Variável dependente (S – sensação térmica) predita pela variável de conforto térmico;

b0 = Constante de regressão ou intercepto;
bi = Coeficiente parcial ou parâmetro da regressão para a variável xi;
xi = Variáveis térmicas;
e = Erro ou resíduo devido ao modelo de regressão (estatístico e não-determinístico).

d) Avaliação da consistência da equação e de seus parâmetros através dos testes t e F.

e) Determinação da temperatura de bulbo seco e da velocidade relativa do ar de conforto térmico para os ambientes estudados, segundo a percepção das pessoas.

f) Realização da análise discriminante, com o intuito de investigar sobre as possíveis características existentes entre as variáveis térmicas e as sensações declaradas pelos trabalhadores, segundo esta classificação: conforto (0), quente (1) e muito quente (2).

 

RESULTADOS E DISCUSSÕES

Nos ambientes de trabalho estudados realizam-se atividades de operações bancárias, ou seja, atividade sedentária e vestimentas leves. Durante três dias foram coletados 5.496 dados inerentes às variáveis climáticas Icl (resistência térmica das vestes), M (metabolismo), tbs (temperatura do ar ou de bulbo seco), trm (temperatura radiante média), tbu (temperatura de bulbo úmido), Var (velocidade relativa do ar), UR (umidade relativa do ar em percentual) e top (temperatura operativa); e S (sensação térmica). Importa ressaltar que as unidades atribuídas às variáveis Icl e Var são, respectivamente, [clo = 0,155m2.ºC/W] e [m/s]. A temperatura de bulbo seco e a velocidade relativa do ar, na situação de conforto térmico, foram determinadas a partir da coleta destes dados e levaram-se em consideração os votos das sensações térmicas fornecidos pelas pessoas nos diversos horários.

Dando seqüência às etapas propostas, verificou-se através das medidas de BOX-COX a normalidade das variáveis acima, de acordo com a equação (31), conforme pode ser visto na Tabela 2 a seguir.

Verificada a normalidade das variáveis, BJ < 5,91, aplicaram-se a Regressão Linear Simples e Múltipla e a Análise Discriminante.

Regressão Linear Simples

Depois de realizados os devidos testes, elaborou-se um modelo de Regressão Simples, contendo a sensação térmica (S) como variável dependente e a temperatura de bulbo seco (tbs) como variável independente.

A Tabela 3 apresenta os resultados da Regressão Linear Simples onde S é função da variável independente tbs.

Os testes F e t mostram a consistência do modelo para a = 0,005 e a = 0,10 (p-valor = 0,00000), respectivamente. A Figura 1 ilustra a reta de regressão obtida e os valores observados.

Observa-se, também, que o valor de R2 é próximo de 1, donde conclui-se que o modelo é consideravelmente explicado pela variável preditora.

Através da Figura 2, observa-se o comportamento dos resíduos padronizados ao longo das medições. A priori, não se percebe nenhuma espécie de padrão dos resíduos no gráfico abaixo.

 

 

A estatística de Durbin-Watson corrobora a afirmação anterior mostrando que não há indícios de autocorrelação entre os resíduos, já que o valor desta é 1,528, ou seja, maior que o valor crítico ds (para p = 1, n = 30) tabelado, que corresponde a 1,49. Logo, a partir dos valores de B constantes na Tabela 3, o MRLS pode ser expresso como

A partir deste modelo, é possível prever que a temperatura de bulbo seco na situação de conforto térmico (S = 0) é de 23,29 ºC.

Regressão Linear Múltipla

Baseando-se nos resultados e discussões anteriores, construiu-se apenas um modelo de regressão múltipla. Este teve a sensação térmica (S) como variável dependente e as variáveis independentes temperatura de bulbo seco (tbs) e velocidade relativa do ar (Var). A variável Var foi selecionada devido a sua importância na sensação de conforto térmico do trabalhador.

Antes de construir o MRLM verificou-se a correlação entre as variáveis independentes. O valor encontrado foi de 0,275961, ou seja, um valor não muito significativo. Concluiu-se, então, que não há existência de multicolinearidade entre essas variáveis.

Em seguida, construiu-se o MRLM. Os resultados da Regressão Linear Múltipla encontram-se na Tabela 4.

O teste F indica que o modelo é significativamente explicado pelo conjunto de variáveis independentes ao nível de a = 0,05 (p-valor = 0,00000). No entanto, o teste t mostra que apenas o intercepto e a variável tbs são significativos ao nível de a = 0,10. Mas como p-valor > a para variável Var em 1,8584% e o R2 (ajustado) apresentado na Tabela 4 é 0,84713, superior ao valor de 0,8384 constante na Tabela 3, preferiu-se incluir a variável Var no modelo, proporcionando assim uma correlação múltipla maior entre S e o conjunto de variáveis tbs e Var. É possível ver na Figura 3 que a sensação térmica (S) do indivíduo tende a situação de conforto (S = 0) quando as variáveis tbs e Var se aproximam para valores ínfimos.

 

 

Pelo gráfico exposto na Figura 4, não é possível identificar claramente evidências indicando a existência de autocorrelação entre os resíduos. O valor da estatística de Durbin-Watson encontrado foi 1,679740, isto é, superior ao valor crítico tabelado ds (para p = 2, n = 30), elucidando assim a inexistência de autocorrelação entre os resíduos, o que ratifica a permanência da variável Var na equação (34).

 

 

Verificada a significância e consistência do modelo e a partir dos valores de B da Tabela 4 tem-se que o mesmo é dado pela equação

Para averiguar a situação de conforto térmico (S = 0) através da relação encontrada na equação (34) faz-se necessário fixar o valor de uma das variáveis independentes, a fim de se determinar o valor da outra variável preditora. Sendo assim, adotando-se o valor de tbs na equação (34) como sendo 23,29ºC, obtido na equação (33) verifica-se que para situação de conforto térmico o valor da variável Var é de 0,0823 m/s.

Análise Discriminante

Como visto anteriormente, sabe-se que um modelo de Análise Discriminante possui uma variável dependente categórica, isto é, discreta. Novamente a variável dependente em questão é a Sensação (S), no entanto esta foi categorizada em três diferentes grupos2, a saber:

0 – Conforto Térmico; 1 – Quente; 2 – Muito Quente.

As variáveis independentes são: Temperatura de Bulbo Seco (tbs) e Velocidade Relativa do Ar (Var).

Os resultados a serem apresentados a seguir foram obtidos através dos Softwares STATISTICA e SPSS. Importa ressaltar que ambos apresentaram pequenas diferenças em seus resultados, todavia estas não comprometem a validação dos resultados.

Os resultados apresentam uma análise discriminante de três grupos. Aparentemente, os três grupos são mais separados em termos da variável tbs do que da outra variável (Var), conforme observada nas médias e desvio padrão dos grupos. A matriz de correlação combinada dentro dos grupos indica fraca correlação entre os prognosticadores. É improvável que a multicolinearidade venha a constituir um problema. A significância F univariada indica que, quando os prognosticadores são considerados individualmente, apenas a variável tbs distingue significativamente a sensação térmica percebida pelos indivíduos.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Como há três grupos, estima-se apenas duas funções discriminantes (1 e 2). Os autovalores associados a estas funções são 3,213 e 0,105, com correlação de 0,873 e 0,308, respectivamente. Os quadrados destas correlações (0,873)2 @ 0,76 e (0,308)2 @ 0,10 indicam que 76% e 10% das variâncias na variável dependente (S) são explicados pelos modelos 1 e 2 respectivamente.

Observando os resultados das funções discriminantes canônicas, o valor 0 localizado abaixo da "After Function" mostra que as duas funções 1 e 2 conjuntamente tornam-se uma função discriminante significativa (a = 0,05), haja vista que o l de Wilks associado a esta função é 0,215, que se transforma em um qui-quadrado 40,749 com 4 graus de liberdade, e p-valor = 0,000. Desta maneira, pode-se afirmar que a hipótese nula foi rejeitada, o que confirma a discriminação significativa. Porém, ao se remover a primeira função, constata-se que a segunda função não exerce influência significativa para a diferenciação dos grupos (p-valor = 0,105).

Os coeficientes padronizados da função discriminante canônica ilustram um maior coeficiente para a tbs na função 1, ao passo que na função 2 o coeficiente da Var possui um valor maior. Através da matriz estrutural também é plausível chegar a uma conclusão semelhante, ou seja, a variável tbs possui peso maior na função 1, e a variável Var, maior peso na função 2.

Os resultados observados na matriz de classificação demonstram que 90% das classificações entre os grupos 1 e 2 foram realizadas de maneira correta, enquanto que na matriz de classificação para validação cruzada, as classificações se apresentaram corretas em 76,7% dos casos.

De acordo com o diagrama apresentado na Figura 5, nota-se que os grupos de percepção 0 (conforto) e 2 (muito quente) apresentam pontos mais aglomerados, ao contrário dos pontos do grupo 1 (quente) que se encontram mais dispersos. Isso explica o melhor desempenho no tocante a classificação dos grupos 0 e 2 em relação ao grupo 1.

 

 

CONCLUSÃO

A partir de um estudo baseado em autores da área métodos quantitativos, pôde-se observar e prever como uma ou mais variáveis podem influenciar na variabilidade de outra variável. Determinou-se, assim, a temperatura de bulbo seco e a velocidade relativa do ar ideais para um ambiente de trabalho, baseando-se na sensação térmica de cada trabalhador, ou seja, construíram-se modelos de Regressão Linear Simples e Múltipla para determinar que variável térmica poderia estar em conformidade com a situação de conforto térmico (S = 0) das pessoas que realizam atividades de bancos em ambientes climatizados, ou seja, atividade e vestimentas leves e umidade relativa no entorno de 50%. A temperatura de bulbo seco tbs = 23,79°C é a mais representativa e a ideal para estes ambientes.

As particularidades entre as sensações térmicas declaradas pelas pessoas foram constatadas e, através da Análise Discriminante, construiram-se funções de classificação segundo as preferências pelo conforto (0), quente (1) e pelo muito quente (2), as quais ratificam a importância da variável tbs na discriminação destas preferências, demonstrando uma maior consistência do modelo S = -10,5531 + 0,4531 . tbs. Para facilitar a classificação de grupos discriminantes vinculados à sensação térmica, a partir de novas coletas de dados termoambientais, apresenta-se, anexo, um script desenvolvido no ambiente MATLAB.

Porém, vale ressaltar que muitos ambientes de trabalho, como os do setor bancário, estão localizados em regiões onde a temperatura externa do ar, em alguns períodos do ano, ultrapassa as temperaturas de projeto recomendadas pelas normas específicas, implicando aumento da temperatura interna, principalmente quando o teto não é bem isolado. Além disso, é comum verificar-se aumento eventual no número de pessoas e de equipamentos eletrônicos não previsto no projeto. Por outro lado, aberturas eventuais de portas e/ou janelas e, principalmente, os dispositivos de insuflamento do ar podem gerar velocidades tais que causem desconforto térmico.

De modo geral, o controle da carga térmica é de grande importância para a saúde e segurança do trabalhador, com repercussões na produtividade. O excesso ou o déficit de calor pode causar desconforto às pessoas com implicação na performance em atividades que exigem certa atenção e concentração. Assim, é importante ratificar que o modelo e as funções de classificação supracitadas poderão contribuir para o controle do conforto térmico interno, levando em consideração a percepção térmica das pessoas presentes no ambiente de trabalho.

 

Notas

1. O erro padrão da estimativa é a medida de variabilidade (desvio padrão) em torno da linha de regressão.

2. O critério de discriminação da variável dependente adotado baseou-se nas características dos dados coletados.

 

Referências

ANDERSON, D. R.; SWEENEY, D. J.; & WILLIAMS, T. Statistics for business and economics. 3 ed, South-Western, 2002        [ Links ]

ANSI/ASHRAE 55. Thermal environmental conditions for human occupancy. Atlanta, GA 30329, 1992.        [ Links ]

BEDALE, E. M. The effects of posture and rest in muscular work. UK: Industrial Fatigue Research, 1924.        [ Links ]

CHARNET, R.; BONVINO, H; FREIRE C. A. L; CHARNET, E. M. R. Análise de modelos de regressão linear com aplicações. Campinas, SP: Unicamp, 1999.        [ Links ]

FANGER, P. O. Thermal comfort analysis and applications in environmental engineering. United States: McGraw-Hill Book Company, 1970.        [ Links ]

ISO 8996. Ergonomics – determination of metabolic heat production. International Organization for Standardization, Genebra, 1990.        [ Links ]

ISO 9920. Ergonomics of the thermal environment – estimation of the thermal insulation and evaporative resistance of a clothing ensemble. International Organization for Standardization, Genebra, 1995.        [ Links ]

ISO 10551. Ergonomics of the thermal environment – assessment of the influence of the thermal environment using subjective judgement scales. International Organization for Standardization, Genebra, 1995.        [ Links ]

ISO/DIS 7726. Ergonomics of the thermal environment– Instruments for measuring physical quantities. International Organization for Standardization, Genebra, 1996.        [ Links ]

ISO 7243. Hot environments – estimation of the heat stress on working man, based on the WBGT-index (wet bulb globe temperature). International Organization for Standardization, Genebra, 1989.        [ Links ]

ISO 7730. Moderate Thermal Environments – Determination of the PMV and PPD indices and specification of the conditions for thermal comfort. International Organization for Standardization, Genebra, 1994.        [ Links ]

LEVINE, D.M.; BERENSON, M. L.; STEPHAN, D. Estatística; Teoria e aplicações. Rio de Janeiro, LTC, 2000.        [ Links ]

MAGALHÃES, M; LIMA, A. C. P. Noções de probabilidade e estatística. 5. ed., São Paulo: Edusp, 2002.        [ Links ]

MALHOTRA, Naresh K. Pesquisa de marketing uma orientação aplicada. Porto Alegre: Bookman, 3. ed., 2001.        [ Links ]

NELSON, T. M.; NILSSON, T. H.; HOPKINS, G. W. Termal comfort: advantages and deviations. Atlanta: ASHRAE Transactions, v. 93, n. 1, p. 1039-1054, 1987.        [ Links ]

RAGSDALE, C.T., Spreadsheet Modeling and Decision Analysis, 3 ed, South-Western College Publishing, Cincinnati, Ohio, 2001.        [ Links ]

RUAS, A. C. Avaliação de conforto térmico – contribuição à aplicação prática das normas internacionais. Dissertação de Mestrado – Faculdade de Engenharia Civil, Universidade Estadual de Campinas, Campinas, SP, 1999.        [ Links ]

SHENTON, L.R.; BOWMAN, K.O. A bivariate model for the distribution of Öb1 and b2. Journal of the American Statistical Association, v. 72, p. 206-211, 1977.        [ Links ]

TRIOLA, Mario F. Introdução à Estatística. 7. ed., Rio de Janeiro: LTC, 1999.        [ Links ]

XAVIER, A. A. de Paula. Condições de conforto térmico para estudantes de 2º Grau na região de Florianópolis. Dissertação de mestrado. CPGEC da UFSC, Florianópolis, 1999.        [ Links ]

 

 

Artigo recebido em 21/12/2005
Aprovado para publicação em 21/08/2006

 

 

Sobre os autores
Anand Subramanian
Universidade Federal da Paraíba (UFPB)
Engenheiro de Produção Mecânica. Mestrando em Engenharia de Produção
End.: Departamento de Engenharia de Produção (DEP) – Centro de Tecnologia – Campus I – Bloco G – Cidade Universitária, Castelo Branco, CEP: 58051-970 – João Pessoa, PB – Brasil – Caixa Postal: 5045.
Tel.: (83) 3216-7685, Fax: (83) 3216-7549
E-mail: anandsubraman@hotmail.com

Antonio Souto Coutinho, Dr.
Universidade Federal da Paraíba (UFPB)
Professor Adjunto IV
End.: Departamento de Engenharia de Produção (DEP) – Centro de Tecnologia – Campus I – Bloco G – Cidade Universitária, Castelo Branco, CEP: 58051-970 – João Pessoa, PB – Brasil – Caixa Postal: 5045.
Tel.: (83) 3216-7685, Fax: (83) 3216-7549
E-mail: coutinho@ct.ufpb.br

Luiz Bueno da Silva, Dr.
Universidade Federal da Paraíba (UFPB)
Professor Adjunto III
End.: Departamento de Engenharia de Produção (DEP) – Centro de Tecnologia – Campus I – Bloco G – Cidade Universitária, Castelo Branco, CEP: 58051-970 – João Pessoa, PB – Brasil – Caixa Postal: 5045.
Tel.: (83) 3216-7685, Fax: (83) 3216-7549
E-mail: bueno@ct.ufpb.br

 

 

SCRIPT DESENVOLVIDO NO AMBIENTE MATLAB PARA CLASSIFICAÇÕES DE GRUPOS DISCRIMINANTES A PARTIR DE DADOS PROVENINENTES DE NOVAS AMOSTRAS

 

A seguir segue um exemplo de aplicação do script para uma amostra de tamanho N = 6. Vale salientar que os dados de tbs e Var foram aproveitados dos dados existentes da amostra utilizada neste estudo.

 

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License