Acessibilidade / Reportar erro

Caracterização de séries climatológicas pontuais via análise canônica de correspondência. Estudo de caso: Belo Horizonte - MG (Brasil)

Punctual climatic series characteristics, using correspondence analysis. Case study: Belo Horizonte - MG (Brazil)

Resumos

A possibilidade do clima de Belo Horizonte estar sendo afetado pelo comportamento do Oceano Pacífico tropical motivou a investigação que deu origem a este trabalho. Por este motivo, apresentamos análises estatísticas, não apenas do comportamento pontual médio mensal das variáveis atmosféricas em Belo Horizonte - MG (Brasil), como também da temperatura da superfície do mar nas regiões do Pacífico tropical, para um período de 30 anos. A análise de correspondência que usamos é uma técnica para a exibição de linhas e colunas de uma matriz de dados, como uma tabela de contingência, como pontos de um espaço vetorial dual com poucas dimensões. Procedemos a análise de dados temporais atmosféricos e oceânicos através de séries mensais de 30 anos (1960-1989), de variáveis mensuradas na cidade de Belo Horizonte - MG e no Pacífico tropical. A amostra foi submetida a tratamentos estatísticos visando a determinação de classes que poderiam nos auxiliar na extração de algumas informações embutidas nos dados brutos em estudo. Sem perda de generalidades, assegurou-se, neste procedimento, a não descaracterização das variáveis por meio do conhecimento dos fenômenos, tanto endógenos quanto exógenos, associados aos processos climatológicos envolvidos neste ensaio.

Discriminante; Classificação; Componentes Principais; Análise Canônica; Clima


The possibility of the climate in Belo Horizonte to have been affected by the sea surface behavior over the tropical Pacific has initially motivated the investigation undergone in this paper. Therefore, it presents an statistical analysis of the average monthly behavior of both the atmospheric punctual variables in Belo Horizonte - MG (Brazil), and the sea surface temperature of the central and eastern tropical Pacific for a period of 30 years. We use the correspondence analysis that is a technique for exhibition columns (variables) and rows (observations) of a data matrix, like contingence table, as points in a dual vectorial space with a reduction of the dimension. The variables have been submitted to statistical treatments to seek for the determination of classes that could be helping us to extract some of the information inlaid in the coarse data under study. Without the loss of generalities, with this procedure, the analysis assures that they will not suffer non-characterization, when we take into account the cognizance of the phenomena, such as endogenous and exogenous properties, associated with the climatic process involved in this essay.

Discriminant; Classification; Principal Components; Canonical Analysis; Climate


Research Note

Caracterização de séries climatológicas pontuais via análise canônica de correspondência. Estudo de caso: Belo Horizonte - MG (Brasil).

P. S. Lucio 1, E. M. M. de Toscano 1 & M. L. de Abreu 2

1 Departamento de Estatística - ICEx / Universidade Federal de Minas Gerais / Cx. P. 702, Pampulha 30.161-970 Belo Horizonte - MG (Brazil) / lucio@est.ufmg.br

2 Departamento de Geografia - IGC / Universidade Federal de Minas Gerais / Cx. P. 702, Pampulha 30.161-970 Belo Horizonte - MG (Brazil)

A possibilidade do clima de Belo Horizonte estar sendo afetado pelo comportamento do Oceano Pacífico tropical motivou a investigação que deu origem a este trabalho. Por este motivo, apresentamos análises estatísticas, não apenas do comportamento pontual médio mensal das variáveis atmosféricas em Belo Horizonte - MG (Brasil), como também da temperatura da superfície do mar nas regiões do Pacífico tropical, para um período de 30 anos. A análise de correspondência que usamos é uma técnica para a exibição de linhas e colunas de uma matriz de dados, como uma tabela de contingência, como pontos de um espaço vetorial dual com poucas dimensões. Procedemos a análise de dados temporais atmosféricos e oceânicos através de séries mensais de 30 anos (1960-1989), de variáveis mensuradas na cidade de Belo Horizonte - MG e no Pacífico tropical. A amostra foi submetida a tratamentos estatísticos visando a determinação de classes que poderiam nos auxiliar na extração de algumas informações embutidas nos dados brutos em estudo. Sem perda de generalidades, assegurou-se, neste procedimento, a não descaracterização das variáveis por meio do conhecimento dos fenômenos, tanto endógenos quanto exógenos, associados aos processos climatológicos envolvidos neste ensaio.

Palavras-chave: Discriminante; Classificação; Componentes Principais; Análise Canônica; Clima.

Punctual climatic series characteristics, using correspondence analysis. Case study: Belo Horizonte - MG (Brazil). -The possibility of the climate in Belo Horizonte to have been affected by the sea surface behavior over the tropical Pacific has initially motivated the investigation undergone in this paper. Therefore, it presents an statistical analysis of the average monthly behavior of both the atmospheric punctual variables in Belo Horizonte - MG (Brazil), and the sea surface temperature of the central and eastern tropical Pacific for a period of 30 years. We use the correspondence analysis that is a technique for exhibition columns (variables) and rows (observations) of a data matrix, like contingence table, as points in a dual vectorial space with a reduction of the dimension. The variables have been submitted to statistical treatments to seek for the determination of classes that could be helping us to extract some of the information inlaid in the coarse data under study. Without the loss of generalities, with this procedure, the analysis assures that they will not suffer non-characterization, when we take into account the cognizance of the phenomena, such as endogenous and exogenous properties, associated with the climatic process involved in this essay.

Key words: Discriminant; Classification; Principal Components; Canonical Analysis; Climate.

INTRODUÇÃO

A região metropolitana de Belo Horizonte, capital do Estado de Minas Gerais (Brasil), por sua localização geográfica, sofre influência de fenômenos meteorológicos de latitudes médias e tropicais que imprimem a esta localidade características de um clima de transição. Duas estações bem definidas podem ser identificadas: uma seca, durante o outono e inverno, e outra chuvosa, que se estende de outubro a março.

Discute-se muito os efeitos globais causados pela ocorrência do fenômeno El Niño/Oscilação Sul (ENOS). Em Abreu et al.(1992), constata-se que em três destes eventos (1982-1983, 1986-1987 e 1991-1992) a temperatura do ar registrou valores acima da média climatológica durante o inverno na região sudeste do Brasil. Recentemente, em Belo Horizonte, os termômetros registraram temperaturas anomalamente altas durante a estação chuvosa de 1997-1998, coincidindo com o evento El Niño mais forte do século. Neste mesmo período observou-se uma distribuição irregular da precipitação, com pequeno número de dias de chuva acumulando grandes valores de água precipitada. Ao mesmo tempo, a umidade do ar esteve abaixo dos valores climatológicos. No nordeste do Estado de Minas Gerais, as temperaturas também estiveram acima da média e as precipitações abaixo de seus valores climatológicos no mesmo período (Cuppolilo & Abreu, 1998). Portanto, a possibilidade de Belo Horizonte estar sendo afetada pelo comportamento do Pacífico tropical motivou a investigação que deu origem a este trabalho.

Neste ensaio propõe-se investigar o regime climático da precipitação, temperatura e umidade relativa do ar à superfície na região metropolitana de Belo Horizonte, através da análise de correspondência, também conhecida como análise de sistemas de associação (Greenacre, 1984), utilizando as informações armazenadas durante um período de trinta anos. Apresenta-se aqui não só análises estatísticas do comportamento médio das variáveis atmosféricas, e da temperatura da superfície do mar em três regiões estratégicas do Pacífico tropical que caracterizam a ocorrência de um evento ENOS, como também os resultados que sugerem como estas séries, atmosféricas e oceânicas, podem estar relacionadas estatisticamente, no período analisado (1960-1989). Estas análises objetivam entender o comportamento médio das variáveis para que futuramente possam ser buscadas relações de causa e efeito que expliquem como a variabilidade da temperatura da superfície do Pacífico tropical pode estar causando anomalias climáticas nesta localidade do Estado de Minas Gerais. Aqui nos limitamos a indicar a possibilidade de alguns eventos extremos de anomalias das variáveis atmosféricas estarem sendo causados por anomalias térmicas no oceano Pacífico tropical.

METODOLOGIA

Este estudo concentra-se em duas séries temporais multivariadas de dados mensais para o período 1960 a 1989. Uma, contendo dados atmosféricos de superfície, em Belo Horizonte, originados das Normais Climatológicas do Instituto Nacional de Meteorologia a saber: número de dias de chuva (NDCBH), precipitação (PRECBH), umidade relativa do ar (URABH), média das temperaturas mínimas (TMINBH), média das temperaturas médias (TMEDBH) e média das temperaturas máximas (TMAXBH). Outra, contendo dados oceânicos, na região do Pacífico tropical, estas são as médias das temperaturas da superfície do mar representando as regiões denominadas: Niño 1 e Niño 2 (TSM1+2) - 90o W até a costa oeste da América do Sul, entre o equador e 10o S; Niño 3 (TSM3) - 150o W a 90o W, entre 5o S e 5o N; Niño 4 (TSM4) - 160o E a 150o W, entre 5o S e 5o N. Estas séries se originam do Climate Prediction Center da NOAA, EUA.

A análise de correspondência, aqui adotada, é uma técnica utilizada para representar as observações e variáveis como pontos em um espaço vetorial cuja dimensão seja de ordem inferior àquela original. Este tipo de análise tem por objetivo suprimir os efeitos de heterogeneidade devido às escalas de mensuração das variáveis, que poderiam forjar a interpretação dos resultados. Em efeito, esta técnica é um método privilegiado para a descrição de dados qualitativos ordinais.

Primeiramente, buscou-se identificar padrões estatísticos descritivos anuais e mensais de informação nos processos condicionantes do fenômeno climático. Simultaneamente operou-se a caracterização das séries oceânicas. Ao longo das análises procurou-se destacar quando valores atmosféricos extremos que ocorreram em anos associados à períodos de desenvolvimento e/ou estabelecimento de eventos ENOS. Finalmente foram utilizadas técnicas que permitissem identificar relações de interdependência entre as variáveis atmosféricas e aquelas oceânicas no período sob investigação.

ANÁLISE EXPLORATÓRIA DOS DADOS

A análise estatística descritiva dos dados climáticos de Belo Horizonte apresentou valores médios anuais para temperatura de 22,6 oC, para precipitação acumulada de aproximadamente 1529 mm e para umidade relativa do ar de 71%. Os meses mais quentes - média das máximas de 28,0 oC - coincidem com a estação chuvosa, correspondendo a 88% da precipitação total anual. Os meses mais frios - média das mínimas de 14,6 oC - corresponde ao período de seca.

A análise do comportamento interanual da precipitação acumulada, no período de estudo (Fig.1), indica que entre os anos de 1971 e 1977 houve uma mudança seqüencial desta variável, sugerindo uma configuração de anomalia no controle estatístico, bem definida. A tendência negativa da série neste período sugere uma diminuição da precipitação nestes anos. Tal tendência pode estar associada tanto a padrões da circulação atmosférica local quanto remotos, entre os quais podemos citar as anomalias na circulação atmosférica tropical, advindos das variações da temperatura da superfície do mar, uma vez que este período apresentou dois eventos El Niño (72/73 e 76/77). Nos anos subseqüentes da série, o sistema tenta entrar em equilíbrio estatístico, gerando, assim, alguns pontos extremos.


Na Fig.1, o comportamento da precipitação anual acumulada, confirma, via configuração seqüencial de pontos, cujo comprimento é de 10 anos, que Belo Horizonte passou por um período de estiagem, com acentuada tendência negativa, que pode ser identificada desde 1967, se estendendo até 1977. Os pontos que se aproximam das linhas de controle: 1963, 1983 e 1985, podem indicar a influência de fatores extrínsecos ao fenômeno, onde podemos citar o evento El Niño 82-83. Este fato nos leva a buscar algumas explanações em outro espaço (conjunto) de variáveis e desta forma estudar alguns atributos de causa e efeito. Deve-se, também, ficar atento aos anos, cujos pontos se aproximam muito da linha média, como os anos de 1960, 1961, 1966, 1980 e 1982. Esta configuração pode estar indicando a influência de processos provenientes de outros atributos associados à precipitação.

Os gráficos de média e desvio padrão (Fig.2) nos fornecem importantes informações sobre a umidade relativa do ar. O sistema sofre influência de fenômenos a ele extrínsecos. Os pontos fora dos limites de controle (distância relativa à linha média é superior a três vezes o desvio-padrão): 1961, 1963 (desenvolvimento de El Niño), 1964 (estabelecimento de El Niño, seguido de desenvolvimento de La Niña), 1965 (estabelecimento de La Niña, seguido de novo desenvolvimento de El Niño) e 1979 a 1982 (período de "normalidade" oceânica, seguida do desenvolvimento de El Niño em 82); exigem uma investigação imediata, buscando a causa da variação assinalável responsável pela sua ocorrência. A persistente anomalia negativa, bem definida, entre os anos de 1966 e 1977, indica uma mudança no nível da umidade relativa do ar. Vale lembrar que este período coincide com aquele indicando quatro eventos El Niño, sugerindo uma investigação mais aprofundada sobre a influência deste fenômeno no comportamento da umidade relativa do ar em Belo Horizonte. Pode-se, também, observar que os anos que apresentaram maior variabilidade mensal foram 1961 e 1974, e ainda, que a partir de 1986 há uma tendência ao aumento da umidade relativa do ar nesta localidade.


UM MODELO DE REGRESSÃO EMPÍRICO

Uma vez explorado o padrão de comportamento das variáveis atmosféricas, o próximo passo é entender suas inter-relações visando propor, futuramente, modelos de previsão. Nada mais natural, que buscarmos, inicialmente, uma relação de associação entre a precipitação e o número de dias de chuva numa determinada região - não consideraremos aqui aspectos associados à formação de padrões climáticos locais. O efeito que está embutido neste enfoque é aquele relacionado à recuperação de dados pluviométricos não mensurados em meses em que conhecemos o número de dias de chuva. Desta forma, sugerimos um modelo simples de regressão relacionando estas duas variáveis, em Belo Horizonte, embora não tenhamos apresentado neste trabalho, o comportamento da variável número de dias de chuva. O grau de associação entre PRECBH e NDCBH, pode ser observado na Fig. 3.


O padrão quadrático evidenciado no gráfico de dispersão da Fig. 3, nos fornece o tipo de relacionamento existente entre a precipitação acumulada em 24 horas e o número de dias de chuva. O teste de normalidade, nos sugere uma transformação (Box-Cox) da variável precipitação, na tentativa de eliminar o efeito de suporte (aquele associado à unidade de medida) com meta de se poder ajustar um modelo linear para predição do valor pluviométrico acumulado mensal, a partir do conhecimento do número de dias chuvosos. Não podemos deixar de observar o aumento da variabilidade pluviométrica com relação ao aumento do número de dias chuvosos.

O padrão evidenciado no gráfico de dispersão mostrado na Fig. 4a, nos fornece o tipo de relacionamento linear existente entre a precipitação mensal e o número de dias de chuva, cujo coeficiente de correlação linear é positivo e tem valor nominal de 0,927. Assim, sugerimos um modelo de regressão linear para a predição da precipitação com base no número de dias de chuva. A equação de regressão é determinada pela relação

SQRTPREC = 1.55 + 0.839 NDCHUVA,

onde, SQRTPREC é a raiz quadrada da precipitação. O coeficiente R2 é 86%, indicando a percentagem da variabilidade da precipitação explicada pelo número de dias de chuva através deste modelo linear. Pela própria gênese do processo, os dados devem ser tratados como longitudinais, uma vez que temos uma série de trinta medidas tomadas mês a mês. Dito de outra forma, em 360 observações teremos certamente repetições de medidas quando tomadas em grupo de trinta dias. Assim,

o teste para erro puro -> P = 0.0031,

o que nos permite afirmar que, ao nível de significância de 5%, rejeitamos a hipótese de adequação do modelo sugerido pela equação de regressão linear, i.e. o modelo é estatisticamente não adequado, talvez devido à ligeira curvatura existente nos dados, detectada através do teste empírico de falta de ajuste. Isto nos leva a sugerir a regressão regida por:

SQRTPREC=0.713+ 1.10 NDCHUVA - 0.0117 NDCHUVA**2.

Neste caso, o coeficiente R2 é 86,8%, indicando a percentagem da variabilidade explicada pelo modelo quadrático de regressão. Agora, quando testamos a falta de ajuste através do erro puro, não obtemos evidências de falta de ajuste (P > 0.05), onde

o teste para erro puro -> P = 0.2795,

nos permite afirmar que, ao nível de significância de 5%, rejeitamos a hipótese de não adequação do modelo sugerido pela equação de regressão quadrática (Fig. 4b). Este modelo é estatisticamente adequado. Todavia, pode-se perceber uma fraca heterocedasticidade (não-homogeneidade da variância) devido ao aumento da variabilidade com relação ao aumento do número de dias chuvosos.



Este modelo se reveste de grande significância para os estudos climáticos, uma vez que ele permite a reconstrução de séries de precipitação a partir do número de dias de chuvas, mais facilmente mensurável. Assim, quanto maior o número de dias de chuvas maior é o valor esperado acumulado da precipitação registrada. No entanto, o modelo apresenta limitações em anos que registrem a ocorrência de anomalias climáticas uma vez que, nestes casos, a média mensal de precipitação pode ser atingida em chuvas intensas ocorrendo em pequenos intervalos de tempo, como é o caso de temporais isolados. Situações como estas foram observadas no verão 97-98, sob a influência do fenômeno El Niño.

COMPORTAMENTO SAZONAL E ANÁLISE DISCRIMINANTE

A análise discriminante e a análise de classificação são técnicas multivariadas baseadas na separação das observações de conjuntos distintos e na alocação de novas observações à grupos previamente definidos (Jonhson & Wichern, 1998). A análise discriminante é uma técnica de natureza exploratória, um procedimento separatório usado na investigação das diferenças observadas. Procura-se com este procedimento determinar valores numéricos que poderiam discriminar o conjunto de dados em classes. O procedimento de classificação é menos exploratório, seguem-se regras preestabelecidas, que podem ser usadas na alocação das observações nas classes de trabalho (discretização).

Admite-se, nesta etapa, que exista uma partição do espaço definida pelas observações em subgrupos de dimensão inferior. Investigamos, quais variáveis e qual padrão de observações caracterizam os grupos e os separa.

Para efeito de avaliação do comportamento estacional (ou sazonal), considera-se as quatro categorizações ordinais para as variáveis atmosféricas:

(C1) os meses correspondentes às quatro estações do ano: verão, outono, inverno e primavera;

(C2) as quatro estações associadas ao comportamento individual de cada variável. Realiza-se o agrupamento das observações relativas a cada variável, em quatro classes definidas pelos seus intervalos interquartílicos, classificadas em baixa, média baixa, média alta e alta;

(C3) as três estações estabelecidas pelo total acumulado de precipitação anual. Classificadas como chuvosa, transitória e seca;

(C4) uma classificação dicotômica empírica em estação chuvosa e seca.

Deve-se observar que a classificação C2, realizada levando-se em consideração os intervalos interquartílicos, foi feita dividindo os dados em quatro grupos, da seguinte forma: o primeiro grupo G1 é constituído pelos pontos amostrais cujo valor nominal poderiam variar entre o mínimo observado e o primeiro quartil, o grupo G2 pelos valores entre o primeiro quartil e a mediana, G3 pelos valores entre a mediana e o terceiro quartil, e por fim o último grupo G4 formado pelos valores compreendidos entre o terceiro quartil e o máximo observado.

A categorização C3 , assim como C4 , baseiam-se no comportamento da precipitação numa região tropical continental, de transição, como é o caso de Belo Horizonte. Assim, no final da primavera e durante o verão (estação chuvosa, proposta nas definições das classes C3 e C4), o continente é aquecido, aquecendo a atmosfera local. A grande disponibilidade de umidade intensifica a atividade convectiva. Esta atividade convectiva que se estende desde o Brasil central até o litoral sudeste, pode se associar aos sistemas frontais estacionários, ocasionando chuvas prolongadas. Este é o caso da ocorrência da ZCAS. No outono (estação de transição, proposta apenas na definição da classe C4 , assumindo que nestas latitudes tropicais outono e primavera podem não ser bem identificados) o resfriamento do continente, intensifica o gradiente térmico equador-polo, favorecendo a penetração de sistemas frontais. Como ainda há umidade disponível, estas frentes podem causar precipitação. No início da primavera o gradiente térmico equador-polo é máximo e, nesta época do ano, a disponibilidade de umidade favorece chuvas intensas regionais. Esta também é uma época de transição climática. No inverno, o gradiente latitudinal de temperatura atinge valores muito intensos porém, a baixa disponibilidade de umidade e a atuação do anticiclone subtropical, induzindo subsidência na baixa e média atmosfera, inibem a formação de precipitação na região (estação seca, proposta nas definições das classes C3 e C4). As quatro categorizações ordinais para as variáveis oceânicas obdedecem a proposta atmosférica, porém no caso do oceano, as justificativas para as categorias C3 e C4 não se aplicam.

Os resultados da análise de classificação, concernente às variáveis atmosféricas, indicam que as melhores classificações individuais são relativas às categorizações dos tipos C2 (92% de média de classificação correta) e C4 (80% de classificação correta, em média). O problema, então, é analisar a estrutura de dependência entre estas categorizações C2 e C4 fazendo, assim, surgir os traços principais daquela que será, doravante, o objeto deste estudo. Para tanto, devemos separar os caracteres em ativos: aqueles que descrevem objetivamente o fenômeno-alvo e em passivos: aqueles que se deseja associar as questões do primeiro grupo mas não necessariamente entre si, buscando-se uma relação de causa e efeito.

Se categorizarmos as estações em seca e chuvosa, como sugerido em C4, conforme os critérios pluviométricos e baseando-nos no método linear (Guillaume, 1977) para a resposta, obtemos para os seis preditores atmosféricos pontuais PRECIPBH, URABH, TMAXBH, TMEDBH, TMINBH e NDCHUVA, uma categorização considerada, sob o enfoque estatístico, como excelente (proporção de acertos 94%). No caso de categorizarmos empiricamente as estações, como em C3, definindo os grupos como G1: janeiro, fevereiro, março, novembro e dezembro; como G2: abril, maio, setembro e outubro e como G3: junho, julho e agosto, conforme os critérios pluviométricos, obtemos para os seis preditores acima mencionados, o que ainda podemos considerar como uma classificação muito boa (proporção de acertos 84%), uma vez adotado um método linear para a resposta. Este resultado estatístico indica que a escolha de um agrupamento que defina três estações para a variável precipitação em Belo Horizonte, baseada nas características do clima tropical da região, é mais adequada, quando comparado à simples definição de quatro estações convencionais.

Em contrapartida, para as variáveis oceânicas TSM1+2, TSM3 e TSM4, evidencia-se que estas seriam melhor classificadas levando-se em consideração as estações do ano, como definidas no hemisfério sul. A propósito desta definição, decidimos averiguar se a climatologia do Pacífico tropical, através destas variáveis, se agruparia, de forma aceitável, em acordo com esta classificação canônica. O resultado, como era esperado, nos sugere o fato de que o Pacífico tropical segue a categorização do que entendemos fisicamente por verão, outono, inverno e primavera, i. e. a categorização C1 (93% da média de classificação correta), ditada por sua própria dinâmica associada ao ciclo sazonal dos ventos alísíos. Não podemos deixar de observar que o inverno estaria menos caracterizado nesta região (confundido-se com parte do outono e parte da primavera).

ANÁLISE DE CLASSIFICAÇÃO

Observa-se que no caso de considerarmos uma das variáveis, usualmente uma variável quantitativa, como dependente e as outras variáveis independentes, a natureza desta dependência deve ser investigada. Se a variável dependente (ou resposta) for qualitativa então a regressão será essencialmente uma análise discriminante, aqui determinada. Se novos conjuntos de observações das variáveis independentes (ou explicativas) vêm a ser mensurados, o valor da variável dependente deve ser previsto, usando-se a relação de regressão estabelecida. Se a variável dependente for qualitativa, então este será essencialmente um problema de classificação (Lucio, 1991). Nesta sessão nós definimos as leis de categorização das variáveis atmosféricas com base em seus comportamentos intrínsecos, que darão seqüência à nossa análise.

Com o objetivo de estabelecermos relações entre as variáveis atmosféricas, até então analisadas separadamento, as observações associadas a cada variável, são agrupadas, segundo um dos critérios que apresentou melhor classificação: C2 ou C4. Contudo, trabalha-se também com um conjunto adicional de observações não agrupadas, o qual deseja-se classificar. Este é freqüentemente o objetivo final de uma análise discriminante. Para este estudo, classificamos cada variável considerando-se o seu comportamento intrínseco, buscando, assim, um padrão de explicação do grupo associado, como sugerido através de C2, onde os grupos sazonais são definidos através dos intervalos interquartílicos.

Explicadas a partir da categorização da sazonalidade (C2) definida por uma dada variável através da análise discriminante (Johnson & Wichern, 1998) as demais variáveis atmosféricas assim se classificariam, de forma aceitável: a partir de NDCBH com aproximadamente 75% de classificação coerente; a partir de PRECBH, aproximadamente com 71% de classificação coerente; a partir TMAXBH, com aproximadamente 68% de classificação coerente; a partir de TMEDBH, com aproximadamente 77% de classificação coerente e a partir de TMINBH, com aproximadamente 74% de classificação coerente. No caso da categorização por meio da sazonalidade definida por URABH, as demais variáveis se classificariam, de forma razoável, porém não aceitável, com aproximadamente 47% de classificação coerente. Este resultado sugere que se busque outra categorização que forneça uma maior proporção explicativa desta informação quando associada às outras variáveis. Decidiu-se optar pela categorização dada por C4. Explicadas a partir da categorização da sazonalidade definida por apenas dois períodos anuais, um seco e outro chuvoso, da umidade relativa do ar, as demais variáveis se classificariam, de forma excelente, com aproximadamente 95% de classificação coerente.

ANÁLISE DE CONGLOMERADOS

Este tipo de análise é freqüentemente denominada classificação automática, onde as similaridades (ou dissimilaridades) entre observações ou variáveis são avaliadas com o objetivo de formar agrupamentos com base em características semelhantes através de partições. Desta análise feita, propomos investigar, inicialmente, os dois conjuntos de variáveis, um atmosférico e outro oceânico, considerando-se a diferença de fase estacional evidenciada nos tratamentos estatísticos acima. Esta proposição está fundamentada através da análise de conglomerados, onde obtemos esta formação utilizando a função de ligação "completa" (Johnson & Wichern, 1998), que leva em consideração a máxima distância entre grupos com base em seus "centróides" - centro de gravidade da massa de dados.

Através do dendograma (sob métrica "completa") observamos com bastante nitidez, a formação de três grupos: dois atmosféricos e um oceânico. Podemos também notar o efeito de suporte, devido as unidades de medida, que se torna evidente com relação ao grupo de variáveis atmosféricas. Na Fig. 5, pode-se observar o alto grau de similaridade entre as variáveis: (1) PRECIP, NDCHUVA e URA, (2) TMAXBH, TMEDBH e TMINBH, e (3) TSM1+2, TSM3 e TSM4. Observe ainda, que detectado através desta técnica, o grau de similaridade, em fase, entre os grupos de variáveis é muito baixo, em torno de 41,0%.


Enfatiza-se, ainda, a distinção entre o comportamento das variáveis precipitação e temperatura. A precipitação se associa à disponibilidade de umidade no ar. Esta associação é observada nas estações chuvosas e de transição (primavera) quando o aquecimento do continente favorece a instabilidade. Assim, a umidade do ar ao ascender, pode condensar e formar nuvens. Já no inverno, apesar da presença de umidade no ar, ela é baixa em função da subsidência associada ao predomínio do anticiclone subtropical sobre o continente brasileiro, causando, consequentemente, baixa precipitação. O grupo de temperaturas indica a dependência entre as temperaturas máxima e mínima, ambas ditadas pelo comportamento do aquecimento e resfriamento da superfície, respectivamente. Os dois grupos estão interligados (45,0% de similaridade), uma vez que altas temperaturas nesta região tropical podem induzir a formação de convecção, caso haja umidade disponível (estação chuvosa). Porém, esta mesma condição de altas temperaturas, na estação seca (inverno), pode estar associada à contínua radiação solar observada em dias ensolaradas, sem nuvens, quando da presença de subsidência, levando a uma inibição da precipitação. Em outras palavras, nesta região tropical, onde se localiza Belo Horizonte - aqui representada pontualmente, altas temperaturas não significam necessariamente chuva (inverno). Desta forma, a estação chuvosa é fortemente definida pelo padrão de umidade do ar nos baixos níveis da atmosfera. Pode haver intensa precipitação, na estação chuvosa, devido à associação entre a convergência de umidade e os sistemas frontais, e serem registradas temperaturas moderadas para o verão. Isto ocorre durante a atuação da ZCAS.

O grupo oceânico se distingue do atmosférico. A Fig. 5 indica que estes grupos podem estar influenciando o padrão das temperaturas sobre o continente sulamericano. O subgrupo TSM1+2 e TSM3 se justifica uma vez que sua gênese está ligada ao comportamento dos ventos alísios e das ondas oceânicas na região do Pacífico tropical equatorial.

Observe a diferença entre análise discriminante, onde há uma partição particular de interesse conhecida e previamente definida, e análise de conglomerados, onde partições são geradas pela própria gênese da análise. Assim, como a discriminação pode ser considerada uma forma discreta de regressão, a análise de conglomerados pode ser considerada uma forma discreta de escalonamento multidimensional, no seguinte sentido: técnicas de escalonamento (como análise de correspondência) geram conjuntos de valores escalares da matriz de dados sob a forma de pontos no "continuum" do espaço multidimensional, onde técnicas de conglomerados geram conjuntos de valores discretos que alocam as observações dentro dos grupos (Greenacre, 1984).

ANÁLISE FATORIAL DE COMPONENTES PRINCIPAIS

Sempre na expectativa de buscar uma relação de comportamento entre os grupos atmosféricos e oceânicos, lançamos mão de uma última etapa objetivando detectar algumas combinações lineares entre as variáveis oceânicas, que possam ser usadas para explicar a estrutura de variância-covariância das variáveis atmosféricas e assim, obter um padrão de informação através dos dados brutos (não categorizados) e interpretá-lo.

Por meio da análise fatorial (Johnson & Wichern, 1998) das variáveis atmosféricas, conclui-se que o primeiro fator explica 57% da variabilidade do fenômeno, sendo que o ponderador mais significativo é aquele referente à TMINBH. Já o segundo fator, explica 29% da variabilidade, acumulando 86% da variabilidade explicada. Assinala-se que para este segundo fator, o maior coeficiente positivo de contribuição é o associado à variável URA e a maior contribuição oposta é a de TMAXBH.

Na tentativa de precisar o comportamento das variáveis de maior contribuição na determinação destes dois fatores (TMINBH, URA e TMAXBH), foram analisados os gráficos representados nas Fig. 6a e Fig. 6b, contendo os ponderadores mensais de influência de cada um dos atributos associados às componentes principais.


Sabendo-se que a maior contribuição na construção de COMP1 é devido à TMINBH, interpretamos através de Fig. 6a, que durante os meses de verão a temperatura mínima tem uma menor contribuição, isto se explica pois esta variável meteorológica é fortemente determinada pela perda radiativa noturna. Esta condição é inibida no verão devido à presença do alto teor de umidade relativa no ar e da intensa atividade convectiva. Assim, a amplitude térmica diária é pequena e não há predomínio do comportamento da temperatura mínima sobre o da máxima. Por outro lado, no inverno nesta localidade, a freqüente ocorrência de noites claras favorece a perda radiativa e consequentemente a redução da magnitude da temperatura mínima. Desta forma, constatamos, como esperado, que a maior contribuição de TMINBH ocorre no final do outono e nos meses de inverno.

A variabilidade da TMAXBH é pequena, pois estamos em latitudes onde predomina forte aquecimento, durante todo o ano. Esta variável é máxima no verão e mínima no inverno, ainda que seus valores em ambas as estações sejam altos. Já o comportamento da URABH (Fig.6b) é regido pela disponibilidade hídrica na região. Na primavera e no verão, a umidade cresce devido à contribuição da advecção proveniente da região amazônica. Na primavera a contribuição da umidade relativa do ar predomina sobre a contribuição da temperatura máxima que está iniciando o processo da ascensão. No outono, a contribuição destas duas variáveis se confunde, uma vez que a TMAXBH tende a diminuir e ainda existe grande disponibilidade de umidade na região local. Observe a diferença de fase de aproximadamente seis meses detectada em COMP1 (Fig. 6a) e de quatro meses em COMP2 (Fig. 6b), confirmando o comportamento climático esperado para estas variáveis.

Referente às variáveis oceânicas, constatamos que o primeiro fator explica 61% da variabilidade do fenômeno, sendo que o ponderador mais significativo é aquele relativo à TSM3 (negativamente). Já o segundo fator explica 28% da variabilidade, acumulando 89%, onde o maior coeficiente de contribuição é o associado à variável TSM4 (positivamente) oposto a TSM1+2 (negativamente). Analogamente, na tentativa de detalhar o comportamento das variáveis oceânicas de maior contribuição na determinação destes dois fatores, foram analisados os gráficos da Fig. 7a e Fig.7b contendo os ponderadores mensais de influência de cada um dos atributos associados às componentes.


Não percebemos aqui qualquer indicativo de existência de diferença de fase entre as variáveis oceânicas. Este comportamento reforça a associação sazonal entre as variáveis oceânicas e os ventos alíseos, indicando o predomínio sob as mesmas da marcha aparente do sol em torno do equador. Contudo se compararmos as Fig. 6(a e b) e Fig. 7(a e b), observamos que as diferenças de fases mensais nos sugere o fato de que, assumindo apenas a temperatura da superfície do mar aqui analisadas como causadores de variabilidade climática na localidade pontual sob estudo, ocorrências no Pacífico tropical associadas a TSM1+2 e TSM4 (TSM3) são sentidas em Belo Horizonte quatro (seis) meses após a sua configuração.

Na tentativa de quantificarmos esta possível influência do Pacífico tropical no clima de Belo Horizonte, elaboramos a análise conjunta das variáveis atmosféricas e oceânicas (Fig. 8). Assim, constatamos que a primeira componente explica grande parte da totalidade da variabilidade do fenômeno atmosférico em Belo Horizonte, sendo que o ponderador mais significativos é aquele referente à temperatura mínima (negativamente). Já o segundo fator explica grande parte da variabilidade do fenômeno oceânico, onde o maior coeficiente de contribuição é o associado à variável TSM3 (positivamente).


Na tentativa de corroborar os resultados mencionados acima, com relação às variáveis atmosféricas e oceânicas de maior contribuição na determinação dos dois fatores, foram analisados os gráficos (Fig. 9a e Fig.9b) contendo os ponderadores mensais de influência de cada um dos atributos globalmente associados às componentes.


Evidenciamos nas Fig. 9a e Fig. 9b que a primeira componente é fortemente influenciada pelas variáveis atmosféricas. Em contrapartida, a segunda componente é determinada através dos atributos oceânicos; em ambos os casos percebemos um comportamento sazonal intrínseco. Em ambos os gráficos figuram dois comportamentos harmônicos (cíclicos) simples. Através do conhecimento da predominância relativa da TSM3 e da forte contribuição das variáveis atmosféricas, observamos a diferença de fase de aproximadamente quatro meses detectada entre os dois componentes, confirmando o fato de que ocorrências no Pacífico tropical são sentidas em Belo Horizonte de quatro a seis meses após a sua configuração.

ANÁLISE FATORIAL DE CORRESPONDÊNCIA

A análise de correspondência ou método para a determinação de um sistema de associação entre os elementos de dois (ou mais) conjuntos, busca explicar a estrutura de associação entre os fatores em questão, relativos aos dados obtidos no experimento, tratados e categorizados.

O conceito de inércia em análise de correspondência é análogo ao conceito de variância em análise de componentes principais, e é proporcional à informação (distância Qui-quadrática) c2 (Greenacre, 1984; Lucio, 1991). Serão indicados, nesta etapa final, as variáveis que melhor explicam a inércia correspondente a cada dimensão e a proporção associada. Analisaremos o conjunto de variáveis na seqüência: atmosféricas, oceânicas e global.

Iniciamos nossa análise através do diagnóstico relativo às observações para, em seguida, inferirmos sobre o comportamento das variáveis.

Podemos observar, pela Fig. 10a, o mesmo padrão de configuração no que diz respeito às variáveis PRECBH e NDCBH. Note também, o padrão de informação que nos fornece a variável URABH sugerindo a associação oposta entre os agrupamentos seco e baixa pluviosidade; chuvoso e alta pluviosidade. Observamos, ainda, o mesmo padrão de ordenação no que diz respeito às variáveis TMAXBH e TMEDBH. Note, ainda, o padrão de informação que nos fornece a variável TMINBH sugerindo um estudo de seu comportamento através de sua série de anomalias. É importante enfatizar que devemos levar em consideração todas as informações aqui apresentadas. Através da Fig. 10b, podemos discutir sobre o padrão de ordenação no que diz respeito à variável TSM1+2 e TSM3 segue uma regularidade similar. Esta regularidade não ocorre com s variável TSM4, sugerindo um estudo destes comportamentos através de séries de anomalias, onde acreditamos encontrar um padrão regular associado às demais variáveis.


A proximidade dos pontos na Fig. 11 representativos das variáveis precipitação e número de dias de chuva, significa que estas são fortemente correlacionadas, não necessariamente proporcionais. Referente à DIM1, a maior contribuição absoluta é a da variável umidade relativa do ar em oposição à temperatura máxima de Belo Horizonte. Poderíamos mesmo afirmar que a formação deste eixo é extraída pela forte oposição entre precipitação e temperatura máxima Nesta dimensão as maiores contribuições relativas são fornecidas pelas variáveis precipitação e temperatura média em comportamento oposto. No verão embora se registrem altos valores de temperatura, quando a precipitação está associada a vários dias de chuvas contínuas (ZCAS), a temperatura máxima se mantêm em patamares mais baixos, devido à intensa cobertura de nuvens. No inverno, a intensa subsidência sobre o sudeste do Brasil, mantêm os dias claros, com baixa umidade relativa do ar, favorecendo altos valores de TMAXBH Esta oposição reflete a relação entre precipitação e temperatura máxima nesta região.


Enquanto que concernente à DIM2, a maior contribuição relativa é referente à temperatura mínima em oposição ao grupo de temperaturas na superfície do mar. Este comportamento oposto ao do grupo que se caracteriza pelas temperaturas de superfície do mar nas regiões Niño1, Niño2 e Niño3 pode estar sendo determinado pela alta contribuição da temperatura em Niño1 e Niño2 oposta, por uma pequena fase, à temperatura em Niño4

CONCLUSÕES E PERSPECTIVAS

Os resultados das técnicas estatísticas aqui apresentadas indicam que na caracterização do clima de Belo Horizonte nenhuma das variáveis consideradas pôde ser julgada como de baixa contribuição, ressaltando que TMINBH pode ser fortemente afetada pelo comportamento térmico na superfície do mar no Pacífico tropical. Não devemos deixar de observar, que por seu comportamento dicotômico, a umidade relativa do ar deve ser considerada, na análise final, como uma variável que auxiliará na correção de fase e na caracterização climática da região sob estudo. Temos o objetivo de dar continuidade a este estudo, analisando através de metodologias de Séries Temporais a importância das séries de anomalias.

AGRADECIMENTOS

M. L. de Abreu agradece à Fundação de Amparo à Pesquisa do Estado de Minas Gerais, por financiar o projeto do qual se originou parte deste artigo. Os autores agradecem ao Instituto Nacional de Meteorologia - Brasil e ao Climate Prediction Center da NOAA - EUA, de onde se originam os dados aqui analisados.

Manuscript submitted April 25, 1998

Revised version accepted March 22, 2000

NOTA SOBRE OS AUTORES

NOTE ABOUT THE AUTHORS

Paulo Sérgio Lucio

Received his Geophysics Doctor's degree in 1996 from the Institut de Physique du Globe de Paris. During his graduate course, he worked at École Nationale Supérieure des Mines de Paris in JOULE project on "3D Asymptotic Seismic Imaging", supported by funding of the European Community. He joined the Universidade Federal de Minas Gerais-UFMG in 1990 where he has been teaching graduate and undergraduate courses on Satistics, advising students and developing research on hydrology, geophysical simulations, inverse problems, environmental data analysis and statistical climatology.

Ela Mercedes Medrano de Toscano

Received her Production Engineering Doctor's degree in 1996 from the Universidade Federal do Rio de Janeiro. She joined the Universidade Federal de Minas Gerais-UFMG in 1996, where she has been teaching graduate and undergraduate courses on statistical analysis and multivariante time series forecasting.

Magda Luzimar de Abreu

Received her Meteorology Doctor's degree in 1991 from the Pennsylvania State University. She joined the Instituto Nacional de Pesquisas Espaciais-INPE in 1985 and worked at the Centro de Previsão de Tempo e Estudos-INPE between 1991 and 1996 where she developed studies on climate simulation using a numerical atmospheric general circulation model. Sice 1996 she is a professor at the Universidade Federal de Minas Gerais-UFMG, where she has been teaching graduate and undergraduate courses on Climatology, advising student and developing research. Her main interests involve the climatology of the state of Minas Gerais, its variability and the effects of the ENOS event on this region.

Punctual climatic series characteristics, using correspondence analysis.

Case study: Belo Horizonte - MG (Brazil).

The possibility of Belo Horizonte being affected by remote atmospheric variability, has initially motivated the investigation undergone in this paper. Therefore, this work presents the average behavior of both the atmospheric variables (precipitation, rainy days number, mean, maximum and minimum temperatures and relative humidity)in Belo Horizonte - MG (Brazil), and the sea surface temperature of central and eastern Tropical Pacific. Future work intends to address the influence of the Tropical Pacific over the climate of Belo Horizonte.

The correspondence analysis, used in this paper, is a very powerful technique in representing the observations and variables as points in a dual vectorial space when dimension is smaller than the original one. This kind of analysis has the aim of suppressing the effects of non-homogeneities due to the scale measurements of the variables that can induce aliasing effects. This is the case of the precipitation, compared to the other atmospheric variables. Therefore, it is a privileged method for description of ordinal data. We made the analysis of the atmospheric and oceanic data by means of monthly time series of 30 years (1960-1989). The samples have been submitted to statistical treatments to seek for the determination of classes that could help us to extract some of the information inlaid in the coarse data under study. Without loss of generalities, the analysis assures that the variables will not suffer non-characterization when we take into account the cognizance of the phenomena, such as endogenous and exogenous properties, associated with the climatic process involved in this essay.

Based on the factorial analysis for the atmospheric variables we concluded that the first factor explains 57% of the phenomenon variability, and its most significant weight is the TMINBH. On the other hand, 29% of the variability is explained by the second factor, for which URA contributes with the largest positive coefficient, while TMAXBH gives the biggest opposite contribution. Both first and second factors explain 86% of the total variability.

We believe that by knowing the behavior of the atmospheric and oceanic variables over the Tropical Pacific we will be able, in the future, to seek for the relations between them, not only in the case of Belo Horizonte, but in other locations. In this way we will be searching the understanding of how oceanic effects, such as the El Niño event, may be related to climatic anomalies over the region.,

By means of the correspondence analysis we conclude that the climate over Belo Horizonte-MG is related to the behavior of the sea surface temperature over the Tropical Pacific. None of the variables can be considered of minor importance in such ASSOCIATION. However the results suggest that we may be able to use TSM4 anomalies to investigate the variability of TMINBH, as well as the monthly behavior of TSM1+2 to predict the PRECBH, TMAXBH, in further investigations.

  • ABREU, M. L. de, ROCHA, A. G. C. & BRITO, I. J.-1992- Efeitos do El Nińo 1991/1992 na variaçăo das médias climatológicas de inverno no campo de temperatura na regiăo sudeste do Brasil. Boletim de Geografia Teorética, 23(45-46): 49-53.
  • CUPOLLILO, F. & ABREU, M. L. de, -1998-: O El Nińo e o Clima em Minas Gerais - Parte2: Estiagem no Nordeste de Minas Gerais. CD-ROM III Simpósio Brasileiro de Climatologia Geográfica.
  • GREENACRE, M. J.-1984- Theory and applications of correspondence analysis. Academic Press, London.
  • GUILLAUME, A. -1977- Introduction a la géologie quantitative. Masson, Paris.
  • JOHNSON, R. A. & WICHERN, D. W.-1998- Applied multivariate statistical analysis. Prentice Hall, New Jersey.
  • LUCIO, P.S.-1991- Análise de correspondęncia - um estudo de caso: erosăo acelerada por voçorocas. Rel. Técnico do Dep. de Estatística - ICEx-UFMG; 81 pp.
  • NIMER, E.-1989- Climatologia do Brasil. Instituto Brasileiro de Geografia e Estatística, Săo Paulo.
  • NOBRE, C. A.-1988- Ainda sobre a Zona de Convergęncia do Atlântico Sul: A Importância do Oceano Atlântico. Climanálise, 3(4): 30-33.
  • OLIVEIRA, A. S.-1986- Interaçőes entre Sistemas na América do Sul e Convecçăo na Amazônia. Tese de Mestrado em Meteorologia - Instituto  Nacional de Pesquisas Espaciais, Săo José dos Campos, SP; (INPE - 4008 - TDL / 239).
  • QUADRO, M. F. L. De ; ABREU, M. L. de -1994- Estudo de Episódios de Zona de Convergęncia do Atlântico Sul sobre a América do Sul. Anais VIII Congresso Brasileiro de Meteorologia, 2: 620-623, Belo Horizonte, MG.
  • ROCHA, A. M. G. C.; GANDU, A. W.-1996- A Zona de Convergęncia do Atlântico Sul. Climanálise Especial (ediçăo comemorativa de 10 anos): 140-142.

Datas de Publicação

  • Publicação nesta coleção
    21 Dez 2000
  • Data do Fascículo
    Nov 1999

Histórico

  • Aceito
    22 Mar 2000
  • Recebido
    25 Abr 1998
Sociedade Brasileira de Geofísica Av. Rio Branco, 156, sala 2510, 20043-900 Rio de Janeiro RJ - Brazil, Tel. / Fax: (55 21) 2533-0064 - São Paulo - SP - Brazil
E-mail: sbgf@sbgf.org.br