Accessibility / Report Error

Metodologia para análise de desempenho de simulações de sistemas convectivos na região metropolitana de São Paulo com o modelo ARPS: sensibilidade a variações com os esquemas de advecção e assimilação de dados

Metodology for performance analysis of simulations of convective systems in the metropolitan area of São Paulo with the ARPS model: sensitivity to variations with the advection and the data assimilation schemes

Resumos

Tempestades seguidas de enchentes e alagamentos em pontos da Região Metropolitana de São Paulo são eventos recorrentes nas estações chuvosas. O desempenho do modelo ARPS nas simulações numéricas de alta resolução espacial, para o evento de 04 de fevereiro de 2004, é avaliado por meio de erros estatísticos e índices de acurácia, com base no confronto entre a distribuição espacial da precipitação acumulada simulada e a estimada com o radar meteorológico de São Paulo. Os resultados quantificam a influência dos termos de advecção das equações primitivas nos erros de fase dos sistemas convectivos simulados, para o tipo de configuração atmosférica dominante no caso estudado. A assimilação incremental de medidas obtidas em estações de superfície durante a execução do modelo, corrige significativamente a fase das células convectivas profundas na região de influência das medidas, a qual é definida durante o processo de análise objetiva. Um novo índice de destreza para modelos de mesoescala é proposto (D PIELKE). As análises preliminares para o desempenho deste índice indicam adequação de sua formulação para o tipo de simulação efetuada.

tempestades; simulações numéricas de mesoescala; erros de fase e amplitude; índices de acurácia


Thunderstorms followed by flash flood events are recurrent in the Metropolitan Area of São Paulo during the wet seasons. The performance of several numerical simulations of the February 04, 2004 event carried out with the ARPS system in high horizontal resolution is evaluated through statistical errors and indices of accuracy. The evaluation is based on direct confrontation of the accumulated precipitation fields simulated by the model and measured by the São Paulo weather radar. The results quantify the influence of the advective terms of the primitive equations on phase errors of the simulated convective systems. The incremental assimilation of surface station data done during the model execution improved its performance in the area limited by the influence radius, which is defined during the objective analysis process. A new skill index formulation is presented (D PIELKE). The preliminary results indicate that the D PIELKE index is adequate for assessing the simulation skill of small-scale convective systems.

thunderstorms; mesoscale numerical simulations; phase and amplitude errors; indices of accuracy


ARTIGOS

Metodologia para análise de desempenho de simulações de sistemas convectivos na região metropolitana de São Paulo com o modelo ARPS: sensibilidade a variações com os esquemas de advecção e assimilação de dados

Metodology for performance analysis of simulations of convective systems in the metropolitan area of São Paulo with the ARPS model: sensitivity to variations with the advection and the data assimilation schemes

Ricardo Hallak; Augusto José Pereira Filho

Universidade de São Paulo, Instituto de Astronomia, Geofísica e Ciências Atmosféricas, Departamento de Ciências Atmosféricas (USP/IAG/DCA), São Paulo, SP, Brasil

hallak@model.iag.usp.br, apereira@model.iag.usp.br

RESUMO

Tempestades seguidas de enchentes e alagamentos em pontos da Região Metropolitana de São Paulo são eventos recorrentes nas estações chuvosas. O desempenho do modelo ARPS nas simulações numéricas de alta resolução espacial, para o evento de 04 de fevereiro de 2004, é avaliado por meio de erros estatísticos e índices de acurácia, com base no confronto entre a distribuição espacial da precipitação acumulada simulada e a estimada com o radar meteorológico de São Paulo. Os resultados quantificam a influência dos termos de advecção das equações primitivas nos erros de fase dos sistemas convectivos simulados, para o tipo de configuração atmosférica dominante no caso estudado. A assimilação incremental de medidas obtidas em estações de superfície durante a execução do modelo, corrige significativamente a fase das células convectivas profundas na região de influência das medidas, a qual é definida durante o processo de análise objetiva. Um novo índice de destreza para modelos de mesoescala é proposto (DPIELKE). As análises preliminares para o desempenho deste índice indicam adequação de sua formulação para o tipo de simulação efetuada.

Palavras-chave: tempestades, simulações numéricas de mesoescala, erros de fase e amplitude, índices de acurácia.

ABSTRACT

Thunderstorms followed by flash flood events are recurrent in the Metropolitan Area of São Paulo during the wet seasons. The performance of several numerical simulations of the February 04, 2004 event carried out with the ARPS system in high horizontal resolution is evaluated through statistical errors and indices of accuracy. The evaluation is based on direct confrontation of the accumulated precipitation fields simulated by the model and measured by the São Paulo weather radar. The results quantify the influence of the advective terms of the primitive equations on phase errors of the simulated convective systems. The incremental assimilation of surface station data done during the model execution improved its performance in the area limited by the influence radius, which is defined during the objective analysis process. A new skill index formulation is presented (DPIELKE). The preliminary results indicate that the DPIELKE index is adequate for assessing the simulation skill of small-scale convective systems.

Keywords: thunderstorms, mesoscale numerical simulations, phase and amplitude errors, indices of accuracy.

1. INTRODUÇÃO

A acurácia das previsões de fase e amplitude dos fenômenos meteorológicos é um dos importantes problemas científicos, que estimulam pesquisas ao redor do globo. A abrangência desta questão adquire dimensões sociais em áreas densamente povoadas do Brasil, como a Região Metropolitana de São Paulo (RMSP). A RMSP é periodicamente sujeita a eventos convectivos severos, que produzem intensa precipitação, cujos efeitos negativos para a população são agravados pelo uso e ocupação inadequados do solo (Silva et al., 2009). O monitoramento operacional da precipitação na RMSP é efetuado já há algum tempo com o uso do Radar Meteorológico de São Paulo (RADSP), operado pela Fundação Centro Tecnológico de Hidráulica (FCTH) da Universidade de São Paulo (USP) (Pereira Filho e Barros, 1998). Com resolução espaço-temporal equivalente a uma rede telemétrica com cerca de 1 pluviômetro a cada 2 km x 2 km, o RADSP proporciona, por exemplo, estimativas da precipitação para acompanhamento e previsões de chuva a curtíssimo prazo (15 minutos a 1 hora) pelo método de extrapolação (p.e., Farias, 2009). No entanto, a despeito do uso de radares meteorológicos, imagens de satélite mais frequentes e previsões numéricas globais com razoável resolução espacial entre outras medidas atmosféricas e seus subprodutos, a previsão quantitativa de precipitação é ainda bastante deficiente na escala de tempo de curto prazo (1 a 24 horas). De fato, as previsões de precipitação de curto prazo são fortemente dependentes da subjetividade do previsor de tempo. A modelagem numérica regional de alta resolução espacial é uma das opções para se obter avanços, tanto no aprimoramento da compreensão dos fenômenos atmosféricos severos, como no aumento da precisão de sua previsão.

Neste trabalho, a simulação explícita de sistemas convectivos profundos (isto é, aquela onde o ciclo de vida completo de nuvens cumulonimbus individuais se desenvolve de fato na solução numérica) é obtida em domínios numéricos de alta resolução espacial com espaçamentos de grade de 1 km. O objetivo das simulações nesta resolução de mesoescala β e γ (Orlanski, 1975) é reproduzir oscilações espaço-temporais de variáveis meteorológicas com comprimentos de onda de, no mínimo, uma dezena de quilômetros. No entanto, como o realismo das simulações é afetado pela componente estocástica das simulações de mesoescala, que aumenta conforme a escala espacial do domínio numérico decresce (Anthes, 1983), espera-se que erros de fase e amplitude cresçam e se propaguem pelo domínio de simulação. As estimativas de precipitação à superfície RADSP oferecem uma oportunidade de se caracterizar e compreender a origem dos erros de fase e amplitude nos campos de precipitação das previsões e simulações numéricas, contra as quais as estimativas RADSP podem ser comparadas.

São diversas as fontes de erros nos resultados finais de simulações numéricas de alta resolução espacial. Por exemplo, as parametrizações dos fenômenos de subgrade, que é a parte da física atmosférica não resolvida pela grade do modelo e que devem necessariamente estar contidas nas suas soluções numéricas quando se objetiva um maior realismo dos resultados, podem ser tratadas como fontes de perturbação das simulações. Geralmente, são geradas diferentes soluções numéricas para cada diferente opção de parametrização de um mesmo fenômeno físico, com consequências significativas para a previsão dos campos de precipitação. Por outro lado, a questão da esparsa distribuição espacial dos instrumentos meteorológicos no Brasil, bem como, a acurácia e precisão das suas medições, também afeta a qualidade das soluções numéricas finais na escala dos fenômenos convectivos. Observe-se que a atmosfera ambiente sofre oscilações dinâmicas e termodinâmicas em alta frequência no tempo e no espaço, quando se desenvolvem sistemas convectivos profundos. Como consequência, estas oscilações são raramente capturadas pela base atual de medições convencionais de superfície e aerológicas. Mesmo quando se tenta corrigir estas deficiências por meio de metodologias alternativas, como por exemplo, aquelas que envolvem a assimilação de dados observacionais convencionais ou remotos nos modelos de mesoescala, a acurácia limitada dos dados é fonte de erro nos resultados numéricos (p.e., Daley, 1991).

Este trabalho revisa e aplica metodologias de análises de erros aos resultados de simulações numéricas de alta resolução espacial, sob o ponto de vista da sua distribuição espacial. As metodologias propostas baseiam-se em análises objetivas de erros e índices de concordância e destreza sobre conjuntos de medidas atmosféricas comparadas a resultados numéricos de simulações explícitas da convecção atmosférica. As análises são aplicadas aos campos de precipitação simulados para um caso real de sistema convectivo profundo de mesoescala observado na RMSP. O modelo numérico adotado é o sistema ARPS (Advanced Regional Prediction System) (Xue et al., 2000; 2001; 2003). A análise objetiva de dados meteorológicos ADAS [ARPS Data Assimilation System (Xue et al., 1995)] é usada para a assimilação de conjuntos de dados de superfície e sondagens atmosféricas na elaboração de experimentos de sensibilidade do modelo. O ARPS é integrado no cluster de 16 processadores XEON-Pentium 4/3.0 GHz (Pereira Filho et al., 2008) com pico de processamento de 120 Gflops (média de 38 Gflops) do Laboratório de Hidrometeorologia (LABHIDRO) do Instituto de Astronomia, Geofísica e Ciências Atmosféricas (IAG) da USP.

2. DADOS E METODOLOGIA

De forma sumária, a caracterização da situação atmosférica, associada aos sistemas convectivos observados na Região RMSP, foi obtida pela análise diagnóstica de medidas meteorológicas convencionais e estimativas de variáveis obtidas por sensoriamento remoto. Neste sentido, estimativas de precipitação à superfície, obtidas pela conversão das refletividades RADSP por meio da relação Z-R de Marshall e Palmer (1948), foram usadas em conjunção às imagens dos satélites geoestacionários GOES-10 e GOES-12 para a identificação e seleção de casos de convecção profunda associados a enchentes repentinas em pontos da RMSP. As radiossondagens realizadas diariamente nos horários sinóticos das 0000 UTC e 1200 UTC no aeródromo de Campo de Marte (situado na Zona Norte da Capital Paulista), foram usadas para análise do perfil vertical das condições atmosféricas ambientes e, adicionalmente, para assimilação no modelo ARPS. Medidas de estações de superfície das redes SYNOP, METAR e CETESB foram também assimiladas no ARPS com o auxílio do sistema de análise objetiva ADAS. As análises GFS de 1º de espaçamento horizontal (cerca de 110 km na linha do equador), disponíveis a cada 6 horas, foram usadas para a caracterização sinótica da atmosfera nos casos selecionados. Além disso, estas análises globais alimentaram o modelo regional ARPS com condições iniciais e de fronteira na sua grade de menor resolução espacial. Os resultados gerais das análises diagnósticas efetuadas com o conjunto de dados descritos são encontrados em Hallak (2007).

2.1. Simulações numéricas

As simulações foram efetuadas em 4 domínios espaciais com diferentes resoluções horizontais (27, 9, 3 e 1 km de espaçamento entre os pontos de grade) e com 72 níveis verticais, com alta resolução vertical no primeiro quilômetro acima da superfície. O aninhamento das 3 grades internas ao domínio de 27 km de espaçamento é mostrado na Figura 1a.


As características básicas da fisiografia do solo e superfície do modelo, a geometria dos domínios e as parametrizações de precipitação usadas em cada grade estão descritas na Tabela 1. Os campos de análises GFS são usados como condições iniciais e de fronteira do modelo regional ARPS em sua grade de menor resolução espacial (27 km). O aninhamento das grades é feito no modo unidirecional, de forma que não há influência das grades aninhadas sobre as grades exteriores, mas há transferência de informação no sentido inverso nas fronteiras de cada grade aninhada. O aninhamento unidirecional é o único modo atualmente disponível no ARPS. Neste esquema de aninhamento, cada grade é rodada independentemente das outras. Assim, uma grade de menor resolução alimenta com condições iniciais e de fronteira a grade imediatamente aninhada a ela. Na sequência, o processo se repete para a grade aninhada seguinte. Uma vantagem do aninhamento unidirecional é que diversos experimentos efetuados com as grades de maior resolução espacial podem ser obtidos sem que haja necessidade de se rodar as grades exteriores novamente. Por outro lado, qualquer alteração efetuada em uma grade externa implica na obrigatoriedade de se rodar novamente as grades interiores a ela.

A Figura 1b mostra a elevação topográfica da grade de 1 km de espaçamento. Nesta figura estão também indicadas as fronteiras geopolíticas dos 39 municípios que compõem a RMSP. As marcas vermelhas em forma de X marcam as posições geográficas das estações meteorológicas de superfície das redes SYNOP, METAR e CETESB.

Neste trabalho, as grades com espaçamentos horizontais de 3 e de 1 km utilizam somente a parametrização de microfísica de nuvens de Lin et al. (1983) (Tabela 1). Esta parametrização permite o tratamento dos processos associados à distribuição espacial da água na atmosfera em suas três fases, incluindo a formação dos diversos tipos de nuvens. As grades de menor resolução espacial (27 km e 9 km) utilizam somente a parametrização de cúmulos de Kain e Fritsch (1993) nos experimentos de controle.

2.2. Análise dos resultados das simulações

Para a quantificação dos erros nas simulações numéricas e a possível determinação das suas fontes de erros, aplica-se uma série de índices e escores estatísticos, os quais são usados como ferramentas de avaliação da acurácia dos experimentos numéricos. A metodologia proposta oferece ferramentas adicionais às verificações diretas tradicionais das soluções numéricas, realizadas por meio da comparação visual dos campos simulados e derivados das quantidades básicas, procedimentos estes que se enquadram na categoria de métodos subjetivos. Além disso, as ferramentas aqui descritas oferecem uma alternativa às comparações estatísticas efetuadas isoladamente em pontos de estações, que frequentemente penalizam exageradamente os resultados dos modelos numéricos (Anthes et al., 1989), em especial nos casos que envolvem o desenvolvimento de sistemas convectivos de mesoescala e de escala local. Dessa forma, são quantificados os erros das simulações em relação aos campos horizontais de distribuição de precipitação acumulada à superfície contra os campos de precipitação estimados pelo RADSP derivados dos CAPPIs de 3 km de altitude nos horários correspondentes. Os erros são também calculados em função de variações na área de abrangência do domínio com o objetivo de se avaliar a sensibilidade das respostas do modelo para determinadas áreas do domínio numérico (Martin e Xue, 2006). Análises comparativas podem ser efetuadas sobre os campos de precipitação acumulada em variados períodos de tempo. Ressalta-se que qualquer outra variável meteorológica pode ser analisada pela mesma metodologia, desde que já esteja objetivamente analisada em pontos de grade, ou seja, distribuída apropriadamente numa grade regular de pontos.

2.2.1. Preliminares

Pereira Filho e Nakayama (2001) estabeleceram os limites espaciais onde as estimativas de precipitação obtidas pelo RADSP podem ser consideradas de boa qualidade, para além da qual a qualidade das estimativas cai com a distância ao radar. Segundo seus resultados, a área onde as estimativas são mais confiáveis corresponde a um círculo centrado no radar com raio de 120 km.

A metodologia de verificação estatística das simulações permite a comparação entre os diversos experimentos numéricos a partir da confrontação direta entre as métricas derivadas. Com base nestas comparações, os experimentos que minimizam os erros das simulações podem então ser objetivamente determinados. No entanto, a metodologia proposta somente pode ser aplicada para campos simulados e observados que possuam a mesma resolução espacial. Como o espaçamento horizontal original das estimativas RADSP se aproxima de 2 km, estas foram interpoladas para uma nova grade pelo método de interpolação bilinear com espaçamento dx = dy = 0.01º (aproximadamente 1 km em longitude e latitude). Por sua vez, os campos de precipitação simulados com o ARPS na grade de 1 km foram degradados para exatamente dx = dy = 0.01º pelo método "box averaging", mais eficiente para a obtenção de degradações de resoluções em contraste aos métodos de interpolação de dados. Com ambos os campos de precipitação representados pelo mesmo conjunto de pontos de grade, procede-se então a avaliação objetiva das simulações, uma vez que ambos os processos de regradeamento preservam a distribuição espacial e a amplitude do campo original com desprezível perda de informação.

2.2.2. Volume de água precipitada à superfície

O valor total da precipitação acumulada à superfície é uma variável de interesse na comparação quantitativa entre observado e simulado. Neste trabalho, as comparações quanto à precipitação são obtidas em termos do volume total precipitado para cada um dos subdomínios selecionados para os cálculos estatísticos. Assim, para cada subdomínio de uma dada grade, o volume de água precipitada é calculado em função da área do pixel e da precipitação acumulada a cada hora durante um evento. Em seguida, o volume acumulado em cada pixel do subdomínio é somado para se achar o volume total acumulado naquela área durante um determinado período de tempo da duração do evento. O valor do volume de água precipitado contém informações sobre o desempenho do modelo numérico e, em adição, permite aplicação prática do ponto de vista hidrológico, como na previsão de enchentes repentinas e no manejo de recursos hídricos numa determinada bacia hidrográfica.

Um elemento de área da superfície terrestre Sj em coordenadas esféricas, definida para cada conjunto j de quatro pontos de grade nas direções x e y, é dado pela Equação 1. O quadrilátero assim definido, também chamado pixel de grade, é limitado pelos intervalos [θi, θf] em longitude e [φi, φf] em latitude, onde os índices i e f referem-se, respectivamente, aos valores "iniciais" e "finais" dos intervalos. Na Equação 1, r é o raio da terra:

A somatória do produto da precipitação Pj por cada elemento de área Sj, tomados no quadrilátero de área j, fornece a quantidade desejada do volume total precipitado (Vt) no subdomínio analisado, desde que se considere que houve precipitação de forma homogênea em cada pixel da grade. Esta última condição penaliza os cálculos na medida inversamente proporcional à resolução do domínio de grade. Dessa forma, quanto mais alta a resolução espacial do domínio, menor é a limitação imposta pela condição de homogeneidade espacial da precipitação no pixel. O total do volume precipitado está expresso na Equação 2:

2.2.3. Erros, métricas, escores e índices estatísticos

O cérebro humano, alimentado pela experiência pessoal e pelas informações sensoriais fornecidas pelos olhos, é uma poderosa ferramenta de análise e identificação de padrões geométricos. Este é o caso de comparações visuais entre campos simulados e medidos em meteorologia (método subjetivo). Por outro lado, a quantificação das comparações entre campos meteorológicos é muitas vezes mais precisa se obtida por intermédio do uso de computadores, que são calculadoras poderosas, e a ciência da computação e seus algoritmos, que ordenam os cálculos no computador. A análise objetiva baseia-se no segundo método.

Ressalta-se, inicialmente, que o tratamento dos erros inerentes às estimativas do RADSP não é aqui considerado. As métricas estatísticas calculadas neste trabalho para avaliação das simulações são baseadas nos escores estatísticos descritos, por exemplo, em Fox (1981), Willmot (1982), Anthes (1983), Anthes et al. (1989), Pielke (2002) e Wilks (2006). No que segue, as somatórias indicadas são aplicadas a campos horizontais com N pontos de grade, onde N = nx . ny, com nx representado o número de pontos da grade em longitude e ny, em latitude. Contudo, observa-se que N poderia se referir a número de eventos numa série temporal, sem perda de generalidades.

Seja P uma variável qualquer discreta ou contínua no espaço. Segundo Pielke (2002), a correspondência ponto a ponto entre a solução numérica e as medidas observacionais de uma mesma variável, proporciona um teste quantitativo para medir a habilidade (ou destreza) do modelo em reproduzir ou prever dados observados. Sejam Pis e Pio, respectivamente, a precipitação acumulada simulada e observada num mesmo ponto de grade i num domínio numérico com N pontos de grade. A quantidade fundamental para o estudo de erros é a diferença (di) entre o previsto ou simulado no ponto i do espaço bidimensional (i = 1, 2, 3,..., N) no tempo t [Pis = P(x,y,t)] e o medido ou observado para uma mesma variável, no mesmo ponto no espaço e no tempo [Pio = O(x,y,t)], o que é expresso simplesmente por:

Basicamente, di = 0 indica simulação perfeita naquele ponto i, enquanto di >> 0 ou di << 0, simulação imperfeita. Quanto mais distante de 0 o valor de di, mais imperfeita a simulação. No entanto, embora Σdi forneça uma idéia da qualidade de uma simulação para uma dada variável, o mesmo não explica as fontes ou características particulares das magnitudes dos erros. A partir da quantidade básica di, contudo, é possível derivar erros que reflitam diferentes componentes do erro total. No que segue, será dada preferência ao uso de siglas em língua inglesa para a identificação dos diversos erros, para uma melhor conformação à literatura científica disponível atualmente. É importante também notar que todas as operações matemáticas, que envolvam média no espaço, devem ser efetuadas considerando-se a esfericidade da superfície terrestre. Portanto, cálculos computacionais que envolvam área são sempre ponderados pelo cosseno da latitude, o que aumenta a precisão dos resultados. Além disso, os conceitos aqui desenvolvidos podem ser aplicados indiferentemente na verificação de simulações ou de previsões. No que segue, será usado sempre o termo "simulação", em conformidade com o estudo de caso apresentado na seção 3.

A medida mais simples derivada de di é o Erro Médio (ME em Inglês) ou tendência ou, ainda, viés (BIAS em Inglês). O VIÉS mede a tendência de o modelo superestimar ou subestimar a precipitação em relação ao observado. Esta tendência, também chamada de erro sistemático, é definida como:

Em termos estatísticos, a média dos erros individuais ou viés definido pela Equação 4 é o primeiro momento da distribuição das diferenças. O viés não traz informação a respeito dos erros individuais e, portanto, não pode ser usado como medida de acurácia da simulação. Além disso, apesar de fornecer uma idéia da tendência ou erro sistemático, o viés é afetado pelo fato de que erros individuais positivos e negativos de mesma magnitude se cancelam na somatória, o que geralmente leva à subestimação do erro das simulações. A média dos erros absolutos (Erro Absoluto Médio || ou MAE na sigla em Inglês) contorna este problema. Por ser menos afetado por pontos com valores anomalamente extremos, também chamados "pontos singulares" (ou "outliers" em Inglês), o MAE é considerado preciso e robusto como medida da habilidade de modelos numéricos em reproduzir a realidade (Fox, 1981). O MAE é definido por:

Uma medida frequentemente usada na verificação da acurácia de modelos numéricos é o Erro Quadrático Médio (MSE na sigla em Inglês) como descrito, por exemplo, em Wilks (2006). O MSE é similar ao MAE, porém mais sensível aos grandes erros, por elevar as diferenças individuais ao quadrado. MSE é sempre positivo. MSE = 0 indica simulação perfeita. MSE é definido por:

Em adição ao MSE, a raiz quadrada de MSE, ou Raiz do Erro Quadrático Médio (RMSE em Inglês), é comumente usada para expressar a acurácia dos resultados numéricos com a vantagem de que RMSE apresenta valores do erro nas mesmas dimensões da variável analisada. O RMSE é definido por:

Por outro lado, segundo Takacs (1985), o Erro Quadrático Médio pode ser decomposto em um termo dissipativo (ou de amplitude, MSEdiss) e outro, dispersivo (ou de fase, MSEdisp). Para maior clareza, doravante o MSE como definido pela Equação 6 passa a ser chamado de Erro Médio Quadrático Total (MSETOT),

o qual pode ser escrito (Takacs, 1985):

Na Equação 9, o componente dissipativo de MSETOT é dado por:

e o dispersivo por:

onde σ(x) é o operador desvio padrão da variável aleatória x, ρ é o coeficiente de correlação espacial entre os campos horizontais de Pio e Pis e as barras sobrescritas indicam médias espaciais das variáveis. O desvio padrão para uma variável x qualquer, σ(x), é definido como a raiz quadrada da variância de x:

onde a variância de x é uma medida da dispersão das ocorrências de x em torno da sua própria média. Em outras palavras, a variância de uma variável x é o erro que seria cometido se todas as ocorrências de x fossem substituídas pelo valor esperado (ou média). Note-se que o desvio padrão de uma variável também é afetado pelos pontos singulares.

O coeficiente de correlação espacial (ρ) é definido da mesma forma que o coeficiente de correlação linear, com a diferença de ser aplicado às variáveis espacialmente distribuídas num mesmo domínio:

Na Equação 13, COV é a covariância entre o campo simulado e o observado de uma variável. Ainda, σS = σ() e σo = σ(). O exame conjunto dos três tipos de erros (MSETOT, MSEDISS e MSEDISP), pode ser efetuado para indicar, por exemplo, os experimentos numéricos que minimizam os erros num conjunto de simulações de um mesmo caso.

Numa amostra obtida de um universo de medidas qualquer, a variância das diferenças () é o segundo momento da distribuição das diferenças, definida por:

onde fornece informação sobre a distribuição dos erros di em torno da média dos erros. Note-se que a solução computacional para a covariância (COV) é a mesma para o cálculo da variância, uma vez que a variância de uma variável x é um caso especial da covariância de x com ela mesma, como está explícito na segunda igualdade da Equação 14. A raiz quadrada da variância é o desvio padrão da distribuição das diferenças. Como mostrado em Fox (1981), o erro médio quadrático total (MSETOT) está relacionado à tendência ou viés () e à variância () por:

Vê-se, portanto, que MSETOT contém mais informação do que o viés ou a variância isoladamente. Note-se que, para variáveis com distribuição normal, o viés tem distribuição normal, enquanto a variância tem distribuição de chi-quadrado. O MSETOT, de acordo com a Equação 15, tem então, distribuição composta (Fox, 1981). Por esta razão, e pelo fato de que o viés não representa adequadamente as características individuais dos erros, Willmott (1982) considera MAE e RMSE (ou MSE) as melhores medidas gerais de desempenho de modelos.

Por outro lado, Wilks (2006) ressalta que MSETOT pode também ser escrito em função do quadrado do erro médio (viés) e do coeficiente de correlação linear de Pearson, entre os valores simulados e observados (rso):

Neste caso, vê-se que o coeficiente de correlação linear rso (ou, analogamente, o coeficiente de determinação ) pode levar a falsas conclusões, quando interpretado como índice de acurácia de previsões ou simulações. Basta, por exemplo, imaginar um caso em que, para um mesmo valor de MSETOT, tenha-se alto valor de rso e um igualmente alto valor de viés (primeiro termo do lado direito da Equação 16). Neste caso, rso e viés podem mutuamente se cancelar na Equação 16. Portanto, para uma situação como a descrita, uma variável cuja simulação e observação sejam altamente correlacionadas, o alto valor de rso (ou ) ocultará a tendência das simulações superestimarem ou subestimarem o observado. Como notado por Willmot (1982), o parâmetro de intercepção e a declividade da reta de regressão são mais informativos do que o próprio coeficiente de correlação. Por analogia, o mesmo problema pode então ser atribuído ao coeficiente de correlação espacial (ρ). Assim, quando analisado isoladamente, ρ não é adequado para indicar completamente a medida de acurácia de uma simulação.

Willmot (1982) ressalta que, apesar de MAE e RMSE proporcionarem estimativas do erro médio, nenhum dos dois proporciona informações sobre a natureza ou tipo das diferenças. Então, é importante determinar qual porção do erro descrito por RMSE é sistemático e qual porção do erro é não-sistemático. Em outras palavras, para uma simulação considerada boa, a diferença sistemática deve se aproximar a zero, enquanto a diferença não-sistemática deve se aproximar de RMSE. Para quantificar o erro sistemático em MSE (MSEsis) e o não-sistemático (MSEnsis), Willmot (1982) propõe os seguintes cálculos:

onde i = a + bPio é a equação da reta de regressão linear entre os campos simulado e observado (sendo a o parâmetro de intercepção do eixo y e b a declividade da reta) e para os erros não-sistemáticos.

No entanto, por serem não-limitados, nenhum dos erros definidos acima fornecem informação sobre o tamanho relativo das diferenças. O Índice de Concordância (IC), proposto por Willmot (1982), possui esta propriedade (0 < IC < 1) e pode ser usado, por exemplo, para comparar diferentes simulações de um mesmo fenômeno. IC é definido por:

com as médias (variáveis com barra sobrescrita) tomadas na área em análise. IC = 1 indica concordância perfeita entre o campo simulado e o observado.

Pielke (2002) sugere uma metodologia adicional para a determinação da qualidade de uma simulação. Dessa forma, se uma simulação preenche os três critérios sugeridos a seguir, a destreza da simulação fica demonstrada. Os critérios são:

onde RMSEbias é o RMSE após a remoção de um bias constante associado à tendência do modelo, definido por:

Um teste adicional, para se determinar a simulação mais realística dentro de um conjunto de simulações de um mesmo caso, foi elaborado com base nos três critérios propostos por Pielke (2002), conforme Equações 20. Note-se, primeiramente, que da Equação 20 (1) se os desvios padrão se equivalerem (ou seja, se o padrão de distribuição espacial da variável simulada é equivalente à observada). Caso contrário, a razão σso pode assumir qualquer outro valor real e a diferença se distancia de zero. Considerando-se, então, um termo absoluto com a magnitude:

e que, da Equação 20 (2):

e da Equação 20 (3):

então uma possível formulação para um teste de destreza de modelo, segundo os critérios de Pielke (2002), seria:

Na Equação 24, DPIELKE é, então, um índice baseado nos critérios propostos em Pielke (2002), que fornece uma medida da destreza do modelo numérico regional em simular realisticamente um determinado campo meteorológico. Note-se que:

1) A destreza do modelo fica demonstrada se DPIELKE < 2;

2) A melhor simulação num conjunto de várias simulações de um mesmo caso é aquela que obtiver o menor valor de DPIELKE;

3) A simulação perfeita fornece DPIELKE = 0.

Apesar de sempre positivo, DPIELKE não é um valor limitado pelo lado positivo do conjunto dos números reais, como é o IC da Equação 19. Portanto, uma desvantagem do índice DPIELKE em relação ao índice de concordância (IC) da Equação 19, proposto por Willmot (1982), é que DPIELKE não é limitado. Willmot (1982) ressalta que índices que variam dentro de limites bem definidos são mais úteis para comparação entre diferentes modelos e para comparações entre diferentes simulações de um único caso, obtidas com um mesmo modelo. No entanto, como vantagem, DPIELKE considera explicitamente a razão entre os desvios padrão [Equação 20(1)]. No presente trabalho, o índice DPIELKE será testado e comparado ao índice de concordância (IC) da Equação 19 para o caso de 04 de fevereiro de 2004.

Um aspecto adicional na questão dos erros em simulações explícitas de convecção deve ainda ser abordado. Lembrando mais uma vez que o realismo de uma simulação é afetado pela componente estocástica das simulações de mesoescala, que aumenta conforme a escala espacial do domínio numérico decresce (Anthes, 1983), as estatísticas de verificação podem indicar um resultado pobre ainda que as simulações sejam bastante realísticas (Anthes et al., 1989). O exemplo hipotético a seguir ilustra este paradoxo.

2.2.4. Matriz de correlações

A Figura 2 mostra uma distribuição espacial hipotética de precipitação acumulada acima de 10 mm em 1 hora, em sombreado, a qual emula um campo observado de superfície. Nesta figura, o domínio mostrado representa uma grade com 3 km de espaçamento entre seus pontos. A previsão de precipitação acima de 10 mm, também hipotética e para o mesmo horário de acumulação, é mostrada na mesma figura (contornos contínuos). O campo de previsão foi obtido do campo de observação hipotético, aplicando-se a operação de translação por 4 pontos de grade na direção oeste. Portanto, há erro de fase de 12 km entre o núcleo observado e o previsto, mas não há erro em amplitude.


Para o subdomínio delimitado pela CAIXA 1 na Figura 2, o coeficiente de correlação espacial entre ambos os campos é de apenas ρ = 0.052. Além disso, dependendo da área definida para os cálculos de erros espaciais, o coeficiente de correlação espacial pode ser menor que zero como na área delimitada pela CAIXA 2 na mesma figura (ρ = -0.160). Assim, um modelo regional de alta resolução espacial pode simular corretamente a intensidade e a forma de um campo meteorológico, mas deslocar o campo por uma pequena distância. No caso hipotético da Figura 2, um pluviômetro de superfície (cuja posição no domínio está marcada com X no centro do núcleo observado hipotético) irá registrar acúmulo de precipitação igual ou maior que 70 mm em 1 hora. Assim, para uma análise pontual de erros, o núcleo de precipitação acumulada previsto pelo modelo estaria posicionado completamente fora do alcance do pluviômetro X e o erro seria de 100%, o que, de fato, penaliza excessivamente os resultados do modelo. Este problema é particularmente crítico quando a escala espacial da simulação é de convecção explícita. A matriz de correlação permite verificar a habilidade do modelo em simular realisticamente campos escalares, como a precipitação.

Para a mesma grade da Figura 2, a correlação espacial entre os campos observado e simulado são calculados para vários deslocamentos norte-sul e leste-oeste do campo simulado em relação ao campo observado. Os pontos de grade para regiões sem dados não são considerados. O resultado é uma matriz que contém informação a respeito da habilidade do modelo em simular padrões espaciais. Uma matriz, contendo poucos coeficientes altos de correlação positivos e um grande número de coeficientes pequenos ou negativos, indica considerável variância nos campos simulados e observados, e que o modelo está simulando a estrutura observada, embora não necessariamente no local correto. No exemplo da Figura 2, um deslocamento apropriado de 12 km para oeste irá fornecer um coeficiente de correlação igual a 1.0 (célula destacada pela borda tracejada), indicando uma simulação perfeita quanto ao padrão de distribuição espacial. Em contraste, uma simulação muito suavizada e com pouca estrutura espacial irá mostrar pequenos coeficientes de correlação e menor variação para vários deslocamentos. A Tabela 2 mostra a matriz dos coeficientes calculados para o caso hipotético da Figura 2 para deslocamentos de 7 pontos na direção de cada ponto cardeal.

2.3. Esquemas de advecção do sistema ARPS

Embora o sistema ARPS disponibilize variadas opções de esquemas advectivos, a exploração de todas as opções oferecidas não é objetivo deste artigo. Pretende-se apenas mostrar a utilidade da metodologia na quantificação de erros em simulações de sistemas convectivos em alta resolução espacial. Diversos testes de sensibilidade do modelo ARPS, quanto à produção de precipitação para o caso analisado neste trabalho, foram efetuados variando-se tanto o grau quanto as opções de tipo dos esquemas advectivos de variáveis escalares e de momento. Para evitar uso excessivo de espaço, apenas será mostrada a comparação entre duas simulações, que diferem quanto ao grau do esquema advectivo de momento, em vista da maior sensibilidade do modelo a estas variações.

Inicialmente, deve-se notar que, no ARPS, as variáveis meteorológicas são decompostas em um termo relativo ao estado básico da atmosfera no instante inicial e um termo de perturbação deste estado básico, como mostrado nas Equações 25. Nestas equações, u, v e w são, respectivamente, os componentes zonal, meridional e vertical do vento, θ a temperatura potencial, p a pressão atmosférica, ρ a densidade do ar, qv a razão de mistura do vapor d'água e qil a razão de mistura total de água nas fases líquida e sólida. Nestas equações, a barra sobrescrita indica o estado básico da variável, considerada horizontalmente homogênea e, portanto, dependente apenas da sua distribuição vertical no tempo inicial, enquanto o apóstrofo indica perturbação da variável em relação ao seu estado básico. Observe-se que os estados básicos de w e de qil são considerados nulos.

As variáveis prognósticas no ARPS são, u, v, w, θ' e qψ, onde o índice ψ refere-se aos 6 tipos de espécies da substância água no modelo (vapor d'água, água de nuvem, água de chuva, cristal de gelo, neve e granizo). Além destas, o modelo resolve também uma equação para p', sendo que os valores de ρ são posteriormente diagnosticados por meio da aplicação da equação de estado (Equação 26). Na Eq, 26, ε = Rd / Rv ≈ 0.622, onde Rd e Rv são, respectivamente, as constantes dos gases para o ar seco e vapor d'água e T, a temperatura do ar.

O termo de advecção é importante, pois influencia diretamente a evolução temporal das variáveis prognosticadas pelo modelo em cada ponto de grade. Tomando-se como exemplo a equação prognóstica da variável escalar θ' (Equação 27), vê-se que a mesma é composta pelo termo de advecção da perturbação (1º. termo do lado direito da equação), mais o termo de advecção vertical do seu estado básico (2º. termo do lado direito da equação), acrescida dos termos devidos à mistura turbulenta (Dθ) e fontes ou sorvedouros da variável (Sθ).

Equações prognósticas semelhantes à Equação 27 são atribuídas às outras variáveis prognósticas escalares (qψ e p'). Para as variáveis associadas a momento, tem-se:

para o componente zonal do vento;

para o componente meridional do vento;

para o componente vertical do vento.

Nas Equações. 28 a 30, os primeiros termos do lado direito das equações referem-se à advecção da variável prognosticada. Os termos que envolvem p' referem-se à força do gradiente horizontal ou vertical de pressão. Há também termos associados à força de Coriolis, que são função de f, o parâmetro de Coriolis (com fx = 2Ω sen φ e fz = 2Ω cos φ, sendo Ω a velocidade angular da Terra e φ a latitude do ponto considerado). Os termos de dissipação turbulenta e molecular de momento estão representados pela letra D, com subscrito indicando a variável a que se refere o termo. Na Equação 30, B é o termo de flutuação das parcelas de ar, mostrado na Equação 31, onde as variáveis são as mesmas já apresentadas. A variável cS, dada pela Equação 32, é a velocidade das ondas de som, dependentes da temperatura do ar T e γ, dada pela Equação 33, a razão entre o calor específico do ar à pressão constante (cp) e a volume constante (cv).

As equações contínuas para o prognóstico de momento (Equações 28 a 30) são discretizadas no ARPS com o uso de técnicas de diferenças finitas centradas. O ARPS emprega a técnica de integração "time splitting" proposto por Klemp e Wilhelmson (1978). Segundo esta técnica, os termos das equações diferenciais discretas, que geram ondas de gravidade e de som (estas últimas são devidas ao fato de que as equações descrevem uma atmosfera compressível) em suas soluções, são integrados em passos de tempo que são submúltiplos ("small time step" em Inglês) do passo de tempo empregado na integração dos termos numericamente estáveis. Os termos de advecção não geram ondas de som ou de gravidade de alta frequência e, por este motivo, podem ser integrados no passo de tempo maior ("big time step" em Inglês).

O esquema numérico empregado na integração dos termos de advecção é o explícito centrado no espaço. O truncamento de menor ordem num esquema numérico centrado é o de grau 2, o qual apresenta erro de truncamento proporcional ao quadrado do passo utilizado. No esquema centrado no espaço, o valor de uma variável qualquer Φ no instante t num ponto de grade é obtido a partir das informações de pontos de grade vizinhos no mesmo instante t. Para simplificar a notação, define-se inicialmente a diferença no espaço (δ) de uma variável dependente Φ= Φ(x, y, z) para uma dada coordenada s (s = x, y ou z em coordenadas cartesianas) como:

onde n é um número inteiro conveniente associado ao grau do esquema numérico.

As variáveis do modelo ARPS são distribuídas segundo o definido para uma grade C de Arakawa (Xue et al., 1995). Neste tipo de grade, as variáveis de momento e de estado não são todas definidas num mesmo ponto, mas em pontos alternados da grade tridimensional ou a meio caminho entre dois pontos de grade. Mostra-se que este procedimento garante a conservação de energia no interior da grade numérica (Xue et al., 1995), um princípio básico fundamental em modelagem numérica. Ao se efetuarem cálculos com as variáveis prognósticas, são primeiramente obtidas médias espaciais destas variáveis sobre os eixos coordenados. Nas notações a seguir, serão omitidas as indicações de médias espaciais, sem perdas de generalidades. Pode-se discretizar o termo de advecção num esquema numérico de segunda ordem para uma variável qualquer Φ como na Equação 35:

Por sua vez, os termos de advecção de 4ª. ordem no ARPS são escritos como a média ponderada de dois termos:

Ambas as formulações (Equações 35 e 36) são quadraticamente conservativas (Xue et al., 1995). Para fluxos não constantes, pode-se mostrar que o erro de truncamento no esquema de 4ª. ordem é proporcional ao gradiente do campo de velocidade (Xue et al., 1995). O esquema numérico de 4ª. ordem é, em teoria, mais preciso que o de 2ª. ordem em relação ao erro de truncamento (Haltiner e Willians, 1980). Haltiner e Willians (1980) discutem os erros de truncamento envolvidos em esquemas numéricos comumente utilizados em modelagem numérica da atmosfera e mostram que o esquema advectivo de 2ª. ordem tem erro de truncamento da ordem de O[(Δs)2], enquanto que o esquema centrado de 4ª. ordem apresenta erro de truncamento da ordem de O[(Δs)4]. No entanto, o menor erro de truncamento, no esquema centrado de 4ª ordem, vem associado ao aumento do tempo computacional necessário para efetuar um mesmo período de integração numérica, em relação ao esquema de 2ª. ordem.

3. RESULTADOS

Embora sejam diversos os locais de acumulação de águas pluviais à superfície na RMSP, a Zona Leste da cidade de São Paulo é especialmente afetada pelos eventos convectivos localizados de longa duração. Pereira Filho et al. (2008) destacam a atuação de ilha de calor urbana naquela área como fator pré-condicionante favorável aos eventos de forte intensidade, como parece ter sido o caso de 04 de fevereiro de 2004, apresentado a seguir.

3.1 Caracterização do caso de 04 de fevereiro de 2004

O evento de 04 de fevereiro de 2004 (de agora em diante referido como 04FEV2004) foi considerado bastante severo e está documentado em Barros et al. (2004). A área mais afetada pelas chuvas na RMSP naquele dia foi a Zona Leste da Cidade de São Paulo. Hallak (2007) verificou subjetivamente a existência de erros consideráveis de fase e amplitude nos campos de precipitação acumulada à superfície, simulados pelo modelo ARPS, quando comparados aos campos de precipitação estimados pelo RADSP, devido à alta complexidade das interações físicas que ocorreram durante a formação dos sistemas convectivos naquele evento. Basicamente, múltiplas interações entre diferentes escoamentos nos níveis mais baixos da atmosfera, como frentes de rajadas, brisa marítima e escoamento vale-montanha, influenciaram sobremaneira a posição das células convectivas naquele dia.

A Figura 3 mostra a seqüência de imagens do satélite GOES-12 no canal infravermelho para o dia 04FEV2004. Às 1445 UTC (Figura 3a), observa-se presença generalizada de nebulosidade baixa sobre o continente. Na região costeira do Estado de São Paulo, o aquecimento superficial já havia diluído a nebulosidade matutina naquela área por intermédio de movimentos térmicos turbulentos. Às 1745 UTC (Figura 3b), alguns sistemas convectivos em desenvolvimento destacavam-se em São Paulo, enquanto uma frente fria é observada no Rio Grande do Sul, a qual avançou para Santa Catarina nas horas seguintes, com perda de intensidade.



O sistema convectivo que atingiu a Zona Leste da Capital é identificado em sua máxima atividade na imagem das 2045 UTC (Figura 3c). Este sistema foi responsável pelo evento de enchente discutido em Barros et al. (2004). Na mesma figura, identificam-se formações convectivas que se alinharam à costa do Estado de São Paulo, aparentemente associadas à atuação da frente de brisa marítima no período da tarde e início da noite daquele dia. No entanto, o alinhamento da convecção paralelo à costa não foi predominante por todo o período e se desconfigurou nas horas seguintes, conforme se observa às 2345 UTC (Figura 3d). A sequência temporal das estimativas RADSP, para a tarde de 04FEV2004 (Figura 4), mostra que as primeiras células de precipitação surgiram pelo aquecimento superficial em associação ao levantamento forçado de parcelas de ar pela topografia (observem-se as Figuras 4a e 4b em comparação à Figura 1b). O movimento de propagação da frente de brisa marítima em direção ao interior do continente tem contribuição no desenvolvimento de sistemas de precipitação na Zona Leste da Capital a partir das 1930 UTC (Figura 4c), os quais se intensificam nos minutos seguintes (Figura 4d). O estacionamento do sistema convectivo na área da Zona Leste da Capital por quase 2 horas, como observado nas estimativas RADSP (Figuras 4c a 4f), pode ter sido motivado pelos efeitos da presença da ilha de calor urbana sobre a Zona Leste, fator que também intensificaria o sistema convectivo. Na sequência de campos da Figura 4 observa-se que há alinhamento dos sistemas precipitantes na direção noroeste/sudeste do domínio a partir das 2000 UTC (Figura 4d), em concordância ao escoamento local predominante na baixa e média troposfera (campos não mostrados).








3.2. Erros e índices de destreza nas simulações de 1 km de espaçamento

Para os testes de sensibilidade na grade de 1 km, as simulações controle de menor resolução espacial (grades de 27, 9 e 3 km) foram mantidas constantes, aproveitando-se da vantagem proporcionada pelo aninhamento unidirecional de grades no ARPS. Este procedimento permite a execução de testes de sensibilidade, iniciando-se o modelo diretamente na grade desejada com o mesmo conjunto de condições iniciais e de fronteira, sem que se alterem os resultados das grades exteriores. Posteriormente, testes de sensibilidade poderiam ser efetuados com alterações específicas nas grades de menor resolução espacial avaliando-se o impacto consequente destas alterações sobre os resultados explícitos de convecção na grade de 1 km de espaçamento.

Desde que os testes de sensibilidade do modelo, quanto à precipitação acumulada à superfície, podem ser executados em variados períodos de acumulação, aqui serão mostradas apenas as avaliações correspondentes aos campos de precipitação acumulada entre 1700 UTC e 2100 UTC de 04FEV2004, que engloba o período de maior atividade convectiva naquele dia na RMSP (Figura 4). A Figura 5a mostra o campo de precipitação acumulada obtido pelas estimativas RADSP, regradeada para 1 km pelo método de interpolação bilinear a partir do campo original de 2 km para fins de comparação com as simulações. A Figura 5a mostra também os subdomínios SD 1, SD 2 e SD 3 sobre os quais foram computados os índices e erros para comparação objetiva com os experimentos numéricos de 1 km de espaçamento descritos na Tabela 3, sendo que SD 1 corresponde ao domínio total da grade numérica de 1 km.








A simulação controle (CTL) para a grade de 1 km de espaçamento horizontal foi configurada com 179 x 179 pontos em latitude e longitude e 72 níveis na vertical, com topo a aproximadamente 29 km acima da superfície e com camada de absorção de ondas de alta frequência nos níveis superiores a 20 km de altitude (Tabela 1). O experimento CTL foi também configurado com esquema de advecção de 4ª ordem para variáveis de momento e de 2ª ordem, para as escalares. Em adição, CTL foi definida com 15 pontos nas fronteiras laterais e formulação completa da física atmosférica [como radiação de ondas longas e curtas formulada pelo Goddard Space Flight Center, inclusão da força de Coriolis, microfísica de nuvens de Lin et al. (1983), modelo de solo de 2 camadas, parametrização de camada limite planetária com fechamento de turbulência de ordem 1.5 e características fisiográficas de 1 km de espaçamento horizontal]. Observe-se que não houve assimilação de dados adicionais por meio do pacote de análise objetiva ADAS na simulação CTL (Tabela 3).

A partir do experimento CTL, foi testada a sensibilidade do modelo a outras configurações, mantendo-se as características básicas mostradas na Tabela 1. A Tabela 3 mostra o código dos experimentos e as alterações de configuração efetuadas que os diferem do experimento CTL. Assim, o EXP1 é o mesmo que o CTL, exceto para a assimilação incremental de dados de estações de superfície (Figura 1b) durante a execução do modelo, com maior peso central às 1800 UTC (Bloom et al., 1996), codificado como ADAS 18 UTC na Tabela 3. O EXP2 é o mesmo que o EXP1, acrescentando a assimilação de dados da sondagem de Campo de Marte às 1200 UTC na condição inicial, codificado como ADAS 12 UTC na Tabela 3. O EXP3 é o mesmo que CTL, exceto pelo uso isolado de ADAS 12 UTC na condição inicial. Finalmente, o EXP4 é o mesmo que EXP2, exceto pela configuração dos esquemas de advecção de momento e de escalares, ambos de 2ª ordem no EXP4. No esquema ADAS 18 UTC, a assimilação incremental de dados de estações de superfície se faz durante a execução do modelo, o que garante o constante ajuste das variáveis do modelo aos valores observados, com mínima geração de ondas espúrias de alta frequência (Bloom et al., 1996). A janela de assimilação foi definida com 2 horas de integração incremental centrada no horário das 1800 UTC, com intervalos de incremento a cada 2 passos de tempo de integração.

As Figuras 5b a 5f mostram que todos os experimentos, incluindo o experimento controle (CTL), apresentam maior dispersão dos sistemas precipitantes no domínio numérico em relação ao observado (Figura 5a) e com menores quantidades acumuladas. Ainda, centros observados de altíssima acumulação, como na Zona Leste da Cidade de São Paulo, não foram adequadamente capturados nas simulações.

A Tabela 4 mostra os índices de acurácia e erros calculados para a totalidade da grade simulada (SD 1) e subdomínios SD 2 e SD 3 da Figura 5a. Os valores mostrados na Tabela 4 correspondem à diferença entre os volumes totais estimados e simulados (ΔV), viés, MAE, σSo, RMSETOT, raízes quadradas de MSEDISS e MSEDISP, coeficiente de correlação espacial ρ, índice de concordância IC e índice de destreza DPIELKE. Os resultados da Tabela 4 geram um grande número de análises, das quais serão aqui reportadas aquelas consideradas mais relevantes para este trabalho.

O maior índice de concordância e menor índice de destreza observados na Tabela 4 referem-se ao EXP1 (apenas acréscimo de ADAS 18 UTC em relação ao CTL), para os subdomínios SD 2 e 3. Em SD 1, o EXP1 obteve o maior IC, mas não o menor DPIELKE, pois a acurácia de EXP1 foi penalizada pelo excessivo RMSETOT. Por outro lado, todos os experimentos obtiveram coeficiente de correlação espacial maior que zero, embora muitos deles bastante pequenos. Como consequência, o componente dispersivo dos erros é quase sempre maior do que o dissipativo, indicando que os maiores problemas na simulação de precipitação no caso de 04FEV2004 estão associados à fase dos sistemas. De fato, alguns experimentos chegam a mostrar erros de fase 3 vezes superiores aos associados à amplitude. A Tabela 4 mostra também, que os erros associados à amplitude dos sistemas crescem quando se considera o subdomínio SD 3, onde se analisa a área em que os sistemas convectivos mais intensos foram observados por meio do RADSP.

Em termos de volume total de precipitação para toda a grade (SD 1), o EXP2, que assimilou a sondagem das 1200 UTC e também os dados de superfície das 1800 UTC, obteve um valor bastante próximo ao estimado pelo RADSP, o que pode ser considerado um resultado útil em termos de manejo hidrológico de bacias. O acréscimo da sondagem das 1200 UTC na inicialização do EXP1 (dando origem ao EXP2) contribuiu moderadamente para a melhora do desempenho do modelo para o caso de 04FEV2004 no maior subdomínio (SD 1), com tendência (viés) próxima de zero. Ao mesmo tempo, o EXP2 tem o menor IC entre os 5 experimentos, penalizado pelo baixo coeficiente de correlação espacial. Contudo, DPIELKE parece ter capturado a maior acurácia geral de EXP2 em relação ao experimento EXP1.

Note-se que os subdomínios SD 2 e SD 3 desconsideram os pontos da grade que estão sobre o Oceano Atlântico, onde não se observou nem se simulou precipitação (Figura 5). Com isso, houve tendência do RMSETOT crescer nestes subdomínios em relação ao SD 1. É interessante notar que o EXP3, o qual difere de CTL apenas pela assimilação ADAS 12 UTC na condição inicial, obteve maiores valores de IC em SD 2 e SD 3, quando comparados ao IC obtido em SD 1. Isto ocorre apesar de EXP3 ter obtido os maiores valores nos erros (compare a coluna EXP3 nos subdomínios SD 2 e SD 3). Neste caso específico, DPIELKE parece identificar com maior eficiência o desempenho inferior de EXP3 nas áreas analisadas.

No subdomínio SD 3, o EXP1 atingiu o máximo IC (IC = 0.717) e o índice de destreza muito próximo de 2.0 demonstra a qualidade dos resultados, apesar da razão relativamente baixa entre os desvios padrão simulado e observado (0.68). De acordo com a matriz de correlações, o coeficiente de correlação espacial de 0.572 atinge o máximo de 0.610 a apenas 2 km ao norte do simulado para este experimento. Para o EXP2, por exemplo, que obteve ρ = 0.030 em SD 3, a matriz de correlações mostra um máximo de 0.450 com um deslocamento de 7 km para norte e 9 km para oeste. Neste caso, o componente dissipativo de RMSE passaria de 15.5 mm para 15.1 mm e o dispersivo, de 23.5 mm para 18.3 mm (uma diminuição relativa de 22%). Em geral, no entanto, as falhas do modelo ainda se devem à maior contribuição do erro associado ao termo dispersivo de MSE.

3.3. Comparação quanto ao esquema de advecção de momento

Os experimentos EXP2 e EXP4 são diretamente comparáveis, pois diferem somente quanto à especificação da ordem do esquema de advecção de momento (Tabela 3). A inspeção dos resultados da Tabela 4 indica que, com um esquema mais apurado para a advecção de momento, o EXP2 apresenta menores erros quadráticos médios nos três subdomínios, bem como menores erros absolutos. Os maiores efeitos do uso de um esquema de diferenças finitas de maior precisão quanto às variáveis de momento aparecem no componente dispersivo de MSE, nos 3 subdomínios. No entanto, o erro sistemático foi maior no esquema de 4ª. ordem em todos os subdomínios. Quanto aos índices de destreza, o melhor ajuste das fases dos sistemas precipitantes no EXP2 é refletido no menor índice DPIELKE para este experimento. Novamente o índice DPIELKE parece capturar com maior propriedade um aumento na acurácia da simulação EXP2 em relação ao EXP4 do que o índice de concordância IC.

4. CONCLUSÕES

As soluções do modelo ARPS para o caso de 04FEV2004 tenderam ao desenvolvimento de precipitação acumulada em 4 horas com maior distribuição espacial do que o observado, obtendo-se indicações de que os sistemas convectivos desenvolvidos na grade de 1 km de espaçamento possuíam maior velocidade de deslocamento do que o observado. As análises dos erros e índices de acurácia indicaram significativa contribuição do termo de advecção das equações primitivas, no controle da distribuição espacial dos fenômenos observados nos baixos níveis da atmosfera.

A assimilação incremental dos dados observados de superfície às 1800 UTC (EXP1), efetuada durante a execução do modelo, mesmo obtida com dados de estações com má distribuição espacial (Figura 1b), atua na correção de boa parte da fase dos sistemas precipitantes. Os melhores resultados para destreza dentre os experimentos propostos foram obtidos no subdomínio SD 3 do EXP1, que atingiu o máximo IC (IC = 0.717) e o índice de destreza DPIELKE muito próximo de 2.0, enquanto o coeficiente de correlação espacial foi de 0.610 a apenas 2 km a norte do simulado. Este resultado leva à questão da necessidade de se instalar uma rede de estações meteorológicas de superfície de mesoescala que cubra de forma adequada a RMSP e suas vizinhanças, e cujas medidas estejam disponíveis em tempo real para uma melhor iniciação dos modelos numéricos regionais.

Os resultados preliminares parecem também indicar que quanto menor a escala espacial dos fenômenos analisados, maior a restrição ao tamanho das áreas sobre as quais são calculados os erros espaciais. Por outro lado, é recomendável que os subdomínios de análise de erros espaciais estejam apropriadamente distantes das fronteiras do domínio numérico, que é uma região afetada pelas inconsistências inerentes às grades de diferentes resoluções espaciais. Estes resultados sugerem que testes de sensibilidade por intermédio de cálculos de índices de acurácia e erros sejam efetuados em vários subdomínios de áreas equivalentes, e que cubram, por exemplo, a maior parte da grade simulada, como apresentado na Figura 6, onde os subdomínios possuem 25 km2 cada. Assim, a sensibilidade de cada porção do domínio numérico poderia ser determinada em função de variações em diversos parâmetros físicos do modelo.


De uma forma geral, os resultados iniciais da pesquisa indicam que a metodologia proposta é promissora para os objetivos estabelecidos. Note-se que o aumento da resolução espacial dos modelos numéricos, certamente acrescenta detalhes importantes às simulações, assim como, aumenta também o grau de complexidade dos fenômenos atmosféricos envolvidos. Quanto a esta questão, o índice de destreza proposto (DPIELKE) parece responder bem ao aumento das exigências ao se considerarem fenômenos de menor escala espacial, com a ressalva de que falta ainda uma comprovação mais rigorosa de sua utilidade.

Sugere-se a análise de um maior número de casos sobre a influência dos esquemas de advecção na distribuição horizontal das variáveis meteorológicas, para uma compreensão mais completa do problema da baixa reprodutibilidade da fase dos sistemas de precipitação, em simulações e previsões em alta resolução espacial.

Por fim, ressalta-se que a metodologia proposta pode ser usada para um número qualquer de membros de um sistema de previsão de tempo por conjuntos, bem como, na quantificação das diferenças entre um determinado experimento numérico controle e suas variações.

5. AGRADECIMENTOS

Os autores agradecem à Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) pelo apoio a esta pesquisa e aos dois revisores anônimos da Revista Brasileira de Meteorologia por suas contribuições à melhoria geral deste artigo. Os autores também agradecem à Universidade de Oklahoma pelo código do sistema ARPS. Agradece-se ainda ao Departamento de Águas e Energia Elétrica (DAEE) do Estado de São Paulo, à Companhia Ambiental do Estado de São Paulo (CETESB) e ao Laboratório MASTER (IAG/USP) pela cessão dos arquivos de dados meteorológicos empregados neste trabalho.

6. REFERÊNCIAS BIBLIOGRÁFICAS

Recebido Janeiro de 2010

Aceito Fevereiro de 2011

  • ANTHES, R. A. Regional Models of the Atmosphere in Middle Latitudes. Monthly Weather Review, v. 111, p. 1306-1335, 1983.
  • ANTHES, R. A.; KUO, Y.-A.; HSIE, E.-Y.; LOW-NAM, S.; BETTGE, T.W. Estimation of Skill and Uncertainty in Regional Numerical Models. Quarterly Journal of the Royal Meteorological Society, v. 115, p. 763-806, 1989.
  • BARROS, M. T. L.; PEREIRA FILHO, A. J.; GANDU, A. W.; HALLAK, R.; ANDRIOLI, C. P. Impacto Hidrológico das Precipitações Observadas na Região Metropolitana de São Paulo nos Dias 04 de Fevereiro de 2004 e 29 de Janeiro de 2004. In: CONGRESSO BRASILEIRO DE METEOROLOGIA, 13, 2004, Fortaleza, CE. Anais..., 2004. CD-ROM.
  • BLOOM, S. C.; TAKACS, L. L.; DA SILVA A. M.; LEDVINA, D. Data Assimilation Using Incremental Analysis Updates. Monthly Weather Review, v. 124, p. 1256-1271, 1996.
  • DALEY, R. Atmospheric Data Analysis 1a. Edição, Canadá, Cambridge University Press, 1991. 420 p.
  • FARIAS, J. F. S. Previsão de Chuva a Curtíssimo Prazo na Abrangência do Radar Meteorológico de São Paulo 2009. 82 f. Dissertação (Mestrado em Meteorologia) -Departamento de Ciências Atmosféricas, Universidade de São Paulo, São Paulo, 2009.
  • FOX, D. G. Judging Air Quality Model Performance. Bulletin of the American Meteorological Society, v. 62, p. 599-609, 1981.
  • HALLAK, R. Simulações Numéricas de Tempestades Severas na RMSP 2007. 219 f. Tese (Doutorado em Ciências) - Departamento de Ciências Atmosféricas, Universidade de São Paulo, São Paulo, 2007.
  • HALTINER, G. J.; WILLIANS, R. T. Numerical Prediction and Dynamic Meteorology 2a Edição, Estados Unidos da América, John Wiley & Sons, Inc., 1980. 477 p.
  • KAIN, J. S.; FRITSCH, J. M. Convective Parameterization for Mesoscale Models: The Kain-Fritsch Scheme. The Representation of Cumulus Convection in Numerical Models. In: AMS Monograph Series, American Metrological Society, p. 165-170, 1993.
  • KLEMP, J. B.; WILHELMSON, R. B. The Simulation of Three-Dimensional Convective Storm Dynamics. Journal of the Atmospheric Sciences, v. 35, p. 1070-1096, 1978.
  • LIN, N.-T; FARLEY, R. D.; ORVILLE, H. D. Bulk Parameterization of the Snow Field in a Cloud Model. Journal of Climate and Applied Meteorology, v. 22, p. 1065-1092, 1983.
  • MARSHALL, J. S.; PALMER, W. M. K. The Distribution of Raindrops with Size. Journal of Meteorology, v. 5, p. 165-166, 1948.
  • MARTIN, W. J.; XUE, M. Sensitivity Analysis of Convection of the 24 May 2002 IHOP Case Using Very Large Ensembles. Monthly Weather Review, v. 134, p. 192-207, 2006.
  • ORLANSKI, I. A Rational Subdivision of Scales for Atmospheric Processes. Bulletin of the American Meteorological Society, v. 56, p. 527-530, 1975.
  • PEREIRA FILHO; A. J., BARROS, M. T. L. Flood Warning System for Megacities: A Brazilian Perspective. In: INTERNATIONAL CONFERENCE ON HIDROLOGY IN A CHANGING ENVIRONMENT, British Hidrological Society, Exeter, 1998.
  • PEREIRA FILHO, A. J.; NAKAYAMA, P. T. Intercomparison of Radar Rainfall Estimates and Rain Gage Measurements in Sao Paulo, Brazil. In: FIFTH INTERNATIONAL SYMPOSIUM ON HYDROLOGICAL APPLICATIONS OF WEATHER RADAR. Kyoto, Japan, 2001.
  • PEREIRA FILHO, A. J.; MASSAMBANI, O.; KARAM, H. A.; HALLAK, R.; HAAS, R.; VEMADO, F. Sistema de Previsão Hidrometeorológica para a Bacia do Alto Tietê. Boletim da Sociedade Brasileira de Meteorologia, v. 32, p. 42-60, 2008.
  • PIELKE SR., R. A. Mesoscale Meteorological Modeling International Geophysics Series. 2ª. Edição, Estados Unidos da América, Academic Press, v. 78, 2002. 676 p.
  • SILVA, F. D. S.; PEREIRA FILHO, A. J.; HALLAK, R. Classificação de Sistemas Meteorológicos e Comparação da Precipitação Estimada Pelo Radar e Medida Pela Rede Telemétrica na Bacia Hidrográfica do Alto Tietê. Revista Brasileira de Meteorologia, v. 24, p. 292-307, 2009.
  • TAKACS, L. A Two-Step Scheme for the Advection Equation with Minimized Dissipation and Dispersion Errors. Monthly Weather Review, v. 113, p. 1050-1065, 1985.
  • WILKS, D. S. Statistical Methods in the Atmospheric Sciences International Geophysics Series. 2a. Edição, Estados Unidos da América, Academic Press, v. 91, 2006. 627 p.
  • WILLMOT, C. J. Some Comments on the Evaluation of Model Performance. Bulletin of the American Meteorological Society, v. 63, p. 1309-1313, 1982.
  • XUE, M.; DROEGEMEIER, K. K.; WONG, W.; SHAPIRO, A.; BREWSTER, K. Advanced Regional Prediction System Users Guide 1a. Edição, Estados Unidos da América, Universidade de Oklahoma,1995. 380 p.
  • XUE, M.; DROEGEMEIER; K. K., WONG, V. The Advanced Regional Prediction System (ARPS) - A Multi-Scale Nonhydrostatic Atmospheric Simulation and Prediction Model. Part I: Model dynamics and verification. Meteorological Atmospheric Physics, v. 75, p. 161-193, 2000.
  • XUE, M.; DROEGEMEIER, K. K.; WONG, V.; SHAPIRO, A.; BREWSTER, K.; CARR, F.; WEBER, D.; LIU, Y.; WANG, D.-H. The Advanced Regional Prediction System (ARPS) - A Multi-Scale Nonhydrostatic Atmospheric Simulation and Prediction Model. Part II: Model Physics and Applications. Meteorological Atmospheric Physics, v. 76, p. 143-165, 2001.
  • XUE, M.; WANG, D.-H.; GAO, J.; BREWSTER, K.; DROEGEMEIER, K. K. The Advanced Regional Prediction System (ARPS), Storm-Scale Numerical Weather Prediction and Data Assimilation. Meteorological Atmospheric Physics, v. 82, p.139-170, 2003.

Datas de Publicação

  • Publicação nesta coleção
    10 Fev 2012
  • Data do Fascículo
    Dez 2011

Histórico

  • Recebido
    Jan 2010
  • Aceito
    Fev 2011
Sociedade Brasileira de Meteorologia Rua. Do México - Centro - Rio de Janeiro - RJ - Brasil, +55(83)981340757 - São Paulo - SP - Brazil
E-mail: sbmet@sbmet.org.br