SciELO - Scientific Electronic Library Online

 
vol.23 issue2Avaliação dos programas de pós-graduação em engenharia da UFRJ empregando uma variante desenvolvida do método UTAAnálise de envoltória de dados no estudo da eficiência e dos benchmarks para companhias aéreas brasileiras author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

Share


Pesquisa Operacional

Print version ISSN 0101-7438On-line version ISSN 1678-5142

Pesqui. Oper. vol.23 no.2 Rio de Janeiro Aug. 2003

http://dx.doi.org/10.1590/S0101-74382003000200004 

Sobre a precisão das estimativas de máxima verossimilhança nas distribuições bivariadas de valores extremos

 

 

Alba Regina MorettiI; Beatriz Vaz de Melo MendesII, *

ICOPPE/UFRJ, Universidade Federal do Rio de Janeiro, Rio de Janeiro – RJ, albamoretti@uol.com.br
IIDepartamento de Métodos Estatísticos – IM/UFRJ, Universidade Federal do Rio de Janeiro, Rio de Janeiro – RJ, beatriz@im.ufrj.br, bmendes@visualnet.com.br

 

 


RESUMO

As distribuições bivariadas de valores extremos surgem como distribuições limites de máximos normalizados. O objetivo na modelagem do comportamento assintótico probabilístico dos extremos é obter boas aproximações para a distribuição bivariada de extremos permitindo o estudo da ocorrência de eventos extremos simultâneos. Quando trabalhamos com amostras pequenas, surgem algumas questões relacionadas à precisão e qualidade das estimativas de máxima verossimilhança dos parâmetros e de outras quantidades derivadas dos modelos bivariados de valores extremos. Neste artigo utilizamos esquemas de reamostragem bootstrap e simulações Monte Carlo para acessar a variabilidade e construir intervalos de confiança para essas estimativas, visando estabelecer o quão confiáveis são as conclusões retiradas das análises feitas com esses modelos. Valores críticos para os testes propostos por Tawn (1988) são também obtidos através de simulações.

Palavras-chave: distribuição bivariada de valores extremos; estimadores de máxima verossimilhança; bootstrap; simulações Monte Carlo.


ABSTRACT

The non-degenerated limit distributions of normalized maxima are the so called bivariate extreme value distributions. When modeling the asymptotic probabilistic behavior of extremes the objective is to obtain good approximations for the bivariate extremes distributions allowing the investigation of simultaneous extreme events. Typically the sample sizes are small, and this raises questions related to the quality and accuracy of the maximum likelihood estimates of the parameters and other quantities derived from the models. In this article we use bootstrap resampling schemes and Monte Carlo simulations to assess the variability and to construct confidence intervals for these estimates, in order to establish how reliable are the conclusions drawn from the analyzes based on these models. Critical values for the tests proposed in Tawn (1988) are obtained through simulations.

Keywords: bivariate extreme value distribution; maximum likelihood estimation; bootstrap; Monte Carlo simulations.


 

 

1. Introdução

As distribuições bivariadas de valores extremos surgem como distribuições limites de máximos (ou mínimos) normalizados. O objetivo na modelagem do comportamento assintótico probabilístico dos extremos é obter boas aproximações para a distribuição bivariada de extremos permitindo o estudo da ocorrência de eventos extremos simultâneos. Os modelos bivariados são muito úteis em aplicações práticas da teoria de valores extremos em diversas áreas, como, por exemplo, na análise da interação entre a velocidade do vento e altura de ondas, na análise do relacionamento entre a grandeza da temperatura e níveis de colheita e, em particular na área financeira, no estudo do comportamento conjunto de ativos compondo uma carteira, ou no estudo da dependência entre mercados de ações. A aplicação da teoria de valores extremos em finanças pode ser vista em Starica (1999), Embrechts (2000), entre vários outros.

Estudada desde os anos 20, a teoria de valores extremos possui resultados importantes no caso univariado, como os obtidos por Fisher & Tippet (1928). Contudo, somente a partir dos anos 50 e 60 é que ocorreram avanços no caso bivariado através dos trabalhos de Gumbel (1954, 1958), Tiago de Oliveira (1958, 1962) e Sibuya (1960). Em Tawn (1988) vemos o desenvolvimento de modelos bivariados de valores extremos, como os modelos logístico e misto assimétricos. Recentemente, a modelagem de extremos multivariados tem recebido mais atenção, veja, por exemplo, Embrechts, de Haan & Huang (2000).

De acordo com a literatura em valores extremos bivariados, a modelagem da estrutura de dependência entre os extremos pode ser feita via modelos paramétricos ou não-paramétricos. Os modelos paramétricos são de dois tipos: diferenciáveis e não-diferenciáveis. Os modelos paramétricos diferenciáveis são classificados em duas famílias: logística e mista, que por sua vez contêm modelos simétricos e assimétricos. A estimação dos parâmetros é em geral feita pelo método da máxima verossimilhança. Resultados sobre o comportamento assintótico dos estimadores de máxima verossimilhança, em particular nas fronteiras do espaço paramétrico relacionada com a independência, podem ser vistas em Smith (1985) e Tawn (1988), entre outros.

Como estamos trabalhando com a teoria assintótica, algumas questões surgem naturalmente. Será que o tamanho das amostras é suficientemente grande para garantir uma boa qualidade dos ajustes? Ou, ao considerarmos medidas de dependência, qual a variabilidade de suas estimativas? Como essa variabilidade mudaria as conclusões feitas?

Para responder as questões acima e obter a variabilidade empírica das estimativas pode-se usar esquemas de bootstrap e simulações Monte Carlo. O método bootstrap, proposto por Efron (1979), baseia-se em reamostragens a partir da amostra original. Essa técnica é especialmente útil para lidar com problemas estatísticos envolvendo amostras de tamanho pequeno e aqueles envolvendo estimadores cuja distribuição (exata ou assintótica) ainda não foi obtida.

O nosso objetivo é acessar a qualidade e precisão das estimativas de máxima verossimilhança dos parâmetros e de outras quantidades derivadas dos modelos bivariados de valores extremos, dessa forma ajudando a estabelecer o quão confiáveis são as estimativas e as conclusões retiradas das análises feitas com esses modelos. É também de interesse investigar se existe ou não deteriorização dessas estimativas, no sentido de um aumento na variabilidade, se diminuirmos progressivamente o tamanho da amostra (de acordo com um certo critério, explicado na Seção 6). Em outras palavras, investigamos como se manifesta nas estimativas, o trade-off que existe ao se melhorar a qualidade da aproximação da distribuição exata de extremos bivariados pela sua distribuição assintótica, mas perdendo na qualidade das estimativas de máxima verossimilhança.

Na Seção 2 apresentamos os modelos paramétricos bivariados e suas propriedades. Na Seção 3 discutimos o procedimento de estimação simultânea dos parâmetros marginais e de dependência. Na Seção 4 revisamos o método bootstrap e apresentamos os algoritmos utilizados nas aplicações. Na Seção 5 avaliamos a qualidade das estimativas de máxima verossimilhança considerando os extremos mensais. Calculamos intervalos de confiança bootstrap paramétricos e não-paramétricos e os utilizamos na avaliação das estimativas de máxima verossimilhança. Na Seção 6, repetimos todos os procedimentos da Seção 5, agora com amostras menores. Também avaliamos através de simulações Monte Carlo com esquemas de bootstrap a performance dos intervalos de confiança obtidos nas seções 5 e 6. Finalmente, na última seção, apresentamos nossas conclusões.

 

2. Modelos Bivariados

No caso univariado temos o resultado fundamental de Fisher & Tippett (1928) que fornece a distribuição limite dos máximos coletados em blocos. No caso bivariado temos um resultado similar. Para definirmos os máximos bivariados, sejam (Xi,Yi), i=1, 2, ..., variáveis aleatórias (v.a.) independentes e identicamente distribuídas (i.i.d.) em Â2 com função de distribuição (f.d.) bivariada F(·,·). Seja (M1n, M2n) o par de máximos coletados em blocos de tamanho fixo n em cada componente, isto é, M1n = max {Xi,i=1,...,n} e M2n = max {Yi,i=1,...,n}. Assim como o resultado no caso univariado, se existirem seqüências de constantes normalizadoras ain > 0, bin Î Â, i =1,2 , tais que a f.d. conjunta

convirja em distribuição para uma f.d. não degenerada W(x,y) quando n ® ¥, então W(·,·) é uma distribuição bivariada de valores extremos. Neste caso cada marginal segue uma distribuição de valores extremos generalizada com as mesmas constantes normalizadoras.

Diferentemente do caso univariado, no caso multivariado não existe uma família de distribuições paramétricas de dimensão finita para modelar a dependência entre os máximos. Supondo a existência de uma função de dependência, e baseados em restrições nesta função, vários modelos paramétricos (diferenciáveis e não diferenciáveis) foram propostos na literatura. Modelos para o caso mais simples de máximos bivariados são conhecidos desde Tiago de Oliveira (1958) e Sibuya (1960). Pickands (1981) estabeleceu a relação de estabilidade para v.a. exponenciais e propôs modelos para a função de dependência. Mais recentemente, modelos para extremos multivariados e aplicações foram investigados, por exemplo, em Coles & Tawn (1991), de Haan & Resnick (1993), e Ledford & Tawn (1997), entre outros.

Os modelos investigados aqui assumem que as distribuições marginais sejam exponenciais unitárias. Antes de introduzir os modelos daremos as notações necessárias: Para qualquer f.d. F em Â, seja (x) = 1 – F(x) a sua função de sobrevivência. Por simplicidade, denotaremos os máximos coletados em cada componente e em blocos de tamanho fixo n por M1 e M2 e usaremos a mesma notação para os mínimos. Todos os procedimentos de modelagem e estimação desenvolvidos para os máximos podem ser aplicados aos valores absolutos dos mínimos. Então, para i=1,2, Mi segue uma distribuição de valores extremos generalizada, denotada por , ou Hi, com f.d. conjunta W(·,·), e densidade conjunta w(·,·).

Seja Ui = Ti(Mi) = , i = 1,2 , o máximo transformado em v.a. exponencial unitária, com f.d. Gi, i = 1,2 , f.d. conjunta G(·,·), e densidade conjunta g(·,·). Então (ui) = exp {–ui}, ui >0, e de acordo com a relação de max-estabilidade para n > 1, ((u1,u2))n = (nu1,nu2), onde G(u1,u2) = Pr{U1>u1,U2>u2}. A densidade conjunta dos máximos originais (M1, M2) é w(m1,m2) = g(u1,u2)|J|, onde ui = Ti(mi), i = 1,2,J é o Jacobiano da transformação, mi Î Â, si > 0, 0 < xi < 1, e . Notemos que as restrições em xi são necessárias porque as transformações Ti valem apenas para xi > 0, e os procedimentos de estimação são válidos apenas para xi < 1 (Smith, 1985).

Pickands (1981) mostrou que a função de sobrevivência conjunta (·,·) pode ser escrita na forma

onde a função convexa A(·) deve satisfazer certas condições (veja Pickands (1981) e Tawn (1988)). A(·) é a função de dependência das v.a. positivamente associadas U1 e U2. Para v.a. absolutamente contínuas, a função A(·) possui, entre outras, as propriedades A(0) = A(1) = 1 e max (v, 1–v) < A(v) < 1, para 0 < v < 1. Os dois máximos U1 e U2 são permutáveis se e somente se A(·) é simétrica em torno de 1/2.

A correlação linear (positiva) entre U1 e U2 é dada por . Uma medida de dependência alternativa é 2[1 – A(1/2)], a qual denotaremos por t. A medida t assume valores entre zero (independência) e um (dependência completa). Ela é uma medida da dependência existente nos altos quantis (quantis associados com probabilidades perto de um) da distribuição bivariada dos extremos. Um ponto importante é que r se refere aos máximos (mínimos) transformados U1 e U2 e esta medida pode ser ligeiramente diferente para os máximos (mínimos) originais M1 e M2, uma vez que o coeficiente de correlação linear não é invariante sob transformações não-lineares.

Dentre os modelos existentes na literatura para modelar a função A(·), destacam-se os modelos simétricos misto e logístico propostos por Gumbel (1960), e suas extensões assimétricas propostas por Tawn (1988). Eles são:

1. Modelo Misto Simétrico: A1(v)=qv2qv+1, 0<q<1. Independência corresponde a q = 0. O coeficiente de correlação é e t = . E, ainda, possui função de sobrevivência conjunta (u1,u2) dada por:

2. Modelo Logístico Simétrico: A2(v) = [(1–v)r + vr]1/r, r > 1. O valor r = 1 corresponde à independência e r = + ¥ à dependência completa. Aqui e t = 2–21/r. A função de sobrevivência conjunta é dada por

3. Modelo Misto Assimétrico: A3(v) = fv3qv2 – (q + f)v + 1; onde q > 0, q + f < 1, q + 2f < 1, q + 3f > 0. Se f = 0 teremos o modelo simétrico. Independência corresponde à q = f = 0. Aqui, . A função de sobrevivência conjunta é dada por

4. Modelo Logístico Assimétrico: A4(v) = [qr(1–v)r + frvr]1/r + (qf)v+1–q, para 0 < q, f < 1, r > 1. Este é um modelo flexível que contém outros modelos. Se q = f = 1 temos novamente o modelo simétrico. Independência corresponde à q = 0 ou f = 0 ou r = 1. Dependência completa corresponde à q = f = 1 e r = + ¥. Aqui t = q + f – (qr + fr)1/r. A função de sobrevivência conjunta é dada por

O modelo misto assimétrico é bastante simples, mas tem a grande vantagem de possuir um parâmetro f associado com a assimetria ou a permutabilidade dos dois máximos. Por outro lado, o modelo logístico assimétrico pode resultar em um ajuste melhor, mas apresenta problemas de identificabilidade, os quais podem ser contornados se fixarmos f = 1 ou q = 1.

 

3. Estimação

O método mais utilizado para a estimação dos parâmetros dos modelos bivariados é o da máxima verossimilhança. Estes estimadores são os valores > 0, e Î Â, i = 1,2, e (aqui b representa o vetor de parâmetros da função de dependência) que maximizam a função de log-verossimilhança

onde m é o tamanho da amostra bivariada.

A existência e consistência dos estimadores de máxima verossimilhança dos parâmetros marginais sob independência foram obtidas por Smith (1985). O comportamento dos estimadores de máxima verossimilhança dos modelos bivariados sob a suposição de que o parâmetro de forma em cada marginal é menor que 1/2, o que corresponde ao caso onde o estimador de máxima verossimilhança dos parâmetros marginais se comportam regularmente, foi inicialmente investigado por Tawn (1988). Este autor mostrou que existindo dependência entre as variáveis, o problema de estimação simultânea é regular. Provou a existência e obteve a distribuição assintótica da solução global de máxima verossimilhança. Além disto, mostrou que a matriz de covariância assintótica é diagonal e sugeriu o uso da matriz de informação observada para obter a variância do estimadores e para construir intervalos de confiança. Argumentou que o teste da razão das verossimilhanças e o teste baseado na estatística escore (testes para escolha de modelo e independência), obtidos quando o processo de estimação é em duas etapas (marginais primeiro e função de dependência depois), podem também ser usados no caso de estimação simultânea, uma vez que neste caso o comportamento assintótico dos testes permanecem inalterados. Além disto, Tawn (1988) obteve resultados semelhantes para o caso onde os dois parâmetros de forma marginais são menores que 1.

Os resultados de Tawn (1988) mostram que é importante testar se existe independência assintótica entre os extremos, já que o procedimento de máxima verossimilhança tem comportamento não regular na fronteira do espaço paramétrico associado à independência. Devemos ressaltar que em muitas aplicações os máximos obtidos a partir de variáveis dependentes podem ser independentes para n suficientemente grande. Para testar a independência consideramos o teste escore dado por Tawn (1988).

Dado um modelo bivariado (3), (4), (5), ou (6), a estatística escore é , onde Lm(b) = Lm(b;(u1,1,u2,1),...,(u1,m,u2,m)). A estatística escore normalizada converge em distribuição (Feller, 1971) para uma v.a. normal padrão. Ou seja, temos que

onde b0 é o valor do parâmetro que corresponde a independência, Z é uma v.a. normal padrão, e c denota a constante normalizadora para a estatística escore, sendo c = para o modelo logístico simétrico e c = para o modelo misto simétrico.

O teste localmente mais poderoso de nível a rejeita a hipótese nula de independência quando

onde F–1(·) é a inversa da normal padrão.

Por exemplo, considerando o modelo logístico simétrico, onde b0 = r0 = 1, temos que

(u1,u2) = log (u1,u2) + (u1 + u2 – 2) log (u1 + u2) – u1 log (u1) – u2 log (u2) + (u1 + u2)–1.

Para o modelo misto simétrico, onde b0 = q0 = 0, temos que

(u1,u2) = u1u2 (u1 + u2)–1 + 2u1u2 (u1 + u2)–3 – ()(u1 + u2)–2.

Uma questão importante é a seguinte: o quanto aplicável é esse resultado assintótico quando trabalhamos com amostras pequenas? Uma maneira de se medir a qualidade da substituição da distribuição exata da estatística teste pela sua aproximação assintótica é via comparação de alguns percentis. Esses percentis para amostras pequenas podem ser obtidos através de simulações. Tawn (1988) forneceu os valores críticos do teste para o modelo logístico simétrico e alguns valores de m, realizando 100.000 replicações da estatística escore normalizada (cm log m)(b0). Fornecemos aqui esses valores críticos no caso do modelo misto simétrico. Também completamos a Tabela 1 de Tawn (1988) obtendo os valores críticos do modelo logístico simétrico para outros valores de m. Os resultados são mostrados nas tabelas 1 e 2 a seguir.

 

 

 

 

Segundo Tawn (1988), ao se fazer o teste de independência com amostras pequenas, é recomendável usar os valores simulados no lugar da aproximação assintótica.

Uma vez confirmada a dependência entre as séries, podemos então realizar o teste para a escolha do melhor modelo. Para testar entre as famílias (simétricas) Mista e Logística, primeiramente ajustamos por máxima verossimilhança um modelo com função de dependência A = g A1(v) + (1–g) A2(2)(v), 0 < g < 1. A partir da estimativa de máxima verossimilhança de g, o teste proposto aceita A1 se > 1/2 ou aceita A2 se < 1/2. Iremos nos referir a este teste como teste ML. Para testar dentro da família (simétrica ou assimétrica), usaremos o teste usual do logaritmo da razão das verossimilhanças, o qual denotaremos por LR.

Quando o modelo ajustado é assimétrico pode-se calcular uma medida da não permutabilidade entre os dois máximos M1 e M2 , a qual denotaremos por R12. Para tanto, seja = (a) a probabilidade Pr{Mj < mj,a| Mi = mi,a}, i,j = 1,2, onde a é uma probabilidade pequena e mi,a é o (1 – a)-quantil da distribuição marginal do máximo Mi , quer dizer, (mi,a) = a, i = 1,2. Definimos R12 = /. Quando R12 é menor que 1 podemos interpretar como a componente M1 tendo maior peso (ou contribuição) na dependência observada. Notemos que R12 = 1 sob modelos simétricos.

Novamente enfatizamos que nosso interesse é utilizar esquemas de reamostragem bootstrap para obter indicações da qualidade das estimativas obtidas , , , i = 1,2, , , e .

 

4. Método bootstrap

O bootstrap é um método computacionalmente intensivo que pode ser utilizado para avaliar a acuracidade de estimativas estatísticas. A idéia principal (Efron, 1979) é tratar o conjunto de dados (amostra) como se fosse a população (verdadeira) e retirar amostras com reposição desse conjunto de dados, como se estivéssemos amostrando da população (para maiores detalhes veja Efron & Tibshirani, 1993). Repete-se esse procedimento um número B grande de vezes, e para cada reamostra calcula-se as quantidades de interesse. Os B valores calculados são utilizados para estimar a distribuição desconhecida dessas quantidades.

Conforme Cribari-Neto (2000), consideremos uma amostra aleatória x = (x1,...,xm) da distribuição F0(d), onde d é o parâmetro (ou vetor de parâmetros) desconhecido, o qual é visto como um funcional de F0 , ou seja, d = t (F0). Seja = s(x) = s(x1,...,xm) um estimador de d. Os estimadores considerados podem ter ou não ter forma fechada e satisfazem s(x1,...,xm) = s(), onde é a função de distribuição empírica de (x1,...,xm).

O esquema de reamostragem pode ser feito paramétrica ou não-parametricamente, dando origem a duas categorias de métodos bootstrap, os paramétricos e os não-paramétricos. No esquema paramétrico as B novas amostras são obtidas de F0(), isto é, geramos amostras a partir da distribuição ajustada aos dados. Na versão não-paramétrica reamostramos com reposição da amostra original, o que equivale a amostrar de . O algoritmo bootstrap básico é dado no Apêndice.

Em resumo, ao aplicarmos o procedimento bootstrap, paramétrico ou não-paramétrico, obtemos B amostras (,...) de (x1,...,xm), denotadas por x* b, b=1,...,B, e calculamos (b) para cada x* b, b=1,...,B. A partir desses valores podemos estimar a variabilidade de em relação ao verdadeiro valor de d, através da variabilidade dos (b) em relação (Efron, 1982). A expressão desta estimativa bootstrap do erro padrão de é também dada no algoritmo bootstrap básico no Apêndice.

Além disto, a distribuição empírica Ê dos B valores (b) pode ser usada para construir estimativas por intervalo. O intervalo de confiança do tipo percentil com cobertura 1 – 2 a, 0 < a < 1/2, para d é dado por

[Ê–1(a), Ê–1(1 – a)] = [],

onde Ê–1(a) = é o 100.a-percentil da distribuição bootstrap Ê, isto é, o B.a-ésimo valor entre os (b) valores ordenados.

De acordo com uma das sugestões de um dos revisores, iremos também calcular intervalos de confiança do tipo BCa ("bias corrected and accelerated"). O intervalo de confiança BCa com cobertura (1 – 2 a) é baseado nos percentis de probabilidade a1 e a2 da distribuição empírica Ê e pode ser visto como uma modificação do intervalo tipo percentil (veja detalhes em Cribari-Neto e outros (2002) e Efron & Tibshirani (1993)).

O intervalo de confiança BCa com cobertura (1 – 2 a) é dado por

[[Ê–1(a1), Ê–1(a2)] = [],

onde

onde

onde

onde F(·) é a função de distribuição normal padrão, za é o 100.a-percentil de uma normal padrão, onde (·) = (i), e onde (i) é a estimativa de d a partir de s(.) e baseada na amostra original sem a i-ésima observação. Notemos que quando as quantidades ("correção do vício") e â ("aceleração") não são zero elas estarão "corrigindo" os percentis usados no cálculo do intervalo tipo percentil.

Tomando como base o algoritmo apresentado no Apêndice, descrevemos a seguir o algoritmo utilizado para calcular a variabilidade das estimativas de máxima verossimilhança e intervalos de confiança bootstrap tipo percentil e tipo BCa, paramétricos e não-paramétricos.

Algoritmo 1:

1- Para b = 1,...,B,

1.1- Reamostramos da amostra original (m1,1,m2,1),...,(m1,m,m2,m) obtendo a b-ésima amostra bootstrap de tamanho m.

1.2- Estimamos simultaneamente, via máxima verossimilhança, os parâmetros marginais e os parâmetros de dependência b*^(b) onde b*^(b) é (b) no modelo logístico simétrico; ou (b) no modelo misto simétrico; ou no modelo logístico assimétrico com f =1; ou ((b),(b)) no modelo misto assimétrico.

1.3- Usando as estimativas obtidas em (1.2), calculamos (b), (b) e (b).

2- Para cada vetor de tamanho B contendo as replicações de calculamos a média aritmética, a variância amostral, o desvio padrão, a mediana, os percentis 1%, 2,5%, 5%, 95%, 97,5% e 99%, e os percentis de probabilidade a1 e a2.

Seja d o vetor de parâmetros (m1, s1, x1,m2, s2, x2, b). Em 1.1 a amostragem é feita a partir da amostra original e com reposição no caso do bootstrap não-paramétrico e é feita a partir da distribuição ajustada aos dados originais (F0()) no caso do bootstrap paramétrico.

No caso do bootstrap não-paramétrico, no passo 1.1 usamos o Algoritmo 2 dado a seguir para gerar uma amostra dos modelos bivariados. Neste algoritmo, W(m1,m2) representa a função de distribuição dos modelos logístico simétrico, logístico assimétrico, misto simétrico ou misto assimétrico, e H1 e H2 representam as distribuições marginais que são do tipo de uma distribuição de valores extremos generalizada. Dada uma observação m1 de H1, a distribuição condicional de M2 é dada por

Wc(m2|m1) = Pr{M2 < m2|M1 = m1} =

Algoritmo 2:

1- Geramos m observações da distribuição H1 (m1, s1, x1).

2- A partir da amostra obtida em (1), geramos m observações da distribuição condicional Wc(m2|m1) usando o método iterativo Newton-Raphson.

As performances dos intervalos de confiança obtidos podem ser avaliadas através de simulações de Monte Carlo com esquemas de bootstrap. Para tanto, iremos gerar um número R grande de amostras do modelo ajustado, e para cada uma delas efetuar B reamostragens, com reposição ou a partir do modelo ajustado. Este experimento está sumarizado no Algoritmo 3:

Algoritmo 3:

1. Para i=1,...,R,

1.1. Geramos a i-ésima amostra de tamanho m do modelo bivariado utilizando o Algoritmo 2. Estimamos simultaneamente por máxima verossimilhança os parâmetros do modelo.

1.2. A partir da i-ésima amostra gerada em (1.1) obtemos B novas amostras x*(ib) amostrando com reposição no caso não-paramétrico, ou obtemos B amostras x*(ib) do modelo ajustado. Para cada uma dessas B amostras:

1.2.1. Estimamos simultaneamente, por máxima verossimilhança, os parâmetros marginais e os parâmetros de dependência.

1.2.2. Usando as estimativas obtidas em (1.2.1), calculamos (ib), (ib) e (ib).

1.2.3. A partir dos vetores de tamanho B contendo as quantidades calculadas em (1.2.1) e (1.2.2) calculamos os percentis 1%, 2,5%, 5%, 95%, 97,5%, 99%, a1, e a2.

1.2.4. Verificamos se os intervalos obtidos contêm o "verdadeiro" valor do parâmetro.

2. Comparamos a cobertura obtida em (1.2.4) com a cobertura nominal.

 

5. Avaliação da Qualidade das Estimativas de Máxima Verossimilhança para Extremos Mensais

Para avaliarmos a qualidade das estimativas de máxima verossimilhança, começamos ilustrando o processo de estimação utilizando três séries financeiras de máximos e mínimos mensais: IBOVESPA do Brasil, S&P500 dos Estados Unidos, e o índice MSCI EAFE da Morgan Stanley Capital International, representando os mercados da Europe, Australásia and Far East, coletados no período de Janeiro de 1996 a Maio de 2001. Os extremos foram, portanto, coletados em blocos de tamanho n=22, formando séries de tamanho m=65.

A Tabela 3 apresenta as estatísticas univariadas dos máximos e mínimos mensais das séries financeiras, que sugerem uma distribuição assimétrica para todos os extremos.

 

 

A associação positiva entre os pares de extremos é ilustrada na Figura 1, onde vemos o diagrama de dispersão entre os mínimos mensais do IBOVESPA e do S&P500, para os dados originais e transformados.

 

 

Não tendo observado nenhum tipo de tendência, ajustamos os quatro modelos bivariados aos 6 pares de extremos, obtendo as estimativas de máxima verossimilhança para todos os parâmetros e para as medidas r, t e R12. O parâmetro f do modelo logístico assimétrico foi fixado igual a 1 para evitar problemas de não identificabilidade do modelo. O software SAS, release 6.12, foi usado no procedimento de otimização simultânea. Todos os ajustes sugeriram dependência. O passo seguinte foi testar formalmente a independência assintótica. O teste escore (7) rejeitou a independência para todos os pares de extremos da Tabela (4). Foram efetuados o teste ML e o teste LR para a escolha do melhor modelo para cada par, e as estimativas dos modelos finais são dadas nas tabelas 4 e 5.

 

 

 

 

Na Tabela 4, damos as estimativas dos parâmetros marginais e (erros padrões). Observamos que as estimativas dos parâmetros de forma foram quase todas positivas (Fréchet), caracterizando distribuições de retornos diários com caudas pesadas. Por outro lado, para os pares de mínimos mensais (IBOVESPA, EAFE) e (S&P500, EAFE), o parâmetro x não é significativamente diferente de zero para o EAFE, indicando ter esta marginal uma distribuição Gumbel e seus retornos diários correspondentes uma distribuição com caudas mais leves do que os demais.

A Tabela 5 fornece as estimativas dos modelos bivariados e também dá as estimativas para r e t, as quais indicam uma associação moderada entre os extremos.

O modelo misto assimétrico para os máximos mensais do S&P500 (1) e EAFE (2) forneceu R12 = 0,9569 para a = 0,01. Isto significa que dado que um retorno positivo alto (lucro grande) m2,0,01 tenha ocorrido para o índice EAFE, a probabilidade do índice S&P500 ser menos extremo (lucros menores) é maior que esta probabilidade calculada quando trocamos os índices. Isto significa que, com respeito a lucros e em relação ao EAFE, o índice S&P500 possui maior peso na dependência observada.

Mas R12 = 0,9569 é próximo de 1. Qual o erro acumulado com as operações sucessivas de estimação e modelagem? Então, precisamos avaliar a precisão e qualidade das estimativas de máxima verossimilhança dos parâmetros e das medidas derivadas dos modelos bivariados, o que faremos a seguir através dos procedimentos bootstrap.

 

5.1 Resultados do bootstrap

Para a realização do bootstrap, escolhemos três pares de índices financeiros de tal forma que tenhamos um exemplo para cada modelo ajustado. Iremos reamostrar das amostras dos pares dos mínimos mensais do (IBOVESPA, S&P500) (modelo 4: logístico simétrico); dos máximos mensais do (IBOVESPA, EAFE) (modelo 2: misto simétrico); e dos máximos mensais do (S&P500, EAFE) (modelo 3: misto assimétrico). Fixamos B = 5000 e implementamos os algoritmos dados.

Apresentamos nas tabelas 6 e 7 os resultados do bootstrap não-paramétrico para os modelos 3 e 4. Os resultados para o modelo 2 são similares e a tabela correspondente foi retirada (seguindo sugestão de um dos revisores). Na primeira linha dessas tabelas repetimos as estimativas dos parâmetros e das medidas de interesse calculadas a partir dos conjuntos de dados originais e dadas nas tabelas 4 e 5. As linhas seguintes contem os resultados do bootstrap. A quarta linha apresenta os erros padrões que nos fornecem a variabilidade das estimativas de máxima verossimilhança apresentadas na primeira linha.

 

 

 

 

Com base nos erros padrões podemos avaliar a acuracidade das estimativas de máxima verossimilhança do coeficiente de correlação r, da medida de dependência t e da medida R12 (quando o modelo é assimétrico) em relação aos seus verdadeiros valores. Ainda nas tabelas 7 e 6 encontramos os intervalos de confiança não-paramétricos do tipo percentil de níveis 90%, 95% e 98% de confiança.

Os resultados nos permitem concluir que a variabilidade não chega a afetar algumas características importantes dos modelos. Por exemplo, os intervalos de confiança para os parâmetros de forma x contém apenas valores positivos, portanto ainda dentro da família Fréchet. Quanto à medida R12, verificamos na Tabela 6 que para o par de máximos mensais S&P500 e EAFE, o erro padrão estimado foi de 0,071 e o intervalo de confiança não-paramétrico do tipo percentil com 95% de cobertura para R12 é [0,863,1,114], o qual contém o valor 1. Então, para este par de índices financeiros não podemos garantir que o S&P500 seja o índice mais responsável pela dependência observada, uma vez que quando R12 = 1 o par de índices estará sob o ajuste de um modelo simétrico. Com base nos resultados podemos dizer que a interpretação da medida R12 deve ser sempre feita com bastante cautela.

As tabelas 8 e 9 apresentam os resultados do bootstrap paramétrico baseado em B=5000 replicações dos modelos 3 e 4 da Tabela 5. Novamente suprimimos a tabela com os resultados do modelo 2 por conter resultados similares.

 

 

 

 

Verificamos que em geral as médias das replicações bootstrap obtidas não-parametricamente ficaram mais próximas dos verdadeiros valores dados na primeira linha das tabelas, do que os resultados obtidos parametricamente. Além disto, em geral sugeriram uma menor variabilidade para os estimadores utilizados.

Analisando na Tabela 8 a medida R12, novamente vemos que o intervalo de 95% de confiança tipo percentil não-paramétrico contém o valor 1. Isto reforça as conclusões já tiradas de que as interpretações de R12 devem sempre levar em consideração sua estimativa pontual mais a variabilidade das mesmas obtidas a partir de esquemas bootstrap.

Devido ao esforço computacional extra considerável que envolve o cálculo dos intervalos de confiança do tipo BCa para os modelos bivariados, calculamos este intervalo apenas para os parâmetros do modelo 4. Notamos que em geral os intervalos de confiança do tipo percentil são menores sob o esquema paramétrico. Já os intervalos de confiança tipo BCa tiveram tamanhos não muito diferentes sob os dois esquemas bootstrap, sendo porém um pouco menores do que os do tipo percentil paramétrico ou não-paramétrico. Por exemplo, para o parâmetro r do modelo 4, os tamanhos dos intervalos tipo percentil (PER), BCa, paramétrico (P), não-paramétrico (NP), para o nível de 98% são: PER-P: 1,016, BCa-P: 0,998, PER-NP: 1,250, BCa-NP: 0,991. Para os níveis de 95% e 90% esses tamanhos são, respectivamente, (0,707, 0,687, 0,967, 0,721) e (0,571, 0,546, 0,752, 0,581).

A seguir utilizamos simulações Monte Carlo seguidas de esquemas de bootstrap para avaliar o desempenho dos intervalos construídos. Fixamos R=5000 e B=5000 e implementamos o Algoritmo 3. Devido ao grande esforço computacional, envolvendo inclusive softwares diferentes, apresentamos os resultados apenas para o modelo 4. Observamos que os intervalos BCa-P e BCa-NP tiveram performances parecidas e um pouco melhores do que os outros dois (PER-P e PER-NP) para todos os níveis de confiança de 98%, 95% e 90%. Por exemplo, o intervalo de 95% BCa-NP incluiu o verdadeiro valor do parâmetro r 94.78% das vezes. No caso da cobertura nominal de 98% e 90% a performance do BCa-NP foi de 97.56% e 89.84%.

Os resultados obtidos pelos dois esquemas permitem uma avaliação favorável quanto a precisão e qualidade das estimativas de máxima verossimilhança obtidas a partir dos modelos bivariados de valores extremos, indicando que a substituição da distribuição exata, com n=22, pela assintótica (n ® ¥), e o tamanho moderado da amostra (m=65) para a estimação por máxima verossimilhança, não tiveram efeito importante na variabilidade das estimativas, exceto no caso da medida R12.

 

6. Avaliação da Qualidade das Estimativas de Máxima Verossimilhança para Extremos Bimestrais

Nesta seção repetimos as análises feitas na Seção 5, agora considerando os máximos e mínimos bimestrais.

O objetivo é verificar se existe ou não aumento na variabilidade das estimativas de máxima verossimilhança dos modelos bivariados se diminuímos o tamanho da amostra de extremos (agora m=32). Por outro lado, notemos que ao coletar extremos bimestrais temos n=44, e portanto a qualidade da aproximação da distribuição exata pela assintótica deve melhorar.

Sendo assim, repetimos todo o processo de ajuste dos modelos, passando pela estimação simultânea dos parâmetros, realizando testes de independência e de escolha dos modelos. As estimativas de máxima verossimilhança, correspondentes aos melhores ajustes obtidos com os modelos bivariados para os diversos pares de extremos, são fornecidas nas tabelas 10 e 11.

 

 

 

 

Observamos que para os pares de máximos bimestrais não ocorreram mudanças no modelo final ajustado. Para os mínimos bimestrais ocorreu uma mudança no par de índices IBOVESPA e EAFE, cujo modelo era logístico simétrico nos mínimos mensais, passando a ser misto simétrico.

Novamente, para averiguarmos a acuracidade das estimativas de máxima verossimilhança utilizamos esquemas bootstrap paramétricos e não-paramétricos com 5000 replicações, cujos resultados para os modelos 3b e 4b estão nas tabelas 12 a 15. As estimativas relacionadas com esses modelos se encontram na primeira linha das referidas tabelas. Algumas características observadas nas seções anteriores se repetem para os extremos bimestrais.

 

 

 

 

 

 

 

 

Observando a quarta linha das tabelas 12 a 15, verificamos que a variabilidade das estimativas de máxima verossimilhança é maior que aquela apresentada nas tabelas 6 a 9. Os maiores aumentos na variabilidade ocorreram no caso dos parâmetros marginais, chegando a ser, em alguns casos, 3,5 vezes maior que a obtida para os extremos mensais.

Com base nos resultados obtidos, constatamos uma certa perda na qualidade das estimativas de máxima verossimilhança, uma vez que ocorreu um aumento significativo na variabilidade. Ou seja, ao se melhorar a qualidade da aproximação da distribuição exata pela distribuição assintótica, se perde na qualidade das estimativas de máxima verossimilhança.

 

7. Conclusões

Neste artigo abordamos o problema da verificação da precisão das estimativas de máxima verossimilhança em amostras de tamanho m pequeno no caso de modelos bivariados da teoria dos valores extremos. Para ilustrar consideramos três índices financeiros, um nacional e dois internacionais, e analisamos os máximos e mínimos coletados em blocos de tamanho fixo n. Os extremos mensais (n=22) resultaram em amostras de tamanho m=65, e os bimestrais (n=44) em m=32.

Para modelar a ocorrência de eventos extremos simultâneos utilizamos duas classes de modelos bivariados de valores extremos: misto e logístico, e seus dois tipos: simétricos e assimétricos. Obtivemos as estimativas de máxima verossimilhança para os parâmetros das distribuições marginais, para a estrutura de dependência, e para as medidas de dependência r, t, e R12. Em seguida, através de esquemas bootstrap paramétricos e não-paramétricos, acessamos a variabilidade dessas estimativas. Calculamos os desvios padrões e intervalos de 90%, 95% e 98% de confiança bootstrap dos tipos percentil e BCa, paramétricos e não-paramétricos. Avaliamos a performance desses intervalos usando simulações Monte Carlo com esquemas bootstrap.

Observamos que para extremos mensais o tamanho pequeno das amostras não parece causar grande variabilidade nas estimativas. Para a medida R12 relacionada com a assimetria dos modelos bivariados, ou seja, com a não permutabilidade das variáveis, constatamos que os procedimentos bootstrap foram muito úteis, já que indicaram que essa medida deve ser usada com cautela. Não se deve portanto afirmar que um mercado tem mais influência na dependência observada à luz apenas das estimativas pontuais de R12.

Finalmente, investigamos o trade-off que existe ao se melhorar a qualidade da aproximação da distribuição exata de extremos bivariados pela distribuição assintótica, a partir do aumento do tamanho do bloco (n passa de 22 a 44 para extremos bimestrais), mas provavelmente perdendo na qualidade das estimativas de máxima verossimilhança, uma vez que o tamanho da amostra de extremos passa a ser m=32. De fato, constatamos uma perda na qualidade das estimativas de máxima verossimilhança, uma vez que ocorreu um aumento significativo na variabilidade. Ou seja, para se ter uma melhor representação da distribuição exata pela distribuição assintótica, se perde na qualidade das estimativas de máxima verossimilhança.

 

Referências Bibliográficas

(1) Cribari-Neto, F. (2000). Bootstrap and applications. Departamento de Estatística, Universidade Federal de Pernambuco, Brasil. http://www.de.ufpe.br.        [ Links ]

(2) Cribari-Neto, F.; Frery, A.C. & Silva, M.F. (2002). Improved estimation of clutter properties in speckled imagery. Computational Statistics and Data Analysis, 40, 801-824.        [ Links ]

(3) Coles, S.G. & Tawn, J.A. (1991). Modelling extreme multivariate events. J. Royal Statist. Society B, 53, 377-392.        [ Links ]

(4) de Haan, L. & Resnick, S.I. (1993). Estimating the limit distribution of multivariate extremes. Commun. Stat. Mod., 9, 275-309.        [ Links ]

(5) Efron, B. (1979). Bootstrap methods: another look at the jackknife. Annals of Statistics, 7, 1-26.        [ Links ]

(6) Efron, B. (1982). The Jackknife, the Bootstrap, and Other Resampling Plans. SIAM, Philadelphia.        [ Links ]

(7) Efron, B. & Tibshirani, R.J. (1993). An Introduction to the Bootstrap. Chapman & Hall, New York.        [ Links ]

(8) Embrechts, P. (2000). Extreme Value Theory: Potential and Limitations as an Integrated Risk Management Tool. Derivatives Use, Trading & Regulation, 6, 449-456.        [ Links ]

(9) Embrechts, P.; de Haan, L. & Huang, X. (2000). Modelling multivariate extremes.In: Extremes and Integrated Risk Management [edited by P. Embrechts], RISK Books, 59-67.        [ Links ]

(10) Feller, W. (1971). An Introduction to Probability Theory and its Applications. Wiley, New York.        [ Links ]

(11) Fisher, R.A. & Tippet, L.H.C. (1928). Limiting forms of the frequency distribution of the largest or smallest member of a sample. Proceedings of the Cambridge Philosophical Society, 24, 180-190.        [ Links ]

(12) Gumbel, E.J. (1954). Statistical theory of extreme values and some practical applications. Nat. Bureau of Standards Applications Mathematics Series, 33, 1-51.        [ Links ]

(13) Gumbel, E.J. (1958). Statistics of Extremes. Columbia Press, New York.        [ Links ]

(14) Gumbel, E.J. (1960). Bivariate exponential distributions. Journal of the American Statistical Association, 55, 698-707.        [ Links ]

(15) Ledford, A.W. & Tawn, J.A. (1997). Modelling dependence within joint tail regions. J. R. Statist. Soc. B, 59, 475-499.        [ Links ]

(16) Mendes, B.V.M. & Moretti, A.R. (2002). Improving financial risk assessment through dependency. Statistical Modelling, an International Journal, 2(2), 103-122.        [ Links ]

(17) Pickands, J. (1981). Multivariate extreme value distributions. Bull. Int. Statist. Inst., 859-878.        [ Links ]

(18) Sibuya, M. (1960). Bivariate extreme statistics. Annals of the Institute of Statistical Mathematics, 11, 195-210.        [ Links ]

(19) Smith, R.L. (1985). Maximum likelihood estimation in a class of nonregular cases. Biometrika, 72, 67-90.        [ Links ]

(20) Starica, C. (1999). Estimation of the extreme value distribution for constant conditional correlation models. Journal of Empirical Finance, to appear.        [ Links ]

(21) Tawn, J. (1988). Bivariate extreme value theory: models and estimation. Biometrika, 75(3), 397-415.        [ Links ]

(22) Tiago de Oliveira, J. (1958). Extremal distributions. Revista da Faculdade Ciências, Lisboa, 2 série A, Matemática, Vol.VII.        [ Links ]

(23) Tiago de Oliveira, J. (1962/63). Structure theory of bivariate extremes, extensions. Est. Mat., Estat. e Econ., 7, 165-195.        [ Links ]

 

 

Recebido em 05/2002, aceito em 04/2003 após 1 revisão

 

 

* Corresponding author / autor para quem as correspondências devem ser encaminhadas

 

 

Apêndice

Algoritmo Básico bootstrap (Cribari-Neto, 2000):

1- Calcular para a amostra original.

2- No caso não-paramétrico, amostrar a partir da amostra original, com reposição, e construir a nova amostra de tamanho m, x* = (,...). No caso paramétrico, amostrar m valores aleatórios da distribuição ajustada F0 () e construir a nova amostra (,...).

3- Calcular (b) para cada amostra bootstrap x*b obtida em (2).

4- Repetir os passos (2) e (3) B vezes.

A expressão para o erro padrão de é:

onde

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License