Acessibilidade / Reportar erro

Fiscalização com e sem radares móveis à luz da teoria dos jogos* * Uma versão anterior deste artigo circulou sob o título “A proibição de radares móveis: eliminando o efeito surpresa da fiscalização”. Agradecemos as sugestões de melhoria para o manuscrito apresentadas pelo(a) parecerista. Jefferson Bertolai e Igor Soares agradecem o apoio institucional da USP e da FEARP/USP ao Laboratório de Economia, Matemática de Computação (LEMC-FEARP/USP), laboratório no qual grande parte deste trabalho foi desenvolvido.

Resumo

Com o objetivo de analisar os efeitos previstos pela Teoria Econômica para a proibição de fiscalização com radares móveis experimentada em 2019 no Brasil, este trabalho utiliza o ferramental usual de Teoria dos Jogos para modelar de forma parcimoniosa a interação estratégica entre a fiscalização de excesso de velocidade e os condutores de veículos. Em grandes linhas, o modelo prevê para as áreas até então fiscalizadas com radares móveis uma intensificação da fiscalização, com uso de radares fixos, nas localidades mais perigosas e uma descontinuidade de fiscalização naquelas mais seguras.

Palavras-chave
radar móvel; fiscalização de trânsito; jogo de fiscalização; escolha de velocidade

1. Introdução

A interrupção de fiscalização de excesso de velocidade por meio de radares móveis é um tema que com frequência é defendido no Brasil por representantes legislativos e por autoridades do Poder Executivo (ver, por exemplo, Lobel & Santos, 2018Lobel, E, & Santos, B. (2018). Descontrole com motos é entrave para Bolsonaro reduzir matança no trânsito. Folha de São Paulo. https://wwwl.folha.uol.com.br/cotidiano/2018/12/descontrole-com-motos-e-entrave -para-bolsonaro-reduzir-matanca-no-transito.shtml
https://wwwl.folha.uol.com.br/cotidiano/...
e Bem Paraná, 2019Bem Paraná. (2019, 06 de novembro). Deputados seguem Bolsonaro e querem proibir radares móveis em rodovias estaduais. Bem Paraná. https://www.bemparana.com.br/noticia/deputados-seguem-bolsonaro-e-querem -proibir-radares-moveis-em-rodovias-estaduais
https://www.bemparana.com.br/noticia/dep...
). Uma das características desta modalidade de fiscalização mais criticadas pelos agentes políticos é a ausência de aviso prévio sobre a presença do radar móvel em determinada localidade (Estadão Conteúdo, 2019Estadão Conteúdo. (2019). Tarcísio de freitas afirmou que renegociação dos contratos para instalação nas rodovias teve uma redução de dois terços no valor. Exame. https://exame.abril.com.br/brasil/ nao-vai-ter-mais-radar-escondido-diz-ministro-da-infraestrutura
https://exame.abril.com.br/brasil/ nao-v...
). Considerando que tais declarações refletem uma resistência de parte do eleitorado à “fiscalização de trânsito sem prévia notificação” e que os limites de velocidade existem para reduzir o risco de acidentes causados por excesso de velocidade, a resistência dos eleitores à fiscalização por radar móvel é no mínimo intrigante.

Possivelmente motivado em atender o interesse dessa parte do eleitorado, o Governo Federal do Brasil suspendeu em agosto de 2019 a utilização de radares móveis na fiscalização de excesso de velocidade em todas as rodovias federais, mantendo-se permitida a fiscalização por meio de radares somente com aparelhos fixos (montados sobre pórticos ou postes).1 1 Ver Sorano e Néri (2019) e despacho da Presidência da República publicado no Diário Oficial da União de 15/08/2019 (DOU, 2019). A medida se aplica somente aos radares usualmente conhecidos como “móveis”: radares instalados em veículo parado ou sobre suporte (tecnicamente denominado radar estático), instalados em veículo em movimento (tecnicamente denominado radar móvel) e direcionados manualmente para os veículos (tecnicamente denominado radar portátil). Segundo DOU (2019), a medida seguirá em vigor até que o Ministério da Infraestrutura conclua a reavaliação da regulamentação dos procedimentos de fiscalização eletrônica de velocidade em vias públicas e não há prazo definido para a volta da fiscalização. Conforme noticiado recentemente por Richter (2019), no entanto, uma decisão judicial de 11 de dezembro de 2019 ordena o reestabelecimento da fiscalização com radares deste tipo. Como justificativa para tal suspensão, o despacho da Presidência da República estabelece que “a suspensão é para evitar o desvirtuamento do caráter pedagógico e a utilização meramente arrecadatória dos instrumentos e equipamentos medidores de velocidade.”

Com o objetivo de analisar os efeitos previstos pela Teoria Econômica para a proibição de fiscalização com radares móveis, este trabalho utiliza o ferramental usual de Teoria dos Jogos para modelar de forma parcimoniosa a interação estratégica entre a fiscalização de excesso de velocidade e os condutores de veículos.2 2 Bjørnskau e Elvik (1992) e Elvik (2014) discutem a atratividade superior da abordagem de Teoria dos Jogos para se estudar o comportamento dos condutores. O modelo assim construído é utilizado para avaliar o efeito de proibir fiscalizações por meio de radares móveis, mantendo-se a opção de fiscalização por radares fixos.

O modelo proposto é uma extensão natural do modelo de Bjørnskau e Elvik (1992)Bjørnskau, T., & Elvik, R. (1992). Can road traffic law enforcement permanently reduce the number of accidents? Accident Analysis & Prevention, 24(5), 507–520. http://dx.doi.org/10.1016/0001-4575(92)90059-R
http://dx.doi.org/10.1016/0001-4575(92)9...
para o caso em que a fiscalização pode ser executada também por meio de radares fixos e no qual há mais de uma localidade na rodovia para ser fiscalizada. A existência de mais de uma localidade permite estudar a situação em que a fiscalização pode ser organizada em três formatos: ela pode ser estruturada somente com radares fixos, ou somente com radares móveis ou usar uma combinação de radares fixos com radares móveis.

A diferença estratégica essencial entre os dois tipos de fiscalização considerados (por meio de radares móveis e por meio radares fixos) reside no fato de o posicionamento dos radares fixos na rodovia ser previamente conhecido pelos condutores. A autoridade de trânsito é obrigada a sinalizar a presença do radar pouco antes da localidade na qual ele foi instalado e, após descobrir o posicionamento do radar em período anterior, os condutores sabem que sua posição não mudou desde então. Na fiscalização por radar móvel, por outro lado, não há obrigatoriedade de sinalização prévia e o posicionamento do radar pode ser mais facilmente mudado de um período para outro. Dessa forma, o jogo estático proposto por Bjørnskau e Elvik (1992)Bjørnskau, T., & Elvik, R. (1992). Can road traffic law enforcement permanently reduce the number of accidents? Accident Analysis & Prevention, 24(5), 507–520. http://dx.doi.org/10.1016/0001-4575(92)90059-R
http://dx.doi.org/10.1016/0001-4575(92)9...
para modelar a interação entre a fiscalização e os condutores é adequado para estudar a situação em que a fiscalização é possível somente com radares móveis. A adaptação deste modelo para a possibilidade de fiscalização com radares fixos requer uma dimensão dinâmica que reflita a informação possuída pelos condutores no momento de sua decisão. O modelo resultante é o jogo dinâmico com informação completa e imperfeita apresentado na Figura 4 em sua forma extensiva.

A relevância para o contexto brasileiro do assunto aqui tratado justifica uma análise cuidadosa sobre potenciais efeitos das políticas públicas. Conforme destacado por Bacchieri e Barros (2011)Bacchieri, G., & Barros, A. J. D. (2011). Acidentes de trânsito no Brasil de 1998 a 2010: Muitas mudanças e poucos resultados. Revista de Saúde Pública, 45(5), 949–963. http://dx.doi.org/10.1590/S0034-89102011005000069
http://dx.doi.org/10.1590/S0034-89102011...
, o trânsito no Brasil é considerado um dos mais violentos do mundo.3 3 Moreira, Ribeiro, Motta, e Motta (2018) cita que 733.120 pessoas morreram no Brasil em decorrência de Acidentes de Trânsito Terrestres (ATT) entre 1996 e 2015, cerca de 3,5% do total de mortes do período. Destaca ainda que 2.272.068 pessoas foram internadas por se envolverem ATT's no mesmo período. Dentre estes, os motociclistas são as vítimas com maior tempo de permanência hospitalar, conforme destacado por Andrade e Jorge (2017). Citando estimativas do IPEA, os autores chamam a atenção para o fato de que o custo dos Acidentes de Transporte Terrestres (ATT's) são significativos: os custos totais em 2005 são estimados em torno de R$28 bilhões, sendo R$ 6,5 bilhões estimados para os ATTs ocorridos em rodovias federais, R$ 14,1 bilhões nas rodovias estaduais e de R$ 1,4 bilhão nas rodovias municipais.

A relação da velocidade dos veículos com a probabilidade e severidade dos ATT's é bastante bem documentada por vários trabalhos empíricos.4 4 Ver Zlatoper (1991), Aarts e Van Schagen (2006), Wilson, Willis, Hendrikz, Le Brocque, e Bellamy (2010), Theofilatos e Yannis (2014), e Fowles e Loeb (1989). Alguns estudos identificam uma correlação positiva e significativa entre o nível de velocidade e a probabilidade e severidade de ATT's, enquanto outros encontram maior relevância da variabilidade de velocidade entre veículos na explicação dos acidentes. Neste sentido, as regras de limite de velocidade são importantes instrumentos para combater a insegurança no trânsito. Elas cumprem o papel de desincentivar níveis de velocidade muito elevados e podem agir como um mecanismo de coordenação que induz a uniformização da velocidade entre condutores.5 5 Ver Lave (1985), Ryeng (2012), Connolly e Aberg (1993), e Elvik (2014).

Os radares utilizados para aferição de velocidade de veículos são instrumentos úteis para promover o cumprimento das regras de limite de velocidade. Em uma revisão de 35 estudos para países desenvolvidos,6 6 Com dados de velocidade em rodovias antes e após a introdução de radares e usando como controle medidas de velocidade em rodovias similares no mesmo período. Wilson et al. (2010)Wilson, C., Willis, C., Hendrikz, J. K., Le Brocque, R., & Bellamy, N. (2010). Speed cameras for the prevention of road traffic injuries and deaths. Cochrane Database of Systematic Reviews, 11(CD004607). http://dx.doi.org/10.1002/14651858.CD004607.pub4
http://dx.doi.org/10.1002/14651858.CD004...
encontram que todos eles indicam redução da velocidade nas áreas próximas do radar: queda entre 8% e 70% no número de condutores acima do limite de velocidade, sendo que a maior parte dos estudos mostrou uma queda entre 10% e 35%. Dentre tais estudos, 28 analisaram o efeito da introdução dos radares sobre os acidentes e identificaram queda entre 8% e 49%, com a maior parte deles mostrando redução entre 14% e 25%. Nesta mesma linha, Teed, Lund, e Knoblauch (1993)Teed, N., Lund, A. K., & Knoblauch, R. (1993). The duration of speed reductions attributable to radar detectors. Accident Analysis & Prevention, 25(2), 131–137. http://dx.doi.org/10.1016/0001-4575(93)90052-X
http://dx.doi.org/10.1016/0001-4575(93)9...
apontam que o uso de radares móveis pela polícia reduz de forma considerável a velocidade dos condutores, embora tal efeito seja relevante somente nas proximidades da localização do radar (distance-halo effect).7 7 No estudo realizado pelos autores na Interstate 70 (no trecho rural do estado de Maryland, EUA), foi encontrado uma elevação na velocidade média dos motoristas quando não há radar ativo. No entanto, o efeito é apenas local. Nas proximidades da localidade do radar, houve redução de 42% para 28% no número de motoristas com velocidade 10 milhas por hora acima do limite máximo (55 milhas por hora). Após 1 milha, 38% dos motoristas já desenvolviam velocidade acima de 65 milhas por hora, com a porcentagem aumentando para 40% após duas a cinco milhas da posição do radar. Estes dois efeitos são identificados no contexto brasileiro por Yamada (2005)Yamada, M. G. (2005). Impacto dos radares fixos na velocidade e na acidentalidade em trecho da rodovia Washington Luís (Dissertação de Mestrado, Escola de Engenharia de São Carlos, São Carlos, SP). http://dx.doi.org/10.11606/D.18.2005.tde-15022006-204946
http://dx.doi.org/10.11606/D.18.2005.tde...
, o qual conclui que o efeito na redução da velocidade é localizado em um pequeno segmento imediatamente anterior a posição do radar. Vaa (1997)Vaa, T. (1997). Increased police enforcement: Effects on speed. Accident Analysis & Prevention, 29(3), 373–385. http://dx.doi.org/10.1016/S0001-4575(97)00003-1
http://dx.doi.org/10.1016/S0001-4575(97)...
, por sua vez, identifica em rodovias da Noruega uma redução na velocidade dos condutores causada pela fiscalização via radares, mas destaca que tal efeito se dissipou após o período de maior fiscalização (time-halo effect).

Em resumo, os ATT's envolvem custos sociais significativos e a fiscalização de velocidade por meio de radares é um instrumento bastante relevante para reduzir tais custos (uma vez que promove regras de limite de velocidade), embora seu efeito se concentre nas proximidades geográfica e temporal de sua atuação.

Tendo em vista a relativa complexidade do modelo aqui desenvolvido (ver Figura 4) e com o objetivo de manter o artigo acessível para um público mais abrangente, a apresentação dos conceitos, objetos e linguagem utilizados na análise é dividida em quatro passos, correspondentes às seções 2, 3, 4 e 5. O modelo de Bjørnskau e Elvik (1992)Bjørnskau, T., & Elvik, R. (1992). Can road traffic law enforcement permanently reduce the number of accidents? Accident Analysis & Prevention, 24(5), 507–520. http://dx.doi.org/10.1016/0001-4575(92)90059-R
http://dx.doi.org/10.1016/0001-4575(92)9...
é apresentado na seção 2 como forma de familiarizar o leitor com o modelo existente na literatura. Em seguida, este modelo é generalizado na seção 3 para o caso em que há duas localidades nas quais existe limite de velocidade a ser verificado com o uso de radares. A seção 4 apresenta uma adaptação do modelo da seção 3 para o caso em que a fiscalização é executada somente com radares fixos. Finalmente, a seção 5 se beneficia da exposição das seções 2, 3 e 4 para apresentar a versão completa do modelo, na qual existe as três opções de organização da fiscalização: somente com radares fixos, somente com radares móveis ou combinar o uso de radares fixos com radares móveis.

2. A interação estratégica essencial

Considere um jogo entre dois jogadores: jogador 0 e jogador 1. O jogador 1 é denominado Condutor e precisa decidir se excede ou não a máxima velocidade permitida em uma determinada rodovia. O jogador 0 é denominado Fiscal e é responsável por fiscalizar o cumprimento da regra que estabelece o limite máximo de velocidade nesta rodovia.

Suponha, por simplicidade, que o veículo utilizado pelo condutor é capaz de desenvolver somente dois níveis de velocidade: um nível baixo, denotado por υb, e um nível alto, denotado por υa e tal que υa > υb. Suponha, ainda por simplicidade, que há somente um local na rodovia em que existe um limite máximo para a velocidade dos veículos: denominado local 1 e denotado por l1. O limite máximo de velocidade nesta localidade é dado por tal que υb < ῡ < υa.

A verificação do cumprimento da regra (manter velocidade abaixo de ῡ na localização l1) é efetuada por meio de um aparelho de aferição de velocidade, doravante denominado radar. Para aferição da velocidade, o radar precisa ser posicionado na localidade l1 e precisa ser operado presencialmente por uma pessoa.

O Condutor do veículo precisa decidir sob qual velocidade transitará com seu veículo pela localidade l1. A atratividade da velocidade alta (υa) reside no fato de que ela permite chegar mais cedo ao destino. A atratividade da velocidade baixa (υb) decorre do fato de esta respeitar o limite máximo e, portanto, evitar uma eventual multa.

O Fiscal, por outro lado, precisa decidir onde estará localizado no momento de passagem do condutor. A atratividade de se posicionar em l1 para operar o radar reside no fato de que o fiscal possui autorização para cobrar uma multa (confiscar um montante de recursos) do condutor quando este é identificado violando o limite v. Alternativamente, o Fiscal tem a opção de se posicionar em outra localidade, denominada l0, desempenhando uma atividade (produtiva ou de lazer) distinta da verificação de cumprimento da regra. O benefício desta atividade alternativa (produção ou lazer) é o custo de oportunidade incorrido pelo fiscal ao se posicionar em l1.

Exemplo 1. A matriz a seguir ilustra de maneira bastante conveniente (na forma normal) a situação estratégica na qual estão envolvidos o Condutor e o Fiscal. Cada linha da matriz corresponde a uma ação do Fiscal e cada coluna corresponde a uma ação do Condutor. Dessa forma, por exemplo, a célula definida pela segunda linha da primeira coluna representa a situação em que o Condutor decidiu passar pela localidade l1 sob uma velocidade baixa (υb) e o Fiscal decidiu se posicionar na localidade de operação do radar (l1).

Condutor (jogador 1)

(1) F i s c a l ( j o g a d o r 0 ) l 0 l 1 C o n d u t o r ( j o g a d o r 1 ) v b v a 0 , 0 1 , 1 ¯ 1 , 0 0 , 1 ¯ ¯

Cada célula da matriz apresenta um par ordenado (x,y) de números x e y que denotam o nível de satisfação do Fiscal e do Condutor, respectivamente, na combinação de ações correspondente a referida célula. Assim, o par ordenado (−1,0) apresentado na segunda linha da primeira coluna da matriz revela que o nível de satisfação (payoff) do Condutor é igual a 0 quando ele passa pela localidade l1 em velocidade baixa e o Fiscal está presente para aferir sua velocidade. Revela ainda que o payoff do Fiscal nesta situação é −1, consequência do custo de oportunidade da fiscalização.

Note que o exemplo apresentado é um caso particular da situação descrita acima, embora já seja rico o suficiente para captar a essência da interação estratégica entre o Fiscal e o Condutor. O Condutor prefere exceder o limite ῡ, a fim de chegar ao seu destino em menos tempo, quando o Fiscal não está presente em l1 para verificar sua velocidade: seu payoff aumenta em uma unidade ao trocar υb por υa neste caso. Por outro lado, o Condutor prefere não exceder quando o Fiscal está presente em l1. Ao trocar υb por υa neste caso, seu payoff é reduzido em uma unidade: o condutor chegaria mais cedo ao destino (o que gera um ganho unitário de payoff), mas teria que arcar com o custo monetário da multa por excesso de velocidade (o que reduz seu payoff em 2 unidades, no exemplo apresentado). Similarmente, o Fiscal prefere não se posicionar em l1 quando o Condutor está respeitando o limite ῡ: seu payoff aumenta em uma unidade quando ele troca a localidade l1 pela localidade l0, uma vez que isto evita o custo de oportunidade de se posicionar em l1. Quando o Condutor excede o limite de velocidade, no entanto, o Fiscal prefere se posicionar em l1: o Fiscal recebe uma unidade adicional de payoff ao trocar l0 por l1 nesta situação.

2.1 Previsões de comportamento

Como cada um dos jogadores (Fiscal e Condutor) possui duas ações possíveis, então há 4 possibilidades de resultado no jogo descrito acima: (l0, υb), (l0, υa), (l1, υb) e (l1, υa). Um dado resultado é considerado uma boo previsão sobre o comportamento dos jogadores se nenhum dos jogadores possui interesse em se comportar de maneira distinta daquela prevista no referido resultado. Por exemplo, o resultado (l0, υb) não pode ser considerado uma boa previsão para o comportamento dos jogadores, pois o Condutor possui interesse em exceder o limite de velocidade quando Fiscal está em l0. Usando tal definição de boa previsão, nenhum dos quatro resultados do jogo acima pode ser considerado uma boa previsão para o comportamento dos jogadores, conforme estabelecido pelo Lema 1 a seguir.

Lema 1. Cada um dos possíveis resultados do jogo (1) não pode ser considerado uma boa previsão para o comportamento dos jogadores.

Demonstração. A razão de (l0, υb) não poder ser considerado uma boa previsão já foi exposta no texto. O Condutor possui interesse em respeitar quando Fiscal está em l1 e, portanto, (l1, υa) não é uma boa previsão. O Fiscal possui interesse em se posicionar em l1 quando o Condutor excede v. Logo, (l0, υa) não é uma boa previsão. O Fiscal possui interesse em se posicionar em l0 quando o Condutor respeita v. Com isso, (l1, υb) não é uma boa previsão.

Em situações nas quais nenhum resultado do jogo é uma boa previsão sobre o comportamento dos jogadores (como é o caso aqui considerado de interação estratégica entre o Condutor e o Fiscal), a previsão de comportamento é feita em termos probabilísticos. Um exemplo de comportamento probabilístico8 8 Para interpretações alternativas sobre previsão de comportamento em termos probabilísticos, ver o trabalho seminal de Harsanyi (1967, 1968a, 1968b) e o livro-texto Gibbons (1992). para o Condutor seria respeitar com probabilidade 3/4 e excedê-lo com probabilidade 1/4. Tal comportamento é usualmente denotado pela distribuição de probabilidade (3/4, 1/4), em que a ordem de apresentação das probabilidades é consistente com a ordem na qual as ações foram apresentadas na matriz (1): a primeira entrada do vetor (3/4, 1/4) denota a probabilidade de υb e a segunda entrada a probabilidade de υa. Como exemplo de comportamento probabilístico para o Fiscal, este poderia se localizar em l0 com probabilidade 1/3 e em l1 com probabilidade 2/3, comportamento este que recebe a representação vetorial (1/3, 2/3). Em conjunto, estas duas previsões sobre comportamentos individuais geram a seguinte previsão probabilística sobre o que acontecerá no jogo

(2) ( σ 0 , σ 1 ) = [ ( 1 3 , 2 3 ) , ( 3 4 , 1 4 ) ] .

Nesta previsão, o resultado (l0, υb) ocorre com probabilidade (l/3)(3/4) = 1/4 e (l1, υb) ocorre com probabilidade (2/3)(3/4) = 1/2. Já (l0, υa) ocorre com probabilidade (l/3)(l/4) = 1/12 e (l1, υa) com probabilidade (2/3)(l/4) = 2/12.

A medida usual para descrever o nível de satisfação dos jogadores quando algum deles adota o comportamento probabilístico é dada pelo payoff esperado, o qual é calculado segundo as distribuições de probabilidade que descrevem os comportamentos. Como ilustração desta medida, o payoff esperado do Condutor sob a previsão (2) é dado por

σ 0 ( l 0 ) [ σ 1 ( υ b ) π 1 ( l 0 , υ b ) + σ 1 ( υ a ) π 1 ( l 0 , υ a ) ] + σ 0 ( l 1 ) [ σ 1 ( υ b ) π 1 ( l 1 , υ b ) + σ 1 ( υ a ) π 1 ( l 1 , υ a ) ] = 1 3 ( 3 4 ( 0 ) + 1 4 ( 1 ) ) + 2 3 ( 3 4 ( 0 ) + 1 4 ( 1 ) ) = 1 12 2 12 = 1 12 ,

em que πk(li, υj) denota o payoff obtido pelo jogador k ∈ {0,1} sob o resultado (li, υj), conforme apresentado na matriz (1). Para i ∈ {0,1}, a probabilidade de o jogador 0 escolher li é denotada por σ0(li). Para j ∈ {a, b}, a probabilidade de o jogador 1 escolher υj é denotada por Σ1(υj). De forma mais geral, o payoff esperado do jogador k ∈ {0,1} sob a previsão σ = (σ0, σ1) é dado por Uk(σ0, σ1) tal que

(3) U k ( σ 0 , σ 1 ) = i = 0 1 σ 0 ( l i ) [ j = a b σ 1 ( υ j ) π k ( l i , υ j ) ] ,

em que o operador ∑ é usado para denotar o somatório

x 0 + x 1 = j = 0 1 x j

para uma dada sequência de números x0 e x1. Analogamente,

y a + y b = j = a b y j

para uma dada sequência de números ya e yb.

Uma previsão probabilística σ = (σ0,σ1) é denominada uma boa previsão sobre o comportamento dos jogadores se nenhum dos jogadores possui interesse em se comportar (probabilisticamente) de maneira distinta daquela prevista por σ. Especificamente, σ = (σ0,σ1) é uma boa previsão se cada jogador i e {0,1} não é capaz de elevar seu nível esperado de satisfação Ui(σ0,σ1), conforme definido em (3), modificando seu comportamento probabilístico σi. Como ilustração deste conceito, a previsão σ=(σ0,σ1)=[(13,23),(34,14)] não pode ser considerada uma boa previsão, pois o Condutor é capaz de elevar seu nível de satisfação U1(σ) de −1/12 para zero trocando seu comportamento σ1=(34,14) por σ0,σ1′ = (1,0).

Como todo jogador é capaz de modificar seu comportamento unilateralmente — ou seja, sem que os demais jogadores modifiquem seu comportamento —, então o = (σ0,σ1) é uma boa previsão somente se cada jogador não é capaz de melhorar sua situação modificando unilateralmente seu comportamento. Tendo em vista que previsões que não possuem desvios unilaterais atrativos são usualmente denominadas como Equilíbrio de Nash,9 9 Ver o artigo seminal de Nash (1950) e o livro-texto Gibbons (1992). esta propriedade estabelece que toda boa previsão é necessariamente um Equilíbrio de Nash.

A fim de tornar precisa a definição de Equilíbrio de Nash, alguma notação matemática adicional é necessária. Defina A1 = {υb, ua} como o conjunto de ações possíveis para o jogador 1 (Condutor) e A0 = {l0, l1} como o conjunto de ações possíveis do jogador 0 (Fiscal). Para cada i ∈ {0,1}, seja

Δ ( A i ) = { ( x , y ) : x 0 , y 0 x + y = 1 }

o conjunto de distribuições de probabilidade sobre Ai. Por exemplo, (x,y) ∈ Δ(A0) significa que o jogador 0 escolhe l0 com probabilidade x ≥ 0 e escolhe l1 com probabilidade y = 1 − x ≥ 0.

Seja σ* = (σ0*, σ1*) tal que σi* ∈ Δ(Ai) e descreve o comportamento probabilístico previsto por σ* para o jogador ∈ {0,1}. O jogador 0 não possui desvio unilateral atrativo a partir de σ* se, e somente se, σ0* é melhor resposta do jogador 0 ao comportamento previsto por σ* para os demais jogadores: neste caso, σ1*. Ou seja,

(4) σ 0 * arg  max U 0 ( σ 0 , σ 1 * ) , σ 0 Δ ( A 0 )

em que o V = max xX f(x) denota o valor máximo que uma dada função f(·) atinge no conjunto X e B = arg maxxX f(x) denota o conjunto de pontos de X nos quais f(·) atinge o valor V.O conjunto apresentado em (4) é o conjunto de melhores respostas do jogador 0 ao comportamento σ1* do jogador 1. De forma análoga, o jogador 1 não possui desvio unilateral atrativo a partir de σ* = (Σ0*, Σ1*) se, e somente se,

(5) σ 1 * arg  max U 1 ( σ 0 * , σ 1 ) . σ 1 Δ ( A 1 )

Conclui-se disto que σ* = (σ0*, σ1*) é Equilíbrio de Nash se, e somente se, σ* satisfaz (4) e (5). Esta caracterização do Equilíbrio de Nash permite obter a única boa previsão para o comportamento dos jogadores no jogo (1), conforme estabelecido pelo Lema 2 a seguir.

Lema 2.A única boa previsão (o único Equilíbrio de Nash) σ* = (σ0*, σ1*) para o jogo entre o Fiscal e o Condutor apresentado em(1)é dado porσ*=[(12,12),(12,12)]

Demonstração. Por conveniência, denote B0(σ1)=argmaxσ0Δ(A0)U0(σ0,σ1) e B1(σ0)=argmaxσ1Δ(A1)U1(σ0,σ1)

Usando (3), observe que

U 0 ( σ 0 , σ 1 ) = σ 0 ( l 0 ) [ σ 1 ( υ b ) 0 + σ 1 ( υ a ) ( 1 ) ] + σ 0 ( l 1 ) [ σ 1 ( υ b ) ( 1 ) + σ 1 ( υ a ) 0 ] = σ 0 ( l 0 ) σ 1 ( υ a ) σ 0 ( l 1 ) σ 1 ( υ b ) = σ 1 ( υ a ) + σ 0 ( l 1 ) [ σ 1 ( υ a ) σ 1 ( υ b ) ] = σ 0 ( l 1 ) [ 2 σ 1 ( υ a ) 1 ] σ 1 ( υ a )
U 1 ( σ 0 , σ 1 ) = σ 1 ( υ b ) [ σ 0 ( l 0 ) 0 + σ 0 ( l 1 ) 0 ] + σ 1 ( υ a ) [ σ 0 ( l 0 ) 1 + σ 0 ( l 1 ) ( 1 ) ] = σ 1 ( υ a ) [ σ 0 ( l 0 ) σ 0 ( l 1 ) ] = σ 1 ( υ a ) [ 1 2 σ 0 ( l 1 ) ] ,

em que se usou os fatos σ0(l0) + σ0(l1) = 1 e σ1(υb) + σ1(υa) = 1, decorrentes de σ0 ∈ Δ(A0) e σ1 ∈ Δ(A1). Assim, U0(σ01) pode ser escrita como uma função linear em σ0(l1) quando σ1 é mantida fixa. A monotonicidade desta função linear depende da magnitude de σ1(υa): ela é estritamente decrescente quando σ1(υa) < 1/2; estritamente crescente se σ1(υa) > 1/2; e constante se σ1(υa) = 1/2. Com isso, U0(σ0,σ1) atinge valor máximo quando σ1(υa) < 1/2 somente se σ0(l1) = 0. Similarmente, U0(σ0,σ1) atinge valor máximo quando σ1(υa) > 1/2 somente se σ0(l1) = 1. Quando σ1(υa) = 1/2, todo valor σ0(l1) ∈ [0, 1] maximiza U0(σ0, σ1). Tal argumento justifica o resultado (6) a seguir:

(6) B 0 ( σ 1 ) = arg max σ 0 Δ ( A 0 ) ( σ 0 ( l 1 ) [ 2 σ 1 ( υ a ) 1 ] σ 1 ( υ a ) ) = { { ( 1 , 0 ) } , se σ 1 ( υ a ) < 1 2 , Δ ( A 0 ) , se σ 1 ( υ a ) = 1 2 { ( 0 , 1 ) } , se σ 1 ( υ a ) > 1 2 ;
(7) B 1 ( σ 0 ) = arg max σ 1 Δ ( A 1 ) ( σ 1 ( υ a ) [ 1 2 σ 0 ( l 1 ) ] ) = { { ( 0 , 1 ) } , se σ 0 ( l 1 ) < 1 2 , Δ ( A 1 ) , se σ 0 ( l 1 ) = 1 2 , { ( 1 , 0 ) } , se σ 0 ( l 1 ) > 1 2 .

Analogamente ao argumento acima, U1(σ0, σ1) pode ser escrita como uma função linear em σ1(υa) quando σ0 é mantida fixa e sua maximização para cada valor de σ0 resulta em (7).

Note que B0(σ1*) = Δ(A0) e B1(σ0*) = Δ(A1) quando σ0*(l1) = σ1*(υa) = 1/2. Assim (4) e (5) são trivialmente satisfeitas por cr* = [(1/2, 1/2), (1/2, 1/2)]. Para ver que somente [(1/2, 1/2), (1/2, 1/2)] é Equilíbrio de Nash, suponha que σ* = (σ0* , σ1*) ∈ Δ(A0) × Δ(A1) é uma previsão probabilística para o jogo (1) que satisfaz (4) e (5) simultaneamente.

Observe que σ0*(l1) < 1/2 gera uma impossibilidade e, portanto, não pode ser verdadeira. De fato, σ0*(l1) < 1/2, (5) e (7) implicam que σ1* = (0, 1) e, portanto, que σ1(υa) = 1 > 1/2. Usando (4), (6) e tal resultado, obtém-se σ0* = (0, 1) e, portanto, a impossibilidade σ0*(l1) = 1 > V2 > σ0*(l1). Conclui-se desta contradição que σ0*(l1) ≥ 1/2. De maneira análoga, σ0*(l1) > V2 gera uma impossibilidade e, portanto, também não pode ser verdadeira. De fato, σ0*(l1) > 1/2, (5) e (7) implicam que σ1* = (1, 0) e, portanto, que σ1*(υa) = 0 < 1/2. Usando (4), (6) e tal resultado, obtémse σ0* = (1, 0) e, portanto, a impossibilidade σ0*(l1) = 0 < 1/2 < σ0*(l1). Conclui-se desta contradição que σ0*(l1) ≤ 1/2. Como σ0*(l1) ≥ 1/2 e σ0*(l1) ≤ V2, então σ0*(l1) = 1/2 e σ0* = (1/2, 1/2).

Tendo em vista que σ0* = (1/2, 1/2), o único caso em (6) consistente com σ0* = (1/2, 1/2) ∈ B0(σ0*) é o caso em que B0(σ1*) = Δ(A0). Logo, σ0*(υa) = 1/2 e σ1* = (1/2,1/2).

O resultado de unicidade apresentado no Lema 2 não depende dos valores particulares atribuídos aos payoffs dos jogadores em (1). Basta que tais valores reflitam o padrão de atratividade (de cada resultado possível para cada jogador) descrito no início desta seção. A fim de verificar tal afirmação, considere a seguinte generalização do nível de satisfação dos jogadores.

Suponha que o Fiscal se posicionou em n ∈ {0,1} localidades para verificar a velocidade do Condutor e que tal posicionamento resultou em m ∈ {0,1} autuações (multas) ao Condutor. Se o Condutor excedeu a velocidade em e ∈ {0,1} localidades, então a satisfação do Fiscal e do Condutor são definidas, respectivamente, por

(8) u 0 ( n , m , e ) = ( α + β ) m α n γ e
(9) u 1 ( m , e ) = μ e ( μ + η ) m

em que β > 0, α > 0, η > 0, μ > 0 e γ > 0. A condição γ > 0 estabelece que o Fiscal fica menos satisfeito quando o Condutor excede o limite de velocidade. A condição α > 0 reflete o fato de a fiscalização possuir um custo: cada fiscalização diminui a satisfação do Fiscal em α unidades. Ou seja, α é o custo de oportunidade de cada fiscalização. A hipótese β > 0 estabelece que a satisfação do Fiscal em autuar o Condutor quando este excede é estritamente maior do que o custo de oportunidade da fiscalização requerida para tal autuação (ou seja, α + β > α). A condição μ > 0 reflete o fato de que exceder aumenta a satisfação do Condutor, uma vez que permite chegar ao seu destino em menos tempo. A hipótese η > 0 estabelece que a satisfação do Condutor em exceder para chegar ao destino mais cedo é estritamente menor do que a punição associada a autuação por limite de velocidade (ou seja, μ < μ + η). A ausência de n em (9) estabelece que o Condutor não se importa com o posicionamento do Fiscal quando sua velocidade não excede ῡ. O padrão de atratividade formalizado por (8) e (9) resulta na generalização do jogo entre o Fiscal e o Condutor apresentada em (10):

Condutor (jogador 1)

(10) Fiscal ( jogador0 ) l 0 l 1 Condutor ( jogador1 ) v b v a u 0 ( 0 , 0 , 0 ) , u 1 ( 0 , 0 ) u 0 ( 0 , 0 , 1 ) , u 1 ( 0 , 1 ) ¯ u 0 ( 1 , 0 , 0 ) , u 1 ( 0 , 0 ) u 0 ( 1 , 1 , 1 ) , u 1 ( 1 , 1 ) ¯ ¯

Note que o Condutor obtém nenhum excesso de velocidade (e = 0) e, portanto, nenhuma multa (m = 0) ao escolher υb. Logo, sua satisfação será u1(0,0) para cada posicionamento do Fiscal. Ao escolher υa, por outro lado, ele obtém um excesso de velocidade (e = 1) e fica exposto a multa por excesso de velocidade. Recebe nenhuma multa (m = 0) se o Fiscal se posiciona em l0, o que resulta em satisfação u1(0,1), e recebe uma multa (m = 1) se o Fiscal se posiciona em l1, o que lhe confere satisfação u1(1,1). Finalmente, ao escolher l0, o Fiscal se posiciona em nenhuma localidade para verificar velocidade (n = 0) e, portanto, não autua o Condutor (m = 0). Obtém com isso satisfação u0(0,0,0) se o Condutor escolhe υb e u0(0,0,1) se o Condutor escolhe υa. Ao escolher l1, no entanto, ele se posiciona em uma localidade para verificar velocidade (n = 1) e autua o Condutor se, e somente se, este escolhe υa.

Como consequência de (8) e (9), a matriz de payoffs em (10) é dada por (11). Esta representação permite visualizar que o jogo (1) é o caso particular de (11) quando α = β = γ = η = μ = l:

Condutor (jogador 1)

(11) Fiscal ( jogador0 ) l 0 l 1 Condutor ( jogador1 ) v b v a 0 , 0 γ , μ ¯ α , 0 β γ , η ¯ ¯

A Proposição 1 a seguir confirma a generalidade do resultado de unicidade do Lema 2 e estabelece ainda que, em todas as situações estratégicas entre o Condutor e o Fiscal que podem ser descritas por (11), o comportamento previsto é o Fiscal se posicionar em l1 para verificar a velocidade do Condutor segundo a probabilidade δ ∈ (0,1) e o Condutor exceder o limite segundo a probabilidade θ ∈ (0,1).

Proposição 1. A única boa previsão (o único Equilíbrio de Nash) para o jogo (11) é dada por

σ * = ( σ 0 * , σ 1 * ) = [ ( 1 δ , δ ) , ( 1 θ , θ ) ] , e m q u e θ α / ( α + β ) ( 0 , 1 ) e δ μ / ( η + μ ) ( 0 , 1 ) .

em que θ ≡ α/(α + β) ∈ (0,1) e δμ/(η + μ) ∈ (0,1).

Demonstração. A demonstração é uma extensão direta do argumento utilizado para provar o Lema 2. Ela é apresentada em detalhes no Apêndice.

Utilizando a Proposição 1 e a definição (3), cabe registrar que o payoff esperado dos jogadores no único equilíbrio de Nash de (11) é dado por

(12) U 0 ( σ 0 * , σ 1 * ) = ( 1 δ ) [ 0 ( 1 θ ) γ θ ] + δ [ α ( 1 θ ) + ( β γ ) θ ] = γ θ + δ [ ( α + β ) θ α ] = γ θ ,
(13) U 1 ( σ 0 * , σ 1 * ) = ( 1 θ ) [ 0 ( 1 δ ) + 0 δ ] + θ [ μ ( 1 δ ) η δ ] = θ [ μ ( μ + η ) δ ] = 0 ,

em que a terceira igualdade utiliza a definição de θ = α/(α + β) e a sexta igualdade utiliza a definição de δ = μ/(η + μ).

3. O modelo para radares móveis

No modelo estudado na seção 2, há somente um local na rodovia em que existe limite máximo para a velocidade dos veículos, denotado por l1. A fim de estudar a decisão de posicionamento do radar entre mais de uma localidade, suponha agora a existência de uma segunda localidade na qual existe limite máximo para a velocidade dos veículos: denominada localidade 2 e denotada por l2. O limite máximo de velocidade na localidade l2 também é dado por ῡ.

Por simplicidade, o veículo utilizado pelo condutor continua capaz de desenvolver somente dois níveis de velocidade: υb e υa tais que υb < < υa. No entanto, agora o condutor precisa decidir qual velocidade vai desenvolver em cada localidade: v1 denota a velocidade do veículo em l1 e v2 a velocidade em l2.

Assim como na seção 2, há uma localidade na qual o Fiscal pode desempenhar uma atividade (produtiva ou de lazer) alternativa à fiscalização: l0. Mas agora, diferentemente do suposto na seção 2, suponha que o Fiscal possui dois aparelhos para aferição de velocidade (radares) e precisa decidir onde posicioná-los. A fim de preservar a hipótese de que cada radar precisa ser operado pessoalmente, suponha agora que o jogador 0 (Fiscal) é a representação de um time de dois fiscais. Neste caso, a satisfação do Fiscal definida em (8) pode ser interpretada como o interesse da sociedade no cumprimento dos limites de velocidade.

O Fiscal possui quatro possíveis posicionamentos dos dois radares: fiscalizar nenhuma localidade, p0 = (l0, l0), fiscalizar somente a localidade 1, denotado por p1 = (l0, l1), fiscalizar somente l2, denotado por p2 = (l0,l2) e fiscalizar todas as localidades, p3 = (l1,l2). Logo, seu conjunto de escolhas (não probabilísticas) possíveis é agora dado por A0 = {p0,p1,p2,p3}. O Condutor possui quatro possibilidades para a agenda de velocidade: exceder o limite em nenhuma localidade, a0 = (υb, υb), exceder o limite apenas na localidade 1, denotada por a1 = (υa, υb), exceder o limite somente em l2, denotada por a2 = (υb, υa) e exceder o limite em todas as localidades, a3 ≡ (υa, υa). Logo, seu conjunto de escolhas (não probabilísticas) possíveis é A1 = {a0, a1, a2, a3}. Portanto, o conjunto de resultados possíveis para o novo jogo possui 16 elementos e é dado por

A 0 × A 1 = { ( p i , a j ) : i { 0 , 1 , 2 , 3 } e j { 0 , 1 , 2 , 3 } } .

O nível de satisfação (payoff) de cada jogador em cada resultado possível é definido por (8), (9) e pela combinação (pi, aj), conforme apresentado na tabela a seguir:

a 0 a 1 a 2 a 3 p 0 u0(0,0,0), u1(0,0) u0(0,0,1), u1(0,1) u0(0,0,1), u1(0,1) u0(0,0,2), u1(0,2) p 1 u0(1,0,0), u1(0,0) u0(1,1,1), u1(1,1) u0(1,0,1), u1(0,1) u0(1,1,2), u1(1,2) p 2 u0(1,0,0), u1(0,0) u0(1,0,1), u1(0,1) u0(1,1,1), u1(1,1) u0(1,1,2), u1(1,2) p 3 u0(2,0,0), u1(0,0) u0(2,1,1), u1(1,1) u0(2,1,1), u1(1,1) u0(2,2,2), u1(2,2)

Os valores atribuídos a (n, m, e) para cada resultado [(li, lj), (υk, υs)] segue lógica similar àquela utilizada para descrever a matriz (10). Por exemplo, somente um radar é posicionado para aferição de velocidade quando o resultado do jogo é (p2, a1) = [(l0,l2), (υa, υb)]. Logo, o custo de oportunidade da fiscalização é incorrido somente uma vez (n = 1). Como o único radar em operação foi posicionado em l2 e o Condutor não excedeu em l2, então ocorre nenhuma autuação por excesso de velocidade (m = 0). Tendo em vista que o Condutor excedeu em l1, e somente em l1, tem-se e = 1. Usando (n,m,e) = (1,0,1) e (8), tem-se que o payoff do Fiscal sob o resultado (p2, a1) é dado por π0(p2, a1) = u0(1, 0, 1). Similarmente, o payoff do Condutor sob o resultado (p2, a1) implicado por (9) é π1(p2, a1) = u1(0,1). A justificativa para cada uma das demais células da tabela acima é análoga. Portanto, a matriz de payoffs implicada por (8) e (9) é

Condutor

(14) ( l 0 , l 0 ) Fiscal ( l 0 , l 1 ) ( l 0 , l 2 ) ( l 1 , l 2 ) Condutor ( v b , v b ) ( v b , v b ) ( v b , v b ) ( v b , v b ) ¯ 0 , 0 γ , μ γ , μ 2 γ , 2 μ ¯ α , 0 β γ , η α γ , μ β 2 γ , μ η ¯ α , 0 α γ , μ β γ , η β 2 γ , μ η ¯ 2 α , 0 β α γ , η β α γ , η 2 ( β γ ) , 2 η ¯

O padrão de atratividade neste novo jogo é consistente com o padrão estudado na seção 2. A atratividade de υa para o Condutor decorre do fato desta velocidade permitir chegar ao destino em menos tempo. O nível υb, por sua vez, é atrativo ao evitar exposição a multa por excesso de velocidade. A atividade de fiscalização é mais satisfatória para o Fiscal quando ela é efetiva: quando o Condutor excede o limite de velocidade na localidade em que o Fiscal está posicionado.

O payoff esperado do jogador k sob uma determinada previsão σ = (σ0, σ1) ∈ Δ(A0) × Δ(A1) passa a ser dado por

(15) U k ( σ 0 , σ 1 ) = i = 0 3 σ 0 ( p i ) [ j = 0 3 σ 1 ( a j ) π k ( p i , a j ) ] ,

em que o payoff obtido pelo jogador k sob o resultado (pi, aj) é denotado por πk(pi, aj) e foi apresentado em (14). A previsão σ* = (σ0*, σ1*) para o jogo (14) é um Equilíbrio de Nash (e, portanto, é uma boa previsão de comportamento) se safistaz (4) e (5) quando a função Uk(·) é definida por (15).

3.1 Previsões de comportamento

O conjunto de comportamentos probabilísticos possíveis neste novo jogo para o Fiscal e para o Condutor precisam ser reformados para acomodar a maior quantidade de alternativas disponíveis em A0 e em A1. Eles passam a ser dados por

Δ ( A 0 ) = Δ ( A 1 ) = { ( x 0 , x 1 , x 2 , x 3 ) : x i 0 para cade  i e i = 0 3 x i = 1 } ,

mas o significado de cada conjunto é distinto. Se x = (x0, x1, x2, x3), a expressão x ∈ Δ(A0) significa que x representa o comportamento do Fiscal no qual p0 é escolhido com probabilidade x0 ≥ 0, p1 é escolhido com probabilidade x1 ≥ 0, p2 é escolhido com probabilidade x2 ≥ 0 e p3 com probabilidade x3 = 1 − x0x1x2 ≥ 0. A expressão y = (y0,y1,y2,y3) ∈ Δ(A1) significa que o comportamento do Condutor é escolher a0 com probabilidade y0 ≥ 0, escolher a1 com probabilidade y1 ≥ 0, escolher a2 com probabilidade y2 ≥ 0 e escolher a3 com probabilidade y3 = 1 − y0y1y2 ≥ 0.

A notação definida a seguir, embora sofisticada, facilita a caracterização de Equilíbrios de Nash com comportamentos probabilísticos.

Notação 1. Para cada jogador i e {0,1} e cada XAi, denote por

Δ ( x ) = { σ i Δ ( A i ) : σ i ( x ) = 0 se x X }

o conjunto de medidas de probabilidade sobre At que atribuem probabilidade nula para elementos de At que não estão presentes em X.

Por exemplo, Δ(X) = Δ({a0}) = {(1, 0, 0, 0)} quando X = {a0} ⊆ A1, pois neste caso a1X, a2X e a3X. Se, por outro lado, X = {p1, p2} ⊆ A0, tem-se

Δ ( X ) = Δ ( { p 1 , p 2 } ) = { ( x 0 , x 1 , x 2 , x 3 ) Δ ( A 0 ) : x 0 = x 3 = 0 } = { ( 0 , x 1 , 1 x 1 , 0 ) : 0 x 1 1 } .

O Lema 3 apresentado no Apêndice mostra que o payoff esperado dos jogadores satisfaz as equações (16) e (17) a seguir. A variável qi(σ0) = σ0(pi) + σ0(p3) denota a probabilidade com que a localidade i ∈ {1, 2} é fiscalizada quando os jogadores se comportam de acordo com σ =0, σ1). A variável qi1) = σ1i) + σ13) denota a probabilidade com que o limite ῡ é excedido na localidade i ∈ {1,2} quando os jogadores se comportam de acordo com σ =0, σ1).

(16) U 0 ( σ 0 , σ 1 ) = α θ ( q 1 ( σ 0 ) [ q 1 ( σ 1 ) θ ] + q 2 ( σ 0 ) [ q 2 ( σ 1 ) θ ] ) + U 0 [ ( 1 , 0 , 0 , 0 ) , σ 1 ] ,
(17) U 1 ( σ 0 , σ 1 ) = μ δ ( q 1 ( σ 1 ) [ δ q 1 ( σ 0 ) ] + q 2 ( σ 1 ) [ δ q 2 ( σ 0 ) ] ) .

A equação (16) mostra que o payoff esperado do Fiscal é determinado por σ0 somente via q(σ0) = (q1(σ0), q2(σ0)) e Por σ1 somente via q(σ1) = (q1(σ1), q2(σ1)). Ainda, U0(σ0, σ1) é uma função linear de σ0, quando σ1 é mantido fixo. Similarmente, a equação (17) mostra que o payoff esperado do Condutor é determinado por σ0 somente via q(σ0) = (q1(σ0), q2(σ0)) e por σ1 somente via q(σ1) = (q1(σ1), q2(σ1)). Adicionalmente, U1(σ0, σ1) é uma função linear de σ1, para σ0 fixo.

Da equação (16), a decisão ótima do Fiscal depende das magnitudes de q1(σ1) e q2(σ1) em relação a θ. Assim como no argumento da demonstração do Lema 2, a linearidade e o padrão de monotonicidade de U0(·) podem ser usados para descrever a escolha ótima do Fiscal. Por exemplo, o Fiscal possui somente uma melhor resposta para o comportamento σ1 do Condutor se q1(σ1) < θ e q2(σ1) < θ. A única melhor resposta neste caso é escolher q1(σ0) = q2(σ0) = 0 e, portanto, p0 com probabilidade 1. Ou seja, σ0 = (1, 0, 0, 0). Para facilitar a visualização de todos os casos relevantes para o Fiscal, a Figura 1(a) apresenta o conjunto de possíveis valores para q(σ1), o quadrante [0, 1]2, como a união de quatro conjuntos: [0, 1]2 =F0F1F2F3, em que

F 0 { ( x , y ) [ 0 , 1 ] 2 : x θ e y θ } , F 1 { ( x , y ) [ 0 , 1 ] 2 : x θ e y θ } , F 2 { ( x , y ) [ 0 , 1 ] 2 : x θ e y θ } , F 3 { ( x , y ) [ 0 , 1 ] 2 : x θ e y θ } .
Figura 1
Casos relevantes para o Fiscal e para o Condutor

Nesta linguagem, o caso exemplificado acima, com q1(σ1) < θ e q2(σ1) <θ,é descrito de forma compacta como q(σ1)F0\(F1F2)={(x,y):(x,y)F0e(x,y)F1F2}

De forma similar, a decisão ótima do Condutor depende das magnitudes de q1(σ0) e q2(σ0) relação a δ. Como exemplo, segue de (17) que a3 é a única melhor resposta do Condutor para um comportamento σ0 do Fiscal tal que q1(σ1) < δ e q2(σ1) < δ, pois neste caso o ótimo é escolher q1(σ1) = q2(σ1) = 1. Ou seja, a única melhor resposta neste caso é σ1 = (0,0,0,1). Para facilitar a visualização de todos casos relevantes para o Condutor, a Figura 1(b) apresenta o conjunto de possíveis valores para q(σ0), o quadrante [0, l]2, como a união de quatro conjuntos: [0, l]2 = C0C1C2C3, em que

C 0 { ( x , y ) [ 0 , 1 ] 2 : x δ e y δ } , C 1 { ( x , y ) [ 0 , 1 ] 2 : x δ e y δ } , C 2 { ( x , y ) [ 0 , 1 ] 2 : x δ e y δ } , C 3 { ( x , y ) [ 0 , 1 ] 2 : x δ e y δ } .

Nesta linguagem, o caso exemplificado, com q1(σ0) < δ e q2(σ0) < δ, é descrito de forma compacta como q(σ0)C3\(C1C2)={(x,y):(x,y)C3e(x,y)C1C2}

A descrição de [0, l]2 como a união de Fi's e de Cj's facilita a caracterização dos conjuntos de melhor resposta do Fiscal e do Condutor: B0(σ1) e B1(σ0), respectivamente. A Tabela 1 apresenta todos os casos relevantes para o Fiscal na segunda coluna e o correspondente valor de B0(σ1) na primeira coluna. Especificamente, a segunda coluna indica o conjunto Q1 para o qual a condição q(σ1) ∈ Q1 implica o (e é implicada pelo) valor correspondente de B0(σ1) na primeira coluna. O exemplo q(σ1) ∈ F0\(F1F2) discutido acima, no qual B0(σ1) = Δ({p0}) e Q1 = F0\(F1F2), é apresentado na primeira linha das duas primeiras colunas. As colunas três e quatro da Tabela 1 apresentam todos os nove casos relevantes para a decisão do Condutor no mesmo formato. O exemplo q(σ0) ∈ C3\ (C2C1) discutido acima, no qual B1(σ0) = Δ({a3}) e Q0 = C3 \ (C2C1), é apresentado na quarta linha das duas últimas colunas.

Tabela 1
Caracterização de B01) e de B11) para o jogo (14)

A caracterização de B0(σ1) e B1(σ0) apresentada na Tabela 1 e a visualização dos respectivos conjuntos na Figura 1 são instrumentos bastante úteis para o entendimento da demonstração da Proposição 2 a seguir. Tal proposição revela que cada Equilíbrio de Nash é descrito completamente por um par (x,y) tal que 0 ≤ x ≤ min {1 − δ,δ}e 0 ≤ y ≤ min {1 − θ,θ}.

Proposição 2.A previsão σ* = (σ0*, σ1*) é uma boa previsão (Equilíbrio de Nash) para o jogo (14) se, e somente se,

(18) q ( σ 0 * ) = ( δ , δ ) e q ( σ 1 * ) = ( θ , θ )

Assim, σ* é um Equilíbrio de Nash se, e somente se,

(19) σ 0 * = ( 1 x δ , x , x , δ x ) e σ 1 * = ( 1 θ y , y , y , θ y )

para algum (x,y) tal que 0 ≤ x ≤ min {δ, 1 − δ} e 0 ≤ y ≤ min {1 − θ,θ}.

Demonstração. (⇐) Suponha que (18) é satisfeita por σ* = (σ0*, σ1*). Quer-se demonstrar que σ* é Equilíbrio de Nash. Como q(σ1*) = (θ,θ) ∈ (F0F1F2F3), então B0(σ1*) = Δ({p0, p1, p2, p3}). Como q(σ1*) = (θ,θ) ∈ (C0C1C2C3), então B1(σ0*) = Δ({α0, α1, α2, α3}). Conclui-se disto que σ0* ∈ B0*(σ1*) e σ1* ∈ B0*(σ0*) são trivialmente satisfeitas. Ou seja, σ* é Equilíbrio de Nash.

(⇒) Suponha que σ* é Equilíbrio de Nash, de forma que σ0* ∈ B0(σ0*) e σ1* ∈ B1(σ0*). Vejamos que isto requer q(σ0*) = (θ,θ). Considere inicialmente o caso em que q1(σ0*) < q2(σ0*), de forma que σ0* (p1) < σ0*(p2). Então a Figura 1 revela que q(σ0*) ∉ C2. Usando a Tabela 1, tem-se B1(σ0*) ⊆ Δ({a0, a1, a3}) e, portanto, σ1*(a2) = 0. Logo, σ1*(a2) = 0 ≤ σ1*(a1) e, com isso, q1(σ0*) ≥ q2(σ0*). Como σ0*(p2) > σ0*(p1) ≥ 0 exige que Δ({p2}) ⊆ B0(σ1*), então a Tabela 1 implica que q(σ1*) ∈ F2. Em conjunto, q(σ1*) ∈ F2 e q1(σ1*) ≥ q2(σ1*) implicam que q(σ1*) = (θ,θ) ∈ F0F1F2F3, conforme evidenciado pela Figura 1.

Para o caso em que q1(σ1*) > q2(σ0*), tem-se σ0*(p1) > σ0*(p2) e a Figura 1 revela que q(σ0*) ∉ C1. Usando a Tabela 1, tem-se B1(σ0*) ⊆ Δ({a0, a2, a3}) e, portanto, σ1*(a1) = 0. Logo, σ1*(a2) ≥ 0 = σ1*(a1) e, com isso, q1(σ1*) ≤ q2(σ1*). Como σ0* (p1) > σ0*(p2) ≥ 0 exige que Δ({p1}) ⊆ B0(σ1*), então a Tabela 1 implica que q(σ1*) ∈ F1. Em conjunto, q(σ1*) ∈ F1 e q1(σ1*) ≤ q2(σ1*) implicam que q(σ1*) = (θ,θ) ∈ F0F1F2F3, conforme evidenciado pela Figura 1.

Por fim, considere o caso em que q1(σ0*) = q2(σ0*), de forma que σ0*(p1) = σ0*(p2). Se σ0*(p2) = σ0*(p1) > 0, então Δ({p1,p2}) ⊆ B0(σ1*). Logo, a Tabela 1 exige para este caso que B0(σ0*) = Δ(A0), o que é possível somente se q(σ1*) = (θ,θ). Suponha alternativamente que σ0*(p2) = σ0*(p1) = 0. Se σ0*(p0) > 0 e σ0*(p3) > 0, então Δ({p0, p3}) ⊆ B0(σ1*). A Tabela 1 exige para este caso que B0(σ1*) = Δ(A0), o que é possível somente se q(σ1*) = (θ,θ).

O caso com σ1* = (1, 0, 0, 0) não constitui Equilíbrio de Nash, pois isto implica q(σ0*) = (0,0) ∈ C3 \ (C1C2) e, portanto, B1(σ0*) = Δ({a3}). Assim, σ1* ∈ B1(σ0*) exige que σ1* = (0, 0, 0, 1) e, com isto, q(σ1*) = (1, 1) ∈ F3 \ (F1 ∪ F2). Então, B0(σ1*) = Δ({p3}) e σ0* = (1, 0, 0, 0) ∉ B0(σ1*). O caso com σ0* = (0, 0, 0, 1) também não constitui Equilíbrio de Nash, pois isto implica q(σ0*) = (1, 1) ∈ C0 \ (C1 u C2) e, portanto, B1(σ0*) = Δ({a0}). Assim, σ1* ∈ B1(σ0*) exige que σ1* = (l, 0, 0, 0)e, com isto, q(σ1*) = (0, 0) ∈ F0 \ (F1F2). Então, B0(σ1*) = Δ({p0}) e σ0* = (0, 0, 0, 1) ∉ B0(σ1*).

Conclui-se do exposto acima que para σ* ser Equilíbrio de Nash é necessário que q(σ1*) = (θ,θ). Segue de q(σ1*) = (θ,θ) que somente σ1*(a1) = σ1*(a2) é consistente com σ* ser Equilíbrio de Nash. Se σ1*(a1) = σ1*(a2) > 0, então Δ({a1, a2}) ⊆ B1(σ0*). Logo, a Tabela 1 exige para este caso que B1(σ0*) = Δ(A1), o que é possível somente se q(σ0*) = (δ,δ). Suponha alternativamente que σ0*(a1) = σ1*(a2) = 0, de forma que σ1*(a3) = q1(σ1*) = θ > 0 e σ1*(a0) = 1 − σ1*(a3) = 1 − θ > 0. Como σ1*(a0) > 0 e σ1*(a3) > 0, então Δ({a0, a3}) ⊆ B1(σ0*). A Tabela 1 exige para este caso que B1(σ0*) = Δ(A1), o que é possível somente se q(σ0*) = (δ,δ).

A fim de subsidiar a análise sobre os efeitos da proibição de radares móveis, o Corolário a seguir registra importantes características da situação prevista para a relação entre condutores e a fiscalização quando podem ser usados somente radares móveis.

Corolário 1.Em cada Equilíbrio de Nash do jogo(14), os payoffs esperados do Condutor e do Fiscal são, respectivamente,

U 1 ( σ 0 * , σ 1 * ) = 0 e U 0 ( σ 0 * , σ 1 * ) = 2 γ θ = 2 γ α α + β .

Em cada Equilíbrio de Nash (σ0*, σ1*), o número esperado de fiscalizações é dado por E(n) = σ0* · [0, 1, 1, 2] = q1(σ0*) + q2(σ0*) = 2δ, o número esperado de excessos de velocidade é E(e)=σ1*[0,1,1,2]=q1(σ1*)+q2(σ1*)=2θ

E ( m ) = σ 0 * ( 0 0 0 0 0 1 0 1 0 0 1 1 0 1 1 2 ) ( σ 1 * ) T = σ 0 * ( 0 q 1 ( σ 1 * ) q 2 ( σ 1 * ) q 1 ( σ 1 * ) + q 2 ( σ 1 * ) ) = q 1 ( σ 0 * ) q 1 ( σ 1 * ) + q 2 ( σ 0 * ) q 2 ( σ 1 * ) ,

em que (σ0*)T denota o vetor coluna obtido ao transpor o vetor linha of.

Demonstração. De acordo com a Proposição 2, em todo equilíbrio de Nash σ* temse q(σ1*) = (θ, θ) e q(σ0*) = (δ,δ). Segue de (16) e (17) que o payoff do Condutor em cada equilíbrio é U1(σ0*, σ1*) = 0eo payoff esperado do Fiscal em cada equilíbrio é U0(σ0*,σ1*)=U0[(1,0,0,0),σ1*]=U0[(1,0,0,0),(1θy,y,y,θy)]

Ou seja, U0(σ0*,σ1*)=0(1θy)γyγy2γ(θy)=2γαα+β

Note que o payoff de equilíbrio esperado pelo Condutor é igual ao payoff que seria obtido ao não exceder o limite em todas as localidades. Como γ > 0 e θ ∈ (0,1), o payoff de equilíbrio esperado pelo Fiscal é estritamente negativo e estritamente maior do que −2γ. Portanto, ele é estritamente menor do que o payoff que seria obtido ao não fiscalizar o Condutor quando este não excede (ou seja, no resultado [(l0,l0),(υbb)]) e estritamente maior do que o payoff obtido ao não fiscalizar o Condutor quando ele sempre excede (ou seja, no resultado [(l0, l0), (υa, υa)]). Conclui-se disto que a possibilidade de violação de piora (em equilíbrio) a situação do Fiscal, sem benefício de satisfação para o Condutor quando somente radares móveis podem ser usados na fiscalização. A possibilidade deste tipo de fiscalização, no entanto, evita (em equilíbrio) que a satisfação do Fiscal seja reduzida até −2γ.

4. O modelo para radares fixos

Considere novamente o modelo estudado na seção 3, mas agora suponha que o Fiscal é obrigado a informar antecipadamente ao Condutor a localização dos dois radares. Tal situação pode ser vista como um modelo para a relação estratégica implicada pela proibição de utilização de radares móveis. Somente radares fixos são usados nesta situação e o posicionamento deles é previamente informado ao condutor ou descoberto por este em período anterior. A árvore de decisão na Figura 2 ilustra de maneira bastante conveniente (na forma extensiva) a nova situação estratégica na qual estão envolvidos o Fiscal (jogador 0) e o Condutor (jogador 1).

A Figura 2 indica que o Fiscal é o primeiro jogador a se mover no jogo. As mesmas quatro opções de posicionamento continuam disponíveis: p0, p1, p2 e p3.

Figura 2
Fiscalização via radares fixos

Não há novas opções de posicionamento e, portanto, o conjunto de ações possíveis é ainda dado por A0 = {p0, p1, p2, p3}. O Condutor joga em seguida, logo após observar a escolha de posicionamento do Fiscal. As mesmas quatro opções de agenda de velocidade continuam disponíveis: a0, a1 a2 e a3. Não há novas opções de agenda e, portanto, o conjunto de ações possíveis é ainda dado por A1 = {a0, a1, a2, a3}. Mas agora é necessário escolher uma agenda para cada uma das quatro situações nas quais o Condutor pode ser convocado a jogar: (i) após a escolha de p0; (ii) após a escolha de p1; (iii) após a escolha de p2; e (iv) após a escolha de p3.

Em situações nas quais o jogador é convocado a jogar em mais de uma contingência, como a situação do Condutor aqui considerada, o conceito de ação é insuficiente para descrever seu comportamento. Nestes casos, o comportamento é descrito por uma função, a qual é frequentemente denominada estratégia. Por exemplo, uma possível estratégia para o Condutor no jogo apresentado na Figura 2 é a função s tal que s(p0) = a0, s(p1) = a3 e s(p2) = s(p3) = a2. Esta estratégia (função) é mais compactamente representada por s = (a0, a3, a2, a2) e descreve a escolha da ação a0 após o Condutor observar o Fiscal escolher p0, ação a3 após observar escolha p1 e ação a2 após observar p2 ou p3. Como o Fiscal é convocado a jogar somente uma vez, seu comportamento (sua estratégia) pode ser descrito com ações. Ou seja, no caso do Fiscal (assim como de ambos os jogadores nos jogos das seções 2 e 3), estratégia e ação são conceitos equivalentes.

A necessidade de o Condutor escolher uma dentre quatro agendas (a0, a1, a2 e a3) para cada um dos quatro possíveis posicionamentos do Fiscal (p0, p1, p2 e p3) faz com que o número de comportamentos não probabilísticos (denominados estratégias puras) do Condutor seja dado por 44 = 256. Ou seja, o conjunto de estratégias puras disponíveis para o Condutor,

S 1 { ( s 0 , s 1 , s 2 , s 3 ) : s i { a 0 , a 1 , a 2 , a 3 } para cada  i { 0 , 1 , 2 , 3 } } ,

possui 256 elementos. Como o Fiscal ainda possui quatro possíveis comportamentos não probabilísticos (4 estratégias puras: S0 ≡ A0 = {p0, p1, p2, p3, }), então há 1.024 possíveis previsões de comportamento não probabilístico. Tal nível de complexidade diminui a utilidade da representação do jogo na Forma Normal, a qual foi utilizada nas seções 2 e 3.

Tendo em vista que a escolha do Condutor pode não ser independente da escolha do Fiscal na formulação dinâmica do jogo de fiscalização, o payoff esperado neste caso não pode ser calculado segundo (15). A definição de payoff esperado em (15) utiliza a hipótese de independência entre as distribuições de probabilidade Σ0 e Σ1, a qual é aceitável quando as escolhas são simultâneas. Quando a hipótese de independência não necessariamente é satisfeita, a definição (15) para cada Σ ∈ Δ(A0 × A1) precisa ser generalizada para

(20) U k ( σ ) = i = 0 3 j = 0 3 σ ( p i , a j ) π k ( p i , a j ) = i = 0 3 j = 0 3 σ 0 ( p i ) σ 1 ( a j | p i ) π k ( p i , a j ) ,

em que a probabilidade condicional σ1(σj\pj) denota a probabilidade com que o Condutor escolhe a ação a,-, condicional a ter observado a escolha do Fiscal pi.

4.1 Previsões de comportamento

O conceito de Equilíbrio de Nash foi utilizado nas seções 2 e 3 como um bom critério para avaliar a razoabilidade de uma dada previsão de comportamento para os jogos estudados nestas seções. Especificamente, a previsão Σ* = (σ0*, σ1*) foi considerada boa se, e somente se, σ0* ∈ B0(σ1*) e σ1* ∈ B1(σ0*). Ou seja, se e somente se σ0* é uma melhor resposta do Fiscal para a conjectura σ1* que este faz sobre o comportamento do Condutor e σ1* é uma melhor resposta do Condutor para a conjectura σ0* que este faz sobre o comportamento do Fiscal.

Em contextos dinâmicos, no entanto, o conceito de Equilíbrio de Nash é frequentemente considerado insuficiente para qualificar uma previsão como boa. Nem toda conjectura utilizada pelos jogadores em um Equilíbrio de Nash de um jogo dinâmico é considerada razoável, no sentido de que não é razoável esperar que os jogadores as considerariam relevantes ao decidir seu comportamento. O jogo dinâmico apresentado a seguir é um exemplo simples que ilustra tal ponto.

Exemplo 2. Considere o jogo descrito na Figura 3. A representação na forma extensiva é apresentada no lado esquerdo e a representação na forma normal está no lado direito.

Conforme indicado na representação extensiva do jogo, o jogador 1 é o primeiro a jogar e escolhe entre as opções L e R. O jogador 2 joga em seguida, após observar a escolha do jogador 1. Se observar a escolha L, o jogador 2 precisa decidir entre as opções L e B. Se observar a escolha R, precisa decidir entre as opções R e B. Assim, o jogador 1 possui duas estratégias possíveis (L e R) e o jogador 2 possui quatro estratégias possíveis: (i) jogar L após observar L e jogar R após observar R, denotada por (L, R); (ii) jogar L após L e jogar B após R, denotada por (L, B); (iii) B após L e R após R, com notação (B, R); e (iv) sempre jogar B, denotada por (B, B).

Figura 3
Ilustração simplificada de Perfeição em Subjogos

Há três equilíbrios de Nash em estratégias puras neste jogo: s* = (s1*,s2*) = [L, (L,R)]; s* = [R, (L,B)]; e s* = [R, (B,B)]. No entanto, observe que somente o equilíbrio [R, (L,B)] é construído usando conjecturas razoáveis. A conjectura (L,R) utilizada pelo jogador 1 na construção do equilíbrio [L, (L, R)] não é defensável, pois o jogador 1 antecipa que o jogador 2 sempre escolherá B após observar R: neste caso, ele recebe payoff 1 jogando B e payoff 0 jogando R. Similarmente, a conjectura (B, B) utilizada pelo jogador 1 na construção do equilíbrio [R, (B, B)] não é defensável, pois o jogador 1 antecipa que o jogador 2 sempre escolherá L após observar L: neste caso, ele recebe payoff 1 jogando L e payoff 0 jogando B.

O critério utilizado para descartar os Equilíbrios de Nash [L, (L, R)] e [R, (B, B)] no jogo do Exemplo 2 é usualmente denominado Perfeição em Subjogos. Mais geralmente, uma dada previsão para um jogo dinâmico é considerada uma boa previsão (um Equilíbrio Perfeito em Subjogos) se ela é um Equilíbrio de Nash do jogo e se ela define Equilíbrios de Nash em cada um dos subjogos. Um subjogo é um jogo dentro do jogo principal. No jogo ilustrado no Exemplo 2 há dois subjogos, cada um deles começando quando o jogador 2 é chamado a jogar. Somente o jogador 2 participa destes subjogos e, portanto, os Equilíbrios de Nash do subjogo são dados pelas melhores respostas deste jogador neste subjogo. Como, por definição, todo Equilíbrio Perfeito em Subjogos é um Equilíbrio de Nash, equilíbrios com perfeição em subjogos são usualmente denominados Equilíbrios de Nash Perfeitos em Subjogos.

A definição de boa previsão de comportamento para jogos dinâmicos descrita acima pode ser usada para estudar a situação estratégica apresentada na Figura 2. No subjogo que se inicia após o Fiscal se posicionar em p0 = (l0, l0), o Condutor possui somente uma melhor resposta: a3 = (υa, υa). No subjogo que se inicia após o Fiscal se posicionar em p1 = (l0, l1), visto que μ > 0, o Condutor possui somente uma melhor resposta: a2 = (υb, υa). No subjogo que se inicia após o Fiscal se posicionar em p2 = (l0, l2), o Condutor possui somente uma melhor resposta: a1 = (υa, υb). No subjogo que se inicia após o Fiscal se posicionar em p3 = (l1, l2), o Condutor possui somente uma melhor resposta: a0 = (υb, υb). Portanto, a única conjectura relevante para o Fiscal sobre o comportamento do Condutor é s1* = (a3, a2, a1, a0). Sob tal conjectura, o conjunto de melhores respostas do Fiscal é dado por

(21) B 0 ( s 1 * ) = B 0 [ ( a 3 , a 2 , a 1 , a 0 ) ] = { Δ ( { ( l 1 , l 2 ) } ) , se α < γ ; Δ ( { ( l 0 , l 0 ) } ) , se α > γ ; Δ ( { p 0 , p 1 , p 2 , p 3 } ) se α = γ .

Segue disto que as boas previsões sobre o comportamento dos jogadores (os Equilíbrios de Nash Perfeitos em Subjogos) do jogo apresentado na Figura 2 dependem da magnitude de α e de γ. Se o custo de oportunidade da fiscalização (α) é menor do que o custo imposto ao Fiscal pelo excesso de velocidade (γ), então s0* ∈ B0(s1*) implica que o Fiscal fiscalizará as duas localidades: s0* = (l1,l2). Por outro lado, se o custo de oportunidade da fiscalização (α) é maior do que o custo imposto ao Fiscal pelo excesso de velocidade (γ), então s0* ∈ B0(s1*) implica que o Fiscal fiscalizará nenhuma das duas localidades: s0* = (l0, l0). Quando o custo de oportunidade α é exatamente igual ao custo γ, o Fiscal está indiferente entre todos os posicionamentos: B0(s1*) = Δ(A0). Neste caso todo posicionamento (seja ele probabilístico ou não) é uma boa previsão para o comportamento do Fiscal. A Proposição 3 a seguir formaliza o resultado assim obtido.

Proposição 3.Suponha que γ < α. Então, s* = (s0*, s1*) é uma boa previsão (Equilíbrio de Nash Perfeito em Subjogos) para o jogo dinâmico apresentado na Figura 2 se, e somente se,

( s 0 * , s 1 * ) = [ ( l 0 , l 0 ) , [ ( υ a , υ a ) , ( υ b , υ a ) , ( υ a , υ b ) , ( υ b , υ b ) ] ] .

Suponha que γ > α. Então, s* é um Equilíbrio de Nash Perfeito em Subjogos para o jogo apresentado na Figura 2 se, e somente se,

( s 0 * , s 1 * ) = [ ( l 1 , l 2 ) , [ ( υ a , υ a ) , ( υ b , υ a ) , ( υ a , υ b ) , ( υ b , υ b ) ] ] .

Por fim, suponha γ = α. Então, s* é uma boa previsão para o jogo apresentado na Figura 2 se, e somente se,

( s 0 * , s 1 * ) = [ ( x , y , z , 1 x y z ) , [ ( υ a , υ a ) , ( υ b , υ a ) , ( υ a , υ b ) , ( υ b , υ b ) ] ] ,

para alguma tripla (x,y,z) tal que x + y + z ≤ 1, x ≥ 0, y ≥ 0 e z ≥ 0.

A previsão de resultado para o jogo dinâmico quando α < y é o Fiscal verificar a velocidade nas duas localidades e o Condutor respeitar o limite nas duas localidades: ou seja, o resultado o = [(l1, l2), (υb, υb)]. Quando α > γ, a previsão de resultado é o Fiscal verificar a velocidade em nenhuma das localidades e o Condutor desrespeitar em todas as localidades: ou seja, o = [(l0, l0), (υa, υa)]. Se α = γ, o Fiscal se comporta de acordo com Σ0* = (x, y, z, 1 − x − y − z) e, portanto, a previsão de resultado é [(l0, l0), (υa, υa)] acontecer com probabilidade x, do resultado [(l0, l1), (υb, υa)] acontecer com probabilidade y, [(l0, l2), (υa, υb)] com probabilidade z e [(l1,l2), (υb, υb)] com probabilidade (1 − xyz).

O payoff esperado previsto para os jogadores também depende das magnitudes de α e γ. Quando α < γ, é previsto acontecer o resultado o = [(l1, Z2), (υb, υb)] com probabilidade 1 e, portanto, a Figura 2 implica que o payoff previsto é −2α para o Fiscal e 0 para o Condutor. Caso α > γ, é previsto acontecer o resultado o = [(l0, l0), (υa, υa)] com probabilidade 1 e, portanto, o payoff previsto é −2γ para o Fiscal e 2Μ, para o Condutor. No caso de α = γ, em que o Fiscal se comporta de acordo com Σ0* = (x,y,z, 1 − x − y − z), o payoff previsto para o Fiscal é −2α = −(α + β) = −2γ e o payoff esperado previsto para o Condutor é

x π 1 ( p 0 , a 3 ) + y π 1 ( p 1 , a 2 ) + z π 1 ( p 2 , a 1 ) + ( 1 x y z ) π 1 ( p 3 , a 0 ) = 2 μ x + μ y + μ z + 0 ( 1 x y z ) = μ ( 2 x + y + z ) .

um valor não negativo e não maior do que 2μ.

O número esperado de fiscalizações é igual a2 se α < γ e é dado por zero se α > γ. Tal número é incerto quando α = γ, pois ele se iguala 2(1 − x) − y − z quando o comportamento do Fiscal é σ1* = (x,y,z, 1 − x − y − z). Pode tanto chegar ao valor de 2, quando x = y = z = 0, quanto se igualar a zero, quando x = 1. Em todos os casos, não há arrecadação de multas, pois os condutores nunca são multados.

5. A escolha entre radares fixos e móveis

Considere agora a situação na qual o Fiscal possui a capacidade de fiscalizar cada uma das duas localidades (l1 e l2) tanto com radares móveis quanto com radares fixos. Para cada localidade, a fiscalização por meio de um radar móvel (portátil) é representada por rp, a fiscalização por radar fixo é representado por rf e o posicionamento de nenhum radar é denotado por rn. Como há duas localidades, a escolha do Fiscal pode ser representada por um par r = (r1, r2) ∈ R, em que

R = { r n , r p , r f } × { r n , r p , r f } = { ( r n , r n ) , ( r n , r p ) , ( r n , r f ) , ( r p , r n ) , ( r p , r p ) , ( r p , r f ) , ( r f , r n ) , ( r f , r p ) , ( r f , r f ) } .

é o conjunto de ações possíveis para o Fiscal. Por exemplo, r = (rp,rf) denota a situação na qual o Fiscal posicionou um radar portátil em l1 e um radar fixo em l2.

Assim como no modelo da seção 4, a utilização ou não de radares fixos e o posicionamento destes na rodovia são informados previamente ao Condutor. No modelo desta seção, no entanto, esta informação prévia não é suficiente para o Condutor concluir que não há fiscalização nas localidades em que não há radar fixo. Formalmente, o Condutor é capaz de observar previamente quatro diferentes tipos de informação: i0, i1, i2, i3. Ao observar i0, o Condutor é informado de que o Fiscal escolheu não utilizar radares fixos (ou seja, de que r ∈ {(rn, rn), (rn, rp), (rp, rn), (rp, rp)}). Após observar i1 o Condutor sabe que o Fiscal escolheu usar radar fixo somente em l1 (ou seja, que r ∈ {(rf, rn), (rnf, rp)}). A informação i2 diz que o Fiscal escolheu usar radar fixo somente em l2 (ou seja, que r e {(rn, rf), (rp, rf)}). Por fim, ao observar i3, o Condutor descobre que o Fiscal escolheu usar radar fixo em todas as localidades (ou seja, que r = (rf, rf)).

A árvore de decisão apresentada na Figura 4 ilustra de maneira bastante conveniente (na forma extensiva) a nova situação estratégica na qual estão envolvidos o Fiscal (jogador 0) e o Condutor (jogador 1). O jogador 0 (Fiscal) inicia o jogo escolhendo o padrão de fiscalização com radares fixos: usar nenhum radar fixo (i0), fiscalizar com radar fixo somente em l1 (padrão denotado por i1), fiscalizar com radar fixo somente em l2 (padrão denotado por i2) e fiscalizar com radar fixo em todas as localidades (i3). Quando o padrão escolhido para a fiscalização com radares fixos é i3, o Condutor observa a presença de radares fixos em todas as localidades e, em seguida, escolhe sua agenda de velocidade: a0, a1, a2 ou a3. Sob os demais padrões de fiscalização com radares fixos (i0, i1 e i2), o Fiscal joga novamente escolhendo o padrão de fiscalização com radares móveis (portáteis) para as localidades sem radar fixo. Como o Condutor não é informado previamente sobre o posicionamento dos eventuais radares portáteis, sua escolha de agenda de velocidade nestes demais casos é feita de maneira simultânea com a escolha de posicionamento dos radares portáteis.

A simultaneidade da escolha de agenda de velocidade com a escolha de posicionamento de radares móveis é representada na Figura 4 pelas linhas pontilhadas conectando nós de decisão da árvore. Por exemplo, para indicar que o Condutor não sabe a escolha que o Fiscal fez entre (rf, rn) e (rf, rp) após escolher i1, os dois nós de decisão do Condutor que são consequência de (rf, rn) e (rf, rp) estão conectados por linhas pontilhadas.

Os conjuntos de nós de decisão conectados por linhas pontilhadas na representação do jogo na Forma Extensiva são usualmente denominados como conjunto de informação. Nesta linguagem, o conjunto de informação do Condutor após ix indica que, quando o Condutor é convocado a jogar após observar i1, ele não sabe se ele foi convocado a jogar no nó de decisão consequente a escolha (rf, rn) ou no nó de decisão implicado pela escolha (rf, rp).

Analogamente, o conjunto de informação do Condutor após i2 indica que, quando o Condutor é convocado a jogar após observar i2, ele não sabe se foi convocado a jogar no nó de decisão consequência de (rn, rf) ou no nó de decisão implicado por (rp, rf). Já o conjunto de informação do Condutor após observar i0 é mais complexo, pois envolve quatro nós de decisão. Tal conjunto de informação indica que, quando o Condutor é convocado a jogar após observar i0, ele não sabe em qual nó de decisão foi convocado a jogar: naquele consequente a (rn, rn), naquele implicado por (rp, rn), naquele após (rn, rp) ou no nó de decisão implicado por (rp, rp).

Figura 4
Fiscalização via radares fixos e portáteis

O jogo apresentado na Figura 4 é um jogo dinâmico de dois estágios e possui quatro subjogos. Há um subjogo trivial após i3, no qual somente o Condutor joga. Os demais três subjogos são jogos simultâneos entre o Fiscal e o Condutor. Por conveniência, todos os subjogos são apresentados na Figura 5 representados na Forma Normal.

O Equilíbrio de Nash no subjogo após i3 é trivialmente dado por [(rf, rf), (υb, υb)] e confere ao Fiscal o nível de payoff −2α e ao Condutor payoff nulo. Os equilíbrios de Nash do subjogo após i0 podem ser obtidos utilizando a Proposição 2, ao notar que a matriz de payoffs da Figura 5(d) coincide com (14). A Proposição 2 estabelece que em todo equilíbrio de Nash de (14) o Fiscal escolhe fiscalizar cada localidade com probabilidade δ e o Condutor escolhe exceder em cada localidade com probabilidade θ. Então, a coincidência dos payoffs da Figura 5(d) com aqueles em (14) permite concluir que, em todo equilíbrio de Nash do subjogo após i0, o Fiscal posiciona um radar portátil em cada localidade com probabilidade δ e o Condutor excede em cada localidade com probabilidade θ. Como consequência, o subjogo após i0 possui como equilíbrio de Nash somente as previsões σ0 = (σ00, σ10) tais que

σ 0 0 = [ σ 0 0 ( r n , r n ) , σ 0 0 ( r p , r n ) , σ 0 0 ( r n , r p ) , σ 0 0 ( r p , r p ) ] = ( 1 x δ , x , x , δ x )
σ 1 0 = [ σ 1 0 ( a 0 ) , σ 1 0 ( a 1 ) , σ 1 0 ( a 2 ) , σ 1 0 ( a 3 ) ] = ( 1 θ y , y , y , θ y ) .

para algum (x,y) tal que 0 ≤ x ≤ min {δ,1 − δ} e 0 ≤ y ≤ min {1 − θ,θ}. Conforme documentado no Corolário 1, o payoff esperado do Fiscal em cada um destes equilíbrios é dado por −2γθ. Já o payoff esperado do Condutor em todo equilíbrio deste subjogo é nulo.

Para o cálculo do(s) equilíbrio(s) de Nash no subjogo após i2, observe que o payoff que o Condutor obtém escolhendo a0 é estritamente maior do que aquele obtido escolhendo a2, independentemente da escolha do Fiscal. Neste caso, a estratégia “jogar a2 com probabilidade 1” é dita estratégia estritamente dominada pela estratégia “jogar a0 com probabilidade 1”. Com base neste fato e na propriedade destacada na Observação 1,10 10 Para mais detalhes sobre tal propriedade, ver Gibbons (1992). a estratégia “jogar a2 com probabilidade 1” pode ser ignorada no cálculo do(s) equilíbrio(s) de Nash no subjogo após i2. Na verdade, toda estratégia do Condutor que atribui probabilidade estritamente positiva para a2 pode ser ignorada neste cálculo, pois cada uma de tais estratégias é estritamente dominada pela estratégia obtida ao transferir para a ação a0 a probabilidade atribuída a a2. Na prática, esta última observação estabelece que a terceira coluna da Figura 5(b) pode ser ignorada pelo cálculo do(s) equilíbrio(s) de Nash no subjogo após i2.

Figura 5
Representação na Forma Normal de cada subjogo da Figura 4

Observação 1. Como toda estratégia componente de Equilíbrio de Nash precisa ser melhor resposta para a estratégia dos demais jogadores e estratégias estritamente dominadas nunca são melhor resposta, então nenhuma estratégia estritamente dominada pode compor equilíbrios de Nash.

Por razão similar, a quarta coluna da Figura 5(b) pode ser ignorada pelo cálculo do(s) equilíbrio(s) de Nash no subjogo após i2, pois o payoff que o Condutor obtém escolhendo a1 é estritamente maior do que aquele obtido escolhendo a3, independentemente da escolha do Fiscal. A matriz de payoffs obtida ao ignorar as colunas três e quatro da Figura 5(b) é apresentada a seguir.

(22) Condutor a 0 a 1 ¯ F i s c a l ( r n , r f ) α , 0 α γ , μ ¯ ( r n , r f ) 2 α , 0 β α γ , η ¯

Agora observe que o custo de oportunidade do radar fixo pode ser ignorado no cálculo de equilíbrios de Nash de (22), uma vez que ele não afeta o diferencial de payoff entre as escolhas (rn, rf) e (rp, rf). Tal propriedade permite somar a no payoff do Fiscal em cada resultado possível de (22) sem alterar o conjunto de equilíbrios de Nash. Esta modificação da matriz (22), no entanto, resulta nos mesmos pares de payoffs apresentados em (11). Como a Proposição 1 estabelece que no único Equilíbrio de Nash de (11) o Condutor escolhe a segunda coluna com probabilidade θ e o Fiscal escolhe a segunda linha com probabilidade 5, então pode-se concluir que (22) possui um único Equilíbrio de Nash e que neste equilíbrio o Fiscal escolhe (rp, rf) com probabilidade δ e o Condutor escolhe a1 = (υa, υb) com probabilidade θ. Como consequência, o subjogo após i2 possui como equilíbrio de Nash somente σ2 = (σ02, σ12) tal que σ02 = [σ02(rn, rf), σ02(rp, rf) = (1 – δ, δ) e σ12 = [σ12(a0), σ12(a1), σ12(a2), σ12(a3)] = 1 – θ, θ, 0, 0). O payoff esperado do Fiscal neste equilíbrio pode ser obtido subtraindo o custo de oportunidade do radar fixo (α) de (12): ele é dado por − γθ − α = −θ(γ + α + β). Já o payoff esperado do Condutor neste equilíbrio é novamente nulo, pois ele coincide com (13).

O cálculo do(s) equilíbrio(s) de Nash no subjogo após ix utiliza argumentação análoga. As colunas segunda e quarta podem ser ignoradas pelo cálculo, pois a estratégia pura a1 é estritamente dominada por a0 e a estratégia pura a3 é estritamente dominada por a2. A matriz resultante da Figura 5(c) após ignorar as colunas dois e quatro e somar α no payoff do Fiscal nas colunas um e três coincide com a matriz de payoffs (11). Assim, o subjogo após i1 possui como equilíbrio de Nash somente σ1 = (σ01, σ11) tal que σ01 = [σ01(rf, rn), σ01(rf, rp)] = (1 – δ, δ) e σ11 = [σ11(a0), σ11(a1), σ11(a2), σ11(a3)] = (1 – θ, 0, θ, θ). Novamente, o payoff esperado do Fiscal neste equilíbrio pode ser obtido subtraindo α de (12) para obter −γθ − α = −θ(γ + α + β) e o payoff esperado do Condutor é nulo, pois coincide com (13).

A discussão acima mostra que em todo equilíbrio de Nash de todos os subjogos, o payoff esperado do Condutor é nulo. O payoff esperado do Fiscal é −2α no equilíbrio de Nash do subjogo após i3 e se iguala a −θ(γ + α + β) em todos os equilíbrios de Nash dos subjogos implicados por ix e í2. Nos equilíbrios de Nash do subjogo após i0, o payoff esperado do Fiscal é dado por −2θγ. Antecipando tais níveis de satisfação em cada subjogo, o Fiscal escolhe o padrão de fiscalização com radares fixos s0 ∈ {i0,i1,i2,i3} para maximizar seu payoff esperado. Por exemplo, ele escolhe i0 quando γ < α + β, pois neste caso −2θγ > −2α e −2θγ > −θ(γ + α + β). Por outro lado, o Fiscal escolhe i3 se γ > α + β, pois neste caso −2α > −2θγ e −2α > −θ(γ + a + β). No caso em que γ = a + β, o Fiscal está indiferente entre todos os padrões de fiscalização com radares fixos. A Proposição 4 reúne os resultados obtidos até aqui.

Proposição 4. A previsão σ = [ ( s 0 , σ 0 0 , σ 0 1 , σ 0 2 ) , ( σ 1 0 , σ 1 1 , σ 1 2 , σ 1 3 ) ] para o jogo apresentado na Figura 4 é equilíbrio de Nash perfeito em subjogos se, e somente se, s 0 satisfaz

s 0 { { i 0 } , s e γ < α + β , { i 0 , i 1 , i 2 , i 3 } , s e γ = α + β , { i 3 } , s e γ > α + β ,

ao mesmo tempo em que σ 0 = ( σ 0 0 , σ 0 1 , σ 0 2 ) e σ 1 = ( σ 1 0 , σ 1 1 , σ 1 2 , σ 1 3 ) satisfazem

σ 1 3 = [ σ 1 3 ( a 0 ) , σ 1 3 ( a 1 ) , σ 1 3 ( a 2 ) , σ 1 3 ( a 3 ) ] = ( 1 , 0 , 0 , 0 ) ; { σ 0 2 = [ σ 0 2 ( r n , r f ) , σ 0 2 ( r p , r f ) ] = ( 1 δ , δ ) , σ 1 2 = [ σ 1 2 ( a 0 ) , σ 1 2 ( a 1 ) , σ 1 2 ( a 2 ) , σ 1 2 ( a 3 ) ] = ( 1 θ , θ , 0 , 0 ) ; { σ 0 1 = [ σ 0 1 ( r f , r n ) , σ 0 1 ( r f , r p ) ] = ( 1 δ , δ ) , σ 1 1 = [ σ 1 1 ( a 0 ) , σ 1 1 ( a 1 ) , σ 1 1 ( a 2 ) , σ 1 1 ( a 3 ) ] = ( 1 θ , 0 , θ , 0 ) ;

e

{ σ 0 0 = [ σ 0 0 ( r n , r n ) , σ 0 0 ( r p , r n ) , σ 0 0 ( r n , r p ) , σ 0 0 ( r p , r p ) ] = ( 1 x δ , x , x , δ x ) , σ 1 0 = [ σ 1 2 ( a 0 ) , σ 1 2 ( a 1 ) , σ 1 2 ( a 2 ) , σ 1 2 ( a 3 ) ] = ( 1 θ y , y , y , θ y ) ;

para algum (x,y) tal que 0 ≤ x ≤ min {δ, 1 − δ} e 0 ≤ y ≤ min {1 − θ,θ}.

O resultado de equilíbrio com perfeição em subjogos quando γ > α+β é o Fiscal escolher usar radares fixos em todas as localidades (s0 = i3) e o Condutor respeitar o limite em todas as localidades (σ13 = (1, 0, 0, 0)). O resultado de equilíbrio com perfeição em subjogos quando γ < α + β é o Fiscal escolher não usar radares fixos (s0 = i0) e fiscalizar cada localidade usando radares portáteis com probabilidade δ (pois (pois σ00 = (1 – x δ, x, x, δ – x) para algum x tal que 0 ≤ x ≤ min {δ, 1 − δ}), enquanto o Condutor excede o limite em cada a localidade com probabilidade θ (pois, (pois σ01 = (1 – θ, – y, y, y, θ – y) para algum y tal que 0 ≤ y ≤ min {1 − θ,θ}).

O payoff esperado do Fiscal é igual a max {−2α, −2γθ}: ele é dado por −2α quando γ > α + β e por −2γθ = −2γα/(α + β) quando γα + β. Já o payoff esperado do Condutor é sempre nulo. O número esperado de fiscalizações é igual a 2 quando γ > α + β, todas elas utilizando radar fixo, e se iguala a 2δ quando γ < α + β, todas elas usando radar móvel. Quando γ = α + β, são indeterminados a quantidade esperada de fiscalizações (podendo assumir qualquer valor entre 2δ e 2) e o formato de fiscalização (qualquer combinação de radares fixos e móveis é possível). O conceito de boa previsão aqui utilizado não é capaz de determinar estas variáveis neste caso. Não há excessos de velocidade quando γ > α + β, mas a quantidade esperada de excessos de velocidade é dada por 2θ quando γ < α + β. Não há autuações (multas) quando γ > α + β, mas a quantidade esperada de multas é dada por 205 quando γ < α + β. Estas informações são apresentadas de forma mais conveniente na Tabela 2 para os três principais casos analisados.

5.1 Os efeitos da proibição

Na linguagem estabelecida pelo modelo aqui desenvolvido, a proibição do uso de radares móveis — com a manutenção da opção de fiscalização com radares fixos — determina que a situação estratégica entre a fiscalização e os condutores é dada pelo jogo dinâmico apresentado na seção 4. A situação estratégica inicial, na qual existe a possibilidade de utilização concomitante de radares fixos e radares móveis, é dada pelo jogo dinâmico da seção 5. Portanto, a comparação entre as previsões de equilíbrio para os modelos destas seções evidencia os efeitos previstos para tal proibição. A Tabela 2 a seguir apresenta uma seleção de variáveis de interesse.

Tabela 2
Efeitos da proibição de radares móveis sobre a previsão σ* = (Σ0*, Σ1*)

A Tabela 2 apresenta o valor previsto (de equilíbrio) para cinco variáveis: o payoff de cada jogador, a quantidade de fiscalizações esperadas, o número de multas esperado e o número esperado de violações do limite v. Tais valores são apresentados para três casos distintos, definidos de acordo com a relevância relativa dos excessos de velocidade na satisfação da sociedade (γ): o primeiro caso é definido por γ ∈ (0, α), o segundo por γ ∈ (α, α + β) e o terceiro por γ ∈ (α + β, ∞).

Observe que a proibição possui nenhum efeito sobre o equilíbrio no terceiro caso, quando o γ é suficientemente alto. Neste caso, o elevado impacto dos excessos de velocidade na satisfação da sociedade motiva o uso de somente radares fixos como forma de eliminar qualquer violação de D, independentemente da disponibilidade ou não de radares móveis para a fiscalização. Assim, a proibição não afeta os dois jogadores.

Para valores intermediários de γ, a proibição não afeta a satisfação esperada do Condutor, mas reduz o payoff esperado do Fiscal. Antes da proibição, o Fiscal prefere utilizar somente radares móveis e, desta forma, impede o Condutor de auferir satisfação esperada positiva. Em resposta, o melhor que o Condutor pode fazer nesta situação lhe confere payoff esperado nulo.11 11 Note que o Condutor é sempre capaz de assegurar payoff nulo escolhendo não exceder ῡ nas duas localidades. Ainda, o Fiscal é sempre capaz de impedir satisfação positiva para o Condutor por meio da utilização de radares fixos em todas as localidades. Logo, a proibição neste caso impede o Fiscal de adotar sua estratégia preferida. Como segunda melhor opção, o Fiscal opta por intensificar a fiscalização ao instalar radares fixos em todas as localidades: o número esperado de fiscalizações se eleva de 2δ para 2, o que motiva a interrupção de excessos de velocidade e, portanto, de autuações. Observe que a atratividade em manter a fiscalização após a proibição se deve ao ainda relevante custo de satisfação imposto pelos excessos de velocidade — quando comparado ao custo de fiscalização α.

Quando o custo γ é suficientemente baixo, por outro lado, a proibição do uso de radares móveis elimina por completo a fiscalização de velocidade. O número esperado de fiscalizações cai de 2δ para zero, o que motiva a elevação dos excessos de velocidade de 2θ para 2. Como não ocorre fiscalização, este aumento de excessos não se reflete em aumento de autuações: o número esperado de autuações se reduz de 2θδ para zero. Assim como no caso de custo γ intermediário, a satisfação esperada do Fiscal é novamente reduzida pela proibição e pelo mesmo motivo: ela impede o Fiscal de utilizar seu instrumento de fiscalização preferido. A segunda melhor opção para o Fiscal quando γ é baixo, no entanto, é arrefecer a fiscalização. A atratividade em interromper a fiscalização após a proibição se deve a baixa relevância do custo de satisfação imposto pelos excessos de velocidade — quando comparado ao agora relevante custo de fiscalização α.

A interrupção de fiscalização prevista para o caso com γ baixo, e consequentes aumento de excessos e redução de multas, confere ao Condutor um aumento de satisfação esperada de 2Μ unidades. Como esta é a única situação para a qual o modelo prevê elevação na satisfação dos condutores e a proibição foi interpretada neste trabalho como motivada em atender o interesse de uma parte dos condutoreseleitores, as previsões apresentadas pela Tabela 2 para o caso γ ∈ (0, α) podem ser vistas como a previsão do atual modelo para a política pública adotada no Brasil a partir de agosto de 2019.

A previsão de completa eliminação de fiscalização após a proibição é consequência da hipótese simplificadora de que todas as localidades são idênticas. Com isto, não é útil interpretá-la de forma literal. Presumivelmente, uma extensão deste modelo para o caso com heterogeneidade entre as localidades geraria previsões menos extremas. Por exemplo, poder-se-ia reconhecer no modelo que o excesso de velocidade afeta a probabilidade e severidade de acidentes de maneira distinta em localidades distintas. Esta heterogeneidade poderia ser modelada admitindo que o excesso de velocidade afeta a sociedade de maneira distinta a depender da localidade na qual foi violado. Ou seja, poderia ser modelada atribuindo γ's distintos para localidades distintas. Com base nos dois primeiros casos da Tabela 2, espera-se que a coexistência de localidades pouco perigosas (γ baixo) com localidades muito perigosas (γ alto) motive o Fiscal a responder a proibição intensificando a fiscalização nas localidades mais perigosas e arrefecendo-a nas localidades mais seguras.

Assim, a previsão do modelo desenvolvido neste trabalho para os efeitos da proibição de radares móveis pode ser interpretada como uma previsão de intensificação no uso de radares fixos nas localidades mais perigosas e abandono de fiscalização naquelas mais seguras.

6. Considerações Finais

O ferramental usual de Teoria dos Jogos se mostrou bastante versátil para analisar a proibição de radares móveis que vigorou no Brasil em 2019 entre meados de agosto e meados de dezembro. A consideração nesta análise da dimensão estratégica entre o Fiscal e os condutores se inspira na argumentação de Bjørnskau e Elvik (1992)Bjørnskau, T., & Elvik, R. (1992). Can road traffic law enforcement permanently reduce the number of accidents? Accident Analysis & Prevention, 24(5), 507–520. http://dx.doi.org/10.1016/0001-4575(92)90059-R
http://dx.doi.org/10.1016/0001-4575(92)9...
. Uma interessante contribuição seria analisar os efeitos da proibição utilizando um modelo no qual os condutores não reconhecem o efeito de suas decisões sobre as decisões do Fiscal. Somente o Fiscal reconheceria que seu comportamento afetaria o comportamento dos demais agentes. Este exercício seria uma forma transparente de analisar a provocação de Bjørnskau e Elvik (1992)Bjørnskau, T., & Elvik, R. (1992). Can road traffic law enforcement permanently reduce the number of accidents? Accident Analysis & Prevention, 24(5), 507–520. http://dx.doi.org/10.1016/0001-4575(92)90059-R
http://dx.doi.org/10.1016/0001-4575(92)9...
à abordagem de Palmer (1977)Palmer, J. (1977). Economic analyses of the deterrent effect of punishment: A review. Journal of Research in Crime and Delinquency, 14(1), 4–21. http://dx.doi.org/10.1177/002242787701400102
http://dx.doi.org/10.1177/00224278770140...
, sob a qual os potenciais infratores não reconhecem seu efeito sobre o padrão de fiscalização.

Conforme discutido na subseção 5.1, a heterogeneidade entre localidades é um ingrediente interessante a ser incluído no atual modelo por pesquisa futura. A tratabilidade do modelo aqui obtida sugere que tal extensão é direta e que confirmaria em definitivo o cabimento da interpretação dada ao resultado da Tabela 2. Outra extensão natural do modelo seria aumentar o número de localidades nas quais há limite de velocidade. Esta generalização poderia ser usada para analisar a importância do alcance geográfico limitado dos radares, conforme identificado pelos trabalhos empíricos citados na seção 1.

Uma generalização do modelo aparentemente não trivial seria relaxar a hipótese de linearidade das utilidades utilizada em (8) e (9). A princípio, a possibilidade de não linearidade de u1(·) em e poderia ser explorada para estudar o fenômeno identificado por Yamada (2005)Yamada, M. G. (2005). Impacto dos radares fixos na velocidade e na acidentalidade em trecho da rodovia Washington Luís (Dissertação de Mestrado, Escola de Engenharia de São Carlos, São Carlos, SP). http://dx.doi.org/10.11606/D.18.2005.tde-15022006-204946
http://dx.doi.org/10.11606/D.18.2005.tde...
, no qual os condutores aceleram após os radares para (supostamente) compensar o tempo perdido ao respeitar o limite no radar.12 12 Se o condutor possui uma meta de tempo de viagem que demanda velocidade média acima de ῡ, então a presença de radares em uma parte da rodovia reduz sua velocidade média para abaixo de ῡ e, assim, aumenta a atratividade de excessos de velocidade nos demais trechos da rodovia. A linearidade de u1(·) em e parece ser inadequada para estudar fenômenos deste tipo. Ainda mais crucial, a possibilidade de não linearidade de u0(·) em e poderia ser explorada a fim de refletir na satisfação da sociedade a presença de externalidades na decisão de excesso de velocidade. É natural imaginar que os condutores não levam em conta todo o efeito de sua decisão na probabilidade de acidentes dos demais condutores.13 13 Segundo Bjørnskau e Elvik (1992), se referindo aos resultados de Näätänen e Summala (1976) e de Summala (1988), os condutores sequer levam em conta o efeito de suas ações na probabilidade de se envolverem em acidentes.

Como contribuição central, este trabalho evidencia a principal consequência teórica prevista para a proibição de radares móveis. Além disso, as possibilidades de adaptação do presente modelo para analisar diferentes questões ilustram a importância do avanço teórico obtido com este trabalho para o tema em questão.

De um ponto de vista abstrato, o presente modelo de interação estratégica para a fiscalização de trânsito se insere em uma discussão mais geral sobre a intervenção do Estado na decisão privada de alocação de risco. Proponentes de legislação contra o consumo de drogas ou pela redução do açúcar em refrigerantes, por exemplo, acreditam que é dever do Estado proteger os cidadãos deles mesmos. A visão mais evidente do debate seria o Estado protegendo crianças desinformadas, mas é provável que muitos acreditam que mesmo os adultos precisam de ajuda para não se colocarem em risco. Assim, a alocação de risco, em um contexto de dificuldade de comprometimento para com boas práticas, poderia ser um elemento para pesquisa futura baseando-se no ferramental do modelo atual.

  • *
    Uma versão anterior deste artigo circulou sob o título “A proibição de radares móveis: eliminando o efeito surpresa da fiscalização”. Agradecemos as sugestões de melhoria para o manuscrito apresentadas pelo(a) parecerista. Jefferson Bertolai e Igor Soares agradecem o apoio institucional da USP e da FEARP/USP ao Laboratório de Economia, Matemática de Computação (LEMC-FEARP/USP), laboratório no qual grande parte deste trabalho foi desenvolvido.
  • JEL Codes C72, D78
  • 1
    Ver Sorano e Néri (2019)Sorano, V., & Néri, R (2019). Bolsonaro determina suspensão de uso de radares móveis em rodovias federais. G1. https://gl.globo.com/carros/noticia/2019/08/15/bolsonaro -determina-suspensao-de-uso-de-radares-moveis-em-rodovias-federais.ghtml
    https://gl.globo.com/carros/noticia/2019...
    e despacho da Presidência da República publicado no Diário Oficial da União de 15/08/2019 (DOU, 2019DOU. (2019). Despachos do Presidente da República. Diário Oficial da União(157). https://www.in.gov.br/en/web/dou/-/ despachos-do-presidente-da-republica-210740855
    https://www.in.gov.br/en/web/dou/-/ desp...
    ). A medida se aplica somente aos radares usualmente conhecidos como “móveis”: radares instalados em veículo parado ou sobre suporte (tecnicamente denominado radar estático), instalados em veículo em movimento (tecnicamente denominado radar móvel) e direcionados manualmente para os veículos (tecnicamente denominado radar portátil). Segundo DOU (2019)DOU. (2019). Despachos do Presidente da República. Diário Oficial da União(157). https://www.in.gov.br/en/web/dou/-/ despachos-do-presidente-da-republica-210740855
    https://www.in.gov.br/en/web/dou/-/ desp...
    , a medida seguirá em vigor até que o Ministério da Infraestrutura conclua a reavaliação da regulamentação dos procedimentos de fiscalização eletrônica de velocidade em vias públicas e não há prazo definido para a volta da fiscalização. Conforme noticiado recentemente por Richter (2019)Richter, A. (2019). Justiça determina que PRF volte a usar radares móveis em rodovias. Agência Brasil de Notícias, http://agenciabrasil.ebc.com.br/justica/noticia/2019-12/ justica-determina-que-prf-volte-usar-radares-moveis-em-rodovias
    http://agenciabrasil.ebc.com.br/justica/...
    , no entanto, uma decisão judicial de 11 de dezembro de 2019 ordena o reestabelecimento da fiscalização com radares deste tipo.
  • 2
    Bjørnskau e Elvik (1992)Bjørnskau, T., & Elvik, R. (1992). Can road traffic law enforcement permanently reduce the number of accidents? Accident Analysis & Prevention, 24(5), 507–520. http://dx.doi.org/10.1016/0001-4575(92)90059-R
    http://dx.doi.org/10.1016/0001-4575(92)9...
    e Elvik (2014)Elvik, R. (2014). A review of game-theoretic models of road user behaviour. Accident Analysis & Prevention, 62, 388–396. http://dx.doi.org/10.1016/j.aap.2013.06.016
    http://dx.doi.org/10.1016/j.aap.2013.06....
    discutem a atratividade superior da abordagem de Teoria dos Jogos para se estudar o comportamento dos condutores.
  • 3
    Moreira, Ribeiro, Motta, e Motta (2018)Moreira, M. R., Ribeiro, J. M., Motta, C. T., & Motta, J. I. J. (2018). Mortalidade por acidentes de transporte de trânsito em adolescentes e jovens, Brasil, 1996–2015: Cumpriremos o ODS 3.6? Ciência & Saúde Coletiva, 23, 2785–2796. http://dx.doi.org/10.1590/1413-81232018239.17082018
    http://dx.doi.org/10.1590/1413-812320182...
    cita que 733.120 pessoas morreram no Brasil em decorrência de Acidentes de Trânsito Terrestres (ATT) entre 1996 e 2015, cerca de 3,5% do total de mortes do período. Destaca ainda que 2.272.068 pessoas foram internadas por se envolverem ATT's no mesmo período. Dentre estes, os motociclistas são as vítimas com maior tempo de permanência hospitalar, conforme destacado por Andrade e Jorge (2017)Andrade, S. S. C. d. A., & Jorge, M. H. P. d. M. (2017). Internações hospitalares por lesões decorrentes de acidente de transporte terrestre no Brasil, 2013: Permanência e gastos. Epidemiologia e Serviços de Saúde, 26(1), 31–38. http://dx.doi.org/10.5123/sl679-49742017000100004
    http://dx.doi.org/10.5123/sl679-49742017...
    .
  • 4
    Ver Zlatoper (1991)Zlatoper, T. J. (1991). Determinants of motor vehicle deaths in the United States: A cross-sectional analysis. Accident Analysis & Prevention, 23(5), 431–436. http://dx.doi.org/10.1016/0001-4575(91)90062-A
    http://dx.doi.org/10.1016/0001-4575(91)9...
    , Aarts e Van Schagen (2006)Aarts, L., & Van Schagen, I. (2006). Driving speed and the risk of road crashes: A review. Accident Analysis & Prevention, 38(2), 215–224. http://dx.doi.org/10.1016/j.aap.2005.07.004
    http://dx.doi.org/10.1016/j.aap.2005.07....
    , Wilson, Willis, Hendrikz, Le Brocque, e Bellamy (2010)Wilson, C., Willis, C., Hendrikz, J. K., Le Brocque, R., & Bellamy, N. (2010). Speed cameras for the prevention of road traffic injuries and deaths. Cochrane Database of Systematic Reviews, 11(CD004607). http://dx.doi.org/10.1002/14651858.CD004607.pub4
    http://dx.doi.org/10.1002/14651858.CD004...
    , Theofilatos e Yannis (2014)Theofilatos, A., & Yannis, G. (2014). A review of the effect of traffic and weather characteristics on road safety. Accident Analysis & Prevention, 72,244–256. http://dx.doi.org/10.1016/j.aap.2014.06.017
    http://dx.doi.org/10.1016/j.aap.2014.06....
    , e Fowles e Loeb (1989)Fowles, R., & Loeb, P. D. (1989). Speeding, coordination, and the 55-mph limit: Comment. The American Economic Review, 79(4), 916–921. https://www.jstor.org/stable/1827947
    https://www.jstor.org/stable/1827947...
    .
  • 5
    Ver Lave (1985)Lave, C. A. (1985). Speeding, coordination, and the 55 mph limit. The American Economic Review, 75(5), 1159–1164. https://www.jstor.org/stable/1818655
    https://www.jstor.org/stable/1818655...
    , Ryeng (2012)Ryeng, E. O. (2012). The effect of sanctions and police enforcement on drivers' choice of speed. Accident Analysis & Prevention, 45,446–454. http://dx.doi.org/10.1016/j.aap.2011.08.010
    http://dx.doi.org/10.1016/j.aap.2011.08....
    , Connolly e Aberg (1993)Connolly, T., & Âberg, L. (1993). Some contagion models of speeding. Accident Analysis & Prevention, 25(1), 57–66. http://dx.doi.org/10.1016/0001-4575(93)90096-F
    http://dx.doi.org/10.1016/0001-4575(93)9...
    , e Elvik (2014)Elvik, R. (2014). A review of game-theoretic models of road user behaviour. Accident Analysis & Prevention, 62, 388–396. http://dx.doi.org/10.1016/j.aap.2013.06.016
    http://dx.doi.org/10.1016/j.aap.2013.06....
    .
  • 6
    Com dados de velocidade em rodovias antes e após a introdução de radares e usando como controle medidas de velocidade em rodovias similares no mesmo período.
  • 7
    No estudo realizado pelos autores na Interstate 70 (no trecho rural do estado de Maryland, EUA), foi encontrado uma elevação na velocidade média dos motoristas quando não há radar ativo. No entanto, o efeito é apenas local. Nas proximidades da localidade do radar, houve redução de 42% para 28% no número de motoristas com velocidade 10 milhas por hora acima do limite máximo (55 milhas por hora). Após 1 milha, 38% dos motoristas já desenvolviam velocidade acima de 65 milhas por hora, com a porcentagem aumentando para 40% após duas a cinco milhas da posição do radar.
  • 8
    Para interpretações alternativas sobre previsão de comportamento em termos probabilísticos, ver o trabalho seminal de Harsanyi (1967Harsanyi, J. C. (1967). Games with incomplete information played by “Bayesian” players, I–III, Part I: The basic model. Management science, 14(3), 159–182. https://www.jstor.org/stable/2628393
    https://www.jstor.org/stable/2628393...
    , 1968a, 1968b) e o livro-texto Gibbons (1992)Gibbons, R. (1992). Game theory for applied economists. Princeton University Press..
  • 9
    Ver o artigo seminal de Nash (1950)Nash, J. F. (1950). Equilibrium points in n-person games. Proceedings of the National Academy of Sciences, 36(1), 48–49. http://dx.doi.org/10.1073/pnas.36.1.48
    http://dx.doi.org/10.1073/pnas.36.1.48...
    e o livro-texto Gibbons (1992)Gibbons, R. (1992). Game theory for applied economists. Princeton University Press..
  • 10
    Para mais detalhes sobre tal propriedade, ver Gibbons (1992)Gibbons, R. (1992). Game theory for applied economists. Princeton University Press..
  • 11
    Note que o Condutor é sempre capaz de assegurar payoff nulo escolhendo não exceder nas duas localidades. Ainda, o Fiscal é sempre capaz de impedir satisfação positiva para o Condutor por meio da utilização de radares fixos em todas as localidades.
  • 12
    Se o condutor possui uma meta de tempo de viagem que demanda velocidade média acima de , então a presença de radares em uma parte da rodovia reduz sua velocidade média para abaixo de e, assim, aumenta a atratividade de excessos de velocidade nos demais trechos da rodovia. A linearidade de u1(·) em e parece ser inadequada para estudar fenômenos deste tipo.
  • 13
    Segundo Bjørnskau e Elvik (1992)Bjørnskau, T., & Elvik, R. (1992). Can road traffic law enforcement permanently reduce the number of accidents? Accident Analysis & Prevention, 24(5), 507–520. http://dx.doi.org/10.1016/0001-4575(92)90059-R
    http://dx.doi.org/10.1016/0001-4575(92)9...
    , se referindo aos resultados de Näätänen e Summala (1976)Näätänen, R., & Summala, H. (1976). Road-user behaviour and traffic accidents. North-Holland. e de Summala (1988)Summala, H. (1988). Risk control is not risk adjustment: The zero-risk theory of driver behaviour and its implications. Ergonomics, 31(4), 491–506. http://dx.doi.org/10.1080/00140138808966694
    http://dx.doi.org/10.1080/00140138808966...
    , os condutores sequer levam em conta o efeito de suas ações na probabilidade de se envolverem em acidentes.

Apêndice. Demonstrações

Proposição 1. A única boa previsão (o único Equilíbrio de Nash) para o jogo (11) é dada por

σ * = ( σ 0 * , σ 1 * ) = [ ( 1 δ , δ ) , ( 1 θ , θ ) ]

em que θα/(α + β) ∈ (0,1) e δμ/(η + μ) ∈ (0,1).

Demonstração. Note que 0 < θ < 1 e 0 < δ < 1 são consequência direta de α > 0, β > 0, μ > 0 e η > 0. Por conveniência, denote B01) = arg maxσ0∈Δ(A0) U00, σ1) e B10) = arg maxσ1∈Δ(A1) U10, σ1).

Usando (3) e (11), note que

U 0 ( σ 0 , σ 1 ) = j = 0 1 σ 0 ( l j ) [ σ 1 ( υ b ) π 0 ( l j , υ b ) + σ 1 ( υ a ) π 0 ( l j , υ a ) ] = σ 0 ( l 0 ) [ 0 σ 1 ( υ b ) γ σ 1 ( υ a ) ] + σ 0 ( l 1 ) [ α σ 1 ( υ b ) + ( β γ ) ( υ a ) ] = γ [ 1 σ 0 ( l 1 ) ] σ 1 ( υ a ) + σ 0 ( l 1 ) [ α + ( β γ + α ) σ 1 ( υ a ) ] = γ σ 1 ( υ a ) + σ 0 ( l 1 ) [ ( β + α ) σ 1 ( υ a ) α ] = σ 0 ( l 1 ) [ σ 1 ( υ a ) θ ] ( β + α ) γ σ 1 ( υ a )
U 1 ( σ 0 , σ 1 ) = k = a b σ 1 ( υ k ) [ σ 0 ( l 0 ) π 1 ( l 0 , υ k ) + σ 0 ( l 1 ) π 1 ( l 1 , υ k ) ] = σ 1 ( υ b ) [ 0 σ 0 ( l 0 ) + 0 σ 0 ( l 1 ) ] + σ 1 ( υ a ) [ μ σ 0 ( l 0 ) η σ 0 ( l 1 ) ] = σ 1 ( υ a ) [ μ ( η + μ ) σ 0 ( l 1 ) ] = σ 1 ( υ a ) [ δ σ 0 ( l 1 ) ] ( η + μ ) ,

em que se usou θ = α/(α+β),δ = μ/(η+μ) e os fatos σ0(l0)+σ0(l1) = σ0(l0)+σ0(l1) = 1, os quais decorrem de σ0 ∈ Δ(A0) e σ0 ∈ Δ(A0). Usando a linearidade de U0(σ0,σ1) e de U1(σ0,σ1), de forma similar ao executado na prova do Lema 2, obtém-se

(A-1) B 0 ( σ 1 ) = arg max σ 0 Δ ( A 0 ) ( σ 0 ( l 1 ) [ σ 1 ( υ a ) θ ] ( β + α ) ) = { { ( 1 , 0 ) } , se σ 1 ( υ a ) < θ , Δ ( A 0 ) , se σ 1 ( υ a ) = θ , { ( 0 , 1 ) } , se σ 1 ( υ a ) > θ ;
(A-2) B 1 ( σ 0 ) = arg max σ 1 Δ ( A 1 ) ( σ 1 ( υ a ) [ δ σ 0 ( l 1 ) ] ( η + μ ) ) = { { ( 0 , 1 ) } , se σ 0 ( l 1 ) < δ , Δ ( A 1 ) , se σ 0 ( l 1 ) = δ , { ( 1 , 0 ) } , se σ 0 ( l 1 ) > δ .

Suponha que σ* = (σ0*,σ1*) ∈ Δ(A0) × Δ(A1) é uma previsão probabilística para o jogo (11) que satisfaz (4) e (5) simultaneamente. Ou seja, σ0* ∈ B01*) e0 σ1* ∈ B00*). A seguir, será demonstrado que σ0*(l1) ≠ δ gera uma contradição (impossibilidade) e, portanto, não pode ser verdadeira.

  • (i) Se σ0*(l1) < δ então (A-2) implica que B1(σ0*) = Δ({υa}) = {(0,1)}. Logo, σ1* = (0, 1) decorre de (5) e, portanto, σ1*(υa) = 1 > θ. Usando (A-1) e tal resultado, obtém-se B0(σ1*) = Δ({l1}) = {(0,1)}. Logo, σ0* = (0,1) decorre de (4) e, portanto, obtém-se a impossibilidade σ0*(l1) = 1 > δ > σ0*(l1).

  • (ii) Se σ0*(l1) > δ, então (A-2) implica que B1(σ0*) = Δ({υb}). Logo, σ1* = (1,0) decorre de (5) e, portanto, σ1*(υa) = 0 < θ. Usando tal resultado e (A-1), obtém-se B0(σ1*) = Δ({l0}). Logo, σ0* = (1,0) decorre de (4) e, portanto, obtém-se a impossibilidade σ0* (l1) = 0 < δ < σ0* (l1).

Como os casos (i) e (ii) são exaustivos quando σ0* (l1) ≠ δ, então σ0* (l1) ≠ δ gera uma impossibilidade em todos os casos possíveis e, portanto, não pode ser verdadeira. Conclui-se então que Σ0*(l1) = δ. Tendo em vista que Σ0* = (δ,δ), o único caso em (A-1) consistente com Σ0* ∈ B0(Σ1*) é o caso em que B0(Σ1*) = Δ(A0). Logo, Σ1*(υa) = θ e Σ1* = (θ,θ).

Lema 3.Considere uma situação do jogo(14)na qual o Fiscal se comporta de acordo com Σ0e o Condutor se comporta de acordo com Σ1. Então,

U 0 ( σ 0 , σ 1 ) θ α = U 0 [ ( 1 , 0 , 0 , 0 ) , σ 1 ] ( θ / α ) + σ 0 ( p 1 ) [ q 1 ( σ 1 ) θ ] + σ 0 ( p 2 ) [ q 2 ( σ 1 ) θ ] + σ 0 ( p 3 ) [ q 1 ( σ 1 ) + q 2 ( σ 1 ) 2 θ ] ,
U 1 ( σ 0 , σ 1 ) δ μ = σ 1 ( a 1 ) [ δ q 1 ( σ 0 ) ] + σ 1 ( a 2 ) [ δ q 2 ( σ 0 ) ] + σ 1 ( a 3 ) [ 2 δ q 1 ( σ 0 ) q 2 ( σ 0 ) ] ,

em que novamente θ = α/(α + β) ∈ (0,1) e δ = μ/(μ + η) ∈ (0, 1).

Demonstração. A partir de (14) e (15) note que,

U 0 ( σ 0 , σ 1 ) = i = 0 3 σ 0 ( p i ) [ j = 0 3 σ 1 ( a j ) π 0 ( p i , a j ) ] = σ 0 ( p 0 ) [ 0 σ 1 ( a 0 ) γ [ σ 1 ( a 1 ) + σ 1 ( a 2 ) ] 2 γ σ 1 ( a 3 ) ] + σ 0 ( p 1 ) [ α σ 1 ( a 0 ) ( β γ ) σ 1 ( a 1 ) ( α + γ ) σ 1 ( a 2 ) + ( β 2 γ ) σ 1 ( a 3 ) ] + σ 0 ( p 2 ) [ α σ 1 ( a 0 ) ( α + γ ) σ 1 ( a 1 ) + ( β γ ) σ 1 ( a 2 ) + ( β 2 γ ) σ 1 ( a 3 ) ] + σ 0 ( p 3 ) [ 2 α σ 1 ( a 0 ) + ( β α γ ) [ σ 1 ( a 1 ) + σ 1 ( a 2 ) ] + 2 ( β γ ) σ 1 ( a 3 ) ] .

Usando σ0(p0) = l − σ0(p1) − σ0(p2) − σ0(p3) e σ1(α0) = 1 − σ1(α1) − σ1(α2) − σ1(α3), tem-se

(A-3) U 0 ( σ 0 , σ 1 ) = γ [ σ 1 ( a 1 ) + σ 1 ( a 2 ) + 2 σ 1 ( a 3 ) ] + σ 0 ( p 1 ) [ α σ 1 ( a 0 ) + β σ 1 ( a 1 ) α σ 1 ( a 2 ) + β σ 1 ( a 3 ) ] + σ 0 ( p 2 ) [ α σ 1 ( a 0 ) α σ 1 ( a 1 ) + β σ 1 ( a 2 ) + β σ 1 ( a 3 ) ] + σ 0 ( p 3 ) [ 2 α σ 1 ( a 0 ) + ( β α ) [ σ 1 ( a 1 ) + σ 1 ( a 2 ) ] + 2 β σ 1 ( a 3 ) ] = γ [ σ 1 ( a 1 ) + σ 1 ( a 2 ) + 2 σ 1 ( a 3 ) ] + σ 0 ( p 1 ) [ q 1 ( σ 1 ) α α + β ] ( α + β ) + σ 0 ( p 2 ) [ q 2 ( σ 1 ) α α + β ] ( α + β ) + σ 0 ( p 3 ) [ q 1 ( σ 1 ) + q 2 ( σ 1 ) 2 α β + α ] ( α + β ) .

O primeiro resultado do Lema é equivalente a (A-3), pois θ = α/(α + β). Agora observe que a partir de (14) e (15) se obtém

(A-4) U 1 ( σ 0 , σ 1 ) = j = 0 3 σ 1 ( a j ) [ i = 0 3 σ 0 ( p i ) π 1 ( p i , a j ) ] = σ 1 ( a 0 ) [ 0 σ 0 ( p 0 ) + 0 σ 0 ( p 1 ) + 0 σ 0 ( p 2 ) + 0 σ 0 ( p 3 ) ] + σ 1 ( a 1 ) [ μ σ 0 ( p 0 ) η σ 0 ( p 1 ) + μ σ 0 ( p 2 ) η σ 0 ( p 3 ) ] + σ 1 ( a 2 ) [ μ σ 0 ( p 0 ) + μ σ 0 ( p 1 ) η σ 0 ( p 2 ) η σ 0 ( p 3 ) ] + σ 1 ( a 3 ) [ 2 μ σ 0 ( p 0 ) + ( μ η ) [ σ 0 ( p 1 ) + σ 0 ( p 2 ) ] 2 η σ 0 ( p 3 ) ] = σ 1 ( a 2 ) [ μ η + μ q 2 ( σ 0 ) ] ( η + μ ) + σ 1 ( a 1 ) [ μ η + μ q 1 ( σ 0 ) ] ( η + μ ) + σ 1 ( a 3 ) [ 2 μ η + μ q 1 ( σ 0 ) q 2 ( σ 0 ) ] ( η + μ ) ,

em que a última igualdade usa σ0(p0) = 1 − σ0(p1) − σ0(p2) − σ0(p3). O segundo resultado do Lema é equivalente a (A-4), pois δ = μ/(μ + η).

Referências bibliográficas

Datas de Publicação

  • Publicação nesta coleção
    20 Dez 2021
  • Data do Fascículo
    Jul-Sep 2021

Histórico

  • Recebido
    14 Dez 2019
  • Aceito
    17 Fev 2020
Fundação Getúlio Vargas Praia de Botafogo, 190 11º andar, 22253-900 Rio de Janeiro RJ Brazil, Tel.: +55 21 3799-5831 , Fax: +55 21 2553-8821 - Rio de Janeiro - RJ - Brazil
E-mail: rbe@fgv.br