Acessibilidade / Reportar erro

Teoremas de Nöther: um estudo

Nöther’s theorems: a study

Resumos

Neste artigo, faremos uma revisão completa sobre os teoremas de Nöther: O que diz respeito às simetrias globais, o que se refere às locais e os correspondentes teoremas recíprocos. Exemplificamos estes teoremas aplicando-os a diversas situações. Particularmente, mostramos, usando o exemplo do problema de Kepler, que o primeiro teorema recíproco de Nöther encontra sua máxima aplicabilidade somente no formalismo hamiltoniano em que as simetrias dinâmicas são realizáveis. Finalmente, expomos a relação que o tensor de energia-momento de Nöther mantém com o métrico. Complementamos a informação expondo, em apêndice, a formulação de Lévy-Leblond–Jackiw que visa unificar os dois teoremas.

Palavras-chave:
Teoremas de Nöther; teoria clássica de campos; simetrias; teorias de calibre


In this paper, we make a complete revision about Nöther’s theorems: The one which refers to the global symmetries, the theorem referring to the local ones, and the corresponding reciprocal theorems. We exemplify these theorems by applying them to a variety of situations. Particularly, we show, through the example of Kepler’s problem, that the first reciprocal Nöther’s theorem finds its maximal applicability only in the Hamiltonian formalism in which the dynamical symmetries are realizable. Finally, we expose the relation between Nöther’s energy-momentum tensor and the metric one. We complement the information by treating, in appendix, Lévy-Leblond–Jackiw’s formulation that intends to unify the two theorems.

Keywords:
Nöther’s theorems; classical field theory; symmetries; gauge theories


1. Introdução

No último século, a física tem experimentado um crescente protagonismo do estudo das simetrias e quantidades conservadas, utilizadas tanto no território teórico quanto no fenomenológico para explicar uma série de fenômenos e tentar dar-lhes uma significação profunda. Semelhante estudo tem sido possível graças aos teoremas publicados em 1918 pela matemática alemã Amalie Emmy Nöther [1[1] Y. Kosmann-Schwarzbach, The Noether Theorems. Invariance and Conservation Laws in the Twentieth Century (Springer, Nova Iorque, 2011)., 2[2] E. Noether, Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-Physikalische Klasse 1918, 235 (1918).] – cuja vida e contexto histórico têm sido recentemente revisadas na Ref. [3[3] Y.J. Cuesta, N.T. Massoni, J.A. Salamanca e C.J. Mosquera, Rev. Bras. Ens. Fís. 43, e20200510 (2021).] – e que relacionam os dois conceitos mencionados tornando-os, em um certo sentido, equivalentes, trazendo à física as poderosas ferramentas da teoria matemática dos grupos de Lie, a qual era, na época, ainda alheia à literatura da física. Os logros alcançados com a utilização destes são inúmeros e de variada natureza; por exemplo, estabeleceu-se a relação existente entre a homogeneidade e isotropia do espaço e do tempo (ou do espaço-tempo) com as leis de conservação da energia e do momento (ou do tensor de energia-momento); encontrou-se uma «explicação» à lei de conservação da carga elétrica como devida à simetria de calibre1 1 Usamos a consumada tradução ao português do termo inglês gauge . pelo grupo U(1). Resultados tão importantes apontaram então para uma generalização de método, que levou à ideia de que todas as interações fundamentais descrevem-se por meio de campos de calibre, ideia essa que perdura, por seu grande sucesso, até os dias atuais. Via a disciplina conhecida como álgebra de correntes, assentada completamente nos próprios teoremas de Nöther, estabeleceu-se o grupo de simetrias a ser usado como grupo de calibre na cromodinâmica quântica (QCD) para a descrição das interações sub-hadrônicas. Igualmente, a teoria de gravitação de Einstein – que, por outro lado, motivou o trabalho de Nöther, especialmente para formular o segundo teorema [1[1] Y. Kosmann-Schwarzbach, The Noether Theorems. Invariance and Conservation Laws in the Twentieth Century (Springer, Nova Iorque, 2011).] – pode ser incorporada a esse esquema geral, permitindo, além do mais, generalizações naturais e novas possíveis direções de pesquisa, incrementando notavelmente a compreensão que temos desses fenômenos2 2 Salientamos, por exemplo, as críticas (construtivas) de Logunov e colaboradores e suas tentativas por basear a teoria da gravidade no estudo das quantidades conservadas, levando a uma teoria (denominada «teoria relativística da gravitação») que, no momento presente, pelas limitações na precisão das observações astronômicas, é indistinguível da teoria einsteniana [4, 5, 6]. . Outrossim, conceitos importantes da física atual de partículas, como os de quebra espontânea de simetria, modos de Goldstone, efeito Brout-Englert-Higgs e outros, baseiam-se em aplicações dos referidos teoremas. Assim, como eles se encontram em grande parte dos desenvolvimentos atuais da física teórica, não é exagerado dizer, com Lederman e Hill [7[7] L.M. Lederman e C.T. Hill, Symmetry and the beautiful universe (Prometheus Books, Nova Iorque, 2004).], que (em tradução livre) «o teorema de Nöther é tão importante para a compreensão das leis dinâmicas da natureza como o teorema de Pitágoras o é para o entendimento da geometria».

Este artigo está devotado a uma minuciosa exposição dos dois teoremas de Nöther, tanto os diretos como os (frequentemente esquecidos) recíprocos, e a um exame de suas consequências, as quais são explicitamente mostradas por via de exemplos. Acreditamos ser essa tarefa de importância devido ao pouco detalhe com que geralmente são abordados os mencionados teoremas, escondendo sua riqueza e abrangência.

Começamos expondo o formalismo variacional da teoria do campo clássico na seção2 2. Formalismo variacional da teoria do campo clássico Abordaremos o estudo dos teoremas de Nöther a partir da perspectiva da teoria do campo clássico. Isto não é perda de generalidade, pois o caso da mecânica pode ser considerado, em primeira instância, suprimindo apenas os argumentos espaciais dos campos, e considerando as coordenadas generalizadas como sendo, elas mesmas, campos da coordenada temporal. Considere o sistema de campos, conjuntamente caracterizados pela letra «u», cuja dinâmica é determinada pela função 𝒫⁢(x;u;∂⁡u;⋯;∂n⁡u) com n∈ℕ através da funcional de ação (1) 𝒜 ⁢ ( u ) = ∫ Ω 𝒫 ⁢ ( x ; u ; ∂ ⁡ u ; ⋯ ; ∂ n ⁡ u ) ⁢ d x , na qual a integração se estende à região Ω do espaço-tempo. A função 𝒫 pode ser a densidade lagrangiana (caso em que os campos u=φ têm o rôle de coordenadas generalizadas), sua transformada de Legendre (caso em que u∈{φ;π} são os campos anteriores e seus momentos conjugados), et cetera . A teoria do campo clássico – o mesmo que a maior parte da física clássica (o motivo, argumentam alguns, é a inclinação teleológica dos homens que a estabeleceram, ou a influência filosófica que sobre eles pesou) – está regida por princípios variacionais. Daí que a formulação geral das propriedades do sistema de campos clássicos passa pelo estudo da variação da ação perante transformações das coordenadas e campos envolvidos. Considere, então, as seguintes transformações3: (2) x → y = x + Δ ⁢ x , u ⁢ ( x ) → v ⁢ ( x ) = u ⁢ ( x ) + Δ ⁢ u ⁢ ( x ) , com Δ⁢x uma mudança infinitesimal das coordenadas e Δ⁢u uma mudança infinitesimal do campo segundo sua forma funcional. A variação total do campo, é claro, deve incluir também à variação das coordenadas; ela é, em primeira ordem, (3) δ ⁢ u ⁢ ( x ) := v ⁢ ( y ) - u ⁢ ( x ) ≈ Δ ⁢ u ⁢ ( x ) + ∂ ⁡ u ⁢ ( x ) ⁢ Δ ⁢ x . A variação da ação é, por outro lado, (4) δ ⁢ 𝒜 = ∫ Ω ′ 𝒫 ⁢ ( y ; v ; ∂ ⁡ v ; ⋯ ; ∂ n ⁡ v ) ⁢ d y - ∫ Ω 𝒫 ⁢ ( x ; u ; ∂ ⁡ u ; ⋯ ; ∂ n ⁡ u ) ⁢ d x . A equação recém escrita torna evidente que a função 𝒫 não muda, senão que são seus argumentos os que o fazem. Por isso, quando escrevermos (5) δ ⁢ 𝒫 := 𝒫 ⁢ ( y ; v ; ∂ ⁡ v ; ⋯ ; ∂ n ⁡ v ) - 𝒫 ⁢ ( x ; u ; ∂ ⁡ u ; ⋯ ; ∂ n ⁡ u ) = Δ ⁢ 𝒫 + ∂ ⁡ 𝒫 ⁢ Δ ⁢ x , é claro que a variação de 𝒫 é consequência da variação na forma funcional dos campos (Δ⁢𝒫) e nas coordenadas (∂⁡𝒫⁢Δ⁢x). Se, além disso, fazemos na primeira integral do lado direito da Eq. (2) a mudança de variáveis de integração y→x, obteremos: (6) δ ⁢ 𝒜 = ∫ Ω { ( 𝒫 + δ ⁢ 𝒫 ) | ∂ ⁡ y ∂ ⁡ x | - 𝒫 } ⁢ d x . Mas a Eq. (2) implica que (7) | ∂ ⁡ y ∂ ⁡ x | = 1 4 ! ⁢ ε α ⁢ β ⁢ γ ⁢ δ ⁢ ε μ ⁢ ν ⁢ σ ⁢ τ ⁢ ∂ ⁡ y α ∂ ⁡ x μ ⁢ ∂ ⁡ y β ∂ ⁡ x ν ⁢ ∂ ⁡ y γ ∂ ⁡ x σ ⁢ ∂ ⁡ y δ ∂ ⁡ x τ ≈ 1 + ∂ ⁡ Δ ⁢ x , de maneira que, substituindo na Eq. (6), (8) δ ⁢ 𝒜 = ∫ Ω ( δ ⁢ 𝒫 + 𝒫 ⁢ ∂ ⁡ Δ ⁢ x ) ⁢ d x = ∫ Ω { Δ ⁢ 𝒫 + ∂ ⁡ ( 𝒫 ⁢ Δ ⁢ x ) } ⁢ d x . Esta equação é válida qualquer que seja a ordem da função 𝒫, isto é, qualquer que seja a maior ordem da derivada do campo u que lhe sirva como argumento. A exigência da invariância da ação sob as transformações consideradas, em qualquer região do espaço-tempo, leva à «equação diferencial de Lie»: (9) Δ ⁢ 𝒫 + ∂ ⁡ ( 𝒫 ⁢ Δ ⁢ x ) = 0 . Esta equação já contém a informação completa necessária para o estabelecimento dos teoremas de Nöther. Contudo, sua aplicação aos diversos problemas se simplifica ao escrevê-la de forma que a dependência com os campos seja explícita. Assumiremos, para tal, que 𝒫 é uma função da segunda ordem – isto é suficiente para exemplificar o procedimento geral; as equações e correntes para as teorias de maior ordem são obtidas por procedimentos análogos. Por definição, (10) Δ ⁢ 𝒫 = ∂ ⁡ 𝒫 ∂ ⁡ u ⁢ Δ ⁢ u + ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ ⁡ u ) ⁢ Δ ⁢ ( ∂ ⁡ u ) + ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ ⁡ ∂ ⁡ u ) ⁢ Δ ⁢ ( ∂ ⁡ ∂ ⁡ u ) . Usando que Δ⁢(∂⁡u)=∂⁡Δ⁢u e que Δ⁢(∂⁡∂⁡u)=∂⁡∂⁡Δ⁢u, o uso da regra de multiplicação do produto de duas funções permite separar uma divergência na variação Δ⁢𝒫: (11) Δ ⁢ 𝒫 + ∂ ⁡ ( 𝒫 ⁢ Δ ⁢ x ) = δ ⁢ 𝒜 δ ⁢ u ⁢ Δ ⁢ u - ∂ ⁡ J , com a derivada funcional da ação em relação ao campo (12) δ ⁢ 𝒜 δ ⁢ u := ∂ ⁡ 𝒫 ∂ ⁡ u - ∂ μ ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) + ∂ μ ⁡ ∂ ν ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) , e a corrente infinitesimal (13) J μ := ( ∂ ν ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) ) ⁢ Δ ⁢ u - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ⁢ ∂ ν ⁡ Δ ⁢ u - 𝒫 ⁢ Δ ⁢ x μ . Será útil escrever essas quantidades em função da variação total do campo. Da Eq. (3), tem-se que (14) ∂ ν ⁡ ( Δ ⁢ u ) = Δ ⁢ ( ∂ ν ⁡ u ) = δ ⁢ ( ∂ ν ⁡ u ) - ∂ ρ ⁡ ∂ ν ⁡ u ⁢ Δ ⁢ x ρ . Desse modo, a quantidade J pode ser escrita na forma: (15) J μ = ( ∂ ν ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) ) ⁢ δ ⁢ u - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ⁢ δ ⁢ ( ∂ ν ⁡ u ) + Θ ⁢ Δ ρ μ ⁢ x ρ , com (16) Θ := ρ μ ( ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) - ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ) ∂ ρ u + ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ⁢ ∂ ρ ⁡ ∂ ν ⁡ u - 𝒫 ⁢ δ ρ μ . Substituindo as Eqs. (11) e (15) na Eq. (8), chega-se a que a variação da ação é (17) δ 𝒜 = ∫ Ω { δ ⁢ 𝒜 δ ⁢ u ( δ u - ∂ ρ u Δ x ρ ) - ∂ μ [ Θ Δ ρ μ x ρ - ( ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) - ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ) δ u - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) δ ( ∂ ν u ) ] } d x . Nessa forma, a aplicação de princípios variacionais à ação leva a resultados imediatos. Princípio da ação estacionária de Ostrogradskii-Hamilton. Este princípio define a forma funcional do campo u como aquela que extremiza a ação 𝒜, sob as condições de fronteira fixa, isto é, dados os valores do campo e de suas derivadas até a ordem n-1 (no caso particular em estudo, até a primeira derivada) na fronteira ∂⁡Ω da região de integração. Em linguagem formal: u ⁢ é campo físico : ⇔ ∀ Δ u ∈ C 2 ( ℝ 4 ) com Δ u | ∂ ⁡ Ω = 0 = Δ ( ∂ u ) | ∂ ⁡ Ω : δ ⁢ 𝒜 = 0 ⁢ sob ⁢ Δ ⁢ x = 0 . Como a segunda linha da Eq. (17) se iguala – segundo o teorema de Ostrogradskii-Gauss – à integral de J sobre a superfície ∂⁡Ω, e J depende das quantidades Δ⁢x, δ⁢u e δ⁢(∂⁡u) que se anulam na mencionada superfície, o princípio da ação estacionária se equivale ao cumprimento das equações de Euler-Lagrange: (18) δ ⁢ 𝒜 δ ⁢ u = 0 ⇔ ∂ ⁡ 𝒫 ∂ ⁡ u - ∂ μ ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) + ∂ μ ⁡ ∂ ν ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) = 0 . Quando a função 𝒫 é a densidade lagrangiana, as equações de Euler-Lagrange são exatamente as recém escritas: (19) δ ⁢ 𝒜 δ ⁢ φ = 0 ⇔ ∂ ⁡ ℒ ∂ ⁡ φ - ∂ μ ⁡ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ φ ) + ∂ μ ⁡ ∂ ν ⁡ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ φ ) = 0 . Quando, por outro lado, se trata da função 𝒫=π⁢∂0⁡φ-ℋ, com ℋ a densidade hamiltoniana, as equações anteriores se reduzem às equações canônicas de Hamilton. Com efeito, consideremos a teoria da primeira ordem em que a velocidade ∂0⁡φ é eliminada em favor do momento π, de forma que a densidade hamiltoniana é ℋ⁢(x;φ;∇⁡φ;π;∇⁡π). Como u∈{φ;π}, as Eqs. (18) se dividem em dois conjuntos: (20) δ ⁢ 𝒜 δ ⁢ φ = 0 ⇔ ∂ 0 ⁡ π = - ∂ ⁡ ℋ ∂ ⁡ φ + ∇ ⁡ ∂ ⁡ ℋ ∂ ⁡ ( ∇ ⁡ φ ) , (21) δ ⁢ 𝒜 δ ⁢ π = 0 ⇔ ∂ 0 ⁡ φ = ∂ ⁡ ℋ ∂ ⁡ π + ∇ ⁡ ∂ ⁡ ℋ ∂ ⁡ ( ∇ ⁡ π ) , que são, já o esperávamos, as equações canônicas de Hamilton. Se a teoria lagrangiana é da segunda ordem, os momentos conjugados devem ser corretamente definidos – e não há uma só, senão diversas formas de fazê-lo [10, 11]. Particularmente, seguindo a Ostrogradskii, definindo a densidade hamiltoniana canônica como a componente Θ00 do tensor canônico de energia-momento, tem-se que (22) ℋ = ( ∂ ⁡ ℒ ∂ ⁡ ( ∂ 0 ⁡ φ ) - ∂ 0 ⁡ ∂ ⁡ ℒ ∂ ⁡ ( ∂ 0 2 ⁡ φ ) - 2 ⁢ ∇ ⁡ ∂ ⁡ ℒ ∂ ⁡ ( ∇ ⁡ ∂ 0 ⁡ φ ) ) ⁢ ∂ 0 ⁡ φ + ∂ ⁡ ℒ ∂ ⁡ ( ∂ 0 2 ⁡ φ ) ⁢ ∂ 0 2 ⁡ φ - ℒ + ∇ ⋅ ( ∂ ⁡ ℒ ∂ ⁡ ( ∇ ⁡ ∂ 0 ⁡ φ ) ⁢ ∂ 0 ⁡ φ ) . Como o último termo é uma divergência espacial, as condições assintóticas usuais indicam que ele é irrelevante para a ação. Considerando os campos independentes φ e ∂0⁡φ, seus correspondentes momentos conjugados, π e π0, se definem como: (23) π := ∂ ⁡ ℒ ∂ ⁡ ( ∂ 0 ⁡ φ ) - ∂ 0 ⁡ ∂ ⁡ ℒ ∂ ⁡ ( ∂ 0 2 ⁡ φ ) - 2 ⁢ ∇ ⁡ ∂ ⁡ ℒ ∂ ⁡ ( ∇ ⁡ ∂ 0 ⁡ φ ) , π 0 := ∂ ⁡ ℒ ∂ ⁡ ( ∂ 0 2 ⁡ φ ) , pois então a hamiltoniana adota a forma (24) H = ∫ V ( π ⁢ ∂ 0 ⁡ φ + π 0 ⁢ ∂ 0 2 ⁡ φ - ℒ ) ⁢ d 3 ⁢ x . O procedimento então segue como no caso habitual, obtendo-se as equações canônicas de Hamilton: (25) ∂ 0 ⁡ φ = δ ⁢ H δ ⁢ π , ∂ 0 2 ⁡ φ = δ ⁢ H δ ⁢ π 0 , ∂ 0 ⁡ π = - δ ⁢ H δ ⁢ φ , ∂ 0 ⁡ π 0 = - δ ⁢ H δ ⁢ ( ∂ 0 ⁡ φ ) . Vemos desta forma que os dois formalismos – a saber, o lagrangiano e o hamiltoniano –, podem ser simultaneamente tratados, como o fez Nöther originalmente [2]. , não restringindo a atenção ao método lagrangiano, mas, como Nöther o fez, de forma geral, incluindo, além disso, a possibilidade de tratar com teorias da segunda ordem nas derivadas dos campos. O primeiro teorema de Nöther e seu recíproco são o foco de atenção da seção3 3. Primeiro Teorema de Nöther e seu Recíproco Teorema 1 (Primeiro teorema de Nöther). Se a funcional da ação de um sistema de campos clássicos é invariante, para toda região Ω⊆ℝ4, sob as transformações de um grupo de Lie Gr de r parâmetros, então r combinações linearmente independentes de derivadas funcionais da ação se reduzem a divergências. Demonstração. Sejam {εa}a∈Ir– denotamos Ir:={n∈ℕ|n≤r}– os parâmetros do grupo de Lie Gr, e sejam {Ua}a∈Ir e {Xa}a∈Ir os correspondentes geradores nas representações que agem sobre os campos u e as coordenadas x, respectivamente. Em uma palavra, (26) δ ⁢ u = ε a ⁢ ( U a ⁢ u ) , Δ ⁢ x = ε a ⁢ ( X a ⁢ x ) . Como é hipótese do teorema a invariância da ação em qualquer região Ω do espaço-tempo, deve-se considerar a equação diferencial de Lie, Eq. (9), ou, equivalentemente, a anulação do integrando da Eq. (17). Nela, será necessário conhecer que (27) δ ⁢ ( ∂ ν ⁡ u ) = Δ ⁢ ( ∂ ν ⁡ u ) + ∂ ρ ⁡ ∂ ν ⁡ u ⁢ Δ ⁢ x ρ = ∂ ν ⁡ ( Δ ⁢ u ) + ∂ ρ ⁡ ∂ ν ⁡ u ⁢ Δ ⁢ x ρ = ∂ ν ⁡ ( δ ⁢ u - ∂ ρ ⁡ u ⁢ Δ ⁢ x ρ ) + ∂ ρ ⁡ ∂ ν ⁡ u ⁢ Δ ⁢ x ρ = ε a [ ∂ ν ( U a u ) - ∂ ρ u ∂ ν ( X a x ) ρ ] . Com as Eqs. (26) e (27) no integrando da Eq. (17), as hipóteses do teorema implicam que (28) ε a δ 𝒜 δ u [ ( U a u ) − ∂ ρ u ( X a x ) ρ ] = ε a ∂ μ { Θ μ ρ ( X a x ) ρ − ( ∂ 𝒫 ∂ ( ∂ μ u ) − ∂ ν ∂ 𝒫 ∂ ( ∂ μ ∂ ν u ) ) ( U a u ) − ∂ 𝒫 ∂ ( ∂ μ ∂ ν u ) [ ∂ ν ( U a u ) − ∂ ρ u ∂ ν ( X a x ) ρ } Como, finalmente, os parâmetros εa são linearmente independentes, pode-se tomar cada um deles diferente de zero por vez, com todos os outros nulos, o que leva a estabelecer que, ∀a∈Ir, (29) δ ⁢ 𝒜 δ ⁢ u ⁢ [ ( U a ⁢ u ) - ∂ ρ ⁡ u ⁢ ( X a ⁢ x ) ρ ] = ∂ μ { Θ μ ρ ( X a x ) ρ − ( ∂ 𝒫 ∂ ( ∂ μ u ) − ∂ v ∂ 𝒫 ∂ ( ∂ μ ∂ v u ) ) ( U a u ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) [ ∂ ν ( U a u ) - ∂ ρ u ∂ ν ( X a x ) ρ ] } . Esta é a tese que desejávamos provar. Em particular, se os campos são campos físicos, no sentido da definição pelo princípio da ação estacionária, então o lado esquerdo da Eq. (29) é nulo, e o primeiro teorema de Nöther implica a existência de r correntes ja, denominadas «correntes de Nöther» e definidas segundo: (30) j μ a : = Θ μ ρ ( X a x ) ρ − ( ∂ 𝒫 ∂ ( ∂ μ u ) − ∂ ν ∂ 𝒫 ∂ ( ∂ μ ∂ ν u ) ) ( U a u ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) [ ∂ ν ( U a u ) - ∂ ρ u ∂ ν ( X a x ) ρ ] , satisfazendo às equações de continuidade: (31) ∀ a ∈ I r : ∂ μ j = a μ 0 . Separando a componente temporal das espaciais e integrando num volume tridimensional (espacial) V, (32) ∫ V ∂ 0 j 0 a d 3 x = ∫ V ∇ ⋅ j a d 3 x = ∫ ∂ V j a ⋅ d σ , em que temos usado o teorema de Ostrogradskii-Gauss para obter a última igualdade. Da primeira integral pode ser extraída a derivada temporal com o uso da regra integral de Leibniz, segundo a qual: Regra integral de Leibniz: Se f:ℝ2→ℝ é uma função contínua com derivada parcial ∂1⁡f contínua em uma região [t1;t2]×[a;b], então, para t∈[t1;t2], (33) d d ⁢ t ⁢ ∫ a b f ⁢ ( t ; x ) ⁢ d x = ∫ a b ∂ 1 ⁡ f ⁢ ( t ; x ) ⁢ d x . Para ver a prova deste teorema, consequência do teorema fundamental do cálculo, e uma generalização em que os limites de integração a e b são substituídos por funções contínuas a⁢(t) e b⁢(t), vide, por exemplo, a seção 4.9 da Ref. [9]. Em virtude da regra de Leibniz, a Eq. (32) adota a forma de uma lei de conservação: (34) d ⁢ Q a d ⁢ t = ∫ ∂ ⁡ V j a ⋅ d σ , com (35) Q a : = ∫ V j 0 a d 3 x a a-ésima «carga de Nöther» contida no volume V. Em particular, se o volume V se estende ao espaço ℝ3, a carga de Nöther se mantém constante sob a suposição de desvanecimento dos campos clássicos e de suas primeiras derivadas no infinito (condições assintóticas). Teorema 2 (Primeiro teorema recíproco de Nöther). Se, em um sistema de campos clássicos, r combinações linearmente independentes de derivadas funcionais da ação se reduzem a divergências, então a funcional da ação que lhes corresponde é invariante sob as transformações de um grupo de Lie Gr de r parâmetros para toda região Ω⊆ℝ4. Demonstração. Suponhamos, por hipótese do teorema, que são satisfeitas as identidades (36) ∂ μ j = a μ φ a ( x ; u ; ∂ u ) δ ⁢ 𝒜 δ ⁢ u ( a ∈ I r ) , com φa⁢(x;u;∂⁡u) funções diferenciáveis em relação a x ao menos duas vezes. Introduzimos um conjunto de r parâmetros numéricos {εa}a∈Ir e as notações (37) Δ ⁢ u = ε a ⁢ φ a ⁢ ( x ; u ; ∂ ⁡ u ) , (38) Δ x μ = - ε a 𝒫 { j + a μ ( ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) + ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ) φ a - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ∂ ν φ a } . Por cálculo direto pode-se então provar que, colocando as Eqs. (37) e (38) na expressão (39) Δ ⁢ 𝒫 + ∂ ρ ⁡ ( 𝒫 ⁢ Δ ⁢ x ρ ) = ∂ ⁡ 𝒫 ∂ ⁡ u ⁢ Δ ⁢ u + ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) ⁢ ∂ μ ⁡ Δ ⁢ u + ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ⁢ ∂ μ ⁡ ∂ ν ⁡ Δ ⁢ u + ∂ ρ ⁡ 𝒫 ⁢ Δ ⁢ x ρ + 𝒫 ⁢ ∂ ρ ⁡ Δ ⁢ x ρ , obtém-se a identidade (40) Δ ⁢ 𝒫 + ∂ ρ ⁡ ( 𝒫 ⁢ Δ ⁢ x ρ ) = ε a { ( ∂ ⁡ 𝒫 ∂ ⁡ u - ∂ ρ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) + ∂ μ ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ) φ a - ∂ ρ j } a ρ , cujo lado direito é nulo por hipótese do teorema, uma vez que a expressão interparentética se identifica com a derivada funcional da ação – vide as Eqs. (12) e (36). Por isto, qualquer que seja a região Ω⊆ℝ4, a integral do lado esquerdo da Eq. (40) estendida a ela será nula: (41) ∫ Ω { Δ ⁢ 𝒫 + ∂ ρ ⁡ ( 𝒫 ⁢ Δ ⁢ x ρ ) } ⁢ d x = 0 . Ora, essa é precisamente a variação da funcional da ação do sistema quando os campos e as coordenadas são submetidos às transformações das Eqs. (37) e (38), respectivamente – vide a Eq. (8). Do qual infere-se que a funcional da ação é invariante sob as transformações assim definidas. As transformações são, até esse ponto, conhecidas só infinitesimalmente. Porém, as Eqs. (37) e (38) estabelecem um sistema de equações diferenciais a partir do qual podem ser encontradas as transformações finitas, isto é, a evolução das coordenadas e campos com os parâmetros εa. Daqui se vê que tais transformações são contínuas por construção. Que elas formam um grupo se deriva, finalmente, do fato de haver r combinações linearmente independentes de derivadas funcionais da ação que se reduzem a divergências. Com efeito, se as tais transformações não formassem um grupo, então a aplicação de duas delas poderia levar a uma nova transformação, linearmente independente das outras, sob a qual a funcional da ação seria novamente invariante, e haveria então r+1 combinações linearmente independentes de derivadas funcionais da ação que se reduzem a divergências, e assim por diante, contradizendo a hipótese do teorema. , e as primeiras aplicações do mesmo mostram-se na seção4 4. Exemplos de Aplicação do Primeiro Teorema de Nöther e de seu Recíproco 4.1. Tensor canônico de energia-momento Consideremos a translação espaço-temporal por um vetor constante; as transformações das coordenadas e campos que lhe correspondem são (42) y = x + ε , v ⁢ ( y ) = u ⁢ ( x ) , que se condizem com (43) ( X σ ⁢ x ) ρ = δ σ ρ , ( U σ ⁢ u ) = 0 . Substituindo estas relações na Eq. (30), obtém-se que a corrente de Nöther associada às translações é o «tensor de energia-momento canônico»: (44) j = σ μ Θ . σ μ As correspondentes cargas de Nöther são as componentes do «vetor de energia-momento»: (45) P σ = ∫ V Θ 0 σ d 3 x , d P σ d t = − ∫ ∂ V Θ i σ d σ i . Invariância sob translações. De forma semelhante, pode-se ilustrar o primeiro teorema recíproco de Nöther com o exemplo inverso. Consideremos o campo escalar real u⁢(x), descrito pela densidade lagrangiana (46) ℒ = 1 2 ⁢ ∂ ⁡ u ⁢ ∂ ⁡ u - 1 2 ⁢ m 2 ⁢ u 2 . Suponhamos que se sabe que o tensor canônico de energia-momento, (47) Θ = ρ μ ∂ μ u ∂ ρ u - 1 2 δ ρ μ ( ∂ u ∂ u - m 2 u 2 ) , é conservado. Em virtude do primeiro teorema recíproco de Nöther, existirá uma simetria tal que o tensor canônico de energia-momento é a corrente de Nöther que lhe corresponde, sempre que a divergência deste possa ser escrita como combinação linear das derivadas funcionais da ação. Ora, neste exemplo há apenas um campo, e por isso a única derivada funcional da ação é (48) δ ⁢ 𝒜 δ ⁢ u = - ( □ + m 2 ) ⁢ u . Por outro lado, tomando a divergência da Eq. (47), obtém-se (49) ∂ μ Θ = ρ μ ( □ + m 2 ) u ∂ ρ u = - ∂ ρ u δ ⁢ 𝒜 δ ⁢ u . A comparação com a Eq. (36) permite identificar que φρ=-∂ρ⁡u. Com o uso das Eqs. (37), (38) e (3), finalmente, descobrimos que são as transformações (50) δ ⁢ u = 0 , Δ ⁢ x = ε as que constituem a simetria da ação que deriva na conservação do tensor canônico da energia-momento. A transformação mostrada, reconhece-se, é a translação pelo vetor constante ε. 4.2. Campo de Schrödinger Consideremos como exemplo o campo de Schrödinger (função de onda), ψ, e seu complexo conjugado, ψ*, sujeitos a satisfazer às equações de Schrödinger: (51) - ℏ 2 2 ⁢ m ⁢ ∇ 2 ⁡ ψ ⁢ ( x ) + V ⁢ ( x ) ⁢ ψ ⁢ ( x ) = i ⁢ ℏ ⁢ ∂ ⁡ ψ ⁢ ( x ) ∂ ⁡ t , - ℏ 2 2 ⁢ m ⁢ ∇ 2 ⁡ ψ * ⁢ ( x ) + V ⁢ ( x ) ⁢ ψ * ⁢ ( x ) = - i ⁢ ℏ ⁢ ∂ ⁡ ψ * ⁢ ( x ) ∂ ⁡ t . Como é bem conhecido, uma das razões sobre as quais assenta-se a interpretação de Copenhagen da função de onda como amplitude de probabilidade é o fato de que, multiplicando a primeira das Eqs. (51) por ψ* e a segunda por ψ, então subtraindo os resultados, obtém-se, após algumas aplicações da regra da derivação de um produto, a equação de continuidade: (52) ∂ t ⁡ ( ψ * ⁢ ψ ) - ∇ ⋅ { i ⁢ ℏ 2 ⁢ m ⁢ ( ψ * ⁢ ∇ ⁡ ψ - ∇ ⁡ ψ * ⁢ ψ ) } = 0 , a qual permite escrever a seguinte «lei de conservação da probabilidade»: (53) d d ⁢ t ⁢ ∫ V ψ * ⁢ ψ ⁢ d 3 ⁢ x = ∫ ∂ ⁡ V i ⁢ ℏ 2 ⁢ m ⁢ ( ψ * ⁢ ∇ ⁡ ψ - ∇ ⁡ ψ * ⁢ ψ ) ⋅ d σ . Em particular, se a função de onda – e por conseguinte também seu complexo conjugado – se anula no infinito espacial, então a integral do lado direito se anula, e a Eq. (53) identifica-se com a conservação no tempo da probabilidade total do evento descrito por ψ– comumente4 expresso como: «a probabilidade de encontrar a partícula em algum ponto do Universo deve ser sempre igual à unidade». Além disso, sob as condições assintóticas recém enunciadas, a equação acima indica que a normalização da função de onda se mantém invariante no tempo. Ora, toda a estrutura anterior se assemelha muito à do primeiro teorema de Nöther. Queremos ver, pois, se alguma simetria encontra-se no intus do desenvolvimento exposto. Para tal, nota-se que o campo não-relativístico de Schrödinger pode ser obtido a partir da densidade lagrangiana (simétrica) (54) ℒ = ℏ 2 2 ⁢ m ⁢ ∇ ⁡ ψ * ⁢ ∇ ⁡ ψ + V ⁢ ψ * ⁢ ψ - i ⁢ ℏ 2 ⁢ ψ * ⁢ ∂ ⁡ ψ ∂ ⁡ t + i ⁢ ℏ 2 ⁢ ψ ⁢ ∂ ⁡ ψ * ∂ ⁡ t . Com efeito, as derivadas funcionais da ação correspondente são (55) δ ⁢ 𝒜 δ ⁢ ψ = - ℏ 2 2 ⁢ m ⁢ ∇ 2 ⁡ ψ * + V ⁢ ψ * + i ⁢ ℏ ⁢ ∂ t ⁡ ψ * , (56) δ ⁢ 𝒜 δ ⁢ ψ * = - ℏ 2 2 ⁢ m ⁢ ∇ 2 ⁡ ψ + V ⁢ ψ - i ⁢ ℏ ⁢ ∂ t ⁡ ψ , cuja igualação a zero leva imediatamente às Eqs. (51). Logo vemos que as manipulações antes feitas às equações do movimento da função de onda e de seu conjugado podem, equivalentemente, ser efetuadas com as derivadas funcionais da ação. Assim, repetindo o procedimento anterior, encontra-se que (57) ∂ t ⁡ ( ψ * ⁢ ψ ) - i ⁢ ℏ 2 ⁢ m ⁢ ∇ ⋅ ( ψ * ⁢ ∇ ⁡ ψ - ∇ ⁡ ψ * ⁢ ψ ) = i ℏ ⁢ ψ * ⁢ δ ⁢ 𝒜 δ ⁢ ψ * - i ℏ ⁢ ψ ⁢ δ ⁢ 𝒜 δ ⁢ ψ . Por meio do primeiro teorema recíproco de Nöther, devemos admitir que a lei de conservação da probabilidade da mecânica ondulatória de Schrödinger é consequência da invariância da ação que lhe corresponde perante as transformações dos campos (58) Δ ⁢ ψ = ε ⁢ φ ψ , Δ ⁢ ψ * = ε ⁢ φ ψ * ; φ ψ = - i ℏ ⁢ ψ , φ ψ * = i ℏ ⁢ ψ * , e das coordenadas (59) Δ ⁢ t = - ε ℒ ⁢ { ψ * ⁢ ψ + ∂ ⁡ ℒ ∂ ⁡ ( ∂ t ⁡ ψ ) ⁢ φ ψ + ∂ ⁡ ℒ ∂ ⁡ ( ∂ t ⁡ ψ * ) ⁢ φ ψ * } = 0 , (60) Δ x = - ε ℒ { ( ψ * ∇ ψ - ∇ ψ * ψ ) + ∂ ⁡ ℒ ∂ ⁡ ( ∇ ⁡ ψ ) φ ψ + ∂ ⁡ ℒ ∂ ⁡ ( ∇ ⁡ ψ * ) φ ψ * } = 0 . Como as variações das coordenadas – de tempo e de espaço – são nulas, as transformações são «internas». A variação total dos campos é então igual à variação de sua forma funcional: (61) δ ⁢ ψ = - i ℏ ⁢ ε ⁢ ψ , δ ⁢ ψ * = i ℏ ⁢ ε ⁢ ψ * , cuja forma finita é a transformação de fase (62) ψ → e - i ⁢ ε / ℏ ⁢ ψ , ψ * → e i ⁢ ε / ℏ ⁢ ψ * . Destarte, a conservação da probabilidade é consequência da invariância da ação frente a transformações de fase da função de onda. Este exemplo mostra que, de forma geral, as leis de conservação que são obtidas a partir de combinações lineares das equações do movimento se encaixam nas hipóteses dos teoremas de Nöther, pois efetuar as mencionadas manipulações nas equações do movimento equivale a fazê-las sobre as derivadas funcionais da ação. . Um exemplo importante, que revela fatos fundamentais a respeito de tal teorema, é o do problema de Kepler, tratado na seção5 5. Simetrias Dinâmicas. O Problema de Kepler Passaremos a considerar um exemplo da mecânica dos pontos: o problema de Kepler, em que dois pontos materiais se movem, um ao redor do outro, por causa de sua força de gravidade mútua [12]. Como é bem sabido, este problema pode ser reduzido ao de um único corpo introduzindo, em substituição das coordenadas r1 e r2 dos dois corpos, as R e r, denotando a posição do centro das massas deles e a posição relativa r2-r1, respectivamente. Com efeito, a lagrangiana original, (63) L = 1 2 ⁢ m 1 ⁢ v 1 2 + 1 2 ⁢ m 2 ⁢ v 2 2 + G ⁢ m 1 ⁢ m 2 | r 2 - r 1 | , em que m1 e m2 são as massas dos pontos materiais que compõem o sistema, v1 e v2 suas respectivas velocidades, e G a constante newtoniana da gravitação universal, pode ser equivalentemente escrita como (64) L = 1 2 ⁢ ( m 1 + m 2 ) ⁢ V 2 + 1 2 ⁢ m ⁢ v 2 + k | r | , com V e v as velocidades correspondentes às coordenadas R e r, respectivamente, k≡G⁢m1⁢m2, e m a massa reduzida do sistema: (65) m := m 1 ⁢ m 2 m 1 + m 2 . Como se evidencia na Eq. (64), as coordenadas R do centro das massas são coordenadas cíclicas, de forma que as equações de Euler-Lagrange que lhes correspondem levam ao resultado de que d⁢V/d⁢t=0, e o centro das massas se move com velocidade constante (ou, particularmente, se encontra em repouso). Como, ademais, nem as coordenadas R nem suas derivadas temporais formam parte das equações de Euler-Lagrange correspondentes às coordenadas relativas r, é suficiente utilizar a lagrangiana (66) L = 1 2 ⁢ m ⁢ v 2 + k | r | , de forma que o problema tem sido reduzido, efetivamente, ao de um só corpo submetido ao potencial central. É evidente que essa lagrangiana possui ao menos as duas simetrias seguintes: (1) Simetria por translações temporais: Como a lagrangiana é explicitamente independente do tempo, será conservada a «energia» – vide as Eqs. (16) e (44), lembrando que os únicos índices do espaço-tempo são os temporais: μ,ρ,σ=t– (67) E ≡ Θ = ∂ ⁡ L ∂ ⁡ v ⋅ v - L = 1 2 ⁢ m ⁢ v 2 - k | r | . (2) Simetria por rotações espaciais: Transformações essas que compõem o grupo de Lie SO(3) de três parâmetros. A variação das coordenadas por uma transformação descrita pelo vetor Δ⁢φ– definida como tendo o módulo Δ⁢φ e a direção do eixo segundo o qual a rotação é operada, de acordo com a regra da mão direita – é5 (68) Δ ⁢ r = Δ ⁢ φ × r ⇔ Δ ⁢ r i = Δ ⁢ φ j ⁢ ε i ⁢ j ⁢ k ⁢ r k ⇔ ( U i ⁢ r ) j = ε i ⁢ j ⁢ k ⁢ r k . Substituindo na Eq. (30), encontra-se que (69) j i = - ∂ ⁡ L ∂ ⁡ v ⋅ ( U i ⁢ r ) = ε i ⁢ k ⁢ j ⁢ r k ⁢ ∂ ⁡ L ∂ ⁡ v j , ou seja, a corrente de Nöther correspondente ao grupo SO(3) é o vetor de momento angular: (70) j = r × ∂ ⁡ L ∂ ⁡ v = r × ( m ⁢ v ) ≡ L . em que temos feito uso da forma explícita da lagrangiana para obter a última igualdade. Logo, da própria definição de L decorre que (71) r ⋅ L = 0 = v ⋅ L , e o movimento da partícula (reduzida) está restrito ao plano ortogonal ao vetor constante L. Apesar de não haver, aparentemente, mais simetrias na lagrangiana, sabe-se que um sistema mecânico fechado com s graus de liberdade possui 2⁢s-1 integrais do movimento [13]. Ora, o sistema (reduzido) sob estudo possui s=3 graus de liberdade, e assim possui 2⁢s-1=5 constantes do movimento, das quais conhecemos quatro, a saber: {E;L1;L2;L3}. Do qual se segue que as trajetórias do sistema só poderão ser completamente determinadas uma vez que seja conhecida a quinta quantidade conservada. Para tentar encontrá-la, calculemos em primeiro lugar a derivada funcional da ação: (72) δ ⁢ 𝒜 δ ⁢ r = - k r 3 ⁢ r - m ⁢ d ⁢ v d ⁢ t . A equação do movimento é portanto (73) d ⁢ v d ⁢ t = - k m ⁢ r r 3 . Ademais, como o vetor L=m⁢r×v é constante, o uso da equação do movimento recém encontrada permite escrever (74) d d ⁢ t ⁢ ( v × L ) = d ⁢ v d ⁢ t × L = - k r 3 ⁢ r × ( r × v ) = - k r 3 ⁢ [ r ⁢ ( r ⋅ v ) - v ⁢ ( r 2 ) ] . Porém, r⋅v=2⁢r⁢vr, com vr=d⁢r/d⁢t a componente radial da velocidade. Assim, a Eq. (74) é igual a (75) d d ⁢ t ⁢ ( v × L ) = - k ⁢ [ r ⁢ ( v r r 2 ) - v ⁢ ( 1 r ) ] = d d ⁢ t ⁢ ( k ⁢ r r ) . Em uma palavra, sob o cumprimento das equações do movimento, o «vetor de Laplace-Runge-Lenz», A, é conservado (76) A := v × L - k r ⁢ r ; d ⁢ A d ⁢ t = 0 . Embora ele seja um vetor, certamente não adiciona três novas constantes do movimento ao problema – pois tal coisa seria impossível. Com efeito, há duas relações de vínculo entre o vetor de Laplace-Runge-Lenz e as outras quantidades conservadas, E e L: (1) Como tanto v×L como r são perpendiculares aL: (77) A ⋅ L = 0 . (2) Elevando o vetor de Laplace-Runge-Lenz ao quadrado: (78) A 2 = ( v × L ) 2 + k 2 - 2 ⁢ k r ⁢ r ⋅ ( v × L ) . Usando as identidades vetoriais a⋅(b×c)= c⋅(a×b) e a×(b×c)=b⁢(a⋅c)-c⁢(a⋅b), assim como a expressão da energia dada na Eq. (67) e a relação da Eq. (71), pode-se escrever (79) A 2 = k 2 + 2 ⁢ E ⁢ L 2 m . Uma forma de ver que não há mais relações envolvendo as constantes do movimento encontradas é verificar que elas determinam completamente as trajetórias do sistema. Como o vetor A é constante e, para mais, perpendicular a L, de forma que se localiza no plano constante em que ocorre o movimento, o ângulo θ que a posição r faz com ele pode ser usado para caracterizar o movimento. Assim, (80) A ⁢ r ⁢ cos ⁡ ( θ ) = A ⋅ r = r ⋅ ( v × L ) - k ⁢ r = L ⋅ ( r × v ) - k ⁢ r = L 2 m - k ⁢ r , do que decorre a equação das órbitas: (81) r = L 2 / k ⁢ m 1 + ( A / k ) ⁢ cos ⁡ ( θ ) . De sorte que a constante do movimento adicional, que permite fixar por completo as trajetórias físicas, é a direção do vetor de Laplace-Runge-Lenz, que aponta para o periastro, como se pode ver da equação recém escrita, em que a variável r adota seu menor valor quando θ=0, ou seja, quando r é paralelo ao vetorA. Sua conservação indica que a órbita não manifesta precessão. Desejamos, naturalmente, relacionar esta nova quantidade conservada a alguma simetria. Tal coisa, entretanto, não pode ser feita no formalismo lagrangiano. Isto não viola ao primeiro teorema recíproco de Nöther, pois esse tem por hipótese que (no âmbito da mecânica dos pontos) a derivada temporal da quantidade conservada seja escrita como combinação linear das derivadas funcionais da ação, sendo que é evidente que a derivada temporal do vetor de Laplace-Runge-Lenz, Eq. (76), não pode ser escrita como combinação linear das componentes da Eq. (72). Este exemplo mostra assim, de forma explícita, que nem todas as simetrias de um dado sistema físico estão contidas na lagrangiana. Já indicamos, não obstante, que o formalismo lagrangiano não esgota as possibilidades de aplicação dos teoremas de Nöther. Por isso, ainda é possível que o vetor de Laplace-Runge-Lenz corresponda, sim, a uma simetria no formalismo hamiltoniano. Ao problema de Kepler corresponde a hamiltoniana [vide a Eq. (67)] (82) H = p 2 2 ⁢ m - k r . O vetor de momento angular e de Laplace-Runge-Lenz são, respectivamente, como função das coordenadas e momentos, (83) L = r × p , A = 1 m ⁢ p × L - k r ⁢ r . Finalmente, as derivadas funcionais da ação são (84) δ ⁢ 𝒜 δ ⁢ r = - d ⁢ p d ⁢ t - k r 3 ⁢ r , δ ⁢ 𝒜 δ ⁢ p = v - p m . Como tanto as velocidades quanto as derivadas temporais do momento aparecem independentemente nessas derivadas funcionais, é de se esperar que, agora sim, a derivada temporal de A possa ser escrita como combinação linear delas. Acontece que tal é, verdadeiramente, o caso: (85) d ⁢ A d ⁢ t = 1 m ⁢ p × ( δ ⁢ 𝒜 δ ⁢ r × r ) - 1 m ⁢ δ ⁢ 𝒜 δ ⁢ r × ( r × p ) + 1 m ⁢ p × ( δ ⁢ 𝒜 δ ⁢ p × p ) - k r 3 ⁢ r × ( δ ⁢ 𝒜 δ ⁢ p × r ) . O mesmo pode ser feito com a derivada temporal do momento angular: (86) d ⁢ L d ⁢ t = δ ⁢ 𝒜 δ ⁢ r × r + δ ⁢ 𝒜 δ ⁢ p × p , e com a derivada temporal da energia: (87) d ⁢ E d ⁢ t = - 1 m ⁢ p ⋅ δ ⁢ 𝒜 δ ⁢ r + k r 3 ⁢ r ⋅ δ ⁢ 𝒜 δ ⁢ p . Destarte, no formalismo hamiltoniano o problema de Kepler tem todas suas constantes do movimento provindo de simetrias da ação. Em outras palavras, as simetrias completas do problema de Kepler não são expressíveis no espaço das configurações, mas somente no espaço das fases; por isto, ao grupo completo se dá o nome de «grupo dinâmico», em contraposição ao «grupo cinemático» das simetrias no espaço das configurações. Essa não é uma peculiaridade do problema de Kepler. De fato, o primeiro teorema recíproco de Nöther é sempre aplicável no formalismo hamiltoniano, o que significa que nesta formulação todas as simetrias estão presentes. Provaremos isso aqui para o caso mais simples da mecânica em que não há transformações do tempo, embora isto se satisfaça de forma geral – como é provado por técnicas mais complexas, por exemplo, na Ref. [14]. Lema 3. Seja A uma carga de Nöther, de forma que satisfaz a equação (88) { A ; H } + ∂ ⁡ A ∂ ⁡ t = 0 , com {•;•} os parênteses de Poisson, definidos de forma que (89) { f ; g } := ∂ ⁡ f ∂ ⁡ q ⁢ ∂ ⁡ g ∂ ⁡ p - ∂ ⁡ g ∂ ⁡ q ⁢ ∂ ⁡ f ∂ ⁡ p . A ação é invariante sob as transformações (90) Δ ⁢ t = 0 , Δ ⁢ q = ε ⁢ ∂ ⁡ A ∂ ⁡ p , Δ ⁢ p = - ε ⁢ ∂ ⁡ A ∂ ⁡ q . Demonstração. No formalismo hamiltoniano, o integrando da ação é a função (91) 𝒫 H = p ⁢ v - H . Calculando sua variação sob as transformações da Eq. (90): (92) Δ ⁢ 𝒫 H = ∂ ⁡ 𝒫 H ∂ ⁡ q ⁢ Δ ⁢ q + ∂ ⁡ 𝒫 H ∂ ⁡ p ⁢ Δ ⁢ p + ∂ ⁡ 𝒫 H ∂ ⁡ v ⁢ Δ ⁢ v = - ε ⁢ ∂ ⁡ H ∂ ⁡ q ⁢ ∂ ⁡ A ∂ ⁡ p - ε ⁢ ( v - ∂ ⁡ H ∂ ⁡ p ) ⁢ ∂ ⁡ A ∂ ⁡ q + d d ⁢ t ⁢ ( p ⁢ Δ ⁢ q ) - ε ⁢ d ⁢ p d ⁢ t ⁢ ∂ ⁡ A ∂ ⁡ p = - ε ⁢ ∂ ⁡ H ∂ ⁡ q ⁢ ∂ ⁡ A ∂ ⁡ p + ε ⁢ ∂ ⁡ H ∂ ⁡ p ⁢ ∂ ⁡ A ∂ ⁡ q - ε ⁢ v ⁢ ∂ ⁡ A ∂ ⁡ q - ε ⁢ d ⁢ p d ⁢ t ⁢ ∂ ⁡ A ∂ ⁡ p + d d ⁢ t ⁢ ( ε ⁢ p ⁢ ∂ ⁡ A ∂ ⁡ p ) . Identificando os parênteses de Poisson entre A e H nos dois primeiros termos, assim como a quantidade d⁢A/d⁢t-∂⁡A/∂⁡t nos dois seguintes, obtém-se (93) Δ ⁢ 𝒫 H = - ε ⁢ ( d ⁢ A d ⁢ t - { A ; H } - ∂ ⁡ A ∂ ⁡ t ) + d d ⁢ t ⁢ ( ε ⁢ p ⁢ ∂ ⁡ A ∂ ⁡ p ) = d d ⁢ t ⁢ ( - ε ⁢ A + ε ⁢ p ⁢ ∂ ⁡ A ∂ ⁡ p ) + ε ⁢ ( { A ; H } + ∂ ⁡ A ∂ ⁡ t ) . Devido à Eq. (88), o último termo é nulo para A uma corrente de Nöther, enquanto que o primeiro termo, sendo uma derivada temporal ordinária, leva, após integração, a uma variação da ação nula sob condições assintóticas apropriadas. O resultado recém provado, além do mais, mostra que as correntes de Nöther são geradoras de transformações canônicas. Com efeito, as transformações das coordenadas e momentos da Eq. (90) podem, equivalentemente, ser escritas como (94) Δ ⁢ q = ε ⁢ { q ; A } , Δ ⁢ p = ε ⁢ { p ; A } , as quais deixam invariantes os parênteses de Poisson fundamentais: Até a primeira ordem no parâmetro infinitesimal ε, { q + Δ q ; p + Δ p } = { q ; p } + { q ; Δ p } + { Δ q ; p } = 1 + ε ⁢ ( { q ; { p ; A } } + { { q ; A } ; p } ) = 1 + ε ⁢ { { q ; p } ; A } = 1 , em que tem sido usada a identidade de Jacobi para passar da segunda à terceira linha. Por outro lado, é fato bem conhecido que os parênteses de Poisson de duas quantidades conservadas é também uma quantidade conservada. Por exemplo, se A e B são quantidades conservadas que independem explicitamente do tempo – e, como consequência, também seus parênteses de Poisson –, d d ⁢ t ⁢ { A ; B } = { { A ; B } ; H } = { { A ; H } ; B } + { { H ; B } ; A } = 0 . Do que decorre que todas as quantidades conservadas independentes (que não são função das outras) formam uma álgebra de Lie fechada, pois há um número limitado delas, ou seja, haverá sempre um conjunto de constantes de estrutura gi⁢j⁢k tais que (95) { A i ; A j } = g i ⁢ j ⁢ k ⁢ A k . Os resultados anteriores são notáveis, pois permitem encontrar rapidamente qual é a álgebra do grupo de simetrias associada às correntes de Nöther. Com efeito, seja {Ai}i∈Ir o conjunto das quantidades conservadas independentes, às quais correspondem, respectivamente, as transformações das coordenadas e momentos Δi⁢u, com u∈{q;p}. Como tais transformações formam um grupo de Lie Gr de r parâmetros (primeiro teorema recíproco de Nöther, sempre aplicável ao formalismo hamiltoniano), será sempre possível escrever (96) [ Δ i ; Δ j ] ⁢ u := ( Δ i ⁢ Δ j - Δ j ⁢ Δ i ) ⁢ u = f i ⁢ j ⁢ k ⁢ Δ k ⁢ u , com fi⁢j⁢k as constantes de estrutura da álgebra do grupo Gr. Por outro lado, escrevendo as transformações como na Eq. (94), tem-se que (97) Δ 1 ⁢ Δ 2 ⁢ u - Δ 2 ⁢ Δ 1 ⁢ u = { u ; { A 1 ; A 2 } } ⇔ f i ⁢ j ⁢ k = g i ⁢ j ⁢ k . Em uma palavra: A álgebra (de comutadores) das transformações das coordenadas e momentos se iguala à álgebra (de parênteses de Poisson) das quantidades conservadas. Voltando ao problema de Kepler, definindo o vetor adimensional de Laplace-Runge-Lenz como (98) V := - m 2 ⁢ E ⁢ A , é já uma tarefa simples calcular a álgebra de parênteses de Poisson das quantidades conservadas, que resulta ser (99) { L i ; L j } = ϵ i ⁢ j ⁢ k ⁢ L k , { L i ; V j } = ϵ i ⁢ j ⁢ k ⁢ V k , { V i ; V j } = ϵ i ⁢ j ⁢ k ⁢ L k , enquanto que todos os parênteses de Poisson com a energia E são nulos. A álgebra da Eq. (99) identifica-se com a álgebra 𝔰⁢𝔬⁢(4). Logo os resultados prévios permitem-nos afirmar que o grupo dinâmico das simetrias do problema de Kepler é o grupo SO(4) (e as translações temporais), sem a necessidade de integrar as Eqs. (85), (86) e (87). . Na seção6 6. Segundo Teorema de Nöther e seu Recíproco Passaremos a estudar o segundo teorema de Nöther, que se instaura permitindo aos parâmetros do grupo de Lie Gr serem funções do ponto do espaço-tempo, dando lugar ao «grupo de infinitos parâmetros6» G∞⁢r. Teorema 4 (Segundo teorema de Nöther). Se o funcional da ação de um sistema de campos clássicos é invariante, na região Ω⊆ℝ4, sob as transformações de um grupo de Lie G∞⁢r de infinitos parâmetros obtido por localização do grupo Gr de r parâmetros, que se anulam em ∂⁡Ω junto com suas derivadas até de ordem igual à maior ordem k das derivadas dos parâmetros do grupo G∞⁢r que participam da lei de transformação dos campos, então há r identidades entre as derivadas funcionais da ação e suas derivadas, até de ordem k. Demonstração. Tal como fizemos para estabelecer a Eq. (12), consideraremos a dependência das diversas quantidades com derivadas de até segunda ordem, pois isso basta para mostrar os procedimentos gerais, enquanto que a generalização para derivadas de ordens superiores torna-se evidente. Sejam, portanto, as leis de transformação dos campos: (100) Δ ⁢ u = a a ⁢ ( x ; u ; ∂ ⁡ u ) ⁢ ε a ⁢ ( x ) + b a ρ ⁢ ( x ; u ; ∂ ⁡ u ) ⁢ ∂ ρ ⁡ ε a ⁢ ( x ) + c a ρ ⁢ σ ⁢ ( x ; u ; ∂ ⁡ u ) ⁢ ∂ ρ ⁡ ∂ σ ⁡ ε a ⁢ ( x ) . Por aplicação da regra de derivação de um produto é possível escrever (101) δ ⁢ 𝒜 δ ⁢ u ⁢ Δ ⁢ u = δ ⁢ 𝒜 δ ⁢ u ⁢ a a ⁢ ε a + δ ⁢ 𝒜 δ ⁢ u ⁢ b a ρ ⁢ ∂ ρ ⁡ ε a + δ ⁢ 𝒜 δ ⁢ u ⁢ c a ρ ⁢ σ ⁢ ∂ ρ ⁡ ∂ σ ⁡ ε a = { a a ⁢ δ ⁢ 𝒜 δ ⁢ u - ∂ ρ ⁡ ( b a ρ ⁢ δ ⁢ 𝒜 δ ⁢ u ) + ∂ ρ ⁡ ∂ σ ⁡ ( c a ρ ⁢ σ ⁢ δ ⁢ 𝒜 δ ⁢ u ) } ⁢ ε a + ∂ μ { δ ⁢ 𝒜 δ ⁢ u ( b a μ ε a + c a μ ⁢ σ ∂ σ ε a ) - ∂ σ ( c a μ ⁢ σ δ ⁢ 𝒜 δ ⁢ u ) ε a } . Substituindo na Eq. (11), (102) Δ ⁢ 𝒫 + ∂ ⁡ ( 𝒫 ⁢ Δ ⁢ x ) = { a a ⁢ δ ⁢ 𝒜 δ ⁢ u - ∂ ρ ⁡ ( b a ρ ⁢ δ ⁢ 𝒜 δ ⁢ u ) + ∂ ρ ⁡ ∂ σ ⁡ ( c a ρ ⁢ σ ⁢ δ ⁢ 𝒜 δ ⁢ u ) } ⁢ ε a - ∂ μ { J μ - δ ⁢ 𝒜 δ ⁢ u ( b a μ ε a + c a μ ⁢ σ ∂ σ ε a ) + ∂ σ ( c a μ ⁢ σ δ ⁢ 𝒜 δ ⁢ u ) ε a } . Assim, se a integração é feita sobre a região Ω em cuja fronteira os parâmetros εa⁢(x) e suas derivadas até da segunda ordem se anulam, então (103) δ 𝒜 = ∫ Ω { a a δ ⁢ 𝒜 δ ⁢ u - ∂ ρ ( b a ρ δ ⁢ 𝒜 δ ⁢ u ) + ∂ ρ ∂ σ ( c a ρ ⁢ σ δ ⁢ 𝒜 δ ⁢ u ) } ε a ( x ) d x . Como, finalmente, as funções εa⁢(x) são independentes e arbitrárias – sujeitas só às condiçãoes já mencionadas –, a hipótese da invariância da ação implica, pelo lema fundamental do cálculo variacional [15], que (104) ∀ a ∈ I r : a a δ ⁢ 𝒜 δ ⁢ u = ∂ ρ ( b a ρ δ ⁢ 𝒜 δ ⁢ u ) - ∂ ρ ∂ σ ( c a ρ ⁢ σ δ ⁢ 𝒜 δ ⁢ u ) . Terminamos fazendo notar que a Eq. (12) é válida para funções 𝒫 de qualquer ordem, apenas mudando as expressões explícitas da derivada funcional da ação e da corrente infinitesimal. Por outro lado, é patente que se na Eq. (100) permitíssemos a dependência com derivadas de εa⁢(x) até da ordem k, então na Eq. (101) apareceriam derivadas até da ordem k da derivada funcional da ação na expressão proporcional a εa. O segundo teorema de Nöther, certamente, deve ser visto também como a prova do seguinte enunciado: Quando o grupo de simetrias é localizado de forma que seus parâmetros se tornem funções do ponto do espaço-tempo, a variação dos campos deve depender da derivada destes, pelo menos até a primeira ordem. Efetivamente, se negarmos isto, então deveríamos colocar baρ=0=caρ⁢σ na Eq. (104), e as equações de Euler-Lagrange tornariam-se em identidades, isto é, seriam satisfeitas por qualquer função u. Donde o princípio variacional seria inaplicável para o estabelecimento das leis físicas. Em outras palavras, é impossível escrever uma teoria invariante perante um grupo de simetrias localizadas em que todos os campos se transformem de acordo com os parâmetros εa⁢(x), mas não com suas derivadas7. Quanto às leis de conservação, nota-se que, segundo a Eq. (102), uma vez que as identidades da Eq. (104) sejam satisfeitas, ter-se-á que (105) ∂ μ ⁡ { J μ - δ ⁢ 𝒜 δ ⁢ u ⁢ ( b a μ ⁢ ε a + c a μ ⁢ σ ⁢ ∂ σ ⁡ ε a ) + ∂ σ ⁡ ( c a μ ⁢ σ ⁢ δ ⁢ 𝒜 δ ⁢ u ) ⁡ ε a } = 0 . Quando as equações do movimento são satisfeitas, obtém-se a lei de conservação da corrente infinitesimal: (106) ∂ μ ⁡ J μ = 0 . Esta lei não é a mesma que a que se obtém devido à invariância sob transformações globais, pois a divergência ∂μ⁡Jμ contém não somente os parâmetros εa, mas também a suas derivadas. Contudo, pode-se verificar que a lei de continuidade obtida do primeiro teorema de Nöther está contida na Eq. (106), a qual contém não só àquela, senão também informações adicionais de grande utilidade. Teorias com simetrias internas. As teorias com simetrias internas (em que as coordenadas não se transformam) constituem a valiosa classe das teorias de calibre para as interações não gravitacionais. Denotando, para simplificar a notação, (107) A μ := ∂ ν ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) ; B μ ⁢ ν := ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) , a corrente de Nöther é (108) j a μ = A μ ⁢ a a - B μ ⁢ ν ⁢ ∂ ν ⁡ a a , pois Jμ se reduz a εa⁢jaμ quando os parâmetros tornam-se constantes. De forma geral, agrupando os termos segundo a ordem da derivada dos parâmetros do qual dependem, (109) J μ = j a μ ⁢ ε a + ( A μ ⁢ b a ν - B μ ⁢ ν ⁢ a a - B μ ⁢ ρ ⁢ ∂ ρ ⁡ b a ν ) ⁢ ∂ ν ⁡ ε a + ( A μ ⁢ c a ρ ⁢ ν - B μ ⁢ ν ⁢ b a ρ - B μ ⁢ σ ⁢ ∂ σ ⁡ c a ρ ⁢ ν ) ⁢ ∂ ρ ⁡ ∂ ν ⁡ ε a - B μ ⁢ ν ⁢ c a ρ ⁢ σ ⁢ ∂ ν ⁡ ∂ ρ ⁡ ∂ σ ⁡ ε a . Aplicando a divergência e agrupando os termos novamente: (110) ∂ μ ⁡ J μ = ε a ⁢ ( ∂ μ ⁡ j a μ ) + ∂ μ ⁡ ε a ⁢ [ j a μ + ∂ ν ⁡ ( A ν ⁢ b a μ - B ν ⁢ μ ⁢ a a - B ν ⁢ ρ ⁢ ∂ ρ ⁡ b a μ ) ] + ∂ μ ∂ ν ε a [ ( A μ b a ν - B μ ⁢ ν a a - B μ ⁢ ρ ∂ ρ b a ν ) + ∂ ρ ( A ρ c a μ ⁢ ν - B ρ ⁢ ν b a μ - B ρ ⁢ σ ∂ σ c a μ ⁢ ν ) ] + ∂ μ ∂ ν ∂ ρ ε a [ ( A μ c a ν ⁢ ρ - B μ ⁢ ρ b a ν - B μ ⁢ σ ∂ σ c a ν ⁢ ρ ) - ∂ σ ( B σ ⁢ μ c a ν ⁢ ρ ) ] - ∂ μ ∂ ν ∂ ρ ∂ σ ε a ( B μ ⁢ ν c a ρ ⁢ σ ) . Como os parâmetros εa⁢(x) e suas derivadas são independentes, os coeficientes destes devem ser todos nulos. Assim, se definirmos as quantidades (111) J ( 1 ) ⁢ a μ ⁢ ν := - ( A μ ⁢ b a ν - B μ ⁢ ν ⁢ a a - B μ ⁢ ρ ⁢ ∂ ρ ⁡ b a ν ) , (112) J ( 2 ) ⁢ a μ ⁢ ν ⁢ ρ := A μ ⁢ c a ν ⁢ ρ - B μ ⁢ ρ ⁢ b a ν - B μ ⁢ σ ⁢ ∂ σ ⁡ c a ν ⁢ ρ , (113) J ( 3 ) ⁢ a μ ⁢ ν ⁢ ρ ⁢ σ := B μ ⁢ ν ⁢ c a ρ ⁢ σ , então a Eq. (106) implica que, sob o cumprimento das equações do movimento dos campos, a corrente de Nöther pode ser determinada por derivação sucessiva a partir de um tensor antissimétrico, como o indica o seguinte sistema de «equações de descida»: (114) J ( 3 ) ⁢ a μ ⁢ ν ⁢ ρ ⁢ σ = - J ( 3 ) ⁢ a μ ⁢ σ ⁢ ρ ⁢ ν , J ( 2 ) ⁢ a μ ⁢ ν ⁢ ρ = ∂ σ ⁡ J ( 3 ) ⁢ a σ ⁢ μ ⁢ ν ⁢ ρ , J ( 1 ) ⁢ a μ ⁢ ν = ∂ ρ ⁡ J ( 2 ) ⁢ a ρ ⁢ μ ⁢ ν , j a μ = ∂ ν ⁡ J ( 1 ) ⁢ a ν ⁢ μ , e que esta corrente é, de fato, conservada: (115) ∂ μ ⁡ j a μ = 0 . Desta forma, o segundo teorema de Nöther leva à mesma lei de conservação que o primeiro teorema, mas, adicionalmente, estabelece um sistema de equações para encontrar a corrente por derivação sucessiva. Teorias com simetrias localizadas gerais da primeira ordem. É claro, as simetrias localizadas não são somente do tipo interno. Por exemplo, é perfeitamente possível escrever teorias da gravidade mediante a localização de simetrias que mudam também às coordenadas do espaço-tempo; tais são, verbi gratia , o teleparalelismo (com grupo das translações localizadas), teorias de calibre do grupo de Poincaré (em particular, a teoria de Einstein-Cartan), et cetera – vide, por exemplo, a Ref. [20]. Sem ir muito longe, mostraremos o dito para teorias da primeira ordem, com variações dependentes da derivada do parâmetro até, também, a primeira ordem. Dessa vez, é preciso incluir a variação das coordenadas, (116) Δ ⁢ x μ = d a μ ⁢ ε a + e a μ ⁢ ν ⁢ ∂ ν ⁡ ε a . A corrente de Nöther é (117) j a μ = - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) ⁢ a a - 𝒫 ⁢ d a μ , enquanto que a corrente infinitesimal possui a expressão (118) J μ = j a μ ⁢ ε a - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) ⁢ b a ρ ⁢ ∂ ρ ⁡ ε a - 𝒫 ⁢ e a μ ⁢ ν ⁢ ∂ ν ⁡ ε a . Tomando a divergência e agrupando termos: (119) ∂ μ ⁡ J μ = ε a ⁢ ( ∂ μ ⁡ j a μ ) + ∂ μ ⁡ ε a ⁢ [ j a μ - ∂ ρ ⁡ ( ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ ρ ⁡ u ) ⁢ b a μ + 𝒫 ⁢ e a ρ ⁢ μ ) ] - ∂ μ ⁡ ∂ ν ⁡ ε a ⁢ ( ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) ⁢ b a ρ + 𝒫 ⁢ e a μ ⁢ ρ ) . Por isso, definindo (120) J ( 1 ) ⁢ a μ ⁢ ρ := ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) ⁢ b a ρ + 𝒫 ⁢ e a μ ⁢ ρ , sob o cumprimento das equações de Euler-Lagrange ter-se-á o sistema de equações de descida: (121) J ( 1 ) ⁢ a μ ⁢ ρ = - J ( 1 ) ⁢ a ρ ⁢ μ , j a μ = ∂ ρ ⁡ J ( 1 ) ⁢ a ρ ⁢ μ , ∂ μ ⁡ j a μ = 0 . Desejamos, por último, chamar a atenção ao fato de que, na mecânica do ponto material, em que os índices são somente temporais, é impossível ter-se um tensor antissimétrico não nulo. O segundo teorema de Nöther, então, implica, via as equações de descida, que a corrente de Nöther tem de ser nula quando construída com coordenadas físicas. Isto será exemplificado na seção7. É importante salientarmos também que as identidades fornecidas pelo segundo teorema de Nöther reduzem o número de equações de Euler-Lagrange independentes de uma dada teoria, o que de forma geral leva ao aparecimento de vínculos ao se passar ao formalismo hamiltoniano, que é então uma tarefa não trivial8. Como outrora, estes pontos e outros a mais serão melhor visualizados ao considerarmos o exemplo da seção7. Antes disso, porém, enunciaremos o recíproco do segundo teorema de Nöther. Teorema 5 (Segundo teorema recíproco de Nöther). Se, em um sistema de campos clássicos, existem r identidades entre as derivadas funcionais da ação e suas derivadas até da ordem k, então a funcional da ação é invariante sob as transformações de um grupo de Lie localizado G∞⁢r, em que as variações dos campos contém derivadas dos parâmetros até da ordem k. Demonstração. Fixando a atenção no caso com k=2 (a generalização é imediata), é hipótese do segundo teorema recíproco a validade de, exatamente, a Eq. (104). Definindo, pela identificação dos coeficientes da mencionada expressão, a variação dos campos como na Eq. (100), obter-se-á que o integrando da variação da ação, Δ⁢𝒫+∂ρ⁡(𝒫⁢Δ⁢xρ), é nulo, módulo uma divergência. Integrando-a numa região Ω⊆ℝ4 em cuja fronteira os parâmetros e suas derivadas se anulam, encontrar-se-á a desejada invariância da funcional da ação. Finalmente, como no primeiro teorema recíproco, que as transformações constituem um grupo decorre da existência de, exatamente, r identidades, que determinam as r transformações linearmente independentes dos campos. , abordamos o segundo teorema de Nöther e seu recíproco, e sua estreita relação com as teorias de calibre é logo introduzida na seção7 7. Princípio da Invariância de Calibre na Mecânica do Ponto Estudaremos, para iniciar, um exemplo da mecânica do ponto, que nos servirá para introduzir o princípio da invariância de calibre – geralmente, porém, como veremos aqui, não necessariamente, introduzido só na teoria do campo clássico – e estudar as consequências do segundo teorema de Nöther. Consideremos a lagrangiana de duas partículas livres de massas m1 e m2 (122) L = 1 2 ⁢ m 1 ⁢ v 1 2 + 1 2 ⁢ m 2 ⁢ v 2 2 . Ela pode ser escrita em função da massa reduzida m fazendo o escalamento das coordenadas segundo (123) r 1 → m 2 m 1 + m 2 ⁢ r 1 , r 2 → m 1 m 1 + m 2 ⁢ r 2 , com o qual (124) L = 1 2 ⁢ m ⁢ ( v 1 2 + v 2 2 ) . Mais ainda, se introduzirmos as coordenadas complexas (125) r := 1 2 ⁢ ( r 1 + i ⁢ r 2 ) , r * := 1 2 ⁢ ( r 1 - i ⁢ r 2 ) , ter-se-á que (126) L = m ⁢ v * ⋅ v . Está claro que essa lagrangiana possui a simetria por transformações de fase, r→ei⁢α⁢r e r*→e-i⁢α⁢r*, as quais se escrevem infinitesimalmente como: Δ⁢r=i⁢α⁢r e Δ⁢r*=-i⁢α⁢r*. A corrente conservada que corresponde a tal simetria é (127) α ⁢ j = - ∂ ⁡ L ∂ ⁡ v ⋅ Δ ⁢ r - ∂ ⁡ L ∂ ⁡ v * ⋅ Δ ⁢ r * ⇒ j = i ⁢ m ⁢ ( r * ⋅ v - v * ⋅ r ) . As transformações de fase das variáveis complexas correspondem, evidentemente, às transformações segundo o grupo SO(2) das coordenadas reais r1 e r2, isto é, às transformações (128) r 1 ′ = cos ⁡ ( α ) ⁢ r 1 - sin ⁡ ( α ) ⁢ r 2 , r 2 ′ = sin ⁡ ( α ) ⁢ r 1 + cos ⁡ ( α ) ⁢ r 2 . A transformação interna global (de parâmetro «α» constante) até agora considerada, é uma simetria da teoria livre. Weyl propôs que a teoria em interação pode ser construída a partir dela por localização daquela: Princípio da invariância de calibre: Se uma (densidade) lagrangiana é invariante perante as transformações do grupo de Lie (global) Gr, então deve sê-lo também perante as transformações do grupo G∞⁢r obtido por localização do primeiro. O grupo de calibre global da lagrangiana da Eq. (126) é o grupo U(1). As correspondentes transformações de fase locais, infinitesimalmente, se escrevem (129) Δ ⁢ r = i ⁢ α ⁢ ( t ) ⁢ r , Δ ⁢ r * = - i ⁢ α ⁢ ( t ) ⁢ r * . As transformações das velocidades são (130) Δ ⁢ v = i ⁢ d t ⁢ α ⁢ r + i ⁢ α ⁢ v , Δ ⁢ v * = - i ⁢ d t ⁢ α ⁢ r * - i ⁢ α ⁢ v * . Logo se vê que a lagrangiana não é invariante pelas transformações escritas, pois ao calcular sua variação obtemos (131) Δ ⁢ L = i ⁢ m ⁢ d t ⁢ α ⁢ ( v * ⋅ r - r * ⋅ v ) = - j ⁢ d t ⁢ α ≠ 0 . Destarte, a lagrangiana L não satisfaz o princípio da invariância de calibre, e deve, como consequência, ser modificada. Executando um paralelismo com o tratamento de Utiyama na teoria do campo clássico – vide as Refs. [18, 19] –, introduzimos uma nova coordenada A, chamada «coordenada de calibre», com a seguinte lei de transformação: (132) Δ ⁢ A = α ⁢ ( U ⁢ A ) + d t ⁢ α . O motivo para introduzirmos a variação de A dependente da derivada do parâmetro α⁢(t) é que, como dissemos alhures, é impossível uma teoria (não trivial) possuir a invariância local sem ao menos um dos campos se transformar segundo a derivada dos parâmetros localizados – o que, digamos de passagem, explica o resultado da Eq. (131). A dependência é com a derivada de até primeira ordem devido a que os termos que impedem a lagrangiana ser invariante perante a transformação local possuem a mesma dependência, Eq. (131). A teoria invariante de calibre local será descrita pela lagrangiana L′=L′⁢(r;r*;v;v*;A), com variação (133) Δ ⁢ L ′ = ∂ ⁡ L ′ ∂ ⁡ r ⋅ Δ ⁢ r + ∂ ⁡ L ′ ∂ ⁡ r * ⋅ Δ ⁢ r * + ∂ ⁡ L ′ ∂ ⁡ v ⋅ Δ ⁢ v + ∂ ⁡ L ′ ∂ ⁡ v * ⋅ v * + ∂ ⁡ L ′ ∂ ⁡ A ⁢ Δ ⁢ A = i ⁢ α ⁢ ( ∂ ⁡ L ′ ∂ ⁡ r ⋅ r - ∂ ⁡ L ′ ∂ ⁡ r * ⋅ r * + ∂ ⁡ L ′ ∂ ⁡ v ⋅ v - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ v * - i ⁢ ∂ ⁡ L ′ ∂ ⁡ A ⁢ ( U ⁢ A ) ) ⏟ (I) + i ⁢ d t ⁢ α ⁢ ( ∂ ⁡ L ′ ∂ ⁡ v ⋅ r - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ r * - i ⁢ ∂ ⁡ L ′ ∂ ⁡ A ) ⏟ (II) . Como o parâmetro α⁢(t) e sua derivada, dt⁢α⁢(t), são independentes, as duas expressões (I) e (II) na Eq. (133) devem ser simultaneamente nulas. (II)=0. Comecemos estudando a condição de ser (II)=0. A equação que se obtém por essa imposição, (134) ∂ ⁡ L ′ ∂ ⁡ A = - i ⁢ ( ∂ ⁡ L ′ ∂ ⁡ v ⋅ r - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ r * ) , pode ser solucionada de forma recursiva (método de aproximações sucessivas de Picard). Supondo que a lagrangiana L′ pode ser obtida suavemente a partir da L, com a qual se iguala quando A=0, solucionemos a Eq. (134) colocando L em seu lado direito: (135) ∂ ⁡ L ′ ∂ ⁡ A = - i ⁢ m ⁢ ( v * ⋅ r - v ⋅ r * ) ⇒ L ′ = L - i ⁢ m ⁢ A ⁢ ( v * ⋅ r - v ⋅ r * ) . Colocando agora esta nova lagrangiana no lado direito da Eq. (134) e solucionando para L′, (136) ∂ ⁡ L ′ ∂ ⁡ A = - i ⁢ m ⁢ ( v * ⋅ r - v ⋅ r * ) + 2 ⁢ m ⁢ A ⁢ r * ⋅ r ⇒ L ′ = L - i ⁢ m ⁢ A ⁢ ( v * ⋅ r - v ⋅ r * ) + m ⁢ A 2 ⁢ r * ⋅ r . E como o novo termo não depende das velocidades, o procedimento recursivo termina aqui. Salientamos que o método recursivo aqui aplicado pode ser diretamente transladado à teoria do campo clássico. De fato, esse é um dos métodos para a construção das teorias de calibre, utilizado, por exemplo, na Ref. [20]. Como explicado nesta referência, as teorias de Yang-Mills possuem a agradável peculiaridade de, como em nosso exemplo, o procedimento recursivo terminar em um número finito de passos. No caso da gravidade, por outro lado, o procedimento recursivo é infinito, o que não significa que ele não possa ser resolvido: Denotando por rj as componentes de todas as coordenadas (ou seja, tanto de r quanto de r*) e supondo que a lagrangiana L′ possa ser expandida em série de potências da coordenada de calibre A, (137) L ′ ⁢ ( r ; v ; A ) = ∑ n ∈ ℕ 0 1 n ! ⁢ A n ⁢ L ( n ) , L ( 0 ) ≡ L , a Eq. (134) leva a (138) L ( n + 1 ) = - i ⁢ ∂ ⁡ L ( n ) ∂ ⁡ v j ⁢ r j = ⋯ = ( - i ) n + 1 ⁢ ∂ n + 1 ⁡ L ∂ ⁡ v j 1 ⁢ ⋯ ⁢ ∂ ⁡ v j n + 1 ⁢ r j 1 ⁢ ⋯ ⁢ r j n + 1 , donde (139) L ′ ⁢ ( r ; v ; A ) = ∑ n ∈ ℕ 0 ( - i ) n ⁢ A n n ! ⁢ ∂ n ⁡ L ∂ ⁡ v j 1 ⁢ ⋯ ⁢ ∂ ⁡ v j n ⁢ r j 1 ⁢ ⋯ ⁢ r j n = L ⁢ ( r ; v - i ⁢ A ⁢ r ) . Assim, ainda que o procedimento recursivo seja infinito, o resultado em qualquer caso se reduz à chamada «prescrição do acoplamento mínimo», derivada pela primeira vez por Utiyama para teorias de calibre gerais [18] e segundo a qual: Prescrição9 do acoplamento mínimo: A (densidade) lagrangiana invariante perante as transformações de calibre locais se obtém pela substituição das derivadas temporais dt pelas «derivadas covariantes» Dt definidas como (140) D t := d t - i ⁢ A . Em particular, isto leva a substituir as velocidades v pelas «velocidades covariantes» V: (141) L ′ ⁢ ( r ; v ; A ) = L ⁢ ( r ; V ) , V = v - i ⁢ A ⁢ r . Um cálculo rápido permite verificar que a lagrangiana da Eq. (136) se obtém da Eq. (126) pela substituição mencionada. (I)=0. Uma vez que conhecemos a forma da nova lagrangiana L′, a condição (I)=0 permitirá fixar por completo a lei de variação da coordenada de calibre A. Com efeito, da Eq. (133) se vê que a presente condição é (142) ∂ ⁡ L ′ ∂ ⁡ A ⁢ ( U ⁢ A ) = - i ⁢ ( ∂ ⁡ L ′ ∂ ⁡ r ⋅ r - ∂ ⁡ L ′ ∂ ⁡ r * ⋅ r * + ∂ ⁡ L ′ ∂ ⁡ v ⋅ v - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ v * ) . Como o lado direito dessa equação é nulo uma vez que se substitui nele a lagrangiana L′ da Eq. (136), deverá ser (U⁢A)=0 e, por isso, a variação da coordenada de calibre será (143) Δ ⁢ A = d t ⁢ α . Isto permite justificar o nome «velocidade covariante» da quantidade V definida na Eq. (141), pois sua variação é (144) Δ ⁢ V = Δ ⁢ v - i ⁢ Δ ⁢ A ⁢ r - i ⁢ A ⁢ Δ ⁢ r = i ⁢ α ⁢ ( v - i ⁢ A ⁢ r ) = i ⁢ α ⁢ V , ou seja, a velocidade covariante V se transforma, perante uma transformação de calibre local, como o faz a velocidade v perante uma global. Sendo que temos já a teoria invariante de calibre global e local para as coordenadas iniciais e sua interação com a coordenada de calibre, é preciso procurarmos pela lagrangiana da coordenada de calibre livre. Denotando-a por LA=LA⁢(A;∂⁡A), sua lei de transformação será (145) Δ ⁢ L A = ∂ ⁡ L A ∂ ⁡ A ⁢ Δ ⁢ A + ∂ ⁡ L A ∂ ⁡ ( d t ⁢ A ) ⁢ d t ⁢ Δ ⁢ A = ∂ ⁡ L A ∂ ⁡ A ⁢ d t ⁢ α + ∂ ⁡ L A ∂ ⁡ ( d t ⁢ A ) ⁢ d t 2 ⁢ α . Semelhante variação deveria ser nula para que a teoria seja invariante de calibre local. Ora, a equação anterior indica que isso só será possível se LA=0, e a coordenada de calibre não possuirá uma dinâmica própria. Em outras palavras, a coordenada de calibre satisfará apenas a equações de vínculos. A teoria invariante de calibre completa será, portanto, a descrita pela lagrangiana (146) L ′ = m ⁢ v * ⋅ v - i ⁢ m ⁢ A ⁢ ( v * ⋅ r - v ⋅ r * ) + m ⁢ A 2 ⁢ r * ⋅ r . No caso unidimensional, com r≡r, r*≡r*– caso particular que consideraremos mais detalhadamente abaixo –, esta lagrangiana é equivalente à do modelo mecânico de Christ-Lee com potencial nulo [21] – vide também o Exemplo 4 na Ref. [17] para um tratamento hamiltoniano. A aplicação do primeiro teorema de Nöther revela que a corrente de Nöther dessa teoria é (147) j ′ = i ⁢ m ⁢ ( v ⋅ r * - v * ⋅ r ) + 2 ⁢ m ⁢ A ⁢ r * ⋅ r , que se conservará ao sujeitarmos as coordenadas às equações do movimento. Escrevendo-a em função das velocidades covariantes, a corrente de Nöther é (148) j ′ = i ⁢ m ⁢ ( r * ⋅ V - r ⋅ V * ) . Daqui se observa que a nova corrente se obtém da primeira, Eq. (127), pela substituição das quantidades iniciais pelas covariantes. Apliquemos agora o segundo teorema de Nöther. Das leis de transformação das diversas coordenadas envolvidas, pode-se identificar [vide a Eq. (100)] (149) a r = i ⁢ r , b r = 0 ; a r * = - i ⁢ r * , b r * = 0 ; a A = 0 , b A = 1 . Substituindo na Eq. (104), obtemos a expressão do segundo teorema de Nöther: (150) i ⁢ r ⋅ δ ⁢ 𝒜 ′ δ ⁢ r - i ⁢ r * ⋅ δ ⁢ 𝒜 ′ δ ⁢ r * = d d ⁢ t ⁢ ( δ ⁢ 𝒜 ′ δ ⁢ A ) , de forma que não todas as derivadas funcionais são independentes, pois existe uma relação entre elas; como consequência, há mais funções incógnitas do que equações, donde haverá também uma liberdade de escolha de uma daquelas (liberdade de calibre). Assim, se as equações do movimento para A, r, r1* e r2* forem satisfeitas, a relação anterior implica que, necessariamente, a equação do movimento para r3* será também, automaticamente, satisfeita. Equivalentemente, qualquer uma das equações do movimento para ri ou ri* pode ser escrita em função das outras; porém, a equação do movimento para A, não, pois ela aparece na tese do segundo teorema de Nöther somente através de uma derivada temporal. Sendo assim, embora uma coordenada pode ser, de fato, eliminada por ser desnecessária para a descrição do sistema, tal não pode ser a coordenada de calibre. Para exemplificar isto, escrevemos as derivadas funcionais da ação de nosso modelo particular, que são as seguintes10: (151) δ ⁢ 𝒜 ′ δ ⁢ r * = - m ⁢ d t ⁢ ( v - i ⁢ A ⁢ r ) + i ⁢ m ⁢ A ⁢ ( v - i ⁢ A ⁢ r ) , (152) δ ⁢ 𝒜 ′ δ ⁢ r = - m ⁢ d t ⁢ ( v * + i ⁢ A ⁢ r * ) - i ⁢ m ⁢ A ⁢ ( v * + i ⁢ A ⁢ r * ) , (153) δ ⁢ 𝒜 ′ δ ⁢ A = i ⁢ m ⁢ ( r * ⋅ v - v * ⋅ r ) + 2 ⁢ m ⁢ A ⁢ r * ⋅ r = j ′ . Supondo a validade das equações do movimento para r e r*, obter-se-ia, via o segundo teorema de Nöther, a lei de conservação (154) d t ⁢ j ′ = 0 . Mas dela não se segue, de forma nenhuma, que seja j′=0, que é a equação do movimento para A11. Para mostrar a liberdade de escolha de uma das funções incógnitas, reduziremos o problema até agora exposto ao caso do espaço unidimensional. A equação do movimento de A permite então obter12 (155) A ⁢ ( t ) = i 2 ⁢ ( v * r * - v r ) . Eliminaremos o desconhecimento da função r* exigindo que seja (156) r * ⁢ ( t ) = f ⁢ ( t ) ; v * ⁢ ( t ) = d t ⁢ f ⁢ ( t ) . Substituindo as Eqs. (159) e (158) na equação do movimento para r [Eq. (155)], obtém-se, sob a suposição de ser f≠0, (157) d t ⁢ A = - i ⁢ A 2 - 2 ⁢ d t ⁢ f f ⁢ A + i ⁢ d t 2 ⁢ f f ; A ⁢ ( 0 ) = i 2 ⁢ ( d t ⁢ f ⁢ ( 0 ) f ⁢ ( 0 ) - v 0 r 0 ) . Esta é uma equação diferencial ordinária da primeira ordem, cuja condição inicial decorre da definição de A [Eq. (158)] – denotamos r0=r⁢(0) e v0=v⁢(0)–, e que possui solução sob condições razoáveis de continuidade de f. Uma vez obtida a função A⁢(t), isolando em sua expressão a coordenada r, ela poderá ser integrada: (158) v r = 2 ⁢ i ⁢ A + d t ⁢ f f ⇒ r ⁢ ( t ) = r 0 ⁢ exp ⁡ { ∫ 0 t ( 2 ⁢ i ⁢ A + d t ⁢ f f ) ⁢ d t } . Destarte, uma multidão de possíveis movimentos são possíveis para a coordenada r. Ainda mais, é claro que, dadas condições iniciais r0,v0,r0*,v0*, existem infinitas funções f⁢(t) que podem ser escolhidas, pois r0* e v0* só fixam os valores de f⁢(0) e dt⁢f⁢(0), mas os valores de todas as outras derivadas são completamente arbitrários. Para exemplificar o dito, consideremos o seguinte caso: Exemplo. Para as condições iniciais r0*=a≠0 e v0*=0, é possível escolher, entre uma infinidade de outras possibilidades, a função f⁢(t)=a ou a f⁢(t)=a⁢et2. Analisemos as duas escolhas. (1) No primeiro caso, a equação diferencial para A será (159) d t ⁢ A = - i ⁢ A 2 ; A ⁢ ( 0 ) = - i ⁢ v 0 2 ⁢ r 0 ⇒ A = - i t + 2 ⁢ r 0 v 0 , o qual, substituído na Eq. (158), leva à solução (160) r ⁢ ( t ) = v 0 2 4 ⁢ r 0 ⁢ ( t + 2 ⁢ r 0 v 0 ) 2 . (2) No segundo caso, por outro lado, a equação diferencial para A será (161) d t ⁢ A = - i ⁢ A 2 - 4 ⁢ t ⁢ A + 4 ⁢ i ⁢ t 2 + 2 ⁢ i , cuja solução, sujeita à condição inicial escrita na Eq. (159), é (162) A = 2 ⁢ i ⁢ t - i t + 2 ⁢ r 0 v 0 , que leva, por sua vez, ao movimento para r⁢(t) dado por (163) r ⁢ ( t ) = v 0 2 4 ⁢ r 0 ⁢ e - t 2 ⁢ ( t + 2 ⁢ r 0 v 0 ) 2 , o qual difere do resultado da Eq. (160) pelo fator e-t2, tornando o movimento completamente diferente: Num caso, a coordenada r⁢(t) cresce infinitamente com o avanço do tempo, noutro, tende assintoticamente a zero. Numa palavra, as condições iniciais não determinam univocamente a evolução posterior das coordenadas. Este fato ilustra perfeitamente uma característica geral dos sistemas invariantes de calibre locais: Como há mais funções incógnitas que equações (algumas equações do movimento são identidades pelo segundo teorema de Nöther), o problema dos valores iniciais não está bem definido até que o calibre tenha sido fixado, ou seja, até que condições fixadoras das funções arbitrárias tenham sido escolhidas13. O caráter vinculado destas teorias, que é também uma característica geral, se observa igualmente em nosso exemplo: Como a derivada temporal da coordenada de calibre não aparece na lagrangiana, o momento canonicamente conjugado que lhe corresponde é nulo, e o passo ao formalismo hamiltoniano não é trivial. De fato, como pode-se ver na Ref. [17], a fixação do calibre é igualmente essencial para a obtenção de uma hamiltoniana. , em que se utiliza o modelo mecânico de Christ-Lee. Tal ideia é aplicada à eletrodinâmica de Maxwell na seção8 8. Eletrodinâmica de Maxwell Nesta seção estudaremos as consequências dos teoremas de Nöther na eletrodinâmica de Maxwell, considerando o campo de Dirac como o campo de matéria. § Construção da teoria: O campo de Dirac possui a seguinte densidade lagrangiana livre: (164) ℒ D = ψ ¯ ( i 2 ∂ ↔ − m ) ψ , da qual se derivam as equações do movimento (165) ( i ∂ − m ) ψ = 0 ∧ ψ ¯ ( i ∂ ← + m ) = 0 É imediato reconhecer que a densidade lagrangiana da Eq. (164) é invariante perante as transformações de fase (166) ψ → e i ⁢ α ⁢ ψ , ψ ¯ → e - i ⁢ α ⁢ ψ ¯ , com α∈ℝ, que constituem o grupo U(1). Essa invariância de calibre global pode ser localizada fazendo uso da prescrição do acoplamento mínimo de Utiyama, analogamente ao que foi realizado no modelo mecânico estudado anteriormente: Introduzindo um campo de calibre Aμ, com a lei de transformação local (167) Δ ⁢ A μ ⁢ ( x ) = 1 e ⁢ ∂ μ ⁡ α ⁢ ( x ) , e substituindo em ℒD as derivadas ordinárias dos campos pelas derivadas covariantes, (168) D μ ⁢ ψ := ∂ μ ⁡ ψ - i ⁢ e ⁢ A μ ⁢ ψ , D μ ⁢ ψ ¯ := ∂ μ ⁡ ψ ¯ + i ⁢ e ⁢ A μ ⁢ ψ ¯ , obtém-se a densidade lagrangiana de matéria e interação (169) ℒ D + i n t = ψ ¯ ( i 2 D ↔ − m ) ψ = ψ ¯ ( i 2 ∂ ↔ − m ) ψ + e A μ ψ ¯ γ μ ψ . Como no caso mecânico, devemos ainda examinar a possibilidade de estabelecer uma densidade lagrangiana para o campo de calibre Aμ, a qual deverá ser, forçosamente, invariante de calibre local – e, como consequência, também global. Suponhamos, pois, que a tal densidade lagrangiana seja da primeira ordem: ℒA=ℒA⁢(A;∂⁡A). Sua variação é (170) Δ ℒ A = ∂ ℒ A ∂ A μ Δ A μ + ∂ ℒ A ∂ ( ∂ ν A μ ) ∂ ν Δ A μ = 1 e ∂ ℒ A ∂ A μ ∂ μ α + 1 2 e ( ∂ ℒ A ∂ ( ∂ ν A μ ) + ∂ ℒ A ∂ ( ∂ μ A ν ) ) ∂ μ ∂ ν α . A condição de nulidade de ℒA implica então, devido à independência entre ∂⁡α e ∂⁡∂⁡α, que: (1) O campo de calibre é não massivo, pois (171) ∂ ⁡ ℒ A ∂ ⁡ A μ = 0 , e que (2) ℒA é função somente do «tensor de Faraday» (172) F μ ⁢ ν := ∂ μ ⁡ A ν - ∂ ν ⁡ A μ , pois (173) ∂ ⁡ ℒ A ∂ ⁡ ( ∂ ν ⁡ A μ ) + ∂ ⁡ ℒ A ∂ ⁡ ( ∂ μ ⁡ A ν ) = 0 . A densidade lagrangiana mais simples que pode ser construída satisfazendo essas características é a conhecida densidade lagrangiana da eletrodinâmica de Maxwell: (174) ℒ A = - 1 4 ⁢ F μ ⁢ ν ⁢ F μ ⁢ ν . Pelos motivos assim expostos, a densidade lagrangiana completa da eletrodinâmica fermiônica de Maxwell é (175) ℒ = ψ ¯ ( i 2 ∂ ↔ − m ) ψ + e A μ ψ ¯ γ μ ψ − 1 4 F μ ν F μ ν . E, por construção, é invariante de calibre pelo grupo U(1) localizado. § Equações do movimento e segundo teorema de Nöther: As derivadas funcionais da ação em relação aos três campos participantes são (176) δ ⁢ 𝒜 δ ⁢ ψ = - ψ ¯ ⁢ ( i ⁢ ⁢ ∂ ← + m ) + e ⁢ ψ ¯ ⁢ ⁢ A , (177) δ ⁢ 𝒜 δ ⁢ ψ ¯ = ( i ⁢ ⁢ ∂ - m ) ⁢ ψ + e ⁢ ⁢ A ⁢ ψ , (178) δ ⁢ 𝒜 δ ⁢ A ρ = e ⁢ ψ ¯ ⁢ γ ρ ⁢ ψ + ∂ σ ⁡ F σ ⁢ ρ = e ⁢ ψ ¯ ⁢ γ ρ ⁢ ψ + □ ⁢ A ρ - ∂ σ ⁡ ∂ ρ ⁡ A σ . Dessas decorrem as equações do movimento (179) ( i ⁢ ⁢ ∂ - m ) ⁢ ψ = - e ⁢ ⁢ A ⁢ ψ , ψ ¯ ⁢ ( i ⁢ ⁢ ∂ ← + m ) = e ⁢ ψ ¯ ⁢ ⁢ A , ∂ σ ⁡ F σ ⁢ ρ = - e ⁢ ψ ¯ ⁢ γ ρ ⁢ ψ . A corrente de Nöther associada à simetria de calibre pode ser encontrada por aplicação direta do primeiro teorema. Contudo, resulta mais fácil aplicar as equações de descida. Reconhecendo das variações dos campos, por comparação com a Eq. (100), que (180) a ψ = i ⁢ ψ , a ψ ¯ = - i ⁢ ψ ¯ , a A μ = 0 ; b ψ = 0 , b ψ ¯ = 0 , b A μ = 1 e , da Eq. (111) tem-se que o sistema de equações de descida começa com o tensor antissimétrico (181) J ( 1 ) μ ⁢ ρ = 1 e ⁢ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ A ρ ) = - 1 e ⁢ F μ ⁢ ρ . Aplicando então a Eq. (114): (182) j μ = ∂ ρ ⁡ J ( 1 ) ρ ⁢ μ = - 1 e ⁢ ∂ ρ ⁡ F ρ ⁢ μ . Finalmente, como as equações de descida se satisfazem sob o cumprimento das equações do movimento, podemos susbtituir aqui a Eq. (179), do qual obtemos (183) j μ = ψ ¯ ⁢ γ μ ⁢ ψ , ∂ μ ⁡ j μ = 0 . A equação de continuidade é consequência da Eq. (115). Com as Eqs. (176)–(178) e (180) é também possível escrever a tese do segundo teorema de Nöther, que, após simplificação, se iguala a (184) ∂ μ ⁡ ∂ ρ ⁡ F ρ ⁢ μ = 0 . Integrando esta equação num volume Ω⊆ℝ4 e aplicando o teorema de Ostrogradskii-Gauss, (185) ∮ ∂ ⁡ Ω d σ μ ⁢ ∂ ρ ⁡ F ρ ⁢ μ = 0 ⇒ ∮ ∂ ⁡ Ω d σ μ ⁢ j μ = 0 , em que a segunda equação foi obtida usando as equações do movimento. Essa é, pois, a lei integral de conservação da corrente jμ. § Tensor canônico de energia-momento: Ao ser aplicada uma translação espaço-temporal por um vetor constante, as transformações das coordenadas e campos são as seguintes: (186) Δ ⁢ x μ = ε μ , Δ ⁢ ψ = - ε μ ⁢ ∂ μ ⁡ ψ , Δ ⁢ ψ ¯ = - ε μ ⁢ ∂ μ ⁡ ψ ¯ , Δ ⁢ A σ = - ε μ ⁢ ∂ μ ⁡ A σ . Com o uso dessas e da densidade lagrangiana da Eq. (175) é possível verificar, por cálculo direto, que é satisfeita a equação diferencial de Lie, Eq. (9), o que significa que a translação pelo vetor constante representa uma simetria da eletrodinâmica fermiônica. Logo, como indicado pela Eq. (44), a corrente de Nöther associada é o tensor canônico de energia-momento (187) Θ = ρ μ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ ψ ) ∂ ρ ψ + ∂ ρ ψ ¯ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ ψ ¯ ) + ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ A σ ) ⁢ ∂ ρ ⁡ A σ - ℒ ⁢ δ ρ μ = ( Θ ψ ) + ρ μ ( Θ A ) + ρ μ ( Θ int ) , ρ μ com os tensores canônicos de energia-momento do campo fermiônico, do eletromagnético e o de interação dados, respectivamente, pelas expressões (188) ( Θ ψ ) = ρ μ i 2 ψ ¯ γ μ ∂ ↔ ρ ψ - i 2 ψ ¯ ⁢ ∂ ↔ ψ δ ρ μ + m ψ ¯ ψ δ ρ μ , (189) ( Θ A ) = ρ μ - F μ ⁢ σ ∂ ρ A σ + 1 4 F λ ⁢ τ F λ ⁢ τ δ ρ μ , (190) ( Θ int ) = ρ μ - e A σ ψ ¯ γ σ ψ δ ρ μ . Sob transformações de calibre esses tensores possuem as seguintes variações: (191) Δ ( Θ ψ ) = ρ μ - ψ ¯ γ μ ψ ∂ ρ α + ψ ¯ γ σ ψ ∂ σ α δ ρ μ , (192) Δ ( Θ A ) = ρ μ - 1 e F μ ⁢ σ ∂ ρ ∂ σ α , (193) Δ ( Θ int ) = ρ μ - ψ ¯ γ σ ψ ∂ σ α δ ρ μ . Assim, sob transformações de calibre o tensor canônico de energia-momento completo tem variação (194) Δ Θ = ρ μ - ψ ¯ γ μ ψ ∂ ρ α - 1 e F μ ⁢ σ ∂ ρ ∂ σ α ≠ 0 . Como pode-se ver, os termos que não permitem a Θρμ ser invariante de calibre provêm dos termos não simétricos nos índices μ e ρ de (Θψ)ρμ e (ΘA)ρμ. Contudo, isso não representa dificuldade alguma para a escrituração das leis de conservação, pois, usando a regra de derivação de um produto, é possível escrever a Eq. (194) como (195) Δ Θ = ρ μ { - ψ ¯ γ μ ψ - 1 e ∂ σ F σ ⁢ μ } ∂ ρ α - ∂ σ ( 1 e F μ ⁢ σ ∂ ρ α ) . Ora, o termo entre chaves é nulo sob o cumprimento das equações do movimento – as quais são, por outro lado, essenciais para escrever as leis de conservação, como decorre do primeiro teorema de Nöther –, Eq. (179). Destarte, a variação de calibre do tensor canônico de energia-momento reduz-se a uma divergência, a qual não tem influência alguma na expressão das quantidades conservadas: (196) P ρ = ∫ ​ V Θ 0 ρ d 3 x , pois, sendo Fμ⁢σ antissimétrico, ter-se-á que (197) Δ P ρ = ∫ ​ V Δ Θ 0 ρ d 3 x = − 1 e ∫ ​ V ∂ σ ( F 0 σ ∂ ρ α ) d 3 x = − 1 e ∫ ​ V ∂ i ( F 0 i ∂ ρ α ) d 3 x , integral na qual já é possível aplicar o teorema de Ostrogradskii-Gauss para obter (198) Δ ⁢ P ρ = - 1 e ⁢ ∮ ∂ ⁡ V F 0 ⁢ i ⁢ ∂ ρ ⁡ α ⁢ d ⁢ σ i , que é nula sob condições de fronteira (ou assintóticas) apropriadas. É precisamente por esse argumento que ao tensor canônico de energia-momento pode ser adicionada a divergência ∂σBρσ⁢μ de um tensor antissimétrico nos índices σ e μ: Sua presença não muda as quantidades conservadas. Este fato pode ser usado, por exemplo, para obter um tensor de energia-momento invariante de calibre. A Eq. (195) sugere que isto pode ser atingido escolhendo (199) B = ρ σ ⁢ μ F μ ⁢ σ A ρ ⇒ ∂ σ B = ρ σ ⁢ μ ∂ σ ( F μ ⁢ σ A ρ ) = e ψ ¯ γ μ ψ A ρ + F μ ⁢ σ ∂ σ A ρ , em que a última igualdade foi obtida pelo uso das equações do movimento. Usando-as novamente, o novo tensor de energia-momento pode ser escrito como (200) T = ρ μ ( i 2 ψ ¯ γ μ ∂ ↔ ρ ψ + e ψ ¯ γ μ ψ A ρ ) + F μ ⁢ σ ⁢ F σ ⁢ ρ + 1 4 ⁢ F λ ⁢ τ ⁢ F λ ⁢ τ ⁢ δ ρ μ , o qual é invariante de calibre, ΔT=ρμ0. Finalmente, este tensor ainda não é simétrico nos termos interparentéticos. Nota-se que uma vez que as quantidades conservadas são invariantes de calibre, não haveria, em princípio, problema em ter um tensor de energia-momento não invariante de calibre e não simétrico. Tal ocorrência é problemática, entretanto, do ponto de vista da gravitação de Einstein, se se deseja interpretar o tensor Θρμ como a fonte do campo gravítico. Com efeito, se a fonte for dependente de calibre, o campo de gravidade a que daria lugar dependeria também da escolha das condições de calibre; isto já o remediamos passando ao tensor Tρμ. Além do mais, a mencionada fonte material da relatividade geral tem sua própria definição, segundo a qual é axiomaticamente simétrica14. O método que permite obter um tensor de energia-momento simétrico é o método de Belinfante e Rosenfeld, que se baseia nos argumentos prévios para definir (201) T μ ⁢ ν := Θ μ ⁢ ν + ∂ ρ ⁡ B ρ ⁢ μ ⁢ ν , B ρ ⁢ μ ⁢ ν = 1 2 ⁢ ( S ρ ⁢ μ ⁢ ν + S μ ⁢ ν ⁢ ρ + S ν ⁢ μ ⁢ ρ ) , com Sμ⁢ν⁢ρ o «tensor do spin de posto 3», definido como a parte explicitamente independente das coordenadas da corrente de Nöther associada à invariância sob transformações de Lorentz, (202) y μ = x μ + ω μ ⁢ ν ⁢ x ν , v ⁢ ( y ) = u ⁢ ( x ) + 1 2 ⁢ ω μ ⁢ ν ⁢ ( U μ ⁢ ν ⁢ u ) ⁢ ( x ) , que para teorias da primeira ordem se lê (203) S = ν ⁢ α μ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ u ) ( U ν ⁢ α u ) . Este método, não obstante eficaz quando aplicado a teorias livres ou em interação para sistemas fechados, não consegue simetrizar o tensor de energia-momento de uma teoria de calibre em interação geral quando a dinâmica de alguns dos campos é desconsiderada [24]. Vejamos, pois, para compreender o assim mencionado, mais em detalhe o procedimento de Belinfante-Rosenfeld e apliquemo-lo ao campo de Dirac, tanto livre como em interação. em acoplamento com o campo fermiônico de Dirac. Precisando da simetrização do tensor canônico de energia-momento, dedicamos a seção9 9. Procedimento de Belinfante-Rosenfeld Comecemos por determinar, de forma geral, as correntes de Nöther associadas à invariância (global) da ação sob transformações do grupo (ortócrono e próprio) de Lorentz. Denotando por ωμ⁢ν=-ων⁢μ os seis parâmetros do grupo, as coordenadas e campos transformam-se segundo a Eq. (202). § Álgebra do grupo de Lorentz: A álgebra do grupo de Lorentz pode ser encontrada da seguinte maneira: consideremos duas transformações de Lorentz infinitesimais, Λ1 e Λ2, respectivamente caracterizadas pelos parâmetros ω1μ⁢ν e ω2ρ⁢σ. A aplicação sucessiva de Λ1 seguida da de Λ2, leva às transformações das coordenadas e campos segundo (204) z μ = x μ + ( ω 1 μ ⁢ ρ + ω 2 μ ⁢ ρ + ω 2 μ ⁢ ν ω ) 1 ⁢ ν ρ x ρ , (205) w ⁢ ( z ) = u ⁢ ( x ) + 1 2 ⁢ ( ω 1 μ ⁢ ν + ω 2 μ ⁢ ν ) ⁢ ( U μ ⁢ ν ⁢ u ) ⁢ ( x ) + 1 4 ⁢ ω 1 μ ⁢ ν ⁢ ω 2 ρ ⁢ σ ⁢ ( U ρ ⁢ σ ⁢ U μ ⁢ ν ⁢ u ) ⁢ ( x ) . A aplicação na ordem inversa, isto é, de Λ2 primeiro e Λ1 depois, leva a (206) z ′ ⁣ μ = x μ + ( ω 1 μ ⁢ ρ + ω 2 μ ⁢ ρ + ω 1 μ ⁢ ν ω ) 2 ⁢ ν ρ x ρ + , (207) w ′ ⁢ ( z ′ ) = u ⁢ ( x ) + 1 2 ⁢ ( ω 1 μ ⁢ ν + ω 2 μ ⁢ ν ) ⁢ ( U μ ⁢ ν ⁢ u ) ⁢ ( x ) + 1 4 ⁢ ω 1 μ ⁢ ν ⁢ ω 2 ρ ⁢ σ ⁢ ( U μ ⁢ ν ⁢ U ρ ⁢ σ ⁢ u ) ⁢ ( x ) . Porém, segundo a Eq. (204), a transformação Λ2⁢Λ1 que leva ao campo w⁢(z) da Eq. (205) é uma transformação de Lorentz caracterizada pelos parâmetros ω1μ⁢ρ+ω2μ⁢ρ+ω2μ⁢νω1⁢νρ, de modo que poder-se-ia também escrever (208) w ( z ) = u ( x ) + 1 2 ( ω 1 λ ⁢ τ + ω 2 λ ⁢ τ + ω 2 λ ⁢ η ω ) 1 ⁢ η τ ( U λ ⁢ τ u ) ( x ) . E, semelhantemente, por graça da Eq. (206), é possível escrever o campo w′⁢(z′) como (209) w ′ ( z ′ ) = u ( x ) + 1 2 ( ω 1 λ ⁢ τ + ω 2 λ ⁢ τ + ω 1 λ ⁢ η ω ) 2 ⁢ η τ ( U λ ⁢ τ u ) ( x ) . Portanto, a diferença w⁢(z)-w′⁢(z′) pode ser escrita quer usando as Eqs. (205) e (207), quer as Eqs. (208) e (209). Da igualdade de ambas possíveis expressões, obtém-se que (210) 1 4 ⁢ ( ω 1 μ ⁢ ν ⁢ ω 2 ρ ⁢ σ ) ⁢ ( [ U ρ ⁢ σ ; U μ ⁢ ν ] ⁢ u ) ⁢ ( x ) = 1 2 ( ω 2 λ ⁢ η ω - 1 ⁢ η τ ω 1 λ ⁢ η ω ) 2 ⁢ η τ ( U λ ⁢ τ u ) ( x ) = 1 4 ω 1 μ ⁢ ν ω 2 ρ ⁢ σ ( { g μ ⁢ σ U ρ ⁢ ν - g ν ⁢ σ U ρ ⁢ μ - g ρ ⁢ ν U μ ⁢ σ + g ρ ⁢ μ U ν ⁢ σ } u ) ( x ) , do qual é imediato reconhecer que a álgebra de comutadores dos geradores Uμ⁢ν é (211) [ U ρ ⁢ σ ; U μ ⁢ ν ] = - g ρ ⁢ ν ⁢ U μ ⁢ σ + g ρ ⁢ μ ⁢ U ν ⁢ σ - g σ ⁢ ν ⁢ U ρ ⁢ μ + g σ ⁢ μ ⁢ U ρ ⁢ ν , que é a álgebra do grupo de Lorentz. § Tensor do momento angular: Suponhamos que a funcional da ação 𝒜 de um conjunto de campos u é invariante sob as transformações de Lorentz acima descritas. Escrevendo a≡(λ⁢τ), substituindo as relações (212) δ ⁢ u = 1 2 ⁢ ω λ ⁢ τ ( U λ ⁢ τ ⁢ u ) , Δ ⁢ x μ = 1 2 ⁢ ω λ ⁢ τ ⁢ ( X λ ⁢ τ ⁢ x ) ρ ⇒ ( X λ ⁢ τ ⁢ x ) ρ = δ λ ρ ⁢ x τ - δ τ ρ ⁢ x λ na Eq. (29), que é a expressão do primeiro teorema de Nöther, teremos que (213) δ ⁢ 𝒜 δ ⁢ u ⁢ [ ( U λ ⁢ τ ⁢ u ) - ( ∂ λ ⁡ u ⁢ x τ - ∂ τ ⁡ u ⁢ x λ ) ] = ∂ μ { ( Θ μ λ x τ − Θ μ τ x λ ) - ( ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) - ∂ ν ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ) ⁢ ( U λ ⁢ τ ⁢ u ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) [ ∂ ν ( U λ ⁢ τ u ) - ( ∂ λ u g ν ⁢ τ - ∂ τ u g ν ⁢ λ ) ] } . De forma que, sob o cumprimento das equações do movimento, obter-se-á a lei de continuidade do «tensor do momento angular de posto 3»: (214) ∂ μ M μ λ τ = 0 , M μ λ τ : = − ( Θ μ λ x τ − Θ μ τ x λ ) + S μ λ τ , com o «tensor do spin de posto 3» (215) S := λ ⁢ τ μ ( ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) - ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ) ( U λ ⁢ τ u ) + ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ⁢ [ ∂ ν ⁡ ( U λ ⁢ τ ⁢ u ) - ( ∂ λ ⁡ u ⁢ g ν ⁢ τ - ∂ τ ⁡ u ⁢ g ν ⁢ λ ) ] . Da lei de continuidade para Mλ⁢τμ, aplicando a divergência a seus termos e usando a lei de continuidade para o tensor canônico de energia-momento – sob a suposição, é claro, de que o sistema exibe também a invariância sob translações –, encontra-se que (216) ∂ μ M = λ ⁢ τ μ - ( Θ τ ⁢ λ - Θ λ ⁢ τ ) + ∂ μ S λ ⁢ τ μ ⇒ ∂ μ S = λ ⁢ τ μ Θ τ ⁢ λ - Θ λ ⁢ τ , e assim o tensor de spin será, ele mesmo, separadamente conservado se e somente se o tensor canônico de energia-momento for simétrico. Ou, dito de outro modo, sempre que a divergência do tensor de spin for diferente de zero, o tensor canônico de energia-momento não poderá ser simétrico. Consideremos agora uma modificação do tipo (217) T τ ⁢ λ = Θ τ ⁢ λ + ∂ ρ B , τ ⁢ λ ρ B ρ ⁢ τ ⁢ λ = - B τ ⁢ ρ ⁢ λ . Como já provamos, as quantidades conservadas associadas a Tτ⁢λ e Θτ⁢λ são as mesmas. Isolando da equação anterior Θτ⁢λ=Tτ⁢λ-∂ρBτ⁢λρ e substituindo na Eq. (214), (218) M μ λ τ = T μ τ x λ − T μ λ x τ + x τ ∂ ρ B ρ μ λ − x λ ∂ ρ B ρ μ τ + S μ λ τ = T μ τ x λ − T μ λ x τ + S μ λ τ − ( B μ λ τ − B μ λ τ ) + ∂ p ( x τ B p μ λ − x λ B p μ λ ) . Definindo o tensor modificado do momento angular de posto 3 como (219) J := λ ⁢ τ μ M - λ ⁢ τ μ ∂ ρ ( x τ B - λ ρ ⁢ μ x λ B ) τ ρ ⁢ μ , que leva às mesmas quantidades conservadas que o original pelo mesmo argumento que o apresentado para o tensor modificado da energia-momento, e introduzindo-o na Eq. (218), obtemos (220) J μ λ τ = T μ τ x λ − T μ λ x τ + S μ λ τ − ( B μ λ τ − B μ τ λ ) . Se, finalmente, exigirmos que o tensor Bλ⁢τμ seja de tal forma a satisfazer à relação (221) S = λ ⁢ τ μ B - λ ⁢ τ μ B , τ ⁢ λ μ então obteremos que o tensor modificado do momento angular é exatamente o momento do tensor modificado de energia-momento, condição essa que define univocamente o tensor de energia-momento [22] (222) J u λ τ = T μ τ x λ − T μ λ x τ . Sendo assim, a lei de continuidade para Jλ⁢τμ implica imediatamente a simetria de Tλ⁢τ: (223) ∂ μ J = λ ⁢ τ μ 0 ⇒ T λ ⁢ τ = T τ ⁢ λ . Finalizando, a Eq. (221) permite encontrar explicitamente o tensor Bλ⁢τμ: Efetuando permutações cíclicas nos índices da citada equação e somando ou subtraindo os termos convenientemente, é possível isolar (224) B μ ⁢ τ ⁢ λ = 1 2 ⁢ ( S μ ⁢ τ ⁢ λ + S τ ⁢ λ ⁢ μ - S λ ⁢ μ ⁢ τ ) , que é exatamente a Eq. (201) – levando em consideração a antissimetria de S nos seus últimos dois índices. Esta argumentação prova, assim, que o procedimento de Belinfante-Rosenfeld permite a simetrização do tensor da energia-momento também para teorias da segunda ordem. 9.1. Tensor simétrico da energia-momento do campo de Dirac livre O tensor canônico da energia-momento do campo de Dirac livre, calculado diretamente a partir da densidade lagrangiana da Eq. (164), é (225) Θ = ρ μ i 2 ψ ¯ γ μ ∂ ↔ ρ ψ - ψ ¯ ( i 2 ⁢ ∂ ↔ - m ) ψ δ ρ μ . Sob o cumprimento das equações do movimento livres – e somente das livres, pois em interação as equações do movimento são outras e o tensor de energia-momento adota uma forma diferente [vide a subseção9.2] –, (226) Θ = ρ μ i 2 ψ ¯ γ μ ∂ ↔ ρ ψ . Como este tensor não é simétrico, aplicar-lhe-emos o método de Belinfante-Rosenfeld, para o qual precisamos calcular o tensor do spin, e ainda antes desse, precisamos conhecer os geradores do grupo de Lorentz na representação que age sobre os campos de Dirac. § Geradores do grupo de Lorentz: Determinaremos quais são os geradores Uλ⁢τ do grupo de Lorentz que agem sobre os campos de Dirac fazendo uso do fato que a transformação S⁢(Λ) satisfaz à seguinte relação: (227) S ( Λ ) − 1 γ μ S ( Λ ) = Λ μ ν γ ν , a qual é condição necessária e suficiente para que o termo bilinear envolvendo a derivada na densidade lagrangiana de Dirac seja invariante de Lorentz. Expandindo até termos da primeira ordem, (228) S ( Λ ) = 1 + 1 2 ω ρ ⁢ σ U ρ ⁢ σ , Λ = ν μ δ ν μ + ω , ν μ a Eq. (227) implica que (229) γ μ + 1 2 ω ρ σ ( γ μ U ρ σ − U ρ σ γ μ ) = γ μ + ω γ ν μ ν = γ μ + 1 2 ω ρ σ ( δ ρ μ g σ ν − δ σ μ g ρ ν ) γ ν , do que decorre que (230) [ γ μ ; U ρ ⁢ σ ] = δ ρ μ ⁢ γ σ - δ σ μ ⁢ γ ρ . Usando da álgebra de Clifford satisfeita pelas matrizes de Dirac para escrever δσμ=12⁢{γμ;γσ} e analogamente para δρμ, obtém-se (231) [ γ μ ; U ρ σ ] = 1 2 ( γ μ γ ρ γ σ + γ ρ γ μ γ σ − γ μ γ σ γ ρ − γ σ γ μ γ ρ ) = 1 2 [ γ μ ; [ γ ρ ; γ σ ] ] + ( δ σ μ γ ρ − δ ρ μ γ σ ) = 1 2 [ γ μ ; [ γ ρ ; γ σ ] ] − [ γ μ ; U ρ σ ] E dessa equação já é possível identificar (232) U ρ ⁢ σ = 1 4 ⁢ [ γ ρ ; γ σ ] . § Tensor do spin de posto 3: Substituindo as Eqs. (164) e (232) na Eq. (203), calculamos (233) S μ τ λ = ∂ ℒ D ∂ ( ∂ μ ψ ) ( U τ λ ψ ) − ( ψ ¯ U τ λ ) ∂ ℒ D ∂ ( ∂ μ ψ ¯ ) = i 8 ψ ¯ { γ μ ; [ γ τ ; γ λ ] } ψ . Usando a álgebra das matrizes de Dirac, é possível provar que (234) { γ μ ; [ γ τ ; γ λ ] } = 2 ⁢ ( γ τ ⁢ γ λ ⁢ γ μ - γ μ ⁢ γ λ ⁢ γ τ ) , de modo que obtemos a forma final: (235) S μ ⁢ τ ⁢ λ = i 4 ⁢ ψ ¯ ⁢ ( γ τ ⁢ γ λ ⁢ γ μ - γ μ ⁢ γ λ ⁢ γ τ ) ⁢ ψ . § Tensor simétrico da energia-momento: Com o tensor do spin recém-calculado, passaremos a obter a forma simetrizada do tensor canônico da energia-momento. Para tal, devemos primeiramente calcular o tensor de Belinfante-Rosenfeld (236) B μ ⁢ τ ⁢ λ = 1 2 ⁢ ( S μ ⁢ τ ⁢ λ + S τ ⁢ λ ⁢ μ - S λ ⁢ μ ⁢ τ ) = i 8 ⁢ ψ ¯ ⁢ b μ ⁢ τ ⁢ λ ⁢ ψ , com (237) b μ τ λ = γ τ γ λ γ μ − γ μ γ λ γ τ + γ λ γ μ γ τ − γ τ γ μ γ λ − γ μ γ τ γ λ + γ λ γ τ γ μ . Fazendo uso repetido da álgebra das matrizes de Dirac, a expressão anterior pode ser simplificada em (238) b μ ⁢ τ ⁢ λ = γ τ ⁢ γ λ ⁢ γ μ - γ μ ⁢ γ λ ⁢ γ τ . Substituindo na Eq. (236), tomando a divergência em relação ao índice μ e usando a álgebra das matrizes de Dirac de forma a obter, sempre que for possível, derivadas contraídas com matrizes de Dirac, (239) ∂ μ ⁡ B μ ⁢ τ ⁢ λ = i 4 ⁢ ψ ¯ ⁢ ( γ λ ⁢ ∂ ↔ τ - γ τ ⁢ ∂ ↔ λ ) ⁢ ψ + i 8 ⁢ ψ ¯ ⁢ ⁢ ∂ ← ⁢ [ γ τ ; γ λ ] ⁢ ψ + i 8 ⁢ ψ ¯ ⁢ [ γ τ ; γ λ ] ⁢ ⁢ ∂ ⁡ ψ . Finalmente, usando as equações de Dirac para escrever i⁢γμ⁢∂μ⁡ψ=m⁢ψ e i⁢∂μ⁡ψ¯⁢γμ=-m⁢ψ¯, os dois últimos termos da equação anterior se cancelam, e obtém-se (240) ∂ μ ⁡ B μ ⁢ τ ⁢ λ = i 4 ⁢ ψ ¯ ⁢ ( γ λ ⁢ ∂ ↔ τ - γ τ ⁢ ∂ ↔ λ ) ⁢ ψ . Assim, substituindo as Eqs. (226) e (240) na Eq. (201), obtemos o tensor simetrizado de energia-momento para o campo de Dirac livre: (241) T τ ⁢ λ = Θ τ ⁢ λ + ∂ μ ⁡ B μ ⁢ τ ⁢ λ = i 4 ⁢ ψ ¯ ⁢ ( γ τ ⁢ ∂ ↔ λ + γ λ ⁢ ∂ ↔ τ ) ⁢ ψ . Como podemos ver, ele resulta ser, simplesmente, a parte simétrica do tensor canônico de energia-momento. Essa é uma peculiaridade da teoria de Dirac, que se explica pelo fato do tensor do spin de posto 3 ser completamente antissimétrico; com efeito, tal característica implica, segundo a Eq. (216), que a parte antissimétrica do tensor canônico de energia-momento é proporcional à divergência de um tensor do tipo requerido para que as quantidades conservadas não mudem se tal divergência é removida. Por outro lado, como essa não é uma característica geral, o resultado não se aplica a outras teorias15. 9.2. Aplicação do método deBelinfante-Rosenfeld à eletrodinâmicafermiônica Para terminar essa seção, desejamos ainda aplicar o procedimento de Belinfante-Rosenfeld à eletrodinâmica fermiônica, com a finalidade de determinar sob quais circunstâncias o mencionado método não tem sucesso em simetrizar o tensor da energia-momento, assim como os motivos pelos quais isso ocorre. Para começar, o tensor canônico de energia-momento para a eletrodinâmica fermiônica, dado nas Eqs. (187)–(190), se reduz, sob o cumprimento das equações do movimento [Eq. (179)], à forma (242) Θ μ ⁢ ρ = i 2 ⁢ ψ ¯ ⁢ γ μ ⁢ ∂ ↔ ρ ⁢ ψ - F μ ⁢ σ ⁢ ∂ ρ ⁡ A σ + 1 4 ⁢ F λ ⁢ τ ⁢ F λ ⁢ τ ⁢ g μ ⁢ ρ . Por outro lado, como já conhecemos os geradores do grupo de Lorentz que agem sobre os campos de Dirac [Eq. (232)], que passaremos a denotar por Uλ⁢τψ, enquanto que para o campo eletromagnético são (243) A ′ ⁣ μ = ( δ ν μ + ω ) ν μ A ν = [ δ ν μ + 1 2 ω λ ⁢ τ ( U λ ⁢ τ A ) ] ν μ A ν ⇒ ( U λ ⁢ τ A ) = ν μ δ λ μ g τ ⁢ ν - δ τ μ g λ ⁢ ν , podemos calcular o tensor do spin de posto 3, (244) S μ τ λ = ∂ ℒ ∂ ( ∂ μ ψ ) ( U τ λ ψ ψ ) − ( ψ ¯ U τ λ ψ ) ∂ ℒ ∂ ( ∂ μ ψ ¯ ) + ∂ ℒ ∂ ( ∂ μ A ρ ) ( U τ λ A ) A σ ρ σ , com ℒ a densidade lagrangiana da Eq. (175). Obtém-se (245) S = τ ⁢ λ μ ( S ψ ) + τ ⁢ λ μ ( S A ) , τ ⁢ λ μ com (Sψ)τ⁢λμ a parte provinda dos termos em ℒ que correspondem à densidade lagrangiana do campo de Dirac, e dado na Eq. (235), e (246) ( S A ) μ τ λ = − F μ τ A λ + F μ λ A τ a provinda dos termos correspondentes à densidade lagrangiana de Maxwell. Além disso, note-se que a separação feita é possível devido a que o tensor do spin depende exclusivamente dos termos derivativos na densidade lagrangiana – vide a Eq. (244) –, sendo que o termo de interação não possui derivada em relação a campo algum16. Prosseguindo com o método de Belinfante-Rosenfeld, o tensor Bμ⁢τ⁢λ cuja divergência há de adicionar-se ao tensor canônico de energia-momento é calculado pela Eq. (224): (247) B μ ⁢ τ ⁢ λ = ( B ψ ) μ ⁢ τ ⁢ λ + ( B A ) μ ⁢ τ ⁢ λ , com (Bψ)μ⁢τ⁢λ obtido pelas Eqs. (236) e (238): (248) ( B ψ ) μ ⁢ τ ⁢ λ = i 8 ⁢ ψ ¯ ⁢ ( γ τ ⁢ γ λ ⁢ γ μ - γ μ ⁢ γ λ ⁢ γ τ ) ⁢ ψ , e (249) ( B A ) μ ⁢ τ ⁢ λ = - F μ ⁢ τ ⁢ A λ . A divergência desses tensores são, um dado pela Eq. (239), o outro (250) ∂ μ ( B A ) μ ⁢ τ ⁢ λ = - ∂ μ F μ ⁢ τ A λ - F μ ⁢ τ ∂ μ A λ . Deste modo, o tensor de energia-momento de Belinfante-Rosenfeld é (251) T τ λ = i 4 ψ ¯ ( γ λ ∂ ↔ τ + γ τ ∂ ↔ λ ) ψ + F τ σ F σ λ + 1 4 F ρ σ F ρ σ g τ λ + i 8 ψ ¯ ∂ ← [ γ τ ; γ λ ] ψ + i 8 ψ ¯ [ γ τ ; γ λ ] ∂ ψ − ∂ σ F σ τ A λ . A primeira linha dessa equação, reconhecemos, é a soma dos tensores simetrizados de energia-momento dos campos de Dirac e eletromagnético livres; para tais campos, precisamente, os termos da segunda linha se anulariam por virtude das equações do movimento livres. Como, entretanto, os campos agora estão em interação [Eq. (179)], as equações do movimento não anulam os mencionados termos. Dessa vez temos de substituir: i⁢⁢ψ=m⁢ψ-e⁢⁢A⁢ψ, i⁢ψ¯⁢⁢∂←=-m⁢ψ¯+e⁢ψ¯⁢⁢A e ∂σ⁡Fσ⁢τ=-e⁢ψ¯⁢γρ⁢ψ, do que resulta (252) i 8 ⁢ ψ ¯ ⁢ ⁢ ∂ ← ⁢ [ γ τ ; γ λ ] ⁢ ψ + i 8 ⁢ ψ ¯ ⁢ [ γ τ ; γ λ ] ⁢ ⁢ ∂ ⁡ ψ = 1 2 ⁢ e ⁢ ψ ¯ ⁢ ( A τ ⁢ γ λ - A λ ⁢ γ τ ) ⁢ ψ , e (253) - ∂ σ ⁡ F σ ⁢ τ ⁢ A λ = e ⁢ ψ ¯ ⁢ γ τ ⁢ A λ ⁢ ψ . Daqui vê-se que, já que nenhuma das Eqs. (252) ou (253) é simétrica, se decidíssemos calcular o tensor de energia-momento para o campo de Dirac em interação, sem considerar os termos livres do campo eletromagnético, ou vice-versa, o procedimento de Belinfante-Rosenfeld não derivaria em um tensor simétrico. A explicação é simples: Como o tensor do spin de posto 3 não é afetado pelo termo de interação, o tensor Bμ⁢τ⁢λ é insensível à presença de tal termo, sendo que, por outro lado, as equações do movimento são outras. A soma completa, finalmente, é (254) T τ ⁢ λ = i 4 ⁢ ψ ¯ ⁢ ( γ λ ⁢ ∂ ↔ τ + γ τ ⁢ ∂ ↔ λ ) ⁢ ψ + F τ ⁢ σ ⁢ F σ ⁢ λ + 1 4 ⁢ F ρ ⁢ σ ⁢ F ρ ⁢ σ ⁢ g τ ⁢ λ + 1 2 ⁢ e ⁢ ψ ¯ ⁢ ( A τ ⁢ γ λ + A λ ⁢ γ τ ) ⁢ ψ . Assim, o procedimento de Belinfante-Rosenfeld leva, sim, a um tensor de energia-momento simétrico para o sistema fechado, como esperado pelo desenvolvimento teórico anteriormente mostrado. ao desenvolvimento do método de Belinfante-Rosenfeld. Uma generalização possível da eletrodinâmica de Maxwell à segunda ordem é a de Podolsky, que estudamos na seção10 10. Eletrodinâmica de Podolsky Esta seção, dedicada à eletrodinâmica de Podolsky, nos permitirá mostrar a grande variabilidade dos procedimentos que podem ser usados em conjunção com os teoremas de Nöther, permitindo visualizar seu alcance e possibilidades. A teoria de Podolsky pode ser construída como uma teoria de calibre livre da segunda ordem. § Densidade lagrangiana de Podolsky: Se, diferentemente ao suposto na seção8, consideramos que a densidade lagrangiana do campo de calibre pode depender não só das derivadas desse de até a primeira ordem como também até a segunda17, ℒA=ℒA⁢(A;∂⁡A;∂⁡∂⁡A), então a variação sob uma transformação de calibre local será, em substituição da Eq. (170), (255) Δ ℒ A = ∂ ℒ A ∂ A μ Δ A μ + ∂ ℒ A ∂ ( ∂ ν A μ ) ∂ ν Δ A μ + ∂ ℒ A ∂ ( ∂ ρ ∂ ν A μ ) ∂ ρ ∂ ν Δ A μ = 1 e ∂ ℒ A ∂ A μ ∂ μ α + 1 2 e ( ∂ ℒ A ∂ ( ∂ ν A μ ) + ∂ ℒ A ∂ ( ∂ μ A ν ) ) ∂ μ ∂ ν α + 1 3 e ( ∂ ℒ A ∂ ( ∂ ρ ∂ ν A μ ) + ∂ ℒ A ∂ ( ∂ ρ ∂ μ A ν ) + ∂ ℒ A ∂ ( ∂ μ ∂ ν A ρ ) ) ∂ ρ ∂ ν ∂ μ α . Logo vemos que a condição de invariância deriva nas seguintes três relações: (256) ∂ ⁡ ℒ A ∂ ⁡ A μ = 0 , (257) ∂ ⁡ ℒ A ∂ ⁡ ( ∂ ν ⁡ A μ ) + ∂ ⁡ ℒ A ∂ ⁡ ( ∂ μ ⁡ A ν ) = 0 , (258) ∂ ⁡ ℒ A ∂ ⁡ ( ∂ ρ ⁡ ∂ ν ⁡ A μ ) + ∂ ⁡ ℒ A ∂ ⁡ ( ∂ ρ ⁡ ∂ μ ⁡ A ν ) + ∂ ⁡ ℒ A ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ A ρ ) = 0 . As duas primeiras já as conhecemos: Elas indicam, respectivamente, que o campo de calibre é não massivo e que a dependência da densidade lagrangiana com suas primeiras derivadas ocorre através do tensor de Faraday. A Eq. (258), finalmente, indica que a dependência com as segundas derivadas de Aμ acontece por meio do tensor (259) G σ ⁢ λ ⁢ τ := ∂ σ ⁡ ∂ λ ⁡ A τ - ∂ σ ⁡ ∂ τ ⁡ A λ = ∂ σ ⁡ F λ ⁢ τ . Uma densidade lagrangiana respeitando a esses requerimentos é a que descreve à «eletrodinâmica de Podolsky»: (260) ℒ A = - 1 4 ⁢ F μ ⁢ ν ⁢ F μ ⁢ ν + a 2 2 ⁢ ∂ ρ ⁡ F μ ⁢ ρ ⁢ ∂ σ ⁡ F μ ⁢ σ , com o «parâmetro de Podolsky» a∈ℝ a ser determinado fenomenologicamente18. Se bem que outras densidades lagrangianas, igualmente quadráticas no tensor G, são possíveis, pode-se provar que todas elas se diferenciam da de Podolsky apenas por termos de superfície e portanto lhe são físicamente equivalentes. Isto permite estabelecer que o eletromagnetismo de Podolsky é a generalização do eletromagnetismo de Maxwell mais simples à segunda ordem. § Equações do movimento e segundo teorema de Nöther: Com a densidade lagrangiana da Eq. (260) calculamos as derivadas funcionais da ação: (261) δ ⁢ 𝒜 δ ⁢ A σ = ( 1 + 2 ⁢ a 2 ⁢ □ ) ⁢ ∂ μ ⁡ F μ ⁢ σ . As equações do movimento são obtidas por igualação a zero da anterior derivada funcional; em função do campo de calibre Aμ, (262) ( 1 + 2 ⁢ a 2 ⁢ □ ) ⁢ ( □ ⁢ A σ - ∂ σ ⁡ ( ∂ ⁡ A ) ) = 0 . Por outro lado, para escrever a tese do segundo teorema de Nöther, notamos primeiramente, por comparação com a Eq. (100), que (263) Δ ⁢ A σ = 1 e ⁢ ∂ σ ⁡ α ⇒ ( a σ ) = 0 , ( b σ ) ρ = 1 e ⁢ δ σ ρ , ( c σ ) ρ ⁢ τ = 0 . Substituindo estes valores e a Eq. (261) na Eq. (104) obtém-se que (264) ∂ ρ ⁡ ( ( b σ ) ρ ⁢ δ ⁢ 𝒜 δ ⁢ A σ ) = 0 ⇒ ( 1 + 2 ⁢ a 2 ⁢ □ ) ⁢ ∂ μ ⁡ ∂ ρ ⁡ F μ ⁢ ρ = 0 , mesmo sem o cumprimento das equações do movimento. Já a lei de conservação que rege sob o cumprimento delas pode ser obtida pelo sistema de equações de descida, Eq. (114). Para estabelecê-lo, começamos calculando as quantidades (Aσ)μ e (Bσ)μ⁢ν da Eq. (107): (265) ( A σ ) μ = ( 1 + 2 ⁢ a 2 ⁢ □ ) ⁢ F μ ⁢ σ - a 2 ⁢ ∂ σ ⁡ ∂ ρ ⁡ F μ ⁢ ρ , (266) ( B σ ) μ ⁢ ν = a 2 ⁢ ( g μ ⁢ σ ⁢ ∂ ρ ⁡ F ν ⁢ ρ + g ν ⁢ σ ⁢ ∂ ρ ⁡ F μ ⁢ ρ - 2 ⁢ g μ ⁢ ν ⁢ ∂ ρ ⁡ F σ ⁢ ρ ) . Como (cσ)μ⁢ν=0, o sistema de equações de descida começa com o tensor [vide a Eq. (112)] (267) J ( 2 ) μ ⁢ ν ⁢ ρ = - ( B σ ) μ ⁢ ρ ⁢ ( b σ ) ν = - a 2 e ⁢ ( g μ ⁢ ν ⁢ ∂ τ ⁡ F ρ ⁢ τ + g ρ ⁢ ν ⁢ ∂ τ ⁡ F μ ⁢ τ - 2 ⁢ g μ ⁢ ρ ⁢ ∂ τ ⁡ F ν ⁢ τ ) . Tomando sua divergência em relação ao índice μ, obtemos a seguinte corrente: (268) J ( 1 ) ν ⁢ ρ = ∂ μ ⁡ J ( 2 ) μ ⁢ ν ⁢ ρ = - a 2 e ⁢ ∂ τ ⁡ ( ∂ ν ⁡ F ρ ⁢ τ - 2 ⁢ ∂ ρ ⁡ F ν ⁢ τ ) . Por divergência desta, finalmente, obtém-se a corrente conservada (269) j ρ = ∂ ν ⁡ J ( 1 ) ν ⁢ ρ = - a 2 e ⁢ ( ∂ τ ⁡ □ ⁢ F ρ ⁢ τ ) = e.d.m. - 1 e ⁢ ∂ μ ⁡ F μ ⁢ ρ . Destarte, a lei de continuidade ∂ρ⁡jρ=0 leva à equação (270) ∂ μ ⁡ ∂ ρ ⁡ F μ ⁢ ρ = 0 , que é a mesma equação obtida na eletrodinâmica de Maxwell, Eq. (184). § Tensor de energia-momento do campo de Podolsky: A fórmula geral para o tensor de energia-momento de uma teoria da segunda ordem aparece na Eq. (16). Em função das quantidades (Aσ)μ e (Bσ)μ⁢ν, (271) Θ μ ⁢ ρ = - ℒ ⁢ g μ ⁢ ρ - ( A σ ) μ ⁢ ∂ ρ ⁡ A σ + ( B σ ) μ ⁢ ν ⁢ ∂ ρ ⁡ ∂ ν ⁡ A σ . Com a densidade lagrangiana de Podolsky e as Eqs. (265) e (266), o cálculo direto permite encontrar, após simplificação, (272) Θ μ ⁢ ρ = 1 4 ⁢ F λ ⁢ τ ⁢ F λ ⁢ τ ⁢ g μ ⁢ ρ - a 2 2 ⁢ ∂ σ ⁡ F λ ⁢ σ ⁢ ∂ τ ⁡ F λ ⁢ τ ⁢ g μ ⁢ ρ - ( 1 + 2 ⁢ a 2 ⁢ □ ) ⁢ F μ ⁢ σ ⁢ ∂ ρ ⁡ A σ + a 2 ( ∂ λ F σ ⁢ λ ∂ ρ F - σ μ ∂ λ F σ ⁢ λ ∂ μ ∂ ρ A σ ) + ∂ σ ⁡ ( a 2 ⁢ ∂ λ ⁡ F μ ⁢ λ ⁢ ∂ ρ ⁡ A σ ) . É evidente que, tomando o limite a2→0 a equação anterior corresponde ao tensor canônico de energia-momento do campo de Maxwell, Eq. (189). Além do mais, nota-se que o último termo, embora seja uma divergência, não pode ser desconsiderado, pois o tensor entre os parênteses não é antissimétrico nos índices σ e μ, e por isso pode, sim, ter contribuição para as componentes do vetor de energia-momento. Apesar de Θμ⁢ρ não ser invariante de calibre, quando uma destas transformações é aplicada, a variação do mencionado tensor é, sob o cumprimento das equações do movimento, (273) Δ Θ μ ⁢ ρ = 1 e ∂ σ { - ( 1 + 2 a 2 □ ) F μ ⁢ σ ∂ ρ α + a 2 ∂ λ F μ ⁢ λ ∂ ρ ∂ σ α - a 2 ∂ λ F σ ⁢ λ ∂ ρ ∂ μ α } , ou seja, igual à divergência, em relação ao índice σ, de um tensor antissimétrico em seus índices σ e μ. Como consequência, o vetor de energia-momento, que são as quantidades conservadas sob condições assintóticas apropriadas, são invariantes de calibre. Como o tensor encontrado não é simétrico, para simetrizá-lo precisaremos aplicar o procedimento de Belinfante-Rosenfeld, o qual começa com o cálculo do tensor do spin, que para a teoria da segunda ordem, tem a expressão mostrada na Eq. (215). Em função das quantidades (Aσ)μ e (Bσ)μ⁢ν, se escreve (274) S = λ ⁢ τ μ - ( A σ ) μ ( U λ ⁢ τ A ) σ + ( B σ ) μ ⁢ ν ⋅ [ ∂ ν ( U λ ⁢ τ A ) σ - ( ∂ λ A σ g ν ⁢ τ - ∂ τ A σ g ν ⁢ λ ) ] . Precisamos usar nela a Eq. (243), isto é, (275) ( U λ τ A ) μ = ( U λ τ ) μ ν A ν = δ λ μ A τ − δ τ μ A λ . Após simplificação, o resultado é (276) S μ λ τ = − ( 1 + 2 a 2 □ ) F μ λ A τ + ( 1 + 2 a 2 □ ) F μ τ A λ − a 2 ( ∂ λ ∂ ρ F μ ρ A τ − ∂ τ ∂ ρ F μ ρ A λ ) + 2 a 2 ( g μ λ ∂ ρ F σ ρ F − σ τ g μ τ ∂ ρ F σ ρ F σ λ − ∂ ρ F τ ρ F λ μ + ∂ ρ F λ ρ F τ μ ) − a 2 ( g μ λ ∂ ρ F σ ρ ∂ σ A τ − g μ τ ∂ ρ F σ ρ ∂ σ A λ − ∂ ρ F τ ρ ∂ λ A μ + ∂ ρ F λ ρ ∂ τ A μ ) . Reconhece-se, mais uma vez, que no limite em que a2→0 o resultado anterior se iguala ao obtido para a teoria de Maxwell, Eq. (246), que agora se vê modificado pelos termos proporcionais ao quadrado do parâmetro de Podolsky. A partir deste ponto, o procedimento pode ser continuado, calculando o tensor de Belinfante-Rosenfeld, sua divergência e adicionando-a ao tensor canônico de energia-momento. É patente, contudo, que semelhante procedimento não é facilmente aplicável devido à quantidade de termos contidos no tensor do spin. Por isso, desenvolveremos na seção11 uma técnica alternativa para o cálculo do tensor simétrico de energia-momento. . Uma vez que para teorias de ordem superior, como a de Podolsky, o procedimento de Belinfante-Rosenfeld se torna computacionalmente pouco atraente, estudamos na seção11 11. Relação do Tensor Canônico de Energia-Momento com o Métrico Nesta seção estabeleceremos a relação entre o tensor de energia-momento derivado do teorema de Nöther – a que se dá o adjetivo «canônico» – e aquele que se obtém na teoria de relatividade geral – chamado «métrico». Seguiremos para tanto a Ref. [31], estendendo os argumentos para teorias da segunda ordem. Este estudo se justifica não somente pelo interesse na teoria da gravidade einsteniana, mas também (e principalmente) porque, o vimos na seção anterior, o problema da simetrização do tensor canônico de energia-momento pelo método de Belinfante-Rosenfeld se complica rapidamente quando a teoria é da ordem superior – não significando isto, desejamos salientar, que o tal método seja inaplicável a tais teorias. Outrossim, manteremos a discussão nas teorias que descrevem o campo tensorial19. Antes de iniciar o desenvolvimento do assunto, desejamos salientar que o fato de que o tensor de energia-momento se relacionar com a derivada funcional da ação da matéria em relação ao campo métrico, gμ⁢ν⁢(x), não é casualidade, mas tem uma origem física profunda que pode ser compreendida à luz do já aprendido. Com efeito, a teoria einsteniana possui como propriedade fundamental a de ser invariante sob transformações gerais de coordenadas (invariância sob difeomorfismos). Infinitesimalmente, uma tal transformação das coordenadas escreve-se (277) y μ = x μ + ξ μ ⁢ ( x ) , ξ μ ∈ C + ∞ ⁢ ( ℝ 4 ) . Ora, não é difícil reconhecer que semelhante transformação poderia perfeitamente ser interpretada como uma translação localizada. Logo a teoria invariante por esse tipo de transformações é uma teoria de calibre associada ao grupo das translações20. Por outro lado, a teoria geral dos campos de calibre de Utiyama tem-nos mostrado que a fonte nas equações do movimento do campo de calibre é igual à corrente conservada como consequência da simetria da ação perante as transformações do grupo de calibre – compare, por exemplo, as Eqs. (179) e (183) para o caso eletromagnético –, o que significa que é possível encontrar a corrente conservada por derivação funcional, em relação ao campo de calibre, da parte da ação que contém a matéria e a interação, donde, na teoria de calibre do grupo das translações, a fonte do campo de calibre (gravitacional) será igual à corrente conservada pela simetria da ação perante as translações, isto é, por definição, o tensor de energia-momento. Consideremos, pois, um conjunto de campos (tensoriais) u, e consideremos igualmente o campo métrico gρ⁢σ. Mantendo-nos no formalismo lagrangiano, a ação invariante sob transformações gerais de coordenadas requer escrever, já não 𝒫=ℒ, senão (278) 𝒫 = - g ⁢ ℒ , com g=det⁡(gρ⁢σ) o determinante da matriz constituída pelas componentes do campo métrico. Isto é assim porque na passagem de um sistema cartesiano de coordenadas {xμ} a um sistema curvilíneo {yμ}, o elemento de volume muda segundo (279) d ⁢ y = | ∂ ⁡ y ∂ ⁡ x | ⁢ d ⁢ x = J ⁢ d ⁢ x , com J=|∂⁡y/∂⁡x| o jacobiano da transformação de coordenadas. Tal jacobiano J pode ser calculado levando em conta que o campo métrico gμ⁢ν⁢(y) no sistema curvilíneo obtém-se a partir de g(0)⁢ρ⁢σ, no sistema cartesiano {xμ}, através da relação (280) g μ ⁢ ν ⁢ ( y ) = ∂ ⁡ y μ ∂ ⁡ x ρ ⁢ ∂ ⁡ y ν ∂ ⁡ x σ ⁢ g ( 0 ) ⁢ ρ ⁢ σ , de modo que, tomando o determinante dessa equação, (281) 1 g = J 2 ⁢ ( - 1 ) ⇒ J = 1 - g , em que o sinal positivo foi utilizado na extração da raiz quadrada para que o elemento de volume seja sempre positivo. A substituição deste resultado na Eq. (279) prova que o elemento de volume invariante é -g⁢d⁢x, justificando a Eq. (278). Colocando, pois, a Eq. (278) na (8), a variação da ação é (282) δ ⁢ 𝒜 = ∫ Ω δ ⁢ 𝒜 δ ⁢ u ⁢ Δ ⁢ u ⁢ d x + ∫ Ω δ ⁢ 𝒜 δ ⁢ g ρ ⁢ σ ⁢ Δ ⁢ g ρ ⁢ σ ⁢ d x - ∮ ∂ ⁡ Ω [ ( ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) ) Δ u - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ∂ ν Δ u ] d σ μ - ∮ ∂ ⁡ Ω { [ ( ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ g ρ ⁢ σ ) ) Δ g ρ ⁢ σ - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) ∂ ν Δ g ρ ⁢ σ ] - 𝒫 Δ x μ } d σ μ . Definimos o «tensor métrico da energia-momento» como (283) T ρ ⁢ σ := 2 - g ⁢ δ ⁢ 𝒜 δ ⁢ g ρ ⁢ σ , o qual é, como antes dizíamos, simétrico por definição. Na Eq. (283), (284) δ ⁢ 𝒜 = ∫ Ω δ ⁢ 𝒜 δ ⁢ u ⁢ Δ ⁢ u ⁢ d x + ∫ Ω 1 2 ⁢ T ρ ⁢ σ ⁢ - g ⁢ Δ ⁢ g ρ ⁢ σ ⁢ d x + ∮ ∂ ⁡ Ω [ ( ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) - ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ) Δ u + ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ∂ ν Δ u + 𝒫 Δ x μ ] d σ μ - ∮ ∂ ⁡ Ω { [ ( ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ g ρ ⁢ σ ) ) Δ g ρ ⁢ σ - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) ∂ ν Δ g ρ ⁢ σ ] } d σ μ . Para continuar, usando a Eq. (277) na (280), (285) g ′ ⁣ μ ⁢ ν ⁢ ( y ) = g μ ⁢ ν ⁢ ( x ) + ∂ μ ⁡ ξ ν ⁢ ( x ) + ∂ ν ⁡ ξ μ ⁢ ( x ) , de modo que, usando também que Δ⁢xμ=ξμ, a variação funcional do campo métrico é (286) Δ ⁢ g μ ⁢ ν ⁢ ( x ) = ∂ μ ⁡ ξ ν ⁢ ( x ) + ∂ ν ⁡ ξ μ ⁢ ( x ) - ξ λ ⁢ ( x ) ⁢ ∂ λ ⁡ g μ ⁢ ν ⁢ ( x ) . Introduzindo os coeficientes de conexão (287) Γ := λ ⁢ τ ρ 1 2 g ρ ⁢ σ ( ∂ λ g τ ⁢ σ + ∂ τ g σ ⁢ λ - ∂ σ g λ ⁢ τ ) , e as derivadas covariantes (288) ∇ μ ξ ν : = ∂ μ ξ ν + Γ ν ρ μ ξ ρ , a variação funcional do campo métrico pode ser escrita como21 (289) Δ ⁢ g μ ⁢ ν ⁢ ( x ) = ∇ μ ⁡ ξ ν ⁢ ( x ) + ∇ ν ⁡ ξ μ ⁢ ( x ) . Por isto, e como a conexão definida na Eq. (287) é métrica, no sentido de satisfazer à equação ∇ρ⁡gμ⁢ν=0, o segundo termo do lado direito da Eq. (284) é (290) ∫ Ω 1 2 ⁢ T ρ ⁢ σ ⁢ - g ⁢ Δ ⁢ g ρ ⁢ σ ⁢ d x = - ∫ Ω ∇ ρ ⁡ T ρ ⁢ σ ⁢ - g ⁢ ξ σ ⁢ d ⁢ x + ∮ ∂ ⁡ Ω T ρ ⁢ σ ⁢ ξ σ ⁢ - g ⁢ d σ ρ . Na Eq. (284), (291) δ ⁢ 𝒜 = ∫ Ω δ ⁢ 𝒜 δ ⁢ u ⁢ Δ ⁢ u ⁢ d x - ∫ Ω ∇ ρ ⁡ T ρ ⁢ σ ⁢ ξ σ ⁢ - g ⁢ d ⁢ x + ∮ ∂ ⁡ Ω { T μ ⁢ ρ ξ ρ - g + [ ( ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) - ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ) ⋅ Δ u + ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ∂ ν Δ u + 𝒫 ξ μ ] } d σ μ - ∮ ∂ ⁡ Ω { ( ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ g ρ ⁢ σ ) ) Δ g ρ ⁢ σ - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) ∂ ν Δ g ρ ⁢ σ } d σ μ . Continuamos escrevendo, na segunda linha da equação recém escrita, a forma explícita das variações dos campos u. Como a transformação é uma translação localizada, ter-se-á que (292) Δ ⁢ u ⁢ ( x ) = δ ⁢ u ⁢ ( x ) - ∂ ρ ⁡ u ⁢ ( x ) ⁢ ξ ρ ⁢ ( x ) , em que δ⁢u⁢(x) dependerá da natureza do campo: Se ele é escalar, será δ⁢u⁢(x)=0, mas no caso geral em que ele seja tensorial, δ⁢u dependerá das derivadas de ξμ⁢(x) de forma semelhante ao campo métrico [Eq. (285)]. Para a parte -∂ρ⁡u⁢ξρ da variação Δ⁢u, o termo entre os colchetes na segunda linha da Eq. (291) reduzir-se-á ao tensor canônico de energia-momento, cuja definição para teorias da segunda ordem foi dada na Eq. (16). A substituição dessa relação, junto com a Eq. (286), permite exprimir a variação da ação dependendo de ξσ⁢(x) e suas derivadas de até a terceira ordem. Com efeito, denotando, como na Eq. (107), (293) A u μ := ∂ ν ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) , B u μ ⁢ ν := ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) , A g μ ⁢ ρ ⁢ σ := ∂ ν ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ g ρ ⁢ σ ) , B g μ ⁢ ν ⁢ ρ ⁢ σ := ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) , o cálculo permite transformar a Eq. (291) à equivalente (294) δ ⁢ 𝒜 = ∫ Ω δ ⁢ 𝒜 δ ⁢ u ⁢ Δ ⁢ u ⁢ d x - ∫ Ω ∇ ρ ⁡ T ρ ⁢ σ ⁢ ξ σ ⁢ - g ⁢ d ⁢ x + ∫ Ω ∂ μ ⁡ ( - A u μ ⁢ δ ⁢ u + B u μ ⁢ ν ⁢ ∂ ν ⁡ δ ⁢ u ) ⁡ d ⁢ x + ∫ Ω ( H σ ξ σ + H μ ⁢ σ ∂ μ ξ σ + H μ ⁢ ν ⁢ σ ∂ μ ∂ ν ξ σ + H μ ⁢ ν ⁢ ρ ⁢ σ ∂ μ ∂ ν ∂ ρ ξ σ ) d x , com as quantidades (295) H σ = ∂ μ ⁡ ( T μ ⁢ σ ⁢ - g - Θ μ ⁢ σ + A g μ ⁢ ρ ⁢ λ ⁢ ∂ σ ⁡ g ρ ⁢ λ - B g μ ⁢ ν ⁢ ρ ⁢ λ ⁢ ∂ ν ⁡ ∂ σ ⁡ g ρ ⁢ λ ) , (296) H μ ⁢ σ = T μ ⁢ σ ⁢ - g - Θ μ ⁢ σ - ∂ ρ ⁡ ( B u ρ ⁢ μ ⁢ ∂ σ ⁡ u ) + 2 ⁢ ∂ λ ⁡ A g λ ⁢ μ ⁢ σ - A g μ ⁢ ρ ⁢ τ ⁢ ∂ σ ⁡ g ρ ⁢ τ - ∂ ν ⁡ B g ν ⁢ μ ⁢ ρ ⁢ λ ⁢ ∂ σ ⁡ g ρ ⁢ λ - 2 ⁢ B g μ ⁢ ν ⁢ ρ ⁢ λ ⁢ ∂ ν ⁡ ∂ σ ⁡ g ρ ⁢ λ , (297) H μ ⁢ ν ⁢ σ = A g μ ⁢ ν ⁢ σ + A g ν ⁢ μ ⁢ σ - ∂ λ ⁡ B g λ ⁢ μ ⁢ ν ⁢ σ - ∂ λ ⁡ B λ ⁢ ν ⁢ μ ⁢ σ - B g μ ⁢ ν ⁢ ρ ⁢ λ ⁢ ∂ σ ⁡ g ρ ⁢ λ , (298) H μ ⁢ ν ⁢ ρ ⁢ σ = 1 3 ⁢ ( B g μ ⁢ ν ⁢ ρ ⁢ σ + B g μ ⁢ ρ ⁢ ν ⁢ σ + B g ν ⁢ ρ ⁢ μ ⁢ σ ) . Em particular, estaremos interessados no limite em que o campo métrico se torna constante (limite de espaço-tempo plano), em que todas as derivadas do campo métrico se anulam e -g=1. Em tal limite, (299) H σ = ∂ μ ⁡ ( T μ ⁢ σ - Θ μ ⁢ σ ) , (300) H μ ⁢ σ = T μ ⁢ σ - Θ μ ⁢ σ - ∂ ρ ⁡ ( B u ρ ⁢ μ ⁢ ∂ σ ⁡ u ) + 2 ⁢ ∂ λ ⁡ A g λ ⁢ μ ⁢ ν , (301) H μ ⁢ ν ⁢ σ = A g μ ⁢ ν ⁢ σ + A g ν ⁢ μ ⁢ σ - ∂ λ ⁡ B g λ ⁢ μ ⁢ ν ⁢ σ - ∂ λ ⁡ B g λ ⁢ ν ⁢ μ ⁢ σ , (302) H μ ⁢ ν ⁢ ρ ⁢ σ = 1 3 ⁢ ( B g μ ⁢ ν ⁢ ρ ⁢ σ + B g μ ⁢ ρ ⁢ ν ⁢ σ + B g ν ⁢ ρ ⁢ μ ⁢ σ ) , em que estarão presentes, é claro, só os termos que não sejam nulos nos limites indicados. Como a ação é invariante, por hipótese, perante a translação localizada da Eq. (277), deverá ser δ⁢𝒜=0, o que então implica, vista a independência de ξσ⁢(x) e de suas derivadas, que cada uma das quantidades proporcionais a elas seja nula. Neste ponto será então preciso explicitar qual seja a variação δ⁢u do campo material, que aparece na segunda linha da Eq. (294), uma vez que tal variação pode depender, ou não, das derivadas de ξσ⁢(x) até uma ordem relacionada com o posto do campo tensorial u. § Campo escalar: No caso em que u é um campo escalar se cumpre que (303) u ′ ⁢ ( y ) = u ⁢ ( x ) ⇒ δ ⁢ u = 0 . A segunda linha da Eq. (294) encontra-se, pois, ausente neste tipo de teoria. § Campo vetorial: Se uμ é um campo vetorial, sua lei de transformação é (304) u μ ′ ⁢ ( y ) = ∂ ⁡ x ν ∂ ⁡ y μ ⁢ u ν ⁢ ( x ) ⇒ δ ⁢ u μ = - ∂ μ ⁡ ξ ν ⁢ u ν . A segunda linha da Eq. (294) adota a seguinte forma: (305) ∫ Ω { ∂ ρ ( A u ρ ⁢ μ u σ - B u ρ ⁢ ν ⁢ μ ∂ ν u σ ) ∂ μ ξ σ + 1 2 [ ( A u μ ⁢ ρ + A u ρ ⁢ μ ) u σ - ∂ ρ ( ( B u ρ ⁢ μ ⁢ ν + B u ρ ⁢ ν ⁢ μ ) u σ ) - ( B u ρ ⁢ μ ⁢ ν + B u ρ ⁢ ν ⁢ μ ) ∂ ρ u σ ] ∂ μ ∂ ν ξ σ - 1 3 ⁢ ( B u μ ⁢ ν ⁢ ρ + B u μ ⁢ ρ ⁢ ν + B u ρ ⁢ ν ⁢ μ ) ⁢ u σ ⁢ ∂ μ ⁡ ∂ ν ⁡ ∂ ρ ⁡ ξ σ + 𝒪 ( ∂ g ; ∂ ∂ g ; ∂ ∂ ∂ g ) } d x . § Campo tensorial de posto 2: Caso uρ⁢λ seja um campo tensorial de posto 2, sua lei de transformação será a seguinte: (306) u μ ⁢ ν ′ ⁢ ( y ) = ∂ ⁡ x ρ ∂ ⁡ y μ ⁢ ∂ ⁡ x λ ∂ ⁡ y ν ⁢ u ρ ⁢ λ ⁢ ( x ) ⇒ δ ⁢ u μ ⁢ ν = - ∂ μ ⁡ ξ ρ ⁢ u ρ ⁢ ν - ∂ ν ⁡ ξ ρ ⁢ u μ ⁢ ρ . Logo, a segunda linha da Eq. (294) será igual a (307) ∫ Ω { ∂ ρ [ A u ρ ⁢ μ ⁢ λ ( u + λ σ u ) λ σ - B u ρ ⁢ ν ⁢ μ ⁢ λ ( ∂ ν u + λ σ ∂ ν u ) λ σ ] ∂ μ ξ σ + 1 2 [ ( A u ν ⁢ μ ⁢ λ + A u μ ⁢ ν ⁢ λ ) ( u + λ σ u ) λ σ - ( B u μ ⁢ ρ ⁢ ν ⁢ λ + B u ν ⁢ ρ ⁢ μ ⁢ λ ) ( ∂ ρ u + λ σ ∂ ρ u ) λ σ - ∂ ρ ( ( B u ρ ⁢ ν ⁢ μ ⁢ λ + B u ρ ⁢ μ ⁢ ν ⁢ λ ) ( u + λ σ u ) λ σ ) ] ∂ μ ∂ ν ξ σ - 1 3 [ ( B u μ ⁢ ν ⁢ ρ ⁢ λ + B u ρ ⁢ ν ⁢ μ ⁢ λ + B u μ ⁢ ρ ⁢ ν ⁢ λ ) ( u + λ σ u ) λ σ ] ⋅ ∂ μ ∂ ν ∂ ρ ξ σ + 𝒪 ( ∂ g ; ∂ ∂ g ; ∂ ∂ ∂ g ) } d x . Como se verifica nas Eqs. (305) e (307), qualquer que seja a natureza do campo material u, no limite de espaço-tempo plano a segunda linha da Eq. (294) só contribui com termos que são proporcionais a ∂μ⁡ξσ, ∂μ⁡∂ν⁡ξσ e ∂μ⁡∂ν⁡∂ρ⁡ξσ, mas em nenhum caso contribui com algum termo proporcional a ξσ. Por isto, em todos os casos a imposição da invariância da ação sob translações localizadas à Eq. (294), sob o cumprimento das equações do movimento para u e as identidades de Bianchi (que implicam que seja ∇ρ⁡Tρ⁢σ=0 [32]), levará à identidade (308) H σ = ∂ μ ⁡ ( T μ ⁢ σ - Θ μ ⁢ σ ) = 0 . Essa é a relação crucial para a prova da equivalência entre o tensor canônico de energia-momento e o métrico: Como a divergência da diferença entre eles é nula, já é evidente que, se um deles satisfaz à equação de conservação, então o outro também o faz. Ademais, a diferença entre eles terá de ser igual à divergência de um tensor antissimétrico: (309) T μ ⁢ σ - Θ μ ⁢ σ = ∂ ρ ⁡ Y ρ ⁢ μ ⁢ σ ; Y ρ ⁢ μ ⁢ σ = - Y μ ⁢ ρ ⁢ σ . Concluimos assim que os tensores de energia-momento Tμ⁢σ e Θμ⁢σ são físicamente equivalentes, no sentido de levarem às mesmas quantidades conservadas (vetor de energia-momento). Quanto ao anulamento dos termos proporcionais às derivadas de ξσ até da terceira ordem, elas estabelecem relações de possibilidade para as teorias da segunda ordem acopladas ao campo métrico. É claro, todavia, pelo desenvolvimento feito, que tais condições dependerão da natureza (posto) do campo tensorial u. Em particular, analisaremos os termos proporcionais a ∂⁡ξ. § Campo escalar: Como não há contribuição adicional ao termo proporcional a ∂⁡ξ, das Eqs. (300) e (309): (310) ∂ ρ ⁡ ( B u ρ ⁢ μ ⁢ ∂ σ ⁡ u ) - 2 ⁢ ∂ ρ ⁡ A g ρ ⁢ μ ⁢ σ = ∂ ρ ⁡ Y ρ ⁢ μ ⁢ σ , isto é, que (311) ∂ ρ ⁡ ( B u ρ ⁢ μ ⁢ ∂ σ ⁡ u - 2 ⁢ A g ρ ⁢ μ ⁢ σ - Y ρ ⁢ μ ⁢ σ ) = 0 , e portanto se deduz a existência de um tensor Zλ⁢ρ⁢μ⁢σ tal que (312) B u ρ ⁢ μ ⁢ ∂ σ ⁡ u - 2 ⁢ A g ρ ⁢ μ ⁢ σ - Y ρ ⁢ μ ⁢ σ = ∂ λ ⁡ Z λ ⁢ ρ ⁢ μ ⁢ σ ; Z λ ⁢ ρ ⁢ μ ⁢ σ = - Z ρ ⁢ λ ⁢ μ ⁢ σ . § Campo vetorial: Das Eqs. (300), (305) e (309), para o campo vetorial: (313) ∂ ρ ( B u ρ ⁢ μ ⁢ λ ∂ σ u λ - 2 A g ρ ⁢ μ ⁢ σ - A u ρ ⁢ μ u σ + B u ρ ⁢ ν ⁢ μ ∂ ν u σ - Y ρ ⁢ μ ⁢ σ ) = 0 , donde se deduz, também, a existência de um tensor Zλ⁢ρ⁢μ⁢σ=-Zρ⁢λ⁢μ⁢σ tal que (314) B u ρ ⁢ μ ⁢ λ ⁢ ∂ σ ⁡ u λ - 2 ⁢ A g ρ ⁢ μ ⁢ σ - A u ρ ⁢ μ ⁢ u σ + B u ρ ⁢ ν ⁢ μ ⁢ ∂ ν ⁡ u σ - Y ρ ⁢ μ ⁢ σ = ∂ λ ⁡ Z λ ⁢ ρ ⁢ μ ⁢ σ . § Campo tensorial de posto 2: Por último, das Eqs. (300), (307) e (309) encontra-se que, para o campo tensorial, (315) ∂ ρ [ B u ρ ⁢ μ ⁢ λ ⁢ τ ∂ σ u λ ⁢ τ - 2 A g ρ ⁢ μ ⁢ σ - A u ρ ⁢ μ ⁢ λ ( u + λ σ u ) λ σ + B u ρ ⁢ ν ⁢ μ ⁢ λ ( ∂ ν u + λ σ ∂ ν u ) λ σ - Y ρ ⁢ μ ⁢ σ ] = 0 . Outra vez, deduz-se a existência de um tensor Zλ⁢ρ⁢μ⁢σ=-Zρ⁢λ⁢μ⁢σ tal que (316) B u ρ ⁢ μ ⁢ λ ⁢ τ ∂ σ u λ ⁢ τ - 2 A g ρ ⁢ μ ⁢ σ - A u ρ ⁢ μ ⁢ λ ( u + λ σ u ) λ σ + B u ρ ⁢ ν ⁢ μ ⁢ λ ( ∂ ν u + λ σ ∂ ν u ) λ σ - Y ρ ⁢ μ ⁢ σ = ∂ λ Z λ ⁢ ρ ⁢ μ ⁢ σ . Tendo estabelecido desta forma a equivalência física entre o tensor canônico de energia-momento e o métrico no limite de espaço-tempo plano, a seguir derivaremos o tensor métrico de energia-momento para a eletrodinâmica de Maxwell e para a de Podolsky. 11.1. Tensor métrico de energia-momento docampo de Maxwell Utilizaremos nesse caso a densidade (317) 𝒫 = - - g 4 ⁢ g μ ⁢ ρ ⁢ g ν ⁢ σ ⁢ F μ ⁢ ν ⁢ F ρ ⁢ σ . A princípio, o tensor de Faraday é agora Fμ⁢ν=∇μ⁡Aν-∇ν⁡Aμ. Todavia, uma vez que os símbolos de Christoffel são simétricos em seus dois índices inferiores –o que significa que no espaço-tempo em consideração a torsão é nula–, é fácil mostrar que a derivação covariante, neste caso, é irrelevante: F μ ν = ( ∂ μ A ν − Γ ρ μ ν A ρ ) − ( ∂ ν A μ − Γ ρ ν μ A ρ ) = ∂ μ ⁡ A ν - ∂ ν ⁡ A μ . Essa parte da densidade 𝒫 é, portanto, independente do campo métrico. Logo, efetuando variações do campo métrico, a ação muda segundo (318) δ 𝒜 = ∫ Ω - - g 4 [ Δ g μ ⁢ ρ g ν ⁢ σ F μ ⁢ ν F ρ ⁢ σ + g μ ⁢ ρ Δ g ν ⁢ σ F μ ⁢ ν F ρ ⁢ σ + 1 2 g λ ⁢ τ Δ g λ ⁢ τ g μ ⁢ ρ g ν ⁢ σ F μ ⁢ ν F ρ ⁢ σ ] d x = ∫ Ω - g 4 ( F λ ⁢ σ F + σ τ F ρ ⁢ λ F ρ τ - 1 2 g λ ⁢ τ F μ ⁢ ν F μ ⁢ ν ) Δ g λ ⁢ τ d x . Daqui que a aplicação da Eq. (283) leva ao tensor métrico de energia-momento (319) T λ ⁢ τ = F λ ⁢ σ F - σ τ 1 4 g λ ⁢ τ F μ ⁢ ν F μ ⁢ ν , que é, como provado anteriormente, físicamente equivalente ao canônico, e que, ademais, já é simétrico e invariante de calibre. 11.2. Tensor métrico de energia-momento do campo de Podolsky Usaremos agora a densidade (320) 𝒫 = - g ( - 1 4 g μ ⁢ ρ g ν ⁢ σ F μ ⁢ ν F ρ ⁢ σ + a 2 2 g ρ ⁢ α g μ ⁢ β g σ ⁢ γ ∇ α F μ ⁢ ρ ∇ σ F β ⁢ γ ) . Desta vez, embora os tensores de Faraday sejam, como no caso prévio, independentes do campo métrico, suas derivadas covariantes não o são. De fato, ter-se-á que, sob uma variação do campo métrico, (321) Δ ( ∇ α F μ ρ ) = − ΔΓ ε μ α F ε ρ − ΔΓ v ρ α F μ ε , com (322) ΔΓ ε μ α = 1 2 g ε κ ( ∂ μ Δ g α κ + ∂ α Δ g μ κ − ∂ κ Δ g μ α ) + 𝒪 ( ∂ g ) . Os termos nessa variação que dependem das derivadas do campo métrico serão irrelevantes para nossos propósitos, uma vez que estamos interessados no limite de espaço-tempo plano. No mencionado limite, a variação da ação é (323) δ 𝒜 = ∫ Ω - g 2 ( F λ ⁢ σ F - σ τ 1 4 g λ ⁢ τ F μ ⁢ ν F μ ⁢ ν ) Δ g λ ⁢ τ d x (324) + a 2 2 ∫ Ω - g { Δ g ρ ⁢ α ∂ α F μ ⁢ ρ ∇ σ F μ ⁢ σ + Δ g μ ⁢ β ∂ ρ F μ ⁢ ρ ∂ σ F + β σ Δ g σ ⁢ γ ∂ ρ F μ ⁢ ρ ∂ σ F γ μ + 1 2 g λ ⁢ τ Δ g λ ⁢ τ ∂ ρ F μ ⁢ ρ ∂ σ F μ ⁢ σ } d x (325) + a 2 2 ⁢ ∫ Ω - g ⁢ g ρ ⁢ α ⁢ g μ ⁢ β ⁢ g σ ⁢ γ ⋅ { ( − ΔΓ ε μ α F ε ρ − ΔΓ ε ρ α F μ ε ) ∂ σ F β γ + ∂ α F μ ρ ( − ΔΓ ε β σ F ε γ − ΔΓ ε γ σ F β ε ) } d x . O primeiro termo, Eq. (323), é o mesmo que já apareceu na teoria de Maxwell, e sua contribuição ao tensor de energia-momento é dado na Eq. (319). Quanto ao termo da Eq. (324), a aplicação da relação Δ⁢gμ⁢ν=-gμ⁢σ⁢gν⁢ρ⁢Δ⁢gσ⁢ρ permite obter sua contribuição: (326) T ( 1 ) λ ⁢ τ = - a 2 [ ( ∂ λ F μ ⁢ τ + ∂ τ F μ ⁢ λ ) ∂ σ F μ ⁢ σ + ∂ ρ F λ ⁢ ρ ∂ σ F τ ⁢ σ - 1 2 g λ ⁢ τ ∂ ρ F μ ⁢ ρ ∂ σ F μ ⁢ σ ] . Finalmente, o uso da Eq. (322) na Eq. (325), após integração por partes e eliminação de termos de superfície sob as condições assintóticas de desvanecimento das variações Δ⁢g no infinito, permite obter também a contribuição do mencionado termo: (327) T ( 2 ) λ ⁢ τ = a 2 [ - g λ ⁢ τ ∂ ρ ( F μ ⁢ ρ ∂ σ F μ ⁢ σ ) + ∂ ρ ⁡ ( F λ ⁢ τ ⁢ ∂ σ ⁡ F τ ⁢ σ + F τ ⁢ ρ ⁢ ∂ σ ⁡ F λ ⁢ σ ) + ∂ λ ( F μ ⁢ τ ∂ ρ F μ ⁢ ρ ) + ∂ τ ( F μ ⁢ λ ∂ ρ F μ ⁢ ρ ) ] . Juntando todas as partes, por último, chegamos ao tensor de energia-momento do campo de Podolsky: (328) T λ ⁢ τ = F λ ⁢ σ F - σ τ 1 4 g λ ⁢ τ F μ ⁢ ν F μ ⁢ ν - a 2 2 g λ ⁢ τ ∂ ρ F μ ⁢ ρ ∂ σ F μ ⁢ σ + a 2 [ - g λ ⁢ τ F μ ⁢ ρ ∂ ρ ∂ σ F μ ⁢ σ + ∂ ρ F λ ⁢ ρ ∂ σ F τ ⁢ σ + F λ ⁢ ρ ⁢ ∂ ρ ⁡ ∂ σ ⁡ F τ ⁢ σ + F τ ⁢ ρ ⁢ ∂ ρ ⁡ ∂ σ ⁡ F λ ⁢ σ - F τ ⁢ ρ ⁢ ∂ λ ⁡ ∂ σ ⁡ F ρ ⁢ σ - F λ ⁢ ρ ∂ τ ∂ σ F ρ ⁢ σ ] . Este tensor, é patente, é simétrico e também invariante de calibre, visto que depende únicamente do tensor de Faraday e de suas derivadas. a relação existente entre o tensor canônico de energia-momento e o métrico, cujo cálculo é significativamente mais simples. Como se verá, todos esses desenvolvimentos, embora diversos, podem ser entendidos de forma unificada pela presença constante dos teoremas de Nöther: É tal generalidade, precisamente, o que os torna essenciais na física. A seção12 12. Comentários Finais Nesse artigo, mostramos, com apenas alguns tópicos escolhidos, a enorme importância que os teoremas de Nöther possuem nas diversas áreas da Física atual. Iniciamos formulando a teoria clássica do campo de ordem (finita) qualquer, obtendo a equação diferencial de Lie para as transformações que deixam invariante à ação. Especializando para teorias da segunda ordem – suficiente para ilustrar o procedimento geral –, mostramos a forma em que o princípio da ação estacionária de Ostrogradskii–Hamilton leva às equações do movimento, quer elas sejam as de Euler–Lagrange, quando 𝒫=ℒ, quer as equações canônicas de Hamilton, quando 𝒫=π⁢∂o⁡φ-ℋ. Assim trabalhamos, seguindo a Nöther, os formalismos lagrangiano e hamiltoniano simultaneamente. A seguir mostramos o primeiro teorema de Nöther, que se reduz às conhecidas leis de conservação das correntes de Nöther para campos físicos, satisfazendo equações de continuidade e que levam, via a regra integral de Leibniz, ao aparecimento das cargas de Nöther, invariantes no tempo (conservadas) sob condições assintóticas de anulamento dos campos e de suas primeiras derivadas no infinito espacial. O primeiro teorema recíproco de Nöther foi então enunciado e provado. Vale salientar que, como escrevemos claramente, ele tem por hipótese que «r combinações linearmente independentes das derivadas funcionais da ação se reduzem a divergências.» Isto é extremamente importante, pois tal hipótese é diferente da de supor que existam r cargas conservadas para campos físicos. Com efeito, após exemplificarmos brevemente a aplicação dos teoremas para o campo escalar relativístico real e o campo de Schrödinger, passamos a estudar o problema de Kepler na mecânica dos pontos. No formalismo lagrangiano, o vetor de Laplace–Runge–Lenz, que junto à energia e o momento angular determina de forma completa as órbitas no problema de dois corpos, não pode ser relacionado a uma simetria, pois sua derivada temporal não pode ser escrita como combinação linear das derivadas funcionais da ação, logo a tese do teorema recíproco de Nöther não se aplica. Isto mostra que a lagrangiana não contém todas as simetrias do sistema físico que descreve. O formalismo hamiltoniano, por outro lado, as contém, sim: O espaço das fases é capaz de acomodar as simetrias dinâmicas inexpressíveis no espaço das configurações. De sorte que o primeiro teorema recíproco de Nöther sempre se aplica no formalismo hamiltoniano, em que todas as simetrias estão presentes. Assim sendo, no formalismo hamiltoniano, para campos físicos, a existência de simetrias é equivalente à existência de quantidades conservadas. Aqui, pois, pode-se escolher livremente se se aceita como axioma (matemático) o princípio de simetria (invariância) ou como axioma (empírico) a lei de conservação: as duas escolhas tornam-se logicamente equivalentes. Além do mais, vimos que as correntes de Nöther são geradoras de transformações canônicas e formam uma álgebra de Lie fechada. Essa álgebra (de parênteses de Poisson) é igual à álgebra (de comutadores) das transformações das coordenadas e momentos. Isto é o que permite encontrar a álgebra do grupo de simetrias estudando a álgebra das correntes de Nöther. Passando ao segundo teorema de Nöther e seu recíproco, em que o grupo de simetrias é localizado (dependente do ponto), mostramos que em tais circunstâncias é imperativo que ao menos um dos campos envolvidos tenha sua variação dependente das derivadas dos parâmetros do grupo, pois se assim não fosse as equações de Euler–Lagrange tornariam-se identidades. Provamos que as identidades que derivam desse teorema reduzem-se, para campos físicos, à mesma lei de conservação do primeiro teorema, além de um conjunto de equações de descida que permite construir a corrente conservada por derivações sucessivas de um tensor antissimétrico cujo posto depende da ordem da teoria. Em particular, isto prova que na mecânica do ponto material a corrente de Nöther é nula quando construída com coordenadas físicas. Finalmente, as identidades do segundo teorema de Nöther levam também a uma redução do número de equações de Euler–Lagrange independentes, isto é, ao aparecimento de vínculos, pois torna em identidades algumas delas, havendo então mais funções incógnitas do que equações para determiná-las. Decorre disto que as condições iniciais não determinam univocamente a evolução posterior do sistema. Isto foi explicitamente exemplificado no modelo mecânico de Christ–Lee com potencial nulo [requerimento esse que pode perfeitamente ser relaxado adicionando um potencial da forma V⁢(r*⁢r)], que construímos partindo do princípio da invariância de calibre e fazendo um paralelismo com o método de Utiyama. Na aplicação dos teoremas à eletrodinâmica fermiônica de Maxwell, obtém-se, é conhecido, um tensor canônico de energia-momento que não é nem simétrico nem invariante de calibre. Introduzimos para solucionar tais dificuldades o método de simetrização de Belinfante–Rosenfeld, fazendo-o para teorias de até segunda ordem, mostrando dessa forma, construtivamente, que tal procedimento lhes é aplicável com os resultados desejados. Em qualquer caso, o procedimento consegue simetrizar o tensor canônico de energia-momento sempre que o sistema ao qual se aplica seja fechado, como comprovamos explicitamente. A eletrodinâmica de Podolsky foi construída estendendo o método de Utiyama para conter teorias de calibre livres da segunda ordem – seguindo a Ref. [25]. O cálculo de seu tensor canônico de energia-momento simetrizado pelo método de Belinfante–Rosenfeld, contudo, é um procedimento longo devido à grande quantidade de termos contidos no tensor de spin. Por isso, estudamos com detalhe a relação deste tensor simetrizado com o tensor métrico de energia-momento definido na teoria da gravidade einsteniana (ou, equivalentemente, na teoria de calibre do grupo das translações). Demonstramos que, para teorias de campos escalares, vetoriais e tensoriais de posto 2, de até segunda ordem, os dois tensores efetivamente se equivalem, exceto pela divergência de um tensor antissimétrico de posto 3; as duas formas de calcular o tensor de energia-momento são, assim, fisicamente equivalentes. Isto permitiu calcular de forma rápida os mencionados tensores tanto para a eletrodinâmica de Maxwell quanto para a de Podolsky. Finalizamos mencionando alguns pontos que não foram analisados neste artigo. Ao longo do texto, tem-se usado como hipótese que as variações dos campos – e de suas derivadas até uma determinada ordem – se anulam no infinito. Isto é válido em uma multidão de casos, porém não em todos. Um exemplo notável é o tratamento da teoria da gravidade de Einstein, em que o tensor métrico não se anula no infinito; ainda em soluções «assintóticamente planas», como a de Schwarzschild, a métrica tende ao valor constante igual à metrica do espaço-tempo de Minkowski, mas nunca ao valor nulo. Em tais circunstâncias, por exemplo, se acrescenta à ação termos adicionais, como o termo de York–Gibbons–Hawking. Hipóteses semelhantes regem a validade do segundo teorema de Nöther, em que os parâmetros e suas derivadas se assumiram nulas na fronteira ∂⁡Ω da região Ω⊆ℝ4. A tais transformações se conhece como «transformações de calibre pequenas», em contraposição às «transformações de calibre grandes», que não respeitam à anterior condição. Em tais circunstâncias, os termos de fronteira não podem ser desconsiderados. Por último, desejamos salientar que a definição do tensor métrico de energia-momento não deve ser considerada a resposta definitiva à questão de como definir semelhante grandeza. Um exemplo claro de que ela não está isenta de dificuldades encontra-se nas teorias com termos topológicos na ação – por exemplo, as teorias de Chern-Simons –, pois tais termos, por serem independentes da métrica, não contribuem para a derivada funcional da ação em relação a esta. Fica claro que a construção do tensor físico de energia-momento não é um assunto trivial. Não há dúvidas, esperamos ter deixado claro, de que os teoremas de Nöther são ferramentas extremamente poderosas para o estudo da Física e que suas aplicações vão muito além do cálculo das cargas conservadas. É justo, pois, reconhecer os desdobramentos a que eles têm conduzido, alguns dos quais apontamos neste artigo. , finalmente, contém uma breve discussão a respeito das dificuldades e tópicos não abordados no presente artigo.

2. Formalismo variacional da teoria do campo clássico

Abordaremos o estudo dos teoremas de Nöther a partir da perspectiva da teoria do campo clássico. Isto não é perda de generalidade, pois o caso da mecânica pode ser considerado, em primeira instância, suprimindo apenas os argumentos espaciais dos campos, e considerando as coordenadas generalizadas como sendo, elas mesmas, campos da coordenada temporal.

Considere o sistema de campos, conjuntamente caracterizados pela letra «u», cuja dinâmica é determinada pela função 𝒫(x;u;u;;nu) com n através da funcional de ação

(1) 𝒜 ( u ) = Ω 𝒫 ( x ; u ; u ; ; n u ) d x ,

na qual a integração se estende à região Ω do espaço-tempo. A função 𝒫 pode ser a densidade lagrangiana (caso em que os campos u=φ têm o rôle de coordenadas generalizadas), sua transformada de Legendre (caso em que u{φ;π} são os campos anteriores e seus momentos conjugados), et cetera . A teoria do campo clássico – o mesmo que a maior parte da física clássica (o motivo, argumentam alguns, é a inclinação teleológica dos homens que a estabeleceram, ou a influência filosófica que sobre eles pesou) – está regida por princípios variacionais. Daí que a formulação geral das propriedades do sistema de campos clássicos passa pelo estudo da variação da ação perante transformações das coordenadas e campos envolvidos. Considere, então, as seguintes transformações3 3 Na notação que usaremos, a variação «Δ» é a que comumente se denota «δ¯», e que representa a variação das coordenadas e da forma funcional do campo. :

(2) x y = x + Δ x , u ( x ) v ( x ) = u ( x ) + Δ u ( x ) ,

com Δx uma mudança infinitesimal das coordenadas e Δu uma mudança infinitesimal do campo segundo sua forma funcional. A variação total do campo, é claro, deve incluir também à variação das coordenadas; ela é, em primeira ordem,

(3) δ u ( x ) := v ( y ) - u ( x ) Δ u ( x ) + u ( x ) Δ x .

A variação da ação é, por outro lado,

(4) δ 𝒜 = Ω 𝒫 ( y ; v ; v ; ; n v ) d y - Ω 𝒫 ( x ; u ; u ; ; n u ) d x .

A equação recém escrita torna evidente que a função 𝒫 não muda, senão que são seus argumentos os que o fazem. Por isso, quando escrevermos

(5) δ 𝒫 := 𝒫 ( y ; v ; v ; ; n v ) - 𝒫 ( x ; u ; u ; ; n u ) = Δ 𝒫 + 𝒫 Δ x ,

é claro que a variação de 𝒫 é consequência da variação na forma funcional dos campos (Δ𝒫) e nas coordenadas (𝒫Δx). Se, além disso, fazemos na primeira integral do lado direito da Eq. (2) a mudança de variáveis de integração yx, obteremos:

(6) δ 𝒜 = Ω { ( 𝒫 + δ 𝒫 ) | y x | - 𝒫 } d x .

Mas a Eq. (2) implica que

(7) | y x | = 1 4 ! ε α β γ δ ε μ ν σ τ y α x μ y β x ν y γ x σ y δ x τ 1 + Δ x ,

de maneira que, substituindo na Eq. (6),

(8) δ 𝒜 = Ω ( δ 𝒫 + 𝒫 Δ x ) d x = Ω { Δ 𝒫 + ( 𝒫 Δ x ) } d x .

Esta equação é válida qualquer que seja a ordem da função 𝒫, isto é, qualquer que seja a maior ordem da derivada do campo u que lhe sirva como argumento. A exigência da invariância da ação sob as transformações consideradas, em qualquer região do espaço-tempo, leva à «equação diferencial de Lie»:

(9) Δ 𝒫 + ( 𝒫 Δ x ) = 0 .

Esta equação já contém a informação completa necessária para o estabelecimento dos teoremas de Nöther. Contudo, sua aplicação aos diversos problemas se simplifica ao escrevê-la de forma que a dependência com os campos seja explícita. Assumiremos, para tal, que 𝒫 é uma função da segunda ordem – isto é suficiente para exemplificar o procedimento geral; as equações e correntes para as teorias de maior ordem são obtidas por procedimentos análogos. Por definição,

(10) Δ 𝒫 = 𝒫 u Δ u + 𝒫 ( u ) Δ ( u ) + 𝒫 ( u ) Δ ( u ) .

Usando que Δ(u)=Δu e que Δ(u)=Δu, o uso da regra de multiplicação do produto de duas funções permite separar uma divergência na variação Δ𝒫:

(11) Δ 𝒫 + ( 𝒫 Δ x ) = δ 𝒜 δ u Δ u - J ,

com a derivada funcional da ação em relação ao campo

(12) δ 𝒜 δ u := 𝒫 u - μ 𝒫 ( μ u ) + μ ν 𝒫 ( μ ν u ) ,

e a corrente infinitesimal

(13) J μ := ( ν 𝒫 ( μ ν u ) - 𝒫 ( μ u ) ) Δ u - 𝒫 ( μ ν u ) ν Δ u - 𝒫 Δ x μ .

Será útil escrever essas quantidades em função da variação total do campo. Da Eq. (3), tem-se que

(14) ν ( Δ u ) = Δ ( ν u ) = δ ( ν u ) - ρ ν u Δ x ρ .

Desse modo, a quantidade J pode ser escrita na forma:

(15) J μ = ( ν 𝒫 ( μ ν u ) - 𝒫 ( μ u ) ) δ u - 𝒫 ( μ ν u ) δ ( ν u ) + Θ Δ ρ μ x ρ ,

com

(16) Θ := ρ μ ( 𝒫 ( μ u ) - ν 𝒫 ( μ ν u ) ) ρ u + 𝒫 ( μ ν u ) ρ ν u - 𝒫 δ ρ μ .

Substituindo as Eqs. (11) e (15) na Eq. (8), chega-se a que a variação da ação é

(17) δ 𝒜 = Ω { δ 𝒜 δ u ( δ u - ρ u Δ x ρ ) - μ [ Θ Δ ρ μ x ρ - ( 𝒫 ( μ u ) - ν 𝒫 ( μ ν u ) ) δ u - 𝒫 ( μ ν u ) δ ( ν u ) ] } d x .

Nessa forma, a aplicação de princípios variacionais à ação leva a resultados imediatos.

Princípio da ação estacionária de Ostrogradskii-Hamilton. Este princípio define a forma funcional do campo u como aquela que extremiza a ação 𝒜, sob as condições de fronteira fixa, isto é, dados os valores do campo e de suas derivadas até a ordem n-1 (no caso particular em estudo, até a primeira derivada) na fronteira Ω da região de integração. Em linguagem formal:

u é campo físico : Δ u C 2 ( 4 ) com Δ u | Ω = 0 = Δ ( u ) | Ω : δ 𝒜 = 0 sob Δ x = 0 .

Como a segunda linha da Eq. (17) se iguala – segundo o teorema de Ostrogradskii-Gauss – à integral de J sobre a superfície Ω, e J depende das quantidades Δx, δu e δ(u) que se anulam na mencionada superfície, o princípio da ação estacionária se equivale ao cumprimento das equações de Euler-Lagrange:

(18) δ 𝒜 δ u = 0 𝒫 u - μ 𝒫 ( μ u ) + μ ν 𝒫 ( μ ν u ) = 0 .

Quando a função 𝒫 é a densidade lagrangiana, as equações de Euler-Lagrange são exatamente as recém escritas:

(19) δ 𝒜 δ φ = 0 φ - μ ( μ φ ) + μ ν ( μ ν φ ) = 0 .

Quando, por outro lado, se trata da função 𝒫=π0φ-, com a densidade hamiltoniana, as equações anteriores se reduzem às equações canônicas de Hamilton. Com efeito, consideremos a teoria da primeira ordem em que a velocidade 0φ é eliminada em favor do momento π, de forma que a densidade hamiltoniana é (x;φ;φ;π;π). Como u{φ;π}, as Eqs. (18) se dividem em dois conjuntos:

(20) δ 𝒜 δ φ = 0 0 π = - φ + ( φ ) ,
(21) δ 𝒜 δ π = 0 0 φ = π + ( π ) ,

que são, já o esperávamos, as equações canônicas de Hamilton. Se a teoria lagrangiana é da segunda ordem, os momentos conjugados devem ser corretamente definidos – e não há uma só, senão diversas formas de fazê-lo [10[10] M. Ostrogradsky, Mémoires de l’Académie Impériale Des Sciences de Saint-Pétersbourg 6, 385 (1848)., 11[11] H.J. Schmidt, Phys. Rev. D 49, 6354 (1994).]. Particularmente, seguindo a Ostrogradskii, definindo a densidade hamiltoniana canônica como a componente Θ00 do tensor canônico de energia-momento, tem-se que

(22) = ( ( 0 φ ) - 0 ( 0 2 φ ) - 2 ( 0 φ ) ) 0 φ + ( 0 2 φ ) 0 2 φ - + ( ( 0 φ ) 0 φ ) .

Como o último termo é uma divergência espacial, as condições assintóticas usuais indicam que ele é irrelevante para a ação. Considerando os campos independentes φ e 0φ, seus correspondentes momentos conjugados, π e π0, se definem como:

(23) π := ( 0 φ ) - 0 ( 0 2 φ ) - 2 ( 0 φ ) , π 0 := ( 0 2 φ ) ,

pois então a hamiltoniana adota a forma

(24) H = V ( π 0 φ + π 0 0 2 φ - ) d 3 x .

O procedimento então segue como no caso habitual, obtendo-se as equações canônicas de Hamilton:

(25) 0 φ = δ H δ π , 0 2 φ = δ H δ π 0 , 0 π = - δ H δ φ , 0 π 0 = - δ H δ ( 0 φ ) .

Vemos desta forma que os dois formalismos – a saber, o lagrangiano e o hamiltoniano –, podem ser simultaneamente tratados, como o fez Nöther originalmente [2[2] E. Noether, Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-Physikalische Klasse 1918, 235 (1918).].

3. Primeiro Teorema de Nöther e seu Recíproco

Teorema 1 (Primeiro teorema de Nöther). Se a funcional da ação de um sistema de campos clássicos é invariante, para toda região Ω4, sob as transformações de um grupo de Lie Gr de r parâmetros, então r combinações linearmente independentes de derivadas funcionais da ação se reduzem a divergências.

Demonstração. Sejam {εa}aIr– denotamos Ir:={n|nr}– os parâmetros do grupo de Lie Gr, e sejam {Ua}aIr e {Xa}aIr os correspondentes geradores nas representações que agem sobre os campos u e as coordenadas x, respectivamente. Em uma palavra,

(26) δ u = ε a ( U a u ) , Δ x = ε a ( X a x ) .

Como é hipótese do teorema a invariância da ação em qualquer região Ω do espaço-tempo, deve-se considerar a equação diferencial de Lie, Eq. (9), ou, equivalentemente, a anulação do integrando da Eq. (17). Nela, será necessário conhecer que

(27) δ ( ν u ) = Δ ( ν u ) + ρ ν u Δ x ρ = ν ( Δ u ) + ρ ν u Δ x ρ = ν ( δ u - ρ u Δ x ρ ) + ρ ν u Δ x ρ = ε a [ ν ( U a u ) - ρ u ν ( X a x ) ρ ] .

Com as Eqs. (26) e (27) no integrando da Eq. (17), as hipóteses do teorema implicam que

(28) ε a δ 𝒜 δ u [ ( U a u ) ρ u ( X a x ) ρ ] = ε a μ { Θ μ ρ ( X a x ) ρ ( 𝒫 ( μ u ) ν 𝒫 ( μ ν u ) ) ( U a u ) 𝒫 ( μ ν u ) [ ν ( U a u ) ρ u ν ( X a x ) ρ }

Como, finalmente, os parâmetros εa são linearmente independentes, pode-se tomar cada um deles diferente de zero por vez, com todos os outros nulos, o que leva a estabelecer que, aIr,

(29) δ 𝒜 δ u [ ( U a u ) - ρ u ( X a x ) ρ ] = μ { Θ μ ρ ( X a x ) ρ ( 𝒫 ( μ u ) v 𝒫 ( μ v u ) ) ( U a u ) - 𝒫 ( μ ν u ) [ ν ( U a u ) - ρ u ν ( X a x ) ρ ] } .

Esta é a tese que desejávamos provar.

Em particular, se os campos são campos físicos, no sentido da definição pelo princípio da ação estacionária, então o lado esquerdo da Eq. (29) é nulo, e o primeiro teorema de Nöther implica a existência de r correntes ja, denominadas «correntes de Nöther» e definidas segundo:

(30) j μ a : = Θ μ ρ ( X a x ) ρ ( 𝒫 ( μ u ) ν 𝒫 ( μ ν u ) ) ( U a u ) - 𝒫 ( μ ν u ) [ ν ( U a u ) - ρ u ν ( X a x ) ρ ] ,

satisfazendo às equações de continuidade:

(31) a I r : μ j = a μ 0 .

Separando a componente temporal das espaciais e integrando num volume tridimensional (espacial) V,

(32) V 0 j 0 a d 3 x = V j a d 3 x = V j a d σ ,

em que temos usado o teorema de Ostrogradskii-Gauss para obter a última igualdade. Da primeira integral pode ser extraída a derivada temporal com o uso da regra integral de Leibniz, segundo a qual:

Regra integral de Leibniz: Se f:2 é uma função contínua com derivada parcial 1f contínua em uma região [t1;t2]×[a;b], então, para t[t1;t2],

(33) d d t a b f ( t ; x ) d x = a b 1 f ( t ; x ) d x .

Para ver a prova deste teorema, consequência do teorema fundamental do cálculo, e uma generalização em que os limites de integração a e b são substituídos por funções contínuas a(t) e b(t), vide, por exemplo, a seção 4.9 da Ref. [9[9] W. Kaplan, Advanced Calculus (Pearson, Boston, 2003), 5 ed.].

Em virtude da regra de Leibniz, a Eq. (32) adota a forma de uma lei de conservação:

(34) d Q a d t = V j a d σ ,

com

(35) Q a : = V j 0 a d 3 x

a a-ésima «carga de Nöther» contida no volume V. Em particular, se o volume V se estende ao espaço 3, a carga de Nöther se mantém constante sob a suposição de desvanecimento dos campos clássicos e de suas primeiras derivadas no infinito (condições assintóticas).

Teorema 2 (Primeiro teorema recíproco de Nöther). Se, em um sistema de campos clássicos, r combinações linearmente independentes de derivadas funcionais da ação se reduzem a divergências, então a funcional da ação que lhes corresponde é invariante sob as transformações de um grupo de Lie Gr de r parâmetros para toda região Ω4.

Demonstração. Suponhamos, por hipótese do teorema, que são satisfeitas as identidades

(36) μ j = a μ φ a ( x ; u ; u ) δ 𝒜 δ u ( a I r ) ,

com φa(x;u;u) funções diferenciáveis em relação a x ao menos duas vezes. Introduzimos um conjunto de r parâmetros numéricos {εa}aIr e as notações

(37) Δ u = ε a φ a ( x ; u ; u ) ,

(38) Δ x μ = - ε a 𝒫 { j + a μ ( 𝒫 ( μ u ) + ν 𝒫 ( μ ν u ) ) φ a - 𝒫 ( μ ν u ) ν φ a } .

Por cálculo direto pode-se então provar que, colocando as Eqs. (37) e (38) na expressão

(39) Δ 𝒫 + ρ ( 𝒫 Δ x ρ ) = 𝒫 u Δ u + 𝒫 ( μ u ) μ Δ u + 𝒫 ( μ ν u ) μ ν Δ u + ρ 𝒫 Δ x ρ + 𝒫 ρ Δ x ρ ,

obtém-se a identidade

(40) Δ 𝒫 + ρ ( 𝒫 Δ x ρ ) = ε a { ( 𝒫 u - ρ 𝒫 ( μ u ) + μ ν 𝒫 ( μ ν u ) ) φ a - ρ j } a ρ ,

cujo lado direito é nulo por hipótese do teorema, uma vez que a expressão interparentética se identifica com a derivada funcional da ação – vide as Eqs. (12) e (36). Por isto, qualquer que seja a região Ω4, a integral do lado esquerdo da Eq. (40) estendida a ela será nula:

(41) Ω { Δ 𝒫 + ρ ( 𝒫 Δ x ρ ) } d x = 0 .

Ora, essa é precisamente a variação da funcional da ação do sistema quando os campos e as coordenadas são submetidos às transformações das Eqs. (37) e (38), respectivamente – vide a Eq. (8). Do qual infere-se que a funcional da ação é invariante sob as transformações assim definidas.

As transformações são, até esse ponto, conhecidas só infinitesimalmente. Porém, as Eqs. (37) e (38) estabelecem um sistema de equações diferenciais a partir do qual podem ser encontradas as transformações finitas, isto é, a evolução das coordenadas e campos com os parâmetros εa. Daqui se vê que tais transformações são contínuas por construção. Que elas formam um grupo se deriva, finalmente, do fato de haver r combinações linearmente independentes de derivadas funcionais da ação que se reduzem a divergências. Com efeito, se as tais transformações não formassem um grupo, então a aplicação de duas delas poderia levar a uma nova transformação, linearmente independente das outras, sob a qual a funcional da ação seria novamente invariante, e haveria então r+1 combinações linearmente independentes de derivadas funcionais da ação que se reduzem a divergências, e assim por diante, contradizendo a hipótese do teorema.

4. Exemplos de Aplicação do Primeiro Teorema de Nöther e de seu Recíproco

4.1. Tensor canônico de energia-momento

Consideremos a translação espaço-temporal por um vetor constante; as transformações das coordenadas e campos que lhe correspondem são

(42) y = x + ε , v ( y ) = u ( x ) ,

que se condizem com

(43) ( X σ x ) ρ = δ σ ρ , ( U σ u ) = 0 .

Substituindo estas relações na Eq. (30), obtém-se que a corrente de Nöther associada às translações é o «tensor de energia-momento canônico»:

(44) j = σ μ Θ . σ μ

As correspondentes cargas de Nöther são as componentes do «vetor de energia-momento»:

(45) P σ = V Θ 0 σ d 3 x , d P σ d t = V Θ i σ d σ i .

Invariância sob translações. De forma semelhante, pode-se ilustrar o primeiro teorema recíproco de Nöther com o exemplo inverso. Consideremos o campo escalar real u(x), descrito pela densidade lagrangiana

(46) = 1 2 u u - 1 2 m 2 u 2 .

Suponhamos que se sabe que o tensor canônico de energia-momento,

(47) Θ = ρ μ μ u ρ u - 1 2 δ ρ μ ( u u - m 2 u 2 ) ,

é conservado. Em virtude do primeiro teorema recíproco de Nöther, existirá uma simetria tal que o tensor canônico de energia-momento é a corrente de Nöther que lhe corresponde, sempre que a divergência deste possa ser escrita como combinação linear das derivadas funcionais da ação. Ora, neste exemplo há apenas um campo, e por isso a única derivada funcional da ação é

(48) δ 𝒜 δ u = - ( + m 2 ) u .

Por outro lado, tomando a divergência da Eq. (47), obtém-se

(49) μ Θ = ρ μ ( + m 2 ) u ρ u = - ρ u δ 𝒜 δ u .

A comparação com a Eq. (36) permite identificar que φρ=-ρu. Com o uso das Eqs. (37), (38) e (3), finalmente, descobrimos que são as transformações

(50) δ u = 0 , Δ x = ε

as que constituem a simetria da ação que deriva na conservação do tensor canônico da energia-momento. A transformação mostrada, reconhece-se, é a translação pelo vetor constante ε.

4.2. Campo de Schrödinger

Consideremos como exemplo o campo de Schrödinger (função de onda), ψ, e seu complexo conjugado, ψ*, sujeitos a satisfazer às equações de Schrödinger:

(51) - 2 2 m 2 ψ ( x ) + V ( x ) ψ ( x ) = i ψ ( x ) t , - 2 2 m 2 ψ * ( x ) + V ( x ) ψ * ( x ) = - i ψ * ( x ) t .

Como é bem conhecido, uma das razões sobre as quais assenta-se a interpretação de Copenhagen da função de onda como amplitude de probabilidade é o fato de que, multiplicando a primeira das Eqs. (51) por ψ* e a segunda por ψ, então subtraindo os resultados, obtém-se, após algumas aplicações da regra da derivação de um produto, a equação de continuidade:

(52) t ( ψ * ψ ) - { i 2 m ( ψ * ψ - ψ * ψ ) } = 0 ,

a qual permite escrever a seguinte «lei de conservação da probabilidade»:

(53) d d t V ψ * ψ d 3 x = V i 2 m ( ψ * ψ - ψ * ψ ) d σ .

Em particular, se a função de onda – e por conseguinte também seu complexo conjugado – se anula no infinito espacial, então a integral do lado direito se anula, e a Eq. (53) identifica-se com a conservação no tempo da probabilidade total do evento descrito por ψ– comumente4 4 Embora seja a mais comum, essa interpretação é discutível, como demonstram as diversas interpretações que historicamente têm sido dadas à mecânica quântica. Uma recente exposição e classificação delas pode ser lida na Ref. [16]. expresso como: «a probabilidade de encontrar a partícula em algum ponto do Universo deve ser sempre igual à unidade». Além disso, sob as condições assintóticas recém enunciadas, a equação acima indica que a normalização da função de onda se mantém invariante no tempo.

Ora, toda a estrutura anterior se assemelha muito à do primeiro teorema de Nöther. Queremos ver, pois, se alguma simetria encontra-se no intus do desenvolvimento exposto. Para tal, nota-se que o campo não-relativístico de Schrödinger pode ser obtido a partir da densidade lagrangiana (simétrica)

(54) = 2 2 m ψ * ψ + V ψ * ψ - i 2 ψ * ψ t + i 2 ψ ψ * t .

Com efeito, as derivadas funcionais da ação correspondente são

(55) δ 𝒜 δ ψ = - 2 2 m 2 ψ * + V ψ * + i t ψ * ,
(56) δ 𝒜 δ ψ * = - 2 2 m 2 ψ + V ψ - i t ψ ,

cuja igualação a zero leva imediatamente às Eqs. (51). Logo vemos que as manipulações antes feitas às equações do movimento da função de onda e de seu conjugado podem, equivalentemente, ser efetuadas com as derivadas funcionais da ação. Assim, repetindo o procedimento anterior, encontra-se que

(57) t ( ψ * ψ ) - i 2 m ( ψ * ψ - ψ * ψ ) = i ψ * δ 𝒜 δ ψ * - i ψ δ 𝒜 δ ψ .

Por meio do primeiro teorema recíproco de Nöther, devemos admitir que a lei de conservação da probabilidade da mecânica ondulatória de Schrödinger é consequência da invariância da ação que lhe corresponde perante as transformações dos campos

(58) Δ ψ = ε φ ψ , Δ ψ * = ε φ ψ * ; φ ψ = - i ψ , φ ψ * = i ψ * ,

e das coordenadas

(59) Δ t = - ε { ψ * ψ + ( t ψ ) φ ψ + ( t ψ * ) φ ψ * } = 0 ,
(60) Δ x = - ε { ( ψ * ψ - ψ * ψ ) + ( ψ ) φ ψ + ( ψ * ) φ ψ * } = 0 .

Como as variações das coordenadas – de tempo e de espaço – são nulas, as transformações são «internas». A variação total dos campos é então igual à variação de sua forma funcional:

(61) δ ψ = - i ε ψ , δ ψ * = i ε ψ * ,

cuja forma finita é a transformação de fase

(62) ψ e - i ε / ψ , ψ * e i ε / ψ * .

Destarte, a conservação da probabilidade é consequência da invariância da ação frente a transformações de fase da função de onda.

Este exemplo mostra que, de forma geral, as leis de conservação que são obtidas a partir de combinações lineares das equações do movimento se encaixam nas hipóteses dos teoremas de Nöther, pois efetuar as mencionadas manipulações nas equações do movimento equivale a fazê-las sobre as derivadas funcionais da ação.

5. Simetrias Dinâmicas. O Problema de Kepler

Passaremos a considerar um exemplo da mecânica dos pontos: o problema de Kepler, em que dois pontos materiais se movem, um ao redor do outro, por causa de sua força de gravidade mútua [12[12] H. Goldstein, C.P. Poole e J. Safko, Classical Mechanics (Pearson, Nova Iorque, 2002), 3 ed.]. Como é bem sabido, este problema pode ser reduzido ao de um único corpo introduzindo, em substituição das coordenadas r1 e r2 dos dois corpos, as R e r, denotando a posição do centro das massas deles e a posição relativa r2-r1, respectivamente. Com efeito, a lagrangiana original,

(63) L = 1 2 m 1 v 1 2 + 1 2 m 2 v 2 2 + G m 1 m 2 | r 2 - r 1 | ,

em que m1 e m2 são as massas dos pontos materiais que compõem o sistema, v1 e v2 suas respectivas velocidades, e G a constante newtoniana da gravitação universal, pode ser equivalentemente escrita como

(64) L = 1 2 ( m 1 + m 2 ) V 2 + 1 2 m v 2 + k | r | ,

com V e v as velocidades correspondentes às coordenadas R e r, respectivamente, kGm1m2, e m a massa reduzida do sistema:

(65) m := m 1 m 2 m 1 + m 2 .

Como se evidencia na Eq. (64), as coordenadas R do centro das massas são coordenadas cíclicas, de forma que as equações de Euler-Lagrange que lhes correspondem levam ao resultado de que dV/dt=0, e o centro das massas se move com velocidade constante (ou, particularmente, se encontra em repouso). Como, ademais, nem as coordenadas R nem suas derivadas temporais formam parte das equações de Euler-Lagrange correspondentes às coordenadas relativas r, é suficiente utilizar a lagrangiana

(66) L = 1 2 m v 2 + k | r | ,

de forma que o problema tem sido reduzido, efetivamente, ao de um só corpo submetido ao potencial central. É evidente que essa lagrangiana possui ao menos as duas simetrias seguintes:

  • (1)

    Simetria por translações temporais: Como a lagrangiana é explicitamente independente do tempo, será conservada a «energia» – vide as Eqs. (16) e (44), lembrando que os únicos índices do espaço-tempo são os temporais: μ,ρ,σ=t

    (67) E Θ = L v v - L = 1 2 m v 2 - k | r | .

  • (2)

    Simetria por rotações espaciais: Transformações essas que compõem o grupo de Lie SO(3) de três parâmetros. A variação das coordenadas por uma transformação descrita pelo vetor Δφ– definida como tendo o módulo Δφ e a direção do eixo segundo o qual a rotação é operada, de acordo com a regra da mão direita – é5 5 Ao mesmo resultado pode-se chegar escrevendo Δri=Δφj(Uj)ikrk e lembrando que, como o grupo SO(3) possui três parâmetros, sobre o espaço tridimensional age sua representação adjunta, em que os geradores são (Uj)=kiεi⁢j⁢k.

    (68) Δ r = Δ φ × r Δ r i = Δ φ j ε i j k r k ( U i r ) j = ε i j k r k .

    Substituindo na Eq. (30), encontra-se que

    (69) j i = - L v ( U i r ) = ε i k j r k L v j ,

    ou seja, a corrente de Nöther correspondente ao grupo SO(3) é o vetor de momento angular:

    (70) j = r × L v = r × ( m v ) L .

    em que temos feito uso da forma explícita da lagrangiana para obter a última igualdade. Logo, da própria definição de L decorre que

    (71) r L = 0 = v L ,

    e o movimento da partícula (reduzida) está restrito ao plano ortogonal ao vetor constante L.

Apesar de não haver, aparentemente, mais simetrias na lagrangiana, sabe-se que um sistema mecânico fechado com s graus de liberdade possui 2s-1 integrais do movimento [13[13] L. Landau e E. Lifshitz, Curso abreviado de física teórica. Libro 1. Mecánica y electrodinámica (Editorial Mir Moscú, Moscou, 1971).]. Ora, o sistema (reduzido) sob estudo possui s=3 graus de liberdade, e assim possui 2s-1=5 constantes do movimento, das quais conhecemos quatro, a saber: {E;L1;L2;L3}. Do qual se segue que as trajetórias do sistema só poderão ser completamente determinadas uma vez que seja conhecida a quinta quantidade conservada. Para tentar encontrá-la, calculemos em primeiro lugar a derivada funcional da ação:

(72) δ 𝒜 δ r = - k r 3 r - m d v d t .

A equação do movimento é portanto

(73) d v d t = - k m r r 3 .

Ademais, como o vetor L=mr×v é constante, o uso da equação do movimento recém encontrada permite escrever

(74) d d t ( v × L ) = d v d t × L = - k r 3 r × ( r × v ) = - k r 3 [ r ( r v ) - v ( r 2 ) ] .

Porém, rv=2rvr, com vr=dr/dt a componente radial da velocidade. Assim, a Eq. (74) é igual a

(75) d d t ( v × L ) = - k [ r ( v r r 2 ) - v ( 1 r ) ] = d d t ( k r r ) .

Em uma palavra, sob o cumprimento das equações do movimento, o «vetor de Laplace-Runge-Lenz», A, é conservado

(76) A := v × L - k r r ; d A d t = 0 .

Embora ele seja um vetor, certamente não adiciona três novas constantes do movimento ao problema – pois tal coisa seria impossível. Com efeito, há duas relações de vínculo entre o vetor de Laplace-Runge-Lenz e as outras quantidades conservadas, E e L:

  • (1)

    Como tanto v×L como r são perpendiculares aL:

    (77) A L = 0 .

  • (2)

    Elevando o vetor de Laplace-Runge-Lenz ao quadrado:

    (78) A 2 = ( v × L ) 2 + k 2 - 2 k r r ( v × L ) .

    Usando as identidades vetoriais a(b×c)= c(a×b) e a×(b×c)=b(ac)-c(ab), assim como a expressão da energia dada na Eq. (67) e a relação da Eq. (71), pode-se escrever

    (79) A 2 = k 2 + 2 E L 2 m .

Uma forma de ver que não há mais relações envolvendo as constantes do movimento encontradas é verificar que elas determinam completamente as trajetórias do sistema. Como o vetor A é constante e, para mais, perpendicular a L, de forma que se localiza no plano constante em que ocorre o movimento, o ângulo θ que a posição r faz com ele pode ser usado para caracterizar o movimento. Assim,

(80) A r cos ( θ ) = A r = r ( v × L ) - k r = L ( r × v ) - k r = L 2 m - k r ,

do que decorre a equação das órbitas:

(81) r = L 2 / k m 1 + ( A / k ) cos ( θ ) .

De sorte que a constante do movimento adicional, que permite fixar por completo as trajetórias físicas, é a direção do vetor de Laplace-Runge-Lenz, que aponta para o periastro, como se pode ver da equação recém escrita, em que a variável r adota seu menor valor quando θ=0, ou seja, quando r é paralelo ao vetorA. Sua conservação indica que a órbita não manifesta precessão.

Desejamos, naturalmente, relacionar esta nova quantidade conservada a alguma simetria. Tal coisa, entretanto, não pode ser feita no formalismo lagrangiano. Isto não viola ao primeiro teorema recíproco de Nöther, pois esse tem por hipótese que (no âmbito da mecânica dos pontos) a derivada temporal da quantidade conservada seja escrita como combinação linear das derivadas funcionais da ação, sendo que é evidente que a derivada temporal do vetor de Laplace-Runge-Lenz, Eq. (76), não pode ser escrita como combinação linear das componentes da Eq. (72). Este exemplo mostra assim, de forma explícita, que nem todas as simetrias de um dado sistema físico estão contidas na lagrangiana.

Já indicamos, não obstante, que o formalismo lagrangiano não esgota as possibilidades de aplicação dos teoremas de Nöther. Por isso, ainda é possível que o vetor de Laplace-Runge-Lenz corresponda, sim, a uma simetria no formalismo hamiltoniano. Ao problema de Kepler corresponde a hamiltoniana [vide a Eq. (67)]

(82) H = p 2 2 m - k r .

O vetor de momento angular e de Laplace-Runge-Lenz são, respectivamente, como função das coordenadas e momentos,

(83) L = r × p , A = 1 m p × L - k r r .

Finalmente, as derivadas funcionais da ação são

(84) δ 𝒜 δ r = - d p d t - k r 3 r , δ 𝒜 δ p = v - p m .

Como tanto as velocidades quanto as derivadas temporais do momento aparecem independentemente nessas derivadas funcionais, é de se esperar que, agora sim, a derivada temporal de A possa ser escrita como combinação linear delas. Acontece que tal é, verdadeiramente, o caso:

(85) d A d t = 1 m p × ( δ 𝒜 δ r × r ) - 1 m δ 𝒜 δ r × ( r × p ) + 1 m p × ( δ 𝒜 δ p × p ) - k r 3 r × ( δ 𝒜 δ p × r ) .

O mesmo pode ser feito com a derivada temporal do momento angular:

(86) d L d t = δ 𝒜 δ r × r + δ 𝒜 δ p × p ,

e com a derivada temporal da energia:

(87) d E d t = - 1 m p δ 𝒜 δ r + k r 3 r δ 𝒜 δ p .

Destarte, no formalismo hamiltoniano o problema de Kepler tem todas suas constantes do movimento provindo de simetrias da ação. Em outras palavras, as simetrias completas do problema de Kepler não são expressíveis no espaço das configurações, mas somente no espaço das fases; por isto, ao grupo completo se dá o nome de «grupo dinâmico», em contraposição ao «grupo cinemático» das simetrias no espaço das configurações.

Essa não é uma peculiaridade do problema de Kepler. De fato, o primeiro teorema recíproco de Nöther é sempre aplicável no formalismo hamiltoniano, o que significa que nesta formulação todas as simetrias estão presentes. Provaremos isso aqui para o caso mais simples da mecânica em que não há transformações do tempo, embora isto se satisfaça de forma geral – como é provado por técnicas mais complexas, por exemplo, na Ref. [14[14] P.J. Olver, Applications of Lie Groups to Differential Equations (Springer, Nova Iorque, 1993), 2 ed.].

Lema 3. Seja A uma carga de Nöther, de forma que satisfaz a equação

(88) { A ; H } + A t = 0 ,

com {;} os parênteses de Poisson, definidos de forma que

(89) { f ; g } := f q g p - g q f p .

A ação é invariante sob as transformações

(90) Δ t = 0 , Δ q = ε A p , Δ p = - ε A q .

Demonstração. No formalismo hamiltoniano, o integrando da ação é a função

(91) 𝒫 H = p v - H .

Calculando sua variação sob as transformações da Eq. (90):

(92) Δ 𝒫 H = 𝒫 H q Δ q + 𝒫 H p Δ p + 𝒫 H v Δ v = - ε H q A p - ε ( v - H p ) A q + d d t ( p Δ q ) - ε d p d t A p = - ε H q A p + ε H p A q - ε v A q - ε d p d t A p + d d t ( ε p A p ) .

Identificando os parênteses de Poisson entre A e H nos dois primeiros termos, assim como a quantidade dA/dt-A/t nos dois seguintes, obtém-se

(93) Δ 𝒫 H = - ε ( d A d t - { A ; H } - A t ) + d d t ( ε p A p ) = d d t ( - ε A + ε p A p ) + ε ( { A ; H } + A t ) .

Devido à Eq. (88), o último termo é nulo para A uma corrente de Nöther, enquanto que o primeiro termo, sendo uma derivada temporal ordinária, leva, após integração, a uma variação da ação nula sob condições assintóticas apropriadas.

O resultado recém provado, além do mais, mostra que as correntes de Nöther são geradoras de transformações canônicas. Com efeito, as transformações das coordenadas e momentos da Eq. (90) podem, equivalentemente, ser escritas como

(94) Δ q = ε { q ; A } , Δ p = ε { p ; A } ,

as quais deixam invariantes os parênteses de Poisson fundamentais: Até a primeira ordem no parâmetro infinitesimal ε,

{ q + Δ q ; p + Δ p } = { q ; p } + { q ; Δ p } + { Δ q ; p } = 1 + ε ( { q ; { p ; A } } + { { q ; A } ; p } ) = 1 + ε { { q ; p } ; A } = 1 ,

em que tem sido usada a identidade de Jacobi para passar da segunda à terceira linha. Por outro lado, é fato bem conhecido que os parênteses de Poisson de duas quantidades conservadas é também uma quantidade conservada. Por exemplo, se A e B são quantidades conservadas que independem explicitamente do tempo – e, como consequência, também seus parênteses de Poisson –,

d d t { A ; B } = { { A ; B } ; H } = { { A ; H } ; B } + { { H ; B } ; A } = 0 .

Do que decorre que todas as quantidades conservadas independentes (que não são função das outras) formam uma álgebra de Lie fechada, pois há um número limitado delas, ou seja, haverá sempre um conjunto de constantes de estrutura gijk tais que

(95) { A i ; A j } = g i j k A k .

Os resultados anteriores são notáveis, pois permitem encontrar rapidamente qual é a álgebra do grupo de simetrias associada às correntes de Nöther. Com efeito, seja {Ai}iIr o conjunto das quantidades conservadas independentes, às quais correspondem, respectivamente, as transformações das coordenadas e momentos Δiu, com u{q;p}. Como tais transformações formam um grupo de Lie Gr de r parâmetros (primeiro teorema recíproco de Nöther, sempre aplicável ao formalismo hamiltoniano), será sempre possível escrever

(96) [ Δ i ; Δ j ] u := ( Δ i Δ j - Δ j Δ i ) u = f i j k Δ k u ,

com fijk as constantes de estrutura da álgebra do grupo Gr. Por outro lado, escrevendo as transformações como na Eq. (94), tem-se que

(97) Δ 1 Δ 2 u - Δ 2 Δ 1 u = { u ; { A 1 ; A 2 } } f i j k = g i j k .

Em uma palavra: A álgebra (de comutadores) das transformações das coordenadas e momentos se iguala à álgebra (de parênteses de Poisson) das quantidades conservadas.

Voltando ao problema de Kepler, definindo o vetor adimensional de Laplace-Runge-Lenz como

(98) V := - m 2 E A ,

é já uma tarefa simples calcular a álgebra de parênteses de Poisson das quantidades conservadas, que resulta ser

(99) { L i ; L j } = ϵ i j k L k , { L i ; V j } = ϵ i j k V k , { V i ; V j } = ϵ i j k L k ,

enquanto que todos os parênteses de Poisson com a energia E são nulos. A álgebra da Eq. (99) identifica-se com a álgebra 𝔰𝔬(4). Logo os resultados prévios permitem-nos afirmar que o grupo dinâmico das simetrias do problema de Kepler é o grupo SO(4) (e as translações temporais), sem a necessidade de integrar as Eqs. (85), (86) e (87).

6. Segundo Teorema de Nöther e seu Recíproco

Passaremos a estudar o segundo teorema de Nöther, que se instaura permitindo aos parâmetros do grupo de Lie Gr serem funções do ponto do espaço-tempo, dando lugar ao «grupo de infinitos parâmetros6 6 É mister indicar explicitamente que o caráter deste grupo de infinitos parâmetros é precisamente o acima indicado, isto é, que se constrói a partir da «localização» de um grupo de um número finito de parâmetros, Gr. Com efeito, o segundo teorema de Nöther não diz respeito à invariância da ação perante transformações de grupos quaisquer de infinitos parâmetros. Quanto a estes, quando os parâmetros são os mesmos para todos os pontos do espaço-tempo, o primeiro teorema de Nöther ainda é aplicável [2]. » Gr.

Teorema 4 (Segundo teorema de Nöther). Se o funcional da ação de um sistema de campos clássicos é invariante, na região Ω4, sob as transformações de um grupo de Lie Gr de infinitos parâmetros obtido por localização do grupo Gr de r parâmetros, que se anulam em Ω junto com suas derivadas até de ordem igual à maior ordem k das derivadas dos parâmetros do grupo Gr que participam da lei de transformação dos campos, então há r identidades entre as derivadas funcionais da ação e suas derivadas, até de ordem k.

Demonstração. Tal como fizemos para estabelecer a Eq. (12), consideraremos a dependência das diversas quantidades com derivadas de até segunda ordem, pois isso basta para mostrar os procedimentos gerais, enquanto que a generalização para derivadas de ordens superiores torna-se evidente. Sejam, portanto, as leis de transformação dos campos:

(100) Δ u = a a ( x ; u ; u ) ε a ( x ) + b a ρ ( x ; u ; u ) ρ ε a ( x ) + c a ρ σ ( x ; u ; u ) ρ σ ε a ( x ) .

Por aplicação da regra de derivação de um produto é possível escrever

(101) δ 𝒜 δ u Δ u = δ 𝒜 δ u a a ε a + δ 𝒜 δ u b a ρ ρ ε a + δ 𝒜 δ u c a ρ σ ρ σ ε a = { a a δ 𝒜 δ u - ρ ( b a ρ δ 𝒜 δ u ) + ρ σ ( c a ρ σ δ 𝒜 δ u ) } ε a + μ { δ 𝒜 δ u ( b a μ ε a + c a μ σ σ ε a ) - σ ( c a μ σ δ 𝒜 δ u ) ε a } .

Substituindo na Eq. (11),

(102) Δ 𝒫 + ( 𝒫 Δ x ) = { a a δ 𝒜 δ u - ρ ( b a ρ δ 𝒜 δ u ) + ρ σ ( c a ρ σ δ 𝒜 δ u ) } ε a - μ { J μ - δ 𝒜 δ u ( b a μ ε a + c a μ σ σ ε a ) + σ ( c a μ σ δ 𝒜 δ u ) ε a } .

Assim, se a integração é feita sobre a região Ω em cuja fronteira os parâmetros εa(x) e suas derivadas até da segunda ordem se anulam, então

(103) δ 𝒜 = Ω { a a δ 𝒜 δ u - ρ ( b a ρ δ 𝒜 δ u ) + ρ σ ( c a ρ σ δ 𝒜 δ u ) } ε a ( x ) d x .

Como, finalmente, as funções εa(x) são independentes e arbitrárias – sujeitas só às condiçãoes já mencionadas –, a hipótese da invariância da ação implica, pelo lema fundamental do cálculo variacional [15[15] L. Elsgoltz, Ecuaciones Diferenciales y cálculo variacional (Editorial Mir Moscú, Moscou, 1969).], que

(104) a I r : a a δ 𝒜 δ u = ρ ( b a ρ δ 𝒜 δ u ) - ρ σ ( c a ρ σ δ 𝒜 δ u ) .

Terminamos fazendo notar que a Eq. (12) é válida para funções 𝒫 de qualquer ordem, apenas mudando as expressões explícitas da derivada funcional da ação e da corrente infinitesimal. Por outro lado, é patente que se na Eq. (100) permitíssemos a dependência com derivadas de εa(x) até da ordem k, então na Eq. (101) apareceriam derivadas até da ordem k da derivada funcional da ação na expressão proporcional a εa.

O segundo teorema de Nöther, certamente, deve ser visto também como a prova do seguinte enunciado: Quando o grupo de simetrias é localizado de forma que seus parâmetros se tornem funções do ponto do espaço-tempo, a variação dos campos deve depender da derivada destes, pelo menos até a primeira ordem. Efetivamente, se negarmos isto, então deveríamos colocar baρ=0=caρσ na Eq. (104), e as equações de Euler-Lagrange tornariam-se em identidades, isto é, seriam satisfeitas por qualquer função u. Donde o princípio variacional seria inaplicável para o estabelecimento das leis físicas. Em outras palavras, é impossível escrever uma teoria invariante perante um grupo de simetrias localizadas em que todos os campos se transformem de acordo com os parâmetros εa(x), mas não com suas derivadas7 7 Isto, está claro, não contradiz o primeiro teorema de Nöther, pois nele os parâmetros da transformação, ao serem constantes, não podem se anular na fronteira da região Ω e, por isso, a tese do segundo teorema não se aplica a essas transformações. As transformações a que se submete aos campos nos dois teoremas são de diferente natureza. .

Quanto às leis de conservação, nota-se que, segundo a Eq. (102), uma vez que as identidades da Eq. (104) sejam satisfeitas, ter-se-á que

(105) μ { J μ - δ 𝒜 δ u ( b a μ ε a + c a μ σ σ ε a ) + σ ( c a μ σ δ 𝒜 δ u ) ε a } = 0 .

Quando as equações do movimento são satisfeitas, obtém-se a lei de conservação da corrente infinitesimal:

(106) μ J μ = 0 .

Esta lei não é a mesma que a que se obtém devido à invariância sob transformações globais, pois a divergência μJμ contém não somente os parâmetros εa, mas também a suas derivadas. Contudo, pode-se verificar que a lei de continuidade obtida do primeiro teorema de Nöther está contida na Eq. (106), a qual contém não só àquela, senão também informações adicionais de grande utilidade.

Teorias com simetrias internas. As teorias com simetrias internas (em que as coordenadas não se transformam) constituem a valiosa classe das teorias de calibre para as interações não gravitacionais. Denotando, para simplificar a notação,

(107) A μ := ν 𝒫 ( μ ν u ) - 𝒫 ( μ u ) ; B μ ν := 𝒫 ( μ ν u ) ,

a corrente de Nöther é

(108) j a μ = A μ a a - B μ ν ν a a ,

pois Jμ se reduz a εajaμ quando os parâmetros tornam-se constantes. De forma geral, agrupando os termos segundo a ordem da derivada dos parâmetros do qual dependem,

(109) J μ = j a μ ε a + ( A μ b a ν - B μ ν a a - B μ ρ ρ b a ν ) ν ε a + ( A μ c a ρ ν - B μ ν b a ρ - B μ σ σ c a ρ ν ) ρ ν ε a - B μ ν c a ρ σ ν ρ σ ε a .

Aplicando a divergência e agrupando os termos novamente:

(110) μ J μ = ε a ( μ j a μ ) + μ ε a [ j a μ + ν ( A ν b a μ - B ν μ a a - B ν ρ ρ b a μ ) ] + μ ν ε a [ ( A μ b a ν - B μ ν a a - B μ ρ ρ b a ν ) + ρ ( A ρ c a μ ν - B ρ ν b a μ - B ρ σ σ c a μ ν ) ] + μ ν ρ ε a [ ( A μ c a ν ρ - B μ ρ b a ν - B μ σ σ c a ν ρ ) - σ ( B σ μ c a ν ρ ) ] - μ ν ρ σ ε a ( B μ ν c a ρ σ ) .

Como os parâmetros εa(x) e suas derivadas são independentes, os coeficientes destes devem ser todos nulos. Assim, se definirmos as quantidades

(111) J ( 1 ) a μ ν := - ( A μ b a ν - B μ ν a a - B μ ρ ρ b a ν ) ,
(112) J ( 2 ) a μ ν ρ := A μ c a ν ρ - B μ ρ b a ν - B μ σ σ c a ν ρ ,
(113) J ( 3 ) a μ ν ρ σ := B μ ν c a ρ σ ,

então a Eq. (106) implica que, sob o cumprimento das equações do movimento dos campos, a corrente de Nöther pode ser determinada por derivação sucessiva a partir de um tensor antissimétrico, como o indica o seguinte sistema de «equações de descida»:

(114) J ( 3 ) a μ ν ρ σ = - J ( 3 ) a μ σ ρ ν , J ( 2 ) a μ ν ρ = σ J ( 3 ) a σ μ ν ρ , J ( 1 ) a μ ν = ρ J ( 2 ) a ρ μ ν , j a μ = ν J ( 1 ) a ν μ ,

e que esta corrente é, de fato, conservada:

(115) μ j a μ = 0 .

Desta forma, o segundo teorema de Nöther leva à mesma lei de conservação que o primeiro teorema, mas, adicionalmente, estabelece um sistema de equações para encontrar a corrente por derivação sucessiva.

Teorias com simetrias localizadas gerais da primeira ordem. É claro, as simetrias localizadas não são somente do tipo interno. Por exemplo, é perfeitamente possível escrever teorias da gravidade mediante a localização de simetrias que mudam também às coordenadas do espaço-tempo; tais são, verbi gratia , o teleparalelismo (com grupo das translações localizadas), teorias de calibre do grupo de Poincaré (em particular, a teoria de Einstein-Cartan), et cetera – vide, por exemplo, a Ref. [20[20] M. Blagojević, Gravitation and gauge symmetries (IoP, Cornwall, 2002).]. Sem ir muito longe, mostraremos o dito para teorias da primeira ordem, com variações dependentes da derivada do parâmetro até, também, a primeira ordem. Dessa vez, é preciso incluir a variação das coordenadas,

(116) Δ x μ = d a μ ε a + e a μ ν ν ε a .

A corrente de Nöther é

(117) j a μ = - 𝒫 ( μ u ) a a - 𝒫 d a μ ,

enquanto que a corrente infinitesimal possui a expressão

(118) J μ = j a μ ε a - 𝒫 ( μ u ) b a ρ ρ ε a - 𝒫 e a μ ν ν ε a .

Tomando a divergência e agrupando termos:

(119) μ J μ = ε a ( μ j a μ ) + μ ε a [ j a μ - ρ ( 𝒫 ( ρ u ) b a μ + 𝒫 e a ρ μ ) ] - μ ν ε a ( 𝒫 ( μ u ) b a ρ + 𝒫 e a μ ρ ) .

Por isso, definindo

(120) J ( 1 ) a μ ρ := 𝒫 ( μ u ) b a ρ + 𝒫 e a μ ρ ,

sob o cumprimento das equações de Euler-Lagrange ter-se-á o sistema de equações de descida:

(121) J ( 1 ) a μ ρ = - J ( 1 ) a ρ μ , j a μ = ρ J ( 1 ) a ρ μ , μ j a μ = 0 .

Desejamos, por último, chamar a atenção ao fato de que, na mecânica do ponto material, em que os índices são somente temporais, é impossível ter-se um tensor antissimétrico não nulo. O segundo teorema de Nöther, então, implica, via as equações de descida, que a corrente de Nöther tem de ser nula quando construída com coordenadas físicas. Isto será exemplificado na seção7 7. Princípio da Invariância de Calibre na Mecânica do Ponto Estudaremos, para iniciar, um exemplo da mecânica do ponto, que nos servirá para introduzir o princípio da invariância de calibre – geralmente, porém, como veremos aqui, não necessariamente, introduzido só na teoria do campo clássico – e estudar as consequências do segundo teorema de Nöther. Consideremos a lagrangiana de duas partículas livres de massas m1 e m2 (122) L = 1 2 ⁢ m 1 ⁢ v 1 2 + 1 2 ⁢ m 2 ⁢ v 2 2 . Ela pode ser escrita em função da massa reduzida m fazendo o escalamento das coordenadas segundo (123) r 1 → m 2 m 1 + m 2 ⁢ r 1 , r 2 → m 1 m 1 + m 2 ⁢ r 2 , com o qual (124) L = 1 2 ⁢ m ⁢ ( v 1 2 + v 2 2 ) . Mais ainda, se introduzirmos as coordenadas complexas (125) r := 1 2 ⁢ ( r 1 + i ⁢ r 2 ) , r * := 1 2 ⁢ ( r 1 - i ⁢ r 2 ) , ter-se-á que (126) L = m ⁢ v * ⋅ v . Está claro que essa lagrangiana possui a simetria por transformações de fase, r→ei⁢α⁢r e r*→e-i⁢α⁢r*, as quais se escrevem infinitesimalmente como: Δ⁢r=i⁢α⁢r e Δ⁢r*=-i⁢α⁢r*. A corrente conservada que corresponde a tal simetria é (127) α ⁢ j = - ∂ ⁡ L ∂ ⁡ v ⋅ Δ ⁢ r - ∂ ⁡ L ∂ ⁡ v * ⋅ Δ ⁢ r * ⇒ j = i ⁢ m ⁢ ( r * ⋅ v - v * ⋅ r ) . As transformações de fase das variáveis complexas correspondem, evidentemente, às transformações segundo o grupo SO(2) das coordenadas reais r1 e r2, isto é, às transformações (128) r 1 ′ = cos ⁡ ( α ) ⁢ r 1 - sin ⁡ ( α ) ⁢ r 2 , r 2 ′ = sin ⁡ ( α ) ⁢ r 1 + cos ⁡ ( α ) ⁢ r 2 . A transformação interna global (de parâmetro «α» constante) até agora considerada, é uma simetria da teoria livre. Weyl propôs que a teoria em interação pode ser construída a partir dela por localização daquela: Princípio da invariância de calibre: Se uma (densidade) lagrangiana é invariante perante as transformações do grupo de Lie (global) Gr, então deve sê-lo também perante as transformações do grupo G∞⁢r obtido por localização do primeiro. O grupo de calibre global da lagrangiana da Eq. (126) é o grupo U(1). As correspondentes transformações de fase locais, infinitesimalmente, se escrevem (129) Δ ⁢ r = i ⁢ α ⁢ ( t ) ⁢ r , Δ ⁢ r * = - i ⁢ α ⁢ ( t ) ⁢ r * . As transformações das velocidades são (130) Δ ⁢ v = i ⁢ d t ⁢ α ⁢ r + i ⁢ α ⁢ v , Δ ⁢ v * = - i ⁢ d t ⁢ α ⁢ r * - i ⁢ α ⁢ v * . Logo se vê que a lagrangiana não é invariante pelas transformações escritas, pois ao calcular sua variação obtemos (131) Δ ⁢ L = i ⁢ m ⁢ d t ⁢ α ⁢ ( v * ⋅ r - r * ⋅ v ) = - j ⁢ d t ⁢ α ≠ 0 . Destarte, a lagrangiana L não satisfaz o princípio da invariância de calibre, e deve, como consequência, ser modificada. Executando um paralelismo com o tratamento de Utiyama na teoria do campo clássico – vide as Refs. [18, 19] –, introduzimos uma nova coordenada A, chamada «coordenada de calibre», com a seguinte lei de transformação: (132) Δ ⁢ A = α ⁢ ( U ⁢ A ) + d t ⁢ α . O motivo para introduzirmos a variação de A dependente da derivada do parâmetro α⁢(t) é que, como dissemos alhures, é impossível uma teoria (não trivial) possuir a invariância local sem ao menos um dos campos se transformar segundo a derivada dos parâmetros localizados – o que, digamos de passagem, explica o resultado da Eq. (131). A dependência é com a derivada de até primeira ordem devido a que os termos que impedem a lagrangiana ser invariante perante a transformação local possuem a mesma dependência, Eq. (131). A teoria invariante de calibre local será descrita pela lagrangiana L′=L′⁢(r;r*;v;v*;A), com variação (133) Δ ⁢ L ′ = ∂ ⁡ L ′ ∂ ⁡ r ⋅ Δ ⁢ r + ∂ ⁡ L ′ ∂ ⁡ r * ⋅ Δ ⁢ r * + ∂ ⁡ L ′ ∂ ⁡ v ⋅ Δ ⁢ v + ∂ ⁡ L ′ ∂ ⁡ v * ⋅ v * + ∂ ⁡ L ′ ∂ ⁡ A ⁢ Δ ⁢ A = i ⁢ α ⁢ ( ∂ ⁡ L ′ ∂ ⁡ r ⋅ r - ∂ ⁡ L ′ ∂ ⁡ r * ⋅ r * + ∂ ⁡ L ′ ∂ ⁡ v ⋅ v - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ v * - i ⁢ ∂ ⁡ L ′ ∂ ⁡ A ⁢ ( U ⁢ A ) ) ⏟ (I) + i ⁢ d t ⁢ α ⁢ ( ∂ ⁡ L ′ ∂ ⁡ v ⋅ r - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ r * - i ⁢ ∂ ⁡ L ′ ∂ ⁡ A ) ⏟ (II) . Como o parâmetro α⁢(t) e sua derivada, dt⁢α⁢(t), são independentes, as duas expressões (I) e (II) na Eq. (133) devem ser simultaneamente nulas. (II)=0. Comecemos estudando a condição de ser (II)=0. A equação que se obtém por essa imposição, (134) ∂ ⁡ L ′ ∂ ⁡ A = - i ⁢ ( ∂ ⁡ L ′ ∂ ⁡ v ⋅ r - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ r * ) , pode ser solucionada de forma recursiva (método de aproximações sucessivas de Picard). Supondo que a lagrangiana L′ pode ser obtida suavemente a partir da L, com a qual se iguala quando A=0, solucionemos a Eq. (134) colocando L em seu lado direito: (135) ∂ ⁡ L ′ ∂ ⁡ A = - i ⁢ m ⁢ ( v * ⋅ r - v ⋅ r * ) ⇒ L ′ = L - i ⁢ m ⁢ A ⁢ ( v * ⋅ r - v ⋅ r * ) . Colocando agora esta nova lagrangiana no lado direito da Eq. (134) e solucionando para L′, (136) ∂ ⁡ L ′ ∂ ⁡ A = - i ⁢ m ⁢ ( v * ⋅ r - v ⋅ r * ) + 2 ⁢ m ⁢ A ⁢ r * ⋅ r ⇒ L ′ = L - i ⁢ m ⁢ A ⁢ ( v * ⋅ r - v ⋅ r * ) + m ⁢ A 2 ⁢ r * ⋅ r . E como o novo termo não depende das velocidades, o procedimento recursivo termina aqui. Salientamos que o método recursivo aqui aplicado pode ser diretamente transladado à teoria do campo clássico. De fato, esse é um dos métodos para a construção das teorias de calibre, utilizado, por exemplo, na Ref. [20]. Como explicado nesta referência, as teorias de Yang-Mills possuem a agradável peculiaridade de, como em nosso exemplo, o procedimento recursivo terminar em um número finito de passos. No caso da gravidade, por outro lado, o procedimento recursivo é infinito, o que não significa que ele não possa ser resolvido: Denotando por rj as componentes de todas as coordenadas (ou seja, tanto de r quanto de r*) e supondo que a lagrangiana L′ possa ser expandida em série de potências da coordenada de calibre A, (137) L ′ ⁢ ( r ; v ; A ) = ∑ n ∈ ℕ 0 1 n ! ⁢ A n ⁢ L ( n ) , L ( 0 ) ≡ L , a Eq. (134) leva a (138) L ( n + 1 ) = - i ⁢ ∂ ⁡ L ( n ) ∂ ⁡ v j ⁢ r j = ⋯ = ( - i ) n + 1 ⁢ ∂ n + 1 ⁡ L ∂ ⁡ v j 1 ⁢ ⋯ ⁢ ∂ ⁡ v j n + 1 ⁢ r j 1 ⁢ ⋯ ⁢ r j n + 1 , donde (139) L ′ ⁢ ( r ; v ; A ) = ∑ n ∈ ℕ 0 ( - i ) n ⁢ A n n ! ⁢ ∂ n ⁡ L ∂ ⁡ v j 1 ⁢ ⋯ ⁢ ∂ ⁡ v j n ⁢ r j 1 ⁢ ⋯ ⁢ r j n = L ⁢ ( r ; v - i ⁢ A ⁢ r ) . Assim, ainda que o procedimento recursivo seja infinito, o resultado em qualquer caso se reduz à chamada «prescrição do acoplamento mínimo», derivada pela primeira vez por Utiyama para teorias de calibre gerais [18] e segundo a qual: Prescrição9 do acoplamento mínimo: A (densidade) lagrangiana invariante perante as transformações de calibre locais se obtém pela substituição das derivadas temporais dt pelas «derivadas covariantes» Dt definidas como (140) D t := d t - i ⁢ A . Em particular, isto leva a substituir as velocidades v pelas «velocidades covariantes» V: (141) L ′ ⁢ ( r ; v ; A ) = L ⁢ ( r ; V ) , V = v - i ⁢ A ⁢ r . Um cálculo rápido permite verificar que a lagrangiana da Eq. (136) se obtém da Eq. (126) pela substituição mencionada. (I)=0. Uma vez que conhecemos a forma da nova lagrangiana L′, a condição (I)=0 permitirá fixar por completo a lei de variação da coordenada de calibre A. Com efeito, da Eq. (133) se vê que a presente condição é (142) ∂ ⁡ L ′ ∂ ⁡ A ⁢ ( U ⁢ A ) = - i ⁢ ( ∂ ⁡ L ′ ∂ ⁡ r ⋅ r - ∂ ⁡ L ′ ∂ ⁡ r * ⋅ r * + ∂ ⁡ L ′ ∂ ⁡ v ⋅ v - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ v * ) . Como o lado direito dessa equação é nulo uma vez que se substitui nele a lagrangiana L′ da Eq. (136), deverá ser (U⁢A)=0 e, por isso, a variação da coordenada de calibre será (143) Δ ⁢ A = d t ⁢ α . Isto permite justificar o nome «velocidade covariante» da quantidade V definida na Eq. (141), pois sua variação é (144) Δ ⁢ V = Δ ⁢ v - i ⁢ Δ ⁢ A ⁢ r - i ⁢ A ⁢ Δ ⁢ r = i ⁢ α ⁢ ( v - i ⁢ A ⁢ r ) = i ⁢ α ⁢ V , ou seja, a velocidade covariante V se transforma, perante uma transformação de calibre local, como o faz a velocidade v perante uma global. Sendo que temos já a teoria invariante de calibre global e local para as coordenadas iniciais e sua interação com a coordenada de calibre, é preciso procurarmos pela lagrangiana da coordenada de calibre livre. Denotando-a por LA=LA⁢(A;∂⁡A), sua lei de transformação será (145) Δ ⁢ L A = ∂ ⁡ L A ∂ ⁡ A ⁢ Δ ⁢ A + ∂ ⁡ L A ∂ ⁡ ( d t ⁢ A ) ⁢ d t ⁢ Δ ⁢ A = ∂ ⁡ L A ∂ ⁡ A ⁢ d t ⁢ α + ∂ ⁡ L A ∂ ⁡ ( d t ⁢ A ) ⁢ d t 2 ⁢ α . Semelhante variação deveria ser nula para que a teoria seja invariante de calibre local. Ora, a equação anterior indica que isso só será possível se LA=0, e a coordenada de calibre não possuirá uma dinâmica própria. Em outras palavras, a coordenada de calibre satisfará apenas a equações de vínculos. A teoria invariante de calibre completa será, portanto, a descrita pela lagrangiana (146) L ′ = m ⁢ v * ⋅ v - i ⁢ m ⁢ A ⁢ ( v * ⋅ r - v ⋅ r * ) + m ⁢ A 2 ⁢ r * ⋅ r . No caso unidimensional, com r≡r, r*≡r*– caso particular que consideraremos mais detalhadamente abaixo –, esta lagrangiana é equivalente à do modelo mecânico de Christ-Lee com potencial nulo [21] – vide também o Exemplo 4 na Ref. [17] para um tratamento hamiltoniano. A aplicação do primeiro teorema de Nöther revela que a corrente de Nöther dessa teoria é (147) j ′ = i ⁢ m ⁢ ( v ⋅ r * - v * ⋅ r ) + 2 ⁢ m ⁢ A ⁢ r * ⋅ r , que se conservará ao sujeitarmos as coordenadas às equações do movimento. Escrevendo-a em função das velocidades covariantes, a corrente de Nöther é (148) j ′ = i ⁢ m ⁢ ( r * ⋅ V - r ⋅ V * ) . Daqui se observa que a nova corrente se obtém da primeira, Eq. (127), pela substituição das quantidades iniciais pelas covariantes. Apliquemos agora o segundo teorema de Nöther. Das leis de transformação das diversas coordenadas envolvidas, pode-se identificar [vide a Eq. (100)] (149) a r = i ⁢ r , b r = 0 ; a r * = - i ⁢ r * , b r * = 0 ; a A = 0 , b A = 1 . Substituindo na Eq. (104), obtemos a expressão do segundo teorema de Nöther: (150) i ⁢ r ⋅ δ ⁢ 𝒜 ′ δ ⁢ r - i ⁢ r * ⋅ δ ⁢ 𝒜 ′ δ ⁢ r * = d d ⁢ t ⁢ ( δ ⁢ 𝒜 ′ δ ⁢ A ) , de forma que não todas as derivadas funcionais são independentes, pois existe uma relação entre elas; como consequência, há mais funções incógnitas do que equações, donde haverá também uma liberdade de escolha de uma daquelas (liberdade de calibre). Assim, se as equações do movimento para A, r, r1* e r2* forem satisfeitas, a relação anterior implica que, necessariamente, a equação do movimento para r3* será também, automaticamente, satisfeita. Equivalentemente, qualquer uma das equações do movimento para ri ou ri* pode ser escrita em função das outras; porém, a equação do movimento para A, não, pois ela aparece na tese do segundo teorema de Nöther somente através de uma derivada temporal. Sendo assim, embora uma coordenada pode ser, de fato, eliminada por ser desnecessária para a descrição do sistema, tal não pode ser a coordenada de calibre. Para exemplificar isto, escrevemos as derivadas funcionais da ação de nosso modelo particular, que são as seguintes10: (151) δ ⁢ 𝒜 ′ δ ⁢ r * = - m ⁢ d t ⁢ ( v - i ⁢ A ⁢ r ) + i ⁢ m ⁢ A ⁢ ( v - i ⁢ A ⁢ r ) , (152) δ ⁢ 𝒜 ′ δ ⁢ r = - m ⁢ d t ⁢ ( v * + i ⁢ A ⁢ r * ) - i ⁢ m ⁢ A ⁢ ( v * + i ⁢ A ⁢ r * ) , (153) δ ⁢ 𝒜 ′ δ ⁢ A = i ⁢ m ⁢ ( r * ⋅ v - v * ⋅ r ) + 2 ⁢ m ⁢ A ⁢ r * ⋅ r = j ′ . Supondo a validade das equações do movimento para r e r*, obter-se-ia, via o segundo teorema de Nöther, a lei de conservação (154) d t ⁢ j ′ = 0 . Mas dela não se segue, de forma nenhuma, que seja j′=0, que é a equação do movimento para A11. Para mostrar a liberdade de escolha de uma das funções incógnitas, reduziremos o problema até agora exposto ao caso do espaço unidimensional. A equação do movimento de A permite então obter12 (155) A ⁢ ( t ) = i 2 ⁢ ( v * r * - v r ) . Eliminaremos o desconhecimento da função r* exigindo que seja (156) r * ⁢ ( t ) = f ⁢ ( t ) ; v * ⁢ ( t ) = d t ⁢ f ⁢ ( t ) . Substituindo as Eqs. (159) e (158) na equação do movimento para r [Eq. (155)], obtém-se, sob a suposição de ser f≠0, (157) d t ⁢ A = - i ⁢ A 2 - 2 ⁢ d t ⁢ f f ⁢ A + i ⁢ d t 2 ⁢ f f ; A ⁢ ( 0 ) = i 2 ⁢ ( d t ⁢ f ⁢ ( 0 ) f ⁢ ( 0 ) - v 0 r 0 ) . Esta é uma equação diferencial ordinária da primeira ordem, cuja condição inicial decorre da definição de A [Eq. (158)] – denotamos r0=r⁢(0) e v0=v⁢(0)–, e que possui solução sob condições razoáveis de continuidade de f. Uma vez obtida a função A⁢(t), isolando em sua expressão a coordenada r, ela poderá ser integrada: (158) v r = 2 ⁢ i ⁢ A + d t ⁢ f f ⇒ r ⁢ ( t ) = r 0 ⁢ exp ⁡ { ∫ 0 t ( 2 ⁢ i ⁢ A + d t ⁢ f f ) ⁢ d t } . Destarte, uma multidão de possíveis movimentos são possíveis para a coordenada r. Ainda mais, é claro que, dadas condições iniciais r0,v0,r0*,v0*, existem infinitas funções f⁢(t) que podem ser escolhidas, pois r0* e v0* só fixam os valores de f⁢(0) e dt⁢f⁢(0), mas os valores de todas as outras derivadas são completamente arbitrários. Para exemplificar o dito, consideremos o seguinte caso: Exemplo. Para as condições iniciais r0*=a≠0 e v0*=0, é possível escolher, entre uma infinidade de outras possibilidades, a função f⁢(t)=a ou a f⁢(t)=a⁢et2. Analisemos as duas escolhas. (1) No primeiro caso, a equação diferencial para A será (159) d t ⁢ A = - i ⁢ A 2 ; A ⁢ ( 0 ) = - i ⁢ v 0 2 ⁢ r 0 ⇒ A = - i t + 2 ⁢ r 0 v 0 , o qual, substituído na Eq. (158), leva à solução (160) r ⁢ ( t ) = v 0 2 4 ⁢ r 0 ⁢ ( t + 2 ⁢ r 0 v 0 ) 2 . (2) No segundo caso, por outro lado, a equação diferencial para A será (161) d t ⁢ A = - i ⁢ A 2 - 4 ⁢ t ⁢ A + 4 ⁢ i ⁢ t 2 + 2 ⁢ i , cuja solução, sujeita à condição inicial escrita na Eq. (159), é (162) A = 2 ⁢ i ⁢ t - i t + 2 ⁢ r 0 v 0 , que leva, por sua vez, ao movimento para r⁢(t) dado por (163) r ⁢ ( t ) = v 0 2 4 ⁢ r 0 ⁢ e - t 2 ⁢ ( t + 2 ⁢ r 0 v 0 ) 2 , o qual difere do resultado da Eq. (160) pelo fator e-t2, tornando o movimento completamente diferente: Num caso, a coordenada r⁢(t) cresce infinitamente com o avanço do tempo, noutro, tende assintoticamente a zero. Numa palavra, as condições iniciais não determinam univocamente a evolução posterior das coordenadas. Este fato ilustra perfeitamente uma característica geral dos sistemas invariantes de calibre locais: Como há mais funções incógnitas que equações (algumas equações do movimento são identidades pelo segundo teorema de Nöther), o problema dos valores iniciais não está bem definido até que o calibre tenha sido fixado, ou seja, até que condições fixadoras das funções arbitrárias tenham sido escolhidas13. O caráter vinculado destas teorias, que é também uma característica geral, se observa igualmente em nosso exemplo: Como a derivada temporal da coordenada de calibre não aparece na lagrangiana, o momento canonicamente conjugado que lhe corresponde é nulo, e o passo ao formalismo hamiltoniano não é trivial. De fato, como pode-se ver na Ref. [17], a fixação do calibre é igualmente essencial para a obtenção de uma hamiltoniana. .

É importante salientarmos também que as identidades fornecidas pelo segundo teorema de Nöther reduzem o número de equações de Euler-Lagrange independentes de uma dada teoria, o que de forma geral leva ao aparecimento de vínculos ao se passar ao formalismo hamiltoniano, que é então uma tarefa não trivial8 8 O estabelecimento do formalismo hamiltoniano para sistemas singulares (vinculados) pode ser realizado de diversas formas, dentre as quais se destacam a abordagem de Dirac e a de Faddeev e Jackiw – uma revisão deste último método na mecânica clássica pode ser consultada, por exemplo, na Ref. [17]. . Como outrora, estes pontos e outros a mais serão melhor visualizados ao considerarmos o exemplo da seção7 7. Princípio da Invariância de Calibre na Mecânica do Ponto Estudaremos, para iniciar, um exemplo da mecânica do ponto, que nos servirá para introduzir o princípio da invariância de calibre – geralmente, porém, como veremos aqui, não necessariamente, introduzido só na teoria do campo clássico – e estudar as consequências do segundo teorema de Nöther. Consideremos a lagrangiana de duas partículas livres de massas m1 e m2 (122) L = 1 2 ⁢ m 1 ⁢ v 1 2 + 1 2 ⁢ m 2 ⁢ v 2 2 . Ela pode ser escrita em função da massa reduzida m fazendo o escalamento das coordenadas segundo (123) r 1 → m 2 m 1 + m 2 ⁢ r 1 , r 2 → m 1 m 1 + m 2 ⁢ r 2 , com o qual (124) L = 1 2 ⁢ m ⁢ ( v 1 2 + v 2 2 ) . Mais ainda, se introduzirmos as coordenadas complexas (125) r := 1 2 ⁢ ( r 1 + i ⁢ r 2 ) , r * := 1 2 ⁢ ( r 1 - i ⁢ r 2 ) , ter-se-á que (126) L = m ⁢ v * ⋅ v . Está claro que essa lagrangiana possui a simetria por transformações de fase, r→ei⁢α⁢r e r*→e-i⁢α⁢r*, as quais se escrevem infinitesimalmente como: Δ⁢r=i⁢α⁢r e Δ⁢r*=-i⁢α⁢r*. A corrente conservada que corresponde a tal simetria é (127) α ⁢ j = - ∂ ⁡ L ∂ ⁡ v ⋅ Δ ⁢ r - ∂ ⁡ L ∂ ⁡ v * ⋅ Δ ⁢ r * ⇒ j = i ⁢ m ⁢ ( r * ⋅ v - v * ⋅ r ) . As transformações de fase das variáveis complexas correspondem, evidentemente, às transformações segundo o grupo SO(2) das coordenadas reais r1 e r2, isto é, às transformações (128) r 1 ′ = cos ⁡ ( α ) ⁢ r 1 - sin ⁡ ( α ) ⁢ r 2 , r 2 ′ = sin ⁡ ( α ) ⁢ r 1 + cos ⁡ ( α ) ⁢ r 2 . A transformação interna global (de parâmetro «α» constante) até agora considerada, é uma simetria da teoria livre. Weyl propôs que a teoria em interação pode ser construída a partir dela por localização daquela: Princípio da invariância de calibre: Se uma (densidade) lagrangiana é invariante perante as transformações do grupo de Lie (global) Gr, então deve sê-lo também perante as transformações do grupo G∞⁢r obtido por localização do primeiro. O grupo de calibre global da lagrangiana da Eq. (126) é o grupo U(1). As correspondentes transformações de fase locais, infinitesimalmente, se escrevem (129) Δ ⁢ r = i ⁢ α ⁢ ( t ) ⁢ r , Δ ⁢ r * = - i ⁢ α ⁢ ( t ) ⁢ r * . As transformações das velocidades são (130) Δ ⁢ v = i ⁢ d t ⁢ α ⁢ r + i ⁢ α ⁢ v , Δ ⁢ v * = - i ⁢ d t ⁢ α ⁢ r * - i ⁢ α ⁢ v * . Logo se vê que a lagrangiana não é invariante pelas transformações escritas, pois ao calcular sua variação obtemos (131) Δ ⁢ L = i ⁢ m ⁢ d t ⁢ α ⁢ ( v * ⋅ r - r * ⋅ v ) = - j ⁢ d t ⁢ α ≠ 0 . Destarte, a lagrangiana L não satisfaz o princípio da invariância de calibre, e deve, como consequência, ser modificada. Executando um paralelismo com o tratamento de Utiyama na teoria do campo clássico – vide as Refs. [18, 19] –, introduzimos uma nova coordenada A, chamada «coordenada de calibre», com a seguinte lei de transformação: (132) Δ ⁢ A = α ⁢ ( U ⁢ A ) + d t ⁢ α . O motivo para introduzirmos a variação de A dependente da derivada do parâmetro α⁢(t) é que, como dissemos alhures, é impossível uma teoria (não trivial) possuir a invariância local sem ao menos um dos campos se transformar segundo a derivada dos parâmetros localizados – o que, digamos de passagem, explica o resultado da Eq. (131). A dependência é com a derivada de até primeira ordem devido a que os termos que impedem a lagrangiana ser invariante perante a transformação local possuem a mesma dependência, Eq. (131). A teoria invariante de calibre local será descrita pela lagrangiana L′=L′⁢(r;r*;v;v*;A), com variação (133) Δ ⁢ L ′ = ∂ ⁡ L ′ ∂ ⁡ r ⋅ Δ ⁢ r + ∂ ⁡ L ′ ∂ ⁡ r * ⋅ Δ ⁢ r * + ∂ ⁡ L ′ ∂ ⁡ v ⋅ Δ ⁢ v + ∂ ⁡ L ′ ∂ ⁡ v * ⋅ v * + ∂ ⁡ L ′ ∂ ⁡ A ⁢ Δ ⁢ A = i ⁢ α ⁢ ( ∂ ⁡ L ′ ∂ ⁡ r ⋅ r - ∂ ⁡ L ′ ∂ ⁡ r * ⋅ r * + ∂ ⁡ L ′ ∂ ⁡ v ⋅ v - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ v * - i ⁢ ∂ ⁡ L ′ ∂ ⁡ A ⁢ ( U ⁢ A ) ) ⏟ (I) + i ⁢ d t ⁢ α ⁢ ( ∂ ⁡ L ′ ∂ ⁡ v ⋅ r - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ r * - i ⁢ ∂ ⁡ L ′ ∂ ⁡ A ) ⏟ (II) . Como o parâmetro α⁢(t) e sua derivada, dt⁢α⁢(t), são independentes, as duas expressões (I) e (II) na Eq. (133) devem ser simultaneamente nulas. (II)=0. Comecemos estudando a condição de ser (II)=0. A equação que se obtém por essa imposição, (134) ∂ ⁡ L ′ ∂ ⁡ A = - i ⁢ ( ∂ ⁡ L ′ ∂ ⁡ v ⋅ r - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ r * ) , pode ser solucionada de forma recursiva (método de aproximações sucessivas de Picard). Supondo que a lagrangiana L′ pode ser obtida suavemente a partir da L, com a qual se iguala quando A=0, solucionemos a Eq. (134) colocando L em seu lado direito: (135) ∂ ⁡ L ′ ∂ ⁡ A = - i ⁢ m ⁢ ( v * ⋅ r - v ⋅ r * ) ⇒ L ′ = L - i ⁢ m ⁢ A ⁢ ( v * ⋅ r - v ⋅ r * ) . Colocando agora esta nova lagrangiana no lado direito da Eq. (134) e solucionando para L′, (136) ∂ ⁡ L ′ ∂ ⁡ A = - i ⁢ m ⁢ ( v * ⋅ r - v ⋅ r * ) + 2 ⁢ m ⁢ A ⁢ r * ⋅ r ⇒ L ′ = L - i ⁢ m ⁢ A ⁢ ( v * ⋅ r - v ⋅ r * ) + m ⁢ A 2 ⁢ r * ⋅ r . E como o novo termo não depende das velocidades, o procedimento recursivo termina aqui. Salientamos que o método recursivo aqui aplicado pode ser diretamente transladado à teoria do campo clássico. De fato, esse é um dos métodos para a construção das teorias de calibre, utilizado, por exemplo, na Ref. [20]. Como explicado nesta referência, as teorias de Yang-Mills possuem a agradável peculiaridade de, como em nosso exemplo, o procedimento recursivo terminar em um número finito de passos. No caso da gravidade, por outro lado, o procedimento recursivo é infinito, o que não significa que ele não possa ser resolvido: Denotando por rj as componentes de todas as coordenadas (ou seja, tanto de r quanto de r*) e supondo que a lagrangiana L′ possa ser expandida em série de potências da coordenada de calibre A, (137) L ′ ⁢ ( r ; v ; A ) = ∑ n ∈ ℕ 0 1 n ! ⁢ A n ⁢ L ( n ) , L ( 0 ) ≡ L , a Eq. (134) leva a (138) L ( n + 1 ) = - i ⁢ ∂ ⁡ L ( n ) ∂ ⁡ v j ⁢ r j = ⋯ = ( - i ) n + 1 ⁢ ∂ n + 1 ⁡ L ∂ ⁡ v j 1 ⁢ ⋯ ⁢ ∂ ⁡ v j n + 1 ⁢ r j 1 ⁢ ⋯ ⁢ r j n + 1 , donde (139) L ′ ⁢ ( r ; v ; A ) = ∑ n ∈ ℕ 0 ( - i ) n ⁢ A n n ! ⁢ ∂ n ⁡ L ∂ ⁡ v j 1 ⁢ ⋯ ⁢ ∂ ⁡ v j n ⁢ r j 1 ⁢ ⋯ ⁢ r j n = L ⁢ ( r ; v - i ⁢ A ⁢ r ) . Assim, ainda que o procedimento recursivo seja infinito, o resultado em qualquer caso se reduz à chamada «prescrição do acoplamento mínimo», derivada pela primeira vez por Utiyama para teorias de calibre gerais [18] e segundo a qual: Prescrição9 do acoplamento mínimo: A (densidade) lagrangiana invariante perante as transformações de calibre locais se obtém pela substituição das derivadas temporais dt pelas «derivadas covariantes» Dt definidas como (140) D t := d t - i ⁢ A . Em particular, isto leva a substituir as velocidades v pelas «velocidades covariantes» V: (141) L ′ ⁢ ( r ; v ; A ) = L ⁢ ( r ; V ) , V = v - i ⁢ A ⁢ r . Um cálculo rápido permite verificar que a lagrangiana da Eq. (136) se obtém da Eq. (126) pela substituição mencionada. (I)=0. Uma vez que conhecemos a forma da nova lagrangiana L′, a condição (I)=0 permitirá fixar por completo a lei de variação da coordenada de calibre A. Com efeito, da Eq. (133) se vê que a presente condição é (142) ∂ ⁡ L ′ ∂ ⁡ A ⁢ ( U ⁢ A ) = - i ⁢ ( ∂ ⁡ L ′ ∂ ⁡ r ⋅ r - ∂ ⁡ L ′ ∂ ⁡ r * ⋅ r * + ∂ ⁡ L ′ ∂ ⁡ v ⋅ v - ∂ ⁡ L ′ ∂ ⁡ v * ⋅ v * ) . Como o lado direito dessa equação é nulo uma vez que se substitui nele a lagrangiana L′ da Eq. (136), deverá ser (U⁢A)=0 e, por isso, a variação da coordenada de calibre será (143) Δ ⁢ A = d t ⁢ α . Isto permite justificar o nome «velocidade covariante» da quantidade V definida na Eq. (141), pois sua variação é (144) Δ ⁢ V = Δ ⁢ v - i ⁢ Δ ⁢ A ⁢ r - i ⁢ A ⁢ Δ ⁢ r = i ⁢ α ⁢ ( v - i ⁢ A ⁢ r ) = i ⁢ α ⁢ V , ou seja, a velocidade covariante V se transforma, perante uma transformação de calibre local, como o faz a velocidade v perante uma global. Sendo que temos já a teoria invariante de calibre global e local para as coordenadas iniciais e sua interação com a coordenada de calibre, é preciso procurarmos pela lagrangiana da coordenada de calibre livre. Denotando-a por LA=LA⁢(A;∂⁡A), sua lei de transformação será (145) Δ ⁢ L A = ∂ ⁡ L A ∂ ⁡ A ⁢ Δ ⁢ A + ∂ ⁡ L A ∂ ⁡ ( d t ⁢ A ) ⁢ d t ⁢ Δ ⁢ A = ∂ ⁡ L A ∂ ⁡ A ⁢ d t ⁢ α + ∂ ⁡ L A ∂ ⁡ ( d t ⁢ A ) ⁢ d t 2 ⁢ α . Semelhante variação deveria ser nula para que a teoria seja invariante de calibre local. Ora, a equação anterior indica que isso só será possível se LA=0, e a coordenada de calibre não possuirá uma dinâmica própria. Em outras palavras, a coordenada de calibre satisfará apenas a equações de vínculos. A teoria invariante de calibre completa será, portanto, a descrita pela lagrangiana (146) L ′ = m ⁢ v * ⋅ v - i ⁢ m ⁢ A ⁢ ( v * ⋅ r - v ⋅ r * ) + m ⁢ A 2 ⁢ r * ⋅ r . No caso unidimensional, com r≡r, r*≡r*– caso particular que consideraremos mais detalhadamente abaixo –, esta lagrangiana é equivalente à do modelo mecânico de Christ-Lee com potencial nulo [21] – vide também o Exemplo 4 na Ref. [17] para um tratamento hamiltoniano. A aplicação do primeiro teorema de Nöther revela que a corrente de Nöther dessa teoria é (147) j ′ = i ⁢ m ⁢ ( v ⋅ r * - v * ⋅ r ) + 2 ⁢ m ⁢ A ⁢ r * ⋅ r , que se conservará ao sujeitarmos as coordenadas às equações do movimento. Escrevendo-a em função das velocidades covariantes, a corrente de Nöther é (148) j ′ = i ⁢ m ⁢ ( r * ⋅ V - r ⋅ V * ) . Daqui se observa que a nova corrente se obtém da primeira, Eq. (127), pela substituição das quantidades iniciais pelas covariantes. Apliquemos agora o segundo teorema de Nöther. Das leis de transformação das diversas coordenadas envolvidas, pode-se identificar [vide a Eq. (100)] (149) a r = i ⁢ r , b r = 0 ; a r * = - i ⁢ r * , b r * = 0 ; a A = 0 , b A = 1 . Substituindo na Eq. (104), obtemos a expressão do segundo teorema de Nöther: (150) i ⁢ r ⋅ δ ⁢ 𝒜 ′ δ ⁢ r - i ⁢ r * ⋅ δ ⁢ 𝒜 ′ δ ⁢ r * = d d ⁢ t ⁢ ( δ ⁢ 𝒜 ′ δ ⁢ A ) , de forma que não todas as derivadas funcionais são independentes, pois existe uma relação entre elas; como consequência, há mais funções incógnitas do que equações, donde haverá também uma liberdade de escolha de uma daquelas (liberdade de calibre). Assim, se as equações do movimento para A, r, r1* e r2* forem satisfeitas, a relação anterior implica que, necessariamente, a equação do movimento para r3* será também, automaticamente, satisfeita. Equivalentemente, qualquer uma das equações do movimento para ri ou ri* pode ser escrita em função das outras; porém, a equação do movimento para A, não, pois ela aparece na tese do segundo teorema de Nöther somente através de uma derivada temporal. Sendo assim, embora uma coordenada pode ser, de fato, eliminada por ser desnecessária para a descrição do sistema, tal não pode ser a coordenada de calibre. Para exemplificar isto, escrevemos as derivadas funcionais da ação de nosso modelo particular, que são as seguintes10: (151) δ ⁢ 𝒜 ′ δ ⁢ r * = - m ⁢ d t ⁢ ( v - i ⁢ A ⁢ r ) + i ⁢ m ⁢ A ⁢ ( v - i ⁢ A ⁢ r ) , (152) δ ⁢ 𝒜 ′ δ ⁢ r = - m ⁢ d t ⁢ ( v * + i ⁢ A ⁢ r * ) - i ⁢ m ⁢ A ⁢ ( v * + i ⁢ A ⁢ r * ) , (153) δ ⁢ 𝒜 ′ δ ⁢ A = i ⁢ m ⁢ ( r * ⋅ v - v * ⋅ r ) + 2 ⁢ m ⁢ A ⁢ r * ⋅ r = j ′ . Supondo a validade das equações do movimento para r e r*, obter-se-ia, via o segundo teorema de Nöther, a lei de conservação (154) d t ⁢ j ′ = 0 . Mas dela não se segue, de forma nenhuma, que seja j′=0, que é a equação do movimento para A11. Para mostrar a liberdade de escolha de uma das funções incógnitas, reduziremos o problema até agora exposto ao caso do espaço unidimensional. A equação do movimento de A permite então obter12 (155) A ⁢ ( t ) = i 2 ⁢ ( v * r * - v r ) . Eliminaremos o desconhecimento da função r* exigindo que seja (156) r * ⁢ ( t ) = f ⁢ ( t ) ; v * ⁢ ( t ) = d t ⁢ f ⁢ ( t ) . Substituindo as Eqs. (159) e (158) na equação do movimento para r [Eq. (155)], obtém-se, sob a suposição de ser f≠0, (157) d t ⁢ A = - i ⁢ A 2 - 2 ⁢ d t ⁢ f f ⁢ A + i ⁢ d t 2 ⁢ f f ; A ⁢ ( 0 ) = i 2 ⁢ ( d t ⁢ f ⁢ ( 0 ) f ⁢ ( 0 ) - v 0 r 0 ) . Esta é uma equação diferencial ordinária da primeira ordem, cuja condição inicial decorre da definição de A [Eq. (158)] – denotamos r0=r⁢(0) e v0=v⁢(0)–, e que possui solução sob condições razoáveis de continuidade de f. Uma vez obtida a função A⁢(t), isolando em sua expressão a coordenada r, ela poderá ser integrada: (158) v r = 2 ⁢ i ⁢ A + d t ⁢ f f ⇒ r ⁢ ( t ) = r 0 ⁢ exp ⁡ { ∫ 0 t ( 2 ⁢ i ⁢ A + d t ⁢ f f ) ⁢ d t } . Destarte, uma multidão de possíveis movimentos são possíveis para a coordenada r. Ainda mais, é claro que, dadas condições iniciais r0,v0,r0*,v0*, existem infinitas funções f⁢(t) que podem ser escolhidas, pois r0* e v0* só fixam os valores de f⁢(0) e dt⁢f⁢(0), mas os valores de todas as outras derivadas são completamente arbitrários. Para exemplificar o dito, consideremos o seguinte caso: Exemplo. Para as condições iniciais r0*=a≠0 e v0*=0, é possível escolher, entre uma infinidade de outras possibilidades, a função f⁢(t)=a ou a f⁢(t)=a⁢et2. Analisemos as duas escolhas. (1) No primeiro caso, a equação diferencial para A será (159) d t ⁢ A = - i ⁢ A 2 ; A ⁢ ( 0 ) = - i ⁢ v 0 2 ⁢ r 0 ⇒ A = - i t + 2 ⁢ r 0 v 0 , o qual, substituído na Eq. (158), leva à solução (160) r ⁢ ( t ) = v 0 2 4 ⁢ r 0 ⁢ ( t + 2 ⁢ r 0 v 0 ) 2 . (2) No segundo caso, por outro lado, a equação diferencial para A será (161) d t ⁢ A = - i ⁢ A 2 - 4 ⁢ t ⁢ A + 4 ⁢ i ⁢ t 2 + 2 ⁢ i , cuja solução, sujeita à condição inicial escrita na Eq. (159), é (162) A = 2 ⁢ i ⁢ t - i t + 2 ⁢ r 0 v 0 , que leva, por sua vez, ao movimento para r⁢(t) dado por (163) r ⁢ ( t ) = v 0 2 4 ⁢ r 0 ⁢ e - t 2 ⁢ ( t + 2 ⁢ r 0 v 0 ) 2 , o qual difere do resultado da Eq. (160) pelo fator e-t2, tornando o movimento completamente diferente: Num caso, a coordenada r⁢(t) cresce infinitamente com o avanço do tempo, noutro, tende assintoticamente a zero. Numa palavra, as condições iniciais não determinam univocamente a evolução posterior das coordenadas. Este fato ilustra perfeitamente uma característica geral dos sistemas invariantes de calibre locais: Como há mais funções incógnitas que equações (algumas equações do movimento são identidades pelo segundo teorema de Nöther), o problema dos valores iniciais não está bem definido até que o calibre tenha sido fixado, ou seja, até que condições fixadoras das funções arbitrárias tenham sido escolhidas13. O caráter vinculado destas teorias, que é também uma característica geral, se observa igualmente em nosso exemplo: Como a derivada temporal da coordenada de calibre não aparece na lagrangiana, o momento canonicamente conjugado que lhe corresponde é nulo, e o passo ao formalismo hamiltoniano não é trivial. De fato, como pode-se ver na Ref. [17], a fixação do calibre é igualmente essencial para a obtenção de uma hamiltoniana. . Antes disso, porém, enunciaremos o recíproco do segundo teorema de Nöther.

Teorema 5 (Segundo teorema recíproco de Nöther). Se, em um sistema de campos clássicos, existem r identidades entre as derivadas funcionais da ação e suas derivadas até da ordem k, então a funcional da ação é invariante sob as transformações de um grupo de Lie localizado Gr, em que as variações dos campos contém derivadas dos parâmetros até da ordem k.

Demonstração. Fixando a atenção no caso com k=2 (a generalização é imediata), é hipótese do segundo teorema recíproco a validade de, exatamente, a Eq. (104). Definindo, pela identificação dos coeficientes da mencionada expressão, a variação dos campos como na Eq. (100), obter-se-á que o integrando da variação da ação, Δ𝒫+ρ(𝒫Δxρ), é nulo, módulo uma divergência. Integrando-a numa região Ω4 em cuja fronteira os parâmetros e suas derivadas se anulam, encontrar-se-á a desejada invariância da funcional da ação. Finalmente, como no primeiro teorema recíproco, que as transformações constituem um grupo decorre da existência de, exatamente, r identidades, que determinam as r transformações linearmente independentes dos campos.

7. Princípio da Invariância de Calibre na Mecânica do Ponto

Estudaremos, para iniciar, um exemplo da mecânica do ponto, que nos servirá para introduzir o princípio da invariância de calibre – geralmente, porém, como veremos aqui, não necessariamente, introduzido só na teoria do campo clássico – e estudar as consequências do segundo teorema de Nöther.

Consideremos a lagrangiana de duas partículas livres de massas m1 e m2

(122) L = 1 2 m 1 v 1 2 + 1 2 m 2 v 2 2 .

Ela pode ser escrita em função da massa reduzida m fazendo o escalamento das coordenadas segundo

(123) r 1 m 2 m 1 + m 2 r 1 , r 2 m 1 m 1 + m 2 r 2 ,

com o qual

(124) L = 1 2 m ( v 1 2 + v 2 2 ) .

Mais ainda, se introduzirmos as coordenadas complexas

(125) r := 1 2 ( r 1 + i r 2 ) , r * := 1 2 ( r 1 - i r 2 ) ,

ter-se-á que

(126) L = m v * v .

Está claro que essa lagrangiana possui a simetria por transformações de fase, reiαr e r*e-iαr*, as quais se escrevem infinitesimalmente como: Δr=iαr e Δr*=-iαr*. A corrente conservada que corresponde a tal simetria é

(127) α j = - L v Δ r - L v * Δ r * j = i m ( r * v - v * r ) .

As transformações de fase das variáveis complexas correspondem, evidentemente, às transformações segundo o grupo SO(2) das coordenadas reais r1 e r2, isto é, às transformações

(128) r 1 = cos ( α ) r 1 - sin ( α ) r 2 , r 2 = sin ( α ) r 1 + cos ( α ) r 2 .

A transformação interna global (de parâmetro «α» constante) até agora considerada, é uma simetria da teoria livre. Weyl propôs que a teoria em interação pode ser construída a partir dela por localização daquela:

Princípio da invariância de calibre: Se uma (densidade) lagrangiana é invariante perante as transformações do grupo de Lie (global) Gr, então deve sê-lo também perante as transformações do grupo Gr obtido por localização do primeiro.

O grupo de calibre global da lagrangiana da Eq. (126) é o grupo U(1). As correspondentes transformações de fase locais, infinitesimalmente, se escrevem

(129) Δ r = i α ( t ) r , Δ r * = - i α ( t ) r * .

As transformações das velocidades são

(130) Δ v = i d t α r + i α v , Δ v * = - i d t α r * - i α v * .

Logo se vê que a lagrangiana não é invariante pelas transformações escritas, pois ao calcular sua variação obtemos

(131) Δ L = i m d t α ( v * r - r * v ) = - j d t α 0 .

Destarte, a lagrangiana L não satisfaz o princípio da invariância de calibre, e deve, como consequência, ser modificada. Executando um paralelismo com o tratamento de Utiyama na teoria do campo clássico – vide as Refs. [18[18] R. Utiyama, Phys. Rev. 101, 1597 (1956)., 19[19] O.A. Acevedo, R.R. Cuzinatto, B.M. Pimentel e P.J. Pompeia, Rev. Bras. Ens. Fís. 40, e4302 (2018).] –, introduzimos uma nova coordenada A, chamada «coordenada de calibre», com a seguinte lei de transformação:

(132) Δ A = α ( U A ) + d t α .

O motivo para introduzirmos a variação de A dependente da derivada do parâmetro α(t) é que, como dissemos alhures, é impossível uma teoria (não trivial) possuir a invariância local sem ao menos um dos campos se transformar segundo a derivada dos parâmetros localizados – o que, digamos de passagem, explica o resultado da Eq. (131). A dependência é com a derivada de até primeira ordem devido a que os termos que impedem a lagrangiana ser invariante perante a transformação local possuem a mesma dependência, Eq. (131). A teoria invariante de calibre local será descrita pela lagrangiana L=L(r;r*;v;v*;A), com variação

(133) Δ L = L r Δ r + L r * Δ r * + L v Δ v + L v * v * + L A Δ A = i α ( L r r - L r * r * + L v v - L v * v * - i L A ( U A ) ) (I) + i d t α ( L v r - L v * r * - i L A ) (II) .

Como o parâmetro α(t) e sua derivada, dtα(t), são independentes, as duas expressões (I) e (II) na Eq. (133) devem ser simultaneamente nulas.

(II)=0. Comecemos estudando a condição de ser (II)=0. A equação que se obtém por essa imposição,

(134) L A = - i ( L v r - L v * r * ) ,

pode ser solucionada de forma recursiva (método de aproximações sucessivas de Picard). Supondo que a lagrangiana L pode ser obtida suavemente a partir da L, com a qual se iguala quando A=0, solucionemos a Eq. (134) colocando L em seu lado direito:

(135) L A = - i m ( v * r - v r * ) L = L - i m A ( v * r - v r * ) .

Colocando agora esta nova lagrangiana no lado direito da Eq. (134) e solucionando para L,

(136) L A = - i m ( v * r - v r * ) + 2 m A r * r L = L - i m A ( v * r - v r * ) + m A 2 r * r .

E como o novo termo não depende das velocidades, o procedimento recursivo termina aqui.

Salientamos que o método recursivo aqui aplicado pode ser diretamente transladado à teoria do campo clássico. De fato, esse é um dos métodos para a construção das teorias de calibre, utilizado, por exemplo, na Ref. [20[20] M. Blagojević, Gravitation and gauge symmetries (IoP, Cornwall, 2002).]. Como explicado nesta referência, as teorias de Yang-Mills possuem a agradável peculiaridade de, como em nosso exemplo, o procedimento recursivo terminar em um número finito de passos. No caso da gravidade, por outro lado, o procedimento recursivo é infinito, o que não significa que ele não possa ser resolvido: Denotando por rj as componentes de todas as coordenadas (ou seja, tanto de r quanto de r*) e supondo que a lagrangiana L possa ser expandida em série de potências da coordenada de calibre A,

(137) L ( r ; v ; A ) = n 0 1 n ! A n L ( n ) , L ( 0 ) L ,

a Eq. (134) leva a

(138) L ( n + 1 ) = - i L ( n ) v j r j = = ( - i ) n + 1 n + 1 L v j 1 v j n + 1 r j 1 r j n + 1 ,

donde

(139) L ( r ; v ; A ) = n 0 ( - i ) n A n n ! n L v j 1 v j n r j 1 r j n = L ( r ; v - i A r ) .

Assim, ainda que o procedimento recursivo seja infinito, o resultado em qualquer caso se reduz à chamada «prescrição do acoplamento mínimo», derivada pela primeira vez por Utiyama para teorias de calibre gerais [18[18] R. Utiyama, Phys. Rev. 101, 1597 (1956).] e segundo a qual:

Prescrição9 Essa «prescrição» tem a categoria de um teorema na mecânica do ponto material, pois nela não existe um análogo ao tensor de Faraday da eletrodinâmica. Ela é uma prescrição, sim, na teoria do campo clássico, pois presume que não há interação nenhuma entre os campos de matéria e as derivadas dos campos de calibre, condição que não segue do princípio da invariância de calibre. Mais detalhes a este respeito serão dados na seção10. do acoplamento mínimo: A (densidade) lagrangiana invariante perante as transformações de calibre locais se obtém pela substituição das derivadas temporais dt pelas «derivadas covariantes» Dt definidas como

(140) D t := d t - i A .

Em particular, isto leva a substituir as velocidades v pelas «velocidades covariantes» V:

(141) L ( r ; v ; A ) = L ( r ; V ) , V = v - i A r .

Um cálculo rápido permite verificar que a lagrangiana da Eq. (136) se obtém da Eq. (126) pela substituição mencionada.

(I)=0. Uma vez que conhecemos a forma da nova lagrangiana L, a condição (I)=0 permitirá fixar por completo a lei de variação da coordenada de calibre A. Com efeito, da Eq. (133) se vê que a presente condição é

(142) L A ( U A ) = - i ( L r r - L r * r * + L v v - L v * v * ) .

Como o lado direito dessa equação é nulo uma vez que se substitui nele a lagrangiana L da Eq. (136), deverá ser (UA)=0 e, por isso, a variação da coordenada de calibre será

(143) Δ A = d t α .

Isto permite justificar o nome «velocidade covariante» da quantidade V definida na Eq. (141), pois sua variação é

(144) Δ V = Δ v - i Δ A r - i A Δ r = i α ( v - i A r ) = i α V ,

ou seja, a velocidade covariante V se transforma, perante uma transformação de calibre local, como o faz a velocidade v perante uma global.

Sendo que temos já a teoria invariante de calibre global e local para as coordenadas iniciais e sua interação com a coordenada de calibre, é preciso procurarmos pela lagrangiana da coordenada de calibre livre. Denotando-a por LA=LA(A;A), sua lei de transformação será

(145) Δ L A = L A A Δ A + L A ( d t A ) d t Δ A = L A A d t α + L A ( d t A ) d t 2 α .

Semelhante variação deveria ser nula para que a teoria seja invariante de calibre local. Ora, a equação anterior indica que isso só será possível se LA=0, e a coordenada de calibre não possuirá uma dinâmica própria. Em outras palavras, a coordenada de calibre satisfará apenas a equações de vínculos.

A teoria invariante de calibre completa será, portanto, a descrita pela lagrangiana

(146) L = m v * v - i m A ( v * r - v r * ) + m A 2 r * r .

No caso unidimensional, com rr, r*r*– caso particular que consideraremos mais detalhadamente abaixo –, esta lagrangiana é equivalente à do modelo mecânico de Christ-Lee com potencial nulo [21[21] N.H. Christ e T.D. Lee, Phys. Rev. D 22, 939 (1980).] – vide também o Exemplo 4 na Ref. [17[17] L.G. Caro, B.M. Pimentel e G.E.R. Zambrano, Rev. Bras. Ens. Fís. 43, e20210273 (2021).] para um tratamento hamiltoniano. A aplicação do primeiro teorema de Nöther revela que a corrente de Nöther dessa teoria é

(147) j = i m ( v r * - v * r ) + 2 m A r * r ,

que se conservará ao sujeitarmos as coordenadas às equações do movimento. Escrevendo-a em função das velocidades covariantes, a corrente de Nöther é

(148) j = i m ( r * V - r V * ) .

Daqui se observa que a nova corrente se obtém da primeira, Eq. (127), pela substituição das quantidades iniciais pelas covariantes.

Apliquemos agora o segundo teorema de Nöther. Das leis de transformação das diversas coordenadas envolvidas, pode-se identificar [vide a Eq. (100)]

(149) a r = i r , b r = 0 ; a r * = - i r * , b r * = 0 ; a A = 0 , b A = 1 .

Substituindo na Eq. (104), obtemos a expressão do segundo teorema de Nöther:

(150) i r δ 𝒜 δ r - i r * δ 𝒜 δ r * = d d t ( δ 𝒜 δ A ) ,

de forma que não todas as derivadas funcionais são independentes, pois existe uma relação entre elas; como consequência, há mais funções incógnitas do que equações, donde haverá também uma liberdade de escolha de uma daquelas (liberdade de calibre). Assim, se as equações do movimento para A, r, r1* e r2* forem satisfeitas, a relação anterior implica que, necessariamente, a equação do movimento para r3* será também, automaticamente, satisfeita. Equivalentemente, qualquer uma das equações do movimento para ri ou ri* pode ser escrita em função das outras; porém, a equação do movimento para A, não, pois ela aparece na tese do segundo teorema de Nöther somente através de uma derivada temporal. Sendo assim, embora uma coordenada pode ser, de fato, eliminada por ser desnecessária para a descrição do sistema, tal não pode ser a coordenada de calibre. Para exemplificar isto, escrevemos as derivadas funcionais da ação de nosso modelo particular, que são as seguintes10 10 Note, além do mais, que as derivadas funcionais da ação podem ser escritas de forma sucinta em função das quantidades covariantes: As equações do movimento são Dt2⁢r=0,(Dt*)2⁢r*=0,r*⋅V=r⋅V*. :

(151) δ 𝒜 δ r * = - m d t ( v - i A r ) + i m A ( v - i A r ) ,
(152) δ 𝒜 δ r = - m d t ( v * + i A r * ) - i m A ( v * + i A r * ) ,
(153) δ 𝒜 δ A = i m ( r * v - v * r ) + 2 m A r * r = j .

Supondo a validade das equações do movimento para r e r*, obter-se-ia, via o segundo teorema de Nöther, a lei de conservação

(154) d t j = 0 .

Mas dela não se segue, de forma nenhuma, que seja j=0, que é a equação do movimento para A11 11 O que, de passagem, confirma o que dissemos no comentário que segue à Eq. (121). .

Para mostrar a liberdade de escolha de uma das funções incógnitas, reduziremos o problema até agora exposto ao caso do espaço unidimensional. A equação do movimento de A permite então obter12 12 A dependência de A∼v/r permite interpretar a coordenada de calibre como um análogo ao potencial de Liénard-Wiechert no limite de velocidade lumínica infinita. Com efeito, na teoria do campo, a invariância local perante o grupo U(1) é obtida com a introdução do potencial eletromagnético.

(155) A ( t ) = i 2 ( v * r * - v r ) .

Eliminaremos o desconhecimento da função r* exigindo que seja

(156) r * ( t ) = f ( t ) ; v * ( t ) = d t f ( t ) .

Substituindo as Eqs. (159) e (158) na equação do movimento para r [Eq. (155)], obtém-se, sob a suposição de ser f0,

(157) d t A = - i A 2 - 2 d t f f A + i d t 2 f f ; A ( 0 ) = i 2 ( d t f ( 0 ) f ( 0 ) - v 0 r 0 ) .

Esta é uma equação diferencial ordinária da primeira ordem, cuja condição inicial decorre da definição de A [Eq. (158)] – denotamos r0=r(0) e v0=v(0)–, e que possui solução sob condições razoáveis de continuidade de f. Uma vez obtida a função A(t), isolando em sua expressão a coordenada r, ela poderá ser integrada:

(158) v r = 2 i A + d t f f r ( t ) = r 0 exp { 0 t ( 2 i A + d t f f ) d t } .

Destarte, uma multidão de possíveis movimentos são possíveis para a coordenada r. Ainda mais, é claro que, dadas condições iniciais r0,v0,r0*,v0*, existem infinitas funções f(t) que podem ser escolhidas, pois r0* e v0* só fixam os valores de f(0) e dtf(0), mas os valores de todas as outras derivadas são completamente arbitrários. Para exemplificar o dito, consideremos o seguinte caso:

Exemplo. Para as condições iniciais r0*=a0 e v0*=0, é possível escolher, entre uma infinidade de outras possibilidades, a função f(t)=a ou a f(t)=aet2. Analisemos as duas escolhas.

  • (1)

    No primeiro caso, a equação diferencial para A será

    (159) d t A = - i A 2 ; A ( 0 ) = - i v 0 2 r 0 A = - i t + 2 r 0 v 0 ,

    o qual, substituído na Eq. (158), leva à solução

    (160) r ( t ) = v 0 2 4 r 0 ( t + 2 r 0 v 0 ) 2 .

  • (2)

    No segundo caso, por outro lado, a equação diferencial para A será

    (161) d t A = - i A 2 - 4 t A + 4 i t 2 + 2 i ,

    cuja solução, sujeita à condição inicial escrita na Eq. (159), é

    (162) A = 2 i t - i t + 2 r 0 v 0 ,

    que leva, por sua vez, ao movimento para r(t) dado por

    (163) r ( t ) = v 0 2 4 r 0 e - t 2 ( t + 2 r 0 v 0 ) 2 ,

    o qual difere do resultado da Eq. (160) pelo fator e-t2, tornando o movimento completamente diferente: Num caso, a coordenada r(t) cresce infinitamente com o avanço do tempo, noutro, tende assintoticamente a zero. Numa palavra, as condições iniciais não determinam univocamente a evolução posterior das coordenadas.

Este fato ilustra perfeitamente uma característica geral dos sistemas invariantes de calibre locais: Como há mais funções incógnitas que equações (algumas equações do movimento são identidades pelo segundo teorema de Nöther), o problema dos valores iniciais não está bem definido até que o calibre tenha sido fixado, ou seja, até que condições fixadoras das funções arbitrárias tenham sido escolhidas13 13 Na teoria do campo, é consequência disto que os campos de calibre somente podem ser quantizados uma vez que o calibre tenha sido fixado. .

O caráter vinculado destas teorias, que é também uma característica geral, se observa igualmente em nosso exemplo: Como a derivada temporal da coordenada de calibre não aparece na lagrangiana, o momento canonicamente conjugado que lhe corresponde é nulo, e o passo ao formalismo hamiltoniano não é trivial. De fato, como pode-se ver na Ref. [17[17] L.G. Caro, B.M. Pimentel e G.E.R. Zambrano, Rev. Bras. Ens. Fís. 43, e20210273 (2021).], a fixação do calibre é igualmente essencial para a obtenção de uma hamiltoniana.

8. Eletrodinâmica de Maxwell

Nesta seção estudaremos as consequências dos teoremas de Nöther na eletrodinâmica de Maxwell, considerando o campo de Dirac como o campo de matéria.

§ Construção da teoria: O campo de Dirac possui a seguinte densidade lagrangiana livre:

(164) D = ψ ¯ ( i 2 m ) ψ ,

da qual se derivam as equações do movimento

(165) ( i m ) ψ = 0 ψ ¯ ( i + m ) = 0

É imediato reconhecer que a densidade lagrangiana da Eq. (164) é invariante perante as transformações de fase

(166) ψ e i α ψ , ψ ¯ e - i α ψ ¯ ,

com α, que constituem o grupo U(1). Essa invariância de calibre global pode ser localizada fazendo uso da prescrição do acoplamento mínimo de Utiyama, analogamente ao que foi realizado no modelo mecânico estudado anteriormente: Introduzindo um campo de calibre Aμ, com a lei de transformação local

(167) Δ A μ ( x ) = 1 e μ α ( x ) ,

e substituindo em D as derivadas ordinárias dos campos pelas derivadas covariantes,

(168) D μ ψ := μ ψ - i e A μ ψ , D μ ψ ¯ := μ ψ ¯ + i e A μ ψ ¯ ,

obtém-se a densidade lagrangiana de matéria e interação

(169) D + i n t = ψ ¯ ( i 2 D m ) ψ = ψ ¯ ( i 2 m ) ψ + e A μ ψ ¯ γ μ ψ .

Como no caso mecânico, devemos ainda examinar a possibilidade de estabelecer uma densidade lagrangiana para o campo de calibre Aμ, a qual deverá ser, forçosamente, invariante de calibre local – e, como consequência, também global. Suponhamos, pois, que a tal densidade lagrangiana seja da primeira ordem: A=A(A;A). Sua variação é

(170) Δ A = A A μ Δ A μ + A ( ν A μ ) ν Δ A μ = 1 e A A μ μ α + 1 2 e ( A ( ν A μ ) + A ( μ A ν ) ) μ ν α .

A condição de nulidade de A implica então, devido à independência entre α e α, que: (1) O campo de calibre é não massivo, pois

(171) A A μ = 0 ,

e que (2) A é função somente do «tensor de Faraday»

(172) F μ ν := μ A ν - ν A μ ,

pois

(173) A ( ν A μ ) + A ( μ A ν ) = 0 .

A densidade lagrangiana mais simples que pode ser construída satisfazendo essas características é a conhecida densidade lagrangiana da eletrodinâmica de Maxwell:

(174) A = - 1 4 F μ ν F μ ν .

Pelos motivos assim expostos, a densidade lagrangiana completa da eletrodinâmica fermiônica de Maxwell é

(175) = ψ ¯ ( i 2 m ) ψ + e A μ ψ ¯ γ μ ψ 1 4 F μ ν F μ ν .

E, por construção, é invariante de calibre pelo grupo U(1) localizado.

§ Equações do movimento e segundo teorema de Nöther: As derivadas funcionais da ação em relação aos três campos participantes são

(176) δ 𝒜 δ ψ = - ψ ¯ ( i + m ) + e ψ ¯ A ,
(177) δ 𝒜 δ ψ ¯ = ( i - m ) ψ + e A ψ ,
(178) δ 𝒜 δ A ρ = e ψ ¯ γ ρ ψ + σ F σ ρ = e ψ ¯ γ ρ ψ + A ρ - σ ρ A σ .

Dessas decorrem as equações do movimento

(179) ( i - m ) ψ = - e A ψ , ψ ¯ ( i + m ) = e ψ ¯ A , σ F σ ρ = - e ψ ¯ γ ρ ψ .

A corrente de Nöther associada à simetria de calibre pode ser encontrada por aplicação direta do primeiro teorema. Contudo, resulta mais fácil aplicar as equações de descida. Reconhecendo das variações dos campos, por comparação com a Eq. (100), que

(180) a ψ = i ψ , a ψ ¯ = - i ψ ¯ , a A μ = 0 ; b ψ = 0 , b ψ ¯ = 0 , b A μ = 1 e ,

da Eq. (111) tem-se que o sistema de equações de descida começa com o tensor antissimétrico

(181) J ( 1 ) μ ρ = 1 e ( μ A ρ ) = - 1 e F μ ρ .

Aplicando então a Eq. (114):

(182) j μ = ρ J ( 1 ) ρ μ = - 1 e ρ F ρ μ .

Finalmente, como as equações de descida se satisfazem sob o cumprimento das equações do movimento, podemos susbtituir aqui a Eq. (179), do qual obtemos

(183) j μ = ψ ¯ γ μ ψ , μ j μ = 0 .

A equação de continuidade é consequência da Eq. (115). Com as Eqs. (176)–(178) e (180) é também possível escrever a tese do segundo teorema de Nöther, que, após simplificação, se iguala a

(184) μ ρ F ρ μ = 0 .

Integrando esta equação num volume Ω4 e aplicando o teorema de Ostrogradskii-Gauss,

(185) Ω d σ μ ρ F ρ μ = 0 Ω d σ μ j μ = 0 ,

em que a segunda equação foi obtida usando as equações do movimento. Essa é, pois, a lei integral de conservação da corrente jμ.

§ Tensor canônico de energia-momento: Ao ser aplicada uma translação espaço-temporal por um vetor constante, as transformações das coordenadas e campos são as seguintes:

(186) Δ x μ = ε μ , Δ ψ = - ε μ μ ψ , Δ ψ ¯ = - ε μ μ ψ ¯ , Δ A σ = - ε μ μ A σ .

Com o uso dessas e da densidade lagrangiana da Eq. (175) é possível verificar, por cálculo direto, que é satisfeita a equação diferencial de Lie, Eq. (9), o que significa que a translação pelo vetor constante representa uma simetria da eletrodinâmica fermiônica. Logo, como indicado pela Eq. (44), a corrente de Nöther associada é o tensor canônico de energia-momento

(187) Θ = ρ μ ( μ ψ ) ρ ψ + ρ ψ ¯ ( μ ψ ¯ ) + ( μ A σ ) ρ A σ - δ ρ μ = ( Θ ψ ) + ρ μ ( Θ A ) + ρ μ ( Θ int ) , ρ μ

com os tensores canônicos de energia-momento do campo fermiônico, do eletromagnético e o de interação dados, respectivamente, pelas expressões

(188) ( Θ ψ ) = ρ μ i 2 ψ ¯ γ μ ρ ψ - i 2 ψ ¯ ψ δ ρ μ + m ψ ¯ ψ δ ρ μ ,
(189) ( Θ A ) = ρ μ - F μ σ ρ A σ + 1 4 F λ τ F λ τ δ ρ μ ,
(190) ( Θ int ) = ρ μ - e A σ ψ ¯ γ σ ψ δ ρ μ .

Sob transformações de calibre esses tensores possuem as seguintes variações:

(191) Δ ( Θ ψ ) = ρ μ - ψ ¯ γ μ ψ ρ α + ψ ¯ γ σ ψ σ α δ ρ μ ,
(192) Δ ( Θ A ) = ρ μ - 1 e F μ σ ρ σ α ,
(193) Δ ( Θ int ) = ρ μ - ψ ¯ γ σ ψ σ α δ ρ μ .

Assim, sob transformações de calibre o tensor canônico de energia-momento completo tem variação

(194) Δ Θ = ρ μ - ψ ¯ γ μ ψ ρ α - 1 e F μ σ ρ σ α 0 .

Como pode-se ver, os termos que não permitem a Θρμ ser invariante de calibre provêm dos termos não simétricos nos índices μ e ρ de (Θψ)ρμ e (ΘA)ρμ. Contudo, isso não representa dificuldade alguma para a escrituração das leis de conservação, pois, usando a regra de derivação de um produto, é possível escrever a Eq. (194) como

(195) Δ Θ = ρ μ { - ψ ¯ γ μ ψ - 1 e σ F σ μ } ρ α - σ ( 1 e F μ σ ρ α ) .

Ora, o termo entre chaves é nulo sob o cumprimento das equações do movimento – as quais são, por outro lado, essenciais para escrever as leis de conservação, como decorre do primeiro teorema de Nöther –, Eq. (179). Destarte, a variação de calibre do tensor canônico de energia-momento reduz-se a uma divergência, a qual não tem influência alguma na expressão das quantidades conservadas:

(196) P ρ = V Θ 0 ρ d 3 x ,

pois, sendo Fμσ antissimétrico, ter-se-á que

(197) Δ P ρ = V Δ Θ 0 ρ d 3 x = 1 e V σ ( F 0 σ ρ α ) d 3 x = 1 e V i ( F 0 i ρ α ) d 3 x ,

integral na qual já é possível aplicar o teorema de Ostrogradskii-Gauss para obter

(198) Δ P ρ = - 1 e V F 0 i ρ α d σ i ,

que é nula sob condições de fronteira (ou assintóticas) apropriadas.

É precisamente por esse argumento que ao tensor canônico de energia-momento pode ser adicionada a divergência σBρσμ de um tensor antissimétrico nos índices σ e μ: Sua presença não muda as quantidades conservadas. Este fato pode ser usado, por exemplo, para obter um tensor de energia-momento invariante de calibre. A Eq. (195) sugere que isto pode ser atingido escolhendo

(199) B = ρ σ μ F μ σ A ρ σ B = ρ σ μ σ ( F μ σ A ρ ) = e ψ ¯ γ μ ψ A ρ + F μ σ σ A ρ ,

em que a última igualdade foi obtida pelo uso das equações do movimento. Usando-as novamente, o novo tensor de energia-momento pode ser escrito como

(200) T = ρ μ ( i 2 ψ ¯ γ μ ρ ψ + e ψ ¯ γ μ ψ A ρ ) + F μ σ F σ ρ + 1 4 F λ τ F λ τ δ ρ μ ,

o qual é invariante de calibre, ΔT=ρμ0. Finalmente, este tensor ainda não é simétrico nos termos interparentéticos.

Nota-se que uma vez que as quantidades conservadas são invariantes de calibre, não haveria, em princípio, problema em ter um tensor de energia-momento não invariante de calibre e não simétrico. Tal ocorrência é problemática, entretanto, do ponto de vista da gravitação de Einstein, se se deseja interpretar o tensor Θρμ como a fonte do campo gravítico. Com efeito, se a fonte for dependente de calibre, o campo de gravidade a que daria lugar dependeria também da escolha das condições de calibre; isto já o remediamos passando ao tensor Tρμ. Além do mais, a mencionada fonte material da relatividade geral tem sua própria definição, segundo a qual é axiomaticamente simétrica14 14 Este argumento somente é válido para a teoria da gravitação de Einstein e generalizações dela em que a geometria efetiva do espaço-tempo é pseudo-riemanniana. Em teorias como a de Einstein-Cartan (ou, vista como uma teoria de campos de calibre associada ao grupo de Poincaré, a de Kibble-Sciama), em que o espaço-tempo pode ter torsão não nula, o tensor de energia-momento que é fonte do campo gravítico não é, em geral, simétrico. Por outro lado, o uso de fontes gravitacionais fermiônicas apresenta uma dificuldade adicional: O tensor de energia-momento calculado no formalismo das tétradas – o que é essencial para poder abordar a teoria (geométrica) em presença de férmions – é em geral não simétrico; isto estabelece uma relação geral entre o spin da matéria e a torsão do espaço-tempo, visível nas equações do movimento de Einstein-Cartan-Kibble-Sciama. Na teoria de relatividade geral, tal dificuldade é superada simplesmente definindo como a fonte do campo gravitacional a parte simétrica do tensor obtido [23]. . O método que permite obter um tensor de energia-momento simétrico é o método de Belinfante e Rosenfeld, que se baseia nos argumentos prévios para definir

(201) T μ ν := Θ μ ν + ρ B ρ μ ν , B ρ μ ν = 1 2 ( S ρ μ ν + S μ ν ρ + S ν μ ρ ) ,

com Sμνρ o «tensor do spin de posto 3», definido como a parte explicitamente independente das coordenadas da corrente de Nöther associada à invariância sob transformações de Lorentz,

(202) y μ = x μ + ω μ ν x ν , v ( y ) = u ( x ) + 1 2 ω μ ν ( U μ ν u ) ( x ) ,

que para teorias da primeira ordem se lê

(203) S = ν α μ ( μ u ) ( U ν α u ) .

Este método, não obstante eficaz quando aplicado a teorias livres ou em interação para sistemas fechados, não consegue simetrizar o tensor de energia-momento de uma teoria de calibre em interação geral quando a dinâmica de alguns dos campos é desconsiderada [24[24] G. Grensing, Structural Aspects of Quantum Field Theory. Vol. 1 (World Scientific, Singapore, 2013).]. Vejamos, pois, para compreender o assim mencionado, mais em detalhe o procedimento de Belinfante-Rosenfeld e apliquemo-lo ao campo de Dirac, tanto livre como em interação.

9. Procedimento de Belinfante-Rosenfeld

Comecemos por determinar, de forma geral, as correntes de Nöther associadas à invariância (global) da ação sob transformações do grupo (ortócrono e próprio) de Lorentz. Denotando por ωμν=-ωνμ os seis parâmetros do grupo, as coordenadas e campos transformam-se segundo a Eq. (202).

§ Álgebra do grupo de Lorentz: A álgebra do grupo de Lorentz pode ser encontrada da seguinte maneira: consideremos duas transformações de Lorentz infinitesimais, Λ1 e Λ2, respectivamente caracterizadas pelos parâmetros ω1μν e ω2ρσ. A aplicação sucessiva de Λ1 seguida da de Λ2, leva às transformações das coordenadas e campos segundo

(204) z μ = x μ + ( ω 1 μ ρ + ω 2 μ ρ + ω 2 μ ν ω ) 1 ν ρ x ρ ,
(205) w ( z ) = u ( x ) + 1 2 ( ω 1 μ ν + ω 2 μ ν ) ( U μ ν u ) ( x ) + 1 4 ω 1 μ ν ω 2 ρ σ ( U ρ σ U μ ν u ) ( x ) .

A aplicação na ordem inversa, isto é, de Λ2 primeiro e Λ1 depois, leva a

(206) z μ = x μ + ( ω 1 μ ρ + ω 2 μ ρ + ω 1 μ ν ω ) 2 ν ρ x ρ + ,
(207) w ( z ) = u ( x ) + 1 2 ( ω 1 μ ν + ω 2 μ ν ) ( U μ ν u ) ( x ) + 1 4 ω 1 μ ν ω 2 ρ σ ( U μ ν U ρ σ u ) ( x ) .

Porém, segundo a Eq. (204), a transformação Λ2Λ1 que leva ao campo w(z) da Eq. (205) é uma transformação de Lorentz caracterizada pelos parâmetros ω1μρ+ω2μρ+ω2μνω1νρ, de modo que poder-se-ia também escrever

(208) w ( z ) = u ( x ) + 1 2 ( ω 1 λ τ + ω 2 λ τ + ω 2 λ η ω ) 1 η τ ( U λ τ u ) ( x ) .

E, semelhantemente, por graça da Eq. (206), é possível escrever o campo w(z) como

(209) w ( z ) = u ( x ) + 1 2 ( ω 1 λ τ + ω 2 λ τ + ω 1 λ η ω ) 2 η τ ( U λ τ u ) ( x ) .

Portanto, a diferença w(z)-w(z) pode ser escrita quer usando as Eqs. (205) e (207), quer as Eqs. (208) e (209). Da igualdade de ambas possíveis expressões, obtém-se que

(210) 1 4 ( ω 1 μ ν ω 2 ρ σ ) ( [ U ρ σ ; U μ ν ] u ) ( x ) = 1 2 ( ω 2 λ η ω - 1 η τ ω 1 λ η ω ) 2 η τ ( U λ τ u ) ( x ) = 1 4 ω 1 μ ν ω 2 ρ σ ( { g μ σ U ρ ν - g ν σ U ρ μ - g ρ ν U μ σ + g ρ μ U ν σ } u ) ( x ) ,

do qual é imediato reconhecer que a álgebra de comutadores dos geradores Uμν é

(211) [ U ρ σ ; U μ ν ] = - g ρ ν U μ σ + g ρ μ U ν σ - g σ ν U ρ μ + g σ μ U ρ ν ,

que é a álgebra do grupo de Lorentz.

§ Tensor do momento angular: Suponhamos que a funcional da ação 𝒜 de um conjunto de campos u é invariante sob as transformações de Lorentz acima descritas. Escrevendo a(λτ), substituindo as relações

(212) δ u = 1 2 ω λ τ ( U λ τ u ) , Δ x μ = 1 2 ω λ τ ( X λ τ x ) ρ ( X λ τ x ) ρ = δ λ ρ x τ - δ τ ρ x λ

na Eq. (29), que é a expressão do primeiro teorema de Nöther, teremos que

(213) δ 𝒜 δ u [ ( U λ τ u ) - ( λ u x τ - τ u x λ ) ] = μ { ( Θ μ λ x τ Θ μ τ x λ ) - ( 𝒫 ( μ u ) - ν 𝒫 ( μ ν u ) ) ( U λ τ u ) - 𝒫 ( μ ν u ) [ ν ( U λ τ u ) - ( λ u g ν τ - τ u g ν λ ) ] } .

De forma que, sob o cumprimento das equações do movimento, obter-se-á a lei de continuidade do «tensor do momento angular de posto 3»:

(214) μ M μ λ τ = 0 , M μ λ τ : = ( Θ μ λ x τ Θ μ τ x λ ) + S μ λ τ ,

com o «tensor do spin de posto 3»

(215) S := λ τ μ ( 𝒫 ( μ u ) - ν 𝒫 ( μ ν u ) ) ( U λ τ u ) + 𝒫 ( μ ν u ) [ ν ( U λ τ u ) - ( λ u g ν τ - τ u g ν λ ) ] .

Da lei de continuidade para Mλτμ, aplicando a divergência a seus termos e usando a lei de continuidade para o tensor canônico de energia-momento – sob a suposição, é claro, de que o sistema exibe também a invariância sob translações –, encontra-se que

(216) μ M = λ τ μ - ( Θ τ λ - Θ λ τ ) + μ S λ τ μ μ S = λ τ μ Θ τ λ - Θ λ τ ,

e assim o tensor de spin será, ele mesmo, separadamente conservado se e somente se o tensor canônico de energia-momento for simétrico. Ou, dito de outro modo, sempre que a divergência do tensor de spin for diferente de zero, o tensor canônico de energia-momento não poderá ser simétrico.

Consideremos agora uma modificação do tipo

(217) T τ λ = Θ τ λ + ρ B , τ λ ρ B ρ τ λ = - B τ ρ λ .

Como já provamos, as quantidades conservadas associadas a Tτλ e Θτλ são as mesmas. Isolando da equação anterior Θτλ=Tτλ-ρBτλρ e substituindo na Eq. (214),

(218) M μ λ τ = T μ τ x λ T μ λ x τ + x τ ρ B ρ μ λ x λ ρ B ρ μ τ + S μ λ τ = T μ τ x λ T μ λ x τ + S μ λ τ ( B μ λ τ B μ λ τ ) + p ( x τ B p μ λ x λ B p μ λ ) .

Definindo o tensor modificado do momento angular de posto 3 como

(219) J := λ τ μ M - λ τ μ ρ ( x τ B - λ ρ μ x λ B ) τ ρ μ ,

que leva às mesmas quantidades conservadas que o original pelo mesmo argumento que o apresentado para o tensor modificado da energia-momento, e introduzindo-o na Eq. (218), obtemos

(220) J μ λ τ = T μ τ x λ T μ λ x τ + S μ λ τ ( B μ λ τ B μ τ λ ) .

Se, finalmente, exigirmos que o tensor Bλτμ seja de tal forma a satisfazer à relação

(221) S = λ τ μ B - λ τ μ B , τ λ μ

então obteremos que o tensor modificado do momento angular é exatamente o momento do tensor modificado de energia-momento, condição essa que define univocamente o tensor de energia-momento [22[22] L.D. Landau e E.M. Lifshitz, Teoría clásica de los campos. Volumen 2 del Curso de Física Teórica (Editorial Reverté, Barcelona, 1992), 2 ed.]

(222) J u λ τ = T μ τ x λ T μ λ x τ .

Sendo assim, a lei de continuidade para Jλτμ implica imediatamente a simetria de Tλτ:

(223) μ J = λ τ μ 0 T λ τ = T τ λ .

Finalizando, a Eq. (221) permite encontrar explicitamente o tensor Bλτμ: Efetuando permutações cíclicas nos índices da citada equação e somando ou subtraindo os termos convenientemente, é possível isolar

(224) B μ τ λ = 1 2 ( S μ τ λ + S τ λ μ - S λ μ τ ) ,

que é exatamente a Eq. (201) – levando em consideração a antissimetria de S nos seus últimos dois índices. Esta argumentação prova, assim, que o procedimento de Belinfante-Rosenfeld permite a simetrização do tensor da energia-momento também para teorias da segunda ordem.

9.1. Tensor simétrico da energia-momento do campo de Dirac livre

O tensor canônico da energia-momento do campo de Dirac livre, calculado diretamente a partir da densidade lagrangiana da Eq. (164), é

(225) Θ = ρ μ i 2 ψ ¯ γ μ ρ ψ - ψ ¯ ( i 2 - m ) ψ δ ρ μ .

Sob o cumprimento das equações do movimento livres – e somente das livres, pois em interação as equações do movimento são outras e o tensor de energia-momento adota uma forma diferente [vide a subseção9.2 9.2. Aplicação do método deBelinfante-Rosenfeld à eletrodinâmicafermiônica Para terminar essa seção, desejamos ainda aplicar o procedimento de Belinfante-Rosenfeld à eletrodinâmica fermiônica, com a finalidade de determinar sob quais circunstâncias o mencionado método não tem sucesso em simetrizar o tensor da energia-momento, assim como os motivos pelos quais isso ocorre. Para começar, o tensor canônico de energia-momento para a eletrodinâmica fermiônica, dado nas Eqs. (187)–(190), se reduz, sob o cumprimento das equações do movimento [Eq. (179)], à forma (242) Θ μ ⁢ ρ = i 2 ⁢ ψ ¯ ⁢ γ μ ⁢ ∂ ↔ ρ ⁢ ψ - F μ ⁢ σ ⁢ ∂ ρ ⁡ A σ + 1 4 ⁢ F λ ⁢ τ ⁢ F λ ⁢ τ ⁢ g μ ⁢ ρ . Por outro lado, como já conhecemos os geradores do grupo de Lorentz que agem sobre os campos de Dirac [Eq. (232)], que passaremos a denotar por Uλ⁢τψ, enquanto que para o campo eletromagnético são (243) A ′ ⁣ μ = ( δ ν μ + ω ) ν μ A ν = [ δ ν μ + 1 2 ω λ ⁢ τ ( U λ ⁢ τ A ) ] ν μ A ν ⇒ ( U λ ⁢ τ A ) = ν μ δ λ μ g τ ⁢ ν - δ τ μ g λ ⁢ ν , podemos calcular o tensor do spin de posto 3, (244) S μ τ λ = ∂ ℒ ∂ ( ∂ μ ψ ) ( U τ λ ψ ψ ) − ( ψ ¯ U τ λ ψ ) ∂ ℒ ∂ ( ∂ μ ψ ¯ ) + ∂ ℒ ∂ ( ∂ μ A ρ ) ( U τ λ A ) A σ ρ σ , com ℒ a densidade lagrangiana da Eq. (175). Obtém-se (245) S = τ ⁢ λ μ ( S ψ ) + τ ⁢ λ μ ( S A ) , τ ⁢ λ μ com (Sψ)τ⁢λμ a parte provinda dos termos em ℒ que correspondem à densidade lagrangiana do campo de Dirac, e dado na Eq. (235), e (246) ( S A ) μ τ λ = − F μ τ A λ + F μ λ A τ a provinda dos termos correspondentes à densidade lagrangiana de Maxwell. Além disso, note-se que a separação feita é possível devido a que o tensor do spin depende exclusivamente dos termos derivativos na densidade lagrangiana – vide a Eq. (244) –, sendo que o termo de interação não possui derivada em relação a campo algum16. Prosseguindo com o método de Belinfante-Rosenfeld, o tensor Bμ⁢τ⁢λ cuja divergência há de adicionar-se ao tensor canônico de energia-momento é calculado pela Eq. (224): (247) B μ ⁢ τ ⁢ λ = ( B ψ ) μ ⁢ τ ⁢ λ + ( B A ) μ ⁢ τ ⁢ λ , com (Bψ)μ⁢τ⁢λ obtido pelas Eqs. (236) e (238): (248) ( B ψ ) μ ⁢ τ ⁢ λ = i 8 ⁢ ψ ¯ ⁢ ( γ τ ⁢ γ λ ⁢ γ μ - γ μ ⁢ γ λ ⁢ γ τ ) ⁢ ψ , e (249) ( B A ) μ ⁢ τ ⁢ λ = - F μ ⁢ τ ⁢ A λ . A divergência desses tensores são, um dado pela Eq. (239), o outro (250) ∂ μ ( B A ) μ ⁢ τ ⁢ λ = - ∂ μ F μ ⁢ τ A λ - F μ ⁢ τ ∂ μ A λ . Deste modo, o tensor de energia-momento de Belinfante-Rosenfeld é (251) T τ λ = i 4 ψ ¯ ( γ λ ∂ ↔ τ + γ τ ∂ ↔ λ ) ψ + F τ σ F σ λ + 1 4 F ρ σ F ρ σ g τ λ + i 8 ψ ¯ ∂ ← [ γ τ ; γ λ ] ψ + i 8 ψ ¯ [ γ τ ; γ λ ] ∂ ψ − ∂ σ F σ τ A λ . A primeira linha dessa equação, reconhecemos, é a soma dos tensores simetrizados de energia-momento dos campos de Dirac e eletromagnético livres; para tais campos, precisamente, os termos da segunda linha se anulariam por virtude das equações do movimento livres. Como, entretanto, os campos agora estão em interação [Eq. (179)], as equações do movimento não anulam os mencionados termos. Dessa vez temos de substituir: i⁢⁢ψ=m⁢ψ-e⁢⁢A⁢ψ, i⁢ψ¯⁢⁢∂←=-m⁢ψ¯+e⁢ψ¯⁢⁢A e ∂σ⁡Fσ⁢τ=-e⁢ψ¯⁢γρ⁢ψ, do que resulta (252) i 8 ⁢ ψ ¯ ⁢ ⁢ ∂ ← ⁢ [ γ τ ; γ λ ] ⁢ ψ + i 8 ⁢ ψ ¯ ⁢ [ γ τ ; γ λ ] ⁢ ⁢ ∂ ⁡ ψ = 1 2 ⁢ e ⁢ ψ ¯ ⁢ ( A τ ⁢ γ λ - A λ ⁢ γ τ ) ⁢ ψ , e (253) - ∂ σ ⁡ F σ ⁢ τ ⁢ A λ = e ⁢ ψ ¯ ⁢ γ τ ⁢ A λ ⁢ ψ . Daqui vê-se que, já que nenhuma das Eqs. (252) ou (253) é simétrica, se decidíssemos calcular o tensor de energia-momento para o campo de Dirac em interação, sem considerar os termos livres do campo eletromagnético, ou vice-versa, o procedimento de Belinfante-Rosenfeld não derivaria em um tensor simétrico. A explicação é simples: Como o tensor do spin de posto 3 não é afetado pelo termo de interação, o tensor Bμ⁢τ⁢λ é insensível à presença de tal termo, sendo que, por outro lado, as equações do movimento são outras. A soma completa, finalmente, é (254) T τ ⁢ λ = i 4 ⁢ ψ ¯ ⁢ ( γ λ ⁢ ∂ ↔ τ + γ τ ⁢ ∂ ↔ λ ) ⁢ ψ + F τ ⁢ σ ⁢ F σ ⁢ λ + 1 4 ⁢ F ρ ⁢ σ ⁢ F ρ ⁢ σ ⁢ g τ ⁢ λ + 1 2 ⁢ e ⁢ ψ ¯ ⁢ ( A τ ⁢ γ λ + A λ ⁢ γ τ ) ⁢ ψ . Assim, o procedimento de Belinfante-Rosenfeld leva, sim, a um tensor de energia-momento simétrico para o sistema fechado, como esperado pelo desenvolvimento teórico anteriormente mostrado. ] –,

(226) Θ = ρ μ i 2 ψ ¯ γ μ ρ ψ .

Como este tensor não é simétrico, aplicar-lhe-emos o método de Belinfante-Rosenfeld, para o qual precisamos calcular o tensor do spin, e ainda antes desse, precisamos conhecer os geradores do grupo de Lorentz na representação que age sobre os campos de Dirac.

§ Geradores do grupo de Lorentz: Determinaremos quais são os geradores Uλτ do grupo de Lorentz que agem sobre os campos de Dirac fazendo uso do fato que a transformação S(Λ) satisfaz à seguinte relação:

(227) S ( Λ ) 1 γ μ S ( Λ ) = Λ μ ν γ ν ,

a qual é condição necessária e suficiente para que o termo bilinear envolvendo a derivada na densidade lagrangiana de Dirac seja invariante de Lorentz. Expandindo até termos da primeira ordem,

(228) S ( Λ ) = 1 + 1 2 ω ρ σ U ρ σ , Λ = ν μ δ ν μ + ω , ν μ

a Eq. (227) implica que

(229) γ μ + 1 2 ω ρ σ ( γ μ U ρ σ U ρ σ γ μ ) = γ μ + ω γ ν μ ν = γ μ + 1 2 ω ρ σ ( δ ρ μ g σ ν δ σ μ g ρ ν ) γ ν ,

do que decorre que

(230) [ γ μ ; U ρ σ ] = δ ρ μ γ σ - δ σ μ γ ρ .

Usando da álgebra de Clifford satisfeita pelas matrizes de Dirac para escrever δσμ=12{γμ;γσ} e analogamente para δρμ, obtém-se

(231) [ γ μ ; U ρ σ ] = 1 2 ( γ μ γ ρ γ σ + γ ρ γ μ γ σ γ μ γ σ γ ρ γ σ γ μ γ ρ ) = 1 2 [ γ μ ; [ γ ρ ; γ σ ] ] + ( δ σ μ γ ρ δ ρ μ γ σ ) = 1 2 [ γ μ ; [ γ ρ ; γ σ ] ] [ γ μ ; U ρ σ ]

E dessa equação já é possível identificar

(232) U ρ σ = 1 4 [ γ ρ ; γ σ ] .

§ Tensor do spin de posto 3: Substituindo as Eqs. (164) e (232) na Eq. (203), calculamos

(233) S μ τ λ = D ( μ ψ ) ( U τ λ ψ ) ( ψ ¯ U τ λ ) D ( μ ψ ¯ ) = i 8 ψ ¯ { γ μ ; [ γ τ ; γ λ ] } ψ .

Usando a álgebra das matrizes de Dirac, é possível provar que

(234) { γ μ ; [ γ τ ; γ λ ] } = 2 ( γ τ γ λ γ μ - γ μ γ λ γ τ ) ,

de modo que obtemos a forma final:

(235) S μ τ λ = i 4 ψ ¯ ( γ τ γ λ γ μ - γ μ γ λ γ τ ) ψ .

§ Tensor simétrico da energia-momento: Com o tensor do spin recém-calculado, passaremos a obter a forma simetrizada do tensor canônico da energia-momento. Para tal, devemos primeiramente calcular o tensor de Belinfante-Rosenfeld

(236) B μ τ λ = 1 2 ( S μ τ λ + S τ λ μ - S λ μ τ ) = i 8 ψ ¯ b μ τ λ ψ ,

com

(237) b μ τ λ = γ τ γ λ γ μ γ μ γ λ γ τ + γ λ γ μ γ τ γ τ γ μ γ λ γ μ γ τ γ λ + γ λ γ τ γ μ .

Fazendo uso repetido da álgebra das matrizes de Dirac, a expressão anterior pode ser simplificada em

(238) b μ τ λ = γ τ γ λ γ μ - γ μ γ λ γ τ .

Substituindo na Eq. (236), tomando a divergência em relação ao índice μ e usando a álgebra das matrizes de Dirac de forma a obter, sempre que for possível, derivadas contraídas com matrizes de Dirac,

(239) μ B μ τ λ = i 4 ψ ¯ ( γ λ τ - γ τ λ ) ψ + i 8 ψ ¯ [ γ τ ; γ λ ] ψ + i 8 ψ ¯ [ γ τ ; γ λ ] ψ .

Finalmente, usando as equações de Dirac para escrever iγμμψ=mψ e iμψ¯γμ=-mψ¯, os dois últimos termos da equação anterior se cancelam, e obtém-se

(240) μ B μ τ λ = i 4 ψ ¯ ( γ λ τ - γ τ λ ) ψ .

Assim, substituindo as Eqs. (226) e (240) na Eq. (201), obtemos o tensor simetrizado de energia-momento para o campo de Dirac livre:

(241) T τ λ = Θ τ λ + μ B μ τ λ = i 4 ψ ¯ ( γ τ λ + γ λ τ ) ψ .

Como podemos ver, ele resulta ser, simplesmente, a parte simétrica do tensor canônico de energia-momento. Essa é uma peculiaridade da teoria de Dirac, que se explica pelo fato do tensor do spin de posto 3 ser completamente antissimétrico; com efeito, tal característica implica, segundo a Eq. (216), que a parte antissimétrica do tensor canônico de energia-momento é proporcional à divergência de um tensor do tipo requerido para que as quantidades conservadas não mudem se tal divergência é removida. Por outro lado, como essa não é uma característica geral, o resultado não se aplica a outras teorias15 15 Note, além do mais, que o mencionado resultado não era previsível e, por isso, foi necessário fazer o cálculo do tensor do spin de posto 3 para o campo de Dirac livre. .

9.2. Aplicação do método deBelinfante-Rosenfeld à eletrodinâmicafermiônica

Para terminar essa seção, desejamos ainda aplicar o procedimento de Belinfante-Rosenfeld à eletrodinâmica fermiônica, com a finalidade de determinar sob quais circunstâncias o mencionado método não tem sucesso em simetrizar o tensor da energia-momento, assim como os motivos pelos quais isso ocorre.

Para começar, o tensor canônico de energia-momento para a eletrodinâmica fermiônica, dado nas Eqs. (187)–(190), se reduz, sob o cumprimento das equações do movimento [Eq. (179)], à forma

(242) Θ μ ρ = i 2 ψ ¯ γ μ ρ ψ - F μ σ ρ A σ + 1 4 F λ τ F λ τ g μ ρ .

Por outro lado, como já conhecemos os geradores do grupo de Lorentz que agem sobre os campos de Dirac [Eq. (232)], que passaremos a denotar por Uλτψ, enquanto que para o campo eletromagnético são

(243) A μ = ( δ ν μ + ω ) ν μ A ν = [ δ ν μ + 1 2 ω λ τ ( U λ τ A ) ] ν μ A ν ( U λ τ A ) = ν μ δ λ μ g τ ν - δ τ μ g λ ν ,

podemos calcular o tensor do spin de posto 3,

(244) S μ τ λ = ( μ ψ ) ( U τ λ ψ ψ ) ( ψ ¯ U τ λ ψ ) ( μ ψ ¯ ) + ( μ A ρ ) ( U τ λ A ) A σ ρ σ ,

com a densidade lagrangiana da Eq. (175). Obtém-se

(245) S = τ λ μ ( S ψ ) + τ λ μ ( S A ) , τ λ μ

com (Sψ)τλμ a parte provinda dos termos em que correspondem à densidade lagrangiana do campo de Dirac, e dado na Eq. (235), e

(246) ( S A ) μ τ λ = F μ τ A λ + F μ λ A τ

a provinda dos termos correspondentes à densidade lagrangiana de Maxwell. Além disso, note-se que a separação feita é possível devido a que o tensor do spin depende exclusivamente dos termos derivativos na densidade lagrangiana – vide a Eq. (244) –, sendo que o termo de interação não possui derivada em relação a campo algum16 16 Ainda no caso geral, embora seja possível que apareçam derivadas do campo de matéria no termo de interação, não aparecerá jamais a derivada do campo de calibre, se o acoplamento é mínimo (tal condição é, verdadeiramente, a própria definição das palavras «acoplamento mínimo»). . Prosseguindo com o método de Belinfante-Rosenfeld, o tensor Bμτλ cuja divergência há de adicionar-se ao tensor canônico de energia-momento é calculado pela Eq. (224):

(247) B μ τ λ = ( B ψ ) μ τ λ + ( B A ) μ τ λ ,

com (Bψ)μτλ obtido pelas Eqs. (236) e (238):

(248) ( B ψ ) μ τ λ = i 8 ψ ¯ ( γ τ γ λ γ μ - γ μ γ λ γ τ ) ψ ,

e

(249) ( B A ) μ τ λ = - F μ τ A λ .

A divergência desses tensores são, um dado pela Eq. (239), o outro

(250) μ ( B A ) μ τ λ = - μ F μ τ A λ - F μ τ μ A λ .

Deste modo, o tensor de energia-momento de Belinfante-Rosenfeld é

(251) T τ λ = i 4 ψ ¯ ( γ λ τ + γ τ λ ) ψ + F τ σ F σ λ + 1 4 F ρ σ F ρ σ g τ λ + i 8 ψ ¯ [ γ τ ; γ λ ] ψ + i 8 ψ ¯ [ γ τ ; γ λ ] ψ σ F σ τ A λ .

A primeira linha dessa equação, reconhecemos, é a soma dos tensores simetrizados de energia-momento dos campos de Dirac e eletromagnético livres; para tais campos, precisamente, os termos da segunda linha se anulariam por virtude das equações do movimento livres. Como, entretanto, os campos agora estão em interação [Eq. (179)], as equações do movimento não anulam os mencionados termos. Dessa vez temos de substituir: iψ=mψ-eAψ, iψ¯=-mψ¯+eψ¯A e σFστ=-eψ¯γρψ, do que resulta

(252) i 8 ψ ¯ [ γ τ ; γ λ ] ψ + i 8 ψ ¯ [ γ τ ; γ λ ] ψ = 1 2 e ψ ¯ ( A τ γ λ - A λ γ τ ) ψ ,

e

(253) - σ F σ τ A λ = e ψ ¯ γ τ A λ ψ .

Daqui vê-se que, já que nenhuma das Eqs. (252) ou (253) é simétrica, se decidíssemos calcular o tensor de energia-momento para o campo de Dirac em interação, sem considerar os termos livres do campo eletromagnético, ou vice-versa, o procedimento de Belinfante-Rosenfeld não derivaria em um tensor simétrico. A explicação é simples: Como o tensor do spin de posto 3 não é afetado pelo termo de interação, o tensor Bμτλ é insensível à presença de tal termo, sendo que, por outro lado, as equações do movimento são outras. A soma completa, finalmente, é

(254) T τ λ = i 4 ψ ¯ ( γ λ τ + γ τ λ ) ψ + F τ σ F σ λ + 1 4 F ρ σ F ρ σ g τ λ + 1 2 e ψ ¯ ( A τ γ λ + A λ γ τ ) ψ .

Assim, o procedimento de Belinfante-Rosenfeld leva, sim, a um tensor de energia-momento simétrico para o sistema fechado, como esperado pelo desenvolvimento teórico anteriormente mostrado.

10. Eletrodinâmica de Podolsky

Esta seção, dedicada à eletrodinâmica de Podolsky, nos permitirá mostrar a grande variabilidade dos procedimentos que podem ser usados em conjunção com os teoremas de Nöther, permitindo visualizar seu alcance e possibilidades. A teoria de Podolsky pode ser construída como uma teoria de calibre livre da segunda ordem.

§ Densidade lagrangiana de Podolsky: Se, diferentemente ao suposto na seção8 8. Eletrodinâmica de Maxwell Nesta seção estudaremos as consequências dos teoremas de Nöther na eletrodinâmica de Maxwell, considerando o campo de Dirac como o campo de matéria. § Construção da teoria: O campo de Dirac possui a seguinte densidade lagrangiana livre: (164) ℒ D = ψ ¯ ( i 2 ∂ ↔ − m ) ψ , da qual se derivam as equações do movimento (165) ( i ∂ − m ) ψ = 0 ∧ ψ ¯ ( i ∂ ← + m ) = 0 É imediato reconhecer que a densidade lagrangiana da Eq. (164) é invariante perante as transformações de fase (166) ψ → e i ⁢ α ⁢ ψ , ψ ¯ → e - i ⁢ α ⁢ ψ ¯ , com α∈ℝ, que constituem o grupo U(1). Essa invariância de calibre global pode ser localizada fazendo uso da prescrição do acoplamento mínimo de Utiyama, analogamente ao que foi realizado no modelo mecânico estudado anteriormente: Introduzindo um campo de calibre Aμ, com a lei de transformação local (167) Δ ⁢ A μ ⁢ ( x ) = 1 e ⁢ ∂ μ ⁡ α ⁢ ( x ) , e substituindo em ℒD as derivadas ordinárias dos campos pelas derivadas covariantes, (168) D μ ⁢ ψ := ∂ μ ⁡ ψ - i ⁢ e ⁢ A μ ⁢ ψ , D μ ⁢ ψ ¯ := ∂ μ ⁡ ψ ¯ + i ⁢ e ⁢ A μ ⁢ ψ ¯ , obtém-se a densidade lagrangiana de matéria e interação (169) ℒ D + i n t = ψ ¯ ( i 2 D ↔ − m ) ψ = ψ ¯ ( i 2 ∂ ↔ − m ) ψ + e A μ ψ ¯ γ μ ψ . Como no caso mecânico, devemos ainda examinar a possibilidade de estabelecer uma densidade lagrangiana para o campo de calibre Aμ, a qual deverá ser, forçosamente, invariante de calibre local – e, como consequência, também global. Suponhamos, pois, que a tal densidade lagrangiana seja da primeira ordem: ℒA=ℒA⁢(A;∂⁡A). Sua variação é (170) Δ ℒ A = ∂ ℒ A ∂ A μ Δ A μ + ∂ ℒ A ∂ ( ∂ ν A μ ) ∂ ν Δ A μ = 1 e ∂ ℒ A ∂ A μ ∂ μ α + 1 2 e ( ∂ ℒ A ∂ ( ∂ ν A μ ) + ∂ ℒ A ∂ ( ∂ μ A ν ) ) ∂ μ ∂ ν α . A condição de nulidade de ℒA implica então, devido à independência entre ∂⁡α e ∂⁡∂⁡α, que: (1) O campo de calibre é não massivo, pois (171) ∂ ⁡ ℒ A ∂ ⁡ A μ = 0 , e que (2) ℒA é função somente do «tensor de Faraday» (172) F μ ⁢ ν := ∂ μ ⁡ A ν - ∂ ν ⁡ A μ , pois (173) ∂ ⁡ ℒ A ∂ ⁡ ( ∂ ν ⁡ A μ ) + ∂ ⁡ ℒ A ∂ ⁡ ( ∂ μ ⁡ A ν ) = 0 . A densidade lagrangiana mais simples que pode ser construída satisfazendo essas características é a conhecida densidade lagrangiana da eletrodinâmica de Maxwell: (174) ℒ A = - 1 4 ⁢ F μ ⁢ ν ⁢ F μ ⁢ ν . Pelos motivos assim expostos, a densidade lagrangiana completa da eletrodinâmica fermiônica de Maxwell é (175) ℒ = ψ ¯ ( i 2 ∂ ↔ − m ) ψ + e A μ ψ ¯ γ μ ψ − 1 4 F μ ν F μ ν . E, por construção, é invariante de calibre pelo grupo U(1) localizado. § Equações do movimento e segundo teorema de Nöther: As derivadas funcionais da ação em relação aos três campos participantes são (176) δ ⁢ 𝒜 δ ⁢ ψ = - ψ ¯ ⁢ ( i ⁢ ⁢ ∂ ← + m ) + e ⁢ ψ ¯ ⁢ ⁢ A , (177) δ ⁢ 𝒜 δ ⁢ ψ ¯ = ( i ⁢ ⁢ ∂ - m ) ⁢ ψ + e ⁢ ⁢ A ⁢ ψ , (178) δ ⁢ 𝒜 δ ⁢ A ρ = e ⁢ ψ ¯ ⁢ γ ρ ⁢ ψ + ∂ σ ⁡ F σ ⁢ ρ = e ⁢ ψ ¯ ⁢ γ ρ ⁢ ψ + □ ⁢ A ρ - ∂ σ ⁡ ∂ ρ ⁡ A σ . Dessas decorrem as equações do movimento (179) ( i ⁢ ⁢ ∂ - m ) ⁢ ψ = - e ⁢ ⁢ A ⁢ ψ , ψ ¯ ⁢ ( i ⁢ ⁢ ∂ ← + m ) = e ⁢ ψ ¯ ⁢ ⁢ A , ∂ σ ⁡ F σ ⁢ ρ = - e ⁢ ψ ¯ ⁢ γ ρ ⁢ ψ . A corrente de Nöther associada à simetria de calibre pode ser encontrada por aplicação direta do primeiro teorema. Contudo, resulta mais fácil aplicar as equações de descida. Reconhecendo das variações dos campos, por comparação com a Eq. (100), que (180) a ψ = i ⁢ ψ , a ψ ¯ = - i ⁢ ψ ¯ , a A μ = 0 ; b ψ = 0 , b ψ ¯ = 0 , b A μ = 1 e , da Eq. (111) tem-se que o sistema de equações de descida começa com o tensor antissimétrico (181) J ( 1 ) μ ⁢ ρ = 1 e ⁢ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ A ρ ) = - 1 e ⁢ F μ ⁢ ρ . Aplicando então a Eq. (114): (182) j μ = ∂ ρ ⁡ J ( 1 ) ρ ⁢ μ = - 1 e ⁢ ∂ ρ ⁡ F ρ ⁢ μ . Finalmente, como as equações de descida se satisfazem sob o cumprimento das equações do movimento, podemos susbtituir aqui a Eq. (179), do qual obtemos (183) j μ = ψ ¯ ⁢ γ μ ⁢ ψ , ∂ μ ⁡ j μ = 0 . A equação de continuidade é consequência da Eq. (115). Com as Eqs. (176)–(178) e (180) é também possível escrever a tese do segundo teorema de Nöther, que, após simplificação, se iguala a (184) ∂ μ ⁡ ∂ ρ ⁡ F ρ ⁢ μ = 0 . Integrando esta equação num volume Ω⊆ℝ4 e aplicando o teorema de Ostrogradskii-Gauss, (185) ∮ ∂ ⁡ Ω d σ μ ⁢ ∂ ρ ⁡ F ρ ⁢ μ = 0 ⇒ ∮ ∂ ⁡ Ω d σ μ ⁢ j μ = 0 , em que a segunda equação foi obtida usando as equações do movimento. Essa é, pois, a lei integral de conservação da corrente jμ. § Tensor canônico de energia-momento: Ao ser aplicada uma translação espaço-temporal por um vetor constante, as transformações das coordenadas e campos são as seguintes: (186) Δ ⁢ x μ = ε μ , Δ ⁢ ψ = - ε μ ⁢ ∂ μ ⁡ ψ , Δ ⁢ ψ ¯ = - ε μ ⁢ ∂ μ ⁡ ψ ¯ , Δ ⁢ A σ = - ε μ ⁢ ∂ μ ⁡ A σ . Com o uso dessas e da densidade lagrangiana da Eq. (175) é possível verificar, por cálculo direto, que é satisfeita a equação diferencial de Lie, Eq. (9), o que significa que a translação pelo vetor constante representa uma simetria da eletrodinâmica fermiônica. Logo, como indicado pela Eq. (44), a corrente de Nöther associada é o tensor canônico de energia-momento (187) Θ = ρ μ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ ψ ) ∂ ρ ψ + ∂ ρ ψ ¯ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ ψ ¯ ) + ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ A σ ) ⁢ ∂ ρ ⁡ A σ - ℒ ⁢ δ ρ μ = ( Θ ψ ) + ρ μ ( Θ A ) + ρ μ ( Θ int ) , ρ μ com os tensores canônicos de energia-momento do campo fermiônico, do eletromagnético e o de interação dados, respectivamente, pelas expressões (188) ( Θ ψ ) = ρ μ i 2 ψ ¯ γ μ ∂ ↔ ρ ψ - i 2 ψ ¯ ⁢ ∂ ↔ ψ δ ρ μ + m ψ ¯ ψ δ ρ μ , (189) ( Θ A ) = ρ μ - F μ ⁢ σ ∂ ρ A σ + 1 4 F λ ⁢ τ F λ ⁢ τ δ ρ μ , (190) ( Θ int ) = ρ μ - e A σ ψ ¯ γ σ ψ δ ρ μ . Sob transformações de calibre esses tensores possuem as seguintes variações: (191) Δ ( Θ ψ ) = ρ μ - ψ ¯ γ μ ψ ∂ ρ α + ψ ¯ γ σ ψ ∂ σ α δ ρ μ , (192) Δ ( Θ A ) = ρ μ - 1 e F μ ⁢ σ ∂ ρ ∂ σ α , (193) Δ ( Θ int ) = ρ μ - ψ ¯ γ σ ψ ∂ σ α δ ρ μ . Assim, sob transformações de calibre o tensor canônico de energia-momento completo tem variação (194) Δ Θ = ρ μ - ψ ¯ γ μ ψ ∂ ρ α - 1 e F μ ⁢ σ ∂ ρ ∂ σ α ≠ 0 . Como pode-se ver, os termos que não permitem a Θρμ ser invariante de calibre provêm dos termos não simétricos nos índices μ e ρ de (Θψ)ρμ e (ΘA)ρμ. Contudo, isso não representa dificuldade alguma para a escrituração das leis de conservação, pois, usando a regra de derivação de um produto, é possível escrever a Eq. (194) como (195) Δ Θ = ρ μ { - ψ ¯ γ μ ψ - 1 e ∂ σ F σ ⁢ μ } ∂ ρ α - ∂ σ ( 1 e F μ ⁢ σ ∂ ρ α ) . Ora, o termo entre chaves é nulo sob o cumprimento das equações do movimento – as quais são, por outro lado, essenciais para escrever as leis de conservação, como decorre do primeiro teorema de Nöther –, Eq. (179). Destarte, a variação de calibre do tensor canônico de energia-momento reduz-se a uma divergência, a qual não tem influência alguma na expressão das quantidades conservadas: (196) P ρ = ∫ ​ V Θ 0 ρ d 3 x , pois, sendo Fμ⁢σ antissimétrico, ter-se-á que (197) Δ P ρ = ∫ ​ V Δ Θ 0 ρ d 3 x = − 1 e ∫ ​ V ∂ σ ( F 0 σ ∂ ρ α ) d 3 x = − 1 e ∫ ​ V ∂ i ( F 0 i ∂ ρ α ) d 3 x , integral na qual já é possível aplicar o teorema de Ostrogradskii-Gauss para obter (198) Δ ⁢ P ρ = - 1 e ⁢ ∮ ∂ ⁡ V F 0 ⁢ i ⁢ ∂ ρ ⁡ α ⁢ d ⁢ σ i , que é nula sob condições de fronteira (ou assintóticas) apropriadas. É precisamente por esse argumento que ao tensor canônico de energia-momento pode ser adicionada a divergência ∂σBρσ⁢μ de um tensor antissimétrico nos índices σ e μ: Sua presença não muda as quantidades conservadas. Este fato pode ser usado, por exemplo, para obter um tensor de energia-momento invariante de calibre. A Eq. (195) sugere que isto pode ser atingido escolhendo (199) B = ρ σ ⁢ μ F μ ⁢ σ A ρ ⇒ ∂ σ B = ρ σ ⁢ μ ∂ σ ( F μ ⁢ σ A ρ ) = e ψ ¯ γ μ ψ A ρ + F μ ⁢ σ ∂ σ A ρ , em que a última igualdade foi obtida pelo uso das equações do movimento. Usando-as novamente, o novo tensor de energia-momento pode ser escrito como (200) T = ρ μ ( i 2 ψ ¯ γ μ ∂ ↔ ρ ψ + e ψ ¯ γ μ ψ A ρ ) + F μ ⁢ σ ⁢ F σ ⁢ ρ + 1 4 ⁢ F λ ⁢ τ ⁢ F λ ⁢ τ ⁢ δ ρ μ , o qual é invariante de calibre, ΔT=ρμ0. Finalmente, este tensor ainda não é simétrico nos termos interparentéticos. Nota-se que uma vez que as quantidades conservadas são invariantes de calibre, não haveria, em princípio, problema em ter um tensor de energia-momento não invariante de calibre e não simétrico. Tal ocorrência é problemática, entretanto, do ponto de vista da gravitação de Einstein, se se deseja interpretar o tensor Θρμ como a fonte do campo gravítico. Com efeito, se a fonte for dependente de calibre, o campo de gravidade a que daria lugar dependeria também da escolha das condições de calibre; isto já o remediamos passando ao tensor Tρμ. Além do mais, a mencionada fonte material da relatividade geral tem sua própria definição, segundo a qual é axiomaticamente simétrica14. O método que permite obter um tensor de energia-momento simétrico é o método de Belinfante e Rosenfeld, que se baseia nos argumentos prévios para definir (201) T μ ⁢ ν := Θ μ ⁢ ν + ∂ ρ ⁡ B ρ ⁢ μ ⁢ ν , B ρ ⁢ μ ⁢ ν = 1 2 ⁢ ( S ρ ⁢ μ ⁢ ν + S μ ⁢ ν ⁢ ρ + S ν ⁢ μ ⁢ ρ ) , com Sμ⁢ν⁢ρ o «tensor do spin de posto 3», definido como a parte explicitamente independente das coordenadas da corrente de Nöther associada à invariância sob transformações de Lorentz, (202) y μ = x μ + ω μ ⁢ ν ⁢ x ν , v ⁢ ( y ) = u ⁢ ( x ) + 1 2 ⁢ ω μ ⁢ ν ⁢ ( U μ ⁢ ν ⁢ u ) ⁢ ( x ) , que para teorias da primeira ordem se lê (203) S = ν ⁢ α μ ∂ ⁡ ℒ ∂ ⁡ ( ∂ μ ⁡ u ) ( U ν ⁢ α u ) . Este método, não obstante eficaz quando aplicado a teorias livres ou em interação para sistemas fechados, não consegue simetrizar o tensor de energia-momento de uma teoria de calibre em interação geral quando a dinâmica de alguns dos campos é desconsiderada [24]. Vejamos, pois, para compreender o assim mencionado, mais em detalhe o procedimento de Belinfante-Rosenfeld e apliquemo-lo ao campo de Dirac, tanto livre como em interação. , consideramos que a densidade lagrangiana do campo de calibre pode depender não só das derivadas desse de até a primeira ordem como também até a segunda17 17 A construção de teorias de calibre da segunda ordem, pelo método de Utiyama, para grupos de Lie de simetrias internas gerais, é apresentada na Ref. [25]. , A=A(A;A;A), então a variação sob uma transformação de calibre local será, em substituição da Eq. (170),

(255) Δ A = A A μ Δ A μ + A ( ν A μ ) ν Δ A μ + A ( ρ ν A μ ) ρ ν Δ A μ = 1 e A A μ μ α + 1 2 e ( A ( ν A μ ) + A ( μ A ν ) ) μ ν α + 1 3 e ( A ( ρ ν A μ ) + A ( ρ μ A ν ) + A ( μ ν A ρ ) ) ρ ν μ α .

Logo vemos que a condição de invariância deriva nas seguintes três relações:

(256) A A μ = 0 ,
(257) A ( ν A μ ) + A ( μ A ν ) = 0 ,
(258) A ( ρ ν A μ ) + A ( ρ μ A ν ) + A ( μ ν A ρ ) = 0 .

As duas primeiras já as conhecemos: Elas indicam, respectivamente, que o campo de calibre é não massivo e que a dependência da densidade lagrangiana com suas primeiras derivadas ocorre através do tensor de Faraday. A Eq. (258), finalmente, indica que a dependência com as segundas derivadas de Aμ acontece por meio do tensor

(259) G σ λ τ := σ λ A τ - σ τ A λ = σ F λ τ .

Uma densidade lagrangiana respeitando a esses requerimentos é a que descreve à «eletrodinâmica de Podolsky»:

(260) A = - 1 4 F μ ν F μ ν + a 2 2 ρ F μ ρ σ F μ σ ,

com o «parâmetro de Podolsky» a a ser determinado fenomenologicamente18 18 Por exemplo, na Ref. [26], seu valor é restringido a ser menor que 2,66×10-11 eV-1 pela comparação do cálculo do momento magnético anômalo do elétron à terceira ordem da série perturbativa (um loop ) com o valor experimental. . Se bem que outras densidades lagrangianas, igualmente quadráticas no tensor G, são possíveis, pode-se provar que todas elas se diferenciam da de Podolsky apenas por termos de superfície e portanto lhe são físicamente equivalentes. Isto permite estabelecer que o eletromagnetismo de Podolsky é a generalização do eletromagnetismo de Maxwell mais simples à segunda ordem.

§ Equações do movimento e segundo teorema de Nöther: Com a densidade lagrangiana da Eq. (260) calculamos as derivadas funcionais da ação:

(261) δ 𝒜 δ A σ = ( 1 + 2 a 2 ) μ F μ σ .

As equações do movimento são obtidas por igualação a zero da anterior derivada funcional; em função do campo de calibre Aμ,

(262) ( 1 + 2 a 2 ) ( A σ - σ ( A ) ) = 0 .

Por outro lado, para escrever a tese do segundo teorema de Nöther, notamos primeiramente, por comparação com a Eq. (100), que

(263) Δ A σ = 1 e σ α ( a σ ) = 0 , ( b σ ) ρ = 1 e δ σ ρ , ( c σ ) ρ τ = 0 .

Substituindo estes valores e a Eq. (261) na Eq. (104) obtém-se que

(264) ρ ( ( b σ ) ρ δ 𝒜 δ A σ ) = 0 ( 1 + 2 a 2 ) μ ρ F μ ρ = 0 ,

mesmo sem o cumprimento das equações do movimento. Já a lei de conservação que rege sob o cumprimento delas pode ser obtida pelo sistema de equações de descida, Eq. (114). Para estabelecê-lo, começamos calculando as quantidades (Aσ)μ e (Bσ)μν da Eq. (107):

(265) ( A σ ) μ = ( 1 + 2 a 2 ) F μ σ - a 2 σ ρ F μ ρ ,
(266) ( B σ ) μ ν = a 2 ( g μ σ ρ F ν ρ + g ν σ ρ F μ ρ - 2 g μ ν ρ F σ ρ ) .

Como (cσ)μν=0, o sistema de equações de descida começa com o tensor [vide a Eq. (112)]

(267) J ( 2 ) μ ν ρ = - ( B σ ) μ ρ ( b σ ) ν = - a 2 e ( g μ ν τ F ρ τ + g ρ ν τ F μ τ - 2 g μ ρ τ F ν τ ) .

Tomando sua divergência em relação ao índice μ, obtemos a seguinte corrente:

(268) J ( 1 ) ν ρ = μ J ( 2 ) μ ν ρ = - a 2 e τ ( ν F ρ τ - 2 ρ F ν τ ) .

Por divergência desta, finalmente, obtém-se a corrente conservada

(269) j ρ = ν J ( 1 ) ν ρ = - a 2 e ( τ F ρ τ ) = e.d.m. - 1 e μ F μ ρ .

Destarte, a lei de continuidade ρjρ=0 leva à equação

(270) μ ρ F μ ρ = 0 ,

que é a mesma equação obtida na eletrodinâmica de Maxwell, Eq. (184).

§ Tensor de energia-momento do campo de Podolsky: A fórmula geral para o tensor de energia-momento de uma teoria da segunda ordem aparece na Eq. (16). Em função das quantidades (Aσ)μ e (Bσ)μν,

(271) Θ μ ρ = - g μ ρ - ( A σ ) μ ρ A σ + ( B σ ) μ ν ρ ν A σ .

Com a densidade lagrangiana de Podolsky e as Eqs. (265) e (266), o cálculo direto permite encontrar, após simplificação,

(272) Θ μ ρ = 1 4 F λ τ F λ τ g μ ρ - a 2 2 σ F λ σ τ F λ τ g μ ρ - ( 1 + 2 a 2 ) F μ σ ρ A σ + a 2 ( λ F σ λ ρ F - σ μ λ F σ λ μ ρ A σ ) + σ ( a 2 λ F μ λ ρ A σ ) .

É evidente que, tomando o limite a20 a equação anterior corresponde ao tensor canônico de energia-momento do campo de Maxwell, Eq. (189). Além do mais, nota-se que o último termo, embora seja uma divergência, não pode ser desconsiderado, pois o tensor entre os parênteses não é antissimétrico nos índices σ e μ, e por isso pode, sim, ter contribuição para as componentes do vetor de energia-momento. Apesar de Θμρ não ser invariante de calibre, quando uma destas transformações é aplicada, a variação do mencionado tensor é, sob o cumprimento das equações do movimento,

(273) Δ Θ μ ρ = 1 e σ { - ( 1 + 2 a 2 ) F μ σ ρ α + a 2 λ F μ λ ρ σ α - a 2 λ F σ λ ρ μ α } ,

ou seja, igual à divergência, em relação ao índice σ, de um tensor antissimétrico em seus índices σ e μ. Como consequência, o vetor de energia-momento, que são as quantidades conservadas sob condições assintóticas apropriadas, são invariantes de calibre.

Como o tensor encontrado não é simétrico, para simetrizá-lo precisaremos aplicar o procedimento de Belinfante-Rosenfeld, o qual começa com o cálculo do tensor do spin, que para a teoria da segunda ordem, tem a expressão mostrada na Eq. (215). Em função das quantidades (Aσ)μ e (Bσ)μν, se escreve

(274) S = λ τ μ - ( A σ ) μ ( U λ τ A ) σ + ( B σ ) μ ν [ ν ( U λ τ A ) σ - ( λ A σ g ν τ - τ A σ g ν λ ) ] .

Precisamos usar nela a Eq. (243), isto é,

(275) ( U λ τ A ) μ = ( U λ τ ) μ ν A ν = δ λ μ A τ δ τ μ A λ .

Após simplificação, o resultado é

(276) S μ λ τ = ( 1 + 2 a 2 ) F μ λ A τ + ( 1 + 2 a 2 ) F μ τ A λ a 2 ( λ ρ F μ ρ A τ τ ρ F μ ρ A λ ) + 2 a 2 ( g μ λ ρ F σ ρ F σ τ g μ τ ρ F σ ρ F σ λ ρ F τ ρ F λ μ + ρ F λ ρ F τ μ ) a 2 ( g μ λ ρ F σ ρ σ A τ g μ τ ρ F σ ρ σ A λ ρ F τ ρ λ A μ + ρ F λ ρ τ A μ ) .

Reconhece-se, mais uma vez, que no limite em que a20 o resultado anterior se iguala ao obtido para a teoria de Maxwell, Eq. (246), que agora se vê modificado pelos termos proporcionais ao quadrado do parâmetro de Podolsky. A partir deste ponto, o procedimento pode ser continuado, calculando o tensor de Belinfante-Rosenfeld, sua divergência e adicionando-a ao tensor canônico de energia-momento. É patente, contudo, que semelhante procedimento não é facilmente aplicável devido à quantidade de termos contidos no tensor do spin. Por isso, desenvolveremos na seção11 11. Relação do Tensor Canônico de Energia-Momento com o Métrico Nesta seção estabeleceremos a relação entre o tensor de energia-momento derivado do teorema de Nöther – a que se dá o adjetivo «canônico» – e aquele que se obtém na teoria de relatividade geral – chamado «métrico». Seguiremos para tanto a Ref. [31], estendendo os argumentos para teorias da segunda ordem. Este estudo se justifica não somente pelo interesse na teoria da gravidade einsteniana, mas também (e principalmente) porque, o vimos na seção anterior, o problema da simetrização do tensor canônico de energia-momento pelo método de Belinfante-Rosenfeld se complica rapidamente quando a teoria é da ordem superior – não significando isto, desejamos salientar, que o tal método seja inaplicável a tais teorias. Outrossim, manteremos a discussão nas teorias que descrevem o campo tensorial19. Antes de iniciar o desenvolvimento do assunto, desejamos salientar que o fato de que o tensor de energia-momento se relacionar com a derivada funcional da ação da matéria em relação ao campo métrico, gμ⁢ν⁢(x), não é casualidade, mas tem uma origem física profunda que pode ser compreendida à luz do já aprendido. Com efeito, a teoria einsteniana possui como propriedade fundamental a de ser invariante sob transformações gerais de coordenadas (invariância sob difeomorfismos). Infinitesimalmente, uma tal transformação das coordenadas escreve-se (277) y μ = x μ + ξ μ ⁢ ( x ) , ξ μ ∈ C + ∞ ⁢ ( ℝ 4 ) . Ora, não é difícil reconhecer que semelhante transformação poderia perfeitamente ser interpretada como uma translação localizada. Logo a teoria invariante por esse tipo de transformações é uma teoria de calibre associada ao grupo das translações20. Por outro lado, a teoria geral dos campos de calibre de Utiyama tem-nos mostrado que a fonte nas equações do movimento do campo de calibre é igual à corrente conservada como consequência da simetria da ação perante as transformações do grupo de calibre – compare, por exemplo, as Eqs. (179) e (183) para o caso eletromagnético –, o que significa que é possível encontrar a corrente conservada por derivação funcional, em relação ao campo de calibre, da parte da ação que contém a matéria e a interação, donde, na teoria de calibre do grupo das translações, a fonte do campo de calibre (gravitacional) será igual à corrente conservada pela simetria da ação perante as translações, isto é, por definição, o tensor de energia-momento. Consideremos, pois, um conjunto de campos (tensoriais) u, e consideremos igualmente o campo métrico gρ⁢σ. Mantendo-nos no formalismo lagrangiano, a ação invariante sob transformações gerais de coordenadas requer escrever, já não 𝒫=ℒ, senão (278) 𝒫 = - g ⁢ ℒ , com g=det⁡(gρ⁢σ) o determinante da matriz constituída pelas componentes do campo métrico. Isto é assim porque na passagem de um sistema cartesiano de coordenadas {xμ} a um sistema curvilíneo {yμ}, o elemento de volume muda segundo (279) d ⁢ y = | ∂ ⁡ y ∂ ⁡ x | ⁢ d ⁢ x = J ⁢ d ⁢ x , com J=|∂⁡y/∂⁡x| o jacobiano da transformação de coordenadas. Tal jacobiano J pode ser calculado levando em conta que o campo métrico gμ⁢ν⁢(y) no sistema curvilíneo obtém-se a partir de g(0)⁢ρ⁢σ, no sistema cartesiano {xμ}, através da relação (280) g μ ⁢ ν ⁢ ( y ) = ∂ ⁡ y μ ∂ ⁡ x ρ ⁢ ∂ ⁡ y ν ∂ ⁡ x σ ⁢ g ( 0 ) ⁢ ρ ⁢ σ , de modo que, tomando o determinante dessa equação, (281) 1 g = J 2 ⁢ ( - 1 ) ⇒ J = 1 - g , em que o sinal positivo foi utilizado na extração da raiz quadrada para que o elemento de volume seja sempre positivo. A substituição deste resultado na Eq. (279) prova que o elemento de volume invariante é -g⁢d⁢x, justificando a Eq. (278). Colocando, pois, a Eq. (278) na (8), a variação da ação é (282) δ ⁢ 𝒜 = ∫ Ω δ ⁢ 𝒜 δ ⁢ u ⁢ Δ ⁢ u ⁢ d x + ∫ Ω δ ⁢ 𝒜 δ ⁢ g ρ ⁢ σ ⁢ Δ ⁢ g ρ ⁢ σ ⁢ d x - ∮ ∂ ⁡ Ω [ ( ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) ) Δ u - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ∂ ν Δ u ] d σ μ - ∮ ∂ ⁡ Ω { [ ( ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ g ρ ⁢ σ ) ) Δ g ρ ⁢ σ - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) ∂ ν Δ g ρ ⁢ σ ] - 𝒫 Δ x μ } d σ μ . Definimos o «tensor métrico da energia-momento» como (283) T ρ ⁢ σ := 2 - g ⁢ δ ⁢ 𝒜 δ ⁢ g ρ ⁢ σ , o qual é, como antes dizíamos, simétrico por definição. Na Eq. (283), (284) δ ⁢ 𝒜 = ∫ Ω δ ⁢ 𝒜 δ ⁢ u ⁢ Δ ⁢ u ⁢ d x + ∫ Ω 1 2 ⁢ T ρ ⁢ σ ⁢ - g ⁢ Δ ⁢ g ρ ⁢ σ ⁢ d x + ∮ ∂ ⁡ Ω [ ( ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) - ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ) Δ u + ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ∂ ν Δ u + 𝒫 Δ x μ ] d σ μ - ∮ ∂ ⁡ Ω { [ ( ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ g ρ ⁢ σ ) ) Δ g ρ ⁢ σ - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) ∂ ν Δ g ρ ⁢ σ ] } d σ μ . Para continuar, usando a Eq. (277) na (280), (285) g ′ ⁣ μ ⁢ ν ⁢ ( y ) = g μ ⁢ ν ⁢ ( x ) + ∂ μ ⁡ ξ ν ⁢ ( x ) + ∂ ν ⁡ ξ μ ⁢ ( x ) , de modo que, usando também que Δ⁢xμ=ξμ, a variação funcional do campo métrico é (286) Δ ⁢ g μ ⁢ ν ⁢ ( x ) = ∂ μ ⁡ ξ ν ⁢ ( x ) + ∂ ν ⁡ ξ μ ⁢ ( x ) - ξ λ ⁢ ( x ) ⁢ ∂ λ ⁡ g μ ⁢ ν ⁢ ( x ) . Introduzindo os coeficientes de conexão (287) Γ := λ ⁢ τ ρ 1 2 g ρ ⁢ σ ( ∂ λ g τ ⁢ σ + ∂ τ g σ ⁢ λ - ∂ σ g λ ⁢ τ ) , e as derivadas covariantes (288) ∇ μ ξ ν : = ∂ μ ξ ν + Γ ν ρ μ ξ ρ , a variação funcional do campo métrico pode ser escrita como21 (289) Δ ⁢ g μ ⁢ ν ⁢ ( x ) = ∇ μ ⁡ ξ ν ⁢ ( x ) + ∇ ν ⁡ ξ μ ⁢ ( x ) . Por isto, e como a conexão definida na Eq. (287) é métrica, no sentido de satisfazer à equação ∇ρ⁡gμ⁢ν=0, o segundo termo do lado direito da Eq. (284) é (290) ∫ Ω 1 2 ⁢ T ρ ⁢ σ ⁢ - g ⁢ Δ ⁢ g ρ ⁢ σ ⁢ d x = - ∫ Ω ∇ ρ ⁡ T ρ ⁢ σ ⁢ - g ⁢ ξ σ ⁢ d ⁢ x + ∮ ∂ ⁡ Ω T ρ ⁢ σ ⁢ ξ σ ⁢ - g ⁢ d σ ρ . Na Eq. (284), (291) δ ⁢ 𝒜 = ∫ Ω δ ⁢ 𝒜 δ ⁢ u ⁢ Δ ⁢ u ⁢ d x - ∫ Ω ∇ ρ ⁡ T ρ ⁢ σ ⁢ ξ σ ⁢ - g ⁢ d ⁢ x + ∮ ∂ ⁡ Ω { T μ ⁢ ρ ξ ρ - g + [ ( ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) - ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ) ⋅ Δ u + ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) ∂ ν Δ u + 𝒫 ξ μ ] } d σ μ - ∮ ∂ ⁡ Ω { ( ∂ ν ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ g ρ ⁢ σ ) ) Δ g ρ ⁢ σ - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) ∂ ν Δ g ρ ⁢ σ } d σ μ . Continuamos escrevendo, na segunda linha da equação recém escrita, a forma explícita das variações dos campos u. Como a transformação é uma translação localizada, ter-se-á que (292) Δ ⁢ u ⁢ ( x ) = δ ⁢ u ⁢ ( x ) - ∂ ρ ⁡ u ⁢ ( x ) ⁢ ξ ρ ⁢ ( x ) , em que δ⁢u⁢(x) dependerá da natureza do campo: Se ele é escalar, será δ⁢u⁢(x)=0, mas no caso geral em que ele seja tensorial, δ⁢u dependerá das derivadas de ξμ⁢(x) de forma semelhante ao campo métrico [Eq. (285)]. Para a parte -∂ρ⁡u⁢ξρ da variação Δ⁢u, o termo entre os colchetes na segunda linha da Eq. (291) reduzir-se-á ao tensor canônico de energia-momento, cuja definição para teorias da segunda ordem foi dada na Eq. (16). A substituição dessa relação, junto com a Eq. (286), permite exprimir a variação da ação dependendo de ξσ⁢(x) e suas derivadas de até a terceira ordem. Com efeito, denotando, como na Eq. (107), (293) A u μ := ∂ ν ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ u ) , B u μ ⁢ ν := ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ u ) , A g μ ⁢ ρ ⁢ σ := ∂ ν ⁡ ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) - ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ g ρ ⁢ σ ) , B g μ ⁢ ν ⁢ ρ ⁢ σ := ∂ ⁡ 𝒫 ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ g ρ ⁢ σ ) , o cálculo permite transformar a Eq. (291) à equivalente (294) δ ⁢ 𝒜 = ∫ Ω δ ⁢ 𝒜 δ ⁢ u ⁢ Δ ⁢ u ⁢ d x - ∫ Ω ∇ ρ ⁡ T ρ ⁢ σ ⁢ ξ σ ⁢ - g ⁢ d ⁢ x + ∫ Ω ∂ μ ⁡ ( - A u μ ⁢ δ ⁢ u + B u μ ⁢ ν ⁢ ∂ ν ⁡ δ ⁢ u ) ⁡ d ⁢ x + ∫ Ω ( H σ ξ σ + H μ ⁢ σ ∂ μ ξ σ + H μ ⁢ ν ⁢ σ ∂ μ ∂ ν ξ σ + H μ ⁢ ν ⁢ ρ ⁢ σ ∂ μ ∂ ν ∂ ρ ξ σ ) d x , com as quantidades (295) H σ = ∂ μ ⁡ ( T μ ⁢ σ ⁢ - g - Θ μ ⁢ σ + A g μ ⁢ ρ ⁢ λ ⁢ ∂ σ ⁡ g ρ ⁢ λ - B g μ ⁢ ν ⁢ ρ ⁢ λ ⁢ ∂ ν ⁡ ∂ σ ⁡ g ρ ⁢ λ ) , (296) H μ ⁢ σ = T μ ⁢ σ ⁢ - g - Θ μ ⁢ σ - ∂ ρ ⁡ ( B u ρ ⁢ μ ⁢ ∂ σ ⁡ u ) + 2 ⁢ ∂ λ ⁡ A g λ ⁢ μ ⁢ σ - A g μ ⁢ ρ ⁢ τ ⁢ ∂ σ ⁡ g ρ ⁢ τ - ∂ ν ⁡ B g ν ⁢ μ ⁢ ρ ⁢ λ ⁢ ∂ σ ⁡ g ρ ⁢ λ - 2 ⁢ B g μ ⁢ ν ⁢ ρ ⁢ λ ⁢ ∂ ν ⁡ ∂ σ ⁡ g ρ ⁢ λ , (297) H μ ⁢ ν ⁢ σ = A g μ ⁢ ν ⁢ σ + A g ν ⁢ μ ⁢ σ - ∂ λ ⁡ B g λ ⁢ μ ⁢ ν ⁢ σ - ∂ λ ⁡ B λ ⁢ ν ⁢ μ ⁢ σ - B g μ ⁢ ν ⁢ ρ ⁢ λ ⁢ ∂ σ ⁡ g ρ ⁢ λ , (298) H μ ⁢ ν ⁢ ρ ⁢ σ = 1 3 ⁢ ( B g μ ⁢ ν ⁢ ρ ⁢ σ + B g μ ⁢ ρ ⁢ ν ⁢ σ + B g ν ⁢ ρ ⁢ μ ⁢ σ ) . Em particular, estaremos interessados no limite em que o campo métrico se torna constante (limite de espaço-tempo plano), em que todas as derivadas do campo métrico se anulam e -g=1. Em tal limite, (299) H σ = ∂ μ ⁡ ( T μ ⁢ σ - Θ μ ⁢ σ ) , (300) H μ ⁢ σ = T μ ⁢ σ - Θ μ ⁢ σ - ∂ ρ ⁡ ( B u ρ ⁢ μ ⁢ ∂ σ ⁡ u ) + 2 ⁢ ∂ λ ⁡ A g λ ⁢ μ ⁢ ν , (301) H μ ⁢ ν ⁢ σ = A g μ ⁢ ν ⁢ σ + A g ν ⁢ μ ⁢ σ - ∂ λ ⁡ B g λ ⁢ μ ⁢ ν ⁢ σ - ∂ λ ⁡ B g λ ⁢ ν ⁢ μ ⁢ σ , (302) H μ ⁢ ν ⁢ ρ ⁢ σ = 1 3 ⁢ ( B g μ ⁢ ν ⁢ ρ ⁢ σ + B g μ ⁢ ρ ⁢ ν ⁢ σ + B g ν ⁢ ρ ⁢ μ ⁢ σ ) , em que estarão presentes, é claro, só os termos que não sejam nulos nos limites indicados. Como a ação é invariante, por hipótese, perante a translação localizada da Eq. (277), deverá ser δ⁢𝒜=0, o que então implica, vista a independência de ξσ⁢(x) e de suas derivadas, que cada uma das quantidades proporcionais a elas seja nula. Neste ponto será então preciso explicitar qual seja a variação δ⁢u do campo material, que aparece na segunda linha da Eq. (294), uma vez que tal variação pode depender, ou não, das derivadas de ξσ⁢(x) até uma ordem relacionada com o posto do campo tensorial u. § Campo escalar: No caso em que u é um campo escalar se cumpre que (303) u ′ ⁢ ( y ) = u ⁢ ( x ) ⇒ δ ⁢ u = 0 . A segunda linha da Eq. (294) encontra-se, pois, ausente neste tipo de teoria. § Campo vetorial: Se uμ é um campo vetorial, sua lei de transformação é (304) u μ ′ ⁢ ( y ) = ∂ ⁡ x ν ∂ ⁡ y μ ⁢ u ν ⁢ ( x ) ⇒ δ ⁢ u μ = - ∂ μ ⁡ ξ ν ⁢ u ν . A segunda linha da Eq. (294) adota a seguinte forma: (305) ∫ Ω { ∂ ρ ( A u ρ ⁢ μ u σ - B u ρ ⁢ ν ⁢ μ ∂ ν u σ ) ∂ μ ξ σ + 1 2 [ ( A u μ ⁢ ρ + A u ρ ⁢ μ ) u σ - ∂ ρ ( ( B u ρ ⁢ μ ⁢ ν + B u ρ ⁢ ν ⁢ μ ) u σ ) - ( B u ρ ⁢ μ ⁢ ν + B u ρ ⁢ ν ⁢ μ ) ∂ ρ u σ ] ∂ μ ∂ ν ξ σ - 1 3 ⁢ ( B u μ ⁢ ν ⁢ ρ + B u μ ⁢ ρ ⁢ ν + B u ρ ⁢ ν ⁢ μ ) ⁢ u σ ⁢ ∂ μ ⁡ ∂ ν ⁡ ∂ ρ ⁡ ξ σ + 𝒪 ( ∂ g ; ∂ ∂ g ; ∂ ∂ ∂ g ) } d x . § Campo tensorial de posto 2: Caso uρ⁢λ seja um campo tensorial de posto 2, sua lei de transformação será a seguinte: (306) u μ ⁢ ν ′ ⁢ ( y ) = ∂ ⁡ x ρ ∂ ⁡ y μ ⁢ ∂ ⁡ x λ ∂ ⁡ y ν ⁢ u ρ ⁢ λ ⁢ ( x ) ⇒ δ ⁢ u μ ⁢ ν = - ∂ μ ⁡ ξ ρ ⁢ u ρ ⁢ ν - ∂ ν ⁡ ξ ρ ⁢ u μ ⁢ ρ . Logo, a segunda linha da Eq. (294) será igual a (307) ∫ Ω { ∂ ρ [ A u ρ ⁢ μ ⁢ λ ( u + λ σ u ) λ σ - B u ρ ⁢ ν ⁢ μ ⁢ λ ( ∂ ν u + λ σ ∂ ν u ) λ σ ] ∂ μ ξ σ + 1 2 [ ( A u ν ⁢ μ ⁢ λ + A u μ ⁢ ν ⁢ λ ) ( u + λ σ u ) λ σ - ( B u μ ⁢ ρ ⁢ ν ⁢ λ + B u ν ⁢ ρ ⁢ μ ⁢ λ ) ( ∂ ρ u + λ σ ∂ ρ u ) λ σ - ∂ ρ ( ( B u ρ ⁢ ν ⁢ μ ⁢ λ + B u ρ ⁢ μ ⁢ ν ⁢ λ ) ( u + λ σ u ) λ σ ) ] ∂ μ ∂ ν ξ σ - 1 3 [ ( B u μ ⁢ ν ⁢ ρ ⁢ λ + B u ρ ⁢ ν ⁢ μ ⁢ λ + B u μ ⁢ ρ ⁢ ν ⁢ λ ) ( u + λ σ u ) λ σ ] ⋅ ∂ μ ∂ ν ∂ ρ ξ σ + 𝒪 ( ∂ g ; ∂ ∂ g ; ∂ ∂ ∂ g ) } d x . Como se verifica nas Eqs. (305) e (307), qualquer que seja a natureza do campo material u, no limite de espaço-tempo plano a segunda linha da Eq. (294) só contribui com termos que são proporcionais a ∂μ⁡ξσ, ∂μ⁡∂ν⁡ξσ e ∂μ⁡∂ν⁡∂ρ⁡ξσ, mas em nenhum caso contribui com algum termo proporcional a ξσ. Por isto, em todos os casos a imposição da invariância da ação sob translações localizadas à Eq. (294), sob o cumprimento das equações do movimento para u e as identidades de Bianchi (que implicam que seja ∇ρ⁡Tρ⁢σ=0 [32]), levará à identidade (308) H σ = ∂ μ ⁡ ( T μ ⁢ σ - Θ μ ⁢ σ ) = 0 . Essa é a relação crucial para a prova da equivalência entre o tensor canônico de energia-momento e o métrico: Como a divergência da diferença entre eles é nula, já é evidente que, se um deles satisfaz à equação de conservação, então o outro também o faz. Ademais, a diferença entre eles terá de ser igual à divergência de um tensor antissimétrico: (309) T μ ⁢ σ - Θ μ ⁢ σ = ∂ ρ ⁡ Y ρ ⁢ μ ⁢ σ ; Y ρ ⁢ μ ⁢ σ = - Y μ ⁢ ρ ⁢ σ . Concluimos assim que os tensores de energia-momento Tμ⁢σ e Θμ⁢σ são físicamente equivalentes, no sentido de levarem às mesmas quantidades conservadas (vetor de energia-momento). Quanto ao anulamento dos termos proporcionais às derivadas de ξσ até da terceira ordem, elas estabelecem relações de possibilidade para as teorias da segunda ordem acopladas ao campo métrico. É claro, todavia, pelo desenvolvimento feito, que tais condições dependerão da natureza (posto) do campo tensorial u. Em particular, analisaremos os termos proporcionais a ∂⁡ξ. § Campo escalar: Como não há contribuição adicional ao termo proporcional a ∂⁡ξ, das Eqs. (300) e (309): (310) ∂ ρ ⁡ ( B u ρ ⁢ μ ⁢ ∂ σ ⁡ u ) - 2 ⁢ ∂ ρ ⁡ A g ρ ⁢ μ ⁢ σ = ∂ ρ ⁡ Y ρ ⁢ μ ⁢ σ , isto é, que (311) ∂ ρ ⁡ ( B u ρ ⁢ μ ⁢ ∂ σ ⁡ u - 2 ⁢ A g ρ ⁢ μ ⁢ σ - Y ρ ⁢ μ ⁢ σ ) = 0 , e portanto se deduz a existência de um tensor Zλ⁢ρ⁢μ⁢σ tal que (312) B u ρ ⁢ μ ⁢ ∂ σ ⁡ u - 2 ⁢ A g ρ ⁢ μ ⁢ σ - Y ρ ⁢ μ ⁢ σ = ∂ λ ⁡ Z λ ⁢ ρ ⁢ μ ⁢ σ ; Z λ ⁢ ρ ⁢ μ ⁢ σ = - Z ρ ⁢ λ ⁢ μ ⁢ σ . § Campo vetorial: Das Eqs. (300), (305) e (309), para o campo vetorial: (313) ∂ ρ ( B u ρ ⁢ μ ⁢ λ ∂ σ u λ - 2 A g ρ ⁢ μ ⁢ σ - A u ρ ⁢ μ u σ + B u ρ ⁢ ν ⁢ μ ∂ ν u σ - Y ρ ⁢ μ ⁢ σ ) = 0 , donde se deduz, também, a existência de um tensor Zλ⁢ρ⁢μ⁢σ=-Zρ⁢λ⁢μ⁢σ tal que (314) B u ρ ⁢ μ ⁢ λ ⁢ ∂ σ ⁡ u λ - 2 ⁢ A g ρ ⁢ μ ⁢ σ - A u ρ ⁢ μ ⁢ u σ + B u ρ ⁢ ν ⁢ μ ⁢ ∂ ν ⁡ u σ - Y ρ ⁢ μ ⁢ σ = ∂ λ ⁡ Z λ ⁢ ρ ⁢ μ ⁢ σ . § Campo tensorial de posto 2: Por último, das Eqs. (300), (307) e (309) encontra-se que, para o campo tensorial, (315) ∂ ρ [ B u ρ ⁢ μ ⁢ λ ⁢ τ ∂ σ u λ ⁢ τ - 2 A g ρ ⁢ μ ⁢ σ - A u ρ ⁢ μ ⁢ λ ( u + λ σ u ) λ σ + B u ρ ⁢ ν ⁢ μ ⁢ λ ( ∂ ν u + λ σ ∂ ν u ) λ σ - Y ρ ⁢ μ ⁢ σ ] = 0 . Outra vez, deduz-se a existência de um tensor Zλ⁢ρ⁢μ⁢σ=-Zρ⁢λ⁢μ⁢σ tal que (316) B u ρ ⁢ μ ⁢ λ ⁢ τ ∂ σ u λ ⁢ τ - 2 A g ρ ⁢ μ ⁢ σ - A u ρ ⁢ μ ⁢ λ ( u + λ σ u ) λ σ + B u ρ ⁢ ν ⁢ μ ⁢ λ ( ∂ ν u + λ σ ∂ ν u ) λ σ - Y ρ ⁢ μ ⁢ σ = ∂ λ Z λ ⁢ ρ ⁢ μ ⁢ σ . Tendo estabelecido desta forma a equivalência física entre o tensor canônico de energia-momento e o métrico no limite de espaço-tempo plano, a seguir derivaremos o tensor métrico de energia-momento para a eletrodinâmica de Maxwell e para a de Podolsky. 11.1. Tensor métrico de energia-momento docampo de Maxwell Utilizaremos nesse caso a densidade (317) 𝒫 = - - g 4 ⁢ g μ ⁢ ρ ⁢ g ν ⁢ σ ⁢ F μ ⁢ ν ⁢ F ρ ⁢ σ . A princípio, o tensor de Faraday é agora Fμ⁢ν=∇μ⁡Aν-∇ν⁡Aμ. Todavia, uma vez que os símbolos de Christoffel são simétricos em seus dois índices inferiores –o que significa que no espaço-tempo em consideração a torsão é nula–, é fácil mostrar que a derivação covariante, neste caso, é irrelevante: F μ ν = ( ∂ μ A ν − Γ ρ μ ν A ρ ) − ( ∂ ν A μ − Γ ρ ν μ A ρ ) = ∂ μ ⁡ A ν - ∂ ν ⁡ A μ . Essa parte da densidade 𝒫 é, portanto, independente do campo métrico. Logo, efetuando variações do campo métrico, a ação muda segundo (318) δ 𝒜 = ∫ Ω - - g 4 [ Δ g μ ⁢ ρ g ν ⁢ σ F μ ⁢ ν F ρ ⁢ σ + g μ ⁢ ρ Δ g ν ⁢ σ F μ ⁢ ν F ρ ⁢ σ + 1 2 g λ ⁢ τ Δ g λ ⁢ τ g μ ⁢ ρ g ν ⁢ σ F μ ⁢ ν F ρ ⁢ σ ] d x = ∫ Ω - g 4 ( F λ ⁢ σ F + σ τ F ρ ⁢ λ F ρ τ - 1 2 g λ ⁢ τ F μ ⁢ ν F μ ⁢ ν ) Δ g λ ⁢ τ d x . Daqui que a aplicação da Eq. (283) leva ao tensor métrico de energia-momento (319) T λ ⁢ τ = F λ ⁢ σ F - σ τ 1 4 g λ ⁢ τ F μ ⁢ ν F μ ⁢ ν , que é, como provado anteriormente, físicamente equivalente ao canônico, e que, ademais, já é simétrico e invariante de calibre. 11.2. Tensor métrico de energia-momento do campo de Podolsky Usaremos agora a densidade (320) 𝒫 = - g ( - 1 4 g μ ⁢ ρ g ν ⁢ σ F μ ⁢ ν F ρ ⁢ σ + a 2 2 g ρ ⁢ α g μ ⁢ β g σ ⁢ γ ∇ α F μ ⁢ ρ ∇ σ F β ⁢ γ ) . Desta vez, embora os tensores de Faraday sejam, como no caso prévio, independentes do campo métrico, suas derivadas covariantes não o são. De fato, ter-se-á que, sob uma variação do campo métrico, (321) Δ ( ∇ α F μ ρ ) = − ΔΓ ε μ α F ε ρ − ΔΓ v ρ α F μ ε , com (322) ΔΓ ε μ α = 1 2 g ε κ ( ∂ μ Δ g α κ + ∂ α Δ g μ κ − ∂ κ Δ g μ α ) + 𝒪 ( ∂ g ) . Os termos nessa variação que dependem das derivadas do campo métrico serão irrelevantes para nossos propósitos, uma vez que estamos interessados no limite de espaço-tempo plano. No mencionado limite, a variação da ação é (323) δ 𝒜 = ∫ Ω - g 2 ( F λ ⁢ σ F - σ τ 1 4 g λ ⁢ τ F μ ⁢ ν F μ ⁢ ν ) Δ g λ ⁢ τ d x (324) + a 2 2 ∫ Ω - g { Δ g ρ ⁢ α ∂ α F μ ⁢ ρ ∇ σ F μ ⁢ σ + Δ g μ ⁢ β ∂ ρ F μ ⁢ ρ ∂ σ F + β σ Δ g σ ⁢ γ ∂ ρ F μ ⁢ ρ ∂ σ F γ μ + 1 2 g λ ⁢ τ Δ g λ ⁢ τ ∂ ρ F μ ⁢ ρ ∂ σ F μ ⁢ σ } d x (325) + a 2 2 ⁢ ∫ Ω - g ⁢ g ρ ⁢ α ⁢ g μ ⁢ β ⁢ g σ ⁢ γ ⋅ { ( − ΔΓ ε μ α F ε ρ − ΔΓ ε ρ α F μ ε ) ∂ σ F β γ + ∂ α F μ ρ ( − ΔΓ ε β σ F ε γ − ΔΓ ε γ σ F β ε ) } d x . O primeiro termo, Eq. (323), é o mesmo que já apareceu na teoria de Maxwell, e sua contribuição ao tensor de energia-momento é dado na Eq. (319). Quanto ao termo da Eq. (324), a aplicação da relação Δ⁢gμ⁢ν=-gμ⁢σ⁢gν⁢ρ⁢Δ⁢gσ⁢ρ permite obter sua contribuição: (326) T ( 1 ) λ ⁢ τ = - a 2 [ ( ∂ λ F μ ⁢ τ + ∂ τ F μ ⁢ λ ) ∂ σ F μ ⁢ σ + ∂ ρ F λ ⁢ ρ ∂ σ F τ ⁢ σ - 1 2 g λ ⁢ τ ∂ ρ F μ ⁢ ρ ∂ σ F μ ⁢ σ ] . Finalmente, o uso da Eq. (322) na Eq. (325), após integração por partes e eliminação de termos de superfície sob as condições assintóticas de desvanecimento das variações Δ⁢g no infinito, permite obter também a contribuição do mencionado termo: (327) T ( 2 ) λ ⁢ τ = a 2 [ - g λ ⁢ τ ∂ ρ ( F μ ⁢ ρ ∂ σ F μ ⁢ σ ) + ∂ ρ ⁡ ( F λ ⁢ τ ⁢ ∂ σ ⁡ F τ ⁢ σ + F τ ⁢ ρ ⁢ ∂ σ ⁡ F λ ⁢ σ ) + ∂ λ ( F μ ⁢ τ ∂ ρ F μ ⁢ ρ ) + ∂ τ ( F μ ⁢ λ ∂ ρ F μ ⁢ ρ ) ] . Juntando todas as partes, por último, chegamos ao tensor de energia-momento do campo de Podolsky: (328) T λ ⁢ τ = F λ ⁢ σ F - σ τ 1 4 g λ ⁢ τ F μ ⁢ ν F μ ⁢ ν - a 2 2 g λ ⁢ τ ∂ ρ F μ ⁢ ρ ∂ σ F μ ⁢ σ + a 2 [ - g λ ⁢ τ F μ ⁢ ρ ∂ ρ ∂ σ F μ ⁢ σ + ∂ ρ F λ ⁢ ρ ∂ σ F τ ⁢ σ + F λ ⁢ ρ ⁢ ∂ ρ ⁡ ∂ σ ⁡ F τ ⁢ σ + F τ ⁢ ρ ⁢ ∂ ρ ⁡ ∂ σ ⁡ F λ ⁢ σ - F τ ⁢ ρ ⁢ ∂ λ ⁡ ∂ σ ⁡ F ρ ⁢ σ - F λ ⁢ ρ ∂ τ ∂ σ F ρ ⁢ σ ] . Este tensor, é patente, é simétrico e também invariante de calibre, visto que depende únicamente do tensor de Faraday e de suas derivadas. uma técnica alternativa para o cálculo do tensor simétrico de energia-momento.

11. Relação do Tensor Canônico de Energia-Momento com o Métrico

Nesta seção estabeleceremos a relação entre o tensor de energia-momento derivado do teorema de Nöther – a que se dá o adjetivo «canônico» – e aquele que se obtém na teoria de relatividade geral – chamado «métrico». Seguiremos para tanto a Ref. [31[31] H. Fleming, O tensor de momento-energia métrico, e o canônico, disponível em: hfleming.com
hfleming.com...
], estendendo os argumentos para teorias da segunda ordem. Este estudo se justifica não somente pelo interesse na teoria da gravidade einsteniana, mas também (e principalmente) porque, o vimos na seção anterior, o problema da simetrização do tensor canônico de energia-momento pelo método de Belinfante-Rosenfeld se complica rapidamente quando a teoria é da ordem superior – não significando isto, desejamos salientar, que o tal método seja inaplicável a tais teorias. Outrossim, manteremos a discussão nas teorias que descrevem o campo tensorial19 19 Como dissemos alhures, a consideração do campo fermiônico requeriria a introdução do formalismo das tétradas; deixamos esse ponto para o futuro. .

Antes de iniciar o desenvolvimento do assunto, desejamos salientar que o fato de que o tensor de energia-momento se relacionar com a derivada funcional da ação da matéria em relação ao campo métrico, gμν(x), não é casualidade, mas tem uma origem física profunda que pode ser compreendida à luz do já aprendido. Com efeito, a teoria einsteniana possui como propriedade fundamental a de ser invariante sob transformações gerais de coordenadas (invariância sob difeomorfismos). Infinitesimalmente, uma tal transformação das coordenadas escreve-se

(277) y μ = x μ + ξ μ ( x ) , ξ μ C + ( 4 ) .

Ora, não é difícil reconhecer que semelhante transformação poderia perfeitamente ser interpretada como uma translação localizada. Logo a teoria invariante por esse tipo de transformações é uma teoria de calibre associada ao grupo das translações20 20 Essa é a ideia central do teleparalelismo. Entretanto, é mister mencionar que, embora qualquer transformação das coordenadas esteja inclusa na Eq. (277) – por exemplo, a Eq. (277) bem poder-se-ia entender, também, como uma transformação de Poincaré localizada, escrevendo ω(x)νμxν+εμ(x)≡ξμ(x)–, os diferentes grupos de calibre que se têm associado à gravidade se diferenciam na lei de transformação local dos campos. Nesta seção, as mudanças dos campos são devidas só às mudanças das coordenadas, de forma que tais diferenças não estarão presentes. . Por outro lado, a teoria geral dos campos de calibre de Utiyama tem-nos mostrado que a fonte nas equações do movimento do campo de calibre é igual à corrente conservada como consequência da simetria da ação perante as transformações do grupo de calibre – compare, por exemplo, as Eqs. (179) e (183) para o caso eletromagnético –, o que significa que é possível encontrar a corrente conservada por derivação funcional, em relação ao campo de calibre, da parte da ação que contém a matéria e a interação, donde, na teoria de calibre do grupo das translações, a fonte do campo de calibre (gravitacional) será igual à corrente conservada pela simetria da ação perante as translações, isto é, por definição, o tensor de energia-momento.

Consideremos, pois, um conjunto de campos (tensoriais) u, e consideremos igualmente o campo métrico gρσ. Mantendo-nos no formalismo lagrangiano, a ação invariante sob transformações gerais de coordenadas requer escrever, já não 𝒫=, senão

(278) 𝒫 = - g ,

com g=det(gρσ) o determinante da matriz constituída pelas componentes do campo métrico. Isto é assim porque na passagem de um sistema cartesiano de coordenadas {xμ} a um sistema curvilíneo {yμ}, o elemento de volume muda segundo

(279) d y = | y x | d x = J d x ,

com J=|y/x| o jacobiano da transformação de coordenadas. Tal jacobiano J pode ser calculado levando em conta que o campo métrico gμν(y) no sistema curvilíneo obtém-se a partir de g(0)ρσ, no sistema cartesiano {xμ}, através da relação

(280) g μ ν ( y ) = y μ x ρ y ν x σ g ( 0 ) ρ σ ,

de modo que, tomando o determinante dessa equação,

(281) 1 g = J 2 ( - 1 ) J = 1 - g ,

em que o sinal positivo foi utilizado na extração da raiz quadrada para que o elemento de volume seja sempre positivo. A substituição deste resultado na Eq. (279) prova que o elemento de volume invariante é -gdx, justificando a Eq. (278).

Colocando, pois, a Eq. (278) na (8), a variação da ação é

(282) δ 𝒜 = Ω δ 𝒜 δ u Δ u d x + Ω δ 𝒜 δ g ρ σ Δ g ρ σ d x - Ω [ ( ν 𝒫 ( μ ν u ) - 𝒫 ( μ u ) ) Δ u - 𝒫 ( μ ν u ) ν Δ u ] d σ μ - Ω { [ ( ν 𝒫 ( μ ν g ρ σ ) - 𝒫 ( μ g ρ σ ) ) Δ g ρ σ - 𝒫 ( μ ν g ρ σ ) ν Δ g ρ σ ] - 𝒫 Δ x μ } d σ μ .

Definimos o «tensor métrico da energia-momento» como

(283) T ρ σ := 2 - g δ 𝒜 δ g ρ σ ,

o qual é, como antes dizíamos, simétrico por definição. Na Eq. (283),

(284) δ 𝒜 = Ω δ 𝒜 δ u Δ u d x + Ω 1 2 T ρ σ - g Δ g ρ σ d x + Ω [ ( 𝒫 ( μ u ) - ν 𝒫 ( μ ν u ) ) Δ u + 𝒫 ( μ ν u ) ν Δ u + 𝒫 Δ x μ ] d σ μ - Ω { [ ( ν 𝒫 ( μ ν g ρ σ ) - 𝒫 ( μ g ρ σ ) ) Δ g ρ σ - 𝒫 ( μ ν g ρ σ ) ν Δ g ρ σ ] } d σ μ .

Para continuar, usando a Eq. (277) na (280),

(285) g μ ν ( y ) = g μ ν ( x ) + μ ξ ν ( x ) + ν ξ μ ( x ) ,

de modo que, usando também que Δxμ=ξμ, a variação funcional do campo métrico é

(286) Δ g μ ν ( x ) = μ ξ ν ( x ) + ν ξ μ ( x ) - ξ λ ( x ) λ g μ ν ( x ) .

Introduzindo os coeficientes de conexão

(287) Γ := λ τ ρ 1 2 g ρ σ ( λ g τ σ + τ g σ λ - σ g λ τ ) ,

e as derivadas covariantes

(288) μ ξ ν : = μ ξ ν + Γ ν ρ μ ξ ρ ,

a variação funcional do campo métrico pode ser escrita como21 21 Note, de passagem, que a condição de anulamento da variação funcional da métrica corresponde à equação de Killing, a qual determina as transformações de coordenadas que representam simetrias do espaço-tempo em estudo.

(289) Δ g μ ν ( x ) = μ ξ ν ( x ) + ν ξ μ ( x ) .

Por isto, e como a conexão definida na Eq. (287) é métrica, no sentido de satisfazer à equação ρgμν=0, o segundo termo do lado direito da Eq. (284) é

(290) Ω 1 2 T ρ σ - g Δ g ρ σ d x = - Ω ρ T ρ σ - g ξ σ d x + Ω T ρ σ ξ σ - g d σ ρ .

Na Eq. (284),

(291) δ 𝒜 = Ω δ 𝒜 δ u Δ u d x - Ω ρ T ρ σ ξ σ - g d x + Ω { T μ ρ ξ ρ - g + [ ( 𝒫 ( μ u ) - ν 𝒫 ( μ ν u ) ) Δ u + 𝒫 ( μ ν u ) ν Δ u + 𝒫 ξ μ ] } d σ μ - Ω { ( ν 𝒫 ( μ ν g ρ σ ) - 𝒫 ( μ g ρ σ ) ) Δ g ρ σ - 𝒫 ( μ ν g ρ σ ) ν Δ g ρ σ } d σ μ .

Continuamos escrevendo, na segunda linha da equação recém escrita, a forma explícita das variações dos campos u. Como a transformação é uma translação localizada, ter-se-á que

(292) Δ u ( x ) = δ u ( x ) - ρ u ( x ) ξ ρ ( x ) ,

em que δu(x) dependerá da natureza do campo: Se ele é escalar, será δu(x)=0, mas no caso geral em que ele seja tensorial, δu dependerá das derivadas de ξμ(x) de forma semelhante ao campo métrico [Eq. (285)].

Para a parte -ρuξρ da variação Δu, o termo entre os colchetes na segunda linha da Eq. (291) reduzir-se-á ao tensor canônico de energia-momento, cuja definição para teorias da segunda ordem foi dada na Eq. (16). A substituição dessa relação, junto com a Eq. (286), permite exprimir a variação da ação dependendo de ξσ(x) e suas derivadas de até a terceira ordem. Com efeito, denotando, como na Eq. (107),

(293) A u μ := ν 𝒫 ( μ ν u ) - 𝒫 ( μ u ) , B u μ ν := 𝒫 ( μ ν u ) , A g μ ρ σ := ν 𝒫 ( μ ν g ρ σ ) - 𝒫 ( μ g ρ σ ) , B g μ ν ρ σ := 𝒫 ( μ ν g ρ σ ) ,

o cálculo permite transformar a Eq. (291) à equivalente

(294) δ 𝒜 = Ω δ 𝒜 δ u Δ u d x - Ω ρ T ρ σ ξ σ - g d x + Ω μ ( - A u μ δ u + B u μ ν ν δ u ) d x + Ω ( H σ ξ σ + H μ σ μ ξ σ + H μ ν σ μ ν ξ σ + H μ ν ρ σ μ ν ρ ξ σ ) d x ,

com as quantidades

(295) H σ = μ ( T μ σ - g - Θ μ σ + A g μ ρ λ σ g ρ λ - B g μ ν ρ λ ν σ g ρ λ ) ,

(296) H μ σ = T μ σ - g - Θ μ σ - ρ ( B u ρ μ σ u ) + 2 λ A g λ μ σ - A g μ ρ τ σ g ρ τ - ν B g ν μ ρ λ σ g ρ λ - 2 B g μ ν ρ λ ν σ g ρ λ ,

(297) H μ ν σ = A g μ ν σ + A g ν μ σ - λ B g λ μ ν σ - λ B λ ν μ σ - B g μ ν ρ λ σ g ρ λ ,

(298) H μ ν ρ σ = 1 3 ( B g μ ν ρ σ + B g μ ρ ν σ + B g ν ρ μ σ ) .

Em particular, estaremos interessados no limite em que o campo métrico se torna constante (limite de espaço-tempo plano), em que todas as derivadas do campo métrico se anulam e -g=1. Em tal limite,

(299) H σ = μ ( T μ σ - Θ μ σ ) ,
(300) H μ σ = T μ σ - Θ μ σ - ρ ( B u ρ μ σ u ) + 2 λ A g λ μ ν ,
(301) H μ ν σ = A g μ ν σ + A g ν μ σ - λ B g λ μ ν σ - λ B g λ ν μ σ ,
(302) H μ ν ρ σ = 1 3 ( B g μ ν ρ σ + B g μ ρ ν σ + B g ν ρ μ σ ) ,

em que estarão presentes, é claro, só os termos que não sejam nulos nos limites indicados.

Como a ação é invariante, por hipótese, perante a translação localizada da Eq. (277), deverá ser δ𝒜=0, o que então implica, vista a independência de ξσ(x) e de suas derivadas, que cada uma das quantidades proporcionais a elas seja nula. Neste ponto será então preciso explicitar qual seja a variação δu do campo material, que aparece na segunda linha da Eq. (294), uma vez que tal variação pode depender, ou não, das derivadas de ξσ(x) até uma ordem relacionada com o posto do campo tensorial u.

§ Campo escalar: No caso em que u é um campo escalar se cumpre que

(303) u ( y ) = u ( x ) δ u = 0 .

A segunda linha da Eq. (294) encontra-se, pois, ausente neste tipo de teoria.

§ Campo vetorial: Se uμ é um campo vetorial, sua lei de transformação é

(304) u μ ( y ) = x ν y μ u ν ( x ) δ u μ = - μ ξ ν u ν .

A segunda linha da Eq. (294) adota a seguinte forma:

(305) Ω { ρ ( A u ρ μ u σ - B u ρ ν μ ν u σ ) μ ξ σ + 1 2 [ ( A u μ ρ + A u ρ μ ) u σ - ρ ( ( B u ρ μ ν + B u ρ ν μ ) u σ ) - ( B u ρ μ ν + B u ρ ν μ ) ρ u σ ] μ ν ξ σ - 1 3 ( B u μ ν ρ + B u μ ρ ν + B u ρ ν μ ) u σ μ ν ρ ξ σ + 𝒪 ( g ; g ; g ) } d x .

§ Campo tensorial de posto 2: Caso uρλ seja um campo tensorial de posto 2, sua lei de transformação será a seguinte:

(306) u μ ν ( y ) = x ρ y μ x λ y ν u ρ λ ( x ) δ u μ ν = - μ ξ ρ u ρ ν - ν ξ ρ u μ ρ .

Logo, a segunda linha da Eq. (294) será igual a

(307) Ω { ρ [ A u ρ μ λ ( u + λ σ u ) λ σ - B u ρ ν μ λ ( ν u + λ σ ν u ) λ σ ] μ ξ σ + 1 2 [ ( A u ν μ λ + A u μ ν λ ) ( u + λ σ u ) λ σ - ( B u μ ρ ν λ + B u ν ρ μ λ ) ( ρ u + λ σ ρ u ) λ σ - ρ ( ( B u ρ ν μ λ + B u ρ μ ν λ ) ( u + λ σ u ) λ σ ) ] μ ν ξ σ - 1 3 [ ( B u μ ν ρ λ + B u ρ ν μ λ + B u μ ρ ν λ ) ( u + λ σ u ) λ σ ] μ ν ρ ξ σ + 𝒪 ( g ; g ; g ) } d x .

Como se verifica nas Eqs. (305) e (307), qualquer que seja a natureza do campo material u, no limite de espaço-tempo plano a segunda linha da Eq. (294) só contribui com termos que são proporcionais a μξσ, μνξσ e μνρξσ, mas em nenhum caso contribui com algum termo proporcional a ξσ. Por isto, em todos os casos a imposição da invariância da ação sob translações localizadas à Eq. (294), sob o cumprimento das equações do movimento para u e as identidades de Bianchi (que implicam que seja ρTρσ=0 [32[32] R. D’Inverno, Introducing Einstein’s Relativity (Oxford University Press, Nova Iorque, 2002).]), levará à identidade

(308) H σ = μ ( T μ σ - Θ μ σ ) = 0 .

Essa é a relação crucial para a prova da equivalência entre o tensor canônico de energia-momento e o métrico: Como a divergência da diferença entre eles é nula, já é evidente que, se um deles satisfaz à equação de conservação, então o outro também o faz. Ademais, a diferença entre eles terá de ser igual à divergência de um tensor antissimétrico:

(309) T μ σ - Θ μ σ = ρ Y ρ μ σ ; Y ρ μ σ = - Y μ ρ σ .

Concluimos assim que os tensores de energia-momento Tμσ e Θμσ são físicamente equivalentes, no sentido de levarem às mesmas quantidades conservadas (vetor de energia-momento).

Quanto ao anulamento dos termos proporcionais às derivadas de ξσ até da terceira ordem, elas estabelecem relações de possibilidade para as teorias da segunda ordem acopladas ao campo métrico. É claro, todavia, pelo desenvolvimento feito, que tais condições dependerão da natureza (posto) do campo tensorial u. Em particular, analisaremos os termos proporcionais a ξ.

§ Campo escalar: Como não há contribuição adicional ao termo proporcional a ξ, das Eqs. (300) e (309):

(310) ρ ( B u ρ μ σ u ) - 2 ρ A g ρ μ σ = ρ Y ρ μ σ ,

isto é, que

(311) ρ ( B u ρ μ σ u - 2 A g ρ μ σ - Y ρ μ σ ) = 0 ,

e portanto se deduz a existência de um tensor Zλρμσ tal que

(312) B u ρ μ σ u - 2 A g ρ μ σ - Y ρ μ σ = λ Z λ ρ μ σ ; Z λ ρ μ σ = - Z ρ λ μ σ .

§ Campo vetorial: Das Eqs. (300), (305) e (309), para o campo vetorial:

(313) ρ ( B u ρ μ λ σ u λ - 2 A g ρ μ σ - A u ρ μ u σ + B u ρ ν μ ν u σ - Y ρ μ σ ) = 0 ,

donde se deduz, também, a existência de um tensor Zλρμσ=-Zρλμσ tal que

(314) B u ρ μ λ σ u λ - 2 A g ρ μ σ - A u ρ μ u σ + B u ρ ν μ ν u σ - Y ρ μ σ = λ Z λ ρ μ σ .

§ Campo tensorial de posto 2: Por último, das Eqs. (300), (307) e (309) encontra-se que, para o campo tensorial,

(315) ρ [ B u ρ μ λ τ σ u λ τ - 2 A g ρ μ σ - A u ρ μ λ ( u + λ σ u ) λ σ + B u ρ ν μ λ ( ν u + λ σ ν u ) λ σ - Y ρ μ σ ] = 0 .

Outra vez, deduz-se a existência de um tensor Zλρμσ=-Zρλμσ tal que

(316) B u ρ μ λ τ σ u λ τ - 2 A g ρ μ σ - A u ρ μ λ ( u + λ σ u ) λ σ + B u ρ ν μ λ ( ν u + λ σ ν u ) λ σ - Y ρ μ σ = λ Z λ ρ μ σ .

Tendo estabelecido desta forma a equivalência física entre o tensor canônico de energia-momento e o métrico no limite de espaço-tempo plano, a seguir derivaremos o tensor métrico de energia-momento para a eletrodinâmica de Maxwell e para a de Podolsky.

11.1. Tensor métrico de energia-momento docampo de Maxwell

Utilizaremos nesse caso a densidade

(317) 𝒫 = - - g 4 g μ ρ g ν σ F μ ν F ρ σ .

A princípio, o tensor de Faraday é agora Fμν=μAν-νAμ. Todavia, uma vez que os símbolos de Christoffel são simétricos em seus dois índices inferiores –o que significa que no espaço-tempo em consideração a torsão é nula–, é fácil mostrar que a derivação covariante, neste caso, é irrelevante:

F μ ν = ( μ A ν Γ ρ μ ν A ρ ) ( ν A μ Γ ρ ν μ A ρ ) = μ A ν - ν A μ .

Essa parte da densidade 𝒫 é, portanto, independente do campo métrico. Logo, efetuando variações do campo métrico, a ação muda segundo

(318) δ 𝒜 = Ω - - g 4 [ Δ g μ ρ g ν σ F μ ν F ρ σ + g μ ρ Δ g ν σ F μ ν F ρ σ + 1 2 g λ τ Δ g λ τ g μ ρ g ν σ F μ ν F ρ σ ] d x = Ω - g 4 ( F λ σ F + σ τ F ρ λ F ρ τ - 1 2 g λ τ F μ ν F μ ν ) Δ g λ τ d x .

Daqui que a aplicação da Eq. (283) leva ao tensor métrico de energia-momento

(319) T λ τ = F λ σ F - σ τ 1 4 g λ τ F μ ν F μ ν ,

que é, como provado anteriormente, físicamente equivalente ao canônico, e que, ademais, já é simétrico e invariante de calibre.

11.2. Tensor métrico de energia-momento do campo de Podolsky

Usaremos agora a densidade

(320) 𝒫 = - g ( - 1 4 g μ ρ g ν σ F μ ν F ρ σ + a 2 2 g ρ α g μ β g σ γ α F μ ρ σ F β γ ) .

Desta vez, embora os tensores de Faraday sejam, como no caso prévio, independentes do campo métrico, suas derivadas covariantes não o são. De fato, ter-se-á que, sob uma variação do campo métrico,

(321) Δ ( α F μ ρ ) = ΔΓ ε μ α F ε ρ ΔΓ v ρ α F μ ε ,

com

(322) ΔΓ ε μ α = 1 2 g ε κ ( μ Δ g α κ + α Δ g μ κ κ Δ g μ α ) + 𝒪 ( g ) .

Os termos nessa variação que dependem das derivadas do campo métrico serão irrelevantes para nossos propósitos, uma vez que estamos interessados no limite de espaço-tempo plano. No mencionado limite, a variação da ação é

(323) δ 𝒜 = Ω - g 2 ( F λ σ F - σ τ 1 4 g λ τ F μ ν F μ ν ) Δ g λ τ d x
(324) + a 2 2 Ω - g { Δ g ρ α α F μ ρ σ F μ σ + Δ g μ β ρ F μ ρ σ F + β σ Δ g σ γ ρ F μ ρ σ F γ μ + 1 2 g λ τ Δ g λ τ ρ F μ ρ σ F μ σ } d x
(325) + a 2 2 Ω - g g ρ α g μ β g σ γ { ( ΔΓ ε μ α F ε ρ ΔΓ ε ρ α F μ ε ) σ F β γ + α F μ ρ ( ΔΓ ε β σ F ε γ ΔΓ ε γ σ F β ε ) } d x .

O primeiro termo, Eq. (323), é o mesmo que já apareceu na teoria de Maxwell, e sua contribuição ao tensor de energia-momento é dado na Eq. (319). Quanto ao termo da Eq. (324), a aplicação da relação Δgμν=-gμσgνρΔgσρ permite obter sua contribuição:

(326) T ( 1 ) λ τ = - a 2 [ ( λ F μ τ + τ F μ λ ) σ F μ σ + ρ F λ ρ σ F τ σ - 1 2 g λ τ ρ F μ ρ σ F μ σ ] .

Finalmente, o uso da Eq. (322) na Eq. (325), após integração por partes e eliminação de termos de superfície sob as condições assintóticas de desvanecimento das variações Δg no infinito, permite obter também a contribuição do mencionado termo:

(327) T ( 2 ) λ τ = a 2 [ - g λ τ ρ ( F μ ρ σ F μ σ ) + ρ ( F λ τ σ F τ σ + F τ ρ σ F λ σ ) + λ ( F μ τ ρ F μ ρ ) + τ ( F μ λ ρ F μ ρ ) ] .

Juntando todas as partes, por último, chegamos ao tensor de energia-momento do campo de Podolsky:

(328) T λ τ = F λ σ F - σ τ 1 4 g λ τ F μ ν F μ ν - a 2 2 g λ τ ρ F μ ρ σ F μ σ + a 2 [ - g λ τ F μ ρ ρ σ F μ σ + ρ F λ ρ σ F τ σ + F λ ρ ρ σ F τ σ + F τ ρ ρ σ F λ σ - F τ ρ λ σ F ρ σ - F λ ρ τ σ F ρ σ ] .

Este tensor, é patente, é simétrico e também invariante de calibre, visto que depende únicamente do tensor de Faraday e de suas derivadas.

12. Comentários Finais

Nesse artigo, mostramos, com apenas alguns tópicos escolhidos, a enorme importância que os teoremas de Nöther possuem nas diversas áreas da Física atual.

Iniciamos formulando a teoria clássica do campo de ordem (finita) qualquer, obtendo a equação diferencial de Lie para as transformações que deixam invariante à ação. Especializando para teorias da segunda ordem – suficiente para ilustrar o procedimento geral –, mostramos a forma em que o princípio da ação estacionária de Ostrogradskii–Hamilton leva às equações do movimento, quer elas sejam as de Euler–Lagrange, quando 𝒫=, quer as equações canônicas de Hamilton, quando 𝒫=πoφ-. Assim trabalhamos, seguindo a Nöther, os formalismos lagrangiano e hamiltoniano simultaneamente.

A seguir mostramos o primeiro teorema de Nöther, que se reduz às conhecidas leis de conservação das correntes de Nöther para campos físicos, satisfazendo equações de continuidade e que levam, via a regra integral de Leibniz, ao aparecimento das cargas de Nöther, invariantes no tempo (conservadas) sob condições assintóticas de anulamento dos campos e de suas primeiras derivadas no infinito espacial.

O primeiro teorema recíproco de Nöther foi então enunciado e provado. Vale salientar que, como escrevemos claramente, ele tem por hipótese que

«r combinações linearmente independentes das derivadas funcionais da ação se reduzem a divergências.»

Isto é extremamente importante, pois tal hipótese é diferente da de supor que existam r cargas conservadas para campos físicos. Com efeito, após exemplificarmos brevemente a aplicação dos teoremas para o campo escalar relativístico real e o campo de Schrödinger, passamos a estudar o problema de Kepler na mecânica dos pontos. No formalismo lagrangiano, o vetor de Laplace–Runge–Lenz, que junto à energia e o momento angular determina de forma completa as órbitas no problema de dois corpos, não pode ser relacionado a uma simetria, pois sua derivada temporal não pode ser escrita como combinação linear das derivadas funcionais da ação, logo a tese do teorema recíproco de Nöther não se aplica. Isto mostra que a lagrangiana não contém todas as simetrias do sistema físico que descreve.

O formalismo hamiltoniano, por outro lado, as contém, sim: O espaço das fases é capaz de acomodar as simetrias dinâmicas inexpressíveis no espaço das configurações. De sorte que o primeiro teorema recíproco de Nöther sempre se aplica no formalismo hamiltoniano, em que todas as simetrias estão presentes. Assim sendo, no formalismo hamiltoniano, para campos físicos, a existência de simetrias é equivalente à existência de quantidades conservadas. Aqui, pois, pode-se escolher livremente se se aceita como axioma (matemático) o princípio de simetria (invariância) ou como axioma (empírico) a lei de conservação: as duas escolhas tornam-se logicamente equivalentes.

Além do mais, vimos que as correntes de Nöther são geradoras de transformações canônicas e formam uma álgebra de Lie fechada. Essa álgebra (de parênteses de Poisson) é igual à álgebra (de comutadores) das transformações das coordenadas e momentos. Isto é o que permite encontrar a álgebra do grupo de simetrias estudando a álgebra das correntes de Nöther.

Passando ao segundo teorema de Nöther e seu recíproco, em que o grupo de simetrias é localizado (dependente do ponto), mostramos que em tais circunstâncias é imperativo que ao menos um dos campos envolvidos tenha sua variação dependente das derivadas dos parâmetros do grupo, pois se assim não fosse as equações de Euler–Lagrange tornariam-se identidades.

Provamos que as identidades que derivam desse teorema reduzem-se, para campos físicos, à mesma lei de conservação do primeiro teorema, além de um conjunto de equações de descida que permite construir a corrente conservada por derivações sucessivas de um tensor antissimétrico cujo posto depende da ordem da teoria. Em particular, isto prova que na mecânica do ponto material a corrente de Nöther é nula quando construída com coordenadas físicas.

Finalmente, as identidades do segundo teorema de Nöther levam também a uma redução do número de equações de Euler–Lagrange independentes, isto é, ao aparecimento de vínculos, pois torna em identidades algumas delas, havendo então mais funções incógnitas do que equações para determiná-las. Decorre disto que as condições iniciais não determinam univocamente a evolução posterior do sistema.

Isto foi explicitamente exemplificado no modelo mecânico de Christ–Lee com potencial nulo [requerimento esse que pode perfeitamente ser relaxado adicionando um potencial da forma V(r*r)], que construímos partindo do princípio da invariância de calibre e fazendo um paralelismo com o método de Utiyama.

Na aplicação dos teoremas à eletrodinâmica fermiônica de Maxwell, obtém-se, é conhecido, um tensor canônico de energia-momento que não é nem simétrico nem invariante de calibre. Introduzimos para solucionar tais dificuldades o método de simetrização de Belinfante–Rosenfeld, fazendo-o para teorias de até segunda ordem, mostrando dessa forma, construtivamente, que tal procedimento lhes é aplicável com os resultados desejados. Em qualquer caso, o procedimento consegue simetrizar o tensor canônico de energia-momento sempre que o sistema ao qual se aplica seja fechado, como comprovamos explicitamente.

A eletrodinâmica de Podolsky foi construída estendendo o método de Utiyama para conter teorias de calibre livres da segunda ordem – seguindo a Ref. [25[25] R.R. Cuzinatto, C.A.M. Melo e P.J. Pompeia, Ann. Phys. 322, 1211 (2007).]. O cálculo de seu tensor canônico de energia-momento simetrizado pelo método de Belinfante–Rosenfeld, contudo, é um procedimento longo devido à grande quantidade de termos contidos no tensor de spin. Por isso, estudamos com detalhe a relação deste tensor simetrizado com o tensor métrico de energia-momento definido na teoria da gravidade einsteniana (ou, equivalentemente, na teoria de calibre do grupo das translações). Demonstramos que, para teorias de campos escalares, vetoriais e tensoriais de posto 2, de até segunda ordem, os dois tensores efetivamente se equivalem, exceto pela divergência de um tensor antissimétrico de posto 3; as duas formas de calcular o tensor de energia-momento são, assim, fisicamente equivalentes. Isto permitiu calcular de forma rápida os mencionados tensores tanto para a eletrodinâmica de Maxwell quanto para a de Podolsky.

Finalizamos mencionando alguns pontos que não foram analisados neste artigo.

Ao longo do texto, tem-se usado como hipótese que as variações dos campos – e de suas derivadas até uma determinada ordem – se anulam no infinito. Isto é válido em uma multidão de casos, porém não em todos. Um exemplo notável é o tratamento da teoria da gravidade de Einstein, em que o tensor métrico não se anula no infinito; ainda em soluções «assintóticamente planas», como a de Schwarzschild, a métrica tende ao valor constante igual à metrica do espaço-tempo de Minkowski, mas nunca ao valor nulo. Em tais circunstâncias, por exemplo, se acrescenta à ação termos adicionais, como o termo de York–Gibbons–Hawking.

Hipóteses semelhantes regem a validade do segundo teorema de Nöther, em que os parâmetros e suas derivadas se assumiram nulas na fronteira Ω da região Ω4. A tais transformações se conhece como «transformações de calibre pequenas», em contraposição às «transformações de calibre grandes», que não respeitam à anterior condição. Em tais circunstâncias, os termos de fronteira não podem ser desconsiderados.

Por último, desejamos salientar que a definição do tensor métrico de energia-momento não deve ser considerada a resposta definitiva à questão de como definir semelhante grandeza. Um exemplo claro de que ela não está isenta de dificuldades encontra-se nas teorias com termos topológicos na ação – por exemplo, as teorias de Chern-Simons –, pois tais termos, por serem independentes da métrica, não contribuem para a derivada funcional da ação em relação a esta. Fica claro que a construção do tensor físico de energia-momento não é um assunto trivial.

Não há dúvidas, esperamos ter deixado claro, de que os teoremas de Nöther são ferramentas extremamente poderosas para o estudo da Física e que suas aplicações vão muito além do cálculo das cargas conservadas. É justo, pois, reconhecer os desdobramentos a que eles têm conduzido, alguns dos quais apontamos neste artigo.

Agradecimentos

B.M.P. agradece ao CNPq o apoio financeiro parcial. Dedicado ao professor Henrique Fleming.

Material suplementar

O seguinte material suplementar está disponível online: A Formulação de Lévy-Leblond-Jackiw

Referências

  • [1]
    Y. Kosmann-Schwarzbach, The Noether Theorems. Invariance and Conservation Laws in the Twentieth Century (Springer, Nova Iorque, 2011).
  • [2]
    E. Noether, Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-Physikalische Klasse 1918, 235 (1918).
  • [3]
    Y.J. Cuesta, N.T. Massoni, J.A. Salamanca e C.J. Mosquera, Rev. Bras. Ens. Fís. 43, e20200510 (2021).
  • [4]
    A.A. Logunov e M.A. Mestvirishvili, Progress of Theoretical Physics 74, 31 (1985).
  • [5]
    A.A. Logunov e Yu.M. Loskutov, Theor. Math. Phys. 67, 163 (1986).
  • [6]
    A.A. Logunov e M.A. Mestvirishvili, The Relativistic Theory of Gravitation (Mir Publishers Moscow, Moscou, 1989).
  • [7]
    L.M. Lederman e C.T. Hill, Symmetry and the beautiful universe (Prometheus Books, Nova Iorque, 2004).
  • [8]
    N.P. Konopleva e V.N. Popov, Gauge Fields (Harwood Acad. Publishers, Nova Iorque, 1981).
  • [9]
    W. Kaplan, Advanced Calculus (Pearson, Boston, 2003), 5 ed.
  • [10]
    M. Ostrogradsky, Mémoires de l’Académie Impériale Des Sciences de Saint-Pétersbourg 6, 385 (1848).
  • [11]
    H.J. Schmidt, Phys. Rev. D 49, 6354 (1994).
  • [12]
    H. Goldstein, C.P. Poole e J. Safko, Classical Mechanics (Pearson, Nova Iorque, 2002), 3 ed.
  • [13]
    L. Landau e E. Lifshitz, Curso abreviado de física teórica. Libro 1. Mecánica y electrodinámica (Editorial Mir Moscú, Moscou, 1971).
  • [14]
    P.J. Olver, Applications of Lie Groups to Differential Equations (Springer, Nova Iorque, 1993), 2 ed.
  • [15]
    L. Elsgoltz, Ecuaciones Diferenciales y cálculo variacional (Editorial Mir Moscú, Moscou, 1969).
  • [16]
    A. Oldofredi e C. López, Found. Phys. 50, 1315 (2020).
  • [17]
    L.G. Caro, B.M. Pimentel e G.E.R. Zambrano, Rev. Bras. Ens. Fís. 43, e20210273 (2021).
  • [18]
    R. Utiyama, Phys. Rev. 101, 1597 (1956).
  • [19]
    O.A. Acevedo, R.R. Cuzinatto, B.M. Pimentel e P.J. Pompeia, Rev. Bras. Ens. Fís. 40, e4302 (2018).
  • [20]
    M. Blagojević, Gravitation and gauge symmetries (IoP, Cornwall, 2002).
  • [21]
    N.H. Christ e T.D. Lee, Phys. Rev. D 22, 939 (1980).
  • [22]
    L.D. Landau e E.M. Lifshitz, Teoría clásica de los campos. Volumen 2 del Curso de Física Teórica (Editorial Reverté, Barcelona, 1992), 2 ed.
  • [23]
    D.N. Blaschke, F. Gieres, M. Reboud e M. Schweda, Nucl. Phys. B 912, 192 (2016).
  • [24]
    G. Grensing, Structural Aspects of Quantum Field Theory. Vol. 1 (World Scientific, Singapore, 2013).
  • [25]
    R.R. Cuzinatto, C.A.M. Melo e P.J. Pompeia, Ann. Phys. 322, 1211 (2007).
  • [26]
    R. Bufalo, B.M. Pimentel e G.E.R. Zambrano, Phys. Rev. D 86, 125023 (2012).
  • [27]
    G. Scharf, Gauge Field Theories: Spin One and Spin Two. 100 Years After General Relativity (Dover, Nova Iorque, 2016).
  • [28]
    B. Schroer, Eur. Phys. J. C 75, 365 (2015).
  • [29]
    J. Frenkel, Phys. Rev. E 54, 5859 (1996).
  • [30]
    G. Scharf, Finite Quantum Electrodynamics. The Causal Approach (Dover, Nova Iorque, 2014), 3 ed.
  • [31]
    H. Fleming, O tensor de momento-energia métrico, e o canônico, disponível em: hfleming.com
    » hfleming.com
  • [32]
    R. D’Inverno, Introducing Einstein’s Relativity (Oxford University Press, Nova Iorque, 2002).
  • [33]
    M. Montesinos e E. Flores, Rev. Mex. Fís. 52, 29 (2006).
  • [34]
    J.M. Lévy-Leblond, Am. J. Phys. 39 502 (1971).
  • [35]
    R. Jackiw, em: Lectures on Current Algebra and its Applications (Princeton University Press, Nova Jersey, 1972).
  • [36]
    H. Fleming, Rev. Bras. Fís. 17, 236 (1987).
  • 1
    Usamos a consumada tradução ao português do termo inglês gauge .
  • 2
    Salientamos, por exemplo, as críticas (construtivas) de Logunov e colaboradores e suas tentativas por basear a teoria da gravidade no estudo das quantidades conservadas, levando a uma teoria (denominada «teoria relativística da gravitação») que, no momento presente, pelas limitações na precisão das observações astronômicas, é indistinguível da teoria einsteniana [4[4] A.A. Logunov e M.A. Mestvirishvili, Progress of Theoretical Physics 74, 31 (1985)., 5[5] A.A. Logunov e Yu.M. Loskutov, Theor. Math. Phys. 67, 163 (1986)., 6[6] A.A. Logunov e M.A. Mestvirishvili, The Relativistic Theory of Gravitation (Mir Publishers Moscow, Moscou, 1989).].
  • 3
    Na notação que usaremos, a variação «Δ» é a que comumente se denota «δ¯», e que representa a variação das coordenadas e da forma funcional do campo.
  • 4
    Embora seja a mais comum, essa interpretação é discutível, como demonstram as diversas interpretações que historicamente têm sido dadas à mecânica quântica. Uma recente exposição e classificação delas pode ser lida na Ref. [16[16] A. Oldofredi e C. López, Found. Phys. 50, 1315 (2020).].
  • 5
    Ao mesmo resultado pode-se chegar escrevendo Δri=Δφj(Uj)ikrk e lembrando que, como o grupo SO(3) possui três parâmetros, sobre o espaço tridimensional age sua representação adjunta, em que os geradores são (Uj)=kiεijk.
  • 6
    É mister indicar explicitamente que o caráter deste grupo de infinitos parâmetros é precisamente o acima indicado, isto é, que se constrói a partir da «localização» de um grupo de um número finito de parâmetros, Gr. Com efeito, o segundo teorema de Nöther não diz respeito à invariância da ação perante transformações de grupos quaisquer de infinitos parâmetros. Quanto a estes, quando os parâmetros são os mesmos para todos os pontos do espaço-tempo, o primeiro teorema de Nöther ainda é aplicável [2[2] E. Noether, Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-Physikalische Klasse 1918, 235 (1918).].
  • 7
    Isto, está claro, não contradiz o primeiro teorema de Nöther, pois nele os parâmetros da transformação, ao serem constantes, não podem se anular na fronteira da região Ω e, por isso, a tese do segundo teorema não se aplica a essas transformações. As transformações a que se submete aos campos nos dois teoremas são de diferente natureza.
  • 8
    O estabelecimento do formalismo hamiltoniano para sistemas singulares (vinculados) pode ser realizado de diversas formas, dentre as quais se destacam a abordagem de Dirac e a de Faddeev e Jackiw – uma revisão deste último método na mecânica clássica pode ser consultada, por exemplo, na Ref. [17[17] L.G. Caro, B.M. Pimentel e G.E.R. Zambrano, Rev. Bras. Ens. Fís. 43, e20210273 (2021).].
  • Essa «prescrição» tem a categoria de um teorema na mecânica do ponto material, pois nela não existe um análogo ao tensor de Faraday da eletrodinâmica. Ela é uma prescrição, sim, na teoria do campo clássico, pois presume que não há interação nenhuma entre os campos de matéria e as derivadas dos campos de calibre, condição que não segue do princípio da invariância de calibre. Mais detalhes a este respeito serão dados na seção10 10. Eletrodinâmica de Podolsky Esta seção, dedicada à eletrodinâmica de Podolsky, nos permitirá mostrar a grande variabilidade dos procedimentos que podem ser usados em conjunção com os teoremas de Nöther, permitindo visualizar seu alcance e possibilidades. A teoria de Podolsky pode ser construída como uma teoria de calibre livre da segunda ordem. § Densidade lagrangiana de Podolsky: Se, diferentemente ao suposto na seção8, consideramos que a densidade lagrangiana do campo de calibre pode depender não só das derivadas desse de até a primeira ordem como também até a segunda17, ℒA=ℒA⁢(A;∂⁡A;∂⁡∂⁡A), então a variação sob uma transformação de calibre local será, em substituição da Eq. (170), (255) Δ ℒ A = ∂ ℒ A ∂ A μ Δ A μ + ∂ ℒ A ∂ ( ∂ ν A μ ) ∂ ν Δ A μ + ∂ ℒ A ∂ ( ∂ ρ ∂ ν A μ ) ∂ ρ ∂ ν Δ A μ = 1 e ∂ ℒ A ∂ A μ ∂ μ α + 1 2 e ( ∂ ℒ A ∂ ( ∂ ν A μ ) + ∂ ℒ A ∂ ( ∂ μ A ν ) ) ∂ μ ∂ ν α + 1 3 e ( ∂ ℒ A ∂ ( ∂ ρ ∂ ν A μ ) + ∂ ℒ A ∂ ( ∂ ρ ∂ μ A ν ) + ∂ ℒ A ∂ ( ∂ μ ∂ ν A ρ ) ) ∂ ρ ∂ ν ∂ μ α . Logo vemos que a condição de invariância deriva nas seguintes três relações: (256) ∂ ⁡ ℒ A ∂ ⁡ A μ = 0 , (257) ∂ ⁡ ℒ A ∂ ⁡ ( ∂ ν ⁡ A μ ) + ∂ ⁡ ℒ A ∂ ⁡ ( ∂ μ ⁡ A ν ) = 0 , (258) ∂ ⁡ ℒ A ∂ ⁡ ( ∂ ρ ⁡ ∂ ν ⁡ A μ ) + ∂ ⁡ ℒ A ∂ ⁡ ( ∂ ρ ⁡ ∂ μ ⁡ A ν ) + ∂ ⁡ ℒ A ∂ ⁡ ( ∂ μ ⁡ ∂ ν ⁡ A ρ ) = 0 . As duas primeiras já as conhecemos: Elas indicam, respectivamente, que o campo de calibre é não massivo e que a dependência da densidade lagrangiana com suas primeiras derivadas ocorre através do tensor de Faraday. A Eq. (258), finalmente, indica que a dependência com as segundas derivadas de Aμ acontece por meio do tensor (259) G σ ⁢ λ ⁢ τ := ∂ σ ⁡ ∂ λ ⁡ A τ - ∂ σ ⁡ ∂ τ ⁡ A λ = ∂ σ ⁡ F λ ⁢ τ . Uma densidade lagrangiana respeitando a esses requerimentos é a que descreve à «eletrodinâmica de Podolsky»: (260) ℒ A = - 1 4 ⁢ F μ ⁢ ν ⁢ F μ ⁢ ν + a 2 2 ⁢ ∂ ρ ⁡ F μ ⁢ ρ ⁢ ∂ σ ⁡ F μ ⁢ σ , com o «parâmetro de Podolsky» a∈ℝ a ser determinado fenomenologicamente18. Se bem que outras densidades lagrangianas, igualmente quadráticas no tensor G, são possíveis, pode-se provar que todas elas se diferenciam da de Podolsky apenas por termos de superfície e portanto lhe são físicamente equivalentes. Isto permite estabelecer que o eletromagnetismo de Podolsky é a generalização do eletromagnetismo de Maxwell mais simples à segunda ordem. § Equações do movimento e segundo teorema de Nöther: Com a densidade lagrangiana da Eq. (260) calculamos as derivadas funcionais da ação: (261) δ ⁢ 𝒜 δ ⁢ A σ = ( 1 + 2 ⁢ a 2 ⁢ □ ) ⁢ ∂ μ ⁡ F μ ⁢ σ . As equações do movimento são obtidas por igualação a zero da anterior derivada funcional; em função do campo de calibre Aμ, (262) ( 1 + 2 ⁢ a 2 ⁢ □ ) ⁢ ( □ ⁢ A σ - ∂ σ ⁡ ( ∂ ⁡ A ) ) = 0 . Por outro lado, para escrever a tese do segundo teorema de Nöther, notamos primeiramente, por comparação com a Eq. (100), que (263) Δ ⁢ A σ = 1 e ⁢ ∂ σ ⁡ α ⇒ ( a σ ) = 0 , ( b σ ) ρ = 1 e ⁢ δ σ ρ , ( c σ ) ρ ⁢ τ = 0 . Substituindo estes valores e a Eq. (261) na Eq. (104) obtém-se que (264) ∂ ρ ⁡ ( ( b σ ) ρ ⁢ δ ⁢ 𝒜 δ ⁢ A σ ) = 0 ⇒ ( 1 + 2 ⁢ a 2 ⁢ □ ) ⁢ ∂ μ ⁡ ∂ ρ ⁡ F μ ⁢ ρ = 0 , mesmo sem o cumprimento das equações do movimento. Já a lei de conservação que rege sob o cumprimento delas pode ser obtida pelo sistema de equações de descida, Eq. (114). Para estabelecê-lo, começamos calculando as quantidades (Aσ)μ e (Bσ)μ⁢ν da Eq. (107): (265) ( A σ ) μ = ( 1 + 2 ⁢ a 2 ⁢ □ ) ⁢ F μ ⁢ σ - a 2 ⁢ ∂ σ ⁡ ∂ ρ ⁡ F μ ⁢ ρ , (266) ( B σ ) μ ⁢ ν = a 2 ⁢ ( g μ ⁢ σ ⁢ ∂ ρ ⁡ F ν ⁢ ρ + g ν ⁢ σ ⁢ ∂ ρ ⁡ F μ ⁢ ρ - 2 ⁢ g μ ⁢ ν ⁢ ∂ ρ ⁡ F σ ⁢ ρ ) . Como (cσ)μ⁢ν=0, o sistema de equações de descida começa com o tensor [vide a Eq. (112)] (267) J ( 2 ) μ ⁢ ν ⁢ ρ = - ( B σ ) μ ⁢ ρ ⁢ ( b σ ) ν = - a 2 e ⁢ ( g μ ⁢ ν ⁢ ∂ τ ⁡ F ρ ⁢ τ + g ρ ⁢ ν ⁢ ∂ τ ⁡ F μ ⁢ τ - 2 ⁢ g μ ⁢ ρ ⁢ ∂ τ ⁡ F ν ⁢ τ ) . Tomando sua divergência em relação ao índice μ, obtemos a seguinte corrente: (268) J ( 1 ) ν ⁢ ρ = ∂ μ ⁡ J ( 2 ) μ ⁢ ν ⁢ ρ = - a 2 e ⁢ ∂ τ ⁡ ( ∂ ν ⁡ F ρ ⁢ τ - 2 ⁢ ∂ ρ ⁡ F ν ⁢ τ ) . Por divergência desta, finalmente, obtém-se a corrente conservada (269) j ρ = ∂ ν ⁡ J ( 1 ) ν ⁢ ρ = - a 2 e ⁢ ( ∂ τ ⁡ □ ⁢ F ρ ⁢ τ ) = e.d.m. - 1 e ⁢ ∂ μ ⁡ F μ ⁢ ρ . Destarte, a lei de continuidade ∂ρ⁡jρ=0 leva à equação (270) ∂ μ ⁡ ∂ ρ ⁡ F μ ⁢ ρ = 0 , que é a mesma equação obtida na eletrodinâmica de Maxwell, Eq. (184). § Tensor de energia-momento do campo de Podolsky: A fórmula geral para o tensor de energia-momento de uma teoria da segunda ordem aparece na Eq. (16). Em função das quantidades (Aσ)μ e (Bσ)μ⁢ν, (271) Θ μ ⁢ ρ = - ℒ ⁢ g μ ⁢ ρ - ( A σ ) μ ⁢ ∂ ρ ⁡ A σ + ( B σ ) μ ⁢ ν ⁢ ∂ ρ ⁡ ∂ ν ⁡ A σ . Com a densidade lagrangiana de Podolsky e as Eqs. (265) e (266), o cálculo direto permite encontrar, após simplificação, (272) Θ μ ⁢ ρ = 1 4 ⁢ F λ ⁢ τ ⁢ F λ ⁢ τ ⁢ g μ ⁢ ρ - a 2 2 ⁢ ∂ σ ⁡ F λ ⁢ σ ⁢ ∂ τ ⁡ F λ ⁢ τ ⁢ g μ ⁢ ρ - ( 1 + 2 ⁢ a 2 ⁢ □ ) ⁢ F μ ⁢ σ ⁢ ∂ ρ ⁡ A σ + a 2 ( ∂ λ F σ ⁢ λ ∂ ρ F - σ μ ∂ λ F σ ⁢ λ ∂ μ ∂ ρ A σ ) + ∂ σ ⁡ ( a 2 ⁢ ∂ λ ⁡ F μ ⁢ λ ⁢ ∂ ρ ⁡ A σ ) . É evidente que, tomando o limite a2→0 a equação anterior corresponde ao tensor canônico de energia-momento do campo de Maxwell, Eq. (189). Além do mais, nota-se que o último termo, embora seja uma divergência, não pode ser desconsiderado, pois o tensor entre os parênteses não é antissimétrico nos índices σ e μ, e por isso pode, sim, ter contribuição para as componentes do vetor de energia-momento. Apesar de Θμ⁢ρ não ser invariante de calibre, quando uma destas transformações é aplicada, a variação do mencionado tensor é, sob o cumprimento das equações do movimento, (273) Δ Θ μ ⁢ ρ = 1 e ∂ σ { - ( 1 + 2 a 2 □ ) F μ ⁢ σ ∂ ρ α + a 2 ∂ λ F μ ⁢ λ ∂ ρ ∂ σ α - a 2 ∂ λ F σ ⁢ λ ∂ ρ ∂ μ α } , ou seja, igual à divergência, em relação ao índice σ, de um tensor antissimétrico em seus índices σ e μ. Como consequência, o vetor de energia-momento, que são as quantidades conservadas sob condições assintóticas apropriadas, são invariantes de calibre. Como o tensor encontrado não é simétrico, para simetrizá-lo precisaremos aplicar o procedimento de Belinfante-Rosenfeld, o qual começa com o cálculo do tensor do spin, que para a teoria da segunda ordem, tem a expressão mostrada na Eq. (215). Em função das quantidades (Aσ)μ e (Bσ)μ⁢ν, se escreve (274) S = λ ⁢ τ μ - ( A σ ) μ ( U λ ⁢ τ A ) σ + ( B σ ) μ ⁢ ν ⋅ [ ∂ ν ( U λ ⁢ τ A ) σ - ( ∂ λ A σ g ν ⁢ τ - ∂ τ A σ g ν ⁢ λ ) ] . Precisamos usar nela a Eq. (243), isto é, (275) ( U λ τ A ) μ = ( U λ τ ) μ ν A ν = δ λ μ A τ − δ τ μ A λ . Após simplificação, o resultado é (276) S μ λ τ = − ( 1 + 2 a 2 □ ) F μ λ A τ + ( 1 + 2 a 2 □ ) F μ τ A λ − a 2 ( ∂ λ ∂ ρ F μ ρ A τ − ∂ τ ∂ ρ F μ ρ A λ ) + 2 a 2 ( g μ λ ∂ ρ F σ ρ F − σ τ g μ τ ∂ ρ F σ ρ F σ λ − ∂ ρ F τ ρ F λ μ + ∂ ρ F λ ρ F τ μ ) − a 2 ( g μ λ ∂ ρ F σ ρ ∂ σ A τ − g μ τ ∂ ρ F σ ρ ∂ σ A λ − ∂ ρ F τ ρ ∂ λ A μ + ∂ ρ F λ ρ ∂ τ A μ ) . Reconhece-se, mais uma vez, que no limite em que a2→0 o resultado anterior se iguala ao obtido para a teoria de Maxwell, Eq. (246), que agora se vê modificado pelos termos proporcionais ao quadrado do parâmetro de Podolsky. A partir deste ponto, o procedimento pode ser continuado, calculando o tensor de Belinfante-Rosenfeld, sua divergência e adicionando-a ao tensor canônico de energia-momento. É patente, contudo, que semelhante procedimento não é facilmente aplicável devido à quantidade de termos contidos no tensor do spin. Por isso, desenvolveremos na seção11 uma técnica alternativa para o cálculo do tensor simétrico de energia-momento. .
  • 10
    Note, além do mais, que as derivadas funcionais da ação podem ser escritas de forma sucinta em função das quantidades covariantes: As equações do movimento são
    Dt2r=0,(Dt*)2r*=0,r*V=rV*.
  • 11
    O que, de passagem, confirma o que dissemos no comentário que segue à Eq. (121).
  • 12
    A dependência de Av/r permite interpretar a coordenada de calibre como um análogo ao potencial de Liénard-Wiechert no limite de velocidade lumínica infinita. Com efeito, na teoria do campo, a invariância local perante o grupo U(1) é obtida com a introdução do potencial eletromagnético.
  • 13
    Na teoria do campo, é consequência disto que os campos de calibre somente podem ser quantizados uma vez que o calibre tenha sido fixado.
  • 14
    Este argumento somente é válido para a teoria da gravitação de Einstein e generalizações dela em que a geometria efetiva do espaço-tempo é pseudo-riemanniana. Em teorias como a de Einstein-Cartan (ou, vista como uma teoria de campos de calibre associada ao grupo de Poincaré, a de Kibble-Sciama), em que o espaço-tempo pode ter torsão não nula, o tensor de energia-momento que é fonte do campo gravítico não é, em geral, simétrico. Por outro lado, o uso de fontes gravitacionais fermiônicas apresenta uma dificuldade adicional: O tensor de energia-momento calculado no formalismo das tétradas – o que é essencial para poder abordar a teoria (geométrica) em presença de férmions – é em geral não simétrico; isto estabelece uma relação geral entre o spin da matéria e a torsão do espaço-tempo, visível nas equações do movimento de Einstein-Cartan-Kibble-Sciama. Na teoria de relatividade geral, tal dificuldade é superada simplesmente definindo como a fonte do campo gravitacional a parte simétrica do tensor obtido [23[23] D.N. Blaschke, F. Gieres, M. Reboud e M. Schweda, Nucl. Phys. B 912, 192 (2016).].
  • 15
    Note, além do mais, que o mencionado resultado não era previsível e, por isso, foi necessário fazer o cálculo do tensor do spin de posto 3 para o campo de Dirac livre.
  • 16
    Ainda no caso geral, embora seja possível que apareçam derivadas do campo de matéria no termo de interação, não aparecerá jamais a derivada do campo de calibre, se o acoplamento é mínimo (tal condição é, verdadeiramente, a própria definição das palavras «acoplamento mínimo»).
  • 17
    A construção de teorias de calibre da segunda ordem, pelo método de Utiyama, para grupos de Lie de simetrias internas gerais, é apresentada na Ref. [25[25] R.R. Cuzinatto, C.A.M. Melo e P.J. Pompeia, Ann. Phys. 322, 1211 (2007).].
  • 18
    Por exemplo, na Ref. [26[26] R. Bufalo, B.M. Pimentel e G.E.R. Zambrano, Phys. Rev. D 86, 125023 (2012).], seu valor é restringido a ser menor que 2,66×10-11 eV-1 pela comparação do cálculo do momento magnético anômalo do elétron à terceira ordem da série perturbativa (um loop ) com o valor experimental.
  • 19
    Como dissemos alhures, a consideração do campo fermiônico requeriria a introdução do formalismo das tétradas; deixamos esse ponto para o futuro.
  • 20
    Essa é a ideia central do teleparalelismo. Entretanto, é mister mencionar que, embora qualquer transformação das coordenadas esteja inclusa na Eq. (277) – por exemplo, a Eq. (277) bem poder-se-ia entender, também, como uma transformação de Poincaré localizada, escrevendo ω(x)νμxν+εμ(x)ξμ(x)–, os diferentes grupos de calibre que se têm associado à gravidade se diferenciam na lei de transformação local dos campos. Nesta seção, as mudanças dos campos são devidas só às mudanças das coordenadas, de forma que tais diferenças não estarão presentes.
  • 21
    Note, de passagem, que a condição de anulamento da variação funcional da métrica corresponde à equação de Killing, a qual determina as transformações de coordenadas que representam simetrias do espaço-tempo em estudo.

Datas de Publicação

  • Publicação nesta coleção
    04 Ago 2023
  • Data do Fascículo
    2023

Histórico

  • Recebido
    1 Abr 2023
  • Revisado
    1 Jun 2023
  • Aceito
    11 Jun 2023
Sociedade Brasileira de Física Caixa Postal 66328, 05389-970 São Paulo SP - Brazil - São Paulo - SP - Brazil
E-mail: marcio@sbfisica.org.br