Acessibilidade / Reportar erro

Um breve tratado sobre a aproximação paraxial

A brief treatise on the paraxial approximation

Resumos

A equação de ondas paraxial emerge na descrição de diversos problemas em física e engenharia. Por exemplo, na mecânica quântica a equação de Schrödinger é uma aproximação paraxial da teoria relativística. Ela aparece também no estudo da propagação de ondas eletromagnéticas, nas mais variadas situações. Na presente contribuição apresentamos uma revisão geral da equação paraxial e sua obtenção em diversas situações importantes para a física e a engenharia. Analogias entre a equação paraxial no estudo de ondas eletromagnéticas e a equação de Schrödinger da mecânica quântica são discutidas, bem como a relação entre paraxialidade e transversalidade das ondas eletromagnéticas. Por fim, alguns exemplos interessantes de propagação de ondas no limite de paraxialidade são considerados.

eletromagnéticas; equação paraxial; equação de Schrödinger


The paraxial wave equation describes many problems in Physics and Engineering. For instance, the Schrödinger equation describing non-relativistic particles can be considered as a paraxial approximation of the relativistic quantum mechanics. The paraxial equation also emerges in the study of the electromagnetic waves propagation in a large number of physical situations. In this contribution we present an overview of the paraxial wave equation and its derivation in relevant problems for Physics and Engineering. Analogies between the electromagnetic paraxial equation and the quantum mechanical Schrödinger equation are discussed, as well as the relationship between paraxiality and transversality of electromagnetic waves. Finally, a few interesting examples of wave propagation in the paraxial limit are considered.

electromagnetic waves; paraxial equation; Schrödinger equation


ARTIGOS GERAIS

Um breve tratado sobre a aproximação paraxial

A brief treatise on the paraxial approximation

Moisés Fernandes de SouzaI, II; Reinaldo SilveiraII; K.Z. NóbregaIII; C.A. DartoraI, 1 1 E-mail: cadartora@eletrica.ufpr.br.

IDepartamento de Engenharia Elétrica, Universidade Federal do Paraná, Curitiba, PR, Brasil

IIInstituto Tecnológico SIMEPAR, Curitiba, PR, Brasil

IIIDepartamento de Eletroeletrônica, Instituto Federal do Maranhão, São Luis, MA, Brasil

RESUMO

A equação de ondas paraxial emerge na descrição de diversos problemas em física e engenharia. Por exemplo, na mecânica quântica a equação de Schrödinger é uma aproximação paraxial da teoria relativística. Ela aparece também no estudo da propagação de ondas eletromagnéticas, nas mais variadas situações. Na presente contribuição apresentamos uma revisão geral da equação paraxial e sua obtenção em diversas situações importantes para a física e a engenharia. Analogias entre a equação paraxial no estudo de ondas eletromagnéticas e a equação de Schrödinger da mecânica quântica são discutidas, bem como a relação entre paraxialidade e transversalidade das ondas eletromagnéticas. Por fim, alguns exemplos interessantes de propagação de ondas no limite de paraxialidade são considerados.

Palavras-chave: eletromagnéticas, equação paraxial, equação de Schrödinger.

ABSTRACT

The paraxial wave equation describes many problems in Physics and Engineering. For instance, the Schrödinger equation describing non-relativistic particles can be considered as a paraxial approximation of the relativistic quantum mechanics. The paraxial equation also emerges in the study of the electromagnetic waves propagation in a large number of physical situations. In this contribution we present an overview of the paraxial wave equation and its derivation in relevant problems for Physics and Engineering. Analogies between the electromagnetic paraxial equation and the quantum mechanical Schrödinger equation are discussed, as well as the relationship between paraxiality and transversality of electromagnetic waves. Finally, a few interesting examples of wave propagation in the paraxial limit are considered.

Keywords: electromagnetic waves, paraxial equation, Schrödinger equation.

1. Introdução

As equações de Maxwell descrevem todos os fenômenos eletromagnéticos conhecidos de modo bastante preciso, e quando são quantizadas apresentam concordância extraordinária entre teoria e dados experimentais. Na forma clássica e no mundo macroscópico, são dadas por [1]

onde é a densidade volumétrica de carga e J é o vetor densidade de corrente, medidas em , respectivamente, E é o vetor intensidade de campo elétrico, medido em V/m, D é o vetor deslocamento elétrico em , H é o vetor intensidade de campo magnético em A/m e B é o vetor densidade de fluxo magnético em . Todas as unidades utilizadas estão dadas no sistema internacional de medidas (SI). Para completar o conjunto das equações, é necessário conhecer as relações constitutivas dos meios, que descrevem a resposta dos meios materiais à aplicação dos campos E e H. Restringindo a atenção ao caso de um meio material não-magnético isotrópico, de maior interesse para o momento, na presença de campos eletromagnéticos E(r,t) e H(r,t) que variam suavemente no espaço em comparação com a escala atômico-molecular, a resposta de um material é dada pelas relações abaixo

onde P é a densidade de polarização dielétrica do meio, µ'0=4π×10H/m é a permeabilidade magnética do vácuo, é a permissividade dielétrica do vácuo e a função resposta ou susceptibilidade dielétrica do meio material no domínio do tempo.

Nos estudos da propagação de ondas na mais ampla gama de frequências do espectro feitos através das equações de Maxwell são raras as situações físicas reais em que a solução analítica exata é conhecida, fazendo necessária a simplificação ou aproximação adequada ao problema físico que torne a análise matematicamente tratável. Por exemplo, em frequências baixas, ou seja, quando as dimensões físicas relevantes envolvidas no problema são muito menores do que o comprimento de onda λ associado ao sinal elétrico propagante no sistema, as equações de Maxwell podem ser reduzidas a um conjunto de relações e leis conhecidas como teoria de circuitos elétricos, onde os aspectos ondulatórios ficam ocultados diante do fato de que o atraso temporal envolvido na propagação dos sinais elétricos é desprezável. No outro extremo tem-se a óptica geométrica, que também pode ser derivada das equações de Maxwell, onde a trajetória de raios é geralmente suficiente para descrever de maneira precisa os fenômenos luminosos. Por outro lado, a óptica física escalar desconsidera o caráter vetorial do eletromagnetismo levando em conta todos os outros aspectos da propagação de ondas, sendo portanto uma versão muito superior à óptica geométrica [2-5]. A aproximação mais útil da equação de ondas para estudar a propagação de feixes ópticos é denominada equação paraxial e está intimamente relacionada à óptica de Fourier. No domínio óptico a equação paraxial encontra sua principal aplicação e é onde tem maior precisão e sucesso. Nas frequências de micro-ondas, geralmente não é possível utilizar a descrição de circuitos, enquanto alguns aspectos de propagação em longas distâncias são tratáveis pela óptica geométrica, recurso frequentemente empregado em algorítimos de cálculo de enlace em sistemas de telecomunicações. Entretanto um modelo mais sofisticado pode empregar a equação paraxial para descrever a propagação de ondas eletromagnéticos em ambientes reais no domínio de micro-ondas, onde a topografia e topologia do terreno tornam-se importantes.

Nesse ponto, o leitor pode questionar a vantagem de fazer aproximações à equação de ondas, para obter uma nova equação diferencial que ainda envolve derivadas parciais. A resposta está no fato de que na chamada aproximação paraxial, de que trataremos com detalhes na presente contribuição, algum termo de variação rápida em relação a determinado eixo é removido e derivadas de segunda ordem em relação a essa coordenada se tornam desprezáveis, restando apenas derivadas de primeira ordem para essa variável. A equação de ondas original apresenta derivadas de segunda ordem em todas as coordenadas enquanto que a aproximação paraxial retém somente a derivada de primeira ordem em relação a alguma dessa variáveis. A vantagem fica evidente quando a solução buscada para o problema é do tipo que propaga-se porque na implementação numérica métodos de solução de sistemas de equações diferenciais de primeira ordem são amplamente conhecidos, estudados e robustos. O exemplo mais simples é o método de Runge-Kutta.

O objetivo desta contribuição é encontrar a equação paraxial escalar para ondas eletromagnéticas propagantes, permitindo a análise de propagação de micro-ondas em sistemas de comunicação, tendo como ponto de partida as equações de Maxwell. Além de ser um problema de interesse prático para a engenharia, é importante observar que em muitos cursos de graduação em física e engenharia, raramente os alunos são estimulados a trabalhar as equações de Maxwell fora daquelas situações padrão consideradas nos cursos de eletromagnetismo e física básica, como por exemplo a solução de onda plana uniforme. Sendo assim, a aproximação paraxial da equação de ondas é geralmente ignorada no ensino de ondas, muitas vezes por falta de tempo em um curso de um semestre de duração. Todavia, além da importância na descrição de propagação de feixes ópticos, a equação paraxial tem imensa similaridade com a equação de Schrödinger não-relativística, permitindo assim aos alunos de física principalmente uma melhor compreensão da mecânica quântica através de analogias mais palpáveis no mundo da óptica. Alguns aspectos da relação entre a óptica e a mecânica quântica já foram abordados em textos de ensino por alguns dos autores deste trabalho [6,7].

O conteúdo do presente trabalho está organizado da seguinte maneira: Na Seção 2, definem-se as transformadas de Fourier para obter as equações de Maxwell no domínio da frequência e a partir destas encontrar a equação de ondas para o campo elétrico em meios não-homogêneos. Na Seção 3, a questão de paraxialidade e transversalidade das ondas eletromagnéticas é discutida com base em um simples exercício de superposição de ondas planas uniformes e a equação paraxial é deduzida a partir da equação de ondas obtida na seção anterior. Além disso analogias entre a equação paraxial e a equação de Schrödinger da mecânica quântica são apontadas. Na Seção 4, alguns exemplos pertinentes de aplicações em óptica e micro-ondas são apresentados e discutidos. Finalmente, na Seção 5 são apresentadas as conclusões gerais deste trabalho.

2. A equação de ondas em meios não-magnéticos isotrópicos

Definindo a transformada de Fourier conectando os espaços duais de tempo t e frequência ω na forma abaixo

podemos aplicá-la ao conjunto de equações de Maxwell (23)-(26) e também às Eqs. (5)-(7). Vamos considerar aqui por simplicidade apenas meios macroscopicamente neutros que satisfaçam a lei vetorial de Ohm, onde a densidade de corrente J e o campo elétrico E são proporcionais entre si no domínio da frequência,

onde σ é a condutividade elétrica do material. Nesse caso, é conveniente definir a permissividade dielétrica complexa do material, εc, na forma abaixo

Note que a grandeza física εc incorpora os efeitos da condutividade elétrica do material através da sua parte imaginária. No domínio da frequência a integral de convolução (7) reduz-se a um produto

e a Eq. (5) toma a forma abaixo

onde a permissividade dielétrica complexa é relacionada à função resposta susceptibilidade dielétrica pela equação abaixo

É importante notar que no domínio da frequência a relação entre a polarização dielétrica e o campo elétrico aplicado é dada diretamente pela equação P=ε0χeE. Fica como exercício para o leitor demonstrar que as equações de Maxwell no domínio de frequência podem ser escritas na seguinte forma

Para obter a equação de ondas para o campo elétrico, primeiro aplicamos o operador rotacional à Eq. (16) e posteriormente fazemos uso da Eq. (17) e da identidade , sabendo-se ainda que nesta última podemos substituir ∇⋅E pelo lado direito da Eq. (14). O leitor pode demonstrar que o resultado é a seguinte equação de ondas

onde , k é a constante de propagação. Aqui já temos um diferencial em relação à equação de ondas que é geralmente demonstrada em cursos básicos de teoria eletromagnética, porque lá o meio é considerado homogêneo, ou seja, εc não depende da posição, fazendo o lado direito da equação acima nulo. Para meios não-homogêneos o termo do lado direito produz efeitos não triviais devido ao acoplamento entre as diversas componentes dos campos eletromagnéticos, sobretudo na polarização dos campos. Para deixar essa ideia clara, consideremos uma situação muito simples, em que a permissividade dielétrica depende somente da coordenada z, isto é, . Como exemplo concreto onde essa aproximação seria razoavelmente aceitável podemos citar a atmosfera terrestre, onde o eixo z é o eixo vertical e representa a altitude. Sabemos que a rarefação do ar atmosférico com o aumento da altitude faz com que o índice de refração n, e consequentemente a permissividade dielétrica, diminuam, uma vez que estão relacionados pela equação . Escrita em termos de componentes, a equação de ondas (18) para esse problema é dada por

onde fica claro que a componente Ez acopla-se com as componentes por intermédio da derivada da permissividade dielétrica em relação à variável z. O desacoplamento ocorrerá somente se , correpondendo a um conjunto de solução particular desse problema.

3. A aproximação paraxial da equação de ondas

Para obter a equação paraxial a partir da equação de ondas precisamos saber o que significa a condição de paraxialidade. Grosso modo, a origem do termo vem do grego, significando no nosso contexto a propagação de um conjunto de ondas cuja direção de propagação formam um ângulo muito pequeno com um certo eixo (axis) de referência, sendo portanto quase paralelas a esse eixo. Usualmente o eixo de referência, ou também chamado longitudinal, é denotado por z. Do ponto de vista formal, é preciso primeiramente rever os conceitos fundamentais a respeito das ondas eletromagnéticas e sanar alguns erros conceituais que geralmente são reforçados na formação dos alunos de graduação em física e engenharia. Um desses erros é a afirmação de que "as ondas eletromagnéticas são transversais, ou seja, os campos oscilam sempre em um plano perpendicular à direção de propagação". Essa sentença não é inteiramente correta, porque verdadeiramente a condição de transversalidade é satisfeita somente pelas as ondas planas uniformes. Superposições arbirárias de ondas planas uniformes produzem campos resultantes que já não respeitam mais a transversalidade. Para colocar mais luz sobre essa questão, vamos considerar as equações de Maxwel em um meio homogêneo, ou seja, εc independente da posição, e sem cargas livres. A solução do tipo onda plana uniforme é dada pela expressão abaixo

e fica fácil demonstrar que as equações de Maxell para ondas planas uniformes são dadas por

onde o espaço (k,ω) de vetores de onda k e frequência ω é o recíproco de (x,t), de posições x e tempo t, E é o campo elétrico, H é o campo magnético, µ é a permeabilidade magnética do meio, a permissividade dielétrica complexa do meio, ω a frequência angular da onda, é o vetor de onda e é a direção de propagação da onda plana . Demonstra-se facilmente das equações acima que , e um vetor de polarização ortogonal à direção . No espaço livre os campos E, H e de uma onda plana uniforme formam uma tríade de vetores ortogonais.

Indo adiante, para demonstrar que nem todas as ondas eletromagnéticas são transversais, consideremos um simples exercício de superposição de ondas, tipicamente apresentado a alunos de graduação em engenharia elétrica nas disciplinas de ondas eletromagnéticas ou seu equivalente. A situação considerada é ilustrada na Fig. 1. Por simplicidade, duas ondas planas uniformes de mesma amplitude propagando-se no vácuo formam ângulo com o eixo z e tem polarização tal que o campo elétrico de cada uma delas é dado abaixo


onde é uma constante de amplitude, = é o número de onda no vácuo e é a velocidade da luz no vácuo.

Pelo princípio de superposição, o campo elétrico E da onda resultante é dado simplesmente pela soma vetorial dos campos individuais

Observando a expressão acima, podemos ver que a velocidade de fase, dada por , aponta na direção âz e o próprio campo E apresenta uma componente não nula nessa direção. Todavia, a direção de propagação da energia média transportada pela onda resultante é a que deve ser tomada como direção de propagação da mesma. Para tanto precisamos determinar o vetor de Poynting médio, dado de forma geral para ondas monocromáticas (que tenham apenas uma componente de frequência ω) pela expressão abaixo

onde Re denota a parte real e * denota a conjugação complexa. O leitor deve encontrar os campos magnéticos de cada onda plana separadamente e depois o campo H resultante da superposição como exercício. O valor médio do vetor de Poynting será dado por

o que significa que a onda transporta energia na direção z, e nesse caso o campo elétrico tem uma componente nessa mesma direção, significando que o campo E não é totalmente transversal à direção de propagação da onda resultante. Na situação ilustrada acima o campo magnético resultante é totalmente transversal, como deve ter sido demonstrado pelo leitor, e por isso esse tipo de solução é denominada onda TM (transversal magnética). A discussão dos vários modos de propagação (TE, TM, TEM, híbridos) vai muito além do escopo da presente contribuição. Nesse ponto o leitor pode se perguntar qual é a relação entre a transversalidade e a paraxialidade. A resposta está na restrição que se faz ao ângulo para satisfazer a condição de paraxialidade. Considerando que ≪1, sabemos que cos≈1-/2 e sin. Quanto menor o ângulo máximo das ondas consideradas na superposição, menor será a importância das componentes longitudinais dos campos E e H resultantes da superposição, e a condição de transversalidade é aproximadamente satisfeita, dando origem a modos denominados quasi-TEM (TEM significando Transversal EletroMagnética). Fazendo E2z→0 no sistema de Eqs. (19)-(21), as componentes de campo ficam desacopladas novamente, mesmo que o meio seja não-homogêneo. Portanto as ondas paraxiais são aproximadamente transverais. O erro da aproximação paraxial dependerá portanto da definição feita a respeito do que é considerado um ângulo muito pequeno e ficará na ordem de /2×100%. Para <10 o erro é menor do que 1%.

Sabemos agora que uma onda resultante de natureza paraxial corresponde a uma superposição de ondas com vetores de onda na forma , onde ≪β é um pequeno desvio transversal do vetor de onda da m-ésima onda plana uniforme que compõe a onda resultante. Nessa condição, a onda propagante tem um termo de fase predominante na forma e, permitindo escrever a solução da Eq. (18) na forma que segue

onde A(x,y,z) é uma função vetorial que contempla variações lentas do vetor campo elétrico, comparativamente a e e contém, adicionalmente, toda a dependência nas variáveis transversais (x,y). Na prática esse método remove as variações rápidas em relação o eixo z do problema a ser resolvido, restando apenas a análise das variações lentas, ou da envoltória A(x,y,z). É conveniente decompor o operador diferencial ∇ e também o laplaciano em componentes transversais e longitudinais

Desse modo podemos calcular diretamente a derivada de segunda ordem do campo E em relação a z, tendo como resultado

Lembrando que a função vetorial A(x,y,z) deve variar lentamente em relação a z, suas derivadas devem ser ainda mais lentas. Uma vez que a derivada de primeira ordem está multiplicada por uma frequência espacial β elevada, esta não pode ser desprezada, enquanto que a derivada de segunda ordem é desprezível quando comparada ao termo de primeira ordem e ao termo multiplicado por . A aproximação paraxial de primeira ordem corresponde simplesmente à desprezar o termo , levando à seguinte equação vetorial

A demonstração e justificativa da eliminação de alguns termos nas equações acima ficam como exercício mais uma vez, lembrando ainda que a componente z dos campos pode ser desprezada na condição de paraxialidade, conforme discutido anteriormente. Para meios homogêneos a permissividade εc e consequentemente não dependem da posição permitindo escolher β=k. Para meios fracamente não-homogêneos, ou seja, quando a permissividade dielétrica do meio material varia de modo suave, o termo |∇⊥lnεc| pode ser desprezado, levando a uma aproximação adicional, cuja consequência é o desacoplamento das componentes do vetor A, não permitindo assim qualquer variação da polarização da onda propagante, pelo menos até um certo limite de distâncias, cujo valor dependerá do efeito acumulativo produzido pelo fator que por ora está sendo desprezado. Uma vez eliminada a componente de campo Az e também as derivadas espaciais de permissividade dielétrica do meio, não haverá acoplamento entre as componentes Ax e Ay e podemos escrever A(x,y,z)=ψ(x,y,z)ê, onde ê é um vetor de polarização que permanecerá invariante ao longo de toda a propagação e ψ é uma função complexa que descreve a dinâmica da amplitude e da fase do campo eletromagnético em função da distância propagada z e das coordenadas transversais (x,y). A equação resultante, mostrada a seguir e muito útil no domínio óptico e em micro-ondas, é denominada equação paraxial escalar

Cabe ressaltar aqui que o termo descreve inteiramente os efeitos de difração de um feixe de ondas, enquanto que o termo descreve espalhamento e refração. A aproximação na forma acima somente é válida quando este último termo não é capaz de produzir efeitos de reflexão da onda tal que surja uma componente contra-propagante.

Nas sub-seções adiante, algumas analogias da equação paraxial acima com a equação de Schrödinger não-relativística da mecânica quântica serão apontadas.

3.1. Analogias com a mecânica quântica

É bem sabido que a óptica e a mecânica quântica tem muito em comum [9-21] e as referências colocadas aqui nesse trabalho estão longe de encerrar todo o assunto. Do ponto de vista histórico uma formulação antiga baseada na óptica por Hamilton e Jacobi inspirou Erwin Schrödinger a escrever a versão ondulatória da mecânica quântica[8]. Hamilton e Jacobi procuravam identificar a trajetória de uma partícula com o gradiente das superfícies de fase constante S(x,t) de uma onda na forma . A equação de Schrödinger não-relativística para a função de ondas ψ da mecânica quântica é mostrada abaixo

ħ=h/(2π) é a constante de Planck, m é a massa da partícula e V o termo de energia potencial, que em geral depende da posição e/ou do tempo. Observe que aparecendo na equação acima é o laplaciano completo. Atualmente muitos sistemas quânticos podem ser "simulados" experimentalmente através de analogias ópticas. De fato, a propagação de ondas eletromagnéticas no regime paraxial, dada pela Eq. (37), é descrita por uma equação de Schrödinger não-relativística, desde que o tempo t da mecânica quântica seja substituído pela coordenada longitudinal z, que corresponde ao eixo de propagação preferencial da onda na condição de paraxialidade. Além disso, a equação paraxial apresenta o operador laplaciano transversal e não o laplaciano completo da equação de Schrödinger, o que mostra que a analogia só é válida com os problemas da mecânica quântica em (1+2)-D, ou seja, em uma dimensão temporal e duas espaciais. O termo de energia potencial V(x,y,z,t) da mecânica quântica é representado pelo fator na equação paraxial. É relativamente simples demonstrar que o campo óptico ψ(x,y,z) é descrito por uma densidade de lagrangiana na forma [9,10]

Uma vez que o regime paraxial em meios sem perdas é análogo à mecânica quântica não-relativística, a propagação de ondas pode ser descrita por um conjunto de funções de base em um espaço de Hilbert. A densidade hamiltoniana pode ser prontamente encontrada por transformações de Legendre, desde que o campo ψ tenha um momento canonicamente conjugado . O resultado da densidade hamiltoniana é

sendo aqui ̇ψ=∂ψ/∂z no contexto do regime paraxial. De forma análoga ao operador momentum da mecânica quântica, aqui temos .

A dualidade onda-partícula na mecânica quântica é correspondente à dualidade entre propagação de ondas - óptica geométrica. Em outras palavras, podemos obter uma equação de trajetória de raios simplesmente observando que a Eq. (40) pode ser obtida de uma expressão na forma , onde a hamiltoniana de uma partícula H é dada por

sendo

. Fazendo , é o índice de refração do meio, onde n20 é uma constante e δn(x,y,z) uma pequena perturbação ao índice de refração e escolhendo podemos utilizar as equações de Hamilton abaixo

onde i=1,2 e , para obter a trajetória de raios

que nos lembram a segunda lei de Newton. É possível, utilizando a Hamiltoniana (41), que descreve essencialmente a óptica geométrica, escrever uma integral de Feynman, somando sobre todas as trajetórias de raios possíveis entre dois pontos quaisquer, o que leva a determinar o propagador da equação paraxial [10]. Nesse sentido, a "quantização" da óptica geométrica leva à óptica física descrita pela equação paraxial. Essa demonstração está além do escopo da presente contribuição.

3.2. A teoria não-relativística como aproximação paraxial da equação de ondas relativística

É sabido que uma partícula livre relativística de massa m deve satizfazer a seguinte relação de dispersão

onde E é a energia total da partícula e p o seu momento linear, c é a velocidade da luz no vácuo. Para a obtenção da equação de ondas relativística da mecânica quântica valemo-nos da prescrição usual em que substituímos , introduzindo ainda uma função de ondas Ψ(x,y,z,t). A rigor, toda partícula obedecerá na mecânica quântica relativística, independentemente do seu spin, à seguinte equação

Uma discussão mais aprofundada a respeito do spin está além do escopo do presente texto e leva ao conceito de representações irredutíveis do grupo de Lorentz [weinberg]. Partículas de spin s precisam que suas funções de onda Ψ sejam espinores com (2s+1) componentes complexos ou 2(2s+1) quando o grupo de Lorentz é extendido para contemplar a paridade [22,23]. Assim, para uma partícula de spin 0, denominada escalar, Ψ(x,y,z,t) é uma função escalar, com apenas uma componente complexa.

Observando a relação de dispersão de partícular relativísticas, quando o momento linear é muito pequeno comparativamente ao termo de energia de repouso, ou seja, c|p|≪mc, há duas soluções possíveis para a energia, Emc e E=-mc, correspondendo ao caso de partículas e anti-partículas, respectivamente. Em energias ordinárias, tipicamente a energia total E desvia-se pouco do valor mc para partículas e processos envolvendo anti-partículas são pouco prováveis. Para entender o porquê, precisaríamos acrescentar um termo de energia potencial Vxyzt=Vxyze+cc cuja frequência ω de variação temporal fosse tão rápida quanto 2mc para permitir o acoplamento significativo de componentes de partículas e anti-partículas. Esse potencial V(x,y,z,t) está geralmente associado à radiação eletromagnética, e sabemos que processos de acoplamento entre partículas e anti-partículas necessitam frequências ω=2mc✯, o que compreende o espectro de radiação gama, altamente energético. Restringindo o problema a situações usuais de baixas energias para descrever partículas, podemos descartar a solução de energia -mc e escrever uma solução da forma

onde a energia total será dada pela aproximação E=mc2+δE. Obviamente, com esse procedimento podemos remover a variação rápida do problema, que está contemplado no termo . Considerando os 4 eixos de coordenadas tratados em pé de igualdade na teoria da relatividade, estamos dizendo que a solução caminha quase paralela ao eixo do tempo, com frequência associada a , mas pequenos desvios, que serão provenientes do termo envolvendo o momento p ou energias potenciais pequenas em comparação com , podem produzir uma variação temporal cuja dinâmica está contida na envoltória ψ(x,y,z,t). O cálculo da derivada temporal de segunda ordem de Ψ(x,y,z,t) expressada na forma da Eq. (48) é análogo ao dos casos realizados anteriormente, tendo por resultado

Obviamente, uma vez que toda a variação rápida está contida no termo e-imct✯, a derivada segunda da envoltória ψ(x,y,z,t) pode ser desprezada, levando à seguinte equação de ondas para a envoltória

Note que essa é a equação de ondas de Schrödinger não-relativística para uma partícula livre. Demonstramos assim que a mecânica quântica não-relativística é uma aproximação paraxial da teoria relativística.

3.3. Partículas sem massa e o caso dos fótons

É possível mostrar uma equação análoga ao da equação de Schrödinger para partículas não-relativísticas de massa m quando as partículas envolvidas tem massa de repouso nula, que é o caso dos fótons, quando a função de ondas pode ser representada como produto de um termo variação rápida no tempo e uma função envoltória, que descreve as flutuações lentas do campo. Para o exemplo dos fótons, vamos considerar a equação de ondas para o campo elétrico em um meio aproximadamente homogêneo com índice de refração n, desprezando efeitos de dispersão da luz(ou seja, variações de n com a frequência)

onde Ψ(x,y,z,t) representa alguma componente do campo elétrico ou magnético. Tipicamente, as ondas eletromagnéticas propagando-se em um sistema de comunicações consistem de uma portadora de frequência ω0 que varia muito rapidamente e um termo de envoltória, descrevendo flutuações lentas de algum parâmetro dessa portadora, como por exemplo, a amplitude média ou de pico, que varia com frequências típicas muito mais lentas do que a frequência ω0. Desse modo, podemos escrever a função Ψ(x,y,z,t) de forma similar à equação de Eq. (48)

onde ψ(x,y,z,t) descreve a envoltória e o termo de variação rápida e-iω0t corresponde à portadora. Nessa condição as derivadas temporais segundas da envoltória podem ser desprezadas em relação aos outros termos. Fica como exercício demonstrar que, em um meio com índice de refração n podendo ser escrito na forma n0+δn, onde n0 independen da posição e δn(x,y,z) é uma pequena perturbação que satisfaz a condição |δn|≪n0, a equação resultante para a dinâmica da envoltória tem a forma abaixo

Esta é idêntica à equação de Schrödinger para uma partícula não-relativística de massa m, com massa efetiva do fóton dada por e energia potencial na forma . Aqui a analogia com a mecânica quântica não-relativística é praticamente completa, e o tempo t tem o mesmo papel tanto na equação de Schrödinger quanto na equação acima, em contraste com os casos anteriores onde o eixo z da equação paraxial eletromagnética fazia o papel do tempo t.

3.4. A equação paraxial no estudo da dispersão

A dispersão da luz é um fenômeno ondulatório associado à superposição de ondas com diferentes frequências, já discutido na Ref. [6], e produz deformação temporal de pulsos propagantes em sistemas de comunicação óptica e a decomposição da luz branca por um prisma, para citar as consequências físicas mais conhecidas. Podemos estudar a dispersão de ondas em sistemas guiados por uma equação paraxial. Partindo da equação de ondas no domínio da frequência mostrada na Eq. (18), desprezando o lado direito na chamada condição de guiamento fraco, muito usual em fibras ópticas, porque o índice de refração do núcleo é muito parecido com o da casca. Podemos escrever a solução para um pulso do campo elétrico na forma que segue

onde o vetor A descreve a envoltória do sinal, ω é a frequência portadora do sinal e β0 uma constante de propagação longitudinal ao longo de z na frequência central ω0 do espectro de um pulso. Uma vez que o perfil transversal é definido por condições de contorno impostas pelo guia de onda, podemos supor uma solução para a envoltória na forma A(x,y,z,ω)=F(x,y)̃ψ(z,ω)ê, sendo ê um vetor unitário de polarização, cuja variação é desprezível em meios isotrópicos e aproximadamente homogêneos. A função F(x,y) descreve o perfil transversal do modo, que também não varia ao longo da propagação e satizfaz uma equação de ondas bidimensional, na forma

onde é o número de ondas transversal e β(ω) é a constante de propagação na frequência ω, não necessariamente na frequência central ω20 do espectro do pulso considerado. A solução dos valores de k e F(x,y) que satisfazem as condições de contorno impostas pelo guia é obtida através da chamada análise modal. Substituindo a solução proposta acima na Eq. (18) nos fornece o resultado

Lembrando que , podemos expandir a função β em séries de Taylor em torno da frequência de portadora do pulso,

onde são definidas as seguintes quantidades

Desse modo, pode-se mostrar facilmente que

Negligenciando termos que dependam da

, com n≥3, o que é geralmente possível caso , a Eq. (55) toma a forma

Uma vez que ̃ψ(z,ω) é uma função no domínio ω podemos aplicar a transformação de Fourier (8) à Eq. (61), para obter

Podemos identificar os termos com a velocidade de fase da portadora e a velocidade de grupo de um pacote de ondas, respectivamente. Para remover a componente de variação rápida no tempo definimos para obter a versão simplificada da Eq. (62)

Convencionalmente faz-se uma transformação galileana de coordenadas, na forma É deixado como exercício mostrar que para soluções dependentes de z e T a equação toma a forma a seguir

É interessante notar que a equação acima tem a mesma forma da equação de Schrödinger da mecânica quântica, porém com os papéis do tempo e do espaço trocados. Quando os termos em , com n≥3, começam a se tornar importantes aparecem na equação as derivadas de ordem mais alta no tempo, e a analogia com a equação de Schrödinger não-relativística não é tão boa. É possível ainda levar em conta efeitos difrativos inserindo um termo contendo , o que define um operador análogo ao laplaciano, com três coordenadas x,y,T.

Com esse exemplo praticamente são esgotadas as possibilidades de aplicação da equação paraxial no estudo de ondas eletromagnéticas e suas analogias com a mecânica quântica.

4. Alguns exemplos relevantes em óptica e micro-ondas

Por questão de simplicidade vamos considerar somente problemas em (1+1)-D, ou seja, ondas propagando-se em z (ou o tempo t) com padrão de intensidade transversal dependente somente da coordenada x. No caso da equação paraxial (37) podemos substituir , com o resultado a seguir

No caso geral em que a permissividade dielétrica depende de modo muito complicado de x e z, o sistema acima não tem soluções analíticas exatas e deve ser integrado numericamente. A soluçao numérica mais simples consiste em discretizar as coordenadas x e z, bem como as derivadas, na forma

onde , i e j são números inteiros associados à discretização do espaço (x,z) contínuo. É importante observar que há uma relação entre Δz e Δx, que deve ser ajustada na prática para garantir convergência. Métodos como o Runge-Kutta de ordem maior são capazes de aproximar melhor as derivadas, produzindo maior convergência do que o método simplista exposto acima. A descrição de tais métodos pode ser encontrada em literatura especializada em cálculo numérico [24]. Há ainda o método denominado de split-step, em que o passo em z é dividido em duas etapas: na primeira o efeito de difração, contido no termo é resolvido, permitindo o uso de transformadas de Fourier na solução; na segunda o efeito do termo de potencial é calculado, já considerada a difração, calculada na primeira etapa. Vários esquemas, otimizados para esse tipo de estratégia, têm sido considerados.

Para fins de validação do método numérico vamos considerar a propagação do feixe gaussiano em meios homogêneos, de modo que possamos fazer β=k ocnforme mencionada anteriormente, reduzindo o problema à seguinte equação diferencial

Aplicando a transformada de Fourier, definida como segue

à Eq. (68), obtemos de forma muito simples a solução geral, na forma abaixo [6]

onde ψ(x,0) é o padrão transversal do campo em z=0, tomado como campo inicial, e ̃ é a sua transformada de Fourier. O padrão de intensidade transversal inicial para um feixe gaussiano tem a seguinte forma

Fica como exercício resolver o sistema de Eqs. (71) e (72) para a condição inicial acima e demonstrar que

Nas Figs. 2.(a)-2.(c) ilustramos a propagação numérica do feixe gaussiano e a comparação entre o resultado numérico e o analítico exato, utilizando o comprimento de onda λ=632.8 nm (corresponde ao valor típico de um apontador laser, disponível facilmente no comércio), com e amplitude de pico (unidades arbitrárias). Para aqueles pesquisadores interessados em implementar soluções numéricas, é sempre importante ter em mãos uma solução analítica conhecida do problema a ser resolvido para fins de validação do método. É possível observar no presente exemplo a excelente concordância entre a expressão analítica e o resultado numérico, na Fig. 2.(c), para a distância final sabendo que quanto maior a distância propagada pelo algorítimo numérico maior é o erro acumulado.


Para fins didáticos vamos considerar ainda os seguintes casos: i) a difração por fenda simples em meios homogêneos e ii) difração de ângulo raso em meios não-homogêneos.

4.1. Difração por fenda simples

Esse problema certamente é um dos mais conhecidos no estudo da difração. Uma fenda simples é iluminada por uma onda plana uniforme, de tal forma que a condição inicial seja para |x|<d/2 e ψ(x,0)=0 para |x|>d/2. Este exemplo já foi discutido na Ref. [6] em algum detalhe, utilizando o método de fase estacionária para resolver o sistema de equações dado pelas Eqs. (71) e (72). A solução analítica para grandes distâncias é bem conhecida, sendo dada por

A expressão acima é válida para grandes distâncias e inclui o termo de fase , que foi negligenciado na Ref. [6] porque no cálculo do módulo ao quadrado da função acima o termo de fase torna-se irrelevante. Considerando ψ0=1 e comprimento de onda λ=632.8 nm (corresponde ao valor típico de um apontador laser, disponível facilmente no comércio), com extensão da fenda d=10µm, podemos simular numericamente a equação paraxial e comparar o resultado numérico com a expressão (75). Os gráficos gerados através do método numérico são mostrados nas Figs 3.(a) a 3.(c), para uma distância máxima propagada . A janela computacional para o eixo transversal x foi de -5d a 5d e um termo dissipativo na forma -α(x)ψ foi acrescentado na equação para absorver as ondas que chegam aos limites da janela computacional. O ajuste de α(x) tem que ser feito na prática. Nota-se a boa concordância entre o resultado gerado numericamente e a previsão teórica dada pela Eq. (75), como se observa na Fig. 3.(c) para a distância final. Observando a Fig. 3.(b) que mostra |ψ(0,z)| pode-se ver a partir de 80µm um pequeno ruído numérico que deve-se à não absorção total das ondas que chegam às fronteiras da janela computacional. Na mesma Fig. 3.(b), observa-se a oscilação da intensidade da onda propagada em função de z em torno do valor inicial , o que não ocorre na propagação da onda gaussiana do exemplo anterior, mostrada na Fig. 2.(b) correspondente. Isso se deve ao fenômeno denominado de difração de gume de faca, que acontece devido às variações muito abruptas na intensidade do campo inicial, nesse caso provocadas pela fenda.


4.2. Incidência em ângulo raso em interfaces e filmes finos

O efeito de reflexão e refração em interfaces entre dois meios, nem sempre regulares ou planas, encontra uma ampla gama de aplicações. Podemos citar como exemplos importantes o efeito de reflexões no terreno na propagação de ondas eletromagnéticas no espectro de micro-ondas, que tipicamente incidem no terreno em baixo ângulo, uma vez que entre a antena emissora de sinal e a recepção em outro ponto usualmente temos grandes distâncias, comparativamente ao desnível dos pontos considerados, e também a reflexão de ondas incidentes com ângulo rasante na interface entre dois meios dielétricos. Essas situações são ilustradas de modo genérico na Fig. 4. A complexidade do problema aumenta ainda mais quando considerada uma estrutura dielétrica de multicamadas que pode ser facilmente produzida por técnicas de filmes finos. Medidas de refletividade com o ângulo poderiam fornecer informações importante a respeito das espessuras das camadas, bem como das propriedades ópticas da estrutura e a rugosidade da superfície.


Para fins de ilustração consideramos uma interface regular com modulação periódica entre dois meios sem perdas, com índice de refração em função de x,z dado por

onde δn é uma perturbação ao índice de refração do vácuo, é a função degrau de Heaviside, ou seja, é uma função que delimita a região de interface. Uma interface periódica, que é tipicamente empregada em redes de Bragg, pode ser obtida definindo , onde a é a profundidade dos sulcos formados na interface e Λ a periodicidade espacial da rugosidade da interface. Para fins de ilustração vamos considerar λ=632.8 nm, δn=0.4, a=2 µm, x1=-5 µm e Λ=5λ, com uma onda incidente gaussiana, expressa na forma

sendo . O resultado obtido é ilustrado na Fig. 5. Pode-se ver claramente a reflexão da onda incidente na região de interface entre os dois meios. Foge ao escopo da presente contribuição avaliar a relação entre as características de interface e a amplitude da onda refletida.


Para finalizar, podemos estudar a refração atmosférica, onde o índice de refração do ar varia em função da altitude, devido a efeitos de temperatura e pressão. Podemos modelar o índice de refração da seguinte maneira, nesse caso

onde tipicamente . Para ilustrar o efeito escolhemos δn=0.1, L=-40 µm é apenas uma referência e a=20 µm. Os parâmetros da onda incidente foram mantidos iguais ao do exemplo anterior. Obviamente a escala de distâncias de variação do índice de refração na prática é bem maior do que nesse exemplo, mas as distâncias onde se observam a curvatura do feixe incidente também são bem maiores. A Fig. 6 mostra o feixe gaussiano curvando devido ao efeito de refração. Efeitos de refração semelhantes a esse ocorrem na ionosfera na faixa de 3-30 MHz, embora neste caso o índice de refração tem outra forma. Em VHF e microondas pode haver formação de dutos que funcionam como guias de ondas, devido a variações do índice de refração atmosférico.


5. Conclusões

Neste trabalho procuramos apresentar uma revisão geral da equação de ondas paraxial e sua emergência em diversos problemas de interesse em física e engenharia. Partindo das equações de Maxwell, encontramos a equação de ondas para o campo elétrico em meios isotrópicos não-homogêneos, e supondo uma solução de ondas propagantes que tem um termo de variação rápida ao longo da direção de propagação, deduzimos a equação paraxial escalar, que descreve essencialmente a propagação da envoltória da onda eletromagnética em situações de variações suaves dos índices de refração dos meios, o que permite considerar a polarização constante ao longo da propagação. A relação entre paraxialidade e transversalidade das ondas eletromagnéticas também foi brevemente discutida, com um exemplo bastante simples de duas ondas eletromagnéticas planas uniformes propagando-se em diferentes direções, produzindo assim interferência e tendo o campo resultante uma componente longitudinal, que torna-se desprezível se a condição de paraxialidade é satisfeita. Analogias da equação paraxial escalar com a mecânica quântica em 1+2 dimensões também foi explorada, e demonstramos que na mecânica quântica a equação de Schrödinger é uma aproximação paraxial da teoria relativística. O caso dos fótons também foi brevemente discutido. Para finalizar, alguns exemplos pertinentes de aplicação da equação paraxial em óptica e micro-ondas foram apresentados e discutidos.

Agradecimentos

Os autores C.A. Dartora e K.Z. Nóbrega agradecem ao CNPq e à PRPGS/IFMA - FAPEMA, respectivamente, pelo suporte financeiro parcial, através de Bolsas de Produtividade em Pesquisa. Os autores agradecem as importantes correções e sugestões feitas pelos revisores anônimos.

Referências

[1] J.D. Jackson, Classical Electrodynamics (John Wiley & Sons, New York, 1998), 3rd ed.

[2] M. Born and E. Wolf, Principles of Optics (Pergamon Press, New York, 1980), 6th ed.

[3] J.W. Goodman, Introduction to Fourier Optics (McGraw-Hill, New York, 1996), 2nd ed.

[4] O.S. Heavens and R.W. Ditchburn, Insight into Optics (John Wiley, Chichester, 1991).

[5] J.M. Stone, Radiation and Optics (McGraw-Hill, New York, 1963).

[6] C.A. Dartora, K.Z. Nobrega, Marina H. Krisam Matielli, Fillipi Klos Rodrigues de Campos e H. Tertuliano dos Santos Filho, Revista Brasileira de Ensino de Física 33, 1307 (2011).

[7] C.A. Dartora, K.Z. Nobrega, V.F. Montagner, A. Heilmann e Horacio Tertuliano S. Filho, Revista Brasileira de Ensino de Física 31, 2303 (2009).

[8] E. Schrödinger, Annalen der Physik volume, 361 (1926); E. Schrödinger, Physical Review 28, 1049 (1926).

[9] C.A. Dartora, G.G. Cabrera, K.Z. Nobrega, K.Z., V.F. Montagner, V., Marina Matielli, Fillipi Klos de Campos and Horacio Tertuliano Filho, Phys. Rev. A 83, 012110 (2011).

[10] C.A. Dartora and K.Z. Nobrega, Phys. Lett. A 375, 2254 (2011).

[11] S. Longhi, Laser & Photonics Reviews 3, 243 (2009).

[12] D. Haefner, S. Sukhov and A. Dogariu, Phys. Rev. Lett. 102, 123903 (2009).

[13] E. Yablonovitch, Phys. Rev. Lett. 58, 2059 (1987).

[14] S. John, Phys. Rev. Lett. 58, 2486 (1987).

[15] K. Ohtaka, Phys. Rev. B 19, 5057 (1979).

[16] E. Yablonovitch, T.J. Gmitter, K.M. Leung, E. Gmitter and T.J. Leung, Phys. Rev. Lett. 67, 2295 (1991).

[17] T.F. Krauss, R.M. DeLaRue and S. Brand, Nature 383, 699 (1996).

[18] M. Mehrafarin and H. Balajany, Phys. Lett. A 374, 1608 (2010).

[19] D. Gloge and M. Marcuse, JOSA 59, 1629 (1969).

[20] S. Longhi, Physical Review E 67, 036601 (2003).

[21] S. Longhi, Physical Review A 71, 065801 (2005).

[22] S. Weinberg, The Quantum Theory of Fields (Cambridge University Press, cidade, 1996), Vol. I, II and III.

[23] L.H. Ryder, Quantum Field Theory (Cambridge University Press, falta cidade, 1996), 2nd. ed.

[24] William E. Boyce and Richard C. DiPrima, Equações Diferenciais Elementares e Problemas de Valores de Contorno (Editora LTC, falta cidade, 2002), 7ª ed.

Recebido em 11/3/2014

Aceito em 8/4/2014

Publicado em 7/8/2014

  • [1] J.D. Jackson, Classical Electrodynamics (John Wiley & Sons, New York, 1998), 3rd ed.
  • [2] M. Born and E. Wolf, Principles of Optics (Pergamon Press, New York, 1980), 6th ed.
  • [3] J.W. Goodman, Introduction to Fourier Optics (McGraw-Hill, New York, 1996), 2nd ed.
  • [4] O.S. Heavens and R.W. Ditchburn, Insight into Optics (John Wiley, Chichester, 1991).
  • [5] J.M. Stone, Radiation and Optics (McGraw-Hill, New York, 1963).
  • [6] C.A. Dartora, K.Z. Nobrega, Marina H. Krisam Matielli, Fillipi Klos Rodrigues de Campos e H. Tertuliano dos Santos Filho, Revista Brasileira de Ensino de Física 33, 1307 (2011).
  • [7] C.A. Dartora, K.Z. Nobrega, V.F. Montagner, A. Heilmann e Horacio Tertuliano S. Filho, Revista Brasileira de Ensino de Física 31, 2303 (2009).
  • [8] E. Schrödinger, Annalen der Physik volume, 361 (1926);
  • E. Schrödinger, Physical Review 28, 1049 (1926).
  • [9] C.A. Dartora, G.G. Cabrera, K.Z. Nobrega, K.Z., V.F. Montagner, V., Marina Matielli, Fillipi Klos de Campos and Horacio Tertuliano Filho, Phys. Rev. A 83, 012110 (2011).
  • [10] C.A. Dartora and K.Z. Nobrega, Phys. Lett. A 375, 2254 (2011).
  • [11] S. Longhi, Laser & Photonics Reviews 3, 243 (2009).
  • [12] D. Haefner, S. Sukhov and A. Dogariu, Phys. Rev. Lett. 102, 123903 (2009).
  • [13] E. Yablonovitch, Phys. Rev. Lett. 58, 2059 (1987).
  • [14] S. John, Phys. Rev. Lett. 58, 2486 (1987).
  • [15] K. Ohtaka, Phys. Rev. B 19, 5057 (1979).
  • [16] E. Yablonovitch, T.J. Gmitter, K.M. Leung, E. Gmitter and T.J. Leung, Phys. Rev. Lett. 67, 2295 (1991).
  • [17] T.F. Krauss, R.M. DeLaRue and S. Brand, Nature 383, 699 (1996).
  • [18] M. Mehrafarin and H. Balajany, Phys. Lett. A 374, 1608 (2010).
  • [19] D. Gloge and M. Marcuse, JOSA 59, 1629 (1969).
  • [20] S. Longhi, Physical Review E 67, 036601 (2003).
  • [21] S. Longhi, Physical Review A 71, 065801 (2005).
  • [22] S. Weinberg, The Quantum Theory of Fields (Cambridge University Press, cidade, 1996), Vol. I, II and III.
  • [23] L.H. Ryder, Quantum Field Theory (Cambridge University Press, falta cidade, 1996), 2nd. ed.
  • [24] William E. Boyce and Richard C. DiPrima, Equações Diferenciais Elementares e Problemas de Valores de Contorno (Editora LTC, falta cidade, 2002), 7ª ed.
  • 1
    E-mail:
  • Datas de Publicação

    • Publicação nesta coleção
      18 Set 2014
    • Data do Fascículo
      Set 2014

    Histórico

    • Aceito
      08 Abr 2014
    • Recebido
      11 Mar 2014
    Sociedade Brasileira de Física Caixa Postal 66328, 05389-970 São Paulo SP - Brazil - São Paulo - SP - Brazil
    E-mail: marcio@sbfisica.org.br