SciELO - Scientific Electronic Library Online

 
vol.37 issue3(Ritus’ method for calculating the Feynman propagator)Living under attack in a one-dimensional virtual world author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

Share


Revista Brasileira de Ensino de Física

Print version ISSN 1806-1117On-line version ISSN 1806-9126

Rev. Bras. Ensino Fís. vol.37 no.3 São Paulo July/Sept. 2015

https://doi.org/10.1590/S1806-11173731829 

Artigo Gerais

Formalismo óptico matricial e aplicações

(Optical matrix formalism and applications)

F.A. Callegari 1   1 

A.A. Freschi1 

1Centro de Engenharia, Modelagem e Ciências Sociais Aplicadas, Universidade Federal do ABC, Santo André, SP, Brasil


RESUMO

O formalismo óptico matricial é desenvolvido a partir da aplicação da lei de Snell para descrever a refração de raios óticos numa superfície esférica. A seguir, dito formalismo é aplicado para achar e justificar parâmetros típicos e expressões como distância focal, condição de imagem e aumento lateral para o caso de uma lente esférica fina imersa em ar. Além disso, é estudado o caso de uma lente esférica fina imersa em dois meios ópticos com índices de refração diferentes e encontrados os parâmetros e expressões correspondentes para este caso.

Palavras-chave: óptica matricial; lentes finas; foco; aumento lateral

ABSTRACT

The optical matrix formalism is developed by applying Snell law to describe the refraction of optical rays in a spherical surface. This formalism is then applied to find and justify typical parameters and expressions as focal distance, image condition and lateral magnification for a thin spherical lenses immerse in air. Also, the case of thin spherical lenses immersed in two media with different refraction index is studied, and the corresponding parameters and expressions are found.

Keywords: matrix optics; thin lenses; focus; lateral magnification

1. Introdução

No ensino da óptica geométrica, o formalismo matricial nem sempre é utilizado ou, quando ensinado, não é totalmente explorado. Contudo, ele é intuitivo e o seu uso fornece resultados baseados em considerações físicas, ao invés de geométricas. Neste trabalho, é desenvolvido o formalismo óptico matricial aplicando a lei de Snell da refração a uma superfície esférica. A seguir, esse formalismo é utilizado para obter os resultados conhecidos da distância focal, a condição de imagem e aumento lateral para uma lente esférica fina imersa em ar. O estudo é então estendido para o caso mais geral de uma lente fina imersa em dois meios de índice de refração diferentes. Este ultimo caso tem interesse prático mas não é estudado na bibliografia usualmente utilizada.

2. Optica matricial

A notação utilizada no desenvolvimento do formalismo matricial e a forma final das matrizes correspondem às apresentadas na Ref. [1]. Também será assumida a convenção de sinais da mesma referência, que é a convenção adotada pela maior parte dos textos. Desde que lentes esféricas serão tratadas neste trabalho, vamos analisar primeiro a refração de um raio óptico numa superfície esférica, como mostrado na Fig. 1.

Figura 1 Diagrama esquemático do exemplo estudado neste trabalho. 

Na figura, o raio incidente se propaga num meio com índice de refração n1 e faz um angulo α1 com o eixo óptico. Esse raio é refratado na superfície esférica e transmitido com angulo α2 (com respeito ao eixo óptico) em um meio com índice de refração n2. A altura, com respeito ao eixo óptico, na qual o raio incidente atinge a esfera é y. Devemos aplicar a lei de Snell, para o qual devemos considerar os ângulos de incidência e refração a respeito da normal à interface. No nosso caso, dita normal está dada pelo raio da esfera, R, o qual faz um angulo ϕ com o eixo óptico. Chamamos os ângulos de incidência e refração de θ1 e θ2, respectivamente. Aplicando a lei de Snell, temos

n1sinθ1=n2sinθ2.(1)

Os ângulos θ1 e θ2 podem ser escritos como função dos ângulos α1, α2 e o ângulo ϕcomo

θ1=α1+ϕ,θ2=α2+ϕ.(2)

Assim, a lei de Snell fica

n1sin(α1+ϕ)=n2sin(α2+ϕ).(3)

A seguir, a aproximação paraxial é aplicada. Em dita aproximação, é assumido que os ângulos θ1 e θ2≪ 1. Como consequência, α1, α2 e ϕ são também muito pequenos, e também y ≪ R. Nessas condições,

sinα1α1cosα11(4)
esinα2α2cosα21(5)

Também, para o angulo auxiliar ϕ, temos,

sinϕy/Rcosϕ1(6)

Desenvolvendo a Eq. (3),

n1(sinα1cosϕ+sinϕcosα1)==n2(sinα2cosϕ+sinϕcosα2)(7)

Substituindo as Eqs. (4) e (6) na Eq. (7), obtemos

n2α2=n1α1+yn1n2R.(8)

Essa expressão descreve a refração de um raio numa superfície curva. Notar que, se a superfície for plana, i.e., R tendendo a infinito, a Eq. 8) se reduz à lei de Snell, escrita na aproximação paraxial. Agora, devemos descrever a variação da altura, y, que um raio sofre na propagação retilínea num meio com índice de refração n1. Para isso, consideramos a situação mostrada na Fig. 2.

Figura 2 Calculo da variação da altura do raio respeito do eixo óptico. 

A variação da altura com respeito ao eixo óptico quando o raio percorre uma distância d (no meio com índice n1), está dada por

y2=y1+dtanα1.(9)

Na aproximação paraxial, α1 ≪ 1, daí, tan α1 ~ α1 e a Eq.(8) se reduz a

y2=y1+dα1.(10)

Podemos agora expressar as Eqs. (8) e (10) em forma matricial, definindo o vetor (nα, y).

Para a refração na superfície esférica, temos

(n2α2y2)=(1n2n1R01)(n1α1y1).(11)

Notar que, aplicando a operação de multiplicação de matrizes, o resultado correspondente ao element n2α2 equivale à Eq. (8). Já a equação y2 = y1, confirma que não houve mudança na altura y do raio na refração.

Para o deslocamento do raio, temos

(n2α2y2)=(10dn11)(n1α1y1).(12)
onde o resultado correspondente ao elemento n2α2 é a lei de Snell (na aproximação paraxial) e o resultado correspondente ao elemento y2 equivale à Eq. (10).

3. Lente fina imersa em ar

A formulação matricial é muito útil quando temos vários elementos refrativos em cascata. O resultado final é obtido pela multiplicação das matrizes correspondentes a cada elemento. Como um exemplo de aplicação, vamos estudar o caso de uma lente fina, com índice de refração n, imersa em ar, como mostrado na Fig. 3.

Figura 3 Lente esférica fina em ar. 

Consideramos a luz se propagando da esquerda para a direita. Um raio se propagando no ar, fazendo um angulo α1 com respeito ao eixo, atinge a lente num ponto com altura y1. A seguir, esse raio abandona a lente num ponto com altura y2 e com angulo α2. Como temos duas superfícies refratoras, vamos considerá-las separadamente, como ilustra a Fig. 4.

Figura 4 Lente esférica fina em ar, duas superfícies refratoras. 

Os raios de curvatura à esquerda, R1, e à direita, R2, estão indicados na figura. Ao estarmos considerando lentes finas, a altura do raio, y, não muda devido ao deslocamento do raio no interior da lente, i.e., y1= yi = y2. Agora devemos expressar o vetor (n2α2, y2) como função do vetor (n1α1, y1). Vamos usar o vetor (i, yi) como intermediário. Para a supercicie refratora à direita (com R2), a Eq. (11) fica

(α2y2)=(11nR201)(nαiyi).(13)
onde n2 = 1, pois temos ar à direita dessa interface. A seguir, deveremos expresser (i, yi) como função de (n1α1, y1).

(nαiyi)=(1n1R101)(α1y1). (14)

onde n1 = 1, já que agora, à esquerda da superfície refratora R1, temos ar. A seguir, expressamos o vetor (n2α2, y2) como função do vetor (n1α1, y1), introduzindo a Eq. (14) na Eq. (13) e obtemos

(α2y2)=(11nR201)(1n1R101)(α1y1).(15)

A seguir, aplicamos simplesmente a operação de multiplicação de matrizes para obtermos

(α2y2)=(1,(n1)(1R11R2)01)(α1y1).(16)

Onde reconhecemos o elemento da linha 1 e coluna 2 da matriz da Eq. (16) como sendo o negativo do inverso da distância focal da lente, −1/f. É bom lembrar aqui que o conceito de foco em lentes finas é introduzido sem demonstração em alguns livros de texto básicos usualmente utilizados, por exemplo as Refs. [2] e [3]. Como saberíamos, a partir do formalismo matricial, do significado desse elemento? Para isso, basta considerar um feixe de raios paralelos ao eixo óptico, i.e., incidindo desde o infinito. Consideremos um desses raios, a uma altura y1 com respeito ao eixo óptico. A seguir, dito raio é refratado pela lente e se propagará uma distância z à direita, ver Fig. 5.

Figura 5 Raios paralelos incidindo na lente esférica fina em ar. 

Vamos aplicar o formalismo matricial ao caso representado na Fig. 5

(α2y2)=(10z1)(11f01)(α1y1).(17)
onde a primeira matriz do segundo membro da Eq. (17) descreve o deslocamento, z, do raio, após ter sido refratado pela lente, y2 é a altura do raio com respeito ao eixo óptico no ponto z. Para simplificar a notação, o elemento 1–2 da matriz correspondente à lente foi substituído por −1/f. Observar que a ordem de multiplicação das matrizes é fundamental (lembrar que o produto de matrizes não é comutativo). Como regra, podemos ler a Eq. (17) da direita para a esquerda e pensar no primeiro elemento que o raio incidente, (α1, y1) encontra, que é a lente. A seguir, vem o deslocamento através do espaço. Multiplicando matrizes a Eq. (17) fica
(α2y2)=(11fz1zf)(α1y1).(18)

Resolvendo para y2, temos

y2=zα1+y1(1zf).(19)

Mas α1 = 0, por termos raios incidentes paralelos ao eixo óptico. Daí a Eq. (19) fica

y2=y1(1zf).(20)

A interpretação da Eq. (20) é obvia agora: se z = f, y2será igual a zero, independente do valor de y1, em outras palavras, a lente focaliza os raios em z = f. Foi suposto implicitamente uma lente convergente, i.e. f > 0 (R1 > 0 e R2 < 0, pela convenção de sinais adotada). Contudo, essa dedução vale também para lentes divergentes. Observar na Eq. (20), se f < 0, os raios focam em z = −f (foco virtual).

Outra dedução que pode ser feita agora, a partir do formalismo matricial, é a condição de imagem, i.e., dado um objeto a uma certa distância, so, da lente, qual será a distância imagem, si? Em geral isto é resolvido através de considerações geométricas. Contudo, o formalismo matricial nos dá a oportunidade de resolver esse problema através de argumentos puramente físicos. Podemos considerar cada ponto do objeto como um gerador de ondas esféricas divergentes (i.e, se afastando do ponto objeto). Para formar uma imagem, a lente deve fazer com que essas ondas esféricas divergentes se transformem em ondas esféricas convergentes, e o ponto de convergência será justamente o ponto imagem correspondente ao ponto objeto. Essa ideia está esquematizada na Fig. 6, onde também são representados, além das referidas ondas, alguns raios ópticos perpendiculares às frentes de onda. Os símbolos ho e hi representam a altura do objeto e da imagem, respectivamente.

Figura 6 Formação de imagem a través da lente. 

Fazendo a analise matricial, temos

(αihi)=(10si1)(11f01)(10so1)(αoho).(21)

Como já dito, para entendermos equações ópticas matriciais, podemos lê-las da direita para a esquerda. Inicialmente, o raio que sai do objeto, com angulo αo e altura ho, percorre uma distância so. A seguir, o raio é refratado na lente. Por último, o raio percorre uma distancia si, até o ponto imagem correspondente. Fazendo o produto indicado na Eq. (21), obtemos

(αihi)=(1sof,1fsi+sosisof,1sif)(αoho).(22)

Resolvendo a equação para a altura do ponto imagem, hi, temos

hi=(si+sosisof)αo+(1sif)ho.(23)

A condição de imagem já mencionada envolvendo as ondas esféricas divergentes e convergentes, pode ser expressa matematicamente a partir da Eq. (23). A variação da altura hi de um ponto imagem (o ponto extremo, por exemplo), deve ser independente do angulo α0 que corresponde ao conjunto de ângulos com o qual os raios são emitidos no ponto objeto correspondente. Matematicamente

hiαo=(si+sosisof)=01si+1so=1f.(24)

Naturalmente surge dai a condição de imagem, também conhecida como equação de Gauss.

Outro resultado que pode ser obtido agora é o do aumento lateral da imagem, definido como

MT=hiho.(25)

Substituindo a condição de imagem, Eq. (24), na Eq. (23), temos

hi=(1sif)ho.(26)

Dai, com ajuda do último termo da Eq. (24) é simples mostrar que

MT=hiho=(1sif)=siso,(27)

o qual já é amplamente conhecido.

4. Lente fina imersa em dois meios ópticos diferentes

O próximo passo é calcularmos a distância focal, a condição de imagem e o aumento lateral para uma lente fina, com índice de refração n, imersa em dois meios com indices n1 e n2 (ver Fig. 7).

Figura 7 Lente fina imersa em meios com índices n1 e n2

Esta situação e de grande interesse prático, por exemplo, nos microscópios de imersão, onde o espaço entre a face externa da objetiva e a amostra (ou a cobertura da amostra) é preenchida com óleo. Isto é feito para aumentar a apertura numérica do microscópio [4].

Aplicando o método matricial, temos

(n2αihi)=(1,0sin21)(1,(n2nR2)01)×(1,(nn1R1)01)(1,0s0n1,1)(n1α0h0).(28)

A Eq. (28), lida da direita para a esquerda, pode ser agora facilmente interpretada. Notar a introdução dos índices de refração correspondentes a cada meio, onde tratamos cada superfície refrativa considerando os índices à esquerda e direita. O raio que sai do ponto objeto, com angulo αo e altura ho, percorre uma distância so, no meio com índice n1. A seguir, esse raio é refratado na superfície refratora, com raio R1, e depois, na outra superfície com raio R2, ambas com índice n(i.e., a lente fina). Por último, o raio percorre uma distancia si, no meio com índice n2, até o ponto imagem correspondente.

Devido à extensão da matriz resultante vamos escrevê-la em forma simbólica como

(n2αihi)=(M11M12M21M22)(n1α0h0).(29)

A seguir, detalhamos cada um dos elementos

M11=1s0n1(nn1R1)s0n1(n2nR2).(30)
M12=(nn1R1)(n2nR2).(31)
M21=sin2[1s0n1(nn1R1)s0n1(n2nR2)]+s0n1.(32)
M22=sin2[(nn1R1)(n2nR2)]+1.(33)

Observar que, se no elemento M12, que corresponde a −1/f no caso da lente fina imersa em ar, fizermos n1 = n2 = 1, recuperamos efetivamente o inverso da distância focal nesse caso. Identificamos então o element M12 como sendo o negativo do inverso da distância focal da lente fina imersa nos meios de indices n1 e n2. Evidentemente, isto também pode ser demonstrado aplicando o mesmo raciocínio que nas Eqs. (1619). Com isto, as Eqs. (30)–(33), podem ser escritas de uma forma mais compacta

M11=1s0n1f.(34)
M12=1f.(35)
M21=sin2+s0n1(1sin2f).(36)
M22=1sin2f.(37)

O próximo passo será determinar a condição de imagem para este sistema. Para isso, escrevemos a Eq. (29), explicitamente, agora com os elementos expressados como nas Eqs. (3336)

(n2αihi)=(1s0n1f,1fsin2+s0n1(1sin2f),1sin2f)(n1α0h0).(38)

Resolvendo a equação matricial (38), para hi, temos

hi=[sin2+s0n1(1sin2f)]n1α0+(1sin2f)h0.(39)

A condição de imagem, como antes, requer que a derivada de hi com respeito a αo seja nula; daí, obtemos

sin2+s0n1(1sin2f)=0.(40)

De onde chegamos a

n1s0+n2si=1f.(41)

Notar que, se n1 = n2 = 1 na Eq. (41), i.e., lente fina imersa em ar, é recuperada a Eq. (24), como esperado.

Podemos também obter a expressão para o aumento lateral, Mt, da lente, introduzindo a Eq. (40), na Eq. (39)

hi=(1sin2f)h0.(42)

Dai, obtemos

MT=hih0=(1sin2f)=n1n2sis0.(43)

Onde, mais uma vez, fazendo n2 = n1 = 1, i.e., lente imersa em ar, recuperamos o resultado esperado, a Eq. (27).

5. Conclusões

Neste trabalho foi desenvolvido o formalismo matricial para propagação de raios ópticos, partindo da lei de Snell da refração aplicada a uma superfície esférica. A seguir, dito formalismo foi aplicado a duas superfícies refratoras em cascata (lente fina) imersa em ar. Foram deduzidas e justificadas as noções de foco e distância focal para a lente. Também, foi deduzida a condição de imagem através de considerações físicas e o aumento lateral da imagem. Por último, foram deduzidas a distância focal, a condição de imagem e o aumento lateral para uma lente fina imersa em dois meios com índices de refração diferentes.

Referências

[1] E. Hecht, Optics (Addison Wesley, 2002), 4th ed. [ Links ]

[2] Sears e Zemansky, Fisica IV, Ótica e Física Moderna (Pearson, São Paulo, 2005), 10a ed. [ Links ]

[3] R.A. Serway e J.W. Jewett, Jr. Princípios de Física, Volume 4, Óptica e Física Moderna (Thomson, São Paulo, 2005). [ Links ]

[4] http://www.olympusmicro.com/primer/anatomy/objectives.html. [ Links ]

Recebido: 12 de Fevereiro de 2015; Aceito: 25 de Março de 2015

Creative Commons License License information: This is an open-access article distributed under the terms of the Creative Commons Attribution License (type CC-BY), which permits unrestricted use, distribution and reproduction in any medium, provided the original article is properly cited.