Acessibilidade / Reportar erro

La transición a la formulación covariante del electromagnetismo

The transition to the covariant formulation of electromagnetism

Resúmenes

Si bien se considera que el electromagnetismo nació como una teoría relativista, esto usualmente no se explota en la enseñanza universitaria al realizar la transición a la formulación covariante tetradimensional del electromagnetismo. En este trabajo se presenta una transición basada en consideraciones formales que surgen de las mismas ecuaciones del electromagnetismo. Esto permite fundamentar la transición, introducir notación y mostrar que las ecuaciones toman formas más sencillas y de interpretación más directa.

Palabras clave
electromagnetismo; formulación covariante; relatividad especial


Although it is considered that the electromanetic theory was born as a relativistic theory, this is seldom used in undergrad education when making the transition to the covariant four-dimensional formulation of electromagnetism. In this work we present a transition based on formal considerations arising from the three-dimensional equations of electromagnetism. This allows to motivate the transition, introduce notation and show that the equations take a more simple form and a more direct interpretation.

Keywords
electromagnetism; covariant formulation; special relativity


1. Introdución

El electromagnetismo tomó forma hace un siglo y medio, con las ecuaciones de Maxwell. Hace un siglo, la relatividad especial hacía lo mismo. A pesar de que históricamente ambas teorías se pueden considerar prácticamente contemporáneas, en los programas universitarios suele tener preeminencia la teoría electromagnética, relegando la relatividad especial a una materia optativa o a un capítulo dentro del dictado de electromagnetismo. Esto llama la atención teniendo en cuenta que la relatividad especial es la teoría del espacio-tiempo en ausencia de campos gravitatorios aceptada en la actualidad. También es llamativo teniendo en cuenta que el electromagnetismo se puede considerar una teoría incompleta sin la relatividad especial.

Los libros típicamente utilizados en los cursos universitarios de electromagnetismo intentan subsanar esto incluyendo uno o dos capítulos de relatividad especial [1[1] D.J. Griffiths, Introduction to Electrodynamics (Prentice Hall, New Jersey, 1999), 3rd ed.], [2[2] J.D. Jackson, Classical Electrodynamics (John Wiley, New York, 1999), 3rd ed.], [3[3] W.K.H. Panofsky and M. Phillips, Classical Electricity and Magnetism (Addison-Wesley, Reading, 1962), 2nd ed.], [4[4] A.L. Davalos and D. Zanette, Fundamentals of Electromagnetism: Vacuum Electrodynamics, Media and Relativity (Springer, Berlin, 1999).]. También se utilizan libros que no presentan la formulación covariante como [5[5] J.R. Reitz, F.J. Milford and R.W. Christy, Foundations of Electromagnetic Theory (Addison-Wesley, Reading, 1979), 3rd ed.] y [6[6] J.A. Stratton, Electromagnetic Theory (McGraw-Hill, New York, 1941).]. Una excepción es el libro del Curso de Física Teórica de Lifshitz y Landau [7[7] E.M. Lifshitz and L.D. Landau, The Classical Theory of Fields (Course of Theoretical Physics Series) (Butterworth-Heinemann, New York, 1987), 4th ed, vol. 2.], donde los dos primeros capítulos están dedicados a la teoría de la relatividad especial, luego se presenta el lagrangiano correspondiente al campo electromagnético y de esto se deducen las ecuaciones electromagnéticas. Si bien esta forma es formalmente correcta, es difícil imaginar un curso para estudiantes de grado estructurado de esta manera.

La forma de presentación usual suele ser primero introducir la teoría electromagnética para los casos estáticos (electrostática y magnetostática), plantear las correcciones a las ecuaciones para variaciones temporales de los campos eléctricos y magnéticos, y presentar las ecuaciones de Maxwell. A continuación se presenta una discusión de la mecánica relativista, quizás motivada por los problemas en la transformación de las ecuaciones de Maxwell ante transformaciones de Galileo. Finalmente, se escriben las ecuaciones de Maxwell en forma covariante tetradimensional, usualmente primero escribiendo las ecuaciones tetradimensionales y luego mostrando que se corresponden con las ecuaciones de Maxwell. Finalmente, se derivan las transformaciones de los campos eléctricos y magnéticos al cambiar de marco de referencia. Esta forma de enseñar electromagnetismo y relatividad especial se puede entender teniendo en cuenta que los fenómenos electromagnéticos son mucho más fáciles de observar que los efectos relativistas. Además de que la relatividad tiene fama de ser una "teoría difícil", alejada del sentido común.

Sin embargo, más de una vez nos cruzamos con la afirmación de que "el electromagnetismo nació como una teoría relativista". Fundamentalmente, fue el electromagnetismo lo que llevó al nacimiento de la relatividad especial. Entonces surge el interrogante de por qué no es esto explotado en la enseñanza de la relatividad especial, teniendo en cuenta que primero se presenta la teoría electromagnética. En las presentaciones usuales parecería que se hace una pausa en la presentación de la teoría electromagnética para revisar la mecánica newtoniana, reemplazarla por la mecánica relativista, y regresar a hablar de electromagnetismo. Así, desde nuestra perspectiva, se da la sensación de que son dos teorías disconexas. También se da la sensación de que se "complica" el electromagnetismo innecesariamente. Una vez que las y los estudiantes han hecho un gran esfuerzo para entender la teoría electromagnética se los lleva a otra teoría, que parece separada del curso, para finalmente presentar las ecuaciones electromagnéticas en una forma que suele parecer más complicada todavía, y menos aplicable, pasando en el medio por ejercicios que parecen no tener que ver con el electromagnetismo, como contracción espacial y dilatación temporal.

Nuestro punto de vista, que es lo que se elabora en el presente trabajo, es que el electromagnetismo sí es una teoría naturalmente relativista, y que lo es desde la formulación de las ecuaciones de Maxwell. Consideramos que esto tendría que ser explotado en la transición de la formulación tridimensional del electromagnetismo a la formulación tetradimensional. A continuación presentamos cómo una vez que se tiene la formulación clásica del electromagnetismo es posible guiarse por consideraciones formales para llegar a la formulación tetradimensional covariante. Se construye de a pequeños pasos, que permiten ir introduciendo notación y muestra cómo objetos matemáticos tridimensionales se reemplazan por objetos matemáticos tetradimensionales, que en gran medida hacen que las ecuaciones tomen formas más sencillas y de interpretación más directa.

El trabajo se estructura de la siguiente forma. En la sección 2 se explicitan cuáles serán las ecuaciones que tomaremos como conocidas y en las cuales nos basaremos para hacer la transición al formalismo tetradimensional. En la sección 3 se discute la primera de dichas ecuaciones, la ecuación de conservación de la carga eléctrica. En la sección 4 se realiza el análisis de las ecuaciones de Maxwell, que es el punto central del formalismo. En la sección 5 se trabaja sobre los potenciales eléctrico y magnético. Finalmente, en la sección 6 se discuten las conclusiones y como consideramos se puede continuar luego de presentar el formalismo desarrollado.

2. Las ecuaciones del electromagnetismo

En esta sección presentamos las ecuaciones del electromagnetismo que utilizaremos en este trabajo. Estas ecuaciones se suponen ya han sido presentadas a las y los estudiantes, y son discutidas en todos los libros citados.

Comenzamos con la ecuación de continuidad o de conservación de la carga eléctrica:

(1)

donde ρ es la densidad de carga y J es la densidad de corriente eléctrica. Si bien (1) suele considerarse un "acompañamiento" a las ecuaciones de Maxwell, es la primer ecuación que tiene una interpretación tetradimensional, y motiva el trabajo posterior que es necesario realizar.

La parte central de la teoría son las leyes de Maxwell:

(2)
(3)
(4)
(5)

donde E es el campo eléctrico, B es el campo magnético, ϵ0 es la permitividad del vacío y μ0 es la permeabilidad del vacío. Como es sabido, y de importancia para el trabajo, en vacío estas ecuaciones implican que

(6)
(7)

donde ∇2 es el operador laplaciano en 3 dimensiones. Esto a su vez implica que las ondas electromagnéticas en el vacío viajan a velocidad

(8)

La pregunta que suelen plantear los libros es: ¿la velocidad con respecto a qué? En este punto es donde usualmente se comienza la disgresión para presentar la relatividad especial.

Para cerrar el análisis vamos a considerar la formulación en término de potenciales, el potencial escalar, V, y el potencial vector, A, a través de los cuales se expresan los campos electromagnéticos como

(9)
(10)

En particular, analizaremos el gauge de Lorentz, el cual se obtiene pidiendo que

(11)

3. La ecuación de continuidad

El propósito de esta sección es mostrar cómo consideraciones formales sobre la ecuación (1) llevan a una expresión más compacta para la misma, naturalmente tetradimensional. En el proceso se introduce notación que ayudará en las secciones siguientes.

Comenzamos entonces con la ecuación de continuidad, o conservación de la carga eléctrica (1), escrita de forma que todas las derivadas de las cargas estén a la izquierda,

(12)

Si escribimos explícitamente la divergencia en coordenadas cartesianas obtenemos

(13)

Esta expresión es sugestivamente similar a la divergencia en tres dimensiones, si consideramos como coordenadas a la tétrada (t,x,y,z), y como vector sobre el cual se calcula la divergencia a (ρ,Jx,Jy,Jz). El único problema aquí es que t no tiene las mismas unidades que x, y o z y que ρ no tiene las mismas unidades que J. Sin embargo, la teoría proporciona un factor de conversión natural entre tiempo y distancia, la velocidad de la luz, c. Además, como (13) es dimensionalmente correcta tenemos que c también es un factor natural de conversión entre ρ y J. Con esto en mente definimos las coordenadas

(14)

Yendo hacia la notación usual en relatividad, utilizamos superíndices para nombrar las coordenadas. Entonces (1) queda

(15)

Como hicimos con las coordenadas, optamos por colocar los índices de vectores tetradimensionales como superíndices, y definimos

(16)

Nos queda

(17)

Con estos cambios, que hasta ahora no han sido más que renombrar algunas cantidades, junto con aprovechar el factor natural c para utilizar la unidad de longitud como unidad de tiempo, la ecuación (17) toma explícitamente la forma de la divergencia tetradimensional de un vector tetradimensional.

Aprovechamos para introducir algo de notación. Para representar en forma compacta el vector (J0, J1, J2, J3) utilizamos el símbolo J con un superíndice griego, por ejemplo Jμ. El superíndice griego se puede pensar como que puede ser reemplazado por los números 0, 1, 2 ó 3, o simplemente como un indicador de que se trata de un vector tetradimensional y no del vector tridimensional J. Con esto, las coordenadas se pueden representar como xμ. Para las derivadas parciales se utilizan

(18)

que representamos genéricamente con μ. También utilizamos la "convención de sumatoria de Einstein", donde si un subíndice y un superíndice tienen el mismo símbolo, se realiza la sumatoria sobre todos los posibles reemplazos numéricos de los índices. De esta manera (17) puede escribirse en forma compacta como

(19)

Aquí, si expandimos el lado izquierdo, la convención implica que

(20)

que es el lado izquierdo de (17).

Si queremos referirnos dentro del formalismo tetradimensional a objetos tridimensionales se utilizan superíndices o subíndices latinos, por ejemplo, el vector tridimensional J está formado por (J1,J2,J3), que se lo representa a través de Ji, y también aplicando la convención de sumatoria, tenemos por ejemplo que

(21)

La ecuacion (19) es exactamente (1), escrita en notación relativista. Pero más importante que eso es notar cómo (19) apunta directamente a un operador natural, como la divergencia, actuando en un vector tetradimensional. El simple hecho de haber redefinido algunas cantidades guiados por consideraciones formales nos lleva a una expresión que tiene una interpretación más sencilla que (1). Esto nos ayuda a pensar que estamos en el camino correcto.

4. Las ecuaciones de Maxwell

Pasamos ahora al nudo de la teoría, las ecuaciones de Maxwell. Como hemos trabajado con la ecuación de continuidad, vamos a comenzar considerando las ecuaciones de Maxwell que contienen fuentes, esto es, (2) y (5). Guiándonos por el trabajo que hicimos con la ecuación de continuidad y la definición de Jμ (16), podemos escribir estas ecuaciones como

(22)
(23)

Observando el lado derecho de estas ecuaciones parecería que hemos separado por componentes una ecuación cuyo lado derecho es μ0Jμ. ¿Qué hacemos con el lado izquierdo? Lo primero es notar que tenemos operadores diferenciales, 0, rot y div, por lo que esperaríamos que estuviera μ. En segundo lugar, tenemos los campos E y B, que aparecen derivados, pero μ es un operador tetradimensional. La pregunta entonces es: ¿cómo hacemos con E y B para construir un objeto tetradimensional (u objetos tetradimensionales)? La primera opción sería considerar que son la parte espacial de vectores tetradimensionales, como hicimos con J, sin embargo no tenemos forma de obtener el cuarto componente de cada uno de esos vectores. La siguiente opción es notar que entre E y B tenemos seis parámetros libres, y que además en las ecuaciones de Maxwell aparecen combinados. Por lo tanto el camino podría ser buscar un objeto tetradimensional que tenga seis parámetros libres. Un vector tiene sólo cuatro, por lo tanto necesitaríamos una matriz, pero una matriz 4 × 4 tiene 16. La respuesta es tomar una matriz con restricciones, y buscando entre las posibilidades más directas se encuentra que una matriz 4 × 4 antisimétrica tiene justamente 6 parámetros libres. Recordemos que una matriz antisimétrica Fμν es una matriz de la forma

(24)

Dado que la ecuacion (23) contiene una divergencia, y que hemos conjeturado cuál sería el lado derecho, la propuesta más directa para una ecuación que englobe (22) y (23) es

(25)

donde tenemos que recordar la convención de sumatoria y que el índice libre μ significa que tenemos una ecuación para cada uno de los valores 0, 1, 2 y 3, o sea, (25) es una ecuación con 4 componentes. Para ver cómo incluir E y B en Fμν comenzamos tomando el superíndice μ = 0, y recordando la convención de sumatoria

(26)

por lo tanto esto correspondería a (23) si definimos

(27)

Si ahora tomamos μ = 1 tenemos

(28)

y si comparamos con (22) vemos que tenemos que definir

(29)

Tomando μ = 2 tenemos que

(30)

El caso μ = 3 se satisface automáticamente, lo cual es reflejo de que los componentes de Jμ no son independientes, sino que deben satisfacer la ecuación de continuidad, o en otras palabras, es consecuencia de que la ecuación de conservación se pueda obtener de las ecuaciones de Maxwell. Por lo tanto, las dos ecuaciones de Maxwell que hemos considerado, (2) y (5), se pueden escribir en la forma (25), donde el "tensor de campo electromagnético" está dado por

(31)

Todavía tenemos que considerar las ecuaciones de Maxwell homogéneas, (3) y (4). Dado que estas se pueden obtener de las que sí hemos utilizado, (2) y (5), haciendo el reemplazo

(32)

no tenemos que volver a tomarnos el trabajo de deducir cuál sería su forma tetradimensional. Si en el tensor Fμν hacemos los reemplazos anteriores, obtenemos un nuevo tensor, que contiene la misma información que Fμν. A este tensor lo denotamos por *Fμν, y se lo llama el "dual de Hodge de Fμν"1 1 Tomar el dual de Hodge de un tensor antisimétrico es una operación definida en general en un espacio vectorial con un elemento de volumen. Sin embargo, no nos parece que entrar en la definición formal de esta operación ayude a las o los estudiantes a tener una idea más clara de lo que se intenta hacer, al contrario, consideramos que lleva a una discusión que desvía del interés principal. A pesar de esto, consideramos también que es el lugar correcto para presentar el nombre de la operación, sin ocultar esto a las y los estudiantes, tema que se puede retomar una vez que se haya explicado el álgebra tensorial tetradimensional. , que explícitamente tiene componentes

(33)

Las ecuaciones correspondientes son

(34)

Con esto completamos el trabajo de llevar las ecuaciones de Maxwell a una formulación tetradimensional, (25) y (34). Al igual que con la ecuación de continuidad las expresiones finales son más compactas. Sin embargo esto no es lo más importante, lo central en este caso es que vemos cómo los campos eléctricos y magnéticos realmente conforman un sólo objeto tetradimensional, el tensor de campo electromagnético (31). También vemos que en esta formulación las ecuaciones toman una interpretación matemática directa, la divergencia del tensor electromagnético es igual al vector de corriente tetradimensional.

5. Potenciales electromagnéticos

En el tratamiento y búsqueda de soluciones de las ecuaciones de Maxwell se consigué una simplificación considerable al tratar las mismas en términos de potenciales. Podríamos esperar una simplificación semejante en la formulación tetradimensional.

Los campos tridimensionales se pueden escribir en términos del potencial escalar, V, y el potencial vector, A, a través de (9) y (10). Como hemos visto, E y B forman un objeto más complicado que un vector tetradimensional, sin embargo, el hecho de tener un escalar y un vector tridimensional sugiere, como con la densidad de carga y la corriente eléctrica, el formar un vector tetradimensional. Para que todas las componentes tengan las mismas unidades, definimos

(35)

La pregunta ahora es si podemos recuperar las relaciones entre los campos y los potenciales pero escritas en términos de Fμν y Aμ. Esto es ciertamente posible dado que Fμν tiene la misma información que E y B, y que Aμ tiene la misma información que V y A. Por esto si simplemente escribiéramos (9) y (10) en términos de los componentes de los campos y potenciales tridimensionales, luego podríamos reemplazar por los componentes de los objetos tetradimensionales y obtendríamos las relaciones equivalentes. Sin embargo esto no es en última instancia lo que queremos. Lo que intentamos es encontrar relaciones que tengan un sentido estrictamente tetradimensional. Si las encontramos, eso mostraría que la definición de Aμ es la correcta.

De la ecuacion (10), tenemos que

(36)

y en general para los componentes 1, 2 y 3,

(37)

Considerando ahora (9) tenemos que

(38)

Considerando (37) y (38), vemos que son muy similares, con una diferencia de signo. También notamos que a la izquierda tenemos dos superíndices, mientras que a la derecha tenemos un superíndice y un subíndice. Aunque en este punto no es claro por qué deberían haber sólo superíndices en el lado derecho si sólo tenemos superíndices en el lado izquierdo, podemos solucionar ambos problemas si definimos las derivadas parciales con superíndices de la siguiente forma:

(39)

Esto es, si ponemos superíndices, la derivada con respecto a x0 cambia de signo mientras que las otras no cambian. Con esto, podemos englobar las relaciones (37) y (38) en

(40)

A esto nos referíamos cuando buscábamos una ecuación consistente en términos tetradimensionales. Esta ecuación es la misma para todos los componentes de Fμν, y nuevamente se ve que la notación es más económica que la notación tridimensional.

Una de las venajas de la formulación en términos de potenciales es que se encarga de satisfacer automáticamente las ecuaciones de Maxwell homogéneas, por lo tanto, aunque no vamos a entrar en el trabajo de demostrarlo en términos púramente tetradimensionales, se satisface automáticamente (34). La ecuación de Maxwell inhomogéna (25) queda

(41)

Recordemos ahora que sobre los potenciales tenemos la libertad de aplicar transformaciones de gauge. De la ecuación (40) vemos que Fμν no cambia si se realiza el cambio

(42)

donde λ es una función y usamos que las derivadas parciales conmutan. Si nos referimos al gauge de Lorentz, pedíamos (11), lo que en notación tetradimensional ya no es complicado ver que significa que

(43)

nuevamente una ecuación compacta y de interpretación más directa que la versión tridimensional. De (41) vemos que en este gauge las ecuaciones de Maxwell toman la forma

(44)

El operador νν se lo llama el "d'Alembertiano", denotado por □, y es el operador diferencial de la ecuación de onda, esto es

(45)

De esto se ve directamente que en el vacío (Jμ = 0) y en el gauge de Lorentz, cada componente de Aμ satisface la ecuación de ondas. Es interesante notar cómo el cambio de signo en ∂0 lleva a que el operador □, que es la divergencia del gradiente, sea el operador de onda y no el laplaciano usual.

6. Conclusiones

Esperamos haber mostrado cómo, eligiendo cuidadosamente los pasos a dar, las ecuaciones tridimensionales del electromagnetismo sugieren formalmente el camino hacia la formulación covariante tetradimensional. Las ecuaciones que se obtienen son en todos los casos más compactas y de una interpretación matemática más directa. Consideramos también que esta forma de presentar la transición entre ambas formulaciones hace más comprensible la utilización de los objetos tetradimensionales, en particular del tensor de campo electromagnético, el cual sentimos que muchas veces las y los estudiantes simplemente aceptan como un mal necesario.

Quedan varios puntos a tratar en un curso luego de esta presentación, siendo no menor el de los fundamentos de la mecánica relativista. Por supuesto, un entendimiento profundo del electromagnetismo no puede darse sin un entendimiento de la relatividad especial, y esta presentación no viene a suplantarlo. Por esto consideramos que la presentación actual deja allanado el camino para ahora sí involucrar a las y los estudiantes en la discusión de la relatividad especial. Los puntos ganados son principalmente la construcción de varios objetos tetradimensionales, el familiarizarse con la notación y el dejar lugares de contacto para la discusión de la teoría de la relatividad especial. Así, como primer punto de contacto sugerimos el cambio de signo en la primer componente de las derivadas parciales (39), que lleva al d'Alembertiano como operador natural, y que lleva también a la pregunta sobre el mapeo de vectores y covectores, o del módulo natural a asociar a un tetravector.

Hay puntos de la teoría difíciles de tratar sin una discusión de la relatividad especial. En particular cabe mencionar la ley de Lorentz, la construcción del tensor de energía-momento y la ecuación de conservación de energía-momento, dado que requieren en gran medida de la definición de tetravelocidad y tiempo propio. Hubiera sido posible incluirlos en el tratamiento dado en este trabajo, sin embargo consideramos que también hubiera sido forzado. Dado que el interés no es poner las ecuaciones del electromagnetismo en el formalismo tetradimensional sin pasar por la relatividad especial, sino allanar y motivar el camino para dicho estudio, se decidió dejar esos temas afuera del tratamiento.

Finalmente, nos gustaría recalcar como pensamos se podría usar el presente tratamiento dentro de la presentación del electromagnetismo. Una vez que se ha llegado a las ecuaciones de Maxwell, se utiliza el tratamiento presentado para escribir las ecuaciones en forma covariante y motivar el estudio de la relativida especial. Luego, al presentar los fundamentos de la relatividad especial, se hace contacto con los objetos tetradimensionales ya construidos y se motiva la definición de la métrica y el tensor de Levi-Civitta, este último necesario para definir el dual de Hodge. Finalmente se introducen los elementos faltantes en esta discusión, como el tensor de energía-momento electromagnético, la fuerza de Lorentz y la ecuación de conservación de la energía-momento.

Referencias

  • [1]
    D.J. Griffiths, Introduction to Electrodynamics (Prentice Hall, New Jersey, 1999), 3rd ed.
  • [2]
    J.D. Jackson, Classical Electrodynamics (John Wiley, New York, 1999), 3rd ed.
  • [3]
    W.K.H. Panofsky and M. Phillips, Classical Electricity and Magnetism (Addison-Wesley, Reading, 1962), 2nd ed.
  • [4]
    A.L. Davalos and D. Zanette, Fundamentals of Electromagnetism: Vacuum Electrodynamics, Media and Relativity (Springer, Berlin, 1999).
  • [5]
    J.R. Reitz, F.J. Milford and R.W. Christy, Foundations of Electromagnetic Theory (Addison-Wesley, Reading, 1979), 3rd ed.
  • [6]
    J.A. Stratton, Electromagnetic Theory (McGraw-Hill, New York, 1941).
  • [7]
    E.M. Lifshitz and L.D. Landau, The Classical Theory of Fields (Course of Theoretical Physics Series) (Butterworth-Heinemann, New York, 1987), 4th ed, vol. 2.
  • 1
    Tomar el dual de Hodge de un tensor antisimétrico es una operación definida en general en un espacio vectorial con un elemento de volumen. Sin embargo, no nos parece que entrar en la definición formal de esta operación ayude a las o los estudiantes a tener una idea más clara de lo que se intenta hacer, al contrario, consideramos que lleva a una discusión que desvía del interés principal. A pesar de esto, consideramos también que es el lugar correcto para presentar el nombre de la operación, sin ocultar esto a las y los estudiantes, tema que se puede retomar una vez que se haya explicado el álgebra tensorial tetradimensional.

Fechas de Publicación

  • Publicación en esta colección
    2017

Histórico

  • Recibido
    29 Mar 2016
  • Revisado
    12 Ago 2016
  • Acepto
    22 Ago 2016
Sociedade Brasileira de Física Caixa Postal 66328, 05389-970 São Paulo SP - Brazil - São Paulo - SP - Brazil
E-mail: marcio@sbfisica.org.br