Geodezyjne - od intuicji do równań

Najprostsza geometria, nauczana w szkołach, to tzw. geometria euklidesowa - nazywana tak od Greka, Euklidesa, który w IV w. p.n.e. opisał w swoich "Elementach" jej podstawy. Geometria ta opiera się na pojęciach punktów, prostych i płaszczyzn i wydaje się doskonale odpowiadać naszym codziennym doświadczeniom z różnymi kształtami. A jednak już nawet w naszym bezpośrednim otoczeniu można natknąć się na problemy, do których opisu geometria euklidesowa jest niewystarczająca.

Wyobraźmy sobie na przykład, że jesteśmy pilotami samolotu i mamy za zadanie jak najszybciej dolecieć z Warszawy do San Francisco. Bierzemy mapę świata i korzystając z wyniesionej z geometrii euklidesowej wiedzy, że najkrótsza linia między dwoma punktami to linia prosta, wykreślamy taką linię od Warszawy do San Francisco. Już szykujemy się do wylotu po naszej trasie... ale na szczęście znajomy nawigator uświadamia nas, że wpadliśmy w pułapkę.

Pułapka polega na tym, że powierzchnia Ziemi nie jest płaszczyzną! Mapa, której użyliśmy do wytyczenia trasy po linii prostej, to tylko pewne odwzorowanie powierzchni, która w rzeczywistości jest zbliżona kształtem do sfery. W związku z tym najkrótsza trasa to nie czerwona linia na mapie poniżej, a fioletowa:

Czerwona linia - prosta na mapie łącząca Warszawę i San Francisco. Fioletowa linia to faktycznie najkrótsza trasa.

Może być to widać nieco lepiej, gdy popatrzeć na Ziemię w jej kulistej formie:

Najkrótsza linia między Warszawą i San Francisco na globusie

Zwróćmy uwagę, że fioletowa linia (czy też czarna na drugim obrazku) nadal w pewnym sensie jest prosta. Jeśli po prostu wsiądziemy w samolot i ruszymy przed siebie wzdłuż tej linii, nie będziemy musieli po drodze zakręcać. Lecąc cały czas prosto, polecimy dokładnie taką trasą.

Takie linie - odpowiedniki prostych na krzywych powierzchniach - nazywa się geodezyjnymi i powiemy sobie dziś trochę o ich wytyczaniu (czy też może odpowiedniejszym słowem byłoby: wyliczaniu).

Ale zanim przejdziemy do szczegółów, musimy rozszerzyć sobie trochę aparat pojęciowy, żeby w ogóle mieć w swoim słowniku pojęcia odpowiednie do mówienia o takich bardziej ogólnych pojęciach/przestrzeniach.

Rozmaitości

I nie, nie chodzi o synonim "różności". Rozmaitość (ang. "manifold") to pojęcie matematyczne, swego rodzaju uogólnienie euklidesowej przestrzeni.

Czym jest rozmaitość? Jest to po prostu pewien zbiór punktów, który lokalnie przypomina przestrzeń euklidesową. Co to znaczy? Mówiąc nieco obrazowo, znaczy to, że możemy wybrać jakiś punkt naszej rozmaitości i popatrzeć na jego najbliższe otoczenie, i jeśli tak zrobimy, to będzie ono wyglądało jak przestrzeń euklidesowa, tj. w takim otoczeniu będzie można w dobrym przybliżeniu mówić o prostych odcinkach, figurach znanych z geometrii euklidesowej itp. Czyli zasadniczo w niewielkich otoczeniach poszczególnych punktów można uprawiać taką geometrię, jaką już znamy.

(Co to znaczy "niewielkie otoczenie"? Matematycy używają w takich kontekstach pojęcia granicy. W przełożeniu na prosty język, im mniejsze otoczenie weźmiemy, tym bliższa geometria takiego otoczenia będzie geometrii euklidesowej. Ściśle rzecz biorąc, całkiem euklidesowa może się stać dopiero, kiedy rozmiar otoczenia będzie zerowy - co może się wydawać mało użyteczne, bo wtedy mówimy już tylko o jednym punkcie - ale okazuje się, że takie ujęcie już wystarcza, by mówić o wielu ciekawych rzeczach.)

Co można robić z rozmaitościami? Przede wszystkim, można wprowadzać na nich układy współrzędnych, nazywane w tym kontekście mapami. Mapa to funkcja z jakiegoś podzbioru rozmaitości (lub, czasem, całej rozmaitości) w podzbiór przestrzeni euklidesowej, zwykle utożsamianej z \mathbb{R}^n. Co oznacza tyle, że każdemu punktowi jakiejś części naszej rozmaitości przypisujemy n liczb rzeczywistych - dokładnie tak, jak robi się to przy wprowadzaniu układów współrzędnych na płaszczyźnie, czy w przestrzeni euklidesowej. n jest tutaj wymiarem rozmaitości - tak jak przestrzenie euklidesowe, rozmaitości mogą mieć dowolny wymiar.

Może się zdarzyć, że rozmaitość ma na tyle złożony kształt, że nie da się zdefiniować mapy, która pokryłaby ją całą. To nie problem, dopóki każdą część da się pokryć jakąś mapą i części pokryte różnymi mapami mają jakieś części wspólne. Wtedy można opisywać różne fragmenty rozmaitości w różnych mapach i tłumaczyć opis z jednej mapy na drugą w częściach wspólnych tych fragmentów. Zbiór układów współrzędnych określonych na danej rozmaitości nazywa się atlasem.

Przykład: M jest rozmaitością z dwoma mapami, jedną określoną na podzbiorze U_\alpha (zielonym), drugą na U_\beta (fioletowym). Pozdbiory te mają część wspólną (jasnoniebieską), gdzie można stosować obie mapy. Można więc też wykonywać przejścia z jednej mapy do drugiej (\tau_{\alpha,\beta} i \tau_{\beta,\alpha}).

Funkcje, pozwalające przejść z jednej mapy do innej na części rozmaitości gdzie jest ich określonych kilka, nazywa się przekształceniami przejścia.

Ponieważ mapa to de facto pewien układ współrzędnych, w dalszej części artykułu będę pisał po prostu o układach współrzędnych i transformacjach między nimi.

Zauważmy, że przekształcenia przejścia (transformacje między układami współrzędnych) są funkcjami z \mathbb{R}^n w \mathbb{R}^n. Takie funkcje bywają różniczkowalne. I właśnie przypadek, kiedy te funkcje są różniczkowalne, jest przedmiotem zainteresowania geometrii różniczkowej. Rozmaitość w takiej sytuacji nazywa się z kolei rozmaitością różniczkową.

Gdy mamy rozmaitość różniczkową i współrzędne na niej, możemy już mówić też o polach wektorowych, kowektorowych, tensorowych i robić różne ciekawe rzeczy. Jednak żeby mówić o liniach geodezyjnych, potrzebujemy jeszcze jednego elementu - metryki. W dużym skrócie, metryka jest czymś, co określa odległości między punktami naszej rozmaitości, a w ten sposób też w pewnym sensie jej kształt. Rozmaitość dwuwymiarowa bez metryki może być czymkolwiek. To dopiero metryka pozwoli nam odróżnić, czy mamy do czynienia z kawałkiem płaszczyzny, czy może kawałkiem sfery albo kawałkiem paraboloidy hiperbolicznej.

O metryce i niektórych innych pojęciach związanych z geometrią różniczkową rozpisałem się szerzej w serii Matematyka czarnych dziur. Jest ona niedokończona, ale polecam jej lekturę przed przejściem do dalszej części tego artykułu - osobom nieobeznanym z geometrią różniczkową powinna choć trochę rozjaśnić niektóre oznaczenia czy pojęcia, które będę stosował dalej. (Prawdopodobnie dołączę kiedyś do serii też ten artykuł, ale najpierw będę musiał nieco przemyśleć jej koncepcję.)

Linie proste

Zanim przejdziemy do linii geodezyjnych, zastanówmy się, jak opisywać zwykłe linie proste w geometrii euklidesowej, ale używając pojęć wprowadzonych wyżej.

Załóżmy więc, że naszą rozmaitością jest zwykła płaszczyzna euklidesowa. Na tej płaszczyźnie mamy wprowadzone współrzędne kartezjańskie: (x, y), w których metryka jest macierzą jednostkową (patrz Część 3 - metryka). Mamy też daną pewną krzywą w postaci parametrycznej t \mapsto (x(t), y(t)). Jak rozpoznać, czy ta krzywa to po prostu linia prosta?

Zastanówmy się, jak najprościej przedstawić prostą w postaci parametrycznej. Chcemy dla różnych parametrów t dostać różne punkty na prostej. Aby to osiągnąć, możemy wybrać jakiś punkt na prostej \vec{x_0} i w zależności od parametru t, przesuwać go o pewien wektor wzdłuż prostej. Mogłoby to wyglądać np. tak:

 \vec{x}(t) = \vec{x_0} + \vec{v}t

(Podobieństwo do równania ruchu jednostajnego i prostoliniowego - nieprzypadkowe ;) )

Stosując notację bardziej zbliżoną do tej używanej w kontekście geometrii różniczkowej, moglibyśmy to zapisać tak:

 x^\mu(t) = x_0^\mu + v^\mu t

Taki zapis ma też dodatkową zaletę - kompletny brak założeń co do liczby wymiarów. To równanie będzie wyglądało tak samo na płaszczyźnie, jak i w przestrzeni 16-wymiarowej. Wszystko zależy od tego, jaki jest zakres wskaźnika \mu.

Co tu widzimy? Ogólne równanie parametryczne prostej to po prostu pewna funkcja liniowa parametru t (dokładniej: n funkcji liniowych, po jednej na każdą współrzędną). Istnieje równanie, którego rozwiązaniami są wszystkie funkcje liniowe i tylko funkcje liniowe. To równanie to:

 \frac{d^2 x^\mu}{dt^2} = 0

Czyli: druga pochodna współrzędnych po parametrze t znika.

Jeśli pochodną po t oznaczymy kropką nad zmienną, jak to się często konwencjonalnie robi, równanie będzie wyglądało tak:

 \ddot{x}^\mu = 0

Łatwo zobaczyć, że to prawda. Jeśli weźmiemy równanie prostej i policzymy pierwszą pochodną, stała x_0^\mu zniknie, a z wyrazu v^\mu t zostanie tylko v^\mu - pewna stała, która zniknie po drugim zróżniczkowaniu. Widać więc, że nasze równanie prostej spełnia to ogólne równanie.

I w drugą stronę: jeśli druga pochodna x^\mu jest zero, to znaczy że pierwsza pochodna jest stała, a samo x^\mu jest funkcją liniową t.

Tak oto zatem wygląda ogólne równanie linii prostej w przestrzeni euklidesowej. Krótko i zwięźle.

(Drobna uwaga: to jest równanie prostej w tzw. parametryzacji afinicznej, co znaczy, że t jest proporcjonalne do odległości od punktu t = 0. Możliwe są też inne parametryzacje, w których druga pochodna współrzędnej nie znika. Komplikuje to jednak rozważania, a parametryzację krzywej zawsze można zmienić na afiniczną, więc skupię się tylko na tym przypadku.)

Zobaczymy teraz, jak wychodząc od tego równania można dojść do ogólnego równania linii geodezyjnej.

Linie geodezyjne

Po rozgrzewce w przestrzeni euklidesowej, czas na ogólną rozmaitość. Załóżmy, że mamy daną bliżej nieokreśloną rozmaitość, jakiś układ współrzędnych x^\mu i metrykę wyrażoną w tych współrzędnych g_{\mu\nu}. Dostajemy jakąś krzywą t \mapsto x^\mu(t) i mamy orzec, czy jest to linia geodezyjna.

Podstawowe pytanie, jakie natychmiast się rodzi, to: ale jak właściwie zdefiniować linię geodezyjną?

Wykorzystamy to, że każda rozmaitość ma lokalnie przypominać przestrzeń euklidesową. A jak lokalnie przypomina przestrzeń euklidesową, to da się w jakimś obszarze wprowadzić współrzędne przypominające kartezjańskie. Powiemy więc tak: krzywa jest linią geodezyjną (w parametryzacji afinicznej), jeśli dla każdego punktu na tej krzywej prawdą jest, że jeśli w otoczeniu tego punktu wprowadzimy współrzędne lokalnie przypominające kartezjańskie y^\alpha, to w tych współrzędnych w tym punkcie krzywa spełnia równanie \ddot{y}^\alpha = 0.

Czyli, w uproszczeniu: nasza krzywa jest geodezyjną, jeśli gdy weźmiemy punkt na niej i popatrzymy na niewielkie otoczenie tego punktu - wystarczająco niewielkie, żeby rozmaitość przypominała przestrzeń euklidesową - to w tym otoczeniu nasza krzywa wygląda jak linia prosta.

Ilustracja powyższej definicji: w otoczeniu czerwonego punktu wprowadzamy współrzędne y, które lokalnie przypominają kartezjańskie. W tych współrzędnych nasza linia powinna spełniać równanie \ddot{y}^\alpha = 0.

To, jak się okazuje, już wystarczy, żeby otrzymać równanie geodezyjnej. Musimy tylko jeszcze doprecyzować kilka rzeczy, przede wszystkim: co to znaczy "współrzędne lokalnie przypominające kartezjańskie"?

Zdefiniujemy to przy pomocy metryki. Otóż powiemy, że współrzędne y^\alpha lokalnie przypominają kartezjańskie, jeśli:

  • metryka g wyrażona w tych współrzędnych (oznaczymy ją h_{\alpha\beta}) jest macierzą jednostkową w interesującym nas punkcie (oznaczmy go y_0)
  • pochodne metryki h w punkcie y_0 wynoszą 0.

Czyli:

 h_{\alpha\beta}(y_0) = \left( \begin{array}{cccc} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{array} \right)

 \frac{\partial}{\partial y^\gamma} h_{\alpha\beta} (y_0) = 0

Jak się okazuje, zawsze da się wybrać takie współrzędne, żeby powyższe warunki były spełnione w jednym punkcie. Jeśli da się wybrać takie, że warunki powyżej są spełnione wszędzie, to wtedy mamy w ogóle do czynienia z przestrzenią euklidesową, a nasze współrzędne to współrzędne kartezjańskie.

Dygresja: transformacje współrzędnych

Ponieważ w dalszej części artykułu będziemy operować na dwóch układach współrzędnych, warto wspomnieć, jak wyglądają transformacje układów współrzędnych na przykładzie punktów, wektorów i metryki.

Transformacja współrzędnych jest dana jako pewien zestaw funkcji: każda współrzędna jednego układu jest wyrażona jako funkcja współrzędnych drugiego układu:

 y^\alpha = y^\alpha(x^\mu)

 x^\mu = x^\mu(y^\alpha)

Na przykład, na płaszczyźnie możemy mieć dwa układy współrzędnych: kartezjański (x,y) i biegunowy (r, \vartheta). Transformacje wyglądają wtedy tak:

 \left\{ \begin{array}{l} r = r(x,y) = \sqrt{x^2 + y^2} \\ \vartheta = \vartheta(x,y) = \arctan(\frac{y}{x}) \end{array} \right.

 \left\{ \begin{array}{l} x = x(r, \vartheta) = r \cos \vartheta \\ y = y(r, \vartheta) = r \sin \vartheta \end{array} \right.

Wobec tego jeśli mamy punkt, którego współrzędne znamy w jednym układzie, wystarczy przeliczyć je zgodnie z tymi funkcjami by uzyskać współrzędne w drugim układzie.

Co z wektorami? Wyobraźmy sobie, że mamy wektor v^\mu wyrażony we współrzędnych x i chcemy wyrazić go jako u^\alpha we współrzędnych y. Przypomnijmy, że wektor jako pełen obiekt matematyczny to tak naprawdę pewien operator różniczkowy, w tym przypadku: v^\mu \frac{\partial}{\partial x^\mu} (patrz Część 2 - współrzędne, wektory i konwencja sumacyjna). Wyrażony we współrzędnych y jako u^\alpha \frac{\partial}{\partial y^\alpha} jest wciąż tym samym wektorem. Zatem:

 v^\mu \frac{\partial}{\partial x^\mu} = u^\alpha \frac{\partial}{\partial y^\alpha}

W następnym kroku "przenosimy" \frac{\partial}{\partial y^\alpha} na drugą stronę. Taka operacja nie istnieje jako poprawna operacja matematyczna, ale jest to przydatna mnemotechnika, by zapamiętać jak uzyskać poprawny wynik - bo wynik poniżej okazuje się poprawny:

 u^\alpha = v^\mu \frac{\partial y^\alpha}{\partial x^\mu}

Wracając do przykładu z płaszczyzną i współrzędnymi kartezjańskimi i biegunowymi: jeśli v^x, v^y to współrzędne jakiegoś wektora w układzie kartezjańskim i chcemy przeliczyć je na układ biegunowy (u^r, u^\vartheta), możemy to zrobić tak:

 u^r = v^x \frac{\partial r}{\partial x} + v^y \frac{\partial r}{\partial y}

 u^\vartheta = v^x \frac{\partial \vartheta}{\partial x} + v^y \frac{\partial \vartheta}{\partial y}

Zauważmy przy tym, że wynik będzie zależał od tego, w jakim punkcie wykonujemy transformację. Wektor (1,1) we współrzędnych kartezjańskich będzie miał inne współrzędne w układzie biegunowym w zależności od tego, w jakim punkcie jest zaczepiony! W związku z tym każdą transformację należy postrzegać albo jako przeprowadzoną w konkretnym punkcie, albo jako pewną funkcję współrzędnych (jednych albo drugich).

Na koniec jeszcze metryka. Zrobimy tu podobny trik jak z wektorem, tzn. zauważymy, że pełnym obiektem geometrycznym jest g_{\mu\nu}dx^\mu dx^\nu, które musi być równe h_{\alpha\beta}dy^\alpha dy^\beta. Stąd:

 h_{\alpha\beta} = g_{\mu\nu} \frac{\partial x^\mu}{\partial y^\alpha} \frac{\partial x^\nu}{\partial y^\beta}

Czyli na przykład, jeśli mamy metrykę we współrzędnych kartezjańskich i chcemy przeliczyć ją na biegunowe, będzie to wyglądało tak:

 h_{rr} = g_{xx} \frac{\partial x}{\partial r} \frac{\partial x}{\partial r} + g_{xy} \frac{\partial x}{\partial r} \frac{\partial y}{\partial r} + g_{yx} \frac{\partial y}{\partial r} \frac{\partial x}{\partial r} + g_{yy} \frac{\partial y}{\partial r} \frac{\partial y}{\partial r}

...itd.

Jako ćwiczenie dla Czytelnika polecam wyliczyć stąd metrykę we współrzędnych biegunowych, gdy wiadomo, że we współrzędnych kartezjańskich jest macierzą jednostkową (tj. g_{xx} = g_{yy} = 1, g_{xy} = g_{yx} = 0).

Na koniec ostatnia uwaga. \frac{\partial x^\mu}{\partial y^\alpha} jest pewną macierzą (o wartościach zależnych od współrzędnych), zwaną jakobianem transformacji. Pochodne transformacji w drugą stronę - \frac{\partial y^\alpha}{\partial x^\mu} - tworzą macierz odwrotną. To oznacza, że:

 \frac{\partial x^\mu}{\partial y^\alpha} \frac{\partial y^\alpha}{\partial x^\nu} = \delta^\mu_\nu

gdzie \delta^\mu_\nu to tzw. delta Kroneckera - macierz jednostkowa. (Od metryki jednostkowej różni się tym, że ma jeden wskaźnik na górze, a drugi na dole - co powoduje, że jest macierzą jednostkową w każdym układzie współrzędnych. Czemu to tak działa, to wykracza poza zakres tego artykułu - tu istotne jest jedynie, że wynik jest taki, a nie inny.)

Delta Kroneckera wymnożona przez jakąś wielkość w efekcie tylko "zmienia wskaźnik" - tj., na przykład:

 g_{\mu\nu} \delta^\nu_\alpha = g_{\mu\alpha}

Powrót do geodezyjnych

Wracamy do naszej sytuacji z krzywą na rozmaitości. Mamy współrzędne x^\mu i metrykę wyrażoną w tych współrzędnych g_{\mu\nu}, oraz współrzędne y^\alpha i tę samą metrykę w tych współrzędnych, h_{\alpha\beta}.

Zgodnie z naszą definicją, równanie geodezyjnej we współrzędnych y to:

 \frac{d^2}{dt^2} y^\alpha = 0

Spróbujemy wyrazić je we współrzędnych x, czyli naszych współrzędnych wyjściowych (przypominam, że y to tylko lokalne współrzędne, przypominające układ kartezjański).

Pierwsza pochodna współrzędnych punktów krzywej: \frac{d y^\alpha}{dt} to tzw. wektor styczny do krzywej. Skoro jest to wektor, wiemy, jak wyrazić go we współrzędnych x:

 \frac{d y^\alpha}{dt} = \frac{dx^\mu}{dt} \frac{\partial y^\alpha}{\partial x^\mu}

Zróżniczkujmy to jeszcze raz po t:

 \frac{d^2 y^\alpha}{dt^2} = \frac{d^2 x^\lambda}{dt} \frac{\partial y^\alpha}{\partial x^\lambda} + \frac{dx^\lambda}{dt} \frac{d}{dt} \frac{\partial y^\alpha}{\partial x^\lambda}

Jak zróżniczkować po t wyrażenie \frac{\partial y^\alpha}{\partial x^\lambda}? Pamiętajmy, że to wyrażenie jest określone w zależności od współrzędnych (czy to x, czy to y). Współrzędne są z kolei pewnymi funkcjami t wzdłuż naszej krzywej. Możemy zatem zastosować regułę łańcuchową, różniczkując po współrzędnych, a następnie współrzędne po t:

 \frac{d}{dt} \frac{\partial y^\alpha}{\partial x^\lambda} = \frac{\partial^2 y^\alpha}{\partial x^\lambda \partial x^\nu} \frac{d x^\nu}{dt}

Stąd:

 \frac{d^2 y^\alpha}{dt^2} = \frac{d^2 x^\lambda}{dt} \frac{\partial y^\alpha}{\partial x^\lambda} + \frac{dx^\lambda}{dt} \frac{\partial^2 y^\alpha}{\partial x^\lambda \partial x^\nu} \frac{d x^\nu}{dt}

Drugie pochodne współrzędnych y są 0 na geodezyjnej, więc dostajemy (zmieniając jeszcze notację z powrotem na "kropkową"):

 0 = \ddot{x^\lambda} \frac{\partial y^\alpha}{\partial x^\lambda} + \frac{\partial^2 y^\alpha}{\partial x^\lambda \partial x^\nu} \dot{x}^\lambda \dot{x}^\nu

Pomnóżmy jeszcze wszystko przez \frac{\partial x^\mu}{\partial y^\alpha}:

 0 = \ddot{x^\lambda} \frac{\partial y^\alpha}{\partial x^\lambda}\frac{\partial x^\mu}{\partial y^\alpha} + \frac{\partial^2 y^\alpha}{\partial x^\lambda \partial x^\nu} \dot{x}^\lambda \dot{x}^\nu \frac{\partial x^\mu}{\partial y^\alpha}

Przypomnijmy, że \frac{\partial y^\alpha}{\partial x^\lambda}\frac{\partial x^\mu}{\partial y^\alpha} = \delta^\mu_\lambda i że v^\lambda \delta^\mu_\lambda = v^\mu, skąd dostajemy:

 0 = \ddot{x^\mu} + \frac{\partial x^\mu}{\partial y^\alpha} \frac{\partial^2 y^\alpha}{\partial x^\lambda \partial x^\nu} \dot{x}^\lambda \dot{x}^\nu

Ok. Otrzymaliśmy pewną zależność na współrzędne x, ale w tej zależności wciąż mamy pochodne funkcji transformacji ze współrzędnych x do y i na odwrót. Czy da się z tego całkowicie wyzbyć współrzędnych y? Okazuje się, że się da. Trzeba do tego wykorzystać metrykę.

Przypomnijmy, że mamy jeszcze metrykę wyrażoną we współrzędnych x jako g_{\mu\nu} i we współrzędnych y jako h_{\alpha\beta}. Ponieważ to ta sama metryka, tylko w innych współrzędnych, to możemy napisać:

 g_{\mu\nu} = h_{\alpha\beta} \frac{\partial y^\alpha}{\partial x^\mu} \frac{\partial y^\beta}{\partial x^\nu}

Obliczmy pochodne metryki g po współrzędnych x:

 \frac{\partial g_{\mu\nu}}{\partial x^\lambda} = \frac{\partial}{\partial x^\lambda} \left( h_{\alpha\beta} \frac{\partial y^\alpha}{\partial x^\mu} \frac{\partial y^\beta}{\partial x^\nu} \right)

Dostajemy:

 \frac{\partial g_{\mu\nu}}{\partial x^\lambda} = \frac{\partial h_{\alpha\beta}}{\partial x^\lambda} \frac{\partial y^\alpha}{\partial x^\mu} \frac{\partial y^\beta}{\partial x^\nu} + h_{\alpha\beta} \frac{\partial^2 y^\alpha}{\partial x^\mu \partial x^\lambda} \frac{\partial y^\beta}{\partial x^\nu} + h_{\alpha\beta}\frac{\partial y^\alpha}{\partial x^\mu} \frac{\partial^2 y^\beta}{\partial x^\nu \partial x^\lambda}

Zakładaliśmy jednak, że pochodne metryki h są 0! (Co prawda względem współrzędnych y, ale jeśli są 0 względem współrzędnych y, to względem współrzędnych x też - polecam sprawdzenie jako ćwiczenie.) Zatem cały pierwszy składnik znika i dostajemy:

 \frac{\partial g_{\mu\nu}}{\partial x^\lambda} = h_{\alpha\beta} \frac{\partial^2 y^\alpha}{\partial x^\mu \partial x^\lambda} \frac{\partial y^\beta}{\partial x^\nu} + h_{\alpha\beta}\frac{\partial y^\alpha}{\partial x^\mu} \frac{\partial^2 y^\beta}{\partial x^\nu \partial x^\lambda}

(Będziemy od teraz w skrócie zapisywać \frac{\partial g_{\mu\nu}}{\partial x^\lambda} jako g_{\mu\nu,\lambda}.)

Wyraźmy teraz h_{\alpha\beta} przez g:

 h_{\alpha\beta} = g_{\rho\sigma} \frac{\partial x^\rho}{\partial y^\alpha} \frac{\partial x^\sigma}{\partial y^\beta}

Po podstawieniu:

 g_{\mu\nu,\lambda} = g_{\rho\sigma} \frac{\partial x^\rho}{\partial y^\alpha} \frac{\partial x^\sigma}{\partial y^\beta} \left( \frac{\partial^2 y^\alpha}{\partial x^\mu \partial x^\lambda} \frac{\partial y^\beta}{\partial x^\nu} + \frac{\partial y^\alpha}{\partial x^\mu} \frac{\partial^2 y^\beta}{\partial x^\nu \partial x^\lambda}\right)

Znowu przypomnijmy sobie, że przeciwne jakobiany po wymnożeniu dają delty Kroneckera:

 g_{\mu\nu,\lambda} = g_{\rho\sigma}  \left( \frac{\partial^2 y^\alpha}{\partial x^\mu \partial x^\lambda} \frac{\partial x^\rho}{\partial y^\alpha} \delta^\sigma_\nu + \frac{\partial^2 y^\beta}{\partial x^\nu \partial x^\lambda} \frac{\partial x^\sigma}{\partial y^\beta} \delta^\rho_\mu \right)

Stąd:

 g_{\mu\nu,\lambda} = g_{\rho\nu} \frac{\partial^2 y^\alpha}{\partial x^\mu \partial x^\lambda} \frac{\partial x^\rho}{\partial y^\alpha} + g_{\mu\sigma} \frac{\partial^2 y^\beta}{\partial x^\nu \partial x^\lambda} \frac{\partial x^\sigma}{\partial y^\beta}

Oznaczmy \Gamma^\lambda_{\mu\nu} = \frac{\partial^2 y^\alpha}{\partial x^\mu \partial x^\nu} \frac{\partial x^\lambda}{\partial y^\alpha} oraz \Gamma_{\lambda\mu\nu} = g_{\lambda\sigma} \Gamma^\sigma_{\mu\nu}. Wtedy:

 g_{\mu\nu,\lambda} = \Gamma_{\nu\mu\lambda} + \Gamma_{\mu\nu\lambda}

Nasze równanie geodezyjnej z kolei przyjmuje postać:

 0 = \ddot{x}^\mu + \Gamma^\mu_{\lambda\nu} \dot{x}^\lambda \dot{x}^\nu

Zauważmy też, że \Gamma_{\lambda\mu\nu} = \Gamma_{\lambda\nu\mu}, tzn. wielkość ta jest symetryczne względem dwóch ostatnich wskaźników. Jest tak, gdyż wyrażeniu na tę wielkość dwa ostatnie wskaźniki występują tylko w drugiej pochodnej y, a różniczkowanie jest symetryczne względem kolejności, tj.:

 \frac{\partial^2 y^\alpha}{\partial x^\mu \partial x^\nu} = \frac{\partial^2 y^\alpha}{\partial x^\nu \partial x^\mu}

Jesteśmy teraz już o krok od końca. Pozostało tylko wypisać wyrażenie na \Gamma, które nie zawiera współrzędnych y. Uzyskamy to, wypisując następujące równania:

 g_{\mu\nu,\lambda} = \Gamma_{\nu\mu\lambda} + \Gamma_{\mu\nu\lambda}

I z zamienionymi wskaźnikami:

 g_{\mu\lambda,\nu} = \Gamma_{\lambda\mu\nu} + \Gamma_{\mu\lambda\nu} =  \Gamma_{\lambda\mu\nu} + \Gamma_{\mu\nu\lambda}

 g_{\lambda\nu,\mu} = \Gamma_{\nu\lambda\mu} + \Gamma_{\lambda\nu\mu} =  \Gamma_{\nu\mu\lambda} + \Gamma_{\lambda\mu\nu}

Dodając dwa pierwsze równania i odejmując trzecie, otrzymamy:

 g_{\mu\nu,\lambda} + g_{\mu\lambda,\nu} - g_{\lambda\nu,\mu} = 2\Gamma_{\mu\nu\lambda}

Stąd:

 \Gamma_{\mu\lambda\nu} = \frac{1}{2} \left( g_{\mu\lambda,\nu} + g_{\mu\nu,\lambda} - g_{\lambda\nu,\mu} \right)

 \Gamma^\mu_{\lambda\nu} = g^{\mu\sigma} \Gamma_{\sigma\lambda\nu} = \frac{1}{2} g^{\mu\sigma} \left( g_{\sigma\lambda,\nu} + g_{\sigma\nu,\lambda} - g_{\lambda\nu,\sigma} \right)

g^{\mu\sigma} to tzw. metryka odwrotna, czyli macierz odwrotna do macierzy metryki (taka, że g^{\mu\sigma}g_{\sigma\nu} = \delta^\mu_\nu).

Nawiasem mówiąc, \Gamma^\mu_{\nu\lambda} to tzw. symbole Christoffela - są one pewną miarą krzywoliniowości układu współrzędnych, a licząc ich pochodne da się wyliczyć tensor krzywizny Riemanna, wyrażający krzywiznę rozmaitości. Ale to już zagadnienie wykraczające mocno poza zakres tego artykułu.

Ostateczne równanie

Zatem, korzystając wyłącznie z intuicji, że geodezyjna powinna być czymś naśladującym prostą na dowolnej powierzchni, otrzymaliśmy ostatecznie równanie:

 0 = \ddot{x}^\mu + \Gamma^\mu_{\lambda\nu} \dot{x}^\lambda \dot{x}^\nu

gdzie:

 \Gamma^\mu_{\lambda\nu} = \frac{1}{2} g^{\mu\sigma} \left( g_{\sigma\lambda,\nu} + g_{\sigma\nu,\lambda} - g_{\lambda\nu,\sigma} \right)

W tych równaniach współrzędne y już w ogóle nie występują. Mając tylko powierzchnię i jej kształt, dany jako metryka w pewnych współrzędnych, możemy teraz obliczać równania linii geodezyjnych.

Przykład: geodezyjne na sferze

Dla przykładu, pokażę jeszcze jak wykorzystać te równania do znalezienia równań linii geodezyjnych na sferze (tzw. ortodrom). Użyjemy współrzędnych geograficznych, tj. (\vartheta, \varphi) (\vartheta - szerokość geograficzna od -\frac{\pi}{2} do \frac{\pi}{2}, \varphi - długość geograficzna od -\pi do \pi), w których metryka sfery wygląda następująco:

 g_{\vartheta\vartheta} = R^2

 g_{\varphi\varphi} = R^2 \cos^2 \vartheta

 g_{\vartheta\varphi} = g_{\varphi\vartheta} = 0

R jest tutaj promieniem naszej sfery.

Metryka odwrotna to:

 g^{\vartheta\vartheta} = \frac{1}{R^2}

 g^{\varphi\varphi} = \frac{1}{R^2 \cos^2 \vartheta}

 g^{\vartheta\varphi} = g^{\varphi\vartheta} = 0

Pochodne metryki - tylko składowa g_{\varphi\varphi} nie jest stała i zależy tylko od \vartheta, więc jedyna niezerowa pochodna spośród 8 możliwych to:

 g_{\varphi\varphi,\vartheta} = -2R^2 \sin\vartheta \cos\vartheta

Niezerowe symbole Christoffela z opuszczonym wskaźnikiem to jedynie te, w których występuje dwa razy \varphi i raz \vartheta:

 \Gamma_{\varphi\varphi\vartheta} = \Gamma_{\varphi\vartheta\varphi} = \frac{1}{2}g_{\varphi\varphi,\vartheta} = -R^2 \sin\vartheta \cos\vartheta

 \Gamma_{\vartheta\varphi\varphi} = -\frac{1}{2}g_{\varphi\varphi,\vartheta} = R^2 \sin\vartheta \cos\vartheta

Pozostało podnieść pierwszy wskaźnik:

 \Gamma^\varphi_{\varphi\vartheta} = \Gamma^\varphi_{\vartheta\varphi} = g^{\varphi\varphi} \Gamma_{\varphi\varphi\vartheta} + g^{\varphi\vartheta} \Gamma_{\vartheta\varphi\vartheta} = -\tan \vartheta

 \Gamma^\vartheta_{\varphi\varphi} = g^{\vartheta\vartheta}\Gamma_{\vartheta\varphi\varphi} + g^{\vartheta\varphi}\Gamma_{\varphi\varphi\varphi} = \sin\vartheta \cos\vartheta

Możemy teraz wypisać równanie geodezyjnej:

 0 = \ddot{\vartheta} + \Gamma^\vartheta_{\vartheta\vartheta} \dot{\vartheta} \dot{\vartheta} + \Gamma^\vartheta_{\vartheta\varphi} \dot{\vartheta} \dot{\varphi} + \Gamma^\vartheta_{\varphi\vartheta} \dot{\varphi} \dot{\vartheta} + \Gamma^\vartheta_{\varphi\varphi} \dot{\varphi} \dot{\varphi} = \ddot{\vartheta} + \dot{\varphi}^2\sin\vartheta \cos\vartheta

 0 = \ddot{\varphi} + \Gamma^\varphi_{\vartheta\vartheta} \dot{\vartheta} \dot{\vartheta} + \Gamma^\varphi_{\vartheta\varphi} \dot{\vartheta} \dot{\varphi} + \Gamma^\varphi_{\varphi\vartheta} \dot{\varphi} \dot{\vartheta} + \Gamma^\varphi_{\varphi\varphi} \dot{\varphi} \dot{\varphi} = \ddot{\varphi} - 2\dot{\vartheta}\dot{\varphi}\tan \vartheta

Przepisane inaczej:

 \ddot{\vartheta} = -\dot{\varphi}^2 \sin\vartheta\cos\vartheta

 \ddot{\varphi} = 2\dot{\vartheta} \dot{\varphi}\tan \vartheta

Korzystając z tych równań, można wytyczyć ortodromę, znając początkową pozycję i kierunek.

Podsumowanie

Chciałem w tym artykule pokazać, że da się wyprowadzić ogólne równanie linii geodezyjnej, opierając się tylko na podstawach geometrii różniczkowej i intuicji odnośnie geodezyjnych - tj. że są to takie linie, które są "najprostsze jak się da", co próbowałem nieco ściślej ująć jako spełnianie równania prostej w układzie współrzędnych "lokalnie przypominającym kartezjański". Czy mi się udało - już nie mi oceniać, ale chętnie dowiem się z komentarzy :) Zapraszam też do zadawania pytań, jeśli coś jest niejasne, no i wskazywania błędów, których prawdopodobnie nie udało mi się tak zupełnie uniknąć :)