Matrixexponential
In der Mathematik ist das Matrixexponential, auch als Matrixexponentialfunktion bezeichnet eine Matrixfunktion, welche analog zur gewöhnlichen (skalaren) Exponentialfunktion definiert ist. Das Matrixexponential stellt die Verbindung zwischen Lie-Algebra und der zugehörigen Lie-Gruppe her.
Definition
Sei eine reelle oder komplexe -Matrix. Das Exponential von , welches mit oder bezeichnet wird, ist die -Matrix, welche durch die folgende Potenzreihe definiert ist (Taylor-Entwicklung):
- .
Diese Reihe konvergiert, genauso wie die der gewöhnlichen Exponentialfunktion, immer. Daher ist das Exponential von wohldefiniert. Wenn eine -Matrix ist, entspricht das Matrixexponential von der gewöhnlichen Exponentialfunktion. Eine Verallgemeinerung, welche auch für unendliche Matrizen sinnvoll ist, ist die Exponentialfunktion auf beliebigen Banachalgebren.
Eigenschaften
Das Matrixexponential teilt eine Reihe der Eigenschaften der gewöhnlichen Exponentialfunktion. Beispielsweise ist das Exponential der -Nullmatrix gleich der -Einheitsmatrix :
- .
Für beliebige komplexe -Matrizen und beliebige komplexe Zahlen und gilt
- .
Daraus folgt
- ,
das heißt
- .
Dabei bezeichnet die zu inverse Matrix.
Die Exponentialfunktion erfüllt für alle Zahlen und . Dasselbe gilt für kommutierende Matrizen und , das heißt, aus
folgt
- .
Für nichtkommutierende Matrizen stimmt diese Gleichung im Allgemeinen nicht. In diesem Fall kann man mit Hilfe der Baker-Campbell-Hausdorff-Formel berechnen.
Das Exponential der zu transponierten Matrix ist gleich der Transposition des Exponentials von :
Daraus folgt, dass die Matrixexponentialfunktion symmetrische Matrizen auf symmetrische Matrizen und schiefsymmetrische Matrizen auf orthogonale Matrizen abbildet. Analog gilt zwischen Adjunktion und Exponentiation die Beziehung
- ,
so dass die Matrixexponentialfunktion hermitesche Matrizen auf hermitesche Matrizen und schiefhermitesche Matrizen auf unitäre Matrizen abbildet.
Weiterhin gelten:
- Wenn invertierbar ist, dann ist .
- , hier bezeichnet die Spur der quadratischen Matrix .
- .
Die Exponentialabbildung
Das Exponential einer Matrix ist immer eine invertierbare Matrix. Die Inverse von ist durch gegeben. Das (komplexe) Matrixexponential liefert somit eine Abbildung
aus dem Vektorraum aller (komplexen) -Matrizen in die allgemeine lineare Gruppe, die Gruppe aller (komplexen) invertierbaren Matrizen. Diese Abbildung ist kein Gruppenhomomorphismus auf der gesamten Gruppe , aber auf jeder Untergruppe, deren Matrizen multiplikativ miteinander kommutieren. Des Weiteren ist sie surjektiv, das heißt, jede (reelle oder komplexe) invertierbare Matrix kann als die Exponentialmatrix einer komplexen Matrix geschrieben werden. Urbilder (bzw. lokale Schnitte) lassen sich durch Matrixlogarithmen berechnen.
Für je zwei Matrizen und gilt
- ,
wobei eine beliebige Matrixnorm bezeichnet. Daraus folgt, dass die Exponentialabbildung stetig und auf kompakten Teilmengen von sogar lipschitzstetig ist. Für die Norm des Matrixexponentials selbst gibt es aber eine präzisere Schranke
mit der logarithmischen Matrixnorm und dem numerischen Wertebereich.
Die Zuordnung
definiert eine glatte Kurve in der allgemeinen linearen Gruppe, welche für die Einheitsmatrix liefert. Dies liefert eine Einparameter-Untergruppe der allgemeinen linearen Gruppe, da
gilt. Die Ableitung dieser Funktion im Punkt ist durch
gegeben. Die Ableitung für ist gerade die Matrix , das heißt, erzeugt diese Einparameter-Untergruppe.
Allgemeiner gilt:
Beispiele von Lie-Algebren und zugehörigen Lie-Gruppen
Lie-Gruppe | Beispiel |
---|---|
Allgemeine lineare Gruppe | . |
Orthogonale Gruppe | |
Unitäre Gruppe | |
Spezielle unitäre Gruppe | wird von surjektiv auf abgebildet. |
Spezielle orthogonale Gruppe | (schiefsymmetrische Matrizen) wird von surjektiv auf abgebildet. |
Spezielle lineare Gruppe | wird von nicht surjektiv auf abgebildet. Notorisches Gegenbeispiel mit liegt nicht im Bild von . |
Aus dem letzten Beispiel ist ersichtlich, dass die Exponentialabbildung für die Erzeugung von Lie-Gruppen (je nach Lie-Algebra) im Allgemeinen nicht surjektiv ist.
Lineare Differentialgleichungen
Einer der Vorzüge des Matrixexponentials ist, dass man es benutzen kann, um Systeme von linearen gewöhnlichen Differentialgleichungen zu lösen, die z. B. für das Zustandsraummodell von dynamischen Übertragungssystemen verwendet werden. Aus Gleichung (1) oben folgt zum Beispiel, dass die Lösung des Anfangswertproblems
mit einer quadratischen Matrix durch
gegeben ist.
Das Matrixexponential kann auch zur Lösung der inhomogenen Gleichung
- ,
verwendet werden. Beispiele findet man unten im Kapitel Anwendungen.
Für Differentialgleichungen der Form
mit nicht-konstantem gibt es im Allgemeinen keine geschlossenen Lösungen. Die Magnus-Reihe liefert jedoch eine allgemeine Lösung in Matrixschreibweise über die Matrix-Exponentialfunktion auch im Fall nicht-konstanter Koeffizienten (als unendliche Reihe des Exponenten).[1]
Berechnung des Matrixexponentials
Taylor-Reihe
Die Exponentialfunktion der Matrix und kann prinzipiell über ihre Taylor-Entwicklung berechnet werden:
Hierbei bezeichnet die Fakultät von . Bei ausreichender Genauigkeit (Reihe ist absolut konvergent) soll die Reihe bei einer endlichen Zahl an Berechnungsschritten abbrechen. Je größer die Einträge der Matrix sind, desto mehr Glieder der Reihe müssen aber berechnet werden (z. B. für die Lösung der linearen DGL für einen großen Zeitschritt). Um den Lösungsalgorithmus dahingehend zu verbessern, kann man die Einträge der Matrix mittels der Rechenregel elegant skalieren ("Scaling & Squaring"-Methode). Ist die (natürliche-) Matrixnorm nicht zu groß, kann die Berechnung der Reihe auch über die Padé-Approximation erfolgen. Die Scaling & Squaring-Methode hat einen Aufwand der Größenordnung (im Wesentlichen Matrizenmultiplikationen). Der Faktor von ist abhängig von den Skalierungsparametern sowie insbesondere von der Matrixnorm.
Nilpotenter Fall
Eine Matrix ist nilpotent, wenn für eine geeignete natürliche Zahl gilt. In diesem Fall bricht die Reihenentwicklung von nach einer endlichen Anzahl von Termen ab und das Matrixexponential kann als
berechnet werden.
Diagonalisierung der Matrix
Ist die Matrix eine Diagonalmatrix
- ,
dann kann man ihr Exponential ermitteln, indem man die gewöhnliche Exponentialfunktion auf jeden Eintrag der Hauptdiagonalen anwendet:
- .
Damit kann man auch das Exponential einer diagonalisierbaren Matrix berechnen. Zur Diagonalisierung
mit einer Diagonalmatrix werden die zugehörige Eigenbasis sowie die Eigenwerte der Matrix bestimmt. Für die Matrix-Exponentialfunktion folgt daraus
mit der skalaren Exponentialfunktion . Der Beweis folgt direkt aus der Taylor-Entwicklung der Exponentialfunktion.
Die Diagonalisierung der Matrix gehört, wie auch der QR-Algorithmus oder die Jordansche Normalform, zu den Matrix-Zerlegungsmethoden zur Berechnung der Exponentialfunktion. Die Diagonalisierung und der QR-Algorithmus haben dabei jeweils einen Aufwand der Größenordnung und sind aber, im Vergleich zu Methoden auf Basis der Taylor-Entwicklung, unabhängig von . Der wesentliche Berechnungsaufwand (hier: Bestimmung der Eigenwerte und Eigenvektoren) ist zudem unabhängig von der Variablen . Zur Lösung beispielsweise von linearen Differentialgleichungen für mehrere Zeitschritte muss dieser Arbeitsaufwand also nur einmalig erbracht werden. Die Berechnung der weiteren Zeitschritte erfolgt bei der Methode Diagonalisierung durch einfache Matrizenmultiplikation und bei dem QR-Algorithmus liegt der Aufwand in der Größenordnung von nur noch .
Beispiel 1
Es soll das Matrixexponential für die folgende Matrix berechnet werden:
- .
Hierzu wird die -Matrix zunächst mittels der Eigenwerte und den Eigenvektoren diagonalisiert. Mit der Diagonalmatrix und der Eigenbasis folgt:
- .
Die Eigenwerte werden aus dem charakteristischen Polynom bestimmt zu
- .
Für die beiden Eigenvektoren bzw. die Eigenbasis gilt:
- sowie
Einsetzen für die Matrix-Exponentialfunktion liefert schließlich
als geschlossene analytische Lösung.[2]
Beispiel 2
Die Matrix-Exponentialfunktion
kann explizit berechnet werden, jedoch ist die Matrix selbst nicht diagonalisierbar. Die Matrix besitzt die beiden Eigenwerte . Obwohl also der Eigenwert die algebraische Vielfachheit 2 hat, existiert nur ein linear unabhängiger Eigenvektor. Die Basis aus den Eigenvektoren
ist nicht invertierbar. Die Diskriminante des charakteristischen Polynoms
wird dabei immer null. In diesem Fall, also wenn gleiche Eigenwerte bzw. Eigenvektoren vorkommen, kann formell die Jordansche Normalform zur Transformation verwendet werden.
Splitting-Methode
Zerfällt das Minimalpolynom (bzw. das charakteristische Polynom) der Matrix in Linearfaktoren (über ist das stets der Fall), dann kann eindeutig in eine Summe
zerlegt werden, wobei
- diagonalisierbar ist,
- nilpotent ist und
- mit kommutiert (d. h. ).
Damit kann man das Exponential von berechnen, indem man es auf die vorgenannten Fälle reduziert: . Im letzten Schritt benötigt man die Kommutativität von und .
Verwendung der jordanschen Normalform
Eine weitere Methode ist die Verwendung der jordanschen Normalform von , wobei auch die Splitting-Methode zum Einsatz kommt. Sei die jordansche Normalform von mit der Basiswechselmatrix , dann gilt
Wegen
gilt
Daher muss man nur das Exponential eines Jordan-Blocks kennen. Nun ist jeder Jordan-Block von der Form
wobei eine spezielle nilpotente Matrix ist. Das Exponential des Jordan-Blocks ist also
Beispiel
Man betrachte die Matrix
- ,
welche die jordansche Normalform
mit der Übergangsmatrix
hat. Dann gelten
und
- .
Somit ist
- .
Das Exponential einer 1×1-Matrix ist trivial. Mit folgt
Die jordansche Normalform und daraus das Exponential zu berechnen, ist auf diesem Weg sehr mühsam. Meist reicht es, die Wirkung der Exponential-Matrix auf einige Vektoren zu berechnen.
Numerische Berechnung
Die Jordan-Normalform-Zerlegung ist numerisch instabil, da aufgrund der Gleitkommaarithmetik Rundungsfehler in die Eigenwerte eingeführt werden, die eine Gruppierung der Eigenwerte in Gruppen identischer Eigenwerte unmöglich macht. Daher werden in der Numerik andere Techniken zur Berechnung des Matrixexponentials verwendet. Zu den effektivsten verfügbaren Algorithmen gehören die Padé-Approximation mit Skalieren und Quadrieren (s. Berechnung mittels Taylorreihe) oder die Matrix-Zerlegungsmethoden wie die Diagonalisierung der Matrix. Bei großen Matrizen kann der Rechenaufwand auch reduziert werden, indem Krylowräume verwendet werden, deren Basisvektoren mit dem Arnoldi-Verfahren orthogonalisiert worden sind.
Explizite Formeln
Mittels der Diagonalisierung über die Eigenwerte und Eigenvektoren ist die Darstellung der Matrix-Exponentialfunktion einer -Matrix auch als explizite Formel möglich. Insbesondere der Umweg über die teils komplexen Eigenwerte ist damit nicht mehr notwendig:[3]
Für die Hilfsfunktion gilt in Abhängigkeit der reellen, komplexen, oder gleichen Eigenwerte (anhand der Diskriminante des charakteristischen Polynoms):
Putzer-Algorithmus
Eine weitere Möglichkeit, das Matrixexpontial zu berechnen, ist der Putzer-Algorithmus. Dabei definiert man bei gegebener Matrix und rekursiv stetig-differenzierbare Funktion und Matrizen , so dass gilt:
Die Lösung des Matrixexponentials einer -Matrix wird hierbei als Polynom erhalten. Die Berechnung hat dabei einen Aufwand der Größenordnung (Berechnung der Eigenwerte sowie insbesondere Matrizenmultiplikationen) und eignet sich daher eher nur für kleine Matrizen.
Anwendungen
Homogene lineare Differentialgleichungen
Das Matrixexponential kann für die Lösung eines Systems von linearen Differentialgleichungen verwendet werden. Eine Differentialgleichung der Form
hat die Lösung . Wenn man den Vektor
betrachtet, dann kann man ein System von gekoppelten linearen Differentialgleichungen betrachten als
- .
Wenn man den Integrationsfaktor ansetzt und auf beiden Seiten multipliziert, erhält man
- ,
also
- .
Wenn man berechnet, erhält man eine Lösung des Differentialgleichungssystems.
Beispiel (homogen)
Gegeben sei das folgende Differentialgleichungssystem
Es lässt sich schreiben als mit der Koeffizientenmatrix
- .
Damit ergibt sich das zugehörige Matrixexponential zu
- .
Als allgemeine Lösung des Differentialgleichungssystems erhält man somit
- .
Inhomogener Fall – Variation der Konstanten
Für den inhomogenen Fall kann man die Methode der Variation der Konstanten benutzen. Es wird eine Lösung der Form gesucht:
Um die Lösung zu ermitteln, fordert man
- ,
also
und daher
- .
Damit ergibt sich
- ,
wobei die Anfangsbedingung angenommen worden ist.
Beispiel (inhomogen)
Gegeben sei das Differentialgleichungssystem
Mit der Matrix von oben schreibt sich das System
mit
- .
Die allgemeine Lösung der homogenen Gleichung wurde bereits oben berechnet. Die Summe aus homogenen und speziellen Lösungen ergibt die Lösung für das inhomogene Problem. Man muss jetzt nur noch eine spezielle Lösung finden (über die Variation der Konstanten). Von der Gleichung oben erhält man:
- ,
also
- .
Siehe auch
Literatur
- Roger A. Horn, Charles R. Johnson: Topics in Matrix Analysis. Cambridge University Press, 1991, ISBN 0-521-46713-6 (englisch).
- Cleve Moler, Charles F. Van Loan: Nineteen Dubious Ways to Compute the Exponential of a Matrix, Twenty-Five Years Later. In: SIAM Review. Band 45, Nr. 1, 2003, ISSN 1095-7200, S. 1–49, doi:10.1137/S00361445024180 (cornell.edu [PDF]).
- V. I. Arnolʹd: Gewöhnliche Differentialgleichungen. Springer-Verlag, Berlin / New York 1980, ISBN 3-540-09216-1.
Einzelnachweise
- ↑ S. Blanes, F. Casas, J. A. Oteo, J. Ros: The Magnus expansion and some of its applications. (= Physics Reports. Band 470). Cornell University Library, 2009, OCLC 635162561.
- ↑ T. Möller: Symbolic mathematics-based simulation of cylinder spaces for regenerative gas cycles. In: Int J Energy Environ Eng. Springer Berlin/ Heidelberg, Feb. 2015. http://link.springer.com/article/10.1007/s40095-015-0163-3
- ↑ T. Möller: Simulation und konstruktive Optimierung der Wärmeübertrager regenerativer Gaskreisprozesse. Shaker Verlag Düren, Aug. 2022. http://www.shaker.de/shop/978-3-8440-8706-2