Najlepsza odpowiedź
Definicja ślad jako suma przekątnych wpisów macierzy jest łatwy do nauczenia i łatwy do zrozumienia. Jednak nie ma on (a priori) żadnej ładnej interpretacji geometrycznej ani innej – wygląda po prostu na narzędzie obliczeniowe. Atakowanie go z tej perspektywy w zasadzie oznacza, że utknąłeś z obliczeniowymi dowodami faktów, takimi jak tr (AB) = tr (BA).
Nie są „t złe , per se. Są łatwe do zrozumienia i na pewno to, co powinno się pokazać, gdy ktoś na początku uczy się algebry liniowej. Istnieje głębszy powód, dla którego tr (AB) = tr (BA), ale jest dość abstrakcyjny i w szczególności wymaga iloczynu tensorowego, aby go zrozumieć.
Rozważmy przestrzeń operatorów liniowych z wektorów przestrzeń V z powrotem do siebie. Jeśli wybierzemy konkretny zestaw współrzędnych, takie operatory będą wyglądać jak macierze kwadratowe. Powinniśmy jednak dążyć do jak największego unikania współrzędnych.
Oznaczamy przez V ^ * podwójną przestrzeń V, która jest przestrzenią funkcjonałów liniowych na V — czyli odwzorowania liniowe \ lambda takie, że jeśli wstawimy wektor v, \ lambda (v) jest skalarem.
Jeśli następnie weźmiemy iloczyn tensorowy V ^ * \ otimes V, jest on izomorficzny z przestrzenią operatorów liniowych V \ rightarrow V. Izomorfizm działa w ten sposób: jeśli w \ in V, to (\ lambda \ otimes v) w = \ lambda (w) v.
Możemy również dowiedzieć się, jak wygląda kompozycja pod tym izomorfizmem – – przypomnij sobie, że składanie map liniowych jest tym samym, co mnożenie odpowiednich macierzy.
(\ lambda\_2 \ otimes v\_2) \ left ((\ lambda\_1 \ otimes v\_1) w \ right) = (\ lambda\_2 \ otimes v\_2) \ left (\ lambda\_1 (w) v\_1 \ right) = \ lambda\_2 \ left (\ lambda\_1 (w) v\_1 \ right) v\_2 = \ lambda\_2 (v\_1) \ lambda\_1 (w) v\_2
stąd
(\ lambda\_2 \ otimes v\_2) \ circ (\ lambda\_1 \ otimes v\_1) = \ lambda\_2 (v\_1) (\ lambda\_1 \ otimes v\_2)
W jaki sposób przyszedł ślad? Cóż, istnieje naturalne odwzorowanie z V ^ * \ otimes V na pole skalarów, które działa tak: \ lambda \ otimes v = \ lambda (v). Niesamowite jest to, że jeśli wszystko obliczysz we współrzędnych, to jest ślad.
To pokazuje, że ślad, który nie jest jakimś abstrakcyjnym narzędziem obliczeniowym, jest w rzeczywistości podstawową i naturalną mapą w algebrze liniowej . W szczególności powyższa analiza automatycznie daje dowód, że tr \ left (ABA ^ {- 1} \ right) = tr (B).
Ale dlaczego silniejsze stwierdzenie tr (AB) = tr ( BA) prawda? Cóż, obliczmy oba z nich.
tr \ left ((\ lambda\_2 \ otimes v\_2) \ circ (\ lambda\_1 \ otimes v\_1) \ right) = tr \ left (\ lambda\_2 (v\_1) (\ lambda\_1, v\_2) \ right) = \ lambda\_2 (v\_1) \ lambda\_1 (v\_2)
Z drugiej strony:
tr \ left ((\ lambda\_1 \ otimes v\_1) \ circ (\ lambda\_2 \ otimes v\_2) \ right) = tr \ left (\ lambda\_1 (v\_2) (\ lambda\_2, v\_1) \ right) = \ lambda\_1 (v\_2) \ lambda\_2 (v\_1)
Ah , więc AB odpowiada parowaniu \ lambda\_1, \ lambda\_2 i v\_1, v\_2 w jeden sposób, a BA odpowiada parowaniu ich w inny sposób, ale gdy wykonamy ślad, zostaną one sparowane ponownie iw tym momencie nie ma już żadnej różnicy.
Pięknie.
Odpowiedź
Dowód \ mbox {tr } (AB) = \ mbox {tr} (BA) to proste obliczenie:
\ mbox {tr} (AB) = \ sum\_i (AB) \_ {ii} = \ sum\_i \ sum\_j A\_ { ij} B\_ {ji} =
= \ sum\_j \ sum\_i B\_ {ji} A\_ {ij} = \ sum\_j (BA) \_ {jj} = \ mbox {tr} (BA).
Nie jestem pewien, czy to odpowiada na część pytania „dlaczego”, w sensie „Tak, Widzę, że obliczenia działają, ale dlaczego ? „.
Często nie jest możliwe wyjaśnienie, „dlaczego” coś jest prawdą. W tym miejscu może warto zauważyć, że AB i BA w rzeczywistości mają coś więcej niż ślad: mają ten sam charakterystyczny wielomian .
Inną użyteczną obserwacją jest to, że jeśli A lub B nie są pojedyncze (odwracalne), to AB i BA są podobnymi macierzami, po prostu dlatego, że
AB = B ^ {- 1} (BA )B.
Podobne macierze mają wyraźnie te same wartości własne, więc w szczególności mają ten sam ślad. Możemy argumentować na podstawie ciągłości (na polach, w których ma to sens), aby dojść do wniosku, że to samo dotyczy nawet pojedynczego przypadku.