W rachunku wariacyjnym, szczególnie w mechanice Lagrange'a, ludzie często mówią, że niezależnie zmieniamy pozycję i prędkość. Ale prędkość jest pochodną pozycji, więc jak możesz traktować je jako zmienne niezależne?
W rachunku wariacyjnym, szczególnie w mechanice Lagrange'a, ludzie często mówią, że niezależnie zmieniamy pozycję i prędkość. Ale prędkość jest pochodną pozycji, więc jak możesz traktować je jako zmienne niezależne?
W przeciwieństwie do tego, co sugeruje twoje pytanie, nie jest prawdą, że prędkość zmienia się niezależnie od położenia. Zmiana pozycji $ q \ mapsto q + \ delta q $ wywołuje zmianę prędkości $ \ części_t q \ mapsto \ części_t q + \ części_t (\ delta q) $ zgodnie z oczekiwaniami.
jedyną rzeczą, która może wydawać się dziwna, jest to, że $ q $ i $ \ części_t q $ są traktowane jako zmienne niezależne lagrangianu $ L (q, \ części_t q) $. Ale to nie jest zaskakujące; w końcu, jeśli zapytasz „jaka jest energia kinetyczna cząstki?”, to nie wystarczy znać położenia cząstki, musisz także znać jej prędkość, aby odpowiedzieć na to pytanie.
Innymi słowy, możesz niezależnie wybrać pozycję i prędkość jako warunki początkowe , dlatego funkcja Lagrangianu traktuje je jako niezależne; ale rachunek zmienności nie zmienia ich niezależnie , zmiana położenia wywołuje dopasowaną zmianę prędkości.
Odpowiedź na twoje główne pytanie jest już podana - nie zmieniasz koordynacji i prędkości niezależnie. Ale wydaje się, że głównym problemem jest użycie współrzędnych i prędkości jako zmiennych niezależnych.
Odniosę się do tej wspaniałej książki: „Applied Differential Geometry”. Autor: William L. Burke. Pierwsza linijka książki (w której autor zwykle mówi, komu poświęcona jest ta książka) jest taka:
Prawdą jest, że od czasu do czasu uczeń zadaj to pytanie. Ale próby wyjaśnienia tego „z góry na dół” zwykle prowadzą do coraz większej liczby pytań. Naprawdę trzeba w temacie uporządkować matematykę „od dołu do góry”. Cóż, jak sugeruje nazwa książki - dyscypliną matematyczną, której potrzebujemy, jest geometria różniczkowa.
Nie mogę powtórzyć wszystkich szczegółów, ale w skrócie wygląda to tak:
Biorąc pod uwagę to, co napisał Greg Graviton, napiszę wyprowadzenie i zobaczę, czy potrafię to zrozumieć.
$$ S = \ int_ {t_1} ^ {t_2} L (q, \ dot q, t) \, \ mathrm {d} t $$
gdzie S to akcja, a L to Lagrangian. Zmieniamy ścieżkę i znajdujemy ekstremum akcji:
$$ \ delta S = \ int_ {t_1} ^ {t_2} \ left ({\ częściowe L \ ponad \ częściowe q} \ delta q + {\ częściowe L \ ponad \ częściowe \ kropka q} \ delta \ dot q \ w prawo) \, \ mathrm {d} t = 0 \ ,. $$
Tutaj q i $ \ dot q $ zmieniają się niezależnie. Ale w następnym kroku użyjemy tej tożsamości,
$$ \ delta \ dot q = {\ mathrm {d} \ over \ mathrm {d} t} \ delta q. $$
I tutaj pojawia się relacja między q a $ \ dot q $. Myślę, że to, co się tutaj dzieje, polega na tym, że q i $ \ dot q $ są początkowo traktowane jako niezależne, ale potem niezależność jest usuwana przez tożsamość.
$$ \ delta S = \ int_ {t_1} ^ {t_2} \ left ({\ częściowe L \ ponad \ częściowe q} \ delta q + {\ częściowe L \ ponad \ częściowe \ dot q} {d \ nad \ mathrm {d} t} \ delta q \ po prawej) \, \ mathrm {d} t = 0 $$
A potem następuje reszta wyprowadzenia. Całkujemy drugi człon po częściach:
$$ \ delta S = \ left [{\ partial L \ over \ part \ dot q} \ delta q \ right] _ {t_1} ^ {t_2} + \ int_ {t_1} ^ {t_2} \ left ({\ częściowe L \ ponad \ częściowe q} - {d \ ponad dt} {\ częściowe L \ ponad \ częściowe \ dot q} \ w prawo) \ delta q \, \ mathrm {d} t = 0 \ ,, $$
a wyrażenie w nawiasach kwadratowych ma wartość zero, ponieważ punkty końcowe są ustalone. Następnie możemy wyciągnąć równanie Eulera-Lagrange'a:
$$ {\ częściowe L \ nad \ częściowe q} - {\ mathrm {d} \ over \ mathrm {d} t} {\ częściowe L \ ponad \ częściowe \ dot q} = 0 \ ,. $$
Teraz ma to dla mnie większy sens. Zaczynasz od traktowania zmiennych jako niezależnych, ale następnie usuwasz niezależność, nakładając warunek podczas wyprowadzania.
Myślę, że to ma sens. Spodziewam się, że ogólnie inne problemy można traktować w ten sam sposób.
(Skopiowałem powyższe równania z Mechaniki autorstwa Landau i Lifshitz.)
Oto moja odpowiedź, która jest w zasadzie rozszerzoną wersją odpowiedzi Grega Gravitona.
Pytanie, dlaczego można traktować pozycję i prędkość jako zmienne niezależne, pojawia się w definicji samego Lagrangianu $ L $, przed używa się równania ruchu, a przed myśli się o zmianie akcji $ S: = \ int_ {t_i} ^ {t_f} \ mathrm {d} t \ L $, a zatem nie ma nic wspólnego z rachunkiem zmienności.
I) Z jednej strony rozważmy najpierw rolę Lagrange'a .Przypnijmy sobie dowolną, ale ustaloną chwilę czasu $ t_0 \ in [t_i, t_f] $. (Chwilowy) Lagrangian $ L (q (t_0), v (t_0), t_0) $ jest funkcją zarówno chwilowej pozycji $ q (t_0) $, jak i chwilowej prędkości $ v (t_0) $ w chwili $ t_0 $. Tutaj $ q (t_0) $ i $ v (t_0) $ są zmiennymi niezależnymi . Zauważ, że (natychmiastowy) lagrangian $ L (q (t_0), v (t_0), t_0) $ nie zależy od przeszłego $ t<t_0 $ ani przyszłego $ t>t_0 $. (Można sprzeciwić się, że profil prędkości $ \ dot {q} \ equiv \ frac {\ mathrm {d} q} {\ mathrm {d} t}: [t_i, t_f] \ to \ mathbb {R} $ jest pochodna profilu pozycji $ q: [t_i, t_f] \ to \ mathbb {R} $, więc jak $ q (t_0) $ i $ v (t_0) $ mogą być naprawdę niezależnymi zmiennymi? Chodzi o to, że od równania ruchu jest drugiego rzędu, nadal można dokonać 2 niezależnych wyborów warunków początkowych: 1 pozycji początkowej i 1 prędkości początkowej.) Możemy powtórzyć ten argument dla dowolnej innej chwili $ t_0 \ in [ t_i, t_f] \,. $
II) Z drugiej strony rozważmy rachunek zmienności. Akcja funkcjonalna $$ S [q] ~: = ~ \ int_ {t_i} ^ {t_f } \ mathrm {d} t \ L (q (t), \ dot {q} (t), t) \ tag {1} $$ zależy od całej (być może wirtualnej) ścieżki $ q: [t_i, t_f] \ to \ mathbb {R} $. Tutaj pochodna po czasie $ \ dot {q} \ equiv \ frac {\ mathrm {d} q} {\ mathrm {d} t} $ zależy od funkcji $ q: [t_i, t_f ] \ to \ mathbb {R} \,. $ Rozszerzanie działania akcji
\ begin {align} 0 ~ = ~ \ delta S ~ & = ~ \ int_ {t_i} ^ {t_f} \ mathrm {d} t \ left [\ left. \ frac {\ partial L (q (t ), v (t), t)} {\ częściowe q (t)} \ right | _ {v (t) = \ dot {q} (t)} \ delta q (t) + \ left. \ frac { \ częściowe L (q (t), v (t), t)} {\ częściowe v (t)} \ right | _ {v (t) = \ dot {q} (t)} \ delta \ dot {q } (t) \ right] \\ & = ~ \ int_ {t_i} ^ {t_f} \ mathrm {d} t \ left [\ left. \ frac {\ częściowe L (q (t), v (t), t)} {\ częściowe q (t)} \ right | _ {v (t) = \ dot {q} (t)} \ delta q (t) + \ left. \ frac {\ częściowe L (q (t) ), v (t), t)} {\ częściowe v (t)} \ right | _ {v (t) = \ dot {q} (t)} \ frac {\ mathrm d} {\ mathrm {d} t} \ delta q (t) \ right] \\ & = ~ \ int_ {t_i} ^ {t_f} \ mathrm {d} t \ left [\ left. \ frac {\ częściowe L (q (t), v (t), t)} {\ częściowe q (t)} \ right | _ {v (t) = \ dot {q} (t)} - \ frac {\ mathrm d} {\ mathrm {d} t} \ left (\ left. \ frac {\ częściowe L (q (t), v (t), t)} {\ częściowe v (t)} \ right | _ {v (t) = \ dot {q} ( t)} \ right) \ right] \ delta q (t) \ end {align} $$ + \ int_ {t_i} ^ {t_f} \ mathrm {d} t \ frac {\ mathrm {d}} {\ mathrm {d} t} \ left [\ left. \ frac {\ częściowe L (q (t), v (t), t)} {\ częściowe v (t)} \ right | _ {v (t) = \ kropka {q} (t)} \ delta q (t) \ right] \ tag {2} $$
z ap odpowiednie warunki brzegowe prowadzą do równania Eulera-Lagrange'a, które jest równaniem ruchu.
$$ \ frac {\ mathrm d} {\ mathrm {d} t} \ left (\ left. \ frac {\ częściowe L (q (t), v (t), t)} {\ częściowe v (t)} \ right | _ {v (t) = \ dot {q} (t)} \ right) ~ = ~ \ left. \ frac {\ częściowe L (q (t), v (t), t)} {\ częściowe q (t)} \ right | _ { v (t) = \ dot {q} (t)} ~. \ tag {3} $$
III) Zauważ, że
$$ \ frac {\ mathrm {d }} {\ mathrm {d} t} ~ = ~ \ dot {v} (t) \ frac {\ częściowy} {\ częściowy v (t)} + \ dot {q} (t) \ frac {\ częściowy} {\ częściowe q (t)} + \ frac {\ części} {\ częściowe t} \ tag {4} $$
jest pochodną czasu całkowitego , a nie jawna pochodna czasu $ \ frac {\ części} {\ częściowa t} $, więc równanie Eulera-Lagrange'a (3) jest w rzeczywistości zwykłym równaniem różniczkowym drugiego rzędu (ODE),
$$ \ left (\ ddot {q} (t) \ frac {\ części} {\ częściowe v (t)} + \ dot {q} (t) \ frac {\ części} {\ częściowe q ( t)} + \ frac {\ Partial} {\ Part t} \ right) \ left. \ frac {\ częściowe L (q (t), v (t), t)} {\ częściowe v (t)} \ right | _ {v (t) = \ dot {q} (t)} ~ = ~ \ left. \ frac {\ częściowe L (q (t), v (t), t)} {\ częściowe q (t)} \ right | _ {v (t) = \ dot {q} (t)} ~. \ tag {5} $$
Aby znaleźć ścieżkę $ q: [t_i, t_f] \ do \ mathbb {R} $, należy określić dwa warunki początkowe, np. $$ q (t_i ) ~ = ~ q_i \ qquad \ text {i} \ qquad \ dot {q} (t_i) ~ = ~ v_i. \ tag {6} $$
Prawdą jest, że funkcja $ \ dot {q} (t) $ jest pochodną funkcji $ q (t) $ w.r.t. w czasie, nie jest prawdą, że wartość $ \ dot {q} $ jest w ogóle powiązana z wartością $ q $ w danym momencie, ponieważ wartość jest tylko liczbą, a nie funkcją. Akcja jest funkcją $ q (t) $, więc nie ma sensu zmieniać akcji zarówno w.r.t. $ q $ i $ \ dot {q} $. Ale lagrangian $ L (q, \ dot {q}) $ jest funkcją wartości $ q $ i $ \ dot {q} $, a nie funkcją funkcji $ q (t) $ i $ \ dot {q } (t) $. Możemy promować $ L $ w funkcji czasu, jeśli podłączymy $ q (t) $ i $ \ dot {q} (t) $ zamiast tylko $ q $ i $ \ dot {q} $. (Pamiętaj, że funkcja zamienia funkcję w liczbę, np. $ S [q] $, podczas gdy funkcja zamienia wartość na liczbę, np. $ L (q, \ dot {q}) $.
Aby rozwiązać $ q (t) $, ekstremalizujemy działanie $ S $, żądając, aby było ono ekstremalne w każdym punkcie $ t $. Jest to równoważne rozwiązaniu równań Eulera-Lagrange'a w każdym punkcie $ t $. Ponieważ w dowolnym momencie $ t $ wartości $ q $ i $ \ dot {q} $ są niezależne, można je zmieniać niezależnie.
Pochodną funkcji $ f (t) $ jest funkcja $ \ dot {f} (t) $ na ogół inna niż $ f $, aw ogólnym przypadku te dwie nie są nawet liniowo zależne, co jest łatwo zobaczyć, jeśli zdecydujesz się na rozszerzenie Taylor. Dopiero gdy zdefiniujesz z nimi równania różniczkowe, zostaną one połączone algebraicznie i tak właśnie działa rachunek wariacyjny.
Jeśli mamy funkcję $ f (x, v) $ , częściowe pochodne są zdefiniowane przez $$ \ frac {\ częściowe f (x, v)} {\ częściowe x} \ equiv \ lim_ {h \ do 0} \ frac {f (x + h, v) -f (x, v)} {h} $$ i $$ \ frac {\ Partial f (x, v)} {\ Partial v} \ equiv \ lim_ {h \ to 0} \ frac {f (x , v + h) -f (x, v)} {h} $$ Oznacza to, na przykład, dla $ f = v ^ 2 $ że $$ \ frac {\ part v ^ 2} {\ part x} \ equiv \ lim_ {h \ to 0} \ frac {v ^ 2-v ^ 2} {h } = 0. $$ Ponadto dla $ v = \ frac {dx} {dt} $ stwierdzamy, że $ x \ to x + h $ oznacza $ v = \ frac {dx} {dt} \ to v '= \ frac {d (x + h) } {dt} = \ frac {dx} {dt} = v $ . Tak więc $$ \ frac {\ part \ frac {dx} {dt} ^ 2} {\ part x} \ equiv \ lim_ {h \ to 0} \ frac {\ frac { dx} {dt} ^ 2- \ frac {dx} {dt} ^ 2} {h} = 0. $$ Dlatego warto rozważyć częściowe pochodne Lagrangianu w odniesieniu do $ x $ i $ v $ oddzielnie iw tym sensie traktuj je niezależnie.
Mówiąc bardziej fizycznie, przypomnijmy sobie, że naszym celem w formalizmie lagranżowskim jest znalezienie właściwej ścieżki w przestrzeni konfiguracyjnej między dwoma stałymi lokalizacjami. Ścieżka charakteryzuje się położeniem i prędkością w każdym punkcie czasu. Jesteśmy tak ogólni, jak to tylko możliwe i rozważamy naprawdę wszystkie możliwe ścieżki. Oznacza to, że rozważamy wszystkie możliwe połączenia lokalizacji i prędkości. Fizyczna ścieżka klasyczna jest wyjątkowa z dwóch powodów: