Optimal sıralama
Optimal kontrol teorisi , muhtemelen kısıtlamalar altında bir performans kriterini en aza indiren (veya maksimize eden) bir sistemin kontrolünü belirlemeyi mümkün kılar. En klasik durum (ve en basit olanı), komuttaki eşitsizlik türünün kısıtlamalarıdır, ancak aynı türdeki kısıtlamalar da dikkate alınabilir. Bu teori, varyasyonlar hesabının bir genellemesidir . İki bölümü vardır: Lev Pontriagin ve Moskova'daki Steklov Enstitüsü'ndeki işbirlikçilerine bağlı olarak maksimum (veya Hamiltoniyeni nasıl tanımladığımıza bağlı olarak minimum) ilkesi ve Hamilton-Jacobi-Bellman denklemi, Hamilton'un genellemesi -Jacobi denklemi ve Amerika Birleşik Devletleri'nde Richard Bellman tarafından başlatılan dinamik programlamanın doğrudan bir sonucu . Optimal kontrol teorisi, otomasyonun ve uygulamalı matematiğin ( süreç optimizasyonu ) bir parçasıdır . Bu teori varyasyonlar hesabını genelleştirdiği için matematiksel fizikte de bir uygulama alanına sahiptir ve mevcut teorik gelişmeler saf matematiği birleştirir.
Tarihi
Maksimum ve dinamik programlama ilkesinin altında yatan fikirler çok eskidir ve tarih öncesi zamanlarından beri yakından bağlantılıdır. 1950'lerin ortalarında bağımsız olarak ve neredeyse eşzamanlı olarak geliştirildiler ve bugün birçok bağlantıya sahip olmaya devam ediyorlar.
Dinamik programlama, Huygens'in ışığın yayılması ilkesinden kaynaklanır: Bir ana küresel dalgadan kaynaklanan ikincil küresel dalgacıkların yayılmasını varsayarak yansıma ve kırılma olgusunu yorumlayan ünlü "ara kaynaklar" ilkesidir; Huygens prensibi kendisinin ilkesine dayalı Fermat ışık yayılma süresi az olduğu yolunu izler varsayar.
Maksimum ilkesi, Hamilton'un varyasyonlar hesabı için denklemlerinin bir genellemesidir . Bunun icadı, 1696'da Jean Bernoulli tarafından ortaya atılan brakistokron eğrisi probleminin çözümüne kadar uzanmaktadır ; aynı zamanda minimum zaman sorunudur (Yunanca kökün belirttiği gibi: "βραχιστος (brachistos)", "en kısa"; "χρονος (kronolar)", "zaman"). Bu sorun ilk olarak Jean Bernoulli'nin kendisi (ve kardeşi Jacques Bernoulli , Leibniz ve Newton dahil olmak üzere diğer bilim adamları ) tarafından ışığın yayılması sorunu ve Huygens'ten ilkenin uygulanmasıyla ilgili bir analoji sayesinde çözüldü ; harften önce dinamik programlama kullanıyordu. Daha sonra Jean Bernoulli'nin öğrencisi Euler , öğretmeninin çözümünü sistematik hale getirme talebine cevaben varyasyonlar hesabının ilk temellerini attı; Euler, bu vesileyle, geometrik değerlendirmelerden, Lagrange'ın biraz sonra daha zarif bir analitik form verdiği bir yöntem olan "küçük varyasyonlar" yöntemini çizdi . On dokuzuncu yüzyılın ortalarında, güçlü aşırılık kavramını tanımlamak ve böyle bir aşırılığın olması için yeterli bir koşulu ve aynı zamanda gerekli bir koşulu oluşturmak bir asır sonra Weierstrass'a kalmıştı. Maksimum ilke, Hamiltoniyen'in sahte Hamiltoniyen ile değiştirilmesiyle elde edilen Weierstrass güçlü ekstremum gerekli koşulunun bir genellemesidir (aşağıya bakınız ). Bu ilke, Constantine Carathéodory tarafından 1935 gibi erken bir tarihte ve daha kesin olarak 1950'de Magnus Hestenes tarafından zaten gözden geçirilmişti . Ancak, Pontriagin'in sezgilerine ve onun yönlendirmesi altında, bugün anladığımız şekliyle maksimum ilkesi 'hui , ilk olarak minimum zaman problemleri için, daha sonra genel durumda 1955 ve 1959 arasında VG Boltyanskii, RV Gamkrelidze ve LI Rozonoer tarafından gösterildi. 1939'da James McShane tarafından zaten kullanılan "iğne varyasyonları" tekniğinin uygulanması, yine de maksimum ilkesinin yalnızca gerekli bir iyimserlik koşulu olduğunu gösteren ve Pontriagin ve işbirlikçilerinin Rusça olarak yayınlanan ünlü kitabında aldığı biçimi maksimuma ilkesine veren Boltyanskii sayesinde 1961 (bu kitabın dördüncü yazarı EF Michtchenko, optimum kontrolün istatistiksel bir problemini çözdü). [Pontriagin ve işbirlikçilerinin katkılarının ardından, bir sistemin komut değişkeninin Rusça'da komut anlamına gelen u , управление ( upravlenie ) olduğu belirtilmiştir ].
Son çalışmalar, bu iki yaklaşımı önemli ölçüde değiştirmeden genelleştirmeyi mümkün kılmıştır; Frank H. Clarke tarafından başlatılan "pürüzsüz olmayan analiz" çerçevesinde, bu yazar tarafından sunulan "genelleştirilmiş gradyanlar" (veya "genelleştirilmiş farklılıklar") kullanılarak büyük ölçüde farklılaşabilirlik koşullarının zayıflatılmasına yönelmişlerdir. Bu, Pontriaguine ve işbirlikçilerinin orijinal teoreminin parçalı sürekli işlevlerinden daha genel nitelikteki komutların dikkate alınmasına yol açtı: özellikle Lebesgue anlamında ölçülebilir işlevler. Başka bir uzantı türü, gecikme sistemleri ve daha genel olarak sonsuz boyutla ilgilidir. Öte yandan Boltyanskii, bu amaç için belirli matematiksel teknikler geliştirdikten sonra ayrık zaman sistemleri için maksimum prensibinin "zayıf bir versiyonunu" verdi, ancak sonucu Karush, Kuhn ve Tucker'ın koşullarından güçlük çekmeden gösterilebilir . Bununla birlikte, belirli dışbükeylik koşulları altında , bu tür bir sistem için gerçek bir maksimum ilke vardır.
Maksimum ilke ve dinamik programlama: farklılıklar ve benzerlikler
Doğası gereği, Pontriaguine maksimum ilkesi, optimallik için gerekli bir koşuldur, dinamik programlama ise yeterli bir koşul sağlar. Öte yandan, maksimum ilke, bir çözüm olarak bir açık döngü kontrolü (zamanın işlevi) verirken, dinamik programlama bir kapalı döngü kontrolüne (sistemin durumunun işlevi) yol açar.
Bununla birlikte, maksimum prensibinin çözüm komutu, uygun durumlarda, bir kapalı döngü komutu şeklinde verilebilir. Maksimum ilkenin dinamik programlamaya göre en büyük avantajlarından biri, kısmi diferansiyel denklemin (Hamilton-Jacobi-Bellman denklemi) çözülmesini içeren sürekli zamanlı sistemlere uygulandığında daha büyük uygulama kolaylığıdır. basit diferansiyel denklemleri çözmeye kadar kaynar (ancak, sorunun "her iki ucunda da" olması nedeniyle ciddi şekilde karmaşık olan bir çözüm).
Dinamik programlama hem deterministik hem de stokastik sistemler için geçerliyken, maksimum ilke (bazı istisnalar dışında) yalnızca deterministik sistemler için geçerlidir.
Bununla birlikte, bu yaklaşımlar için ortak bir adım, kabul edilebilir komutlar kümesi üzerinde sözde Hamiltoncunun maksimizasyonudur. Pontriaguine ve işbirlikçilerinin kendilerinin belirttiği gibi, "Bellman'ın işlevi" üzerine yeterli düzenlilik varsayımları yapılırsa, gösterimi çok basit olan Bellman teoreminden maksimum ilkesi çıkarılabilir. Ancak bu varsayımlar, maksimum ilkesinin tüm çıkarına sahip olduğu ve bunun için tasarlandığı durumlarda, örneğin "Bang-Bang komutu" nda doğrulanmaz.
Optimal bir kontrol probleminin formüle edilmesi
Sistem ve kriter
Durum üzerinde kısıtlama olmaksızın optimal kontrol problemini olağan türevlenebilirlik varsayımları ile ele alıyoruz (problem veya daha doğrusu çözümü, durum üzerinde kısıtlama olması durumunda oldukça karmaşıktır, çünkü Lagrange çarpanlarından biri o zaman bir ölçüdür. Lebesgue ölçümüne göre kesinlikle sürekli değil). Gösterimleri basitleştirmek için, ilk zamanın ve başlangıç durumunun sabit olduğu durumu ele alıyoruz. Ya sistem:
x˙=f(t,x,sen){\ displaystyle {\ nokta {x}} = f \ sol (t, x, u \ sağ)},
x(t0)=x0,t∈ben{\ displaystyle x \ sol (t_ {0} \ sağ) = x_ {0}, t \ {\ mathcal {I}}} içinde
burada içeren gerçek hattının kompakt aralıktır ve burada sürekli bir fonksiyonudur olarak , olan bir Banach alanı (okuyucu varsayabiliriz ), bir açık ve bir topolojik boşluk (en sık, bir alt kümesi ). Değişken durumdur ve komuttur (Durum gösterimi makalesine bakın ). İşlevin her şey için sürekli olarak farklılaştırılabileceği varsayılır .
ben{\ displaystyle {\ mathcal {I}}}t0{\ displaystyle t_ {0}}f{\ displaystyle f}ben×Ω×U{\ displaystyle {\ mathcal {I}} \ times \ Omega \ times \ mathbf {U}}X{\ displaystyle \ mathbf {X}}X{\ displaystyle \ mathbf {X}}X=Rdeğil{\ displaystyle \ mathbf {X} = \ mathbb {R} ^ {n}}Ω{\ displaystyle \ Omega}X{\ displaystyle \ mathbf {X}}U{\ displaystyle \ mathbf {U}}Rm{\ displaystyle \ mathbb {R} ^ {m}}x{\ displaystyle x}sen{\ displaystyle u}x↦f(t,x,sen){\ displaystyle x \ mapsto f (t, x, u)}(t,sen)∈ben×U{\ mathcal {I}} \ times \ mathbf {U}} içinde {\ displaystyle (t, u) \
Ya performans kriteri
J(sen)=K(tf,xf)+∫t0tfL(t,x(t),sen(t))dt{\ displaystyle J (u) = K \ sol (t_ {f}, x_ {f} \ sağ) + \ int _ {t_ {0}} ^ {t_ {f}} {\ mathcal {L}} \ sol (t, x \ sol (t \ sağ), u \ sol (t \ sağ) \ sağ) dt}burada Lagrange tatmin aynı gibi durumlar ve sürekli olarak ayırt edilebilirdir .
L{\ displaystyle {\ mathcal {L}}}f{\ displaystyle f}K{\ displaystyle K}Vf{\ displaystyle {\ mathcal {V}} _ {f}}
Kabul edilebilir ve optimum kontrol kavramları
Izin bir türevlenebilir altcins denilen, son çeşitliliği . Biz bir işlev diyecekler olduğunu kabul o parçalı sürekli ve çift aktarır eğer başlangıç koşullarından nihai duruma (ile ve , ). Tüm uygun siparişler not edilir . Hipotezler anlamına olduğu lokal Lipschitzian nedenle eğer kabul edilirse, bir mutlak sürekli ve çözelti kavramı (eşitlik dolayısıyla klasik olan Lebesgue anlamında hemen hemen her yerde onaylanıyor).
Vf{\ displaystyle {\ mathcal {V}} _ {f}}ben×X{\ displaystyle {\ mathcal {I}} \ mathbf {\ times} \ mathbf {X}}sen:ben→U{\ displaystyle u: {\ mathcal {I}} \ rightarrow \ mathbf {U}}(t,x){\ displaystyle \ sol (t, x \ sağ)}(t0,x0){\ displaystyle \ sol (t_ {0}, x_ {0} \ sağ)}(tf,xf)∈Vf{\ mathcal {V}} _ {f}} içinde {\ displaystyle \ sol (t_ {f}, x_ {f} \ sağ) \x(tf)=xf{\ displaystyle x \ sol (t_ {f} \ sağ) = x_ {f}}tf>t0{\ displaystyle t_ {f}> t_ {0}}tf∈ben{\ mathcal {I}}} içinde {\ displaystyle t_ {f} \U{\ displaystyle {\ mathcal {U}}}f{\ displaystyle f}sen{\ displaystyle u}x{\ displaystyle x}x˙(t)=f(t,x(t),sen(t)){\ displaystyle {\ nokta {x}} (t) = f \ sol (t, x (t), u (t) \ sağ)}
Let ve bize izin tarafından ifade ve karşılık gelen devlet ve son anlık. Let ve aşağıdaki durumu kontrol eden oluşturulmuş komutların alt kümesi : durum ve karşılık gelen son zaman ,
sen∗∈U{\ mathcal {U}}} içinde {\ displaystyle u ^ {\ ast} \x∗{\ displaystyle x ^ {\ ast}}tf∗{\ displaystyle t_ {f} ^ {\ ast}}ε>0{\ displaystyle \ varepsilon> 0}Uε{\ displaystyle {\ mathcal {U}} _ {\ varepsilon}}U{\ displaystyle {\ mathcal {U}}}sen∈U{\ displaystyle u \ in {\ mathcal {U}}}x{\ displaystyle x}tf{\ displaystyle t_ {f}}
|tf-tf∗|<ε{\ displaystyle \ sol \ vert t_ {f} -t_ {f} ^ {\ ast} \ sağ \ vert <\ varepsilon \ quad}ve .
‖x(t)-x∗(t)‖<ε,∀t∈[t0,tf]∩[t0,tf∗]{\ displaystyle \ dört \ sol \ Vert x \ sol (t \ sağ) -x ^ {\ ast} \ sol (t \ sağ) \ sağ \ Vert <\ varepsilon, \ forall t \ içinde \ sol [t_ {0 }, t_ {f} \ sağ] \ cap \ left [t_ {0}, t_ {f} ^ {\ ast} \ sağ]}Komut olduğu söylenir yerel en iyi varsa öyle ki , ve genel optimal eğer .
sen∗{\ displaystyle u ^ {\ ast}}ε>0{\ displaystyle \ varepsilon> 0}J(sen)≤J(sen∗),∀sen∈Uε{\ displaystyle J (u) \ leq J (u ^ {\ ast}), \ forall u \ {\ mathcal {U}} _ {\ varepsilon}}J(sen)≤J(sen∗),∀sen∈U{\ displaystyle J (u) \ leq J (u ^ {\ ast}), \ forall u \ {\ mathcal {U}}}
Küçükler için "küçük mahalle" olarak düşünülebilir . Böyle bir mahallede, her t anında mutlaka yakın olmadığı not edilecektir . Eğer bir vektör alanı, bir “küçük varyasyon” bir alt kümesidir u özellikle bir varyasyon olabilir o fonksiyonun bir “küçük bir varyasyonunu” olmasına neden olur ve büyük genlikli ama küçük süresinin . Bu formülasyon Weierstrass'ınkiyle aynıdır ve kişinin bir "güçlü ekstremum" aradığını gösterir (sadece zayıf genlikli u varyasyonlarıyla "zayıf bir uç" elde edilir ).
ε{\ displaystyle \ varepsilon}Uε{\ displaystyle {\ mathcal {U}} _ {\ varepsilon}}sen∗{\ displaystyle u ^ {\ ast}}sen(t){\ displaystyle u (t)}sen∗(t){\ displaystyle u ^ {\ ast} (t)}U{\ displaystyle \ mathbf {U}}δsen{\ displaystyle \ delta u}x:t↦x(t){\ displaystyle x: t \ mapsto x (t)}
Sözde Hamiltoniyen
Sözde Hamiltonyen'e fonksiyon
diyoruz
H:ben×Ω×U×{0,1}×X′→R{\ displaystyle {\ mathcal {H}}: {\ mathcal {I}} \ times \ Omega \ times \ mathbf {U} \ times \ left \ {0,1 \ right \} \ times \ mathbf {X} ^ {\ asal} \ rightarrow \ mathbb {R}}( ikilisi nerede ) tarafından tanımlanmıştır
X′{\ displaystyle \ mathbf {X} ^ {\ prime}}X{\ displaystyle \ mathbf {X}}
H(t,x,sen,λ,p′)=⟨p′|f(t,x,sen)⟩-λL(t,x,sen){\ displaystyle {\ mathcal {H}} \ sol (t, x, u, \ lambda, p ^ {\ prime} \ sağ) = \ sol \ langle p ^ {\ prime} | f \ sol (t, x , u \ sağ) \ sağ \ rangle - \ lambda {\ mathcal {L}} \ left (t, x, u \ right)}.
(burada bir ikilik dirseği ).
⟨.|.⟩{\ displaystyle \ sol \ langle. |. \ sağ \ rangle}
Uyarılar
- Uygulamaların büyük çoğunluğunda .X=Rdeğil{\ displaystyle \ mathbf {X} = \ mathbb {R} ^ {n}}
- Bununla birlikte, olduğu tahmin edilebilir bir olan diferansiyel manifoldu (muhtemelen banachic ), vektör alanı f şekildedir ait teğet alanı ; daha sonra ait cotangent demeti kanca böylece, , cotangent alanı içinde . Bu formülasyon, örneğin, bir Riemann uzayında jeodezik hesaplaması için gereklidir .Ω{\ displaystyle \ Omega} f(t,x,sen){\ displaystyle f (t, x, u)} Tx(Ω){\ displaystyle T_ {x} (\ Omega)}p′{\ displaystyle p ^ {\ prime}} T′(Ω){\ displaystyle T ^ {\ üssü} (\ Omega)}⟨p′|f(x,sen,t)⟩{\ displaystyle \ sol \ langle p ^ {\ üssü} | f (x, u, t) \ sağ \ rangle}p′{\ displaystyle p ^ {\ prime}}Tx′(Ω){\ displaystyle T_ {x} ^ {\ üssü} (\ Omega)}
- Bunun bir alt kümesi olduğunu varsayarsak, parça parça sürekli fonksiyonlardan daha genel kabul edilebilir komutları, örneğin, Lebesgue anlamında ölçülebilir fonksiyonlar düşünebiliriz. Daha sonra yerine göre burada bir fonksiyonudur alt kümeleri kümesinde grafiğidir (sözde “çok işlevli”) -measurable, bir Lebesgue kabile arasında , olan Borelian kabile arasında ve grubu aracılığı ile kabiledir .U{\ displaystyle \ mathbf {U}}Rm{\ displaystyle \ mathbb {R} ^ {m}}U{\ displaystyle \ mathbf {U}}U(t){\ displaystyle \ mathbf {U} (t)}t↦U(t){\ displaystyle t \ mapsto \ mathbf {U} (t)}ben{\ displaystyle {\ mathcal {I}}}Rdeğil{\ displaystyle \ mathbb {R} ^ {n}}L×B{\ displaystyle {\ mathcal {L}} \ times {\ mathcal {B}}}L{\ displaystyle {\ mathcal {L}}}ben{\ displaystyle {\ mathcal {I}}}B{\ displaystyle {\ mathcal {B}}}Rdeğil{\ displaystyle \ mathbb {R} ^ {n}}L×B{\ displaystyle {\ mathcal {L}} \ times {\ mathcal {B}}}AT×B,AT∈L,B∈B{\ displaystyle A \ times B, A \ {\ mathcal {L}}, B \ {\ mathcal {B}}}
Maksimum ilke
Eyaletler
İkili, ile tanımlanır . Biz göstermek ve parçalı sürekli fonksiyonların vektör alanı içinde . Diğer yandan iki kanonik denklemiR×X{\ displaystyle \ mathbb {R} \ times \ mathbf {X}}R×X′{\ displaystyle \ mathbb {R} \ times \ mathbf {X} ^ {\ prime}}KVS1(ben;X′){\ displaystyle KC ^ {1} \ sol ({\ mathcal {I}}; \ mathbf {X} ^ {\ prime} \ sağ)}ben{\ displaystyle {\ mathcal {I}}}X′{\ displaystyle \ mathbf {X} ^ {\ prime}}
x˙∗=∂H∂p′(t,x∗,sen∗,λ∗,p′∗){\ displaystyle {\ dot {x}} ^ {\ ast} = {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi p ^ {\ üssü}}} \ sol (t, x ^ {\ ast}, u ^ {\ ast}, \ lambda ^ {\ ast}, p ^ {\ prime \ ast} \ sağ)},
p˙′∗=-∂H∂x(t,x∗,sen∗,λ∗,p′∗){\ displaystyle {\ dot {p}} ^ {\ prime \ ast} = - {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi x}} \ sol (t, x ^ {\ ast} , u ^ {\ ast}, \ lambda ^ {\ ast}, p ^ {\ prime \ ast} \ sağ)}.
Bize göstermek Let manifolduna uzay teğet noktasında ve ortogonal içinde sürekli lineer formlar kümesini demek ki, gibi . Çaprazlık koşuluna ilişki
diyoruzT(tf∗,xf∗)(Vf){\ displaystyle T _ {\ sol (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ)} \ sol ({\ mathcal {V}} _ {f} \ sağ)}Vf{\ displaystyle {\ mathcal {V}} _ {f}}(tf∗,xf∗){\ displaystyle \ sol (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ)}DEĞİL(tf∗,xf∗)(Vf){\ displaystyle N _ {\ sol (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ)} \ sol ({\ mathcal {V}} _ {f} \ sağ)}T(tf∗,xf∗)(Vf){\ displaystyle T _ {\ sol (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ)} \ sol ({\ mathcal {V}} _ {f} \ sağ)}R×X′{\ displaystyle \ mathbb {R} \ times \ mathbf {X} ^ {\ prime}}k′∈R×X′{\ displaystyle k ^ {\ prime} \ in \ mathbb {R} \ times \ mathbf {X} ^ {\ prime}}⟨k′|h⟩=0,∀h∈T(tf∗,xf∗)(Vf){\ displaystyle \ sol \ langle k ^ {\ prime} | h \ sağ \ rangle = 0, \ forall h \ in T _ {\ left (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ)} \ sol ({\ mathcal {V}} _ {f} \ sağ)}
0∈(λ∗∂K∂t(tf∗,xf∗)-H(tf∗,xf∗,sen∗(tf∗),λ∗,p′∗(tf∗)),λ∗∂K∂x(tf∗,xf∗)+p′∗(tf∗))+DEĞİL(tf∗,xf∗)(Vf){\ displaystyle 0 \ in \ sol (\ lambda ^ {\ ast} {\ frac {\ kısmi K} {\ kısmi t}} \ sol (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ) - {\ mathcal {H}} \ left (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast}, u ^ {\ ast} \ left (t_ {f} ^ {\ ast} \ sağ), \ lambda ^ {\ ast}, p ^ {\ prime \ ast} \ left (t_ {f} ^ {\ ast} \ sağ) \ sağ), \ lambda ^ {\ ast} {\ frac {\ kısmi K} {\ kısmi x}} \ left (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ) + p ^ {\ prime \ ast} \ sol (t_ {f} ^ {\ ast} \ sağ) \ sağ) + N _ {\ left (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ)} \ left ({ \ mathcal {V}} _ {f} \ sağ)}.
Son olarak, önemsiz olmama durumuna eşitsizlik
adını vereceğiz.
(λ∗,p′∗(tf∗))≠0{\ displaystyle \ sol (\ lambda ^ {\ ast}, p ^ {\ asal \ ast} \ sol (t_ {f} ^ {\ ast} \ sağ) \ sağ) \ neq 0}.
Aşağıdaki sonucu gösteriyoruz:
Pontriagin-Boltyansky teoremi - Varsayalım sonlu keyfi dik boyutlu. Yerel olarak optimal düzenin olması için, iki kanonik denklemin, enine olmanın koşulu ve önemsizlik koşulunun sağlandığı, işlevin sürekli olduğu bir yardımcı durum ve bir Lagrange çarpanı olması gerekir. maksimum ilkesiT(tf∗,xf∗)(Vf){\ displaystyle T _ {\ sol (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ)} \ sol ({\ mathcal {V}} _ {f} \ sağ)}sen∗∈U{\ mathcal {U}}} içinde {\ displaystyle u ^ {\ ast} \ p′∗∈KVS1(ben;X′){\ displaystyle p ^ {\ prime \ ast} \ KC'de ^ {1} \ sol ({\ mathcal {I}}; \ mathbf {X} ^ {\ prime} \ sağ)} λ∗∈{0,1}{\ displaystyle \ lambda ^ {\ ast} \ solda \ {0,1 \ sağ \}}t↦H(t,x∗(t),sen∗(t),λ∗,p′∗(t)){\ displaystyle t \ mapsto {\ mathcal {H}} \ sol (t, x ^ {\ ast} \ sol (t \ sağ), u ^ {\ ast} \ sol (t \ sağ), \ lambda ^ { \ ast}, p ^ {\ prime \ ast} \ left (t \ right) \ sağ)}
H(t,x∗(t),sen∗(t),λ∗,p′∗(t))≥H(t,x∗(t),sen,λ∗,p′∗(t)),∀sen∈U{\ displaystyle {\ mathcal {H}} \ sol (t, x ^ {\ ast} \ sol (t \ sağ), u ^ {\ ast} \ sol (t \ sağ), \ lambda ^ {\ ast} , p ^ {\ prime \ ast} \ left (t \ right) \ right) \ geq {\ mathcal {H}} \ left (t, x ^ {\ ast} \ left (t \ right), u, \ lambda ^ {\ ast}, p ^ {\ prime \ ast} \ left (t \ right) \ right), \ forall u \ in \ mathbf {U}}
komutun sürekli olduğu herhangi bir noktada kontrol edilir . Herhangi bir noktada ve sürekli olduğumuz bir noktaya sahibiz (yani sonlu bir nokta dışında)
t∈[t0,tf∗]{\ displaystyle t \ solda [t_ {0}, t_ {f} ^ {\ ast} \ sağ]}sen∗{\ displaystyle u ^ {\ ast}}sen∗{\ displaystyle u ^ {\ ast}}p′∗{\ displaystyle p ^ {\ prime \ ast}}
ddtH(t,x∗(t),sen∗(t),λ∗,p′∗(t))=∂∂tH(t,x∗(t),sen∗(t),λ∗,p′∗(t)){\ displaystyle {\ frac {d} {dt}} {\ mathcal {H}} \ sol (t, x ^ {\ ast} \ sol (t \ sağ), u ^ {\ ast} \ sol (t \ sağ), \ lambda ^ {\ ast}, p ^ {\ prime \ ast} \ left (t \ right) \ right) = {\ frac {\ partic} {\ kısmi t}} {\ mathcal {H}} \ left (t, x ^ {\ ast} \ left (t \ right), u ^ {\ ast} \ left (t \ right), \ lambda ^ {\ ast}, p ^ {\ prime \ ast} \ sol (t \ sağ) \ sağ)}
ve özellikle, eğer sözde-Hamiltonyan açıkça zamana bağlı değilse,
H{\ displaystyle {\ mathcal {H}}}
H(x∗(t),sen∗(t),λ∗,p′∗(t))=VSte{\ displaystyle {\ mathcal {H}} \ sol (x ^ {\ ast} \ sol (t \ sağ), u ^ {\ ast} \ sol (t \ sağ), \ lambda ^ {\ ast}, p ^ {\ prime \ ast} \ left (t \ right) \ right) = C ^ {te}}.
Bu teoremin kanıtı ( sonlu boyutlu), Pontriaguine ve işbirlikçilerinin çalışmalarında yaklaşık 40 sayfa kaplar. Nihai durum, sonsuz ortak boyutun bir alt manifolduna ait olmak üzere sınırlandırıldığında , sıranın iğne varyasyonları artık yeterli değildir (yeterli serbestlik derecesi vermezler) ve Yu Vladimirovich Egorov tarafından 1963'te yapılan bir karşı örnek, Maksimum İlke yanlıştır. Herhangi bir Banach uzayında durumu değerlendirilen yarı doğrusal sistemler için maksimum prensibinin bir uzantısı vardır; bu sonuç, komutun "dağınık varyasyonları" veya "yama varyasyonları" kullanılarak elde edilir.
X{\ displaystyle \ mathbf {X}}X{\ displaystyle \ mathbf {X}}
Bir gerekçe Pontriagin-Boltyansky teoreminin Bellman teoremine dayalı, daha sonra verilir. Ayrıca kullanımını gör genelleştirilmiş Du Bois-Reymond Lemma zaman bir açık olduğunu yapılır ve komuta yalnızca “zayıf varyasyonları”.
U{\ displaystyle \ mathbf {U}}Rm{\ displaystyle \ mathbb {R} ^ {m}}
Not
Başlangıç zaman olduğunu varsayalım ve ilk durumu artık sabit olan ve sadece bir başlangıç konumuna sahip olduğu bir türevlenebilir alt manifoldu olan ( ilk manifold ). Daha sonra çaprazlık koşulunu eklemeliyiz
t0{\ displaystyle t_ {0}}x0{\ displaystyle x_ {0}}(t0,x0)∈V0{\ mathcal {V}} _ {0}} içinde {\ displaystyle \ sol (t_ {0}, x_ {0} \ sağ) \V0{\ displaystyle {\ mathcal {V}} _ {0}}ben×X{\ displaystyle {\ mathcal {I}} \ mathbf {\ times} \ mathbf {X}}
0∈(-H(t0∗,x0∗,sen∗(t0∗),λ∗,p′∗(t0∗)),p′∗(t0∗))+DEĞİL(t0∗,x0∗)(V0){\ displaystyle 0 \ solda (- {\ mathcal {H}} \ sol (t_ {0} ^ {\ ast}, x_ {0} ^ {\ ast}, u ^ {\ ast} \ sol (t_ {0} ^ {\ ast} \ sağ), \ lambda ^ {\ ast}, p ^ {\ prime \ ast} \ left (t_ {0} ^ {\ ast} \ sağ) \ sağ), p ^ { \ prime \ ast} \ left (t_ {0} ^ {\ ast} \ sağ) \ sağ) + N _ {\ left (t_ {0} ^ {\ ast}, x_ {0} ^ {\ ast} \ sağ)} \ sol ({\ mathcal {V}} _ {0} \ sağ)}.
Özel durumlar
Şimdi manifoldu farz formun olduğu yerde ve bir alttürlere olan ve sırasıyla. Çaprazlık denklemi bu nedenle yazılır
Vf{\ displaystyle {\ mathcal {V}} _ {f}}Tf×Xf{\ displaystyle {\ mathcal {T}} _ {f} \ times {\ mathcal {X}} _ {f}}Tf{\ displaystyle {\ mathcal {T}} _ {f}}Xf{\ displaystyle {\ mathcal {X}} _ {f}}R{\ displaystyle {\ mathcal {\ mathbb {R}}}}X{\ displaystyle \ mathbf {X}}
(a) ,
0∈λ∗∂K∂t(tf∗,xf∗)-H(tf∗,xf∗,sen∗(tf∗),λ∗,p′∗(tf∗))+DEĞİLtf∗(Tf){\ displaystyle 0 \ in \ lambda ^ {\ ast} {\ frac {\ kısmi K} {\ kısmi t}} \ sol (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ) - {\ mathcal {H}} \ left (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast}, u ^ {\ ast} \ left (t_ {f} ^ {\ ast } \ sağ), \ lambda ^ {\ ast}, p ^ {\ prime \ ast} \ left (t_ {f} ^ {\ ast} \ sağ) \ sağ) + N_ {t_ {f} ^ {\ ast }} \ left ({\ mathcal {T}} _ {f} \ sağ)}(b) .
0∈λ∗∂K∂x(tf∗,xf∗)+p′∗(tf∗)+DEĞİLtf∗(Xf){\ displaystyle 0 \ in \ lambda ^ {\ ast} {\ frac {\ kısmi K} {\ kısmi x}} \ sol (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ) + p ^ {\ prime \ ast} \ left (t_ {f} ^ {\ ast} \ sağ) + N_ {t_ {f} ^ {\ ast}} \ left ({\ mathcal {X}} _ {f} \ sağ)}Serbest bir son an olması durumunda, bu nedenle sahibiz ve (a) olur
Tf=R{\ displaystyle {\ mathcal {T}} _ {f} = {\ mathcal {\ mathbb {R}}}}DEĞİLtf∗(Tf)=0{\ displaystyle N_ {t_ {f} ^ {\ ast}} \ sol ({\ mathcal {T}} _ {f} \ sağ) = 0}
(')
λ∗∂K∂t(tf∗,xf∗)=H(tf∗,xf∗,sen∗(tf∗),λ∗,p′∗(tf∗)){\ displaystyle \ lambda ^ {\ ast} {\ frac {\ kısmi K} {\ kısmi t}} \ sol (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ) = {\ mathcal {H}} \ left (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast}, u ^ {\ ast} \ left (t_ {f} ^ {\ ast} \ sağ ), \ lambda ^ {\ ast}, p ^ {\ prime \ ast} \ left (t_ {f} ^ {\ ast} \ sağ) \ sağ)}
oysa sabit bir son an söz konusu olduğunda ve bu nedenle (a) önemsiz şekilde doğrulanır. Her iki durumda da bir denklemimiz var: (a ') ilkinde, ikincisinde.
Tf={tf}{\ displaystyle {\ mathcal {T}} _ {f} = \ sol \ {t_ {f} \ sağ \}}DEĞİLtf∗(Tf)={0}{\ displaystyle N_ {t_ {f} ^ {\ ast}} \ sol ({\ mathcal {T}} _ {f} \ sağ) = \ sol \ {0 \ sağ \}}tf∗=tf{\ displaystyle t_ {f} ^ {\ ast} = t_ {f}}
Özgür bir nihai durum söz konusu olduğunda, bu nedenle sahibiz ve (b) olur
Xf=X{\ displaystyle {\ mathcal {X}} _ {f} = \ mathbf {X}}DEĞİLxf∗(Xf)=0{\ displaystyle N_ {x_ {f} ^ {\ ast}} \ sol ({\ mathcal {X}} _ {f} \ sağ) = 0}
(b ')
p′∗(tf∗)=-λ∗∂K∂x(tf∗,xf∗){\ displaystyle p ^ {\ prime \ ast} \ sol (t_ {f} ^ {\ ast} \ sağ) = - \ lambda ^ {\ ast} {\ frac {\ kısmi K} {\ kısmi x}} \ sol (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sağ)}
ve önemsiz olmama durumu gerektirir . Sabit bir nihai durum söz konusu olduğunda ve bu nedenle (b) önemsiz şekilde doğrulanır. Her iki durumda da n tane denklemimiz var , eğer ilkinde n : (b ') boyutundaysa , ikincisinde.
λ=1{\ displaystyle \ lambda = 1}Xf={xf}{\ displaystyle {\ mathcal {X}} _ {f} = \ sol \ {x_ {f} \ sağ \}}DEĞİLxf∗(Xf)={0}{\ displaystyle N_ {x_ {f} ^ {\ ast}} \ sol ({\ mathcal {X}} _ {f} \ sağ) = \ sol \ {0 \ sağ \}} X{\ displaystyle \ mathbf {X}}xf∗=xf{\ displaystyle x_ {f} ^ {\ ast} = x_ {f}}
Bang-Bang komutu
Şimdi minimum zaman sipariş sorununu düşünün. Topolojik uzay , tarafından tanımlanan alt kümedir . Ölçüt, yukarıda ve ile verilen ifadenin özel bir halidir . Sorun artık bitmesini ders özgür olduğunu ve son durum kümesi var: . Biz varsayalım , bu nedenle form ile gösterilen, denge ve sistem komutu afin olduğu bir nokta burada . Bize temsil edelim elemanların üst üste tarafından ve elemanların matrisi ile . O gelir
U{\ displaystyle \ mathbf {U}}Rm{\ displaystyle \ mathbb {R} ^ {m}}senben_≤senben≤senben¯(1≤ben≤m){\ displaystyle {\ altı çizili {u_ {i}}} \ leq u_ {i} \ leq {\ üst çizgi {u_ {i}}} \ sol (1 \ leq i \ leq m \ sağ)}J=tf-t0{\ displaystyle J = t_ {f} -t_ {0}}K=0{\ displaystyle K = 0}l=1{\ displaystyle l = 1}Xf={0}{\ displaystyle {\ mathcal {X}} _ {f} = \ sol \ {0 \ sağ \}}x=0{\ displaystyle x = 0}sen=0{\ displaystyle u = 0}f(t,x,sen)=h(t,x)+g(t,x)sen{\ Displaystyle f \ sol (t, x, u \ sağ) = h \ sol (t, x \ sağ) + g \ sol (t, x \ sağ) u}h(t,0)=0{\ displaystyle h \ sol (t, 0 \ sağ) = 0}p′{\ displaystyle p ^ {\ prime}}pben(1≤ben≤değil){\ Displaystyle p_ {i} \ sol (1 \ leq i \ leq n \ sağ)}g{\ displaystyle g}gben,j{\ displaystyle g_ {i, j}}
H(t,x,sen,λ,p′)=⟨p′|h(t,x)⟩+∑j=1m(∑ben=1değilpbengbenj(t,x))senj+λ{\ displaystyle {\ mathcal {H}} \ sol (t, x, u, \ lambda, p ^ {\ prime} \ sağ) = \ sol \ langle p ^ {\ prime} | h \ sol (t, x \ right) \ right \ rangle + \ sum _ {j = 1} ^ {m} \ left (\ sum _ {i = 1} ^ {n} p_ {i} g_ {ij} \ left (t, x \ sağ) \ sağ) u_ {j} + \ lambda}.
Eğer , daha da olmayan Önemsizlik durumunu ters (b ')' e uygun olması; bu nedenle ,. Maksimum İlke şunu ifade eder:
λ∗=0{\ displaystyle \ lambda ^ {\ ast} = 0}p′∗=0{\ displaystyle p ^ {\ prime \ ast} = 0}λ=1{\ displaystyle \ lambda = 1}
senj∗(t)=senj¯{\ displaystyle u_ {j} ^ {\ ast} \ sol (t \ sağ) = {\ üst çizgi {u_ {j}}}}(yanıt ) if (yanıt <0).
senj_{\ displaystyle {\ underline {u_ {j}}}}∑ben=1değilpben′∗(t)gbenj(t,x∗(t))>0{\ displaystyle \ toplamı _ {i = 1} ^ {n} p_ {i} ^ {\ prime \ ast} \ sol (t \ sağ) g_ {ij} \ sol (t, x ^ {\ ast} \ sol (t \ sağ) \ sağ)> 0}Bu komut, komutasyonlarla her zaman minimum değerine veya maksimum değerine eşittir (yalnızca bir bileşeni olduğu durumda). 2. dereceden lineer sistemler söz konusu olduğunda, faz portresine dayalı olarak açık çözümler bulunabilir . Öte yandan, durağan doğrusal düzen sistemini ve kontrol edilebilir olduğunu varsayalım . Durum matrisinin özdeğerlerinin tümü gerçelse, anahtarlamaların sayısı en fazla eşittir . Bu özdeğerlerin tümü sol yarı düzlemdeyse ve 0 içindeyse , optimum kontrol vardır ve benzersizdir.
değil{\ displaystyle n}değil-1{\ displaystyle n-1}U{\ displaystyle \ mathbf {U}}
Maksimum İlke şeklinde yeterli optimallik koşulu
Sistemin doğrusal ve sonlu boyutlu
olduğunu varsayalım.
f(t,x,sen)=AT(t)x+B(t)sen{\ displaystyle f (t, x, u) = A (t) x + B (t) u}burada fonksiyonlar ve sürekli ve kriterin K ve l fonksiyonları sürekli türevlenebilir. Manifoldu olması da varsayalım olan afin ve son anlık olduğunu edilmektedir sabit . Seti nihayet varsayalım U ve fonksiyon olan dışbükey yanı sıra fonksiyon her şey için . Bu durumda, ile Pontriaguine koşulları olan yeterli için için optimal genel . Dahası, işlev kesinlikle u'ya göre dışbükey ise , o zaman optimal komutun benzersizliği vardır .
t↦AT(t){\ displaystyle t \ mapsto A (t)}t↦B(t){\ displaystyle t \ mapsto B (t)}Vf{\ displaystyle {\ mathcal {V}} _ {f}}tf{\ displaystyle t_ {f}}xf↦K(tf,xf){\ displaystyle x_ {f} \ mapsto K (t_ {f}, x_ {f})}(x,sen)↦L(t,x,sen){\ displaystyle (x, u) \ mapsto {\ mathcal {L}} (t, x, u)}t∈ben{\ mathcal {I}}} içinde {\ displaystyle t \λ∗=1{\ displaystyle \ lambda ^ {\ ast} = 1}sen∗{\ displaystyle u ^ {\ ast}}(x,sen)↦L(t,x,sen){\ displaystyle (x, u) \ mapsto {\ mathcal {L}} (t, x, u)}
Dinamik programlama (deterministik durum)
Yukarıda ortaya konduğu şekliyle optimal kontrol sorununa dönelim.
Hamilton-Jacobi-Bellman denklemi
Genel dinamik programlama ilkesine göre , optimum kontrol , her şey için kriteri
en aza indirir.U{\ displaystyle {\ mathcal {U}}}(τ,ξ)∈[t0,tf[×Ω{\ displaystyle \ sol (\ tau, \ xi \ sağ) \ solda [t_ {0}, t_ {f} \ sağ [\ times \ Omega}
Jτ(sen)=K(tf,xf)+∫τtfL(t,x(t),sen(t))dt{\ displaystyle J _ {\ tau} (u) = K \ sol (t_ {f}, x_ {f} \ sağ) + \ int _ {\ tau} ^ {t_ {f}} {\ mathcal {L} } \ sol (t, x \ sol (t \ sağ), u \ sol (t \ sağ) \ sağ) dt}ile
x(τ)=ξ{\ displaystyle x \ sol (\ tau \ sağ) = \ xi}.
Bu kriterin optimal değeri ile ifade edelim . Önceki varsayımlara ek olarak, şimdi fonksiyonların ve sürekli olarak türevlenebilir olduğunu varsayıyoruz . Ayrıca varsayıyoruz ve bu değişkeni argümanlarından kaldırıyoruz , bu nedenle şimdi bir fonksiyon
ω(τ,ξ){\ displaystyle \ omega \ sol (\ tau, \ xi \ sağ)}f,L{\ displaystyle f, {\ mathcal {L}}}ω{\ displaystyle \ omega}λ=1{\ displaystyle \ lambda = 1}H{\ displaystyle {\ mathcal {H}}}
H:(t,x,sen,p′)↦H(t,x,sen,p′){\ displaystyle {\ mathcal {H}} :( t, x, u, p ^ {\ prime}) \ mapsto {\ mathcal {H}} (t, x, u, p ^ {\ prime})}.
Hamilton- Jacobi- Bellman denklemi kısmi diferansiyel denklem olan
(HJB) ::∂ω∂t(τ,ξ)=maxsen∈UH(τ,ξ,sen,-∂ω∂ξ(τ,ξ)){\ displaystyle {\ frac {\ kısmi \ omega} {\ kısmi t}} \ sol (\ tau, \ xi \ sağ) = \ max _ {u \ U} {\ mathcal {H}} \ sol (\ tau, \ xi, u, - {\ frac {\ kısmi \ omega} {\ kısmi \ xi}} \ left (\ tau, \ xi \ sağ) \ sağ)}
sınır koşulu ile
(CL) :: .
ω(tf,xf)=K(tf,xf),∀(tf,xf)∈Vf{\ displaystyle \ omega \ sol (t_ {f}, x_ {f} \ sağ) = K \ sol (t_ {f}, x_ {f} \ sağ), \ forall \ sol (t_ {f}, x_ { f} \ sağ) \ {\ mathcal {V}} _ {f}} içinde
Biz sözde Hamilton demek olduğunu düzenli fonksiyonu ise benzersiz bir maksimum itiraf U değeri uzandı, bir u . Bu durumda, ya kapalı döngü kontrolü . Aşağıdaki sonuca sahibiz:
H{\ displaystyle {\ mathcal {H}}}sen↦H(τ,ξ,sen,p′){\ displaystyle u \ mapsto {\ mathcal {H}} \ left (\ tau, \ xi, u, p ^ {\ prime} \ sağ)}sen0(τ,ξ,p′){\ displaystyle u ^ {0} \ sol (\ tau, \ xi, p ^ {\ prime} \ sağ)} sen^(t,x)=sen0(t,x,-∂ω∂ξ(t,x)){\ displaystyle {\ hat {u}} \ sol (t, x \ sağ) = u ^ {0} \ sol (t, x, - {\ frac {\ kısmi \ omega} {\ kısmi \ xi}} \ sol (t, x \ sağ) \ sağ)}
Bellman teoremi -
Sözde Hamiltoniyenin düzenli olduğunu varsayalım. Kapalı döngü kontrol içinoptimum olduğu, bunun yeterli bir (I) bir sürekli türevlenebilir çözüm mevcut olduğusınır koşulu ve (Cl), Hamilton-Jacobi-Bellman denklem (HJB), ve (ii) işlevi,komutun uygulanmasından kaynaklanan durumnerede,kabul edilebilir. Bu optimal kapalı döngü kontrolü ile elde edilen kriter değeri.
(t,x)→sen^(t,x){\ displaystyle \ sol (t, x \ sağ) \ sağarrow {\ hat {u}} \ sol (t, x \ sağ)}(τ,ξ)→ω(τ,ξ){\ Displaystyle \ sol (\ tau, \ xi \ sağ) \ sağ yön \ omega \ sol (\ tau, \ xi \ sağ)}t→sen∗(t)=sen^(t,xsen^(t)){\ displaystyle t \ sağarrow u ^ {\ ast} \ sol (t \ sağ) = {\ şapka {u}} \ sol (t, x _ {\ şapka {u}} \ sol (t \ sağ) \ sağ )}xsen^{\ displaystyle x _ {\ hat {u}}}sen^{\ displaystyle {\ hat {u}}}ω(t0,x(t0)){\ displaystyle \ omega \ sol (t_ {0}, x \ sol (t_ {0} \ sağ) \ sağ)}
Gösteri
Hamilton-Jacobi-Bellman denklemini ve sınır koşulunu elde etmek :
Ya öyle . Sahibiz
Δτ{\ displaystyle \ Delta \ tau}τ<τ+Δτ≤tf{\ displaystyle \ tau <\ tau + \ Delta \ tau \ leq t_ {f}}
ω(τ,ξ)=minsen∈U{∫ττ+ΔτL(t,x(t),sen(t))dt+∫τ+ΔτtfL(t,x(t),sen(t))dt+K(tf,xf)}=minsen∈U{L(τ,ξ,sen)Δτ+ω(τ+Δτ,ξ+Δξ)+K(tf,xf)+Ö(Δτ)}=minsen∈U{L(τ,ξ,sen)Δτ+ω(τ,ξ)+∂ω∂t(τ,ξ)Δt+∂ω∂ξ(τ,ξ)Δξ+Ö(Δτ)}{\ displaystyle {\ begin {array} {cc} \ omega (\ tau, \ xi) & = \ min \ limits _ {u \ in \ mathrm {U}} \ left \ {\ int _ {\ tau} ^ {\ tau + \ Delta \ tau} {\ mathcal {L}} \ left (t, x \ left (t \ right), u (t) \ right) dt + \ int _ {\ tau + \ Delta \ tau } ^ {t_ {f}} {\ mathcal {L}} \ left (t, x \ left (t \ right), u (t) \ right) dt + K (t_ {f}, x_ {f}) \ right \} \\ & = \ min \ limits _ {u \ in \ mathrm {U}} \ left \ {{\ mathcal {L}} \ left (\ tau, \ xi, u \ right) \ Delta \ tau + \ omega (\ tau + \ Delta \ tau, \ xi + \ Delta \ xi) + K (t_ {f}, x_ {f}) + o \ left (\ Delta \ tau \ right) \ sağ \} \ \ & = \ min \ limits _ {u \ in \ mathrm {U}} \ left \ {{\ mathcal {L}} \ left (\ tau, \ xi, u \ right) \ Delta \ tau + \ omega (\ tau, \ xi) + {\ frac {\ parsiyel \ omega} {\ kısmi t}} \ left (\ tau, \ xi \ right) \ Delta t + {\ frac {\ parsiyel \ omega} {\ kısmi \ xi}} (\ tau, \ xi) \ Delta \ xi + o \ left (\ Delta \ tau \ sağ) \ sağ \} \ end {dizi}}}ile . Bu nedenle, iki üyeden çıkararak , bölerek ve 0'a yaklaşarak elde ederiz.
Δξ=f(τ,ξ,sen)Δτ+Ö(Δτ){\ Displaystyle \ Delta \ xi = f (\ tau, \ xi, u) \ Delta \ tau + o (\ Delta \ tau)}ω(τ,ξ){\ displaystyle \ omega (\ tau, \ xi)}Δτ{\ displaystyle \ Delta \ tau}Δτ{\ displaystyle \ Delta \ tau}
0=minsen∈U{L(τ,ξ,sen)+∂ω∂t(τ,ξ)+∂ω∂ξ(τ,ξ)f(τ,ξ,sen)}{\ displaystyle 0 = \ min \ limitler _ {u \ in \ mathrm {U}} \ sol \ {{\ mathcal {L}} \ sol (\ tau, \ xi, u \ sağ) + {\ frac {\ kısmi \ omega} {\ kısmi t}} \ sol (\ tau, \ xi \ sağ) + {\ frac {\ kısmi \ omega} {\ kısmi \ xi}} (\ tau, \ xi) f (\ tau, \ xi, u) \ doğru \}}
=minsen∈U{∂ω∂τ(τ,ξ)-H(τ,ξ,sen,-∂ω∂ξ(τ,ξ))}{\ displaystyle = \ min \ limitler _ {u \ in \ mathbf {U}} \ sol \ {{\ frac {\ kısmi \ omega} {\ kısmi \ tau}} \ sol (\ tau, \ xi \ sağ) - {\ mathcal {H}} \ left (\ tau, \ xi, u, - {\ frac {\ kısmi \ omega} {\ kısmi \ xi}} \ left (\ tau, \ xi \ sağ) \ sağ) \ sağ \}},
Hamilton-Jacobi-Bellman denklemine eşdeğerdir. Sınır koşulu ve kriterin optimal değeri, tanımından çıkar .
ω(τ,ξ){\ displaystyle \ omega (\ tau, \ xi)}
Yeterli optimallik koşulunun kanıtı :
Aşağıdaki miktar açısından en aza indirdiğini varsayalım :
sen^(τ,ξ){\ displaystyle {\ hat {u}} (\ tau, \ xi)}v∈U{\ displaystyle v \ in \ mathrm {U}}Q(τ,ξ;v){\ displaystyle Q (\ tau, \ xi; v)}
Q(τ,ξ;v)=L(τ,ξ,v)+∂ω∂t(τ,ξ)+∂ω∂ξ(τ,ξ)f(τ,ξ,v)=H(τ,ξ,sen^(τ,ξ),-∂ω∂ξ(τ,ξ))-H(τ,ξ,v,-∂ω∂ξ(τ,ξ))≥0{\ displaystyle {\ begin {dizi} {c} Q (\ tau, \ xi; v) = {\ mathcal {L}} \ sol (\ tau, \ xi, v \ sağ) + {\ frac {\ kısmi \ omega} {\ kısmi t}} \ left (\ tau, \ xi \ right) + {\ frac {\ partici \ omega} {\ partici \ xi}} (\ tau, \ xi) f (\ tau, \ xi, v) \\ = {\ mathcal {H}} \ left (\ tau, \ xi, {\ hat {u}} (\ tau, \ xi), - {\ frac {\ partici \ omega} {\ kısmi \ xi}} (\ tau, \ xi) \ sağ) - {\ mathcal {H}} \ left (\ tau, \ xi, v, - {\ frac {\ kısmi \ omega} {\ kısmi \ xi} } (\ tau, \ xi) \ sağ) \ geq 0 \ end {dizi}}}.
Let U olduğu kabul edilebilir bir komutu ve diferansiyel denklem tarafından belirlenen durumu ve ilk durumuna . O zaman bizde
xsen:t↦xsen(t){\ displaystyle x_ {u}: t \ mapsto x_ {u} (t)}x˙=f(t,x,sen(t)){\ displaystyle {\ nokta {x}} = f (t, x, u (t))}xsen(t0)=x0{\ displaystyle x_ {u} (t_ {0}) = x_ {0}}
∂ω∂t(t,xsen(t))+∂ω∂ξ(t,xsen(t))f(t,xsen(t),sen(t))=ddtω(t,xsen(t)){\ displaystyle {\ frac {\ kısmi \ omega} {\ kısmi t}} \ sol (t, x_ {u} (t) \ sağ) + {\ frac {\ kısmi \ omega} {\ kısmi \ xi}} (t, x_ {u} (t)) f (t, x_ {u} (t), u (t)) = {\ frac {d} {dt}} \ omega \ left (t, x_ {u} (t) \ sağ)}ve sonuç olarak
0≤∫t0tfQ(t,xsen(t);sen(t))dt=∫t0tfL(t,xsen(t),sen(t))dt+ω(tf,xf)-ω(t0,x0)=J(sen)-ω(t0,x0){\ displaystyle {\ begin {array} {cc} 0 \ leq \ int _ {t_ {0}} ^ {t_ {f}} Q \ left (t, x_ {u} (t); u (t) \ sağ) dt & = \ int _ {t_ {0}} ^ {t_ {f}} {\ mathcal {L}} (t, x_ {u} \ left (t \ right), u (t)) dt + \ omega \ left (t_ {f}, x_ {f} \ sağ) - \ omega \ left (t_ {0}, x_ {0} \ sağ) \\ & = J (u) - \ omega \ left (t_ {0}, x_ {0} \ sağ) \ end {dizi}}}sınır koşulunu dikkate alarak. Çünkü ve sabit olduğundan , öyle. Sipariş uygundur ve yukarıdaki miktar sıfırdır. Bu nedenle, sipariş optimal ve .
x0{\ displaystyle x_ {0}}t0{\ displaystyle t_ {0}}ω(t0,x0){\ displaystyle \ omega \ sol (t_ {0}, x_ {0} \ sağ)}t↦sen^(t,xsen^(t)){\ displaystyle t \ mapsto {\ hat {u}} (t, x _ {\ hat {u}} (t))}sen(t)=sen^(t,xsen^(t))=sen∗(t){\ displaystyle u (t) = {\ hat {u}} \ sol (t, x _ {\ hat {u}} (t) \ sağ) = u ^ {*} (t)}sen∗{\ displaystyle u ^ {*}}J(sen∗)=ω(t0,x0){\ displaystyle J (u ^ {*}) = \ omega \ sol (t_ {0}, x_ {0} \ sağ)}
Pontriagin-Boltyansky teoreminin gerekçesi
Bellman teoreminden Pontriagin-Boltyansky teoremini izleyen şeyi, iki kez sürekli türevlenebilir işlevi varsayarak çıkarıyoruz , ancak bu ikinci varsayım ne yazık ki Bang-Bang komutu gibi en yaygın durumlarda tatmin olmuyor. Optimal yörüngelerde bile farklılaşabilir (yine de bu varsayım, varyasyon hesabı durumunda, Lagrangian ve K fonksiyonu analitik olduğunda, son zaman sabittir ve son durum serbesttir, daha sonra göreceğimiz gibi ).
ω:(t,x)↦ω(t,x){\ displaystyle \ omega: (t, x) \ mapsto \ omega (t, x)}ω{\ displaystyle \ omega}L{\ displaystyle {\ mathcal {L}}}
Bu nedenle Hamilton-Jacobi-Bellman denkleminin sınıfla doğrulandığını varsayalım . O zaman optimal bir kontrolün var olduğunu biliyoruz; t zamanında sırasıyla let ve optimal durum ve optimal kontrol ve ayarla
ω{\ displaystyle \ omega}VS2{\ displaystyle {\ mathcal {C}} ^ {2}}x∗(t){\ displaystyle x {^ {\ ast}} (t)}sen∗(t){\ displaystyle u {^ {\ ast}} (t)}
p′∗(t)=-∂ω∂x(t,x∗(t)){\ displaystyle p ^ {\ asal \ ast} (t) = - {\ frac {\ kısmi \ omega} {\ kısmi x}} \ sol (t, x ^ {\ ast} (t) \ sağ)}.
O zaman mutlaka gelir
p˙′∗(t)=-∂2ω∂x∂t(t,x∗(t))-∂2ω∂x2(t,x∗(t))x˙∗(t){\ displaystyle {\ nokta {p}} ^ {\ prime \ ast} (t) = - {\ frac {\ kısmi ^ {2} \ omega} {\ kısmi x \ kısmi t}} \ sol (t, x ^ {\ ast} (t) \ sağ) - {\ frac {\ kısmi ^ {2} \ omega} {\ kısmi x ^ {2}}} \ left (t, x ^ {\ ast} (t) \ sağ) {\ nokta {x}} ^ {\ ast} \ sol (t \ sağ)}ile , ilk kanonik denkleme eşdeğerdirx˙∗(t)=f(t,x∗(t),sen∗(t)){\ displaystyle {\ nokta {x}} ^ {\ ast} \ sol (t \ sağ) = f (t, x ^ {\ ast} (t), u ^ {\ ast} \ sol (t \ sağ) )}
x˙∗(t)=∂H∂p′(t,x∗(t),sen∗(t),λ∗,p′∗(t)){\ displaystyle {\ dot {x}} ^ {\ ast} (t) = {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi p ^ {\ prime}}} \ sol (t, x ^ {\ ast} (t), u ^ {\ ast} (t), \ lambda ^ {\ ast}, p ^ {\ prime \ ast} (t) \ sağ)}.
Hamilton-Jacobi-Bellman denklemi Maksimum İlkeyi içerir
sen∗(t)=argümanmaxsen∈UH(t,x∗(t),sen,p∗(t)){\ displaystyle u ^ {\ ast} \ sol (t \ sağ) = {\ underet {u \ in U} {\ arg \ max}} {\ mathcal {H}} \ left (t, x ^ {\ ast } \ sol (t \ sağ), u, p ^ {\ ast} \ sol (t \ sağ) \ sağ)}.
hem de eşitlik
∂ω∂t(t,x)=H(t,x,sen∗(t),-∂ω∂x(t,x)){\ displaystyle {\ frac {\ kısmi \ omega} {\ kısmi t}} (t, x) = {\ mathcal {H}} \ sol (t, x, u ^ {\ ast} \ sol (t \ sağ ), - {\ frac {\ kısmi \ omega} {\ kısmi x}} \ sol (t, x \ sağ) \ sağ)}.
İkincisinden çekiyoruz
∂2ω∂t∂x(t,x)=∂H∂x(t,x,sen∗(t),-∂ω∂x(t,x))-∂H∂p′(t,x,sen∗(t),-∂ω∂x(t,x))∂2ω∂x2(t,x){\ displaystyle {\ frac {\ kısmi ^ {2} \ omega} {\ kısmi t \ kısmi x}} (t, x) = {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi x} } \ left (t, x, u ^ {\ ast} \ left (t \ right), - {\ frac {\ parsiyel \ omega} {\ kısmi x}} \ left (t, x \ sağ) \ sağ) - {\ frac {\ partic {\ mathcal {H}}} {\ partly p ^ {\ prime}}} \ left (t, x, u ^ {\ ast} \ left (t \ right), - {\ frac {\ kısmi \ omega} {\ kısmi x}} \ left (t, x \ right) \ right) {\ frac {\ kısmi ^ {2} \ omega} {\ kısmi x ^ {2}}} \ sol (t, x \ sağ)}.
Onun teklifine dalarak ,
X{\ displaystyle \ mathbf {X}}
∂H∂p′(t,x,sen∗,(t),p∗(t))=f(x,sen∗(t),t){\ displaystyle {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi p ^ {\ prime}}} \ sol (t, x, u ^ {\ ast}, \ sol (t \ sağ), p ^ {\ ast} (t) \ sağ) = f \ left (x, u ^ {\ ast} \ left (t \ sağ), t \ sağ)}ve nihayet ikinci kanonik denklemi elde ettik
p˙′(t)=-∂H∂x(t,x∗(t),sen∗(t),p∗(t)){\ displaystyle {\ nokta {p}} ^ {\ prime} (t) = - {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi x}} \ sol (t, x ^ {\ ast } (t), u ^ {\ ast} \ sol (t \ sağ), p ^ {\ ast} (t) \ sağ)}çünkü yukarıdaki yerleştirme ile ve sürekli çift doğrusal formun simetrik olduğu gerçeğini dikkate alarak ,
∂2ω∂x2(t,x∗(t)){\ displaystyle {\ frac {\ kısmi ^ {2} \ omega} {\ kısmi x ^ {2}}} \ sol (t, x ^ {\ ast} (t) \ sağ)}
f(t,x∗(t),sen∗(t))∂2ω∂x2(t,x∗(t)){\ displaystyle f \ sol (t, x ^ {\ ast} (t), u ^ {\ ast} (t) \ sağ) {\ frac {\ kısmi ^ {2} \ omega} {\ kısmi x ^ { 2}}} \ left (t, x ^ {\ ast} (t) \ sağ)} ve
∂2ω∂x2(t,x∗(t))f(t,x∗(t),sen∗(t)){\ displaystyle {\ frac {\ kısmi ^ {2} \ omega} {\ kısmi x ^ {2}}} \ sol (t, x ^ {\ ast} (t) \ sağ) f \ sol (t, x ^ {\ ast} (t), u ^ {\ ast} (t) \ sağ)}
aynı sürekli doğrusal formun iki farklı komut dosyasıdır.
(Gerçekten de, izin B olmak , bir devamlı doğrusal bir şekilde simetrik ve Daha sonra vardır. Dirseği göz önünde bulundurun. Bu gerçek gösterir. . Ancak dikkate h arasında dual bir unsuru olarak , aynı zamanda tayin . Bu nedenle ,, ve yana B simetriktir , hala gerektirir hangi . halinde sonlu boyut, biri bir tabanı iki üye genişleterek bu eşitliğin kontrol edebilirsiniz ve ikili tabana.)
X×X{\ displaystyle \ mathbf {X} \ times \ mathbf {X}}h,k∈X{\ displaystyle h, k \ in \ mathbf {X}}B.k∈X′{\ displaystyle Bk \ in \ mathbf {X} {^ {\ prime}}}⟨B.k|h⟩{\ displaystyle \ sol \ langle Bk | h \ sağ \ rangle}(B.k)h=B.(k,h){\ displaystyle (Bk) h = B. (k, h)}X{\ displaystyle \ mathbf {X}}(h∘B)(k){\ displaystyle \ sol (h \ circ B \ sağ) \ sol (k \ sağ)}(h∘B)(k)=B.(k,h){\ displaystyle \ sol (h \ circ B \ sağ) \ sol (k \ sağ) = B. (k, h)}(h∘B)(k)=B.(h,k){\ displaystyle \ sol (h \ circ B \ sağ) \ sol (k \ sağ) = B. (h, k)}h∘B=B.h{\ displaystyle h \ circ B = Bh}X{\ displaystyle \ mathbf {X}}X{\ displaystyle \ mathbf {X}}
Optimal yörüngeler üzerinde eşitliği (kısaltma olarak) göstermek için, basitlik için bir Banach uzayının açık olduğunu varsayalım . Maksimum ilkesi, Euler'in optimumdaki koşulunu ifade eder . Bu nedenle,
∂H∂t=dHdt{\ displaystyle {\ frac {\ bölümlü {\ mathcal {H}}} {\ bölümlü t}} = {\ frac {d {\ mathcal {H}}} {dt}}}U{\ displaystyle \ mathbf {U}}∂H∂sen=0{\ displaystyle {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi u}} = 0}
dHdt=∂H∂t+∂H∂xx˙+∂H∂p′p˙′+∂H∂sen=∂H∂t+∂H∂x∂H∂p′-∂H∂p′∂H∂x{\ displaystyle {\ frac {d {\ mathcal {H}}} {dt}} = {\ frac {\ parsiyel {\ mathcal {H}}} {\ kısmi t}} + {\ frac {\ kısmi {\ matematiksel {H}}} {\ kısmi x}} {\ nokta {x}} + {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi p ^ {\ prime}}} {\ nokta {p }} ^ {\ prime} + {\ frac {\ parsiyel H} {\ kısmi u}} = {\ frac {\ bölümlü {\ mathcal {H}}} {\ bölümlü t}} + {\ frac {\ bölümlü {\ mathcal {H}}} {\ kısmi x}} {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi p ^ {\ prime}}} - {\ frac {\ partic {\ mathcal { H}}} {\ kısmi p ^ {\ prime}}} {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi x}}}.
Yukarıdaki ile aynı akıl yürütme türü, bunun sonucu olarak ortaya çıkmaktadır.
∂H∂x∂H∂p′=∂H∂p′∂H∂x{\ displaystyle {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi x}} {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi p ^ {\ prime}}} = { \ frac {\ kısmi {\ mathcal {H}}} {\ kısmi p ^ {\ prime}}} {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi x}}}
Enine olma koşulunu elde etmeye devam ediyor. On biz sahip olmalıdır . Bu nedenle, herhangi bir sonsuz küçük müsaade edilebilir artış için ,
Vf{\ displaystyle {\ mathcal {V}} _ {f}}ω(tf,x(tf))=K(tf,x(tf)){\ displaystyle \ omega (t_ {f}, x (t_ {f})) = K (t_ {f}, x (t_ {f}))}(δtf,δxf)∈T(tf∗,xf∗(tf∗))Vf{\ displaystyle \ sol (\ delta t_ {f}, \ delta x_ {f} \ sağ) \ içinde T _ {\ sol (t_ {f} ^ {\ ast}, x_ {f} ^ {\ ast} \ sol (t_ {f} ^ {\ ast} \ sağ) \ sağ)} {\ mathcal {V}} _ {f}}
(∂K∂t(tf∗,x∗(tf∗)-∂ω∂t(tf∗,x∗(tf∗))δtf+(∂K∂x(tf∗,x∗(tf∗)-∂ω∂x(tf∗,x∗(tf∗))δxf=0{\ displaystyle \ sol ({\ frac {\ kısmi K} {\ kısmi t}} (t_ {f} ^ {\ ast}, x ^ {\ ast} \ sol (t_ {f} ^ {\ ast} \ sağ) - {\ frac {\ kısmi \ omega} {\ kısmi t}} (t_ {f} ^ {\ ast}, x ^ {\ ast} \ left (t_ {f} ^ {\ ast} \ sağ) \ sağ) \ delta t_ {f} + \ left ({\ frac {\ kısmi K} {\ kısmi x}} (t_ {f} ^ {\ ast}, x ^ {\ ast} \ left (t_ {f } ^ {\ ast} \ sağ) - {\ frac {\ kısmi \ omega} {\ kısmi x}} (t_ {f} ^ {\ ast}, x ^ {\ ast} \ left (t_ {f} ^ {\ ast} \ sağ) \ sağ) \ delta x_ {f} = 0}.
Ancak bizde
∂ω∂t(tf∗,x∗(tf∗))=H(tf∗,x∗(tf∗),sen∗(tf∗),p′∗(tf∗)){\ displaystyle {\ frac {\ kısmi \ omega} {\ kısmi t}} \ sol (t_ {f} ^ {\ ast}, x ^ {\ ast} \ sol (t_ {f} ^ {\ ast} \ sağ) \ sağ) = {\ mathcal {H}} \ left (t_ {f} ^ {\ ast}, x ^ {\ ast} \ left (t_ {f} ^ {\ ast} \ sağ), u ^ {\ ast} \ left (t_ {f} ^ {\ ast} \ sağ), p ^ {\ prime \ ast} \ left (t_ {f} ^ {\ ast} \ sağ) \ sağ)} ve
∂ω∂x(tf∗,x∗(tf∗))=-p′∗(tf∗,x∗(tf∗),sen∗(tf∗),p′∗(tf∗)){\ displaystyle {\ frac {\ kısmi \ omega} {\ kısmi x}} \ sol (t_ {f} ^ {\ ast}, x ^ {\ ast} \ sol (t_ {f} ^ {\ ast} \ sağ) \ sağ) = - p ^ {\ prime \ ast} \ left (t_ {f} ^ {\ ast}, x ^ {\ ast} \ left (t_ {f} ^ {\ ast} \ sağ), u ^ {\ ast} \ left (t_ {f} ^ {\ ast} \ sağ), p ^ {\ prime \ ast} \ left (t_ {f} ^ {\ ast} \ sağ) \ sağ)}.
Bu nedenle, çaprazlığın durumu gösterilmiştir.
Euler-Lagrange, Legendre, Weierstrass ve Weierstrass-Erdmann koşulları
Değişkenler Hesabı problemi, formun bir kriterini en aza indirmekten ibarettir.
J=K(tf,xf)+∫t0tfL(t,x(t),x˙(t))dt{\ displaystyle J = K \ sol (t_ {f}, x_ {f} \ sağ) + \ int _ {t_ {0}} ^ {t_ {f}} {\ mathcal {L}} \ sol (t, x \ sol (t \ sağ), {\ nokta {x}} \ sol (t \ sağ) \ sağ) dt}optimal kontrol problemi konumunda düşünülen ile aynı tipte bir son koşul ile. Bu nedenle, “sistemin denklemi” ile optimal kontrol probleminden ve sonlu boyutun varsayıldığı uzay sorunundan başka bir şey değildir . Geliyor, eliyor ,
x˙=sen{\ displaystyle {\ dot {x}} = u}U=X{\ displaystyle \ mathbf {U} = \ mathbf {X}}sen{\ displaystyle u}
H(t,x,x˙,λ,p′)=⟨p′|x˙⟩-λL(t,x,x˙){\ displaystyle {\ mathcal {H}} \ sol (t, x, {\ nokta {x}}, \ lambda, p ^ {\ prime} \ sağ) = \ sol \ langle p ^ {\ prime} | { \ nokta {x}} \ sağ \ rangle - \ lambda {\ mathcal {L}} \ left (t, x, {\ dot {x}} \ sağ)}.
Fonksiyonun kısmi diferansiyeli olduğu kadar sürekli türevlenebilir olduğu varsayılır . Maksimum İlke, formülasyonu gereği, "güçlü bir optimum" için gerekli bir koşuldur. İma ediyor
L{\ displaystyle {\ mathcal {L}}}∂L∂x˙{\ displaystyle {\ frac {\ kısmi {\ mathcal {L}}} {\ kısmi {\ nokta {x}}}}}
∂H∂x˙(t,x∗,x˙∗,λ∗,p′∗)=0⇔p′∗=λ∂L∂x˙(t,x∗,x˙∗){\ displaystyle {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi {\ nokta {x}}}} \ sol (t, x ^ {\ ast}, {\ nokta {x}} ^ { \ ast}, \ lambda ^ {\ ast}, p ^ {\ prime \ ast} \ right) = 0 \ Leftrightarrow p ^ {\ prime \ ast} = \ lambda {\ frac {\ parsiyel {\ mathcal {L} }} {\ kısmi {\ nokta {x}}}} \ left (t, x ^ {\ ast}, {\ nokta {x}} ^ {\ ast} \ sağ)}.
Önemsiz olmama durumu ima eder , bu nedenle şimdi argümanları kaldırıyoruz . Kanonik denklemler artık normal Hamilton denklemlerine indirgenmiştir . Yukarıda elde edilen ifadeyi ikinci kanonik denklemde değiştirerek, Euler-Lagrange koşulunu elde ederiz :
λ=1{\ displaystyle \ lambda = 1}λ{\ displaystyle \ lambda}H{\ displaystyle {\ mathcal {H}}}p′∗{\ displaystyle p ^ {\ prime \ ast}}
ddt(∂L∂x˙)=∂L∂x{\ displaystyle {\ frac {d} {dt}} \ sol ({\ frac {\ kısmi {\ mathcal {L}}} {\ kısmi {\ nokta {x}}}} \ sağ) = {\ frac { \ kısmi {\ mathcal {L}}} {\ kısmi x}}}.
Öte yandan, bir kısmi diferansiyel saniyeyi kabul ettiğini ve bu kısmi diferansiyel saniyenin sürekli bir fonksiyon olduğunu varsayarsak , maksimum prensibi, ikinci sırada, Legendre'nin zayıf durumunu ifade eder.L{\ displaystyle {\ mathcal {L}}}x˙{\ displaystyle {\ dot {x}}}
∂2L∂x˙2(t,x∗(t),x˙∗(t),p′∗(t))≥0{\ displaystyle {\ frac {\ kısmi ^ {2} {\ mathcal {L}}} {\ kısmi {\ nokta {x}} ^ {2}}} \ sol (t, x ^ {\ ast} \ sol (t \ sağ), {\ nokta {x}} ^ {\ ast} \ sol (t \ sağ), p ^ {\ prime \ ast} \ sol (t \ sağ) \ sağ) \ geq 0}bu simetrik sürekli çift doğrusal formun pozitif yarı kesin olması gerektiği anlamına gelir . Hamiltonian'ın düzenli olabilmesi için, Legendre'nin güçlü koşulunun karşılanması gerekir.∂2L∂x˙2(t,x∗(t),x˙∗(t),p′∗(t)){\ displaystyle {\ frac {\ kısmi ^ {2} {\ mathcal {L}}} {\ kısmi {\ nokta {x}} ^ {2}}} \ sol (t, x ^ {\ ast} \ sol (t \ sağ), {\ nokta {x}} ^ {\ ast} \ sol (t \ sağ), p ^ {\ prime \ ast} \ sol (t \ sağ) \ sağ)}
∂2L∂x˙2(t,x∗(t),x˙∗(t),p′∗(t))>0{\ displaystyle {\ frac {\ kısmi ^ {2} {\ mathcal {L}}} {\ kısmi {\ nokta {x}} ^ {2}}} \ sol (t, x ^ {\ ast} \ sol (t \ sağ), {\ nokta {x}} ^ {\ ast} \ sol (t \ sağ), p ^ {\ prime \ ast} \ sol (t \ sağ) \ sağ)> 0}bu, bu simetrik çift doğrusal formun pozitif tanımlı olması gerektiği anlamına gelir.
"Fazlalık" olarak da adlandırılan Weierstrass işlevini düşünün
E(t,x,sen;w)=H(t,x,sen,∂L∂x˙(t,x,sen))-H(t,x,w,∂L∂x˙(t,x,sen)){\ displaystyle {\ mathcal {E}} \ sol (t, x, u; w \ sağ) = {\ mathcal {H}} \ sol (t, x, u, {\ frac {\ kısmi {\ mathcal { L}}} {\ kısmi {\ nokta {x}}}} \ left (t, x, u \ right) \ right) - {\ mathcal {H}} \ left (t, x, w, {\ frac {\ kısmi {\ mathcal {L}}} {\ kısmi {\ nokta {x}}}} \ left (t, x, u \ right) \ sağ)}.
Maksimum Prensibi Weierstrass koşulunu ifade eder (Boltyanskii tarafından maksimum Prensibinin gösterilmesi için getirilen “iğne varyasyonlarına” benzer şekilde “güçlü varyasyonlar” ile elde edilir). Weierstrass işlevini de formda yazıyoruz
E(t,x∗(t),x˙∗(t);w)≥0{\ displaystyle {\ mathcal {E}} \ sol (t, x ^ {\ ast} (t), {\ nokta {x}} ^ {\ ast} (t); w \ sağ) \ geq 0}
E(t,x,sen;w)=L(t,x,w)-L(t,x,sen)-∂L∂x˙(t,x,sen)(w-sen){\ displaystyle {\ mathcal {E}} (t, x, u; w) = {\ mathcal {L}} (t, x, w) - {\ mathcal {L}} (t, x, u) - {\ frac {\ bölümlü {\ mathcal {L}}} {\ bölümlü {\ nokta {x}}}} (t, x, u) \ sol (wu \ sağ)}.
Son olarak, süreklilik ve fonksiyonunun bir yuvarlama köşe için koşul arasında Weierstrass'ın-Erdmann (in) .
p′∗{\ displaystyle p ^ {\ prime \ ast}}t↦H(t,x∗(t),x˙∗(t),∂L∂x˙(t,x∗(t),x˙∗(t))){\ displaystyle t \ mapsto {\ mathcal {H}} \ sol (t, x ^ {\ ast} \ sol (t \ sağ), {\ nokta {x}} ^ {\ ast} \ sol (t \ sağ ), {\ frac {\ bölümlü {\ mathcal {L}}} {\ bölümlü {\ nokta {x}}}} \ left (t, x ^ {\ ast} \ left (t \ right), {\ nokta {x}} ^ {\ ast} \ sol (t \ sağ) \ sağ) \ sağ)}
Not
Maksimum Prensibi ile Weierstrass'ın koşulu arasındaki temel fark, ikincisinde, kişinin baştan itibaren eşitliğe sahip olmasıdır ; bu, örtük bir fonksiyon olarak belirleyen eşitlik, klasik varyasyon hesabında (o daha sonra göreceğimiz gibi, sözde Hamilton'cudan ziyade bir Hamilton'cuyla akla yol açar). Weierstrass veya ondan önceki diğerleri, kendisini bu durumdan kurtararak Maksimum İlkeyi formüle edebilirdi.
p′∗=∂L∂x˙{\ displaystyle p ^ {\ prime \ ast} = {\ frac {\ kısmi {\ mathcal {L}}} {\ kısmi {\ nokta {x}}}}}x˙∗{\ displaystyle {\ dot {x}} ^ {\ ast}}p′∗{\ displaystyle p ^ {\ prime \ ast}}
Carathéodory koşulu ve Hamilton-Jacobi denklemi
Carathéodory durumu
Carathéodory durumu aşağıdaki biçimde ifade edilebilir: Farz edelim ki , yukarıda daha önce yaptığımız gibi, poz vererek, sürekli türevlenebilir bir işlev var.
S:(t,x)↦S(t,x){\ displaystyle S: (t, x) \ S (t, x) ile eşleşir}
sen0(t,x,p′)=argümanmaxsenH(t,x,sen,p′){\ displaystyle u ^ {0} \ sol (t, x, p ^ {\ prime} \ sağ) = {\ underet {u} {\ arg \ max}} {\ mathcal {H}} \ sol (t, x, u, p ^ {\ üssü} \ sağ)}(maksimumun var olduğunu ve kesin olduğunu varsayarak) veya "Carathéodory" kısmi diferansiyel denklemin çözümü
S{\ displaystyle S}
∂S∂t(t,x)=-H(t,x,sen0(t,x,∂S∂x(t,x)),∂S∂x(t,x)){\ displaystyle {\ frac {\ kısmi S} {\ kısmi t}} (t, x) = - {\ mathcal {H}} (t, x, u ^ {0} (t, x, {\ frac { \ kısmi S} {\ kısmi x}} (t, x)), {\ frac {\ kısmi S} {\ kısmi x}} (t, x))}.
O zaman optimal fonksiyon diferansiyel denklemin çözümüdür
x∗{\ displaystyle x ^ {\ ast}}
x˙∗(t)=senÖ(t,x∗(t),∂S∂x(t,x∗(t))){\ displaystyle {\ nokta {x}} ^ {\ ast} \ sol (t \ sağ) = u ^ {o} \ sol (t, x ^ {\ ast} (t), {\ frac {\ kısmi S } {\ kısmi x}} \ left (t, x ^ {\ ast} \ left (t \ sağ) \ sağ) \ sağ)}.
Hamilton-Jacobi-Bellman denklemi sadece bu koşulun yeniden formüle edilmesidir . Notasyondaki bu fark, varyasyonların hesabında, "eylem" S'nin başlangıç anı ile mevcut an t arasında en aza indirilmesi , Bellman'ın Optimallik İlkesine göre Bellman işlevinin şu anki t ile mevcut zamanı arasında en aza indirilmesi gerçeğinden kaynaklanmaktadır. son kez .
ω=-S+VSte{\ displaystyle \ omega = -S + C ^ {te}}t0{\ displaystyle t_ {0}}ω{\ displaystyle \ omega}tf{\ displaystyle t_ {f}}
Hamilton-Jacobi denklemi
U'ya göre maksimizasyonu bir açıkta gerçekleştirilir. Sözde Hamiltoniyenin maksimizasyonu bu nedenle Euler koşulunu ifade eder.
H{\ displaystyle {\ mathcal {H}}}
∂H∂sen(t,x,sen,p′)=0⇔p′=∂L∂sen(t,x,sen){\ displaystyle {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi u}} \ sol (t, x, u, p ^ {\ asal} \ sağ) = 0 \ Leftrightarrow p ^ {\ asal } = {\ frac {\ kısmi {\ mathcal {L}}} {\ kısmi u}} \ left (t, x, u \ right)}.
Biz formda bu denklemi yazabiliriz ile ve . Kapalı fonksiyon teoremi sözde Hamilton, düzenli ve eğer ima sınıfı , U örtülü bir sınıf fonksiyonudur ve z yazılabilir .
G(z,sen)=0{\ displaystyle G (z, u) = 0}z=(t,x,p′){\ displaystyle z = (t, x, p ^ {\ üssü})}G(z,sen)=p′-∂L∂sen(t,x,sen){\ displaystyle G (z, u) = p ^ {\ üssü} - {\ frac {\ kısmi {\ mathcal {L}}} {\ kısmi u}} \ sol (t, x, u \ sağ)}∂L∂sen{\ displaystyle {\ frac {\ kısmi {\ mathcal {L}}} {\ kısmi u}}}VS1{\ displaystyle {\ mathcal {C}} ^ {1}}VS1{\ displaystyle {\ mathcal {C}} ^ {1}}sen0(z){\ displaystyle u ^ {0} \ sol (z \ sağ)}
O zaman Hamilton'cu olalım
H(t,x,p′)=H(t,x,sen0(t,x,p′),p′){\ displaystyle {\ mathfrak {H}} (t, x, p ^ {\ prime}) = {\ mathcal {H}} \ left (t, x, u ^ {0} (t, x, p ^ { \ prime}), p ^ {\ prime} \ sağ)}.
Carathéodory denkleminden her zamanki
Hamilton-Jacobi denklemini elde ederiz.
∂S∂t+H(t,x,∂S∂x)=0{\ displaystyle {\ frac {\ kısmi S} {\ kısmi t}} + {\ mathfrak {H}} (t, x, {\ frac {\ kısmi S} {\ kısmi x}}) = 0}.
Yukarıda Pontriaguine'nin prensibini Hamilton-Jacobi-Bellman denkleminden sınıf varsayarak nasıl çıkaracağımızı gördük . Biz aynı şekilde varsayılarak Caratheodory durumun varyasyon hesabı gerekli güçlü asgari şartları içinde anlamak S sınıfı .
ω{\ displaystyle \ omega}VS2{\ displaystyle {\ mathcal {C}} ^ {2}}VS2{\ displaystyle {\ mathcal {C}} ^ {2}}
Özellikle, Euler-Lagrange, Legendre ve Weierstrass'ın gerekli koşulları, eğer düzenli ve analitikse, K analitikse, son an sabitse ve son durum serbestse , Carathéodory koşullarının sonucudur . Aslında, örtük fonksiyonların teoremi, bunun analitik olduğunu ima eder ; bu nedenle de öyledir ve Cauchy-Kowalevski teoremi, yeterince küçük bir açıkta, sabit c koşulunu tatmin eden benzersiz bir çözüm S'nin varlığını içerir ve bu çözüm analitiktir. Bu yalnızca yerel bir sonuçtur, ancak büyük önem taşımaktadır, çünkü özellikle fizikte, daha sonra göreceğimiz gibi, doğru “en az eylem ilkesi” de yereldir.
H{\ displaystyle {\ mathcal {H}}}sen0{\ displaystyle u ^ {0}}H{\ displaystyle {\ mathfrak {H}}}S(tf,xf)=vs-K(tf,xf){\ displaystyle S (t_ {f}, x_ {f}) = cK (t_ {f}, x_ {f})}
"Doğrusal ikinci dereceden" komut
Sorunun konumu
1960 yılında Kalman tarafından yayınlanan makaleden bu yana , "doğrusal ikinci dereceden kontrol" çok sayıda araştırmanın konusu olmuştur. Durum denklemi için sistemin doğrusal ve sonlu boyutlu olduğunu varsayalım.
x˙=AT(t)x+B(t)sen{\ displaystyle {\ nokta {x}} = A \ sol (t \ sağ) x + B \ sol (t \ sağ) u}Nerede ve Hangi küme fonksiyonları arasında yer ve sırasıyla. Kriterin, formun ikinci dereceden olduğu varsayılır.
t↦AT(t){\ displaystyle t \ A \ sola doğru (t \ sağ)}t↦B(t){\ displaystyle t \ mapsto B \ sol (t \ sağ)}[t0,tf]{\ displaystyle \ sol [t_ {0}, t_ {f} \ sağ]}Rdeğil×değil{\ displaystyle \ mathbb {R} ^ {n \ kere n}}Rdeğil×m{\ displaystyle \ mathbb {R} ^ {n \ kere m}}
J=xfTPfxf+∫t0tf(xT(t)Q(t)x(t)+senT(t)R(t)sen(t))dt{\ displaystyle J = x_ {f} ^ {T} P_ {f} x_ {f} + \ int _ {t_ {0}} ^ {t_ {f}} \ sol (x ^ {T} \ sol (t \ sağ) Q \ sol (t \ sağ) x \ sol (t \ sağ) + u ^ {T} \ sol (t \ sağ) R \ sol (t \ sağ) u \ sol (t \ sağ) \ sağ ) dt}burada (yanıt ), in (sırasıyla ) düzenlenmiş (sürekli) bir işlevidir ; matrisin devrikini belirtir . Matrisler ve gerçek simetrik varsayılır ve her şey için pozitif tanımlı (kısaltılmış :) olduğu varsayılır . Matrisin pozitif yarı kesin gerçek simetrik olduğu varsayılır. Son durum serbestken son zaman sabittir .
t↦Q(t){\ displaystyle t \ Q'ya doğru \ sola (t \ sağ)}t↦R(t){\ displaystyle t \ Mapsto R \ sola (t \ sağ)}[t0,tf]{\ displaystyle \ sol [t_ {0}, t_ {f} \ sağ]}Rdeğil×değil{\ displaystyle \ mathbb {R} ^ {n \ kere n}}Rm×m{\ displaystyle \ mathbb {R} ^ {m \ times m}}(.)T{\ displaystyle \ sol (. \ sağ) ^ {T}}(.){\ displaystyle \ sol (. \ sağ)}Q(t){\ displaystyle Q \ sol (t \ sağ)}R(t){\ displaystyle R \ sol (t \ sağ)}R(t){\ displaystyle R \ sol (t \ sağ)}R(t)>0{\ displaystyle R (t)> 0}t∈[t0,tf]{\ displaystyle t \ solda [t_ {0}, t_ {f} \ sağ]}Pf{\ displaystyle P_ {f}}tf{\ displaystyle t_ {f}}xf{\ displaystyle x_ {f}}
Bellman teoreminin uygulanması
Şimdi dinamik programlama yöntemini uygulayalım, böylece yeterli bir optimallik koşulu elde edelim (ki bu dikkate alındığında da gerekli olacaktır; ve aynı sonuca yol açacak maksimum ilkesini de uygulayabiliriz) ). Bunun için formun bir "Bellman işlevi" ni seçelim
ω(t,ξ)=ξTP(t)ξ.{\ displaystyle \ omega \ sol (t, \ xi \ sağ) = \ xi ^ {T} P \ sol (t \ sağ) \ xi.}Sahibiz
H(τ,ξ,sen,1,-∂ω∂x(τ,ξ))=-2ξTP(τ)(AT(τ)ξ+B(τ)sen)-(ξTQ(τ)ξ+senTR(τ)sen){\ displaystyle {\ mathcal {H}} \ sol (\ tau, \ xi, u, 1, - {\ frac {\ kısmi \ omega} {\ kısmi x}} \ sol (\ tau, \ xi \ sağ) \ right) = - 2 \ xi ^ {T} P \ left (\ tau \ right) \ left (A \ left (\ tau \ right) \ xi + B \ left (\ tau \ sağ) u \ sağ) - \ left (\ xi ^ {T} Q \ left (\ tau \ right) \ xi + u ^ {T} R \ left (\ tau \ sağ) u \ sağ)}.
Fonksiyon kesinlikle edilir burada içbükey üzerinde , bu nedenle "Euler eşitliği" tarafından belirlenen eşsiz global maksimum itiraf (diğer bir deyişle, sözde Hamilton düzenli)
sen↦H(τ,ξ,sen,1,-∂ω∂x(τ,ξ)){\ displaystyle u \ mapsto {\ mathcal {H}} \ left (\ tau, \ xi, u, 1, - {\ frac {\ kısmi \ omega} {\ kısmi x}} \ sol (\ tau, \ xi \ doğru doğru)}Rm{\ displaystyle \ mathbb {R} ^ {m}}
∂H∂sen(τ,ξ,sen,1,-∂ω∂x(τ,ξ))=0{\ displaystyle {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi u}} \ sol (\ tau, \ xi, u, 1, - {\ frac {\ kısmi \ omega} {\ kısmi x }} \ left (\ tau, \ xi \ sağ) \ sağ) = 0}Bu, Hamilton-Jacobi-Bellman denklemini verir, bu nedenle yazılır (notasyonları hafifletmek için farklı matrislerin zamana bağlılığı çıkarılır)
sen∗(τ,ξ)=-R(τ)-1BT(τ)P(τ)ξ.{\ Displaystyle u ^ {\ ast} \ sol (\ tau, \ xi \ sağ) = - R \ sol (\ tau \ sağ) ^ {- 1} B ^ {T} \ sol (\ tau \ sağ) P \ sol (\ tau \ sağ) \ xi.}
ξTP˙ξ=-2ξTP(ATξ-BR-1BTξ)-(ξTQξ+ξTPBR-1BTPξ){\ displaystyle \ xi ^ {T} {\ nokta {P}} \ xi = -2 \ xi ^ {T} P \ sol (A \ xi -BR ^ {- 1} B ^ {T} \ xi \ sağ ) - \ left (\ xi ^ {T} Q \ xi + \ xi ^ {T} PBR ^ {- 1} B ^ {T} P \ xi \ sağ)}matris
Riccati denkleminin çözüm fonksiyonunun seçilmesine yol açarτ→P(τ){\ displaystyle \ tau \ rightarrow P \ sol (\ tau \ sağ)}
-P˙=ATTP+PAT-PBBR-1BTP+Q{\ displaystyle - {\ nokta {P}} = A ^ {T} P + PA-PBBR ^ {- 1} B ^ {T} P + Q}ile bir ön şartı
P(tf)=Pf{\ displaystyle P \ sol (t_ {f} \ sağ) = P_ {f}}.
Jacobi Şartları
Yapılan varsayımlar altında, diferansiyel denkleme ikinci elemanı bir yerel Lipschitz fonksiyonudur P . Bu nedenle, yukarıdaki son koşulla, bir aralıkta (açık veya kapalı ) benzersiz bir maksimum çözümü kabul eder . Bu aralıktaki tüm t'ler için gerçek simetrik olduğunu kolayca görebiliriz . Diferansiyel denklemlerin teorisi ima eğer yoksa eğer ancak aralık aylarında açıktır , sonra . O zaman anın , anın eşleniği olduğu söylenir . (Çoğunlukla, Calculus of variations'da eşlenik nokta kavramı daha çok sabit bir son duruma sahip bir optimizasyon problemi için tanıtılmıştır.) Aşağıdaki sonuç artık açıktır:
P(t;tf){\ displaystyle P \ sol (t; t_ {f} \ sağ)}(t1,tf]{\ displaystyle \ sol (t_ {1}, t_ {f} \ sağ]}t1{\ displaystyle t_ {1}}P(t;tf){\ displaystyle P \ sol (t; t_ {f} \ sağ)}t1>t0{\ displaystyle t_ {1}> t_ {0}}t1=t0{\ displaystyle t_ {1} = t_ {0}}(t1,tf]{\ displaystyle \ sol (t_ {1}, t_ {f} \ sağ]}t1{\ displaystyle t_ {1}}limt→t1,t∈]t1,tf]‖P(t;tf)‖=+∞{\ displaystyle \ lim \ sınırları _ {t \ sağarrow t_ {1}, t \ solda] t_ {1}, t_ {f} \ sağ]} \ sol \ Vert P \ sol (t; t_ {f} \ sağ) \ sağ \ Vert = + \ infty}t1{\ displaystyle t_ {1}}tf{\ displaystyle t_ {f}}
Teorem (Jacobi) - Optimal bir sıranın olması için gerekli bir koşul , aralıkta eşlenik nokta olmamasıdır ( zayıf Jacobi koşulu ). Optimal bir düzenin olması için yeterli bir koşul , aralıkta eşlenik noktaların olmamasıdır ( güçlü Jacobi koşulu ).
]t0,tf]{\ displaystyle] t_ {0}, t_ {f}]}[t0,tf]{\ displaystyle [t_ {0}, t_ {f}]}
Aşağıdaki iki koşulun eşdeğer olduğunu unutmayın:
(1) Jacobi'nin güçlü durumu tatmin ediliyor;
(2) düzgün sınırlıdır ( t'ye göre ).
‖P(t;tf)‖{\ Displaystyle \ sol \ Vert P \ sol (t; t_ {f} \ sağ) \ sağ \ Vert}
Teoremi (Kalman, 1960) - herkes için varsa , bir pozitif yarı tanımlı (kısaltılmış, ), sonra Jacobi'nin güçlü koşulu karşılayan.
t∈[t0,tf]{\ displaystyle t \ in [t_ {0}, t_ {f}]}Q(t){\ displaystyle Q (t)}Q(t)≥0{\ displaystyle Q (t) \ geq 0}
Gösteri
Izin olan bir anlık tanımlanır ve izin temel bir çözüm ile tanımlanabilir
t∈[t0,tf]{\ displaystyle t \ in [t_ {0}, t_ {f}]}P(t;tf){\ displaystyle P \ sol (t; t_ {f} \ sağ)}Φ(.,t){\ displaystyle \ Phi (., t)}
∂Φ∂τ(τ;t)=AT(τ)Φ(τ;t){\ displaystyle {\ frac {\ kısmi \ Phi} {\ kısmi \ tau}} \ sol (\ tau; t \ sağ) = A \ sol (\ tau \ sağ) \ Phi \ sol (\ tau; t \ sağ )}, .
Φ(t;t)=bendeğil{\ displaystyle \ Phi (t; t) = I_ {n}}Bellman'ın teoremi şunu ima eder ,
∀ξ∈Rdeğil{\ displaystyle \ forall \ xi \ in \ mathbb {R} ^ {n}}
ξTP(t;tf)ξ≤∫ttfξTΦT(τ;t)Q(t)Φ(τ;t)ξdτ{\ displaystyle \ xi ^ {T} P \ sol (t; t_ {f} \ sağ) \ xi \ leq \ int _ {t} ^ {t_ {f}} \ xi ^ {T} \ Phi ^ {T } \ left (\ tau; t \ right) Q \ left (t \ right) \ Phi \ left (\ tau; t \ sağ) \ xi d \ tau}.
Bu nedenle, eğer ,
Q(t)≥0{\ displaystyle Q (t) \ geq 0}
ξTP(t;tf)ξ≤‖ξ‖2α(t0,tf){\ displaystyle \ xi ^ {T} P \ sol (t; t_ {f} \ sağ) \ xi \ leq \ sol \ Vert \ xi \ sağ \ Vert ^ {2} \ alfa \ sol (t_ {0}, t_ {f} \ sağ)}nerede ve sonunda
α(t0,tf)=∫ttf‖Q(t)‖‖Φ(τ;t)‖2dτ<∞{\ displaystyle \ alpha \ sol (t_ {0}, t_ {f} \ sağ) = \ int _ {t} ^ {t_ {f}} \ sol \ Vert Q \ sol (t \ sağ) \ sağ \ Vert \ left \ Vert \ Phi \ left (\ tau; t \ sağ) \ sağ \ Vert ^ {2} d \ tau <\ infty}
‖P(t;tf)‖≤α(t0,tf){\ Displaystyle \ Vert P \ sol (t; t_ {f} \ sağ) \ Vert \ leq \ alfa \ sol (t_ {0}, t_ {f} \ sağ)}.
Optimal komut ifadesi
Varsayalım . Optimal kontrol bu nedenle iyi tanımlanmıştır; doğrusal ve kapalı döngüdür ve şu şekilde verilir:
Q(t)≥0,∀t∈[t0,tf]{\ displaystyle Q (t) \ geq 0, \ forall t \ içinde [t_ {0}, t_ {f}]}
sen^(t,x)=-K(t)x{\ displaystyle {\ şapka {u}} \ sol (t, x \ sağ) = - K \ sol (t \ sağ) x}, .
K=R-1BTP{\ displaystyle K = R ^ {- 1} B ^ {T} P}Kriterin optimal değerinin şu olduğuna dikkat edin: ω(t0,x(t0))=xT(t0)P(t0;tf)x(t0).{\ displaystyle \ omega \ sol (t_ {0}, x \ sol (t_ {0} \ sağ) \ sağ) = x ^ {T} \ sol (t_ {0} \ sağ) P \ sol (t_ {0 }; t_ {f} \ sağ) x \ sol (t_ {0} \ sağ).}
Sabit lineer sistemler için (matrisleri A ve B zamana bağlı değildir), kişi genellikle alır , Q ve R sabit matrislerini seçer ve biri "sonsuz ufku", yani aldığını seçer . Q formuna yazın . Aşağıdaki koşullardan biri:
Pf=0{\ displaystyle P_ {f} = 0}tf→+∞{\ displaystyle t_ {f} \ rightarrow + \ infty}Q=VSTVS{\ displaystyle Q = C ^ {T} C}
(a): Sistem (veya kısaca çift ) stabilize edilebilir .
(AT,B){\ displaystyle \ sol (A, B \ sağ)}
(b) bir çift olduğu tespit .
(VS,AT){\ displaystyle \ sol (C, A \ sağ)}
Aşağıdaki sonuca sahibiz:
Infinite horizon ile doğrusal ikinci dereceden kontrol -
Koşul (a) karşılanırsa, "Riccati cebirsel denkleminin" gerçek pozitif yarı kesin simetrik çözümü olan
sabit bir limit kabul edin.P(t;tf){\ displaystyle P \ sol (t; t_ {f} \ sağ)}tf→+∞{\ displaystyle t_ {f} \ rightarrow + \ infty}P∞{\ displaystyle P _ {\ infty}}
ATTP+PAT-BBR-1BTP+Q=0{\ displaystyle A ^ {T} P + PA-BBR ^ {- 1} B ^ {T} P + Q = 0}ve optimum kontrolü , .
(t,x)→sen^(t,x)=-Kx{\ displaystyle \ sol (t, x \ sağ) \ sağarrow {\ şapka {u}} \ sol (t, x \ sağ) = - Kx}K=R-1BTP∞{\ displaystyle K = R ^ {- 1} B ^ {T} P _ {\ infty}}
Aşağıdaki denkliğe sahibiz:
(-de)&(b)⇔{\ Displaystyle (a) \ & \ sol (b \ sağ) \ Leftrightarrow} P∞{\ displaystyle P _ {\ infty}}olan benzersiz yukarıda Riccati cebir denklemi ve ilmekli sisteminin pozitif yarı tanımlı gerçek simetrik bir çözümdür katlanarak kararlı .
Bu koşullar doyurulurken, matris halinde ve yalnızca pozitif kesin olduğu gözlemlenebilir .
P∞{\ displaystyle P _ {\ infty}}(VS,AT){\ displaystyle \ sol (C, A \ sağ)}
Çapraz terim içeren bir kriterin durumu
Bazen çapraz terim de dahil olmak üzere daha genel bir ikinci dereceden kriter olarak değerlendiririz.
J=xfTPfxf+∫t0tf(xT(t)senT(t))(Q(t)S(t)ST(t)R(t))(x(t)sen(t))dt{\ displaystyle J = x_ {f} ^ {T} P_ {f} x_ {f} + \ int _ {t_ {0}} ^ {t_ {f}} \ sol ({\ begin {dizi} {cc} x ^ {T} (t) & u ^ {T} \ left (t \ right) \ end {dizi}} \ right) \ left ({\ begin {dizi} {cc} Q (t) & S (t ) \ \ S ^ {T} (t) & R (t) \ end {dizi}} \ sağ) \ left ({\ begin {dizi} {c} x (t) \\ u (t) \ end { dizi}} \ sağ) dt}fonksiyonları nerede , , süreklidir. Ama kimliğimiz var
t↦Q(t){\ displaystyle t \ Q'ya doğru \ sola (t \ sağ)}t↦R(t){\ displaystyle t \ Mapsto R \ sola (t \ sağ)}t↦S(t){\ displaystyle t \ mapsto S \ sol (t \ sağ)}
(xTsenT)(QSSTR)(xsen)=xT(Q-SRST)x+(sen+R-1STx)R(sen+R-1STx),{\ displaystyle \ left ({\ begin {array} {cc} x ^ {T} & u ^ {T} \ end {array}} \ right) \ left ({\ begin {array} {cc} Q&S \\ S ^ {T} & R \ end {dizi}} \ sağ) \ left ({\ begin {dizi} {c} x \\ u \ end {dizi}} \ sağ) = x ^ {T} \ left ( Q- SRS ^ {T} \ sağ) x + \ left (u + R ^ {- 1} S ^ {T} x \ sağ) R \ left (u + R ^ {- 1} S ^ {T} x \ sağ),}sonuç olarak değişkeni değiştirerek ve poz vererek önceki duruma geri dönülür .
v=sen+R-1STx{\ displaystyle v = u + R ^ {- 1} S ^ {T} x}Q1=Q-SRST{\ displaystyle Q_ {1} = Q-SRS ^ {T}}
Göreli Dinamiklere Uygulama
Bir kuvvet alanına yerleştirilmiş hareketsiz haldeki maddi bir kütle noktası düşünün . Kendimizi buraya yerleştirdiğimiz özel görelilik bağlamında eylem,
m0{\ displaystyle m_ {0}}U(x){\ displaystyle U (x)}
S(t0,tf)=∫t0tf(-m0vs21-‖sen‖2vs2-U(x))dt{\ displaystyle S \ sol (t_ {0}, t_ {f} \ sağ) = \ int _ {t_ {0}} ^ {t_ {f}} \ sol (-m_ {0} c ^ {2} { \ sqrt {1 - {\ frac {\ left \ Vert u \ right \ Vert ^ {2}} {c ^ {2}}}}} - U (x) \ sağ) dt}göz önüne alınan ortamdaki ışık hızı nerede ve nedir. Sözde Hamiltoniyen tarafından verilir
sen=x˙{\ displaystyle u = {\ dot {x}}}vs=vs(x){\ displaystyle c = c (x)}
H(x,sen,p′)=⟨p′|sen⟩+m0vs21-‖sen‖2vs2+U(x){\ displaystyle {\ mathcal {H}} \ sol (x, u, p ^ {\ prime} \ sağ) = \ sol \ langle p ^ {\ prime} | u \ sağ \ rangle + m_ {0} c ^ {2} {\ sqrt {1 - {\ frac {\ left \ Vert u \ right \ Vert ^ {2}} {c ^ {2}}}} + U (x)}.
Hamilton'un ilk kanonik denklemi verir sen=x˙{\ displaystyle u = {\ dot {x}}}
Sözde Hamiltoniyenin maksimizasyonu sette yapılır .
‖sen‖≤vs{\ displaystyle \ sol \ Yeşil u \ sağ \ Yeşil \ leq c}
1) Önce klasik durumu ele alalım . C hızı sabitse, Hamilton'ın ikinci kanonik denklemi
‖sen‖<vs{\ displaystyle \ sol \ Yeşil u \ sağ \ Yeşil <c}
p˙′=-∂U∂x{\ displaystyle {\ dot {p}} ^ {\ prime} = - {\ frac {\ kısmi U} {\ kısmi x}}}.
Maksimum ilkesi , dolayısıyla iyi bilinen ilişkiyi
ima eder.∂H∂sen=0{\ displaystyle {\ frac {\ kısmi {\ mathcal {H}}} {\ kısmi u}} = 0}
p=m01-‖sen‖2vs2sen{\ displaystyle p = {\ frac {m_ {0}} {\ sqrt {1 - {\ frac {\ left \ Vert u \ right \ Vert ^ {2}} {c ^ {2}}}}} u }burada sütun vektörü p , satır vektörünün devrikidir . 2) Şimdi nerede olduğunu düşünün . Bir öncekinden farklı olarak, bu durum normal varyasyon hesaplamasına girmez. Sözde Hamiltoniyen, ne zaman maksimumdur?
p′{\ displaystyle p ^ {\ prime}}‖sen‖=vs(x){\ Displaystyle \ sol \ Dikey u \ sağ \ Vert = c (x)}
p=‖p‖vs(x)sen{\ displaystyle p = {\ frac {\ sol \ Vert p \ sağ \ Vert} {c (x)}} u}ve Hamilton-Jacobi-Bellman denklemi eikonal denklem olur
∂S∂t+vs(x)‖∂S∂x‖+U(x)=0{\ displaystyle {\ frac {\ kısmi S} {\ kısmi t}} + c \ sol (x \ sağ) \ sol \ Vert {\ frac {\ kısmi S} {\ kısmi x}} \ sağ \ Vert + U (x) = 0},
klasik ne zaman .
U(x)=0{\ displaystyle U (x) = 0}
Notlar ve referanslar
Notlar
-
Pontryagin et al. 1962
-
Bellman 1957
-
Goldstine 1980
-
Gamkrelidze 1999
-
Pesh and Plail 2009
-
RV Gamkrelidze, Discovery of the Maximum Principle , J. of Dynamical and Control Systems, 5 (4), 85-99, 1999.
-
Clarke 1976
-
Clarke 1987
-
Vinter 2000
-
Gorecki, Fuksa ve Korytowski 1989
-
Li ve Yong 1994
-
Boltyanskii 1976
-
Bourlès 2004
-
Neustadt 1976 , §VII.4
-
Fleming ve Rishel 1975
-
Haussmann 1978
-
Vinter 2000 , Böl. 9
-
Clarke 1987 , Chap. 5
-
Lang 1995
-
Alexéev, Tikhomirov ve Fomin 1982
-
Mordukhovich bölüm 6.3
-
Fattorini 1999
-
Sussmann ve Willems 1997
-
Carathéodory 1999 , § 231
-
Carathéodory 1999 , §§ 232-241.
-
Petrovsky 1991
-
Kalman 1960
-
Durumu bir Hilbert uzayına ait olan bir sistemin durumu Lions 1968 tarafından ele alınmıştır.
-
Düzenlilik varsayımları genel duruma kıyasla zayıflatılabilir: bkz. Kalman, Falb ve Arbib 1969 , §3.5.
-
Anderson ve Moore 1989
-
Kwakernaak ve Sivan 1972
-
Daha fazla bilgi için LQ komutu makalesine bakın .
Metni oluşturmak için kullanılan işler
- V. Alexeev , V. Tikhomirov ve S. Fomine , Optimal kontrol Mir,1982, 447 s.
- (tr) Brian DO Anderson ve John B. Moore , Optimal Control , Prentice-Hall,1989, 391 s. ( ISBN 0-13-638651-2 )
- (tr) Richard Bellman , Dinamik Programlama , Princeton University Press,1957, 360 s. ( ISBN 0-486-42809-5 )
- LS Boltyanskii , Ayrık sistemlerin optimum kontrolü , Mir,1976, 467 s.
- Henri Bourlès , "Principe du maximum" , H. Abou-Kandil (yön.), Dinamik sistemlerin optimal kontrolü , Hermès-Science,2004( ISBN 2746209659 ) , "1", s. 15-70
- (en) Constantin Carathéodory , Varyasyon Hesabı ve Birinci Dereceden Kısmi Diferansiyel Denklemler , American Mathematical Society,1999, 402 s. ( ISBN 0-8218-1999-2 )
- (in) Frank H. Clarke , " Minimal Varsayımlar Altındaki Maksimum İlke " , SIAM J. Control Optim. , cilt. 14, n o 6,1976, s. 1078-1091
- (en) Frank H. Clarke , Optimization and Nonsmooth Analysis , Philadelphia, Society for Industrial & Applied Mathematics, ABD,1987, 308 s. ( ISBN 0-89871-256-4 , çevrimiçi okuyun )
- (en) Hector H. Fattorini , Infinite Dimensional Optimization and Control , Cambridge, Cambridge University Press,1999, 798 s. ( ISBN 0-521-45125-6 )
- (tr) Wendell Helms Fleming ve Raymond W. Rishel , Deterministik ve Stokastik Optimal Kontrol , Springer,1975, 222 s. ( ISBN 3-540-90155-8 )
- (en) RV Gamkrelidze , " Discovery of the Maximum Principle " , Journal of Dynamical and Control Systems , cilt. 5, n, o , 4,1999, s. 85-89
- (en) Herman H. Goldstine , A History of the Calculus of Variations from the17th - 19th Century , Springer-Verlag,1980, 410 s. ( ISBN 0-387-90521-9 )
- (içinde) I .M. Gelfand ve SV Fomin , Calculus Of Variations , New York, Dover Publications Inc.,2003, 232 s. ( ISBN 0-486-41448-5 )
- (en) Henrik Gorecki , Stanislaw Fuksa ve Adam Korytowski , Zaman Gecikme Sistemlerinin Analizi ve Sentezi , John Wiley & Sons,1989, 382 s. ( ISBN 0-471-27622-7 )
- (tr) UG Haussmann , " Stokastik Maksimum İlke Üzerine " , SIAM J. Kontrol ve Optimizasyon , cilt. 16, n o 21978, s. 236-269
- (tr) Rudolph E. Kalman , " Optimal Kontrol Teorisine Katkılar " , Boletin de la Sociedad Mathematica Mexicana , cilt. 5,1960, s. 102-119
-
(en) Rudolph E. Kalman , Peter L. Falb ve Michael A. Arbib , Matematiksel Sistem Teorisinde Konular , McGraw-Hill,1969, 358 s. ( ISBN 0-07-033255-X ).
- (tr) Huibert Kwakernaak ve Raphael Sivan , Doğrusal Optimal Kontrol Sistemleri , John Wiley & Sons Inc,1972, 575 s. ( ISBN 0-471-51110-2 )
- (tr) Serge Lang , Diferansiyel ve Riemann Manifoldları , New York, Springer-Verlag,1995, 364 s. ( ISBN 0-387-94338-2 , çevrimiçi okuyun )
- (en) Xunjing Li ve Jiongmin Yong , Sonsuz Boyutlu Sistemler için Optimal Kontrol Teorisi , Basel / Boston, Birkhäuser,1994, 448 s. ( ISBN 0-8176-3722-2 )
- (en) Jacques Louis Lions , Kısmi diferansiyel denklemler tarafından yönetilen sistemlerin optimum kontrolü , Dunod,1968
- BS Mordukhovich , Varyasyon Analizi ve Genelleştirilmiş Türev II: Uygulamalar , Springer,2006, 610 s. ( ISBN 978-3-540-25438-6 )
-
(tr) Lucien W. Neustadt , Optimizasyon, Gerekli Koşullar Teorisi , Princeton Univ. Basın,1976, 440 p. ( ISBN 0-691-08141-7 ).
- Robert Pallu de la Barrière , Teorik otomatik kurs , Dunod,1966
- (tr) Hans Joseph Pesh ve Michael Plail , " Optimum kontrolün maksimal ilkesi: Zekice fikirlerin ve kaçırılan fırsatların geçmişi " , Control and Cybernetics , cilt. 38, n o 4A,2009, s. 973-995 ( çevrimiçi okuyun )
-
(en) Ivan Georgievich Petrovsky , Kısmi Diferansiyel Denklemler , New York, Dover,1991245 p. ( ISBN 0-486-66902-5 , çevrimiçi okuyun ).
- (en) LS Pontryagin , VG Boltyansky , RV Gamkrelidze ve EF Mishchenko , The Mathematical Theory of Optimal Processes , Interscience,1962( ISBN 2-88124-077-1 )
- (tr) Hector J. Sussmann ve Jan C. Willems , " 300 Yıllık Optimal Kontrol: Brachystochrone'dan Maximal Principle " , IEEE Control Systems , cilt. 6,1997, s. 32-44
- (tr) Richard Vinter , Optimal Kontrol , Birkhäuser,2000, 500 p. ( ISBN 0-8176-4075-4 , çevrimiçi okuyun )
Diğer işler
- JF Bonnans ve P. Rouchon , Dinamik sistemlerin kontrolü ve optimizasyonu , Palaiseau, Editions de l'Ecole Polytechnique,2005, 280 p. ( ISBN 2-7302-1251-5 )
- (tr) Arthur E. Bryson ve Yu-Chi Ho , Applied Optimal Control (Revised Ed.) , Taylor & Francis Inc,1988, 496 s. ( ISBN 0-89116-228-3 )
İlgili Makaleler
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">