Lagrange Multiplier Demystified

Image via https://elements.envato.com under license to Naoki Shibuya

Have you ever wondered why we use the Lagrange multiplier to solve constrained optimization problems?

Is it just a clever technique?

mivel nagyon könnyű használni, úgy tanuljuk meg, mint egy alapvető aritmetikát, gyakorolva, amíg szívből meg nem tudjuk csinálni.

de Gondolkozott már azon, hogy miért működik? Mindig működik? Ha nem, miért ne?

Ha meg szeretné tudni a válaszokat ezekre a kérdésekre, akkor a megfelelő helyen vagy.

demisztifikálom az Ön számára.

példa korlátozott optimalizálási probléma

abban az esetben, ha nem ismeri a korlátozott optimalizálásokat, írtam egy cikket, amely elmagyarázza. Ellenkező esetben kérjük, olvassa tovább.

tegyük fel, hogy van egy hegyünk, amely alul néz ki:

Image by author using Grapher on macOS

The height of a location (x, y) is given as follows (in kilometers):

Further suppose, the mountain has an eruption:

Image by author using Grapher on macOS

From the top, it looks like below:

Image by author using Grapher on macOS

The eruption area is given as follows:

Ez azt jelenti, hogy a kitörés szélét a következőképpen adjuk meg:

tehát az él így néz ki.

kép szerző Grapher segítségével macOSfigcaption>

tegyük fel, hogy meg akarjuk tudni a kitörés legmagasabb helyzetét ezen a hegyen.

Ez azt jelenti, hogy a legmagasabb pozíciónak a kitörés szélén kell lennie, amelyet a következőképpen fejezhetünk ki:

bármely hely (x, y), amely megfelel a g(x, y)=0 a kitörés szélén van.

ezért a korlátozott optimalizálási probléma a maximális f(x, y)g(x, y) = 0.

intuíció a korlátozott optimalizálási probléma megoldására

intuitív módon tudjuk, hogy a kitörés maximális magassága körül van, ahol a kék nyíl jelzi.

kép szerző segítségével Grapher macOSfigcaption>

a legmagasabb kontúrvonalat keressük, amely megérinti a kitörés szélét.

definiáljuk a kontúrvonal egyenletét:

f(x, y) = H

H a kontúr magasságát jelző állandó érték.

egy adott h érték esetén a (x, y) értékek halmaza megfelel a f(x, y) = Hértékeknek.

af(x, y) gradiens jelzi azt az irányt, ahol a magasság növekszik, ami merőleges a kontúrvonalra.

Image by author using Grapher on macOS

The gradient is a vector of partial derivatives.

Similarly, the gradient of g(x, y) is perpendicular to the edge of the eruption area.

a kitörés szélét érintő legmagasabb kontúrvonalnak f(x, y) a kitörés szélével párhuzamosang(x, y) gradiens.

a szerző képe

Ha a kontúrvonal gradiense nincs párhuzamosan a kitörési él gradiensével, akkor lesz néhány kitörési terület, amely a kitörés szélén található.magasabb, mint a kontúrvonal.

a szerző képe

tehát meg kell találnunk ezt a pontot (x, y)/div>ahol a f(x, y)gradiens párhuzamos a g(x, y) gradiensével.

A Lagrange szorzó és a Lagrangian

tegyük objektívünket egy matematikai képletbe.

af(x, y) gradiensének és ag(x, y) gradiensének párhuzamosnak kell lennie, de eltérő méretük és irányuk lehet.

grad f(x, y) = λ grad g(x, y)

ezt a λ Lagrange szorzónak nevezik annak a matematikusnak a neve után, aki 1788-ban bevezette a Lagrangiai mechanikát.

Joseph-Louis Lagrange (Wikipedia)

ebben a szakaszban nem ismerjük aami bármi lehet, mint 2.5, -1, vagy más. Ez csak azt jelenti, hogy a két színátmenetnek párhuzamosan kell lennie.

az egyenletet az alábbiak szerint lehet átrendezni:

grad { f(x, y) - λ g(x, y) } = 0

a nulla itt a nullákkal rendelkező vektort jelenti: (0,0).

és a göndör zárójelek belsejét Lagrangian L – nak nevezzük.

L = f(x, y) - λ g(x, y)

tehát azt mondjuk, hogy a következő a szükséges feltétel.

grad L = 0

a Lagrangian gradiense két egyenletet ad nekünk.

de három ismeretlenxyésλ. Hogyan oldhatjuk meg ezeket az egyenleteket?

valójában van még egy egyenletünk, amely a g(x, y) = 0.

tehát megoldhatjuk a három egyenletet, hogy megtaláljuk a legmagasabb helyet (x, y), amely kielégíti a kényszert.

a probléma most aritmetikai gyakorlatgá válik.

a válasz f(x, y) = 2 where x = 1 and y = 1.

kép szerző Grapher segítségével macOS

az egyenletekkel ellenőrizheti az értékeket.

továbbá, λ = -4/5 ami azt jelenti, hogy ezek a színátmenetek a várt módon ellentétes irányban vannak.

összességében a Lagrange szorzó hasznos a kényszer optimalizálási problémák megoldására.

megtaláljuk a(x, y) pontot, ahol az általunk optimalizált függvény gradiense és a kényszer függvény gradiense párhuzamosan van aλszorzóval.

összefoglalva az alábbi lépéseket követtük:

  • azonosítsa az optimalizálás (Maximalizálás vagy minimalizálás) funkcióját: f(x, y)
  • azonosítsa a kényszer funkcióját: g(x, y) = 0
  • határozza meg a Lagrangian L = f(x, y) - λ g(x, y)
  • grad L = 0

Ez olyan mechanikus, mint a fenti, És most már tudja, miért működik.

de van még néhány dolog, amit meg kell említeni.

ha nem működik

tettem néhány feltételezés, miközben elmagyarázza a Lagrange szorzó.

először is azt feltételeztem, hogy minden függvénynek van színátmenete (az első derivatívák), ami azt jelenti, hogy a f(x, y) és g(x, y) folytonos és sima.

második, azt is feltételezem, hogy a f(x, y) rendelkezik a második származékokkal, így ellenőrizhetjük, hogy a megoldás (x, y) valójában a maximális vagy sem.

Ez a két feltételezés igaz ebben a példában, de valós problémák esetén ellenőrizze, hogy képes-e használni a Lagrange szorzót a kényszer optimalizálási probléma megoldásához.

harmadszor egyszerűsítettem a kérdést, hogy csak egy maximummal kell foglalkoznunk.

más szóval, a hegy alakja úgy van definiálva, hogy a korlátozott optimalizálási problémára csak egy megoldás létezik.

valós problémák esetén a hegynek bonyolultabb alakzatai lehetnek, több csúcsával és völgyével.

https://unsplash.com/@simonfitall

ebben az esetben foglalkoznunk kell a globális optimalizálási problémával (azaz több helyi maxima).

ehelyett a cikkben szereplő példa csak egy helyi maximummal foglalkozik, amely szintén a globális maximum.

remélem, hogy a Lagrange szorzó megértése most optimális.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük