Lagrange Multiplier Demystified

Image via https://elements.envato.com under license to Naoki Shibuya

Have you ever wondered why we use the Lagrange multiplier to solve constrained optimization problems?

Is it just a clever technique?

사용하기가 매우 쉽기 때문에 마음으로 할 수있을 때까지 연습하여 기본 산술처럼 배웁니다.

하지만 왜 작동하는지 궁금한 적이 있습니까? 항상 작동합니까? 그렇지 않다면 왜 안됩니까?이 질문들에 대한 답을 알고 싶다면 올바른 장소에 있습니다.

나는 당신을 위해 그것을 신비화 할 것입니다.

예를 들어 제한된 최적화 문제

경우에 당신은 익숙하지 않은 제한을 최적화하는,내가 문서를 작성하는 설명합니다. 그렇지 않으면 계속 읽으십시오.

아래와 같이 보이는 산이 있다고 가정합니다:

Image by author using Grapher on macOS

The height of a location (x, y) is given as follows (in kilometers):

Further suppose, the mountain has an eruption:

Image by author using Grapher on macOS

From the top, it looks like below:

Image by author using Grapher on macOS

The eruption area is given as follows:

이 가장자리의 분화는 다음과 같이 지정됩니다.

므로,가장자리는 다음과 같습니다.

이미지는 저자가 사용하여 계기에 macOS

우리가 알고 싶어 최고의 위치에 분화에 이니다.

이미 최고 위치에 있어야 합니다 가장자리 라인의 분화할 수 있는 익스프레스는 다음과 같다:

어떤 위치(x, y)g(x, y)=0는의 가장자리에 분화.

따라서,제한된 최적화 문제를 찾는 것이 최대의f(x, y)g(x, y) = 0.

에 대한 직관 해결하는 방법을 제한된 최적화 문제

,직관적으로 우리가 알고 있는 최대 높이의 화산 폭발은 주변에는 파란색 화살표를 나타냅니다.

이미지는 저자가 사용하여 계기에 macOS

우리가 찾고 있는 가장 높은 윤곽 라인을 만지는 가장자리의 분화.

등고선 방정식을 정의합시다:

f(x, y) = H

H은 일정한 값을 나타내는 고도의 윤곽.

주어진 h 값에 대해(x, y)f(x, y) = H를 만족하는 값 집합이 있습니다.

f(x, y)의 그라데이션은 등고선에 수직 인 높이가 증가하는 방향을 나타냅니다.

Image by author using Grapher on macOS

The gradient is a vector of partial derivatives.

Similarly, the gradient of g(x, y) is perpendicular to the edge of the eruption area.

가장 높은 윤곽 라인을 만지는 가장자리의 분화가 있어야 합 그라데이션의f(x, y)g(x, y).

이미지로 저자

경우 그라데이션의 윤곽선에 평행으로 그라데이션의 분화가 될 것이 폭발이 지역에 위치하는 보다 높은 윤곽 라인입니다.

이미지로 저자

그 우리는 우리를 찾을 필요한 시점(x, y)f(x, y)g(x, y).

Lagrange 승수와 Lagrangian

우리의 목표를 수학 공식에 넣자.

그라데이션의f(x, y)g(x, y)해야에서 병렬하지만 그들은 서로 다른 크기와 방향입니다.

grad f(x, y) = λ grad g(x, y)

λ는 1788 년에 lagrangian mechanics 를 도입 한 수학자의 이름 뒤에 Lagrange multiplier 라고 불립니다.

요셉이-루이스 라그랑주(Wikipedia)

이 단계에서,우리는 알지 못한 가치의λ아무것도 될 수있는 다음과 같 2.5,-1,또는 다른입니다. 그것은 단지 두 그라디언트가 병렬로 있어야한다는 사실을 의미합니다.

우리는 다음과 같이 방정식을 재 배열 할 수 있습니다:

grad { f(x, y) - λ g(x, y) } = 0

여기서 0 은 0 이있는 벡터를 의미합니다.(0,0).

그리고 우리는 대괄호 내부를 LagrangianL라고 부릅니다.다음은 필수 조건이라고 말하고 있습니다.

grad L = 0

Lagrangian 의 그라디언트는 우리에게 두 가지 방정식을 제공합니다.

그러나 우리는 세 가지 미지수xy,andλ. 이 방정식을 어떻게 풀 수 있습니까?

실제로g(x, y) = 0인 방정식이 하나 더 있습니다.

따라서 제약 조건을 만족하는 가장 높은 위치(x, y)를 찾기 위해 세 방정식을 풀 수 있습니다.문제는 이제 산술 운동이됩니다.이 질문에 대한 답변은 다음과 같습니다.

이미지는 저자가 사용하여 계기에 macOS

을 확인할 수 있는 값과 함께 답변을 받으실 수 있습니다.

또한λ = -4/5이는 이러한 그라디언트가 예상대로 반대 방향임을 의미합니다.

모두 모두 Lagrange 승수는 제약 최적화 문제를 해결하는 데 유용합니다.

우리는 지점을 발견(x, y)λ.

에서 요약,우리를 따라 아래 단계:

  • 를 식별하는 기능을 최적화하는(극대화하거나 최소화):f(x, y)
  • 기능을 확인에 대한 제약 조건: g(x, y) = 0
  • 정의 LagrangianL = f(x, y) - λ g(x, y)
  • 를 해결grad L = 0제약 조건을 만족

그것은 기계적으로 위와 당신은 지금 알고 왜 그것을 작동합니다.그러나 언급해야 할 몇 가지 사항이 더 있습니다.

작동하지 않을 때

Lagrange 승수를 설명하면서 몇 가지 가정을했습니다.

첫째,내가 가정한 모든 기능이 있 그라디언트(최초의 유도체)의미하는 기능을f(x, y)g(x, y)은 지속적이고 부드럽습니다.

두 번째,내가 또한다고 가정하는f(x, y)(x, y)는 실제로 최대나지 않습니다.

이러한 두 가정은 진정한 이 예시에서 하지만 실제 문제를 확인해야 합니다 그게 사용할 수 있 Lagrange multiplier 를 해결하기 위해 제약 조건의 최적화 문제입니다.

셋째,질문을 단순화하여 하나의 최대 값만 처리하면됩니다.즉,산의 모양은 제한된 최적화 문제에 대한 해결책이 하나 뿐이되도록 정의됩니다.실생활의 문제에서 산은 여러 개의 봉우리와 계곡이있는 더 복잡한 모양을 가질 수 있습니다.

https://unsplash.com/@simonfitall

에서 같은 경우,우리가 다룰 필요가 글로벌 최적화 문제(즉,여러 지역 maxima).

대신이 기사의 예제는 전역 최대 값이기도 한 하나의 로컬 최대 값만 처리합니다.

이제 라그랑주 승수에 대한 이해가 최적이되기를 바랍니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다