Understanding why it works
Have you ever wondered why we use the Lagrange multiplier to solve constrained optimization problems?
Is it just a clever technique?
사용하기가 매우 쉽기 때문에 마음으로 할 수있을 때까지 연습하여 기본 산술처럼 배웁니다.
하지만 왜 작동하는지 궁금한 적이 있습니까? 항상 작동합니까? 그렇지 않다면 왜 안됩니까?이 질문들에 대한 답을 알고 싶다면 올바른 장소에 있습니다.
나는 당신을 위해 그것을 신비화 할 것입니다.
예를 들어 제한된 최적화 문제
경우에 당신은 익숙하지 않은 제한을 최적화하는,내가 문서를 작성하는 설명합니다. 그렇지 않으면 계속 읽으십시오.
아래와 같이 보이는 산이 있다고 가정합니다:
The height of a location (x, y) is given as follows (in kilometers):
Further suppose, the mountain has an eruption:
From the top, it looks like below:
The eruption area is given as follows:
이 가장자리의 분화는 다음과 같이 지정됩니다.
므로,가장자리는 다음과 같습니다.
우리가 알고 싶어 최고의 위치에 분화에 이니다.
이미 최고 위치에 있어야 합니다 가장자리 라인의 분화할 수 있는 익스프레스는 다음과 같다:
어떤 위치(x, y)
g(x, y)=0
는의 가장자리에 분화.
따라서,제한된 최적화 문제를 찾는 것이 최대의f(x, y)
g(x, y) = 0
.
에 대한 직관 해결하는 방법을 제한된 최적화 문제
,직관적으로 우리가 알고 있는 최대 높이의 화산 폭발은 주변에는 파란색 화살표를 나타냅니다.
우리가 찾고 있는 가장 높은 윤곽 라인을 만지는 가장자리의 분화.
등고선 방정식을 정의합시다:
f(x, y) = H
H
은 일정한 값을 나타내는 고도의 윤곽.
주어진 h 값에 대해(x, y)
f(x, y) = H
를 만족하는 값 집합이 있습니다.
f(x, y)
의 그라데이션은 등고선에 수직 인 높이가 증가하는 방향을 나타냅니다.
The gradient is a vector of partial derivatives.
Similarly, the gradient of g(x, y)
is perpendicular to the edge of the eruption area.
가장 높은 윤곽 라인을 만지는 가장자리의 분화가 있어야 합 그라데이션의f(x, y)
g(x, y)
.
경우 그라데이션의 윤곽선에 평행으로 그라데이션의 분화가 될 것이 폭발이 지역에 위치하는 보다 높은 윤곽 라인입니다.
그 우리는 우리를 찾을 필요한 시점(x, y)
f(x, y)
g(x, y)
.
Lagrange 승수와 Lagrangian
우리의 목표를 수학 공식에 넣자.
그라데이션의f(x, y)
g(x, y)
해야에서 병렬하지만 그들은 서로 다른 크기와 방향입니다.
grad f(x, y) = λ grad g(x, y)
이λ
는 1788 년에 lagrangian mechanics 를 도입 한 수학자의 이름 뒤에 Lagrange multiplier 라고 불립니다.
이 단계에서,우리는 알지 못한 가치의λ
아무것도 될 수있는 다음과 같 2.5,-1,또는 다른입니다. 그것은 단지 두 그라디언트가 병렬로 있어야한다는 사실을 의미합니다.
우리는 다음과 같이 방정식을 재 배열 할 수 있습니다:
grad { f(x, y) - λ g(x, y) } = 0
여기서 0 은 0 이있는 벡터를 의미합니다.(0,0)
.
그리고 우리는 대괄호 내부를 LagrangianL
라고 부릅니다.다음은 필수 조건이라고 말하고 있습니다.
grad L = 0
Lagrangian 의 그라디언트는 우리에게 두 가지 방정식을 제공합니다.
그러나 우리는 세 가지 미지수x
y
,andλ
. 이 방정식을 어떻게 풀 수 있습니까?
실제로g(x, y) = 0
인 방정식이 하나 더 있습니다.
따라서 제약 조건을 만족하는 가장 높은 위치(x, y)
를 찾기 위해 세 방정식을 풀 수 있습니다.문제는 이제 산술 운동이됩니다.이 질문에 대한 답변은 다음과 같습니다.
을 확인할 수 있는 값과 함께 답변을 받으실 수 있습니다.
또한λ = -4/5
이는 이러한 그라디언트가 예상대로 반대 방향임을 의미합니다.
모두 모두 Lagrange 승수는 제약 최적화 문제를 해결하는 데 유용합니다.
우리는 지점을 발견(x, y)
λ
.
에서 요약,우리를 따라 아래 단계:
- 를 식별하는 기능을 최적화하는(극대화하거나 최소화):
f(x, y)
- 기능을 확인에 대한 제약 조건:
g(x, y) = 0
- 정의 Lagrangian
L = f(x, y) - λ g(x, y)
- 를 해결
grad L = 0
제약 조건을 만족
그것은 기계적으로 위와 당신은 지금 알고 왜 그것을 작동합니다.그러나 언급해야 할 몇 가지 사항이 더 있습니다.
작동하지 않을 때
Lagrange 승수를 설명하면서 몇 가지 가정을했습니다.
첫째,내가 가정한 모든 기능이 있 그라디언트(최초의 유도체)의미하는 기능을f(x, y)
g(x, y)
은 지속적이고 부드럽습니다.
두 번째,내가 또한다고 가정하는f(x, y)
(x, y)
는 실제로 최대나지 않습니다.
이러한 두 가정은 진정한 이 예시에서 하지만 실제 문제를 확인해야 합니다 그게 사용할 수 있 Lagrange multiplier 를 해결하기 위해 제약 조건의 최적화 문제입니다.
셋째,질문을 단순화하여 하나의 최대 값만 처리하면됩니다.즉,산의 모양은 제한된 최적화 문제에 대한 해결책이 하나 뿐이되도록 정의됩니다.실생활의 문제에서 산은 여러 개의 봉우리와 계곡이있는 더 복잡한 모양을 가질 수 있습니다.
에서 같은 경우,우리가 다룰 필요가 글로벌 최적화 문제(즉,여러 지역 maxima).
대신이 기사의 예제는 전역 최대 값이기도 한 하나의 로컬 최대 값만 처리합니다.
이제 라그랑주 승수에 대한 이해가 최적이되기를 바랍니다.