- 소개
- 규칙의 확률
- 확률 규칙(모든 이벤트에 대한 A,0≤P(A)≤1)
- 확률 규칙을 두(의 합의 확률이 가능한 모든 결과 1)
- 확률 규칙을 세(보완 규칙)
- 확률을 포함한 여러 이벤트
- 확률 규칙 네 가지(추가 규칙에 대한 연결이 끊긴 이벤트)
- 발견 P(A,B)논리를 사용하여
- 확률 규칙 섯(일반 또한 규칙)
- 반올림 엄지손가락의 규칙에 대한 확률
- 하자 요약
이전 섹션에서,우리가 도입 확률하는 방법으로 정량화 불확실성에서 발생하는 실험을 실시하여 임의의 샘플에서 인구의 관심입니다.
우리는 확률의 이벤트가(예를 들어,이벤트가 무작위로 선택된 사람은 혈액형 O)추정할 수 있습니다 상대적으로 빈도는 이벤트 발생 시에서 오랜 시리즈는 많은 시험이 있었습니다. 그래서 우리는 것이 데이터를 수집하에서 개인의 많은 확률을 추정하기 위해 누군가는 혈액형 O.
이 섹션에서,우리는 설정의 기본적인 방법과 원리를 찾기위한 확률의 이벤트입니다.
우리는 또한 확률을 계산하는 데 사용할 수있는 확률의 기본 규칙 중 일부를 다룰 것입니다.
소개
우리는 우리 것을 시작으로 고전적인 확률의 예를 던지는 공정한 동전 세 번입니다.
때문에 머리와 꼬리는 동등성에 대한 각각의 토스에서 이 시나리오,각각의 가능성에서 발생할 수있는 세 개의 던진 것입니다 또한 동등하게 할 가능성이 그래서 우리가 할 수 있는 목록이 가능한 모든 값을 이 목록을 사용하여 계산하는 확률.
때문에 우리의 초점에서 이 과정에서 데이터 통계(지 않은 이론 확률),에서 가장 우리의 미래의 문제는 우리가 사용할 것이 요약된 데이터 집합,일반적으로 주파수 테이블이나 두 방법으로 테이블,계산 확률.
예: 을 던져 공정한 동전 세 번
자의 목록을 각각의 가능한 결과(또는 가능한 결과):
{HHH,THH,HTH,HHT,HTT,THT,TTH,TTT}
지금의 정의를 다음과 같은 이벤트가 있습니다.
이벤트:”아 H”
이벤트 B: “얻는 정확하게 하나 H”
이벤트 C:”최소한 한 개의 H”
참고 각 이벤트 참으로 문 결과에 대해 실험을 생성하기 위하여 가고 있다. 실제로 각 이벤트는 가능한 결과의 일부 수집(하위 집합)에 해당합니다.이벤트 A:”No H 얻기”→TTT
이벤트 B: “얻는 정확하게 하나 H”→HTT,THT,TTH
이벤트 C:”최소한 한 개의 H”→HTT,THT,TTH,THH,HTH,HHT,HHH
여기에서 시각적으로 표현한 이벤트, B and C.
에서 이 시각적으로 표현한 이벤트,그것은 쉽게 볼 수 있는 이벤트 B 는 완전히에 포함되 이벤트 C,는 의미에서 모든 결과에서는 이벤트 B 한 결과에서는 이벤트 C. 또한,이벤트는 의미에서 떨어져 이벤트 B,C,는 의미에서 그들은 아무 결과에서는 일반적인,또는 겹치는 부분이 없습니다. 이 시점에서 이것들은 주목할만한 관찰 일 뿐이지 만 나중에 발견 할 수 있듯이 매우 중요한 것들입니다.
새 이벤트를 추가 한 경우 어떻게해야합니까?
이벤트 D: “첫 번째 토스에서 T 를 얻는 것”→THH,THT,TTH,TTT
위의 다이어그램에 이벤트 D 를 추가하면 어떻게 보입니까? (에 대한 링크를 응답이)
기억하기 때문 H T 은 동등하게 할 가능성이 각각에 던지고 있기 때문에 8 가능한 결과 확률은 각각의 결과이 1/8.
볼 수 있으면 다음과 같은 질문에 대답을 사용하여 다이어그램 및/또는 목록의 결과를 위해 각 이벤트와 함께 당신이 배운 것에 대해 지금까지 확률입니다.
수 있었다면 그 질문에 대답이 제대로,당신은 가능성이 좋은 본능에 대한 계산 확률! 우리가이 지식을 어떻게 적용 할 것인지를 배우기 위해 계속 읽으십시오.그렇지 않은 경우이 섹션에서이 기술을 개발할 수 있도록 노력할 것입니다.
논평:
- 이벤트 C”점점에서 하나 이상의 머리는”단 하나의 가능한 결과가 없,”점점 더 머리”=TTT. 우리는 확률 규칙,특히 보완 규칙에 대해 이야기 할 때이를 다시 다룰 것입니다. 이 시점에서,우리는 단지 당신이이 시나리오에서 어떻게이 두 사건이”반대”인지 생각하기를 원합니다.
그것은 매우 중요하다는 것을 깨닫 다만 우리가 할 수 있기 때문에 목록으로 가능한 결과,이 의미하지 않는 각각의 결과에 동등하게 높습니다.
이것은 우리가 이전 페이지에서 제공 한 데일리 쇼 클립의(재미있는)메시지입니다. 그러나 이것에 대해 다시 생각해 봅시다. 그 클립에서 월터는 두 가지 가능한 결과가 있기 때문에 확률은 0.5 라고 주장하고 있습니다. 두 가능한 결과는
- 세계를 파괴 될 것이 사용하기 때문에 큰 hadron collider
- 세계가 파괴되지 않을 사용하기 때문에 큰 hadron collider
희망이 있는 것이 분명 이러한 두 가지 결과가 동등하지 않게 가능성!!더 일반적인 예를 생각해 봅시다.
예:출생 결함
우리가 무작위로 선택한 세 명의 어린이가 관심이 있는 확률이 없는 아이들이 어떤 결함이 출생.
우리는 표기법 D 를 사용하여 출생 결함으로 태어난 아이를 나타내고 n 은 출생 결함이없는 태어난 아이를 나타냅니다. 우리 목록이 가능한 결과로 우리가 동전 던지기,그들은 다음과 같습니다.
{DDD,카페,DND,를 종료하고 해당,DNN,NDN,역사는 양동이 들,NNN}
은 이벤트 DDD(세 가지 모든 아이들은 제)과 NNN(없음의 어린이는 제)동일 가능성이 있을까요?
P(NNN)가 P(DDD)보다 훨씬 크다는 것이 당신에게 합리적이어야합니다.이것은 p(N)와 P(D)가 똑같이 가능성이있는 이벤트가 아니기 때문입니다.
무작위로 선택된 아이가 출생 결함으로 태어나는 것은 드뭅니다(확실히 50%가 아님).
확률의 규칙
이제 우리는 확률의 기본 규칙 중 일부를 학습으로 이동합니다.
다행히도 이러한 규칙은 매우 직관적이,그만큼 그들이 적용된 체계적으로,그들은 우리가 해결해 더 복잡한 문제이며,특히 사람들 문제는 우리의 직관이 될 수도 불충분하다.
이후 대부분의 가능성을 발견하게됩 계산할 수 있다 모두 사용하여
- 논리와 세
- 규칙을 우리가 배우는 것입니다,
우리는 우리에게 다음과 같은 조언으로 원칙으로 합니다.
원리:
경우에 당신은 계산할 수 있는 확률을 사용하여 논리와 계산이 필요하지 않습 확률 규칙(지만 정확한 규칙이 적용될 수 있습니다 항상)
확률 규칙을 하나의
우리의 첫번째 규칙이 단순히 우리가 생각나의 기본 속성을 확률의는 우리는 이미 배웠습니다.
확률의 이벤트를 알려주는 미국의 그것의 가능성이 발생할 수 있는 범위에서 어디서나 0(을 나타내는 이벤트 발생하지 않을 것입니다)1(을 나타내는 이벤트가 특정).
확률 규칙 1:
- 임의의 이벤트 A,0≤P(A)≤1.
참고:하나는 실용적인 이용 규칙은 그것을 식별하는 데 사용할 수 있는 모든 확률을 계산하는 것으로 나온 이상 1(또는 0 보다)으로 잘못되었습니다.
로 이동하기 전에 다른 규칙,의 첫 번째 예를 살펴을 제공하는 상황을 설명하기 위한 다음 여러 가지 규칙이 있습니다.
예:혈액형
앞에서 설명한 대로 모든 인간의 혈액 입력할 수 있으 O,A,B 또는 AB.또한 이러한 혈액형의 발생 빈도는 인종 및 인종 그룹에 따라 다릅니다.
스탠포드 대학의 혈액 센터(bloodcenter.스탠포드.edu),이들은 확률이 인간의 혈액의 유형은 미국에서(에 대한 확률이 입력한 생략되었습에 목적):
기 질문에 대한 규칙 2:는 사람이 미국에서 임의로 선택됩니다. 그 사람이 혈액형 a 를 가질 확률은 얼마입니까?
답변: 우리의 직감 우리에게 그 이후 네 혈액형 O,A,B,AB 배기 모든 가능성을,그들이 확률이 함께해야 합 1,확률”특정”이벤트(사람의 하나 이러한 4 혈액형에 대한 특정).
이후의 확률 O,B,AB 함께 합계 0.44 + 0.1 + 0.04 =0.58,확률의 입력해야 될 나머지 0.42 (1 – 0.58 = 0.42):
확률 규칙을 두
이 예제는 우리의 두 번째 규칙이 우리에게는 확률이 가능한 모든 결과 함께해야 합니다 1.
확률 규칙을 두:
의 합의 확률이 가능한 모든 결과입니다 1.
이것은 좋은 장소를 비교하고 대조 지금 우리가 하는 일과 우리가 무엇을 배운에서 예비 데이터 분석(EDA)섹션입니다.
- 이 문제에서 우리는 본질적으로 단일 범주 변수 인 혈액형에 초점을 맞추고 있음을 알 수 있습니다.
- 우리는 우리를 요약 이 변수 위로 우리를 요약 하나의 범주형 변수에 EDA 섹션을 나열하여 어떤 값을 변수는 얼마나 자주 걸리는 그들.
- EDA 에서 우리는 백분율을 사용했으며 여기서는 확률을 사용하고 있지만 두 가지는 동일한 정보를 전달합니다.
- 에 EDA 섹션에서,우리는 것을 배웠 파이 차트로 제공하는 적절한 경우 표시 하나의 범주형 변수,참여와 마찬가지로 우리가 사용할 수 있습니다 그것은 여기에서(백분율을 사용하는 대신 확률):
지만 지금 우리가 하는 일은 참으로 유사하에게 무슨 짓을했는지에 EDA 섹션이 있지만 중요한 차이점 근본적인 상황
- 에 EDA,우리는 우리로 요약된 데이터에서 얻을 수 있었의 예제는 개인을 위해 누구의 가치는 변수의 관심이 기록되었다.
- 여기 할 때,우리는 현재 확률은 각각의 혈액형,우리는 마음에서는 전체 populationof 미국에 있는 사람들을 위해,우리가 추정 알고의 전반적인 주파수 값에 의해 촬영 변수입니다.
확률 규칙을 세
에서 확률 및 그 응용 프로그램,우리는이 자주 찾는 데 관심이 확률는 특정 이벤트가 발생하지 않습니다.
중요한 점을 이해하는 여기에는”이벤트가 발생하지 않”를 별도 이벤트로 구성되는 가능한 모든 결과에 없는고”라고 보완하는 이벤트의 A.”
Notation:우리를 쓸 것이”아니”에 나타내는 이벤트가 발생하지 않습니다. 다음은 이벤트 A 와 그 보완 이벤트”not A”가 함께 모든 가능한 결과를 나타내는 방법에 대한 시각적 표현입니다.
주석:
- 이러한 시각적 표시를”Venn 다이어그램”이라고합니다.”벤 다이어그램은 직사각형과 원을 사용하여 이벤트와 그 사이의 관계를 시각화하는 간단한 방법입니다.
규칙 3 은 사건의 확률과 그 보완 사건의 확률 사이의 관계를 다룬다.
주어진 이벤트 및 이벤트는”아닙니다”함께 가능한 모든 결과,그리고 이후 규칙 2 우리에게 알려줍의 합의 확률이 가능한 모든 결과는 1,다음 규칙을 수도:
확률 규칙을 세(보완 규칙):
- P(아) =1–P(A)
- 는 확률는 이벤트가 발생하지 않은 1 마이너스는 확률가 발생합니다.
예:혈액형
다시 혈액형 예제:
여기에 몇 가지 추가 정보:
- 사람과 함께 입력할 수 있는 혈액을 기부하는 사람과 함께 유형 A 또는 AB.
- b 형을 가진 사람은 b 형 또는 AB 형을 가진 사람에게 혈액을 기증 할 수 있습니다.
- ab 형 인 사람은 ab 형 인 사람에게만 혈액을 기증 할 수 있습니다.
- o 형 혈액을 가진 사람은 누구에게나 기증 할 수 있습니다.
무작위로 선택한 사람이 모든 사람에게 혈액을 기증 할 수없는 확률은 얼마입니까? 다른 말로하면,무작위로 선택된 사람이 혈액형 O 를 갖지 않을 확률은 얼마입니까? 우리는 P(o 가 아닌)를 찾아야합니다. 보완 규칙을 사용하여 P(o 가 아님)=1–P(O)=1–0.44=0.56. 다시 말해서,56%은 미국 인구의하지 않는 혈액형 O
명확하고,우리가 할 수도 찾 P(지 않 O)에 직접 추가하여 확률 B,AB,A.
댓글:
- 보완 규칙 인 P(a 가 아님)=1–P(A)는 P(A)=1-P(a 가 아님)로 다시 공식화 될 수 있습니다.
- P(a 가 아님)=1–P(A)
- 는 P(A)=1-P(a 가 아님)로 재 공식화 될 수 있습니다.
- 이 겉으로는 사소한 대수적 조작이 중요한 응용 프로그램,그리고 실제로 캡쳐 강도의 보완 규칙이 있습니다.
- 어떤 경우에,을 찾을 때 P(A)직접 매우 복잡할 수 있습이 훨씬 쉽게 찾을 수 있 P 지 않는(A)다음 단지 그것을 빼서 1 원하는 P(A).
- 우리는 곧이 주석으로 돌아와 추가 예제를 제공 할 것입니다.
- 보완 규칙이 유용할 수 있습할 때마다 더 쉽게 계산하는의 가능성을 보완하의 이벤트가 아닌 이벤트 자체.
- 공지 사항,우리는 다시”적어도 하나”라는 문구를 사용했습니다.”
- 이제 우리는”적어도 하나…”의 보완이”없음…”또는”아니오….”(우리가 이전에”반대”인 사건의 관점에서 언급했듯이).
- 위의 활동에 우리가 보는
- P(이러한 두 가지 부작용)=1–P(적어도 하나의 이러한 두 가지 부작용)
- 이것은 일반적인 응용 프로그램의 보완 규할 수 있는 종종 인해 구문에서”적어도 하나의”에서 문제입니다.
확률을 포함한 여러 이벤트
우리는 것이 자주 찾는 데 관심이 있을 확률을 포함한 여러 이벤트와 같이
- P(A 또는 B)=P(이벤트가 발생하거나 발생 이벤트 B 또는 모두가 발생)
- P(A,B)=P(모두 이벤트가 발생 및 이벤트 B 발생합니다)
일반적인 문제는 용어와 관련하여 어떻게 우리는 보통 생각한다”또는”우리의 일상 생활에서. 예를 들어,부모가 장난감 가게에서 자녀에게”장난감 a 또는 장난감 B 를 원하십니까?”,이것은 아이가 단 하나의 장난감을 얻으려고하고 그 또는 그녀가 그들 사이에서 선택해야한다는 것을 의미합니다. 두 장난감을 모두 얻는 것은 일반적으로 옵션이 아닙니다.
에 대비:
에서 확률,”또는”의 뜻은 하나 또는 다른니다.
etc P(A 또는 B)=P(이벤트가 발생하거나 발생 이벤트 B 또는 모두가 발생)
는 말했다,그것은 주목해야한다는 몇 가지의 경우 단순히 불가능한 두 개의 이벤트는 모두가 동시에 수행됩니다.
확률 규칙 네
사이를 구별할 수 있는 이벤트가 함께 발생하고 그 수 없는 중요합니다.나는 이것을 할 수 없다.: 동시에 발생할 수없는 두 가지 이벤트를 분리 또는 상호 배타적이라고합니다. (우리는 분리 된 것을 사용할 것입니다.)
해야에서 명확한 그림을 그
- 첫 번째 경우에는 행사되지 않은 분리,P(A,B)≠0
- 두 번째 경우에는 이벤트는 연결이 끊긴 P(A,B)=0.
다음은 두 가지 예입니다.
예제:
고려 다음과 같은 두 가지 이벤트:.
A—무작위로 선택된 사람은 혈액형,그리고
B—무작위로 선택된 사람은 혈액형 B.
드문 경우에,그것은 가능한 한 사람의 하나 이상의 형식을 통해 흐르는 혈액의 혈관,그러나 우리의 목적을 위해, 우리는다고 가정하고 각 사람이 하나만 있을 수 있습니다. 따라서 이벤트 A 와 B 가 함께 발생하는 것은 불가능합니다.
- 이벤트 A 와 B 는 분리 된
반면에…
예:
고려 다음과 같은 두 가지 이벤트:.
A—무작위로 선택된 사람은 혈액형
B—무작위로 선택된 사람은 여자입니다.
이 경우 이벤트 A 와 B 가 함께 발생할 수 있습니다.
- 이벤트 A 와 B 는 분리되지 않습니다.
벤 다이어그램을 제안하는 또 다른 방법에 대해 생각 연결되지 않은 대지 연결이 끊긴 이벤트는 연결이 끊긴 이벤트이 겹치지 않도록 해야 합니다. 그들은 가능한 결과 중 하나를 공유하지 않으므로 함께 일어날 수 없습니다.반면에 분리되지 않은 이벤트는 가능한 결과 중 일부를 공유하므로 동시에 발생할 수 있다는 의미에서 중복됩니다.
이제 분리 된 이벤트에 대한 P(A 또는 B)를 찾는 간단한 규칙으로 시작합니다.
확률 규칙 네 가지(추가 규칙에 대한 연결이 끊긴 이벤트가):
- 경우 A B 은 연결이 끊긴 이벤트,그 P(A 또는 B)=P(A)+P(B).
논평:
- 다룰 경우 확률을 단어는”또는”항상의 운영과 관련된 추가; 따라서이 규칙의 이름은”추가 규칙.”
예:혈액형
리콜 혈액형 예제:
여기에 몇 가지 추가 정보
- 사람과 함께 유형 Acan 혈액을 기부하는 사람과 함께 유형 A 또는 AB.
- b 형이있는 사람은 b 형 또는 AB 형 사람에게 혈액을 기증 할 수 있습니다.
- 사람과 함께 유형 ABcan 혈액을 기부하는 사람이 가진 AB 형
- 사람과 함께 유형 Oblood 기증할 수 있습니다.
무작위로 선택된 사람이 혈액형 A 를 가진 사람의 잠재적 기증자 일 확률은 얼마입니까?
에서 주어진 정보,우리가 알고 있는 잠재적인 사람을 위한 기증자와 혈액형을 갖는 것을 의미한 혈액형 또는 O.
따라서 우리는 우리를 찾을 필요 P(또는 O). 이후 이벤트와 O 은 떨어져 있습니다,우리가 사용할 수 있습니다 추가 규칙에 대한 연결이 끊긴 이벤트:.
- P(또는 O)=P(A)+P(O)=0.42+0.44=0.86.
확률을 추가하는 것이 실제로 왜 의미가 있는지 쉽게 알 수 있습니다.
경우 42%의 인구는 혈액형이 44%의 인구가 혈액형 O
- 그 42%+44%=86%의 인구 중 하나 혈액형 또는 O,따라서는 잠재적인 기부하는 사람과 함께 혈액형 A.
이론에 대한 규칙을 의미할 수 있를 사용하여 시각 파이 차트 below:
논평:
- 추가 규칙에 대한 연결이 끊긴 이벤트할 수 있는 자연스럽게 확장하여 두 개 이상의 연결이 끊긴 이벤트입니다. 예를 들어 세 가지를 보자. A,B 및 C 가 3 개의 분리 된 이벤트 인 경우
P(A 또는 B)=P(A)+P(B)+P(C). 규칙은 임의의 수의 분리 된 이벤트에 대해 동일합니다.
우리는 지금은 완성되는 첫 번째 버전과의 추가 규칙(규칙 네)어떤 버전에 제한 끊긴 이벤트입니다. 두 번째 버전을 다루기 전에 먼저 P(A 와 B)에 대해 논의해야합니다.
발견 P(A 및 B)을 이용하여 로직
우리는 지금 계산
- P(A,B)=P(모두 이벤트가 발생하고 발생 이벤트 B)
이후,우리는 것입니다 토론 규칙을 계산하기 위한 P(A,B).먼저 논리와 카운팅을 통해 답을 결정할 수있을 때마다 규칙이 필요하지 않음을 설명하고자합니다.
특별한 경우:
있는 하나의 특별한 경우로 우리가 알고있는 무엇 P(A,B)은 적용하지 않고 어떤 규칙이 있습니다.다음 작업을 수행하여 학습합니다.: P(A 와 B)찾기#1
따라서 이벤트 A 와 B 가 분리되면(정의에 따라)P(A 와 B)=0 입니다. 그러나 이벤트가 분리되지 않으면 어떻게해야합니까?
추가 규칙 인 규칙 4 에는 두 가지 버전이 있음을 상기하십시오. 하나는 우리가 이미 다루었던 분리 된 이벤트로 제한되며,이 모듈의 뒷부분에서보다 일반적인 버전을 다룰 것입니다. 그리고
를 포함하는 확률에 대해서도 마찬가지입니다.그러나 특별한 경우를 제외하고는이 과정에서 P(A 및 B)를 찾기 위해 논리에 의존 할 것입니다. 공식적인 규칙을 다루기 전에 이벤트가 분리되지 않은 예를 살펴 보겠습니다.
예:치의 상태와 성
다음에 관한 치주는 상태의 개인 및 그들의 성. 치주 상태는 개인이 건강하거나 치은염이 있거나 치주 질환이있는 것으로 분류되는 잇몸 질환을 말합니다.
우리는 c→C 의 경우 데이터 분석에 대해 논의했을 때 전에 이러한 유형의 테이블을 보았습니다. 이 질문의 목적으로이 데이터를 우리의”인구”로 사용하고 무작위로 한 사람을 선택하는 것을 고려할 것입니다.
우리는 같은 요청하는 확률과 유사한 질문에 이전 예(를 사용하여 두 개의 방법으로 테이블 데이터를 기반으로) 로 이것은 당신 사이의 연결을 만들기 위해 이러한 주제를 유지하는 데 도움이 일부는 당신이 무엇을 배운 데이터에 대한 신선에 당신의 마음입니다.
확률 규칙 5
이제 추가 규칙의 확장 버전으로 이동할 준비가되었습니다.
이 섹션에서는 A 와 B 가 반드시 분리되지 않을 때 P(A 또는 B)를 찾는 방법을 배우게됩니다.
- 우리는이 확장 버전을”일반 추가 규칙”이라고 부르며 확률 규칙 5 로 명시 할 것입니다.
우리는 우리 것이에 의해 시작을 알리는 규칙과 예제를 제공하와 유사한 유형의 문제는 우리는 일반적으로 묻는다. 그런 다음 샘플에서 작업 할 원시 데이터가없는 또 다른 예를 제시 할 것입니다.
확률 규칙 5:
- 일반 추가 규칙:P(A 또는 B)=P(A)+P(B)–P(A 및 b).
참고:논리를 사용하여 다른 수식이 아닌 P(A 및 B)를 찾는 것이 가장 좋습니다.
매우 일반적인 오류가 잘못 적용하는 곱셈 규칙에 대한 독립적인 사건에서 다음 페이지로 이동합니다. 이 올바른 경우 그리고 B 독립(보 정의를 따라하)이는 거의 경우에 제공되는 데이터는 두 개의 방법으로 테이블이 있습니다.
이전 예제에서 목격했듯이 두 이벤트가 분리되지 않을 때 이벤트 사이에 약간의 중복이 있습니다.
- 경우 우리는 단순히 추가 두 가지 확률 함께,우리는 것이 잘못된 응답을 얻을하기 때문에 우리가 계산되는 일부”확률”두 번!
- 따라서 정답에 도착하려면이”추가”확률을 빼야합니다. 벤 다이어그램과 양방향 테이블은이 아이디어를 시각화하는 데 도움이됩니다.
이 규칙은 모든 이벤트 쌍(심지어 분리 된 이벤트)에 대해 작동하기 때문에 더 일반적입니다. 우리의 조언은 여전히려고 질문에 대답을 사용하여 논리와 계산이 가능할 때마다 그렇지 않으면,우리는 매우 조심해야 할 올바른 선택에 대한 규칙이 문제입니다.
원리:
경우에 당신은 계산할 수 있는 확률을 사용하여 논리와 계산이 필요하지 않습 확률 규칙(지만 정확한 규칙이 적용될 수 있습니다 항상)
통지하는 경우,그리고 B 은 떨어져 있습니다,그 P(A,B)=0 과 규칙 5 을 감소하는 규칙 4 이를 위해 특별한 경우입니다.
의 다시 마지막 예:
예:치의 상태와 성
고려하이 무작위로 선택하면 중 하나에서 개별적으로 표현들에서는 다음 테이블에 관한 치주는 상태의 개인 및 그들의 성. 치주 상태는 개인이 건강하거나 치은염이 있거나 치주 질환이있는 것으로 분류되는 잇몸 질환을 말합니다.
지금까지 배운 것을 검토합시다. 우리가 계산할 수 있습니다 모든 확률이 시나리오에서는 우리가 결정할 수 있는 얼마나 많은 사람들을 만족 이벤트 또는 조합의 이벤트입니다.
- P(남성)=3009/8027=0.3749
- P(여)=5018/8027=0.6251
- P(건강)=3750/8027=0.4672
- P(건강)=P(염나다) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
우리는 또한 계산을 사용하여 이를 보완 규:1–P(건강)
우리는 또한 이전에는 것을 발견
- P(남성과 건강한)=1143/8027=0.1424
리콜 규칙 5,P(A 또는 b)=P(A)+P(B)–P(A 및 b). 우리는 지금 이 규칙을 사용하여 계산하는 P(남성 또는 건강한)
- P(남성 또는 건강한)=P(남성)+P(건강)–P(남성과 건강한)=0.3749 + 0.4672 – 0.1424 =0.6997 또는 약 70%
우리는 이 질문에 해결에 의해 이전에는 단순히 계산하는 방법을 많은 사람들은 남성 또는 건강한니다. 아래 그림은 우리가 결합해야 할 가치를 보여줍니다. 우리는 우리를 계산해야
- 모든 남성
- 모든 건강한 사람
- 그러나,계산되지 않을 사람이다.!
이용하여 논리적인 접근 우리는 우리를 찾을 것입
- P(남성 또는 건강한) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996
우리는 작은 차이에서 우리의 답변에 마지막 소수 자릿수로 인한 반올림 발생할 때 우리는 계산 P(남성),P(건강),P(남성과 건강한)및 그 적용된 규칙 5.
분명히 대답은 효과적으로 동일하며 약 70%입니다. 만약 우리가 수행에 대한 우리의 대답에 따라 더 많은 소수점 자리 또는 우리가 사용하면 원래의 분수,우리는 우리 제거할 수 있는 이 작은 차이가니다.
규칙이 필요할 때 확률 규칙 5 를 설명하기 위해 하나의 마지막 예를 살펴 보겠습니다.
예:중요한 배달!
특정 문서가 하루 안에 목적지에 도달하는 것이 중요합니다. 의 기회를 극대화하기 위해 시간에 배달,두 문서의 복사본을 사용하여 전송되는 두 개의 서비스,서비스 및 서비스 B. 는 것이 알려져의 확률이 시간에 배달습니다:
- 0.90 서비스(P(A)=0.90)
- 0.80 서비스에 대한 B(P(B)=0.80)
- 0.75 두 서비스 모두 정시에(P(A 및 B)=0.75)
(A 및 B 는 분리되지 않습니다. 그들은 확률 0.75 와 함께 일어날 수 있습니다.)
아래의 벤 다이어그램은 확률 P(A),P(B)및 P(a 및 b)를 보여줍니다.
이 문제의 맥락에서 관심있는 명백한 질문은:
- 이 전략을 사용하여 문서를 정시 배달 할 확률은 얼마입니까(두 서비스를 통해 전송)?
문서는 서비스 A 또는 서비스 B 또는 두 서비스에 의해 제 시간에 배달되는 한 제 시간에 목적지에 도달합니다. 즉,이벤트 A 가 발생하거나 이벤트 B 가 발생하거나 둘 다 발생할 때. 그래서….
P(시간에 맞춰 납품에 이 전략을 사용하는)=P(A 또는 B)를 표현으로 음영 지역에서 아래 그림:
할 수 있습니다.
- 사용하여 세 벤 다이어그램를 나타내는 P(A),P(B)및 P(A,B)
- 는 우리를 찾을 수 있습 P(A 또는 B)를 추가하여 P(A)(대표에 의해 왼쪽 원)과 P(B)(로 표시되는 오른쪽 원)
- 다음을 빼 P(A,B)(대표에 의해 중복)이후,우리는 그것을 포함 한 번의 일환으로 P(A)한 번의 일환으로 P(B).
이것은 다음과 같이지:
경우 우리는 이를 우리를 들어,우리는 것을 발견:
- P(A 또는 B)=P(배달 시간을 사용하여 이 전략)= 0.90 + 0.80 – 0.75 = 0.95.
따라서 두 가지 배달 서비스를 사용하는 우리의 전략은 정시 배달 확률을 0.95 로 증가시킵니다.
동안 벤 다이어그램을 시각화하는 일반적인 이외 규칙,이러한 경우에 그것은 훨씬 더 쉽게 정보를 표시하고 작업으로 두 방법으로 테이블의 확률이 많은 우리 사이의 관계를 조사 두 개의 범주형 변수에 예비 데이터 분석 섹션입니다.
우리는 단순히 당신이 얼마나 우리는 파생으로 그것을 당신이라는 메시지가 표시되지 않습니하는 이것을 가능하게 합니다. 당신은 어떤 논리와 간단한 덧셈/뺄셈이 우리가 아래 표를 채우는 데 사용 된 모든 것을 볼 수 있어야합니다.
때 사용하는 방법을 두 테이블에,우리는 기억해야에서 보는 전체를 찾 전반적인 확률을 포함하만이거나 만 B.
- P(A)=0.90 즉 90%의 경우에 서비스를 사용하며,문서에 시간입니다. 이를 찾기 위해 우리는 P(A)를 찾는 A 를 포함하는 행에 대한 총 확률을 보면 B 가 발생하는지 여부를 알 수 없습니다.
- P(B)=0.80 는 것을 의미에서 80%의 경우스 B 사용 그것은 문서를 제공합니다. 이를 찾기 위해 우리는 p(B)를 찾는 B 를 포함하는 열에 대한 총 확률을 보면 A 가 발생하는지 여부를 알 수 없습니다.
댓글
- 때 우리는 우리 사용되는 두 개의 방법으로 테이블에 예비 데이터 분석(EDA)섹션에서 그것을 기록하는 값의 두 가지 범주형 변수에 대한 콘크리트 샘플의 개인이다.
- 대조적으로 확률 양방향 테이블의 정보는 전체 모집단에 대한 것이며 값은 다소 추상적입니다.
- 가 있으면 우리는 치료 같은 것을 배달 예 EDA 섹션에서,우리는 것을 기록한 실제적인 숫자의에서는 시간(그리고 시간에)배송에 대한 서류의 샘플을 발송 서비스 또는 B.
- 이 섹션에서는 장기적인 확률이 제시되는 것으로 알려져 있습니다.
- 아마도,이 전달 예에서보고 된 확률은 많은 반복에 걸쳐 기록 된 상대 주파수를 기반으로했다.
확률에 대한 엄지 손가락의 반올림 규칙:
이 과정의 다음 일반 지침을 따르십시오. 의심 스럽다면 소수점 이하 자릿수를 더 많이 가지고 다니십시오. 우리가 지정하는 경우 요청 정확히 무엇을 제공합니다.
- 일반적으로 중간 단계에 대해 최소 소수점 이하 4 자리까지 확률을 전달해야합니다.
- 우리는 종종 최종 답을 소수점 이하 2~3 자리로 반올림합니다.
- 에 대한 확률이 매우 작은 것이 중요하이 1 또는 두 가지 중요한 자리 숫자(비제로 자리)등 0.000001 또는 0.000034,etc.
많은 컴퓨터 패키지를 표시할 수 있습니다 매우 작은 값을 사용하여 과학적인 표기법 등
- 58×10-5 또는 1.58E-5 을 나타내 0.0000158
하자 요약
지금까지의 연구에서 확률,당신은 도입되었을 때로는 카운터-직관적인 성격의 확률 및 기초의 기초가 되는,확률 이러한 상대적으로 주파수이다.
우리는 또한 이벤트의 확률,즉 확률 규칙을 찾는 데 도움이되는 몇 가지 도구를주었습니다.
당신은 아마 확률 섹션에서는 크게 다르에서 이전의 두 부분,이것은 훨씬 더 큰 기술적/수학적 구성요소,그래서 그 결과는 경향이 있을 수”올바른 또는 잘못된”자연이다.
에 예비 데이터 분석 섹션에 대한 가장 일부,컴퓨터 신 기술적 측면을 것이고,우리의 작업은 그것을 말하는 올바른 일을 할 수 있고 그 해석의 결과입니다.
에서 확률,우리가 할 일을 처음부터 끝까지 선택에서 오른쪽에 도구(규칙)을 사용하여 올바르게 사용하고,해석의 결과입니다.
여기에 우리가 지금까지 제시 한 규칙의 요약입니다.1. 확률 규칙#1 상태:임의의 이벤트 A 에 대해
- ,0≤P(A)≤1
2. 확률 규칙#2 상태:
- 가능한 모든 결과의 확률의 합은 1
3 입니다. 보완 규칙(#3)국
- P(안)=1–P(A)
또는 재배치 하는 경우
- P(A)=1–P(아)
후자 표현의 보완 규칙은 특히 유용합니다면 우리를 찾을 필요가 확률의 이벤트는”종류의 하나 이상의…”
4. 일반적인 이외 규칙(#5)국는 어떤 두 개의 이벤트,
- P(A 또는 B)=P(A)+P(B)–P(A 및 B),
지 P(A 또는 B)우리는 것을 의미 P(가 발생하거나 B 발생하 또는 모두).
특별한 경우에의 연결이 끊긴 이벤트,이벤트 발생할 수 없는 함께,일반적인 이외 규칙을 감소될 수 있습니다 추가 규칙에 대한 연결이 끊긴 이벤트(#4),
- P(A 또는 B)=P(A)+P(B). *
*이벤트가 분리되어 있다고 확신 할 때만 사용하십시오(겹치지 않음)
5. 제한된 버전의 추가 규칙(에 대한 연결이 끊긴 이벤트)를 쉽게 확장할 수 있습니다 두 개 이상의 이벤트입니다.6. 지금까지 우리는 간단한 예제에서 논리와 카운팅을 사용하여 P(A 와 B)만 발견했습니다.