Základní Pravděpodobnost Pravidla

  • Úvod
  • Pravidla Pravděpodobnosti
    • Pravděpodobnost, že Pravidlo číslo Jedna (Pro žádném případě A, 0 ≤ P(A) ≤ 1)
    • Pravděpodobnost Pravidlo Dvou (součet pravděpodobností všech možných výsledků je 1)
    • Pravděpodobnost Pravidlo Tří (Doplnit Pravidlo)
    • Pravděpodobnosti Zahrnující Více Událostí
    • Pravděpodobnost Pravidlo Čtyři (Kromě Pravidlo pro Disjunktní Akce)
    • Nalezení P(a a B) pomocí Logiky
    • Pravděpodobnost Pravidlo Pět (Kromě Obecné Pravidlo)
  • Zaokrouhlení Pravidlo pro Pravděpodobnost,
  • Pojďme Shrnout
CO-6: Aplikovat základní pojmy z pravděpodobnosti, náhodné variace, a běžně používané statistické rozdělení pravděpodobnosti.
LO 6.4: vztahujte pravděpodobnost události k pravděpodobnosti výskytu této události.
LO 6.5: použijte relativní frekvenční přístup k odhadu pravděpodobnosti události.
LO 6.6: Použijte základní pravidla logiky a pravděpodobnosti, abyste našli empirickou pravděpodobnost události.
Video: Základní Pravděpodobnost Pravidla (25:17)

V předchozí části jsme představili pravděpodobnost, jako způsob, jak kvantifikovat nejistotu, která vyplývá z provádění experimentů pomocí náhodného vzorku z populace zájem.

viděli jsme, že pravděpodobnost události (například událost, že náhodně vybraná osoba má krevní skupinu O) lze odhadnout relativní frekvencí, s jakou se událost vyskytuje v dlouhé sérii studií. Takže bychom shromažďovat data z mnoha jedinců odhadnout pravděpodobnost, že má někdo krevní skupinu O.

V této části jsme se stanovit základní metody a principy pro nalezení pravděpodobnosti událostí.

pokryjeme také některá základní pravidla pravděpodobnosti, která lze použít k výpočtu pravděpodobností.

Úvod

začneme klasickým pravděpodobnostním příkladem házení spravedlivé mince třikrát.

Od té doby, panny a orli jsou stejně pravděpodobné, že pro každý přehazovat v tomto případě, každá z možností, která může být výsledkem tří hodů bude také stejně pravděpodobné, takže můžeme vypsat všechny možné hodnoty a použít tento seznam pro výpočet pravděpodobnosti.

protože se v tomto kurzu zaměřujeme na data a statistiky (nikoli teoretickou Pravděpodobnost), ve většině našich budoucích problémů použijeme souhrnný datový soubor, obvykle frekvenční tabulku nebo obousměrnou tabulku, pro výpočet pravděpodobností.

příklad: Hodím spravedlivou mincí třikrát

Pojďme seznam každý možný výsledek (nebo možný výsledek):

{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}

Nyní pojďme definovat následující události:

Akce: „ne H“

Událost B: „Dostat přesně jednu H“

Událost C: „, že alespoň jeden H“

Všimněte si, že každá akce je opravdu prohlášení o výsledek, že experiment se bude vyrábět. V praxi každá událost odpovídá určitému sběru (podmnožině) možných výsledků.

Event A:“ Getting no H “ → TTT

Event B: „Dostat přesně jednu H“ → HTT, THT, TTH

Událost C: „, že alespoň jeden H“ → HTT, THT, TTH, THH, HTH, HHT, HHH

Zde je vizuální znázornění událostí, B a C.

Máme velký obdélník s nápisem "S", což představuje rozsahu vzorku prostoru. Uvnitř tohoto obdélníku máme kružnici označenou "C." všechno mimo "C se shoduje s událostí a obsahující pouze "TTT". Uvnitř C, vidíme "HHH," "THH," "HTH," "HHT," a kruh představující událost B. Uvnitř B jsou "HHT," "THT" a "TTH."Všimněte si, že všechny předměty uvnitř B jsou také uvnitř C, takže C plně obklopuje."S" which represents the entirety of the sample space. Inside this rectangle we have a circle labeled "C." Everything outside of "C happens to coincied with event A containing only "TTT". Inside of C, we see "HHH," "THH," "HTH," "HHT," and a circle representing event B. Inside B are "HHT," "THT," and "TTH." Note that all of the items inside B are also inside C, so C fully encloses B.

Z této vizuální reprezentaci události, je snadné vidět, že událost B je zcela zahrnuty v případě C, v tom smyslu, že každý výsledek v případě B je také výsledek v případě C. všimněte si Také, že událost stojí na rozdíl od události B a C, v tom smyslu, že nemají žádný výsledek společného, nebo ne překrývají. V tomto okamžiku se jedná pouze o pozoruhodné pozorování, ale jak zjistíte později, jsou to velmi důležité.

Co kdybychom přidali novou událost:

událost D: „Získání T při prvním hodu“ → THH, THT, TTH, TTT

jak by to vypadalo, kdybychom do výše uvedeného diagramu přidali událost D? (Odkaz na odpověď)

pamatujte, protože H A T jsou stejně pravděpodobné při každém hodu, a protože existuje 8 možných výsledků, pravděpodobnost každého výsledku je 1/8.

Uvidíme, jestli můžete odpovědět na následující otázky, pomocí diagramů a/nebo seznam výsledků pro každou událost, spolu s tím, co jste se zatím naučili o pravděpodobnosti.

Naučte se tím: Házení spravedlivé mince třikrát

Pokud jste byli schopni odpovědět na tyto otázky správně, pravděpodobně máte dobrý instinkt pro výpočet pravděpodobnosti! Čtěte dále a dozvíte se, jak tyto znalosti uplatníme.

Pokud ne, pokusíme se vám pomoci rozvíjet tuto dovednost v této sekci.

Komentář:

  • Všimněte si, že v případě C, „Dostat alespoň jednu hlavu“ existuje pouze jeden možný výsledek, který chybí, „BEZ hlavy“ = TTT. Budeme to řešit znovu, když hovoříme o pravidlech pravděpodobnosti, zejména o pravidle komplementu. V tuto chvíli chceme, abyste přemýšleli o tom, jak jsou tyto dvě události v tomto scénáři“ protiklady“.

je VELMI důležité si uvědomit, že jen proto, můžeme seznam možných výsledků, to neznamená, že každý výsledek je stejně pravděpodobný.

Toto je (vtipná) zpráva v klipu Daily Show, který jsme poskytli na předchozí stránce. Ale zamysleme se nad tím znovu. V tomto klipu Walter tvrdí, že protože existují dva možné výsledky, pravděpodobnost je 0,5. Dva možné výsledky,

  • svět bude zničen v důsledku použití velkého hadronového urychlovače
  • svět NEBUDE zničen v důsledku použití velkého hadronového urychlovače

Doufejme, že to je jasné, že tyto dva výsledky jsou stejně pravděpodobné!!

uvažujme o běžnějším příkladu.

PŘÍKLAD: vrozené Vady

Předpokládejme, že budeme náhodně vybrat tři děti a zajímá nás pravděpodobnost, že žádné z dětí mít nějaké vrozené vady.

používáme notaci D k reprezentaci dítěte narozeného s vrozenou vadou a N k reprezentaci dítěte narozeného bez vrozené vady. Můžeme seznam možných výsledků, stejně jako jsme to udělali pro losování, jsou:

{DDD, NDD, DND, DDN, DNN, SOV, NND, NNN}

Jsou události DDD (všechny tři děti se rodí s vrozenými vadami) a NNN (žádné z dětí se rodí s vrozenými vadami) stejně pravděpodobné?

mělo by být rozumné, že P(NNN) je mnohem větší než P(DDD).

je to proto, že P(N) A P(D) nejsou stejně pravděpodobné události.

je vzácné (rozhodně ne 50%), že se náhodně vybrané dítě narodí s vrozenou vadou.

pravidla pravděpodobnosti

nyní přejdeme k učení některých základních pravidel pravděpodobnosti.

naštěstí jsou tato pravidla velmi intuitivní a pokud jsou aplikována systematicky, umožní nám vyřešit složitější problémy; zejména ty problémy, pro které by naše intuice mohla být nedostatečná.

Protože většina pravděpodobností, budete požádáni, aby najít lze vypočítat pomocí obou

  • logiku a počítání

a

  • pravidla se budeme učit,

jsme dát následující radu jako princip.

PRINCIP:

Pokud si můžete spočítat pravděpodobnost, s použitím logiky a počítání nepotřebujete pravděpodobnost pravidlo (i když správné pravidlo může být vždy aplikován)

Pravděpodobnost, že Pravidlo číslo Jedna

Naše první pravidlo, jednoduše nám připomíná základní vlastnost pravděpodobnost, že už jsme se dozvěděli.

pravděpodobnost, Že událost, která nás informuje o pravděpodobnosti jejího výskytu, se může pohybovat kdekoli od 0 (což znamená, že událost bude nikdy nedojde) do 1 (což naznačuje, že událost je jisté).

pravidlo pravděpodobnosti jedna:

  • pro každou událost a, 0 ≤ P(a) ≤ 1.

POZNÁMKA: Jedním z praktických použití tohoto pravidla je, že může být použita k identifikaci jakéhokoliv výpočtu pravděpodobnosti, že vyjde na více než 1 (nebo menší než 0) jako nesprávné.

než přejdeme k dalším pravidlům, podívejme se nejprve na příklad, který poskytne kontext pro ilustraci dalších několika pravidel.

příklad: krevní skupiny

Jak bylo uvedeno výše, veškerá lidská krev může být napsána jako O, A, B nebo AB.

kromě toho se frekvence výskytu těchto krevních typů liší podle etnických a rasových skupin.

podle krevního centra Stanfordské univerzity (bloodcenter.stanforde.edu), jsou pravděpodobnosti typy lidské krve ve Spojených Státech (pravděpodobnost pro typ byl vynechán naschvál):

Motivující otázka pro pravidlo 2: člověk ve Spojených Státech je vybrán náhodně. Jaká je pravděpodobnost, že osoba má krevní skupinu a?

odpověď: Naše intuice nám říká, že od té doby čtyři krevní skupiny O, A, B, a AB vyčerpat všechny možnosti, jejich pravděpodobnosti, spolu musí součet 1, což je pravděpodobnost, že „některé“ události (člověk má jednu ze 4 krevních skupin pro určité).

Od pravděpodobnosti O, B, a AB dohromady sumu 0.44 + 0.1 + 0.04 = 0.58, pravděpodobnost, že typ musí být zbývající 0.42 (1 – 0.58 = 0.42):

Údaje uvedené v "Typ Krve: Pravděpodobnost" Formátu: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Pravděpodobnost Pravidlo číslo Dvě

Tento příklad ilustruje naše druhé pravidlo, které nám říká, že pravděpodobnost všech možných výsledků spolu musí být 1.

pravidlo pravděpodobnosti dvě:

součet pravděpodobností všech možných výsledků je 1.

Toto je dobré místo pro porovnání a kontrast toho, co zde děláme, s tím, co jsme se naučili v sekci Exploratory Data Analysis (EDA).

  • Všimněte si, že v tomto problému se v podstatě zaměřujeme na jednu kategorickou proměnnou: krevní skupinu.
  • shrnuli jsme tuto proměnnou výše, jak jsme shrnuli jednotlivé kategorické proměnné v sekci EDA, seznamem hodnot, které proměnná Bere a jak často je bere.
  • v EDA jsme použili procenta, a zde používáme pravděpodobnosti, ale obě sdělují stejné informace.
  • V EDA oddílu, jsme se dozvěděli, že koláčový graf poskytuje odpovídající zobrazení při jedné kategorické proměnné je zapojen, a podobně můžeme ji použít zde (pomocí procenta namísto pravděpodobnosti):

koláčový graf s názvem " krevní skupiny."Typ O zabírá 44% výsečového grafu, a používá 42%, AB představuje 4% a B představuje zbytek, 10%. Všimněte si, že typy krve, které nejsou "O", zabírají 56% výsečového grafu."Blood Types." Type O takes up 44% of the pie chart, A uses 42%, AB represents 4%, and B represents the rest, 10%. Note that the types of blood which are "not O" take up 56% of the pie chart.

I když to, co tady děláme, je opravdu podobné tomu, co jsme udělali v EDA části, tam je jemný, ale důležitý rozdíl mezi základní situace,

  • V EDA, jsme se shrnout údaje, které byly získány z reprezentativního vzorku osob, pro které hodnoty proměnné byly zaznamenány.
  • zde, když uvádíme pravděpodobnost každé krevní skupiny, máme na mysli celou populacilidé ve Spojených státech, u kterých předpokládáme, že známe celkovou frekvenci hodnot přijatých proměnnou zájmu.

Dostal jsem to?: Pravděpodobnost Pravidlo číslo Dvě

Pravděpodobnost Pravidlo Tří

V pravděpodobnosti a její aplikace, jsme často zájem zjistit pravděpodobnost, že určitá událost nenastane.

důležitý bod k pochopení je, že „událost nenastane,“ je zvláštní událost, která zahrnuje všechny možné výsledky, které nejsou v a je nazýván „doplňují události.“

Notace: budeme psát „ne“ k označení případě, že nenastane. Zde je vizuální znázornění toho, jak událost a a její doplňková událost „ne A“ společně představují všechny možné výsledky.

celý vzorový prostor S je reprezentován šedým rámečkem. Uvnitř tohoto pole je modrý kruh, představující všechny výsledky v A. všechno ostatní v šedém poli, ale mimo modrý kruh, není "a"."not A".

komentář:

  • takové vizuální zobrazení se nazývá “ Vennův diagram.“Vennův diagram je jednoduchý způsob, jak vizualizovat události a vztahy mezi nimi pomocí obdélníků a kruhů.

Pravidlo 3 se zabývá vztahem mezi pravděpodobností události a pravděpodobnosti jejího doplnění událost.

Vzhledem k tomu, že událost a a událost „ne“ dohromady tvoří všechny možné výsledky, a protože pravidlo 2 nám říká, že součet pravděpodobností všech možných výsledků je 1, toto pravidlo by mělo být poměrně intuitivní:

Pravděpodobnost Pravidlo Tří (Doplnit Pravidlo):

  • P(ne) = 1 – P(A)
  • to je pravděpodobnost, že událost nenastane, je 1 minus pravděpodobnost, že to dojde.

PŘÍKLAD: Krevní Typy

Zpět na typu krevní příklad:

Zde jsou některé další informace:

  • člověk s typem A může darovat krev osoby s typu A nebo AB.
  • osoba s typem B může darovat krev osobě s typem B nebo AB.
  • osoba s typem AB může darovat krev pouze osobě s typem AB.
  • osoba s krví typu O může darovat komukoli.

jaká je pravděpodobnost, že náhodně vybraná osoba nemůže darovat krev všem? Jinými slovy, jaká je pravděpodobnost, že náhodně vybraná osoba nemá krevní skupinu O? Musíme najít P (ne O). Pomocí pravidla komplementu P (ne O) = 1-P (O) = 1-0,44 = 0,56. Jinými slovy, 56% obyvatel USA nemá krevní skupinu O:

Jasně, můžeme také najít P(ne, O) přímo přidáním pravděpodobnosti B, AB, a a.

Komentář:

  • Všimněte si, že pravidlo komplementu, P(ne A) = 1 – P(a) lze znovu formulovat jako P(A) = 1-P(ne A).
    • P (ne A) = 1-P (a)
    • lze znovu formulovat jako P (a) = 1 – P(ne A).
    • tato zdánlivě triviální algebraická manipulace má důležitou aplikaci a ve skutečnosti zachycuje sílu doplňkového pravidla.
    • V některých případech, kdy nalezení P(A) přímo, je velmi komplikované, to může být mnohem snazší najít P(ne) a pak právě to odečíst od 1, aby získat požadovaný P(A).
    • k tomuto komentáři se brzy vrátíme a poskytneme další příklady.
Dostal jsem to?: Pravidlo pravděpodobnosti tři
  • pravidlo komplementu může být užitečné vždy, když je snazší vypočítat pravděpodobnost komplementu události spíše než samotné události.

  • Všimněte si, že jsme znovu použili frázi “ alespoň jeden.“
  • nyní jsme viděli, že doplněk „alespoň jednoho …“ je „žádný …“ nebo “ ne ….“(jak jsme již zmínili, pokud jde o události, které jsou „protiklady“).
  • Ve výše uvedené aktivity, vidíme, že
    • P(ŽÁDNÝ z těchto dvou nežádoucí účinky) = 1 – P(aspoň jedna z těchto dvou nežádoucí účinky )
  • To je běžné použití doplnit pravidlo, které můžete často poznat výrazem „alespoň jeden“ problém.

Pravděpodobnosti Zahrnující Více Událostí

Budeme často být zájem o nalezení pravděpodobnosti zahrnující více akcí, jako jsou

  • P(A nebo B) = P(jev A nastane, nebo událost B se vyskytuje nebo jak se vyskytují)
  • P(a B)= P(obě událost nastane, a událost B se vyskytuje)

společný problém s terminologií týká, jak jsme obvykle myslí „nebo“ v našem každodenním životě. Například, když rodič řekne svému dítěti v hračkářství „chcete hračku A nebo hračku B?“, to znamená, že dítě dostane pouze jednu hračku a musí si mezi nimi vybrat. Získání obou hraček obvykle není možné.

naproti tomu:

v pravděpodobnosti“ nebo “ znamená buď jedno nebo druhé nebo obojí.

a tak P(A nebo B) = P(jev A nastane, nebo událost B se vyskytuje nebo JAK se vyskytují)

Having řekl, že, to by mělo být poznamenal, že tam jsou některé případy, kdy to je prostě nemožné pro dvě události, aby oba nastat současně.

pravidlo pravděpodobnosti čtyři

rozdíl mezi událostmi, které se mohou stát společně, a událostmi, které nemohou, je důležitý.

Disjoint: Dvě události, které nemohou nastat současně, se nazývají disjunktní nebo vzájemně se vylučující. (Budeme používat disjoint.)

Vennův diagram s názvem "a a B jsou Disjunktní."Celý prostor vzorku je reprezentován jako obdélník. Uvnitř obdélníku jsou dva samostatné kruhy. Jeden kruh představuje události v a druhý představuje události v B."A and B are Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two separate circles. One circle represents the events in A and the other represents the events in B.Vennův diagram s názvem "a a B NEJSOU Disjunktní."Celý prostor vzorku je reprezentován jako obdélník. Uvnitř obdélníku jsou dva kruhy. Jeden kruh představuje výskyty v A a druhý představuje výskyty v B. Tyto dva nejsou nesouvislé, takže se oba kruhy částečně překrývají. (Nejsou-li disjunktní, mohly by se dva kruhy úplně překrývat, ale v tomto příkladu tomu tak není.)"A and B are NOT Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two circles. One circle represents the occurrences in A and the other represents the occurrences in B. These two are not disjoint, so the two circles partially overlap each other. (Being NOT disjoint, two circles could overlap each other completely, but in this example they do not.)

To by mělo být jasné z obrázku, že

  • v prvním případě, kdy události NEJSOU disjunktní, P(a, B) ≠ 0
  • v druhém případě, kde události JSOU disjunktní, P(a B) = 0.

zde jsou dva příklady:

příklad:

Zvažte následující dvě události:

A — náhodně vybraný člověk má krevní skupinu A, a

B — náhodně vybraná osoba má krevní skupinu B.

Ve vzácných případech, to je možné, aby osoba, která má více než jeden druh krve proudí skrze jeho nebo její žíly, ale pro naše účely, budeme předpokládat, že každá osoba může mít pouze jeden typ krve. Proto není možné, aby se události a A B vyskytly společně.

  • Události a a B jsou DISJUNKTNÍ

Na druhou stranu …

PŘÍKLAD:

zvažte následující dvě události:

A-náhodně vybraná osoba má krevní skupinu a

B-náhodně vybraná osoba je žena.

v tomto případě je možné, aby se události a A B vyskytly společně.

  • události A A B nejsou disjunktní.

Venn diagramy naznačují, že jiný způsob, jak přemýšlet o disjunktní versus ne nesouvislé události je, že nesouvislé události se nepřekrývají. Nesdílejí žádný z možných výsledků,a proto se nemohou stát společně.

na druhé straně se události, které nejsou disjunktní, překrývají v tom smyslu, že sdílejí některé z možných výsledků, a proto se mohou vyskytnout současně.

nyní začínáme jednoduchým pravidlem pro nalezení P (a nebo B) pro disjunktní události.

Pravděpodobnost Pravidlo Čtyři (Kromě Pravidlo pro Nesouvislé Události):

  • Pokud a a B jsou disjunktní události, pak P(A nebo B) = P(A) + P(B).

komentář:

  • při práci s pravděpodobnostmi bude slovo „nebo“ vždy spojeno s operací sčítání; proto název tohoto pravidla, “ pravidlo sčítání.“

PŘÍKLAD: Krevní Typy

vzpomeňte si na krevní typ příklad:

Údaje uvedené v "Typ Krve: Pravděpodobnost" Formátu: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Zde jsou některé další informace,

  • osoby s typ Acan darovat krev osoby s typu A nebo AB.
  • osoba s typem Bmůže darovat krev osobě s typem B nebo AB.
  • osoba s typem Abmůže darovat krev osobě s typem AB
  • osoba s typem Oblood může darovat komukoli.

jaká je pravděpodobnost, že náhodně vybraná osoba je potenciálním dárcem pro osobu s krevní skupinou a?

z uvedených informací víme, že být potenciálním dárcem pro osobu s krevní skupinou a znamená mít krevní skupinu a nebo o.

proto musíme najít P(a nebo O). Protože události A A O jsou disjunktní, můžeme použít pravidlo sčítání pro disjunktní události, abychom získali:

  • P (a nebo O) = P (A) + P (O) = 0,42 + 0,44 = 0,86.

je snadné pochopit, proč přidání pravděpodobnosti skutečně dává smysl.

Pokud 42% populace má krevní skupinu a a 44% populace má krevní skupinu nula,

  • pak 42% + 44% = 86% populace má buď krevní skupinu A nebo O, a tak se potenciální dárce, aby člověk s krevní skupinu A.

Tato úvaha o tom, proč toho pravidlo dává smysl, může být vizualizovány pomocí grafu níže:

výsečový graf s názvem "Krevní Typy."Typ a zabírá 42% výsečového grafu a typ O zabírá 44%. Společně jako A nebo O zabírají 86% výsečového grafu."Blood Types." Type A takes up 42% of the pie chart, and type O takes up 44%. Together, as A or O, they take up 86% of the pie chart.

Naučte se tím: pravidlo pravděpodobnosti čtyři

komentář:

  • pravidlo sčítání pro disjunktní události lze přirozeně rozšířit na více než dvě disjunktní události. Vezměme si například tři. Pokud A, B a C jsou tři disjunktní události
Vennův Diagram ukazuje 3 disjunktní události. Jako obvykle je šedý rámeček zobrazující celý prostor vzorku. Uvnitř této šedé krabice jsou tři zcela oddělené kruhy. První kruh je pro výskyty v A, druhý pro události v B, a třetí pro výskyty v C.

pak P(A nebo B nebo C) = P(A) + P(B) + P(C). Pravidlo je stejné pro libovolný počet nesouvislých událostí.

Dostal jsem to?: Pravidlo pravděpodobnosti čtyři

nyní jsme skončili s první verzí pravidla sčítání (pravidlo čtyři) , což je verze omezená na disjunktní události. Před pokrytím druhé verze musíme nejprve diskutovat o P (A A B).

Hledání P(a a B) pomocí Logiky

nyní se vraťme k výpočtu

  • P(a B)= P(obě událost nastane, a událost B se vyskytuje)

Později budeme diskutovat o pravidla pro výpočet P(a a B).

nejprve chceme ilustrovat, že pravidlo není potřeba, kdykoli můžete určit odpověď pomocí logiky a počítání.

zvláštní případ:

existuje jeden zvláštní případ, pro který víme, co se rovná P(A A B) bez použití jakéhokoli pravidla.

Naučte se tím: Nalezení P (A A B) #1

takže pokud jsou události a A B nesouvislé, pak(podle definice) P (A A B)= 0. Ale co když události nejsou nesouvislé?

připomeňme, že pravidlo 4, pravidlo sčítání, má dvě verze. Jeden je omezen na disjunktní události, které jsme již pokryli, a obecnější verzi se budeme zabývat později v tomto modulu. Totéž platí pro pravděpodobnosti zahrnující a

nicméně, s výjimkou zvláštních případů, budeme spoléhat na logiku najít P (A A B) v tomto kurzu.

před pokrytím jakýchkoli formálních pravidel se podívejme na příklad, kde události nejsou nesouvislé.

PŘÍKLAD: Periodontální Stav a Pohlaví

Zvažte následující tabulka týkající se periodontálního statusu osob a jejich pohlaví. Periodontální stav se týká onemocnění dásní, kde jsou jednotlivci klasifikováni jako zdraví, mají zánět dásní nebo mají periodontální onemocnění.

tento typ tabulky jsme již viděli, když jsme diskutovali o analýze dat v případě C → C. Pro účely této otázky použijeme tato data jako naši „populaci“ a zvážíme náhodný výběr jedné osoby.

Učit tím, že Dělá: Periodontální Stav a Pohlaví

Jsme se chtěl zeptat pravděpodobnost otázky podobné na předchozí příklad (použití dvou-způsob, tabulka na základě údajů) jako to umožňuje, aby se spojení mezi těmito tématy a pomůže vám udržet něco z toho, co jste se naučili o data čerstvé ve vaší mysli.

pamatujte, že naším primárním cílem v tomto kurzu je analyzovat data v reálném životě!

pravidlo pravděpodobnosti pět

nyní jsme připraveni přejít na rozšířenou verzi pravidla sčítání.

v této části se naučíme, jak najít P (a nebo B), Když A A B nemusí být nutně disjunktní.

  • tuto rozšířenou verzi nazveme „obecné pravidlo sčítání“ a uvedeme ji jako pravidlo pravděpodobnosti pět.

začneme tím, právního a poskytuje příklad, podobné typy problémů jsme se obecně zeptat v tomto kurzu. Pak představíme další příklad, kdy nemáme surová data ze vzorku, ze kterého bychom mohli pracovat.

pravidlo pravděpodobnosti pět:

  • obecné pravidlo sčítání: P (a nebo B) = P(A) + P(B) – P (A A B).

poznámka: nejlepší je použít logiku k nalezení P (A A B), nikoli jiného vzorce.

velmi častou chybou je nesprávné použití pravidla násobení pro nezávislé události uvedené na další stránce. To bude správné pouze v případě, že A A B jsou nezávislé (viz definice, které je třeba dodržovat), což je zřídka případ údajů prezentovaných v obousměrných tabulkách.

jak jsme byli svědky v předchozích příkladech, když obě události nejsou nesouvislé, mezi událostmi dochází k určitému překrývání.

  • pokud jednoduše sečteme obě pravděpodobnosti dohromady, dostaneme špatnou odpověď, protože jsme spočítali nějakou „pravděpodobnost“ dvakrát!
  • proto musíme odečíst tuto“ extra “ pravděpodobnost, abychom dospěli ke správné odpovědi. Vennův diagram a obousměrné tabulky jsou užitečné při vizualizaci této myšlenky.

vennův diagram s názvem "a a B NEJSOU Disjunktní."Šedá krabička představuje vzorkovací prostor a uvnitř jsou dva modré kruhy, které mají překrývající se oblast. Jeden kruh je označen a a druhý je označen B. oblast, kde se oba kruhy překrývají, představuje, že události a A B mohou nastat současně, takže P(A A B) ≠ 0."A and B are NOT Disjoint." A gray box represents the sample space, and inside are two blue circles which have an overlapping area. One circle is labeled A and the other is labeled B. The area where the two circles overlap represents that Events A and B can occur at the same time, so P(A and B) ≠ 0.

toto pravidlo je obecnější, protože funguje pro jakoukoli dvojici událostí (i disjunktních událostí). Naše rada je stále pokusit se odpovědět na otázku pomocí logiky a počítání, kdykoli je to možné, jinak musíme být velmi opatrní při výběru správného pravidla pro problém.

PRINCIP:

Pokud si můžete spočítat pravděpodobnost, s použitím logiky a počítání nepotřebujete pravděpodobnost pravidlo (i když správné pravidlo může být vždy aplikován)

Všimněte si, že pokud a a B jsou disjunktní, pak P(a B) = 0 a pravidlo 5 snižuje na pravidlo 4 pro tento zvláštní případ.

Vennův Diagram s názvem " A A B jsou nesouvislé. Celý vzorový prostor S je reprezentován jako šedý obdélník. Uvnitř jsou dva, oddělené, nepřekrývající se modré kruhy. Jeden kruh je pro výskyty v a druhý pro události v B."A and B are Disjoint. The entire sample space S is represented as a gray rectangle. Inside are two, separate, non-overlapping blue circles. One circle is for the occurrences in A and the other for occurrences in B.

podívejme se znovu na poslední příklad:

PŘÍKLAD: Periodontální Stav a Pohlaví

Zvážit náhodně vybrat jednu osobu z těch, které jsou zastoupeny v následující tabulce, pokud jde o periodontální stav jednotlivců a jejich pohlaví. Periodontální stav se týká onemocnění dásní, kde jsou jednotlivci klasifikováni jako zdraví, mají zánět dásní nebo mají periodontální onemocnění.

podívejme se, co jsme se dosud naučili. V tomto scénáři můžeme vypočítat jakoukoli pravděpodobnost, pokud můžeme určit, kolik jednotlivců uspokojí událost nebo kombinaci událostí.

  • P(Muž) = 3009/8027 = 0.3749
  • P(Žena) = 5018/8027 = 0.6251
  • P(Zdravý) = 3750/8027 = 0.4672
  • P(Není Zdravé) = P(zánět Dásní nebo Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
    Můžeme také vypočítat pomocí doplnit pravidlo: 1 – P(Zdravé)

také Jsme již dříve zjistili, že

  • P(Samec A Zdravé) = 1143/8027 = 0.1424

Připomeňme si, pravidlo 5, P(A nebo B) = P(A) + P(B) – P(a a B). Jsme nyní použít toto pravidlo pro výpočet P(Muž NEBO Zdravá)

  • P(Muž nebo Zdravá) = P(Muž) + P(Zdravé) – P(Samec a Zdravé) = 0.3749 + 0.4672 – 0.1424 = 0.6997 nebo o 70%

Jsme řešit tuto otázku dříve, jednoduše počítat, kolik jedinců jsou buď Mužské, nebo Zdravý, nebo obojí. Níže uvedený obrázek ilustruje hodnoty, které musíme kombinovat. Musíme počítat

  • všichni muži
  • všichni zdraví jedinci
  • ale nepočítat nikoho dvakrát!!

Pomocí této logický přístup bychom našli

  • P(Muž nebo Zdravá) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996

Máme tu menší rozdíl v našich odpovědí v posledním desetinném místě vzhledem k zaokrouhlování, které se vyskytly, když jsme spočítali, P(Muž), P(Zdravé), a P(Samec a Zdravé) a pak se aplikuje pravidlo 5.

je zřejmé, že odpověď je v podstatě stejná, asi 70%. Pokud bychom přenesli naše odpovědi na více desetinných míst nebo pokud bychom použili původní zlomky, mohli bychom tento malý rozpor zcela odstranit.

podívejme se na poslední příklad, pro ilustraci Pravděpodobnost Pravidlo 5, když pravidlo je potřeba – tj. když nemáme aktuální údaje.

příklad: důležité doručení!

je nezbytné, aby určitý dokument dosáhl svého cíle během jednoho dne. Maximalizovat šance, on-time dodávky, dvě kopie dokumentu jsou odesílány pomocí dvou služeb, servis a služby B. je známo, že pravděpodobnost, on-time dodávky jsou:

  • 0,90 pro služby (P(A) = 0.90)
  • 0.80 pro servis B (P(B) = 0.80)
  • 0.75 pro obě služby jsou na čase(P (A A B) = 0.75)
    (Všimněte si, že A A B nejsou disjunktní. Mohou se stát společně s pravděpodobností 0,75.)

Venn diagramy níže znázorňují pravděpodobnosti P(A), P(B), a, P(a a B) :

Tři Vennovy Diagramy. Ve všech z nich je velký obdélník představující celý prostor vzorku s. uvnitř tohoto obdélníku jsou dva kruhy, které se částečně překrývají. Jeden kruh je označen a a druhý je označen B. v prvním Vennově diagramu je kruh pro a zbarven modře a vidíme, že P (A) = 0,90 . V jistém smyslu je p (A) oblast kruhu A. Ve druhém Vennově diagramu je kruh pro B zbarven modře a je označen, že P (B) = 0,80 . Stejně jako v prvním Vennově diagramu lze předpokládat, že kružnice pro B má plochu 0,80 . Ve třetím Vennově diagramu je oblast, která je překrytím kruhů A A B, zbarvena modře. P (A A B) = 0,75 . Oblast překrytí lze považovat za plochu 0,75.

v souvislosti s tímto problémem je zřejmá otázka zájmu:

  • jaká je pravděpodobnost doručení dokumentu včas pomocí této strategie(odeslání prostřednictvím obou služeb)?

dokument dorazí na místo určení včas, pokud je doručen včas službou a nebo službou B nebo oběma službami. Jinými slovy, když nastane událost a nebo nastane událost B nebo dojde k oběma. proto….

P(na čas dodání pomocí této strategie)= P(A nebo B), která je zastoupena v zastíněné oblasti v diagramu níže:

stejné Vennův Diagram s výjimkou oblasti dva kruhy byl barevný, modrá (stínované). To znamená, že oblast v překrytí je také zbarvena modře. Všimněte si, že oblast překrytí byla zbarvena pouze jednou, takže i když je v obou kruzích, spočítáme ji jednou.

nyní můžeme

  • použít tři Vennovy diagramy reprezentující P(A), P(B) a P(a B)
  • vidět, že můžeme najít P(A nebo B) přidáním P(A) (zastoupené levého kruhu) a P(B) (zastoupené pravého kruhu),
  • pak odečtením P(a B) (zastoupené překrývají), od té doby jsme zařadili to dvakrát, jednou jako součást P(A) a jednou jako součást P(B).

Toto je znázorněno na následujícím obrázku:

obsah obou kruzích v Vennův diagram (počítání překrývají oblast jednou) se vypočítá jako: plochy je kruh (který zahrnuje překrytí) + plocha B kruhu (který také zahrnuje překrytí) - oblasti se překrývají. Dostaneme tedy: P (a nebo B) = P(A) + P(B) - P(A A B).'s circle (which includes the overlap) + the area of B's circle (which also includes the overlap) - the area of the overlap. We therefore get: P(A or B) = P(A) + P(B) - P(A and B).

použijeme – li to na náš příklad, zjistíme, že:

  • P (a nebo B)= P (včasné doručení pomocí této strategie)= 0.90 + 0.80 – 0.75 = 0.95.

takže naše strategie využití dvou doručovacích služeb zvyšuje naši pravděpodobnost včasného doručení na 0,95.

Zatímco Vennovy diagramy byly skvělé vizualizovat Kromě Obecné Pravidlo, že v případech jako jsou tyto je to mnohem jednodušší pro zobrazení informací a práce s obousměrnou tabulka pravděpodobnosti, podobně jako jsme zkoumali vztah mezi dvěma kategorické proměnné v Průzkumné Analýzy Dat sekce.

jednoduše vám ukážeme tabulku, ne jak ji odvodíme, protože nebudete požádáni, abyste to udělali za nás. Měli byste být schopni vidět, že nějaká logika a jednoduché sčítání/odčítání je vše, co jsme použili k vyplnění níže uvedené tabulky.

tabulka obsahuje sloupce" B"," ne B "a" celkem."Řádky jsou "A", "ne A" a " celkem."Zde jsou některé informace o tabulce, uspořádané buňkou: v buňce a, B, hodnota tam (0,75) je P (A A B) = P (včasné doručení oběma službami). V buňce a, nikoli B, je tam hodnota (0, 15)P (A a ne B) = P (včasné doručení pouze službou a). V buňce Ne A A B je hodnota (0,05)p (ne a A B) = P (včasné doručení pouze službou B). V buňce ne A a ne B je hodnota (0,05)p (ne A a ne B) = P (služba a ani B nebyla doručena včas)."B," "not B," and "Total." The rows are "A," "not A," and "Total." Here are is some information about the table, organized by cell: At the cell A,B, the value there (0.75) is P(A and B) = P(on-time delivery by both services). At the cell A,not B, the value there (0.15) is P(A and Not B) = P(on-time delivery ONLY by service A). At cell Not A and B, the value (0.05) is P(not A and B) = P(on-time delivery ONLY by service B). At cell Not A and Not B, the value (0.05) is P(not A and not B) = P(Neither service A nor B delivered on time).

Při použití dvou-způsob, tabulky, musíme si uvědomit, podívat se na celý řádek nebo sloupec najít celkové pravděpodobnosti zahrnující jen A nebo jen B.

  • P(A) = 0.90 znamená, že v 90% případů, kdy služba se používá, přináší dokument o době. Abychom to zjistili, podíváme se na celkovou pravděpodobnost řádku obsahujícího a. při hledání P (A) nevíme, zda se B stane nebo ne.

první řádek tabulky byl zvýrazněn. Zde je zvýrazněná data v Řádku, Sloupci formát: A, B: P(a B) = 0.75; A, B: P(A a ne-B) = 0.15;, Celkem: P(A) = 0.90 = P(a. B) + P(A a ne-B)'s first row has been highlighted. Here is the highlighted data in "Row, Column" format: A, B: P(A and B) = 0.75; A, not B: P(A and not B) = 0.15; A, Total: P(A) = 0.90 = P(A and B) + P(A and not B)

  • P(B) = 0.80 znamená, že v 80% případů, kdy služby B se používá, to přináší dokument o době. Abychom to zjistili, podíváme se na celkovou pravděpodobnost sloupce obsahujícího B. při hledání P (B) nevíme, zda se A stane nebo ne.

první sloupec tabulky byl zvýrazněn. Zde jsou zvýrazněná data v řádku, Formát sloupce: A, B: P (A A B) = 0,75; ne a, B: P (ne a A B) = 0.05; B Celkem: P(B) = 0.80 = P(a. B) + P(a B)'s first column has been highlighted. Here is the highlighted data in "Row, Column" format: A,B: P(A and B) = 0.75; not A, B: P(not A and B) = 0.05; B,Total: P(B) = 0.80 = P(A and B) + P(not A and B)

Komentář

  • Když jsme použili dvou-způsob, jakým tabulky v Explorační Analýza Dat (EDA) část, to bylo pro záznam hodnot dvou kategorických proměnných pro konkrétní vzorek jedinců.
  • naproti tomu informace v pravděpodobnostní obousměrné tabulce jsou pro celou populaci a hodnoty jsou spíše abstraktní.
  • Pokud bychom měli léčit něco jako doručení například v EDA části, bychom zaznamenali skutečný počet na čas (a ne na čas) dodávky pro vzorky dokumentů poštou s servis A nebo B.
  • V této části, dlouhodobé pravděpodobnosti jsou prezentovány jako známý.
  • pravděpodobně byly hlášené pravděpodobnosti v tomto příkladu dodání založeny na relativních frekvencích zaznamenaných během mnoha opakování.

interaktivní Applet: pravděpodobnostní Vennův Diagram

zaokrouhlovací pravidlo pro Pravděpodobnost:

postupujte podle následujících obecných pokynů v tomto kurzu. V případě pochybností nést více desetinných míst. Pokud specifikujeme, uveďte přesně to, co je požadováno.

  • obecně platí, že pro přechodné kroky byste měli mít pravděpodobnost alespoň na 4 desetinná místa.
  • často zaokrouhlujeme naši konečnou odpověď na dvě nebo tři desetinná místa.
  • Pro velmi malé pravděpodobnosti, je důležité mít 1 nebo dvě platné číslice (nenulové číslice), jako 0.000001 nebo 0.000034, atd.

Mnoho počítačových balíčků může zobrazit velmi malé hodnoty ve vědecké notaci,

  • 58×10-5 nebo 1,58 E-5 reprezentovat 0.0000158

Pojďme Shrnout

zatím v naší studii pravděpodobnost, že jste byla zavedena k někdy pult-intuitivní povahu pravděpodobnosti a základy, které jsou základem pravděpodobnost, jako relativní četnost.

také jsme vám poskytli několik nástrojů, které vám pomohou najít pravděpodobnosti událostí-konkrétně pravidla pravděpodobnosti.

asi Jste si všimli, že pravděpodobnost, že sekce byla výrazně odlišná od předchozích dvou částí; to má mnohem větší technické/matematické komponenty, takže výsledky mají tendenci být více „správné nebo špatné“ přírody.

V Průzkumné Analýzy Dat sekce, pro nejvíce se rozdělit, počítač se postaral o technickou stránku věci, a naše úkoly byly to říct, aby udělal správnou věc a pak interpretovat výsledky.

v pravděpodobnosti děláme práci od začátku do konce, od výběru správného nástroje (pravidla), který chcete použít, přes jeho správné použití až po interpretaci výsledků.

zde je shrnutí pravidel, která jsme dosud představili.

1. Pravidlo pravděpodobnosti č. 1 uvádí:

  • pro každou událost a, 0 ≤ P (a) ≤ 1

2. Pravděpodobnost Pravidlo #2 státy:

  • součet pravděpodobností všech možných výsledků je 1

3. Doplněk Pravidlo (#3) uvádí, že

  • P () = 1 – P(A)

nebo když předělaný

  • P(A) = 1 – P(ne)

druhé zastoupení Doplnit Pravidlo je zvláště užitečné, když potřebujeme najít pravděpodobnosti událostí takového „alespoň jeden z …“

4. Obecný Kromě Pravidlo (#5) uvádí, že pro jakékoliv dvě události,

  • P(A nebo B) = P(A) + P(B) – P(a a B),

, kde P(A nebo B) rozumíme P(nastane, nebo B dojde nebo obojí).

Ve zvláštním případě nesouvislé události, události, která nemůže nastat společně, Kromě Obecné Pravidlo může být snížena na Toho Pravidlo pro Disjunktní Jevy (#4), což je

  • P(A nebo B) = P(A) + P(B). *

* používejte pouze tehdy, pokud jste přesvědčeni, že události jsou disjunktní (nepřekrývají se)

5. Omezená verze pravidla přidávání (pro disjunktní události) lze snadno rozšířit na více než dvě události.

6. Zatím jsme našli pouze P (A A B) pomocí logiky a počítání v jednoduchých příkladech

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *