Basic Kans Regels

  • Inleiding
  • de Regels van de Waarschijnlijkheid
    • Kans Regel Een (Voor elke gebeurtenis A, 0 ≤ P(A) ≤ 1)
    • Kans Regel Twee (De som van de kansen van alle mogelijke uitkomsten is 1)
    • Kans Regel Drie (De Aanvulling op Regel)
    • Kansen Waarbij Meerdere Events
    • Kans Regel Vier (Naast de Regel voor Disjuncte Gebeurtenissen)
    • het Vinden van P(A en B) met behulp van Logische
    • Kans Regel Vijf (de Algemene Optelregel)
  • Afrondingsregel voor waarschijnlijkheid
  • laten we
CO-6 samenvatten: basisconcepten van waarschijnlijkheid, willekeurige variatie en algemeen gebruikte statistische kansverdelingen toepassen.
LO 6.4: relateer de waarschijnlijkheid van een gebeurtenis aan de waarschijnlijkheid van deze gebeurtenis.
LO 6.5: Pas de relatieve frequentiebenadering toe om de waarschijnlijkheid van een gebeurtenis te schatten.
LO 6.6: Pas basisregels voor logica en waarschijnlijkheid toe om de empirische waarschijnlijkheid van een gebeurtenis te vinden.
Video: Basic Probability Rules (25:17)

in de vorige paragraaf introduceerden we waarschijnlijkheid als een manier om de onzekerheid te kwantificeren die voortvloeit uit het uitvoeren van experimenten met behulp van een willekeurige steekproef uit de populatie van belang.

we zagen dat de kans op een gebeurtenis (bijvoorbeeld de gebeurtenis dat een willekeurig gekozen persoon bloedgroep O heeft) kan worden geschat door de relatieve frequentie waarmee de gebeurtenis optreedt in een lange reeks van onderzoeken. Dus we zouden gegevens verzamelen van veel individuen om de kans te schatten dat iemand bloedgroep O.

In deze sectie zullen we de basismethoden en principes vaststellen voor het vinden van waarschijnlijkheden van gebeurtenissen.

We zullen ook enkele basisregels van waarschijnlijkheid behandelen die kunnen worden gebruikt om waarschijnlijkheden te berekenen.

Inleiding

we beginnen met een klassiek voorbeeld van drie keer gooien van een eerlijke munt.

aangezien kop en munt in dit scenario even waarschijnlijk zijn voor elke toss, zal elk van de mogelijkheden die kunnen voortvloeien uit drie tosses ook even waarschijnlijk zijn, zodat we alle mogelijke waarden kunnen opsommen en deze lijst kunnen gebruiken om waarschijnlijkheden te berekenen.

aangezien onze focus in deze cursus is op gegevens en statistieken (niet theoretische waarschijnlijkheid), zullen we in de meeste van onze toekomstige problemen een samengevatte dataset gebruiken, meestal een frequentietabel of een tweerichtingstabel, om waarschijnlijkheden te berekenen.

voorbeeld: Toss a fair coin three times

laten we een lijst maken van elk mogelijk resultaat (of mogelijk resultaat):

{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}

laten we nu de volgende gebeurtenissen definiëren:

Event A: “Getting no H”

Event B: “Getting exact one H”

Event C: “Getting at least one H”

merk op dat elke gebeurtenis inderdaad een verklaring is over het resultaat dat het experiment gaat produceren. In de praktijk komt elke gebeurtenis overeen met een verzameling (deelverzameling) van de mogelijke uitkomsten.

Gebeurtenis a: “Geen H krijgen” → TTT

Gebeurtenis B: “Getting exact one H” → HTT, THT, TTH

Event C: “Getting at least one H” → HTT, THT, TTH, THH, HTH, HHT, HHH

Hier is een visuele representatie van gebeurtenissen A, B en C.

we hebben een grote rechthoek gelabeld "S" die vertegenwoordigt het geheel van de steekproefruimte. Binnen deze rechthoek hebben we een cirkel gelabeld "C." alles buiten "C gebeurt te coincied met event A die alleen "TTT". Binnen in C zien we "HHH, ""THH, "" HTH," "HHT," en een cirkel die gebeurtenis B. binnen B zijn "HHT, ""THT," en " TTH."Merk op dat alle items binnen b ook binnen C zitten, zodat C volledig B."S" which represents the entirety of the sample space. Inside this rectangle we have a circle labeled "C." Everything outside of "C happens to coincied with event A containing only "TTT". Inside of C, we see "HHH," "THH," "HTH," "HHT," and a circle representing event B. Inside B are "HHT," "THT," and "TTH." Note that all of the items inside B are also inside C, so C fully encloses B.

omsluit van deze visuele representatie van de gebeurtenissen, is het gemakkelijk om te zien dat Gebeurtenis B volledig is opgenomen in Gebeurtenis C, in de zin dat elke uitkomst in Gebeurtenis B ook een uitkomst is in Gebeurtenis C. merk ook op dat Gebeurtenis A zich onderscheidt van gebeurtenissen B en C, in de zin dat ze geen uitkomst gemeen hebben, of geen overlapping hebben. Op dit punt zijn dit slechts opmerkelijke observaties, maar zoals je later zult ontdekken, zijn het zeer belangrijke.

Wat als we de nieuwe gebeurtenis toevoegen:

Gebeurtenis D: “Getting a T on the first toss” → THH, THT, TTH, TTT

Hoe zou het eruit zien als we event D aan het bovenstaande diagram zouden toevoegen? (Link naar het antwoord)

onthoud, aangezien H en T bij elke toss even waarschijnlijk zijn en er 8 mogelijke uitkomsten zijn, is de kans op elk resultaat 1/8.

kijk of u de volgende vragen kunt beantwoorden met behulp van de diagrammen en/of de lijst met uitkomsten voor elke gebeurtenis samen met wat u tot nu toe hebt geleerd over waarschijnlijkheid.

leren door te doen: Een eerlijke munt driemaal gooien

als je in staat was om die vragen correct te beantwoorden, heb je waarschijnlijk een goed instinct voor het berekenen van waarschijnlijkheid! Lees verder om te leren hoe we deze kennis gaan toepassen.

indien niet, zullen we proberen u te helpen deze vaardigheid te ontwikkelen in deze sectie.

opmerking:

  • merk op dat in geval C, “Getting at least one head” er slechts één mogelijke uitkomst ontbreekt, “Getting NO heads” = TTT. We zullen dit opnieuw bespreken wanneer we het hebben over waarschijnlijkheidsregels, in het bijzonder de complementregel. Op dit punt willen we dat jullie nadenken over hoe deze twee gebeurtenissen “tegenpolen” zijn in dit scenario.

Het is erg belangrijk om te beseffen dat alleen omdat we de mogelijke uitkomsten kunnen opsommen, dit niet betekent dat elke uitkomst even waarschijnlijk is.

Dit is het (grappige) bericht in de Daily Show clip die we op de vorige pagina hebben gegeven. Maar laten we er nog eens over nadenken. In die clip beweert Walter dat aangezien er twee mogelijke uitkomsten zijn, de waarschijnlijkheid 0,5 is. De twee mogelijke uitkomsten zijn

  • de wereld zal vernietigd worden door het gebruik van de Large hadron collider
  • de wereld zal niet vernietigd worden door het gebruik van de large hadron collider

hopelijk is het duidelijk dat deze twee uitkomsten niet even waarschijnlijk zijn!!

laten we een meer algemeen voorbeeld bekijken.

voorbeeld: geboorteafwijkingen

stel dat we willekeurig drie kinderen selecteren en we zijn geïnteresseerd in de kans dat geen van de kinderen geboorteafwijkingen hebben.

we gebruiken de notatie D om aan te geven dat een kind geboren is met een geboorteafwijking en N om aan te geven dat het kind geboren is zonder geboorteafwijking. We kunnen de mogelijke uitkomsten net als bij het tossen opsommen, ze zijn:

{DDD, NDD, DND, DDN, DNN, NDN, NND, NNN}

zijn de gebeurtenissen DDD (alle drie de kinderen zijn geboren met geboorteafwijkingen) en NNN (geen van de kinderen zijn geboren met geboorteafwijkingen) even waarschijnlijk?

Het zou voor u redelijk moeten zijn dat P(NNN) veel groter is dan P(DDD).

Dit komt omdat P(N) en P (D) niet even waarschijnlijke gebeurtenissen zijn.

Het is zeldzaam (zeker niet 50%) dat een willekeurig gekozen kind met een geboorteafwijking wordt geboren.

Waarschijnlijkheidsregels

nu gaan we verder met het leren van enkele basisregels van waarschijnlijkheid.

gelukkig zijn deze regels zeer intuïtief, en zolang ze systematisch worden toegepast, zullen ze ons in staat stellen meer ingewikkelde problemen op te lossen; in het bijzonder die problemen waarvoor onze intuïtie misschien onvoldoende is.

aangezien de meeste waarschijnlijkheden die u zal worden gevraagd te vinden kunnen worden berekend met behulp van zowel

  • logica en het tellen van

en

  • de regels die we zullen leren,

geven we het volgende advies als Principe.

Principe:

als je een waarschijnlijkheid kunt berekenen met behulp van logica en tellen heb je geen waarschijnlijkheidsregel nodig (hoewel de juiste regel altijd kan worden toegepast)

Waarschijnlijkheidsregel Eén

onze eerste regel herinnert ons simpelweg aan de basiseigenschap van waarschijnlijkheid die we al hebben geleerd.

de waarschijnlijkheid van een gebeurtenis, die ons informeert over de waarschijnlijkheid van het optreden, kan variëren van 0 (wat aangeeft dat de gebeurtenis nooit zal plaatsvinden) tot 1 (wat aangeeft dat de gebeurtenis zeker is).

Waarschijnlijkheidsregel één:

  • voor elke gebeurtenis A, 0 ≤ P(A) ≤ 1.

opmerking: een praktisch gebruik van deze regel is dat deze kan worden gebruikt om elke waarschijnlijkheidsberekening die meer dan 1 (of minder dan 0) blijkt te zijn, als onjuist te identificeren.

voordat we verder gaan met de andere regels, laten we eerst kijken naar een voorbeeld dat een context zal bieden voor het illustreren van de volgende regels.

voorbeeld: bloedgroepen

zoals eerder besproken, kan al het menselijk bloed worden getypt als O, A, B of AB.

bovendien varieert de frequentie van het optreden van deze bloedgroepen per etnische en raciale groep.

volgens Stanford University ‘ s Blood Center (bloodcenter.Stanford.edu), dit zijn de waarschijnlijkheden van menselijke bloedgroepen in de Verenigde Staten (de waarschijnlijkheid voor type A is opzettelijk weggelaten):

motiverende vraag voor regel 2: een persoon in de Verenigde Staten wordt willekeurig gekozen. Wat is de kans dat de persoon bloedgroep A heeft?

antwoord: Onze intuïtie vertelt ons dat aangezien de vier bloedgroepen O, A, B en AB alle mogelijkheden uitputten, hun waarschijnlijkheden samen moeten optellen tot 1, Wat de kans is op een “bepaalde” gebeurtenis (een persoon heeft een van deze 4 bloedgroepen voor bepaalde).

aangezien de waarschijnlijkheden van O, B en AB samen optellen tot 0.44 + 0.1 + 0.04 = 0,58, de waarschijnlijkheid van type A moet de resterende 0.42 (1 – 0.58 = 0.42):

gegevens in "bloedgroep: waarschijnlijkheid" formaat: O: 0,44; A: 0,42; B: 0,10; AB: 0,04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Waarschijnlijkheidsregel twee

dit voorbeeld illustreert onze tweede regel, die ons vertelt dat de waarschijnlijkheid van alle mogelijke uitkomsten samen 1 moet zijn.

Waarschijnlijkheidsregel twee:

De som van de waarschijnlijkheden van alle mogelijke uitkomsten is 1.

Dit is een goede plek om te vergelijken en te contrasteren wat we hier doen met wat we hebben geleerd in de sectie explorative Data Analysis (Eda).

  • merk op dat we ons in dit probleem voornamelijk richten op één categorische variabele: bloedgroep.
  • we hebben deze variabele hierboven samengevat, zoals we enkele categorische variabelen in de Eda-sectie hebben samengevat, door een opsomming te geven van welke waarden de variabele neemt en hoe vaak ze neemt.
  • in EDA gebruikten we percentages, en hier gebruiken we waarschijnlijkheden, maar de twee geven dezelfde informatie.
  • in de Eda-sectie hebben we geleerd dat een cirkeldiagram een passende weergave biedt wanneer een enkele categorische variabele betrokken is, en op dezelfde manier kunnen we het hier gebruiken (met percentages in plaats van waarschijnlijkheden):

een cirkeldiagram, getiteld " Blood Types."Type O neemt 44% van het cirkeldiagram in beslag, A gebruikt 42%, AB staat voor 4% en B staat voor de rest, 10%. Merk op dat de soorten bloed die "niet O" nemen 56% van het cirkeldiagram."Blood Types." Type O takes up 44% of the pie chart, A uses 42%, AB represents 4%, and B represents the rest, 10%. Note that the types of blood which are "not O" take up 56% of the pie chart.

hoewel wat we hier doen inderdaad vergelijkbaar is met wat we hebben gedaan in de Eda-sectie, is er een subtiel maar belangrijk verschil tussen de onderliggende situaties

  • in EDA, vatte we gegevens samen die werden verkregen uit een steekproef van individuen voor wie waarden van de variabele van belang werden geregistreerd.wanneer we hier de waarschijnlijkheid van elke bloedgroep weergeven, denken we aan de gehele bevolking van mensen in de Verenigde Staten, waarvoor we ervan uitgaan dat we de algemene frequentie kennen van de waarden die door de variabele van belang worden genomen.
kreeg ik dit?: Waarschijnlijkheidsregel twee

Waarschijnlijkheidsregel drie

In waarschijnlijkheid en in zijn toepassingen, zijn we vaak geïnteresseerd in het vinden van de waarschijnlijkheid dat een bepaalde gebeurtenis niet zal plaatsvinden.

een belangrijk punt om hier te begrijpen is dat” Gebeurtenis A niet voorkomt “een afzonderlijke gebeurtenis is die bestaat uit alle mogelijke uitkomsten die niet in A voorkomen en wordt genoemd”de complementgebeurtenis van A. “

notatie: we zullen” not a ” schrijven om de gebeurtenis aan te duiden die A niet voorkomt. Hier is een visuele representatie van hoe event A en zijn complementgebeurtenis “niet A” samen alle mogelijke uitkomsten vertegenwoordigen.

de volledige monsterruimte S wordt weergegeven met een grijs kader. Binnen in dit kader is een blauwe cirkel, die alle uitkomsten in A. voorstelt.al het andere in het grijze kader maar buiten de blauwe cirkel is "geen A"."not A".

commentaar:

  • zo ‘ n visuele weergave wordt een “Venn diagram genoemd.”Een Venn-diagram is een eenvoudige manier om gebeurtenissen en de relaties tussen hen te visualiseren met behulp van rechthoeken en cirkels.

regel 3 behandelt de relatie tussen de waarschijnlijkheid van een gebeurtenis en de waarschijnlijkheid van zijn complementgebeurtenis.

gegeven dat Gebeurtenis A en gebeurtenis “not A” samen alle mogelijke uitkomsten vormen, en omdat regel 2 ons vertelt dat de som van de waarschijnlijkheden van alle mogelijke uitkomsten 1 is, moet de volgende regel vrij intuïtief zijn:

Waarschijnlijkheidsregel drie (de Complementregel):

  • P(not a) = 1 – P(A)
  • dat wil zeggen, de waarschijnlijkheid dat een event does not occur is 1 min de kans dat het wel voorkomt.

voorbeeld: bloedgroepen

terug naar de bloedgroep voorbeeld:

Hier is enige aanvullende informatie:

  • een persoon met type A kan bloed doneren aan een persoon met type A of AB.
  • een persoon met type B kan bloed doneren aan een persoon met type B of AB.
  • een persoon met type AB kan alleen bloed doneren aan een persoon met type AB.
  • een persoon met bloedgroep O kan aan iedereen doneren.

Wat is de kans dat een willekeurig gekozen persoon geen bloed aan iedereen kan doneren? Met andere woorden, Wat is de kans dat een willekeurig gekozen persoon geen bloedgroep O heeft? We moeten P(niet O) vinden. Met behulp van de Complement regel, P(not O) = 1 – P(O) = 1 – 0,44 = 0,56. Met andere woorden, 56% van de Amerikaanse bevolking heeft geen bloedgroep O:

duidelijk kunnen we P (niet O) direct vinden door de waarschijnlijkheden van B, AB en A. toe te voegen

:

  • merk op dat de Complement regel, P(not a) = 1 – P(A) kan worden geherformuleerd als P(A) = 1-P(not A).
    • P(not A) = 1 – P(A)
    • kan opnieuw worden geformuleerd als P(A) = 1-P (not A).
    • deze schijnbaar triviale algebraïsche manipulatie heeft een belangrijke toepassing, en vangt eigenlijk de sterkte van de complement regel.
    • in sommige gevallen, wanneer het direct vinden van P(A) erg ingewikkeld is, kan het veel gemakkelijker zijn om P(niet A) te vinden en het dan gewoon af te trekken van 1 om de gewenste P(A) te krijgen.
    • we komen binnenkort terug op deze opmerking en geven extra voorbeelden.
kreeg ik dit?: Waarschijnlijkheidsregel drie
  • De complementregel kan nuttig zijn wanneer het gemakkelijker is om de waarschijnlijkheid van de complement van de gebeurtenis te berekenen in plaats van de gebeurtenis zelf.
  • let op, we gebruikten opnieuw de zin “ten minste één.”
  • nu hebben we gezien dat de complement van “ten minste één …” is “geen …” of ” nee ….”(zoals we eerder vermeldden in termen van de gebeurtenissen zijn “tegenpolen”).
  • in de bovenstaande activiteit zien we dat
    • P(geen van deze twee bijwerkingen) = 1 – P(minstens één van deze twee bijwerkingen )
  • Dit is een veel voorkomende toepassing van de complementregel die u vaak kunt herkennen aan de zinsnede “ten minste één” in het probleem.

waarschijnlijkheden met meerdere gebeurtenissen

We zullen vaak geïnteresseerd zijn in het vinden van waarschijnlijkheden met meerdere gebeurtenissen zoals

  • P (a of B) = P(gebeurtenis a optreedt of gebeurtenis B optreedt of beide optreden)
  • P(zowel gebeurtenis A als gebeurtenis B optreedt)

een veel voorkomend probleem met terminologie heeft betrekking op hoe we gewoonlijk denken over “of” in onze dagelijkse leven. Bijvoorbeeld, wanneer een ouder tegen zijn of haar kind in een speelgoedwinkel zegt “Wil je speelgoed A of speelgoed B?”, dit betekent dat het kind slechts één speeltje krijgt en dat hij of zij moet kiezen tussen hen. Het krijgen van beide speelgoed is meestal geen optie.

in tegenstelling:

In waarschijnlijkheid betekent “OR” een van beide of beide.

en dus P(A of B) = P(gebeurtenis a treedt op of gebeurtenis B treedt op of beide treden op)

Dit gezegd hebbende, moet worden opgemerkt dat er enkele gevallen zijn waarin het eenvoudigweg onmogelijk is dat beide gebeurtenissen tegelijkertijd plaatsvinden.

Waarschijnlijkheidsregel Vier

het onderscheid tussen gebeurtenissen die samen kunnen gebeuren en gebeurtenissen die dat niet kunnen is belangrijk.

disjunct: Twee gebeurtenissen die niet tegelijkertijd kunnen plaatsvinden worden disjunct of wederzijds exclusief genoemd. (We zullen disjunct gebruiken.)

een Venn-diagram met de titel " A en B zijn disjunct."De gehele monsterruimte wordt weergegeven als een rechthoek. In de rechthoek bevinden zich twee afzonderlijke Cirkels. De ene cirkel vertegenwoordigt de gebeurtenissen in A en de andere de gebeurtenissen in B."A and B are Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two separate circles. One circle represents the events in A and the other represents the events in B.een Venn-diagram met de titel " A en B zijn niet disjunct."De gehele monsterruimte wordt weergegeven als een rechthoek. In de rechthoek bevinden zich twee cirkels. De ene cirkel vertegenwoordigt de gebeurtenissen in A en de andere vertegenwoordigt de gebeurtenissen in B. Deze twee zijn niet disjunct, zodat de twee cirkels elkaar gedeeltelijk overlappen. (Omdat het niet disjunct is, kunnen twee cirkels elkaar volledig overlappen, maar in dit voorbeeld doen ze dat niet.)"A and B are NOT Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two circles. One circle represents the occurrences in A and the other represents the occurrences in B. These two are not disjoint, so the two circles partially overlap each other. (Being NOT disjoint, two circles could overlap each other completely, but in this example they do not.)

uit de afbeelding moet duidelijk blijken dat

  • in het eerste geval, waar de gebeurtenissen niet disjunct zijn, P(A en B) ≠ 0
  • in het tweede geval, waar de gebeurtenissen disjunct zijn, P(A en B) = 0.

Hier zijn twee voorbeelden:

voorbeeld:

beschouw de volgende twee gebeurtenissen:

A — een willekeurig gekozen persoon heeft bloedgroep A, en

B — een willekeurig gekozen persoon heeft bloedgroep B.

in zeldzame gevallen is het mogelijk dat een persoon meer dan één type bloed door zijn of haar aderen stroomt, maar voor onze doeleinden gaan we ervan uit dat elke persoon slechts één bloedgroep kan hebben. Daarom is het onmogelijk dat de gebeurtenissen A en B samen plaatsvinden.

  • gebeurtenissen A en B zijn disjunct

aan de andere kant …

voorbeeld:

beschouw de volgende twee gebeurtenissen:

A — een willekeurig gekozen persoon heeft bloedgroep A

B — een willekeurig gekozen persoon is een vrouw.

in dit geval is het mogelijk dat gebeurtenissen A en B samen voorkomen.

  • gebeurtenissen A en B zijn niet disjunct.

De Venn-diagrammen suggereren dat een andere manier om disjunct versus niet disjunct gebeurtenissen te denken is dat disjunct gebeurtenissen elkaar niet overlappen. Ze delen geen van de mogelijke resultaten en kunnen daarom niet samen gebeuren.

aan de andere kant overlappen gebeurtenissen die niet disjunct zijn in die zin dat ze een aantal van de mogelijke uitkomsten delen en daarom tegelijkertijd kunnen optreden.

We beginnen nu met een eenvoudige regel voor het vinden van P (A of B) voor disjuncte gebeurtenissen.

Waarschijnlijkheidsregel vier (de Optelregel voor disjuncte gebeurtenissen):

  • als A en B disjuncte gebeurtenissen zijn, dan P(A of B) = P(A) + P(B).

opmerking:

  • bij het behandelen van waarschijnlijkheden zal het woord “or” altijd geassocieerd worden met de operatie van optelling; vandaar de naam van deze regel, “de toevoeging regel.”

voorbeeld: bloedgroepen

herinner de bloedgroep voorbeeld:

gegevens gegeven in "bloedgroep: waarschijnlijkheid" formaat: O: 0,44; A: 0,42; B: 0,10; AB: 0,04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Hier is enige aanvullende informatie

  • een persoon met type Acan doneert bloed aan een persoon met type A of ab.
  • een persoon met type B kan bloed doneren aan een persoon met type B of AB.
  • een persoon met type AB kan bloed doneren aan een persoon met type AB
  • een persoon met type Oblood kan aan iedereen doneren.

Wat is de kans dat een willekeurig gekozen persoon een potentiële donor is voor een persoon met bloedgroep A?

uit de gegeven informatie weten we dat een potentiële donor zijn voor een persoon met bloedgroep A betekent dat hij bloedgroep A of O heeft.

daarom moeten we P(A of O) vinden. Omdat de gebeurtenissen A en O disjunct zijn, kunnen we de optelregel voor disjunct gebeurtenissen gebruiken om:

  • P(a Of O) = P(A) + P(O) = 0,42 + 0,44 = 0,86 te krijgen.

het is gemakkelijk in te zien waarom het toevoegen van de waarschijnlijkheid eigenlijk zinvol is.

Als 42% van de bevolking heeft bloedgroep A en 44% van de bevolking heeft bloedgroep O,

  • dan 42% + 44% = 86% van de bevolking heeft bloedgroep A of O, en dus potentiële donoren om een persoon met bloedgroep A.

Deze redenering over de reden waarom de toevoeging regel zinvol kan worden gevisualiseerd met behulp van het cirkeldiagram hieronder:

Een cirkeldiagram met de titel "bloedgroepen."Type A neemt 42% van het cirkeldiagram in beslag, en type O neemt 44% in beslag. Samen nemen zij als A of O 86% van het cirkeldiagram in beslag."Blood Types." Type A takes up 42% of the pie chart, and type O takes up 44%. Together, as A or O, they take up 86% of the pie chart.

Leer door te doen: Waarschijnlijkheidsregel Vier

commentaar:

  • De Optelregel voor disjuncte gebeurtenissen kan natuurlijk worden uitgebreid tot meer dan twee disjuncte gebeurtenissen. Laten we er bijvoorbeeld drie nemen. Als A, B en C drie disjuncte gebeurtenissen zijn
een Venn-Diagram met 3 disjuncte gebeurtenissen. Zoals gewoonlijk is er een grijze doos met de volledige monsterruimte. In deze grijze doos zitten drie volledig gescheiden Cirkels. De eerste cirkel is voor de voorvallen in A, de tweede voor voorvallen in B, en de derde voor voorvallen in C.

dan P(A of B of C) = P(A) + P(B) + P(C). De regel is hetzelfde voor een aantal disjuncte gebeurtenissen.

heb ik dit ontvangen?: Waarschijnlijkheidsregel Vier

We zijn nu klaar met de eerste versie van de Optellings regel (regel vier) die de versie is die beperkt is tot disjuncte gebeurtenissen. Voordat we de tweede versie behandelen, moeten we eerst P(A en B) bespreken.

p(A en B) vinden met behulp van logica

We gaan nu over tot het berekenen

  • P(a en B)= P(zowel gebeurtenis A als gebeurtenis B)

Later zullen we de regels voor het berekenen van P(A en B) bespreken.

ten eerste willen we illustreren dat een regel niet nodig is wanneer u het antwoord kunt bepalen door logica en tellen.

speciaal geval:

er is één speciaal geval waarvoor we weten wat P(A en B) is zonder enige regel toe te passen.

leren door te doen: Het vinden van P (A en B) # 1

dus, als gebeurtenissen A en B disjunct zijn, dan (per definitie) P(A en B)= 0. Maar wat als de gebeurtenissen niet onsamenhangend zijn?

bedenk dat Regel 4, De Optellings-regel, twee versies heeft. Eén is beperkt tot disjuncte gebeurtenissen, die we al hebben behandeld, en we zullen later in deze module de meer algemene versie behandelen. Hetzelfde geldt voor waarschijnlijkheden met betrekking tot en

echter, behalve in speciale gevallen, zullen we vertrouwen op logica om P(A en B) in deze cursus te vinden.

voordat we formele regels behandelen, laten we eens kijken naar een voorbeeld waar de gebeurtenissen niet disjunct zijn.

voorbeeld: parodontale Status en geslacht

bekijk de volgende tabel met betrekking tot de parodontale status van individuen en hun geslacht. Parodontale status verwijst naar tandvleesaandoeningen waar individuen worden geclassificeerd als ofwel gezond, hebben gingivitis, of hebben parodontitis.

we hebben dit type tabel eerder gezien toen we het analyseren van data bespraken in geval C → C. Voor het doel van deze vraag zullen we deze gegevens gebruiken als onze “populatie” en overwegen willekeurig één persoon te selecteren.

Leer door te doen: parodontale Status en geslacht

We stellen graag waarschijnlijkheidsvragen vergelijkbaar met het vorige voorbeeld (met behulp van een tweewegtabel op basis van gegevens) omdat dit u in staat stelt om verbindingen te maken tussen deze onderwerpen en helpt je houdt een deel van wat je hebt geleerd over data vers in je geest.

onthoud, ons primaire doel in deze cursus is het analyseren van real-life data!

Waarschijnlijkheidsregel vijf

We zijn nu klaar om door te gaan naar de uitgebreide versie van de Optellings regel.

In deze sectie zullen we leren hoe P(A of B) te vinden wanneer A en B niet noodzakelijk disjunct zijn.

  • we noemen deze uitgebreide versie de “Algemene Optellings regel” en stellen het als Waarschijnlijkheidsregel vijf.

We zullen beginnen met het geven van de regel en het geven van een voorbeeld vergelijkbaar met de soorten problemen die we in deze cursus meestal vragen. Dan zullen we een meer een ander voorbeeld presenteren waar we niet de ruwe gegevens van een steekproef hebben om van te werken.

Waarschijnlijkheidsregel vijf:

  • de Algemene Optelregel: P(A of B) = P(A) + P(B) – P(A en B).

opmerking: Het is het beste om logica te gebruiken om P(A en B) te vinden, niet een andere formule.

een veel voorkomende fout is het onjuist toepassen van de vermenigvuldigingsregel voor onafhankelijke gebeurtenissen die op de volgende pagina worden behandeld. Dit is alleen correct als A en B onafhankelijk zijn (zie hierna te volgen definities), wat zelden het geval is in gegevens die in tweerichtingstabellen worden gepresenteerd.

zoals we in vorige voorbeelden hebben gezien, is er enige overlap tussen de gebeurtenissen wanneer de twee gebeurtenissen niet disjunct zijn.

  • als we gewoon de twee waarschijnlijkheden bij elkaar optellen, krijgen we het verkeerde antwoord omdat we twee keer wat “waarschijnlijkheid” hebben geteld!
  • dus moeten we deze “extra” waarschijnlijkheid Aftrekken om tot het juiste antwoord te komen. Het Venn-diagram en de tweewegtabellen zijn nuttig bij het visualiseren van dit idee.

een venn-diagram met de titel " A en B zijn niet disjunct."Een grijze doos vertegenwoordigt de steekproefruimte, en binnen zijn twee blauwe cirkels die een overlappend gebied hebben. De ene cirkel is gelabeld met A en de andere met B. Het gebied waar de twee cirkels elkaar overlappen geeft aan dat gebeurtenissen A en B tegelijkertijd kunnen plaatsvinden, dus P(A en B) ≠ 0."A and B are NOT Disjoint." A gray box represents the sample space, and inside are two blue circles which have an overlapping area. One circle is labeled A and the other is labeled B. The area where the two circles overlap represents that Events A and B can occur at the same time, so P(A and B) ≠ 0.

deze regel is algemener omdat het werkt voor elk paar gebeurtenissen (zelfs disjuncte gebeurtenissen). Ons advies is nog steeds om te proberen om de vraag te beantwoorden met behulp van logica en tellen waar mogelijk, anders moeten we uiterst voorzichtig zijn om de juiste regel voor het probleem te kiezen.

Principe:

als je een waarschijnlijkheid kunt berekenen met behulp van logica en tellen heb je geen waarschijnlijkheidsregel nodig (hoewel de juiste regel altijd kan worden toegepast)

merk op dat, als A en B disjunct zijn, P(A en B) = 0 en regel 5 voor dit speciale geval reduceert tot regel 4.

een Venn-Diagram met de titel " A en B zijn disjunct. De volledige monsterruimte S wordt weergegeven als een grijze rechthoek. Binnen zijn twee, aparte, niet-overlappende blauwe cirkels. De ene cirkel is voor de voorvallen in A en de andere voor voorvallen in B."A and B are Disjoint. The entire sample space S is represented as a gray rectangle. Inside are two, separate, non-overlapping blue circles. One circle is for the occurrences in A and the other for occurrences in B.

laten we het laatste voorbeeld opnieuw bekijken:

voorbeeld: parodontale Status en geslacht

overweeg willekeurig een individu te selecteren uit de in de volgende tabel weergegeven gevallen met betrekking tot de parodontale status van individuen en hun geslacht. Parodontale status verwijst naar tandvleesaandoeningen waar individuen worden geclassificeerd als ofwel gezond, hebben gingivitis, of hebben parodontitis.

laten we bekijken wat we tot nu toe hebben geleerd. We kunnen elke waarschijnlijkheid in dit scenario berekenen als we kunnen bepalen hoeveel individuen voldoen aan de gebeurtenis of combinatie van gebeurtenissen.

  • P(Man) = 3009/8027 = 0.3749
  • P(Vrouw) = 5018/8027 = 0.6251
  • P(Gezonde) = 3750/8027 = 0.4672
  • P(Niet Gezond) = P(Gingivitis of Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
    We kunnen ook berekenen met behulp van de aanvulling op regel: 1 – P(Gezond)

We hebben ook eerder gevonden dat

  • P(Mannelijke EN Gezond) = 1143/8027 = 0.1424

Terugroepregel 5, P(A of B) = P(A) + P(B) – P(A en B). We gebruiken nu deze regel om P(Mannelijk of gezond)

  • p(Mannelijk of gezond) = P(Mannelijk) + P(gezond) – P(mannelijk en gezond) = 0.3749 + 0.4672 – 0.1424 = 0,6997 of ongeveer 70%

we losten deze vraag eerder op door simpelweg te tellen hoeveel individuen Mannelijk of gezond zijn of beide. De afbeelding hieronder illustreert de waarden die we moeten combineren. We moeten

  • alle mannen
  • alle gezonde individuen
  • tellen, maar niemand twee keer tellen!!

Met deze logische benadering vinden we

  • P (Mannelijk of gezond) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996

we hebben een klein verschil in onze antwoorden in de laatste decimaal als gevolg van de afronding die optrad toen we P(Mannelijk), P(gezond), en P(mannelijk en gezond) berekenden en vervolgens regel 5 toepasten.

Het antwoord is duidelijk hetzelfde, ongeveer 70%. Als we onze antwoorden naar meer decimalen zouden voeren of als we de originele breuken zouden gebruiken, zouden we deze kleine discrepantie volledig kunnen elimineren.

laten we eens kijken naar een laatste voorbeeld om Waarschijnlijkheidsregel 5 te illustreren wanneer de regel nodig is – dat wil zeggen wanneer we geen werkelijke gegevens hebben.

voorbeeld: belangrijke levering!

Het is van vitaal belang dat een bepaald document binnen één dag zijn bestemming bereikt. Om de kans op tijdige levering te maximaliseren, worden twee kopieën van het document verzonden met behulp van twee diensten, service A en service B. Het is bekend dat de kansen op tijdige levering zijn:

  • 0,90 voor service A (P(A) = 0,90)
  • 0,80 voor service B (P(B) = 0,80)
  • 0.75 voor beide diensten die op tijd zijn(P(A en B) = 0,75)
    (merk op dat A en B niet disjunct zijn. Ze kunnen samen gebeuren met kans 0,75.)

De Venn-diagrammen hieronder illustreren de waarschijnlijkheden P (A), P(B) en P(A en B):

drie Venn-diagrammen. In alle van hen is er een grote rechthoek die alle van de steekproefruimte S. vertegenwoordigt binnen deze rechthoek zijn twee cirkels die gedeeltelijk overlappen. De ene cirkel is gelabeld met A en de andere met B. In het eerste Venn Diagram is de cirkel voor A blauw gekleurd, en we zien dat P ( A) = 0,90 . In zekere zin is P (A) de oppervlakte van de A-cirkel. In het tweede Venn Diagram is de cirkel voor B blauw gekleurd, en het is gemarkeerd dat P (B) = 0,80 . Net als in het eerste Venn diagram kan men denken dat de cirkel voor B een oppervlakte heeft van 0,80 . In het derde Venn Diagram is het gebied dat de overlap van cirkels A en B is blauw gekleurd. P (A en B) = 0,75 . De oppervlakte van de overlap kan worden gezien als een oppervlakte van 0,75 .

in de context van dit probleem is de voor de hand liggende vraag van belang:

  • Hoe groot is de kans dat het document met behulp van deze strategie op tijd wordt afgeleverd (door het via beide diensten te verzenden)?

het document zal zijn bestemming op tijd bereiken zolang het op tijd wordt geleverd door Dienst A of door dienst B of door beide diensten. Met andere woorden, wanneer gebeurtenis A optreedt of gebeurtenis B optreedt of beide optreden. dus….

P(op tijd levering met behulp van deze strategie)= P(A of B), die wordt weergegeven door de gearceerde regio in het onderstaande diagram:

hetzelfde Venn Diagram behalve het gebied van de twee cirkels is blauw gekleurd (gearceerd). Dit betekent dat het gebied in de overlap ook blauw gekleurd is. Merk op dat het overlapgebied slechts één keer is gekleurd, dus ook al is het in beide cirkels we het één keer tellen.

We kunnen nu

  • gebruik van de drie Venn-diagrammen vertegenwoordigen P(A) P(B) en P(A en B)
  • om te zien, dat vinden we P(A of B) door het toevoegen van P(A) (vertegenwoordigd door de linker cirkel) en P(B) (vertegenwoordigd door de rechter cirkel),
  • vervolgens af te trekken van P(A en B) (vertegenwoordigd door de overlapping), aangezien we het nog tweemaal, eenmaal als onderdeel van P(A) en eenmaal als onderdeel van de P(B).

Dit wordt weergegeven in de volgende afbeelding:

het gebied van beide cirkels in het Venn - diagram (het overlapgebied eenmaal tellen) wordt berekend als: het gebied van de cirkel van A (inclusief de overlap) + het gebied van de cirkel van B (inclusief de overlap) - het gebied van de overlap. We krijgen daarom: P(A of B) = P(A) + P(B) - P (A en B).'s circle (which includes the overlap) + the area of B's circle (which also includes the overlap) - the area of the overlap. We therefore get: P(A or B) = P(A) + P(B) - P(A and B).

als we dit toepassen op ons voorbeeld, vinden we dat:

  • P (a of B) = P (on-time delivery met behulp van deze strategie)= 0.90 + 0.80 – 0.75 = 0.95.onze strategie om twee bezorgdiensten te gebruiken verhoogt onze kans op tijdige levering tot 0,95.

    hoewel de Venn-diagrammen geweldig waren om de Algemene Optelregel te visualiseren, is het in gevallen als deze veel gemakkelijker om de informatie weer te geven en te werken met een tweerichtingstabel van waarschijnlijkheden, net zoals we de relatie tussen twee categorische variabelen onderzochten in de sectie verkennende gegevensanalyse.

    We zullen u gewoon de tabel laten zien, niet hoe we het afleiden omdat u niet gevraagd wordt om dit voor ons te doen. Je zou moeten kunnen zien dat enige logica en eenvoudige optellen/aftrekken alles is wat we gebruikten om de onderstaande tabel in te vullen.

    de tabel heeft de kolommen" B, "" not B, "en" totaal."De rijen zijn" A, ""Niet A," en " totaal."Hier is wat informatie over de tabel, georganiseerd door cel: bij de cel A, B, de waarde daar(0,75) is P(A en B) = P (on-time levering door beide diensten). In de cel A, Niet B, is de waarde daar (0,15) P(A en niet B) = P(tijdige levering alleen door service a). In cel niet A en B is de waarde (0,05) P(niet A en B) = P(tijdige levering alleen door dienst B). In cel niet A en niet B is de waarde (0,05) P(niet A en niet B) = P(noch dienst A noch B op tijd geleverd)."B," "not B," and "Total." The rows are "A," "not A," and "Total." Here are is some information about the table, organized by cell: At the cell A,B, the value there (0.75) is P(A and B) = P(on-time delivery by both services). At the cell A,not B, the value there (0.15) is P(A and Not B) = P(on-time delivery ONLY by service A). At cell Not A and B, the value (0.05) is P(not A and B) = P(on-time delivery ONLY by service B). At cell Not A and Not B, the value (0.05) is P(not A and not B) = P(Neither service A nor B delivered on time).

    wanneer een tweerichtingstabel wordt gebruikt, moeten we niet vergeten de hele rij of kolom te bekijken om algemene waarschijnlijkheden te vinden waarbij alleen A of alleen B.

    • P(a) = 0,90 betekent dat in 90% van de gevallen waarin service A wordt gebruikt, het document op tijd wordt afgeleverd. Om dit te vinden kijken we naar de totale waarschijnlijkheid voor de rij met A. Bij het vinden van P(A) weten we niet of B gebeurt of niet.

    de eerste rij van de tabel is gemarkeerd. Hier zijn de gemarkeerde gegevens in Rij-Kolomformaat: A, B: P(A en B) = 0,75; a, Niet B: P(A en niet B) = 0,15; A, totaal: P(A) = 0,90 = P(A en B) + P(A en niet B)'s first row has been highlighted. Here is the highlighted data in "Row, Column" format: A, B: P(A and B) = 0.75; A, not B: P(A and not B) = 0.15; A, Total: P(A) = 0.90 = P(A and B) + P(A and not B)

    • P(B) = 0,80 betekent dat in 80% van de gevallen waarin service B wordt gebruikt, het document op tijd wordt afgeleverd. Om dit te vinden kijken we naar de totale waarschijnlijkheid voor de kolom met B. Bij het vinden van P(B) weten we niet of A gebeurt of niet.

    de eerste kolom van de tabel is gemarkeerd. Hier zijn de gemarkeerde gegevens in Rij, Kolomformaat: A, B: P(A en B) = 0,75; niet A, B: P(niet A en B) = 0.05; B, totaal: P(B) = 0,80 = P(A en B) + P(niet A en B)'s first column has been highlighted. Here is the highlighted data in "Row, Column" format: A,B: P(A and B) = 0.75; not A, B: P(not A and B) = 0.05; B,Total: P(B) = 0.80 = P(A and B) + P(not A and B)

    commentaar

    • wanneer we tweerichtingstabellen gebruikten in de sectie explorative Data Analysis (Eda), moesten waarden van twee categorische variabelen worden vastgelegd voor een concrete steekproef van individuen.
    • daarentegen is de informatie in een waarschijnlijkheidstabel voor een hele populatie, en de waarden zijn vrij abstract.
    • als we iets als het leveringsvoorbeeld in de Eda-sectie hadden behandeld, zouden we het werkelijke aantal on-time (en niet-on-time) leveringen hebben geregistreerd voor monsters van documenten die met service A of B. werden gemaild.
    • in deze sectie worden de waarschijnlijkheid op lange termijn weergegeven als bekend.
    • vermoedelijk waren de gerapporteerde waarschijnlijkheden in dit leveringsvoorbeeld gebaseerd op relatieve frequenties die gedurende vele herhalingen werden geregistreerd.

interactieve Applet: kansrekening Venn Diagram

Afrondingsregel voor kansrekening:

Volg de volgende algemene richtlijnen in deze cursus. Bij twijfel meer decimalen dragen. Als we specificeren geef precies wat wordt gevraagd.

  • in het algemeen moet u waarschijnlijkheden tot ten minste 4 decimalen dragen voor tussenliggende stappen.
  • we ronden ons definitieve antwoord vaak af op twee of drie decimalen.
  • voor zeer kleine waarschijnlijkheden is het belangrijk om 1 of twee significante cijfers (niet-nul cijfers) te hebben, zoals 0,000001 of 0,000034, enz.

veel computerpakketten kunnen extreem kleine waarden weergeven met behulp van wetenschappelijke notatie zoals

  • 58×10-5 of 1.58 E-5 om 0,0000158

samen te vatten

tot nu toe in onze studie van waarschijnlijkheid, bent u in kennis gesteld van de soms contra-intuïtieve aard van waarschijnlijkheid en de grondbeginselen die ten grondslag liggen aan waarschijnlijkheid, zoals een relatieve frequentie.

we gaven je ook enkele tools om je te helpen de waarschijnlijkheden van gebeurtenissen te vinden-namelijk de waarschijnlijkheidsregels.

u hebt waarschijnlijk gemerkt dat de waarschijnlijkheidssectie significant verschilde van de twee voorgaande secties; Het heeft een veel grotere technische/wiskundige component, dus de resultaten hebben de neiging meer van de “goed of fout” aard te zijn.

in het gedeelte verkennende gegevensanalyse zorgde de computer grotendeels voor het technische aspect van de dingen, en onze taak bestond erin de computer te vertellen het juiste te doen en vervolgens de resultaten te interpreteren.

In waarschijnlijkheid doen we het werk van begin tot eind, van het kiezen van het juiste gereedschap (regel) om te gebruiken, tot het correct gebruiken, tot het interpreteren van de resultaten.

Hier is een samenvatting van de regels die we tot nu toe hebben gepresenteerd.

1. Waarschijnlijkheidsregel # 1 stelt:

  • voor elke gebeurtenis A, 0 ≤ P (A) ≤ 1

2. Waarschijnlijkheidsregel # 2 stelt:

  • De som van de waarschijnlijkheden van alle mogelijke uitkomsten is 1

3. De Complement regel (#3) stelt dat

  • P(not a) = 1 – P(a)

of wanneer herschikt

  • P(a) = 1 – P(not a)

de laatste representatie van de complement regel is vooral handig wanneer we waarschijnlijkheden moeten vinden van gebeurtenissen van de soort “ten minste één van …”

4. De Algemene Optelregel (#5) stelt dat voor elke twee gebeurtenissen,

  • P(a of B) = P(A) + P(B) – P(A en B),

waarbij we met P(A of B) P bedoelen (a komt voor of B komt voor of beide).

in het speciale geval van disjuncte gebeurtenissen, gebeurtenissen die niet samen kunnen voorkomen, kan de Algemene Optelregel worden gereduceerd tot de Optelregel voor disjuncte gebeurtenissen (#4), die

  • P(a of B) = P(A) + P(B) is. *

* alleen gebruiken als u ervan overtuigd bent dat de gebeurtenissen disjunct zijn (ze overlappen niet)

5. De beperkte versie van de optelregel (voor disjuncte gebeurtenissen) kan eenvoudig worden uitgebreid tot meer dan twee gebeurtenissen.

6. Tot nu toe hebben we alleen P (A en B) gevonden met behulp van logica en tellen in eenvoudige voorbeelden

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *