- Inleiding
- de Regels van de Waarschijnlijkheid
- Kans Regel Een (Voor elke gebeurtenis A, 0 ≤ P(A) ≤ 1)
- Kans Regel Twee (De som van de kansen van alle mogelijke uitkomsten is 1)
- Kans Regel Drie (De Aanvulling op Regel)
- Kansen Waarbij Meerdere Events
- Kans Regel Vier (Naast de Regel voor Disjuncte Gebeurtenissen)
- het Vinden van P(A en B) met behulp van Logische
- Kans Regel Vijf (de Algemene Optelregel)
- Afrondingsregel voor waarschijnlijkheid
- laten we
in de vorige paragraaf introduceerden we waarschijnlijkheid als een manier om de onzekerheid te kwantificeren die voortvloeit uit het uitvoeren van experimenten met behulp van een willekeurige steekproef uit de populatie van belang.
we zagen dat de kans op een gebeurtenis (bijvoorbeeld de gebeurtenis dat een willekeurig gekozen persoon bloedgroep O heeft) kan worden geschat door de relatieve frequentie waarmee de gebeurtenis optreedt in een lange reeks van onderzoeken. Dus we zouden gegevens verzamelen van veel individuen om de kans te schatten dat iemand bloedgroep O.
In deze sectie zullen we de basismethoden en principes vaststellen voor het vinden van waarschijnlijkheden van gebeurtenissen.
We zullen ook enkele basisregels van waarschijnlijkheid behandelen die kunnen worden gebruikt om waarschijnlijkheden te berekenen.
Inleiding
we beginnen met een klassiek voorbeeld van drie keer gooien van een eerlijke munt.
aangezien kop en munt in dit scenario even waarschijnlijk zijn voor elke toss, zal elk van de mogelijkheden die kunnen voortvloeien uit drie tosses ook even waarschijnlijk zijn, zodat we alle mogelijke waarden kunnen opsommen en deze lijst kunnen gebruiken om waarschijnlijkheden te berekenen.
aangezien onze focus in deze cursus is op gegevens en statistieken (niet theoretische waarschijnlijkheid), zullen we in de meeste van onze toekomstige problemen een samengevatte dataset gebruiken, meestal een frequentietabel of een tweerichtingstabel, om waarschijnlijkheden te berekenen.
voorbeeld: Toss a fair coin three times
laten we een lijst maken van elk mogelijk resultaat (of mogelijk resultaat):
{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}
laten we nu de volgende gebeurtenissen definiëren:
Event A: “Getting no H”
Event B: “Getting exact one H”
Event C: “Getting at least one H”
merk op dat elke gebeurtenis inderdaad een verklaring is over het resultaat dat het experiment gaat produceren. In de praktijk komt elke gebeurtenis overeen met een verzameling (deelverzameling) van de mogelijke uitkomsten.
Gebeurtenis a: “Geen H krijgen” → TTT
Gebeurtenis B: “Getting exact one H” → HTT, THT, TTH
Event C: “Getting at least one H” → HTT, THT, TTH, THH, HTH, HHT, HHH
Hier is een visuele representatie van gebeurtenissen A, B en C.
omsluit van deze visuele representatie van de gebeurtenissen, is het gemakkelijk om te zien dat Gebeurtenis B volledig is opgenomen in Gebeurtenis C, in de zin dat elke uitkomst in Gebeurtenis B ook een uitkomst is in Gebeurtenis C. merk ook op dat Gebeurtenis A zich onderscheidt van gebeurtenissen B en C, in de zin dat ze geen uitkomst gemeen hebben, of geen overlapping hebben. Op dit punt zijn dit slechts opmerkelijke observaties, maar zoals je later zult ontdekken, zijn het zeer belangrijke.
Wat als we de nieuwe gebeurtenis toevoegen:
Gebeurtenis D: “Getting a T on the first toss” → THH, THT, TTH, TTT
Hoe zou het eruit zien als we event D aan het bovenstaande diagram zouden toevoegen? (Link naar het antwoord)
onthoud, aangezien H en T bij elke toss even waarschijnlijk zijn en er 8 mogelijke uitkomsten zijn, is de kans op elk resultaat 1/8.
kijk of u de volgende vragen kunt beantwoorden met behulp van de diagrammen en/of de lijst met uitkomsten voor elke gebeurtenis samen met wat u tot nu toe hebt geleerd over waarschijnlijkheid.
als je in staat was om die vragen correct te beantwoorden, heb je waarschijnlijk een goed instinct voor het berekenen van waarschijnlijkheid! Lees verder om te leren hoe we deze kennis gaan toepassen.
indien niet, zullen we proberen u te helpen deze vaardigheid te ontwikkelen in deze sectie.
opmerking:
- merk op dat in geval C, “Getting at least one head” er slechts één mogelijke uitkomst ontbreekt, “Getting NO heads” = TTT. We zullen dit opnieuw bespreken wanneer we het hebben over waarschijnlijkheidsregels, in het bijzonder de complementregel. Op dit punt willen we dat jullie nadenken over hoe deze twee gebeurtenissen “tegenpolen” zijn in dit scenario.
Het is erg belangrijk om te beseffen dat alleen omdat we de mogelijke uitkomsten kunnen opsommen, dit niet betekent dat elke uitkomst even waarschijnlijk is.
Dit is het (grappige) bericht in de Daily Show clip die we op de vorige pagina hebben gegeven. Maar laten we er nog eens over nadenken. In die clip beweert Walter dat aangezien er twee mogelijke uitkomsten zijn, de waarschijnlijkheid 0,5 is. De twee mogelijke uitkomsten zijn
- de wereld zal vernietigd worden door het gebruik van de Large hadron collider
- de wereld zal niet vernietigd worden door het gebruik van de large hadron collider
hopelijk is het duidelijk dat deze twee uitkomsten niet even waarschijnlijk zijn!!
laten we een meer algemeen voorbeeld bekijken.
voorbeeld: geboorteafwijkingen
stel dat we willekeurig drie kinderen selecteren en we zijn geïnteresseerd in de kans dat geen van de kinderen geboorteafwijkingen hebben.
we gebruiken de notatie D om aan te geven dat een kind geboren is met een geboorteafwijking en N om aan te geven dat het kind geboren is zonder geboorteafwijking. We kunnen de mogelijke uitkomsten net als bij het tossen opsommen, ze zijn:
{DDD, NDD, DND, DDN, DNN, NDN, NND, NNN}
zijn de gebeurtenissen DDD (alle drie de kinderen zijn geboren met geboorteafwijkingen) en NNN (geen van de kinderen zijn geboren met geboorteafwijkingen) even waarschijnlijk?
Het zou voor u redelijk moeten zijn dat P(NNN) veel groter is dan P(DDD).
Dit komt omdat P(N) en P (D) niet even waarschijnlijke gebeurtenissen zijn.
Het is zeldzaam (zeker niet 50%) dat een willekeurig gekozen kind met een geboorteafwijking wordt geboren.
Waarschijnlijkheidsregels
nu gaan we verder met het leren van enkele basisregels van waarschijnlijkheid.
gelukkig zijn deze regels zeer intuïtief, en zolang ze systematisch worden toegepast, zullen ze ons in staat stellen meer ingewikkelde problemen op te lossen; in het bijzonder die problemen waarvoor onze intuïtie misschien onvoldoende is.
aangezien de meeste waarschijnlijkheden die u zal worden gevraagd te vinden kunnen worden berekend met behulp van zowel
- logica en het tellen van
en
- de regels die we zullen leren,
geven we het volgende advies als Principe.
Principe:
als je een waarschijnlijkheid kunt berekenen met behulp van logica en tellen heb je geen waarschijnlijkheidsregel nodig (hoewel de juiste regel altijd kan worden toegepast)
Waarschijnlijkheidsregel Eén
onze eerste regel herinnert ons simpelweg aan de basiseigenschap van waarschijnlijkheid die we al hebben geleerd.
de waarschijnlijkheid van een gebeurtenis, die ons informeert over de waarschijnlijkheid van het optreden, kan variëren van 0 (wat aangeeft dat de gebeurtenis nooit zal plaatsvinden) tot 1 (wat aangeeft dat de gebeurtenis zeker is).
Waarschijnlijkheidsregel één:
- voor elke gebeurtenis A, 0 ≤ P(A) ≤ 1.
opmerking: een praktisch gebruik van deze regel is dat deze kan worden gebruikt om elke waarschijnlijkheidsberekening die meer dan 1 (of minder dan 0) blijkt te zijn, als onjuist te identificeren.
voordat we verder gaan met de andere regels, laten we eerst kijken naar een voorbeeld dat een context zal bieden voor het illustreren van de volgende regels.
voorbeeld: bloedgroepen
zoals eerder besproken, kan al het menselijk bloed worden getypt als O, A, B of AB.
bovendien varieert de frequentie van het optreden van deze bloedgroepen per etnische en raciale groep.
volgens Stanford University ‘ s Blood Center (bloodcenter.Stanford.edu), dit zijn de waarschijnlijkheden van menselijke bloedgroepen in de Verenigde Staten (de waarschijnlijkheid voor type A is opzettelijk weggelaten):
motiverende vraag voor regel 2: een persoon in de Verenigde Staten wordt willekeurig gekozen. Wat is de kans dat de persoon bloedgroep A heeft?
antwoord: Onze intuïtie vertelt ons dat aangezien de vier bloedgroepen O, A, B en AB alle mogelijkheden uitputten, hun waarschijnlijkheden samen moeten optellen tot 1, Wat de kans is op een “bepaalde” gebeurtenis (een persoon heeft een van deze 4 bloedgroepen voor bepaalde).
aangezien de waarschijnlijkheden van O, B en AB samen optellen tot 0.44 + 0.1 + 0.04 = 0,58, de waarschijnlijkheid van type A moet de resterende 0.42 (1 – 0.58 = 0.42):
Waarschijnlijkheidsregel twee
dit voorbeeld illustreert onze tweede regel, die ons vertelt dat de waarschijnlijkheid van alle mogelijke uitkomsten samen 1 moet zijn.
Waarschijnlijkheidsregel twee:
De som van de waarschijnlijkheden van alle mogelijke uitkomsten is 1.
Dit is een goede plek om te vergelijken en te contrasteren wat we hier doen met wat we hebben geleerd in de sectie explorative Data Analysis (Eda).
- merk op dat we ons in dit probleem voornamelijk richten op één categorische variabele: bloedgroep.
- we hebben deze variabele hierboven samengevat, zoals we enkele categorische variabelen in de Eda-sectie hebben samengevat, door een opsomming te geven van welke waarden de variabele neemt en hoe vaak ze neemt.
- in EDA gebruikten we percentages, en hier gebruiken we waarschijnlijkheden, maar de twee geven dezelfde informatie.
- in de Eda-sectie hebben we geleerd dat een cirkeldiagram een passende weergave biedt wanneer een enkele categorische variabele betrokken is, en op dezelfde manier kunnen we het hier gebruiken (met percentages in plaats van waarschijnlijkheden):
hoewel wat we hier doen inderdaad vergelijkbaar is met wat we hebben gedaan in de Eda-sectie, is er een subtiel maar belangrijk verschil tussen de onderliggende situaties
- in EDA, vatte we gegevens samen die werden verkregen uit een steekproef van individuen voor wie waarden van de variabele van belang werden geregistreerd.wanneer we hier de waarschijnlijkheid van elke bloedgroep weergeven, denken we aan de gehele bevolking van mensen in de Verenigde Staten, waarvoor we ervan uitgaan dat we de algemene frequentie kennen van de waarden die door de variabele van belang worden genomen.
Waarschijnlijkheidsregel drie
In waarschijnlijkheid en in zijn toepassingen, zijn we vaak geïnteresseerd in het vinden van de waarschijnlijkheid dat een bepaalde gebeurtenis niet zal plaatsvinden.
een belangrijk punt om hier te begrijpen is dat” Gebeurtenis A niet voorkomt “een afzonderlijke gebeurtenis is die bestaat uit alle mogelijke uitkomsten die niet in A voorkomen en wordt genoemd”de complementgebeurtenis van A. “
notatie: we zullen” not a ” schrijven om de gebeurtenis aan te duiden die A niet voorkomt. Hier is een visuele representatie van hoe event A en zijn complementgebeurtenis “niet A” samen alle mogelijke uitkomsten vertegenwoordigen.
commentaar:
- zo ‘ n visuele weergave wordt een “Venn diagram genoemd.”Een Venn-diagram is een eenvoudige manier om gebeurtenissen en de relaties tussen hen te visualiseren met behulp van rechthoeken en cirkels.
regel 3 behandelt de relatie tussen de waarschijnlijkheid van een gebeurtenis en de waarschijnlijkheid van zijn complementgebeurtenis.
gegeven dat Gebeurtenis A en gebeurtenis “not A” samen alle mogelijke uitkomsten vormen, en omdat regel 2 ons vertelt dat de som van de waarschijnlijkheden van alle mogelijke uitkomsten 1 is, moet de volgende regel vrij intuïtief zijn:
Waarschijnlijkheidsregel drie (de Complementregel):
- P(not a) = 1 – P(A)
- dat wil zeggen, de waarschijnlijkheid dat een event does not occur is 1 min de kans dat het wel voorkomt.
voorbeeld: bloedgroepen
terug naar de bloedgroep voorbeeld:
Hier is enige aanvullende informatie:
- een persoon met type A kan bloed doneren aan een persoon met type A of AB.
- een persoon met type B kan bloed doneren aan een persoon met type B of AB.
- een persoon met type AB kan alleen bloed doneren aan een persoon met type AB.
- een persoon met bloedgroep O kan aan iedereen doneren.
Wat is de kans dat een willekeurig gekozen persoon geen bloed aan iedereen kan doneren? Met andere woorden, Wat is de kans dat een willekeurig gekozen persoon geen bloedgroep O heeft? We moeten P(niet O) vinden. Met behulp van de Complement regel, P(not O) = 1 – P(O) = 1 – 0,44 = 0,56. Met andere woorden, 56% van de Amerikaanse bevolking heeft geen bloedgroep O:
duidelijk kunnen we P (niet O) direct vinden door de waarschijnlijkheden van B, AB en A. toe te voegen
:
- merk op dat de Complement regel, P(not a) = 1 – P(A) kan worden geherformuleerd als P(A) = 1-P(not A).
- P(not A) = 1 – P(A)
- kan opnieuw worden geformuleerd als P(A) = 1-P (not A).
- deze schijnbaar triviale algebraïsche manipulatie heeft een belangrijke toepassing, en vangt eigenlijk de sterkte van de complement regel.
- in sommige gevallen, wanneer het direct vinden van P(A) erg ingewikkeld is, kan het veel gemakkelijker zijn om P(niet A) te vinden en het dan gewoon af te trekken van 1 om de gewenste P(A) te krijgen.
- we komen binnenkort terug op deze opmerking en geven extra voorbeelden.
- De complementregel kan nuttig zijn wanneer het gemakkelijker is om de waarschijnlijkheid van de complement van de gebeurtenis te berekenen in plaats van de gebeurtenis zelf.
- let op, we gebruikten opnieuw de zin “ten minste één.”
- nu hebben we gezien dat de complement van “ten minste één …” is “geen …” of ” nee ….”(zoals we eerder vermeldden in termen van de gebeurtenissen zijn “tegenpolen”).
- in de bovenstaande activiteit zien we dat
- P(geen van deze twee bijwerkingen) = 1 – P(minstens één van deze twee bijwerkingen )
- Dit is een veel voorkomende toepassing van de complementregel die u vaak kunt herkennen aan de zinsnede “ten minste één” in het probleem.
waarschijnlijkheden met meerdere gebeurtenissen
We zullen vaak geïnteresseerd zijn in het vinden van waarschijnlijkheden met meerdere gebeurtenissen zoals
- P (a of B) = P(gebeurtenis a optreedt of gebeurtenis B optreedt of beide optreden)
- P(zowel gebeurtenis A als gebeurtenis B optreedt)
een veel voorkomend probleem met terminologie heeft betrekking op hoe we gewoonlijk denken over “of” in onze dagelijkse leven. Bijvoorbeeld, wanneer een ouder tegen zijn of haar kind in een speelgoedwinkel zegt “Wil je speelgoed A of speelgoed B?”, dit betekent dat het kind slechts één speeltje krijgt en dat hij of zij moet kiezen tussen hen. Het krijgen van beide speelgoed is meestal geen optie.
in tegenstelling:
In waarschijnlijkheid betekent “OR” een van beide of beide.
en dus P(A of B) = P(gebeurtenis a treedt op of gebeurtenis B treedt op of beide treden op)
Dit gezegd hebbende, moet worden opgemerkt dat er enkele gevallen zijn waarin het eenvoudigweg onmogelijk is dat beide gebeurtenissen tegelijkertijd plaatsvinden.
Waarschijnlijkheidsregel Vier
het onderscheid tussen gebeurtenissen die samen kunnen gebeuren en gebeurtenissen die dat niet kunnen is belangrijk.
disjunct: Twee gebeurtenissen die niet tegelijkertijd kunnen plaatsvinden worden disjunct of wederzijds exclusief genoemd. (We zullen disjunct gebruiken.)
uit de afbeelding moet duidelijk blijken dat
- in het eerste geval, waar de gebeurtenissen niet disjunct zijn, P(A en B) ≠ 0
- in het tweede geval, waar de gebeurtenissen disjunct zijn, P(A en B) = 0.
Hier zijn twee voorbeelden:
voorbeeld:
beschouw de volgende twee gebeurtenissen:
A — een willekeurig gekozen persoon heeft bloedgroep A, en
B — een willekeurig gekozen persoon heeft bloedgroep B.
in zeldzame gevallen is het mogelijk dat een persoon meer dan één type bloed door zijn of haar aderen stroomt, maar voor onze doeleinden gaan we ervan uit dat elke persoon slechts één bloedgroep kan hebben. Daarom is het onmogelijk dat de gebeurtenissen A en B samen plaatsvinden.
- gebeurtenissen A en B zijn disjunct
aan de andere kant …
voorbeeld:
beschouw de volgende twee gebeurtenissen:
A — een willekeurig gekozen persoon heeft bloedgroep A
B — een willekeurig gekozen persoon is een vrouw.
in dit geval is het mogelijk dat gebeurtenissen A en B samen voorkomen.
- gebeurtenissen A en B zijn niet disjunct.
De Venn-diagrammen suggereren dat een andere manier om disjunct versus niet disjunct gebeurtenissen te denken is dat disjunct gebeurtenissen elkaar niet overlappen. Ze delen geen van de mogelijke resultaten en kunnen daarom niet samen gebeuren.
aan de andere kant overlappen gebeurtenissen die niet disjunct zijn in die zin dat ze een aantal van de mogelijke uitkomsten delen en daarom tegelijkertijd kunnen optreden.
We beginnen nu met een eenvoudige regel voor het vinden van P (A of B) voor disjuncte gebeurtenissen.
Waarschijnlijkheidsregel vier (de Optelregel voor disjuncte gebeurtenissen):
- als A en B disjuncte gebeurtenissen zijn, dan P(A of B) = P(A) + P(B).
opmerking:
- bij het behandelen van waarschijnlijkheden zal het woord “or” altijd geassocieerd worden met de operatie van optelling; vandaar de naam van deze regel, “de toevoeging regel.”
voorbeeld: bloedgroepen
herinner de bloedgroep voorbeeld:
Hier is enige aanvullende informatie
- een persoon met type Acan doneert bloed aan een persoon met type A of ab.
- een persoon met type B kan bloed doneren aan een persoon met type B of AB.
- een persoon met type AB kan bloed doneren aan een persoon met type AB
- een persoon met type Oblood kan aan iedereen doneren.
Wat is de kans dat een willekeurig gekozen persoon een potentiële donor is voor een persoon met bloedgroep A?
uit de gegeven informatie weten we dat een potentiële donor zijn voor een persoon met bloedgroep A betekent dat hij bloedgroep A of O heeft.
daarom moeten we P(A of O) vinden. Omdat de gebeurtenissen A en O disjunct zijn, kunnen we de optelregel voor disjunct gebeurtenissen gebruiken om:
- P(a Of O) = P(A) + P(O) = 0,42 + 0,44 = 0,86 te krijgen.
het is gemakkelijk in te zien waarom het toevoegen van de waarschijnlijkheid eigenlijk zinvol is.
Als 42% van de bevolking heeft bloedgroep A en 44% van de bevolking heeft bloedgroep O,
- dan 42% + 44% = 86% van de bevolking heeft bloedgroep A of O, en dus potentiële donoren om een persoon met bloedgroep A.
Deze redenering over de reden waarom de toevoeging regel zinvol kan worden gevisualiseerd met behulp van het cirkeldiagram hieronder:
commentaar:
- De Optelregel voor disjuncte gebeurtenissen kan natuurlijk worden uitgebreid tot meer dan twee disjuncte gebeurtenissen. Laten we er bijvoorbeeld drie nemen. Als A, B en C drie disjuncte gebeurtenissen zijn
dan P(A of B of C) = P(A) + P(B) + P(C). De regel is hetzelfde voor een aantal disjuncte gebeurtenissen.
We zijn nu klaar met de eerste versie van de Optellings regel (regel vier) die de versie is die beperkt is tot disjuncte gebeurtenissen. Voordat we de tweede versie behandelen, moeten we eerst P(A en B) bespreken.
p(A en B) vinden met behulp van logica
We gaan nu over tot het berekenen
- P(a en B)= P(zowel gebeurtenis A als gebeurtenis B)
Later zullen we de regels voor het berekenen van P(A en B) bespreken.
ten eerste willen we illustreren dat een regel niet nodig is wanneer u het antwoord kunt bepalen door logica en tellen.
speciaal geval:
er is één speciaal geval waarvoor we weten wat P(A en B) is zonder enige regel toe te passen.
dus, als gebeurtenissen A en B disjunct zijn, dan (per definitie) P(A en B)= 0. Maar wat als de gebeurtenissen niet onsamenhangend zijn?
bedenk dat Regel 4, De Optellings-regel, twee versies heeft. Eén is beperkt tot disjuncte gebeurtenissen, die we al hebben behandeld, en we zullen later in deze module de meer algemene versie behandelen. Hetzelfde geldt voor waarschijnlijkheden met betrekking tot en
echter, behalve in speciale gevallen, zullen we vertrouwen op logica om P(A en B) in deze cursus te vinden.
voordat we formele regels behandelen, laten we eens kijken naar een voorbeeld waar de gebeurtenissen niet disjunct zijn.
voorbeeld: parodontale Status en geslacht
bekijk de volgende tabel met betrekking tot de parodontale status van individuen en hun geslacht. Parodontale status verwijst naar tandvleesaandoeningen waar individuen worden geclassificeerd als ofwel gezond, hebben gingivitis, of hebben parodontitis.
we hebben dit type tabel eerder gezien toen we het analyseren van data bespraken in geval C → C. Voor het doel van deze vraag zullen we deze gegevens gebruiken als onze “populatie” en overwegen willekeurig één persoon te selecteren.
We stellen graag waarschijnlijkheidsvragen vergelijkbaar met het vorige voorbeeld (met behulp van een tweewegtabel op basis van gegevens) omdat dit u in staat stelt om verbindingen te maken tussen deze onderwerpen en helpt je houdt een deel van wat je hebt geleerd over data vers in je geest.
Waarschijnlijkheidsregel vijf
We zijn nu klaar om door te gaan naar de uitgebreide versie van de Optellings regel.
In deze sectie zullen we leren hoe P(A of B) te vinden wanneer A en B niet noodzakelijk disjunct zijn.
- we noemen deze uitgebreide versie de “Algemene Optellings regel” en stellen het als Waarschijnlijkheidsregel vijf.
We zullen beginnen met het geven van de regel en het geven van een voorbeeld vergelijkbaar met de soorten problemen die we in deze cursus meestal vragen. Dan zullen we een meer een ander voorbeeld presenteren waar we niet de ruwe gegevens van een steekproef hebben om van te werken.
Waarschijnlijkheidsregel vijf:
- de Algemene Optelregel: P(A of B) = P(A) + P(B) – P(A en B).
opmerking: Het is het beste om logica te gebruiken om P(A en B) te vinden, niet een andere formule.
een veel voorkomende fout is het onjuist toepassen van de vermenigvuldigingsregel voor onafhankelijke gebeurtenissen die op de volgende pagina worden behandeld. Dit is alleen correct als A en B onafhankelijk zijn (zie hierna te volgen definities), wat zelden het geval is in gegevens die in tweerichtingstabellen worden gepresenteerd.
zoals we in vorige voorbeelden hebben gezien, is er enige overlap tussen de gebeurtenissen wanneer de twee gebeurtenissen niet disjunct zijn.
- als we gewoon de twee waarschijnlijkheden bij elkaar optellen, krijgen we het verkeerde antwoord omdat we twee keer wat “waarschijnlijkheid” hebben geteld!
- dus moeten we deze “extra” waarschijnlijkheid Aftrekken om tot het juiste antwoord te komen. Het Venn-diagram en de tweewegtabellen zijn nuttig bij het visualiseren van dit idee.
deze regel is algemener omdat het werkt voor elk paar gebeurtenissen (zelfs disjuncte gebeurtenissen). Ons advies is nog steeds om te proberen om de vraag te beantwoorden met behulp van logica en tellen waar mogelijk, anders moeten we uiterst voorzichtig zijn om de juiste regel voor het probleem te kiezen.
Principe:
als je een waarschijnlijkheid kunt berekenen met behulp van logica en tellen heb je geen waarschijnlijkheidsregel nodig (hoewel de juiste regel altijd kan worden toegepast)
merk op dat, als A en B disjunct zijn, P(A en B) = 0 en regel 5 voor dit speciale geval reduceert tot regel 4.
laten we het laatste voorbeeld opnieuw bekijken:
voorbeeld: parodontale Status en geslacht
overweeg willekeurig een individu te selecteren uit de in de volgende tabel weergegeven gevallen met betrekking tot de parodontale status van individuen en hun geslacht. Parodontale status verwijst naar tandvleesaandoeningen waar individuen worden geclassificeerd als ofwel gezond, hebben gingivitis, of hebben parodontitis.
laten we bekijken wat we tot nu toe hebben geleerd. We kunnen elke waarschijnlijkheid in dit scenario berekenen als we kunnen bepalen hoeveel individuen voldoen aan de gebeurtenis of combinatie van gebeurtenissen.
- P(Man) = 3009/8027 = 0.3749
- P(Vrouw) = 5018/8027 = 0.6251
- P(Gezonde) = 3750/8027 = 0.4672
- P(Niet Gezond) = P(Gingivitis of Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
We kunnen ook berekenen met behulp van de aanvulling op regel: 1 – P(Gezond)
We hebben ook eerder gevonden dat
- P(Mannelijke EN Gezond) = 1143/8027 = 0.1424
Terugroepregel 5, P(A of B) = P(A) + P(B) – P(A en B). We gebruiken nu deze regel om P(Mannelijk of gezond)
- p(Mannelijk of gezond) = P(Mannelijk) + P(gezond) – P(mannelijk en gezond) = 0.3749 + 0.4672 – 0.1424 = 0,6997 of ongeveer 70%
we losten deze vraag eerder op door simpelweg te tellen hoeveel individuen Mannelijk of gezond zijn of beide. De afbeelding hieronder illustreert de waarden die we moeten combineren. We moeten
- alle mannen
- alle gezonde individuen
- tellen, maar niemand twee keer tellen!!
Met deze logische benadering vinden we
- P (Mannelijk of gezond) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996
we hebben een klein verschil in onze antwoorden in de laatste decimaal als gevolg van de afronding die optrad toen we P(Mannelijk), P(gezond), en P(mannelijk en gezond) berekenden en vervolgens regel 5 toepasten.
Het antwoord is duidelijk hetzelfde, ongeveer 70%. Als we onze antwoorden naar meer decimalen zouden voeren of als we de originele breuken zouden gebruiken, zouden we deze kleine discrepantie volledig kunnen elimineren.
laten we eens kijken naar een laatste voorbeeld om Waarschijnlijkheidsregel 5 te illustreren wanneer de regel nodig is – dat wil zeggen wanneer we geen werkelijke gegevens hebben.
voorbeeld: belangrijke levering!
Het is van vitaal belang dat een bepaald document binnen één dag zijn bestemming bereikt. Om de kans op tijdige levering te maximaliseren, worden twee kopieën van het document verzonden met behulp van twee diensten, service A en service B. Het is bekend dat de kansen op tijdige levering zijn:
- 0,90 voor service A (P(A) = 0,90)
- 0,80 voor service B (P(B) = 0,80)
- 0.75 voor beide diensten die op tijd zijn(P(A en B) = 0,75)
(merk op dat A en B niet disjunct zijn. Ze kunnen samen gebeuren met kans 0,75.)
De Venn-diagrammen hieronder illustreren de waarschijnlijkheden P (A), P(B) en P(A en B):
in de context van dit probleem is de voor de hand liggende vraag van belang:
- Hoe groot is de kans dat het document met behulp van deze strategie op tijd wordt afgeleverd (door het via beide diensten te verzenden)?
het document zal zijn bestemming op tijd bereiken zolang het op tijd wordt geleverd door Dienst A of door dienst B of door beide diensten. Met andere woorden, wanneer gebeurtenis A optreedt of gebeurtenis B optreedt of beide optreden. dus….
P(op tijd levering met behulp van deze strategie)= P(A of B), die wordt weergegeven door de gearceerde regio in het onderstaande diagram:
We kunnen nu
- gebruik van de drie Venn-diagrammen vertegenwoordigen P(A) P(B) en P(A en B)
- om te zien, dat vinden we P(A of B) door het toevoegen van P(A) (vertegenwoordigd door de linker cirkel) en P(B) (vertegenwoordigd door de rechter cirkel),
- vervolgens af te trekken van P(A en B) (vertegenwoordigd door de overlapping), aangezien we het nog tweemaal, eenmaal als onderdeel van P(A) en eenmaal als onderdeel van de P(B).
Dit wordt weergegeven in de volgende afbeelding:
als we dit toepassen op ons voorbeeld, vinden we dat:
- P (a of B) = P (on-time delivery met behulp van deze strategie)= 0.90 + 0.80 – 0.75 = 0.95.onze strategie om twee bezorgdiensten te gebruiken verhoogt onze kans op tijdige levering tot 0,95.
hoewel de Venn-diagrammen geweldig waren om de Algemene Optelregel te visualiseren, is het in gevallen als deze veel gemakkelijker om de informatie weer te geven en te werken met een tweerichtingstabel van waarschijnlijkheden, net zoals we de relatie tussen twee categorische variabelen onderzochten in de sectie verkennende gegevensanalyse.
We zullen u gewoon de tabel laten zien, niet hoe we het afleiden omdat u niet gevraagd wordt om dit voor ons te doen. Je zou moeten kunnen zien dat enige logica en eenvoudige optellen/aftrekken alles is wat we gebruikten om de onderstaande tabel in te vullen.
wanneer een tweerichtingstabel wordt gebruikt, moeten we niet vergeten de hele rij of kolom te bekijken om algemene waarschijnlijkheden te vinden waarbij alleen A of alleen B.
- P(a) = 0,90 betekent dat in 90% van de gevallen waarin service A wordt gebruikt, het document op tijd wordt afgeleverd. Om dit te vinden kijken we naar de totale waarschijnlijkheid voor de rij met A. Bij het vinden van P(A) weten we niet of B gebeurt of niet.
- P(B) = 0,80 betekent dat in 80% van de gevallen waarin service B wordt gebruikt, het document op tijd wordt afgeleverd. Om dit te vinden kijken we naar de totale waarschijnlijkheid voor de kolom met B. Bij het vinden van P(B) weten we niet of A gebeurt of niet.
commentaar
- wanneer we tweerichtingstabellen gebruikten in de sectie explorative Data Analysis (Eda), moesten waarden van twee categorische variabelen worden vastgelegd voor een concrete steekproef van individuen.
- daarentegen is de informatie in een waarschijnlijkheidstabel voor een hele populatie, en de waarden zijn vrij abstract.
- als we iets als het leveringsvoorbeeld in de Eda-sectie hadden behandeld, zouden we het werkelijke aantal on-time (en niet-on-time) leveringen hebben geregistreerd voor monsters van documenten die met service A of B. werden gemaild.
- in deze sectie worden de waarschijnlijkheid op lange termijn weergegeven als bekend.
- vermoedelijk waren de gerapporteerde waarschijnlijkheden in dit leveringsvoorbeeld gebaseerd op relatieve frequenties die gedurende vele herhalingen werden geregistreerd.
Afrondingsregel voor kansrekening:
Volg de volgende algemene richtlijnen in deze cursus. Bij twijfel meer decimalen dragen. Als we specificeren geef precies wat wordt gevraagd.
- in het algemeen moet u waarschijnlijkheden tot ten minste 4 decimalen dragen voor tussenliggende stappen.
- we ronden ons definitieve antwoord vaak af op twee of drie decimalen.
- voor zeer kleine waarschijnlijkheden is het belangrijk om 1 of twee significante cijfers (niet-nul cijfers) te hebben, zoals 0,000001 of 0,000034, enz.
veel computerpakketten kunnen extreem kleine waarden weergeven met behulp van wetenschappelijke notatie zoals
- 58×10-5 of 1.58 E-5 om 0,0000158
samen te vatten
tot nu toe in onze studie van waarschijnlijkheid, bent u in kennis gesteld van de soms contra-intuïtieve aard van waarschijnlijkheid en de grondbeginselen die ten grondslag liggen aan waarschijnlijkheid, zoals een relatieve frequentie.
we gaven je ook enkele tools om je te helpen de waarschijnlijkheden van gebeurtenissen te vinden-namelijk de waarschijnlijkheidsregels.
u hebt waarschijnlijk gemerkt dat de waarschijnlijkheidssectie significant verschilde van de twee voorgaande secties; Het heeft een veel grotere technische/wiskundige component, dus de resultaten hebben de neiging meer van de “goed of fout” aard te zijn.
in het gedeelte verkennende gegevensanalyse zorgde de computer grotendeels voor het technische aspect van de dingen, en onze taak bestond erin de computer te vertellen het juiste te doen en vervolgens de resultaten te interpreteren.
In waarschijnlijkheid doen we het werk van begin tot eind, van het kiezen van het juiste gereedschap (regel) om te gebruiken, tot het correct gebruiken, tot het interpreteren van de resultaten.
Hier is een samenvatting van de regels die we tot nu toe hebben gepresenteerd.
1. Waarschijnlijkheidsregel # 1 stelt:
- voor elke gebeurtenis A, 0 ≤ P (A) ≤ 1
2. Waarschijnlijkheidsregel # 2 stelt:
- De som van de waarschijnlijkheden van alle mogelijke uitkomsten is 1
3. De Complement regel (#3) stelt dat
- P(not a) = 1 – P(a)
of wanneer herschikt
- P(a) = 1 – P(not a)
de laatste representatie van de complement regel is vooral handig wanneer we waarschijnlijkheden moeten vinden van gebeurtenissen van de soort “ten minste één van …”
4. De Algemene Optelregel (#5) stelt dat voor elke twee gebeurtenissen,
- P(a of B) = P(A) + P(B) – P(A en B),
waarbij we met P(A of B) P bedoelen (a komt voor of B komt voor of beide).
in het speciale geval van disjuncte gebeurtenissen, gebeurtenissen die niet samen kunnen voorkomen, kan de Algemene Optelregel worden gereduceerd tot de Optelregel voor disjuncte gebeurtenissen (#4), die
- P(a of B) = P(A) + P(B) is. *
* alleen gebruiken als u ervan overtuigd bent dat de gebeurtenissen disjunct zijn (ze overlappen niet)
5. De beperkte versie van de optelregel (voor disjuncte gebeurtenissen) kan eenvoudig worden uitgebreid tot meer dan twee gebeurtenissen.
6. Tot nu toe hebben we alleen P (A en B) gevonden met behulp van logica en tellen in eenvoudige voorbeelden