- introduktion
- Sandsynlighedsregler
- Sandsynlighedsregel en (for enhver begivenhed A, 0 Lr P(a) LR 1)
- Sandsynlighedsregel to (summen af sandsynlighederne for alle mulige resultater er 1)
- Sandsynlighedsregel tre (Komplementreglen)
- Sandsynlighedsregel en (for enhver begivenhed A, 0 Lr P(a) LR 1)
- Sandsynlighedsregel to (summen af sandsynlighederne for alle mulige resultater er 1)
- Sandsynlighedsregel tre (Komplementreglen)
- sandsynligheder, der involverer flere begivenheder
- Sandsynlighedsregel fire (Tilføjelsesregel for uensartede begivenheder)
- find P (A og B) ved hjælp af logik
- sandsynlighedsregel Fem (den generelle Tilføjelsesregel)
- Afrundingsregel for Sandsynlighed
- lad os opsummere
i det foregående afsnit introducerede vi sandsynlighed som en måde at kvantificere den usikkerhed, der opstår ved at udføre eksperimenter ved hjælp af en tilfældig prøve fra interessepopulationen.
vi så, at sandsynligheden for en begivenhed (for eksempel begivenheden, at en tilfældigt valgt person har blodtype O) kan estimeres ved den relative hyppighed, hvormed begivenheden finder sted i en lang række forsøg. Så vi ville indsamle data fra mange individer for at estimere sandsynligheden for, at nogen har blodtype O.
i dette afsnit vil vi etablere de grundlæggende metoder og principper for at finde sandsynligheder for begivenheder.
Vi vil også dække nogle af de grundlæggende sandsynlighedsregler, som kan bruges til at beregne sandsynligheder.
introduktion
vi begynder med et klassisk sandsynlighedseksempel på at kaste en fair mønt tre gange.
da hoveder og haler er lige sandsynlige for hvert kast i dette scenario, vil hver af de muligheder, der kan skyldes tre kast, også være lige sandsynlige, så vi kan liste alle mulige værdier og bruge denne liste til at beregne sandsynligheder.
da vores fokus i dette kursus er på data og statistik (ikke teoretisk sandsynlighed), vil vi i de fleste af vores fremtidige problemer bruge et opsummeret datasæt, normalt en frekvenstabel eller tovejstabel, til at beregne sandsynligheder.
eksempel: Kast en fair mønt tre gange
lad os liste hvert muligt resultat (eller muligt resultat):
{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}
lad os nu definere følgende begivenheder:
begivenhed a: “får ingen H”
begivenhed B: “får nøjagtigt en H”
begivenhed C: “får mindst en H”
bemærk, at hver begivenhed faktisk er en erklæring om det resultat, som eksperimentet skal producere. I praksis svarer hver begivenhed til en eller anden samling (delmængde) af de mulige resultater.
begivenhed A:” Getting no H ” af TTT
begivenhed B: “At få nøjagtigt en H “Kristi HTT, THT, TTH
begivenhed C:” at få mindst en H”Kristi HTT, THT, TTH, THH, HTH, HHT, HHH
Her er en visuel repræsentation af begivenhederne A, B og C.
fra denne visuelle repræsentation af begivenhederne er det let at se, at Begivenhed B er helt inkluderet i begivenhed C i den forstand, at ethvert resultat i begivenhed B også er et resultat i begivenhed C. Bemærk også, at Begivenhed a adskiller sig fra begivenheder B og C i den forstand, at de ikke har noget resultat til fælles eller ingen overlapning. På dette tidspunkt er disse kun bemærkelsesværdige observationer, men som du vil opdage senere, er de meget vigtige.
Hvad hvis vi tilføjede den nye begivenhed:
begivenhed D: “At få en T på det første kast” Kristian THH, THT, TTH, TTT
hvordan ville det se ud, hvis vi tilføjede begivenhed D til diagrammet ovenfor? (Link til svaret)
Husk, da H og T er lige sandsynlige på hvert kast, og da der er 8 mulige resultater, er sandsynligheden for hvert resultat 1/8.
se om du kan besvare følgende spørgsmål ved hjælp af diagrammerne og/eller listen over resultater for hver begivenhed sammen med det, du hidtil har lært om sandsynlighed.
Hvis du var i stand til at besvare disse spørgsmål korrekt, har du sandsynligvis et godt instinkt til beregning af sandsynlighed! Læs videre for at lære, hvordan vi vil anvende denne viden.
Hvis ikke, vil vi forsøge at hjælpe dig med at udvikle denne færdighed i dette afsnit.
kommentar:
- Bemærk, at I tilfælde C, “at få mindst et hoved”, er der kun et muligt resultat, der mangler, “at få ingen hoveder” = TTT. Vi vil tage fat på dette igen, når vi taler om sandsynlighedsregler, især komplementreglen. På dette tidspunkt vil vi bare have dig til at tænke over, hvordan disse to begivenheder er “modsætninger” i dette scenario.
det er meget vigtigt at indse, at bare fordi vi kan liste de mulige resultater, betyder det ikke, at hvert resultat er lige sandsynligt.
Dette er den (sjove) besked i det daglige Visningsklip, vi leverede på forrige side. Men lad os tænke over det igen. I dette klip hævder Valter, at da der er to mulige resultater, er sandsynligheden 0.5. De to mulige resultater er
- verden vil blive ødelagt på grund af brugen af large hadron collider
- verden vil ikke blive ødelagt på grund af brugen af large hadron collider
forhåbentlig er det klart, at disse to resultater ikke er lige sandsynlige!!
lad os overveje et mere almindeligt eksempel.
eksempel: fødselsdefekter
Antag, at vi tilfældigt vælger tre børn, og vi er interesserede i sandsynligheden for, at ingen af børnene har nogen fødselsdefekter.
Vi bruger notationen D til at repræsentere et barn blev født med en fødselsdefekt og N til at repræsentere barnet født uden fødselsdefekt. Vi kan liste de mulige resultater, ligesom vi gjorde for møntkastet, de er:
{DDD, NDD, DND, DDN, DNN, NDN, NND, NNN}
er begivenhederne DDD (alle tre børn er født med fødselsdefekter) og NNN (ingen af børnene er født med fødselsdefekter) lige sandsynlige?
det bør være rimeligt for dig, at P(NNN) er meget større end P(DDD).
Dette skyldes, at P (N) og P(D) ikke er lige sandsynlige begivenheder.
det er sjældent (bestemt ikke 50%) for et tilfældigt udvalgt barn at blive født med en fødselsdefekt.
Sandsynlighedsregler
nu går vi videre til at lære nogle af de grundlæggende sandsynlighedsregler.
heldigvis er disse regler meget intuitive, og så længe de anvendes systematisk, vil de lade os løse mere komplicerede problemer; især de problemer, som vores intuition kan være utilstrækkelig til.
da de fleste af de sandsynligheder, du bliver bedt om at finde, kan beregnes ved hjælp af både
- logik og tælling
og
- de regler, vi vil lære,
Vi giver følgende råd som et princip.
princip:
Hvis du kan beregne en sandsynlighed ved hjælp af logik og tælling, behøver du ikke en sandsynlighedsregel (selvom den korrekte regel altid kan anvendes)
Sandsynlighedsregel en
vores første regel minder os simpelthen om den grundlæggende egenskab af sandsynlighed, som vi allerede har lært.
sandsynligheden for en begivenhed, der informerer os om sandsynligheden for, at den forekommer, kan variere alt fra 0 (hvilket indikerer, at begivenheden aldrig vil forekomme) til 1 (hvilket indikerer, at begivenheden er sikker).
Sandsynlighedsregel en:
- for enhver begivenhed A, 0 lp(a) lp 1.
bemærk: en praktisk anvendelse af denne regel er, at den kan bruges til at identificere enhver sandsynlighedsberegning, der kommer ud til at være mere end 1 (eller mindre end 0) som forkert.
før vi går videre til de andre regler, Lad os først se på et eksempel, der giver en kontekst til at illustrere de næste flere regler.
eksempel: blodtyper
som tidligere diskuteret kan alt humant blod skrives som O, A, B eller AB.
derudover varierer hyppigheden af forekomsten af disse blodtyper efter etniske og racemæssige grupper.
ifølge Stanford University ‘ s Blood Center (bloodcenter.Stanford.edu), disse er sandsynlighederne for humane blodtyper i USA (sandsynligheden for type A er udeladt med vilje):
motiverende spørgsmål til regel 2: en person i USA vælges tilfældigt. Hvad er sandsynligheden for, at den person, der har blodtype A?
svar: Vores intuition fortæller os, at da de fire blodtyper O, A, B og AB udtømmer alle mulighederne, skal deres sandsynligheder tilsammen udgøre 1, hvilket er sandsynligheden for en “bestemt” begivenhed (en person har en af disse 4 blodtyper for visse).
da sandsynlighederne for O, B og AB tilsammen udgør 0.44 + 0.1 + 0.04 = 0,58, sandsynligheden for type A skal være den resterende 0.42 (1 – 0.58 = 0.42):
Sandsynlighedsregel to
dette eksempel illustrerer vores anden regel, som fortæller os, at sandsynligheden for alle mulige resultater sammen skal være 1.
Sandsynlighedsregel to:
summen af sandsynlighederne for alle mulige resultater er 1.
dette er et godt sted at sammenligne og kontrastere det, vi laver her, med det, vi lærte i afsnittet sonderende dataanalyse (EDA).
- Bemærk, at vi i dette problem i det væsentlige fokuserer på en enkelt kategorisk variabel: blodtype.
- vi opsummerede denne variabel ovenfor, da vi opsummerede enkelte kategoriske variabler i EDA-sektionen ved at angive, hvilke værdier variablen tager, og hvor ofte den tager dem.
- i EDA brugte vi procenter, og her bruger vi sandsynligheder, men de to formidler de samme oplysninger.
- i EDA-sektionen lærte vi, at et cirkeldiagram giver en passende visning, når en enkelt kategorisk variabel er involveret, og på samme måde kan vi bruge den her (ved hjælp af procenter i stedet for sandsynligheder):
selvom det, vi laver her, faktisk ligner det, vi har gjort i EDA-sektionen, er der en subtil, men vigtig forskel mellem de underliggende situationer
- i EDA opsummerede vi data, der blev opnået fra en prøveaf personer, for hvem værdier af variablen af interesse blev registreret.
- her, når vi præsenterer sandsynligheden for hver blodtype, har vi i tankerne hele befolkningenaf mennesker i USA, som vi antager at kende den samlede frekvens af værdier taget af variablen af interesse.
Sandsynlighedsregel tre
I sandsynlighed og i dens applikationer er vi ofte interesserede i at finde ud af sandsynligheden for, at en bestemt begivenhed ikke vil forekomme.
et vigtigt punkt at forstå her er, at “Begivenhed A ikke forekommer” er en separat begivenhed, der består af alle de mulige resultater, der ikke er i A og kaldes “komplementbegivenheden for A.”
Notation: vi vil skrive “ikke A” for at betegne den begivenhed, som A ikke forekommer. Her er en visuel repræsentation af, hvordan begivenhed A og dens komplementbegivenhed “ikke A” tilsammen repræsenterer alle mulige resultater.
kommentar:
- et sådant visuelt display kaldes et “Venn-diagram.”Et Venn-diagram er en enkel måde at visualisere begivenheder og forholdet mellem dem ved hjælp af rektangler og cirkler.
regel 3 omhandler forholdet mellem sandsynligheden for en begivenhed og sandsynligheden for dens komplementbegivenhed.
i betragtning af at Begivenhed A og begivenhed “ikke A” tilsammen udgør alle mulige resultater, og da regel 2 fortæller os, at summen af sandsynlighederne for alle mulige resultater er 1, skal følgende regel være ret intuitiv:
Sandsynlighedsregel tre (Komplementreglen):
- P(ikke a) = 1 – p(a)
- det vil sige sandsynligheden for at at en begivenhed ikke forekommer er 1 minus sandsynligheden for, at den forekommer.
eksempel: blodtyper
Tilbage til blodtype eksempel:
Her er nogle yderligere oplysninger:
- en person med type A kan donere blod til en person med type A eller ab.
- en person med type B kan donere blod til en person med type B eller AB.
- en person med type AB kan kun donere blod til en person med type AB.
- en person med type O-blod kan donere til nogen.
Hvad er sandsynligheden for, at en tilfældigt valgt person ikke kan donere blod til alle? Med andre ord, Hvad er sandsynligheden for, at en tilfældigt valgt person ikke har blodtype O? Vi skal finde P (ikke O). Brug af Komplementreglen, P (ikke O) = 1 – P(O) = 1 – 0,44 = 0,56. Med andre ord har 56% af den amerikanske befolkning ikke blodtype O:
det er klart, at vi også kunne finde P(ikke O) direkte ved at tilføje sandsynlighederne for B, AB og A.
kommentar:
- Bemærk, at Komplementreglen, P(ikke a) = 1 – P(A) kan omformuleres som P(A) = 1-p(ikke a).
- P(ikke a) = 1 – P(a)
- kan omformuleres som P(A) = 1-p(ikke a).
- denne tilsyneladende trivielle algebraiske manipulation har en vigtig anvendelse og fanger faktisk styrken af komplementreglen.
- i nogle tilfælde, når det er meget kompliceret at finde P(a) direkte, kan det være meget lettere at finde P(ikke A) og derefter bare trække det fra 1 for at få den ønskede P(a).
- vi vender snart tilbage til denne kommentar og giver yderligere eksempler.
- komplementreglen kan være nyttig, når det er lettere at beregne sandsynligheden for komplementet til begivenheden snarere end selve begivenheden.
- Bemærk, Vi brugte igen sætningen “mindst en.”
- nu har vi set, at komplementet til “mindst en …” er “ingen …” eller ” nej ….”(som vi tidligere nævnte med hensyn til begivenhederne som “modsætninger”).
- i ovenstående aktivitet ser vi, at
- P(ingen af disse to bivirkninger) = 1 – P(mindst en af disse to bivirkninger )
- dette er en almindelig anvendelse af komplementreglen, som du ofte kan genkende ved udtrykket “mindst en” i problemet.
sandsynligheder, der involverer flere begivenheder
vi vil ofte være interesserede i at finde sandsynligheder, der involverer flere begivenheder såsom
- P(A eller B) = P(begivenhed a forekommer eller begivenhed B forekommer eller begge forekommer)
- P (A og B)= P(både begivenhed a forekommer og begivenhed B forekommer)
et almindeligt problem med terminologi vedrører, hvordan vi normalt tænker på “eller” i vores daglige livet. For eksempel, når en forælder siger til sit barn i en legetøjsbutik “vil du have legetøj a eller legetøj B?”betyder det, at barnet kun får et legetøj, og han eller hun skal vælge mellem dem. At få begge legetøj er normalt ikke en mulighed.
i modsætning:
i Sandsynlighed betyder “Eller” enten den ene eller den anden eller begge dele.
og så P(A eller B) = P(begivenhed a forekommer eller begivenhed B forekommer eller begge forekommer)
når det er sagt, skal det bemærkes, at der er nogle tilfælde, hvor det simpelthen er umuligt for de to begivenheder at begge forekommer på samme tid.
Sandsynlighedsregel fire
sondringen mellem begivenheder, der kan ske sammen, og dem, der ikke kan, er vigtig.
Disjoint: To begivenheder, der ikke kan forekomme på samme tid, kaldes uensartede eller gensidigt eksklusive. (Vi vil bruge disjoint.)
det skal fremgå af billedet, at
- i det første tilfælde, hvor begivenhederne ikke er uensartede, P(A og B) 0
- i det andet tilfælde, hvor begivenhederne er uensartede, P(A og B) = 0.
Her er to eksempler:
eksempel:
overvej følgende to begivenheder:
A — en tilfældigt valgt person har blodtype A, og
B — en tilfældigt valgt person har blodtype B.
I sjældne tilfælde er det muligt for en person at have mere end en type blod, der strømmer gennem hans eller hendes årer, men til vores formål antager vi, at hver person kun kan have en blodtype. Derfor er det umuligt for begivenhederne A og B at forekomme sammen.
- begivenheder A og B er uensartede
på den anden side …
eksempel:
overvej følgende to begivenheder:
A — en tilfældigt valgt person har blodtype A
B — en tilfældigt valgt person er en kvinde.
i dette tilfælde er det muligt for hændelser A og B at forekomme sammen.
- begivenheder A og B er ikke uensartede.
Venn-diagrammerne antyder, at en anden måde at tænke på uensartede versus ikke uensartede begivenheder er, at uensartede begivenheder ikke overlapper hinanden. De deler ikke nogen af de mulige resultater, og kan derfor ikke ske sammen.
på den anden side overlapper begivenheder, der ikke er adskilte, i den forstand, at de deler nogle af de mulige resultater og derfor kan forekomme på samme tid.
Vi begynder nu med en simpel regel for at finde P(A eller B) til uensartede begivenheder.
Sandsynlighedsregel fire (Tilføjelsesreglen for adskilte begivenheder):
- hvis A og B er adskilte begivenheder, så P(A eller B) = P(A) + P(B).
kommentar:
- når man beskæftiger sig med sandsynligheder, vil ordet “eller” altid være forbundet med driften af tilføjelse; derfor navnet på denne regel, “Tilføjelsesreglen.”
eksempel: blodtyper
Recall blodtype eksempel:
Her er nogle yderligere oplysninger
- en person med type acan donere blod til en person med type A eller ab.
- en person med type Bkan donere blod til en person med type B eller AB.
- en person med type ABcan donere blod til en person med type AB
- en person med type Oblood kan donere til nogen.
Hvad er sandsynligheden for, at en tilfældigt valgt person er en potentiel donor for en person med blodtype A?
fra de givne oplysninger ved vi, at det at være en potentiel donor for en person med blodtype A betyder at have blodtype A eller O.
vi er derfor nødt til at finde P(A eller O). Da begivenhederne A og O er uensartede, kan vi bruge tilføjelsesreglen for uensartede begivenheder til at få:
- P(A eller O) = P(A) + P(O) = 0,42 + 0,44 = 0,86.
det er let at se, hvorfor tilføjelse af sandsynligheden faktisk giver mening.
Hvis 42% af befolkningen har blodtype A og 44% af befolkningen har blodtype O,
- så 42% + 44% = 86% af befolkningen har enten blodtype A eller O, og dermed er potentielle donorer til en person med blodtype A.
denne begrundelse for, hvorfor tilføjelsesreglen giver mening, kan visualiseres ved hjælp af cirkeldiagrammet nedenfor:
kommentar:
- Tilføjelsesreglen for adskilte begivenheder kan naturligvis udvides til mere end to adskilte begivenheder. Lad os tage tre, for eksempel. Hvis A, B og C er tre uensartede begivenheder
derefter P(A eller B eller C) = P(A) + P(B) + P(C). Reglen er den samme for et vilkårligt antal uensartede begivenheder.
Vi er nu færdige med den første version af Tilføjelsesreglen (regel fire), som er den version, der er begrænset til uensartede begivenheder. Før vi dækker den anden version, skal vi først diskutere P(A og B).
find P(A og B) ved hjælp af logik
vi vender nu til beregning
- P(A og B)= P(både begivenhed a forekommer og begivenhed B forekommer)
senere vil vi diskutere reglerne for beregning af P(A og B).
først vil vi illustrere, at en regel ikke er nødvendig, når du kan bestemme svaret gennem logik og tælling.
Special Case:
der er et specielt tilfælde, som vi ved, hvad P(A og B) er lig med uden at anvende nogen regel.
så hvis begivenhederne A og B er uensartede, så (pr.definition) P(A og B)= 0. Men hvad nu hvis begivenhederne ikke er uensartede?
Husk, at Regel 4, Tilføjelsesreglen, har to versioner. Den ene er begrænset til uensartede begivenheder, som vi allerede har dækket, og vi behandler den mere generelle version senere i dette modul. Det samme vil være tilfældet med sandsynligheder, der involverer og
men undtagen i særlige tilfælde vil vi stole på logik for at finde P(A og B) i dette kursus.
før vi dækker formelle regler, Lad os se på et eksempel, hvor begivenhederne ikke er uensartede.
eksempel: Periodontal Status og køn
overvej følgende tabel vedrørende individers periodontale status og deres køn. Periodontal status refererer til tandkødssygdomme, hvor individer klassificeres som enten sunde, har tandkødsbetændelse eller har periodontal sygdom.
Vi har set denne type tabel før, da vi diskuterede analyse af data i tilfælde C-kur C. Med henblik på dette spørgsmål vil vi bruge disse data som vores “befolkning” og overveje tilfældigt at vælge en person.
Vi kan godt lide at stille sandsynlighedsspørgsmål svarende til det foregående eksempel (ved hjælp af en tovejstabel baseret på data), da dette giver dig mulighed for at lave forbindelser mellem disse emner og hjælper dig med at holde noget af det, du har lært om data, frisk i dit sind.
Sandsynlighedsregel fem
Vi er nu klar til at gå videre til den udvidede version af Tilføjelsesreglen.
i dette afsnit lærer vi, hvordan man finder P(A eller B), Når A og B ikke nødvendigvis er uensartede.
- vi kalder denne udvidede version “generel Tilføjelsesregel” og angiver den som Sandsynlighedsregel fem.
Vi begynder med at angive reglen og give et eksempel svarende til de typer problemer, vi generelt stiller i dette kursus. Derefter vil vi præsentere et mere andet eksempel, hvor vi ikke har rådataene fra en prøve at arbejde ud fra.
Sandsynlighedsregel fem:
- den generelle Tilføjelsesregel: P(A eller B) = P(A) + P(B) – P(A og B).
BEMÆRK: Det er bedst at bruge logik til at finde P(A og B), ikke en anden formel.
en meget almindelig fejl er forkert anvendelse af multiplikationsreglen for uafhængige begivenheder, der er dækket på Næste side. Dette vil kun være korrekt, hvis A og B er uafhængige (se definitioner, der skal følges), hvilket sjældent er tilfældet i data præsenteret i tovejstabeller.
som vi var vidne til i tidligere eksempler, når de to begivenheder ikke er uensartede, er der en vis overlapning mellem begivenhederne.
- hvis vi blot tilføjer de to sandsynligheder sammen, får vi det forkerte svar, fordi vi har talt en vis “sandsynlighed” to gange!
- således skal vi trække denne” ekstra ” Sandsynlighed ud for at nå frem til det rigtige svar. Venn-diagrammet og tovejstabellerne er nyttige til at visualisere denne ide.
denne regel er mere generel, da den fungerer for ethvert par begivenheder (endda uensartede begivenheder). Vores råd er stadig at forsøge at besvare spørgsmålet ved hjælp af logik og tælling, når det er muligt, ellers skal vi være yderst forsigtige med at vælge den rigtige regel for problemet.
princip:
Hvis du kan beregne en sandsynlighed ved hjælp af logik og tælling, behøver du ikke en sandsynlighedsregel (selvom den korrekte regel altid kan anvendes)
Bemærk, at hvis A og B er uensartede, reduceres P(A og B) = 0 og Regel 5 til Regel 4 for dette specielle tilfælde.
lad os se det sidste eksempel igen:
eksempel: Periodontal Status og køn
overvej tilfældigt at vælge et individ blandt dem, der er repræsenteret i følgende tabel vedrørende individers periodontale status og deres køn. Periodontal status refererer til tandkødssygdomme, hvor individer klassificeres som enten sunde, har tandkødsbetændelse eller har periodontal sygdom.
lad os gennemgå, hvad vi har lært hidtil. Vi kan beregne enhver Sandsynlighed i dette scenarie, hvis vi kan bestemme, hvor mange individer der tilfredsstiller begivenheden eller kombinationen af begivenheder.
- P (mand) = 3009/8027 = 0,3749
- P (kvinde) = 5018/8027 = 0,6251
- P (sund) = 3750/8027 = 0,4672
- P (ikke sund) = P(Gingivitis eller Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
vi kunne også beregne dette ved hjælp af komplementreglen: 1-P(sund)
Vi fandt også tidligere, at
- P(mandlig og sund) = 1143/8027 = 0.1424
husk regel 5, P(A eller B) = P(A) + P(B) – P(A og B). Vi bruger nu denne regel til at beregne P (mand eller sund)
- P (mand eller sund) = P (mand) + P (sund) – P (mand og sund) = 0.3749 + 0.4672 – 0.1424 = 0.6997 eller omkring 70%
vi løste dette spørgsmål tidligere ved blot at tælle, hvor mange individer der er enten mandlige eller sunde eller begge dele. Billedet nedenfor illustrerer de værdier, vi skal kombinere. Vi er nødt til at tælle
- alle mænd
- alle sunde individer
- men ikke tælle nogen to gange!!
Ved hjælp af denne logiske tilgang ville vi finde
- P (mand eller sund) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996
Vi har en mindre forskel i vores svar i den sidste decimal på grund af afrundingen, der opstod, da vi beregnede P(mand), P(sund) og P(mand og sund) og derefter anvendte regel 5.
det er klart, at svaret faktisk er det samme, omkring 70%. Hvis vi Bar vores svar til flere decimaler, eller hvis vi brugte de originale fraktioner, kunne vi eliminere denne lille uoverensstemmelse helt.
lad os se på et sidste eksempel for at illustrere Sandsynlighedsregel 5, når reglen er nødvendig – dvs.når vi ikke har faktiske data.
eksempel: vigtig levering!
det er vigtigt, at et bestemt dokument når sin destination inden for en dag. For at maksimere chancerne for levering til tiden sendes to kopier af dokumentet ved hjælp af to tjenester, service A og service B. Det er kendt, at sandsynligheden for levering til tiden er:
- 0.90 for service a (P(a) = 0.90)
- 0.80 for service B (P(B) = 0.80)
- 0.75 for begge tjenester er til tiden(P(A og B) = 0,75)
(Bemærk, at A og B ikke er uensartede. De kan ske sammen med Sandsynlighed 0,75.)
Venn-diagrammerne nedenfor illustrerer sandsynlighederne P(A), P(B) og P(A og B):
i forbindelse med dette problem er det indlysende spørgsmål af interesse:
- hvad er sandsynligheden for levering til tiden af dokumentet ved hjælp af denne strategi (for at sende det via begge tjenester)?
dokumentet når sin destination til tiden, så længe det leveres til tiden af service A eller af service B eller af begge tjenester. Med andre ord, når begivenhed a opstår, eller begivenhed B forekommer, eller begge forekommer. så….
P (til tiden levering ved hjælp af denne strategi)= P(A eller B), som er repræsenteret af det skraverede område i diagrammet nedenfor:
Vi kan nu
- bruge de tre Venn-diagrammer, der repræsenterer P(A), P(B) og P(A og B)
- for at se, at vi kan finde P(A eller B) ved at tilføje P(A) (repræsenteret af den venstre cirkel) og P(B) (repræsenteret af den højre cirkel),
- derefter trække P(A og B) (repræsenteret af overlapningen), da vi inkluderede det to gange, en gang som en del af AF P(A) og en gang som en del af p(B).
Dette vises på følgende billede:
Hvis vi anvender dette på vores eksempel, finder vi, at:
- P (A eller B)= P (levering til tiden ved hjælp af denne strategi)= 0.90 + 0.80 – 0.75 = 0.95.
så vores strategi for at bruge to leveringstjenester øger vores Sandsynlighed for levering til tiden til 0,95.
mens Venn-diagrammerne var gode til at visualisere den generelle Tilføjelsesregel, er det i tilfælde som disse meget lettere at vise informationen i og arbejde med en tovejs sandsynlighedstabel, ligesom vi undersøgte forholdet mellem to kategoriske variabler i afsnittet sonderende dataanalyse.
Vi viser dig simpelthen tabellen, ikke hvordan vi udleder den, da du ikke bliver bedt om at gøre dette for os. Du skal være i stand til at se, at noget logik og enkel tilføjelse/subtraktion er alt, hvad vi brugte til at udfylde nedenstående tabel.
når vi bruger en tovejstabel, skal vi huske at se på hele rækken eller kolonnen for at finde overordnede sandsynligheder, der kun involverer a eller kun B.
- P(a) = 0,90 betyder, at i 90% af tilfældene, når service A bruges, leverer det dokumentet til tiden. For at finde dette ser vi på den samlede sandsynlighed for rækken, der indeholder A. Ved at finde P(A) ved vi ikke, om B sker eller ej.
- P(B) = 0,80 betyder, at i 80% af tilfældene, når service B anvendes, leverer det dokumentet til tiden. For at finde dette ser vi på den samlede sandsynlighed for kolonnen indeholdende B. ved at finde P(B) ved vi ikke, om a sker eller ej.
kommentar
- da vi brugte tovejstabeller i afsnittet sonderende dataanalyse (EDA), var det at registrere værdier for to kategoriske variabler for en konkret prøve af individer.
- i modsætning hertil er informationen i en sandsynlighedsvejstabel for en hel befolkning, og værdierne er ret abstrakte.
- hvis vi havde behandlet noget som leveringseksemplet i EDA-sektionen, ville vi have registreret det faktiske antal on-time (og ikke-on-time) leverancer for prøver af dokumenter sendt med service A eller B.
- i dette afsnit præsenteres de langsigtede sandsynligheder som værende kendt.
- formentlig var de rapporterede sandsynligheder i dette leveringseksempel baseret på relative frekvenser registreret over mange gentagelser.
afrunding tommelfingerregel for Sandsynlighed:
følg følgende generelle retningslinjer i dette kursus. Hvis du er i tvivl bære flere decimaler. Hvis vi angiver give præcis, hvad der anmodes om.
- generelt skal du bære sandsynligheder til mindst 4 decimaler for mellemliggende trin.
- vi runder ofte vores endelige svar med to eller tre decimaler.
- for ekstremt små sandsynligheder er det vigtigt at have 1 eller to signifikante cifre (ikke-nul cifre), såsom 0,000001 eller 0,000034 osv.
mange computerpakker kan vise ekstremt små værdier ved hjælp af videnskabelig notation som
- 58 list 10-5 eller 1.58 E-5 for at repræsentere 0.0000158
lad os opsummere
indtil videre i vores undersøgelse af sandsynlighed er du blevet introduceret til sandsynlighedens undertiden kontraintuitive karakter og de grundlæggende elementer, der ligger til grund for sandsynligheden, såsom en relativ frekvens.
Vi gav dig også nogle værktøjer til at hjælpe dig med at finde sandsynlighederne for begivenheder — nemlig sandsynlighedsreglerne.
du har sikkert bemærket, at sandsynlighedsafsnittet var signifikant forskelligt fra de to foregående afsnit; Det har en meget større teknisk/matematisk komponent, så resultaterne har tendens til at være mere af den “rigtige eller forkerte” karakter.
i afsnittet sonderende dataanalyse tog computeren for det meste sig af det tekniske aspekt af tingene, og vores opgaver var at bede den om at gøre det rigtige og derefter fortolke resultaterne.
i Sandsynlighed gør vi arbejdet fra start til slut, fra at vælge det rigtige værktøj (regel) til brug, til at bruge det korrekt, til at fortolke resultaterne.
Her er en oversigt over de regler, vi har præsenteret indtil videre.
1. Sandsynlighedsregel # 1 angiver:
- for enhver begivenhed A, 0 lp(a) lp 1
2. Sandsynlighedsregel #2 siger:
- summen af sandsynlighederne for alle mulige resultater er 1
3. Komplementreglen (#3) angiver, at
- P(ikke a) = 1 – p(a)
eller når omarrangeret
- P(a) = 1 – p(ikke A)
sidstnævnte repræsentation af Komplementreglen er især nyttig, når vi skal finde sandsynligheder for begivenheder af den slags “mindst en af …”
4. Den generelle Tilføjelsesregel (#5) angiver, at for to begivenheder
- P(A eller B) = P(A) + P(B) – P(A og B),
hvor vi med P(A eller B) mener P(A forekommer eller B forekommer eller begge dele).
i det særlige tilfælde af uensartede begivenheder, begivenheder, der ikke kan forekomme sammen, kan den generelle Tilføjelsesregel reduceres til Tilføjelsesreglen for uensartede begivenheder (#4), som er
- P(A eller B) = P(A) + P(B). *
*brug kun, når du er overbevist om, at begivenhederne er uensartede (de overlapper ikke)
5. Den begrænsede version af tilføjelsesreglen (for uensartede begivenheder) kan let udvides til mere end to begivenheder.
6. Indtil videre har vi kun fundet P (A og B) ved hjælp af logik og tælling i enkle eksempler