grundlæggende Sandsynlighedsregler

  • introduktion
  • Sandsynlighedsregler
    • Sandsynlighedsregel en (for enhver begivenhed A, 0 Lr P(a) LR 1)
    • Sandsynlighedsregel to (summen af sandsynlighederne for alle mulige resultater er 1)
    • Sandsynlighedsregel tre (Komplementreglen)
    • Sandsynlighedsregel en (for enhver begivenhed A, 0 Lr P(a) LR 1)
    • Sandsynlighedsregel to (summen af sandsynlighederne for alle mulige resultater er 1)
    • Sandsynlighedsregel tre (Komplementreglen)
    • sandsynligheder, der involverer flere begivenheder
    • Sandsynlighedsregel fire (Tilføjelsesregel for uensartede begivenheder)
    • find P (A og B) ved hjælp af logik
    • sandsynlighedsregel Fem (den generelle Tilføjelsesregel)
  • Afrundingsregel for Sandsynlighed
  • lad os opsummere
CO-6: Anvend grundlæggende begreber Sandsynlighed, tilfældig variation og almindeligt anvendte statistiske sandsynlighedsfordelinger.
LO 6.4: forhold sandsynligheden for en begivenhed til sandsynligheden for, at denne begivenhed finder sted.
LO 6.5: anvend den relative frekvensmetode til at estimere sandsynligheden for en begivenhed.
LO 6.6: Anvend grundlæggende logik og sandsynlighedsregler for at finde den empiriske Sandsynlighed for en begivenhed.
Video: grundlæggende Sandsynlighedsregler (25:17)

i det foregående afsnit introducerede vi sandsynlighed som en måde at kvantificere den usikkerhed, der opstår ved at udføre eksperimenter ved hjælp af en tilfældig prøve fra interessepopulationen.

vi så, at sandsynligheden for en begivenhed (for eksempel begivenheden, at en tilfældigt valgt person har blodtype O) kan estimeres ved den relative hyppighed, hvormed begivenheden finder sted i en lang række forsøg. Så vi ville indsamle data fra mange individer for at estimere sandsynligheden for, at nogen har blodtype O.

i dette afsnit vil vi etablere de grundlæggende metoder og principper for at finde sandsynligheder for begivenheder.

Vi vil også dække nogle af de grundlæggende sandsynlighedsregler, som kan bruges til at beregne sandsynligheder.

introduktion

vi begynder med et klassisk sandsynlighedseksempel på at kaste en fair mønt tre gange.

da hoveder og haler er lige sandsynlige for hvert kast i dette scenario, vil hver af de muligheder, der kan skyldes tre kast, også være lige sandsynlige, så vi kan liste alle mulige værdier og bruge denne liste til at beregne sandsynligheder.

da vores fokus i dette kursus er på data og statistik (ikke teoretisk sandsynlighed), vil vi i de fleste af vores fremtidige problemer bruge et opsummeret datasæt, normalt en frekvenstabel eller tovejstabel, til at beregne sandsynligheder.

eksempel: Kast en fair mønt tre gange

lad os liste hvert muligt resultat (eller muligt resultat):

{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}

lad os nu definere følgende begivenheder:

begivenhed a: “får ingen H”

begivenhed B: “får nøjagtigt en H”

begivenhed C: “får mindst en H”

bemærk, at hver begivenhed faktisk er en erklæring om det resultat, som eksperimentet skal producere. I praksis svarer hver begivenhed til en eller anden samling (delmængde) af de mulige resultater.

begivenhed A:” Getting no H ” af TTT

begivenhed B: “At få nøjagtigt en H “Kristi HTT, THT, TTH

begivenhed C:” at få mindst en H”Kristi HTT, THT, TTH, THH, HTH, HHT, HHH

Her er en visuel repræsentation af begivenhederne A, B og C.

vi har et stort rektangel mærket" S " som repræsenterer hele prøveområdet. Inde i dette rektangel har vi en cirkel mærket "C." alt uden for "C sker sammenfaldende med begivenhed A, der kun indeholder "TTT". Inde i C, vi ser " HHH," "THH," "HTH," "HHT," og en cirkel, der repræsenterer begivenhed B. inde i B er "HHT," "THT," og " TTH."Bemærk, at alle elementerne inde i B også er inde i C, så C omslutter fuldt ud B."S" which represents the entirety of the sample space. Inside this rectangle we have a circle labeled "C." Everything outside of "C happens to coincied with event A containing only "TTT". Inside of C, we see "HHH," "THH," "HTH," "HHT," and a circle representing event B. Inside B are "HHT," "THT," and "TTH." Note that all of the items inside B are also inside C, so C fully encloses B.

fra denne visuelle repræsentation af begivenhederne er det let at se, at Begivenhed B er helt inkluderet i begivenhed C i den forstand, at ethvert resultat i begivenhed B også er et resultat i begivenhed C. Bemærk også, at Begivenhed a adskiller sig fra begivenheder B og C i den forstand, at de ikke har noget resultat til fælles eller ingen overlapning. På dette tidspunkt er disse kun bemærkelsesværdige observationer, men som du vil opdage senere, er de meget vigtige.

Hvad hvis vi tilføjede den nye begivenhed:

begivenhed D: “At få en T på det første kast” Kristian THH, THT, TTH, TTT

hvordan ville det se ud, hvis vi tilføjede begivenhed D til diagrammet ovenfor? (Link til svaret)

Husk, da H og T er lige sandsynlige på hvert kast, og da der er 8 mulige resultater, er sandsynligheden for hvert resultat 1/8.

se om du kan besvare følgende spørgsmål ved hjælp af diagrammerne og/eller listen over resultater for hver begivenhed sammen med det, du hidtil har lært om sandsynlighed.

Lær ved at gøre: Kaste en Fair mønt tre gange

Hvis du var i stand til at besvare disse spørgsmål korrekt, har du sandsynligvis et godt instinkt til beregning af sandsynlighed! Læs videre for at lære, hvordan vi vil anvende denne viden.

Hvis ikke, vil vi forsøge at hjælpe dig med at udvikle denne færdighed i dette afsnit.

kommentar:

  • Bemærk, at I tilfælde C, “at få mindst et hoved”, er der kun et muligt resultat, der mangler, “at få ingen hoveder” = TTT. Vi vil tage fat på dette igen, når vi taler om sandsynlighedsregler, især komplementreglen. På dette tidspunkt vil vi bare have dig til at tænke over, hvordan disse to begivenheder er “modsætninger” i dette scenario.

det er meget vigtigt at indse, at bare fordi vi kan liste de mulige resultater, betyder det ikke, at hvert resultat er lige sandsynligt.

Dette er den (sjove) besked i det daglige Visningsklip, vi leverede på forrige side. Men lad os tænke over det igen. I dette klip hævder Valter, at da der er to mulige resultater, er sandsynligheden 0.5. De to mulige resultater er

  • verden vil blive ødelagt på grund af brugen af large hadron collider
  • verden vil ikke blive ødelagt på grund af brugen af large hadron collider

forhåbentlig er det klart, at disse to resultater ikke er lige sandsynlige!!

lad os overveje et mere almindeligt eksempel.

eksempel: fødselsdefekter

Antag, at vi tilfældigt vælger tre børn, og vi er interesserede i sandsynligheden for, at ingen af børnene har nogen fødselsdefekter.

Vi bruger notationen D til at repræsentere et barn blev født med en fødselsdefekt og N til at repræsentere barnet født uden fødselsdefekt. Vi kan liste de mulige resultater, ligesom vi gjorde for møntkastet, de er:

{DDD, NDD, DND, DDN, DNN, NDN, NND, NNN}

er begivenhederne DDD (alle tre børn er født med fødselsdefekter) og NNN (ingen af børnene er født med fødselsdefekter) lige sandsynlige?

det bør være rimeligt for dig, at P(NNN) er meget større end P(DDD).

Dette skyldes, at P (N) og P(D) ikke er lige sandsynlige begivenheder.

det er sjældent (bestemt ikke 50%) for et tilfældigt udvalgt barn at blive født med en fødselsdefekt.

Sandsynlighedsregler

nu går vi videre til at lære nogle af de grundlæggende sandsynlighedsregler.

heldigvis er disse regler meget intuitive, og så længe de anvendes systematisk, vil de lade os løse mere komplicerede problemer; især de problemer, som vores intuition kan være utilstrækkelig til.

da de fleste af de sandsynligheder, du bliver bedt om at finde, kan beregnes ved hjælp af både

  • logik og tælling

og

  • de regler, vi vil lære,

Vi giver følgende råd som et princip.

princip:

Hvis du kan beregne en sandsynlighed ved hjælp af logik og tælling, behøver du ikke en sandsynlighedsregel (selvom den korrekte regel altid kan anvendes)

Sandsynlighedsregel en

vores første regel minder os simpelthen om den grundlæggende egenskab af sandsynlighed, som vi allerede har lært.

sandsynligheden for en begivenhed, der informerer os om sandsynligheden for, at den forekommer, kan variere alt fra 0 (hvilket indikerer, at begivenheden aldrig vil forekomme) til 1 (hvilket indikerer, at begivenheden er sikker).

Sandsynlighedsregel en:

  • for enhver begivenhed A, 0 lp(a) lp 1.

bemærk: en praktisk anvendelse af denne regel er, at den kan bruges til at identificere enhver sandsynlighedsberegning, der kommer ud til at være mere end 1 (eller mindre end 0) som forkert.

før vi går videre til de andre regler, Lad os først se på et eksempel, der giver en kontekst til at illustrere de næste flere regler.

eksempel: blodtyper

som tidligere diskuteret kan alt humant blod skrives som O, A, B eller AB.

derudover varierer hyppigheden af forekomsten af disse blodtyper efter etniske og racemæssige grupper.

ifølge Stanford University ‘ s Blood Center (bloodcenter.Stanford.edu), disse er sandsynlighederne for humane blodtyper i USA (sandsynligheden for type A er udeladt med vilje):

motiverende spørgsmål til regel 2: en person i USA vælges tilfældigt. Hvad er sandsynligheden for, at den person, der har blodtype A?

svar: Vores intuition fortæller os, at da de fire blodtyper O, A, B og AB udtømmer alle mulighederne, skal deres sandsynligheder tilsammen udgøre 1, hvilket er sandsynligheden for en “bestemt” begivenhed (en person har en af disse 4 blodtyper for visse).

da sandsynlighederne for O, B og AB tilsammen udgør 0.44 + 0.1 + 0.04 = 0,58, sandsynligheden for type A skal være den resterende 0.42 (1 – 0.58 = 0.42):

Data givet i" blodtype: Sandsynlighed " Format: O: 0.44; a: 0.42; B: 0.10; AB: 0.04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Sandsynlighedsregel to

dette eksempel illustrerer vores anden regel, som fortæller os, at sandsynligheden for alle mulige resultater sammen skal være 1.

Sandsynlighedsregel to:

summen af sandsynlighederne for alle mulige resultater er 1.

dette er et godt sted at sammenligne og kontrastere det, vi laver her, med det, vi lærte i afsnittet sonderende dataanalyse (EDA).

  • Bemærk, at vi i dette problem i det væsentlige fokuserer på en enkelt kategorisk variabel: blodtype.
  • vi opsummerede denne variabel ovenfor, da vi opsummerede enkelte kategoriske variabler i EDA-sektionen ved at angive, hvilke værdier variablen tager, og hvor ofte den tager dem.
  • i EDA brugte vi procenter, og her bruger vi sandsynligheder, men de to formidler de samme oplysninger.
  • i EDA-sektionen lærte vi, at et cirkeldiagram giver en passende visning, når en enkelt kategorisk variabel er involveret, og på samme måde kan vi bruge den her (ved hjælp af procenter i stedet for sandsynligheder):

et cirkeldiagram med titlen "blodtyper."Type O optager 44% af cirkeldiagrammet, a bruger 42%, AB repræsenterer 4%, og B repræsenterer resten, 10%. Bemærk, at de typer blod, der er "ikke O", optager 56% af cirkeldiagrammet."Blood Types." Type O takes up 44% of the pie chart, A uses 42%, AB represents 4%, and B represents the rest, 10%. Note that the types of blood which are "not O" take up 56% of the pie chart.

selvom det, vi laver her, faktisk ligner det, vi har gjort i EDA-sektionen, er der en subtil, men vigtig forskel mellem de underliggende situationer

  • i EDA opsummerede vi data, der blev opnået fra en prøveaf personer, for hvem værdier af variablen af interesse blev registreret.
  • her, når vi præsenterer sandsynligheden for hver blodtype, har vi i tankerne hele befolkningenaf mennesker i USA, som vi antager at kende den samlede frekvens af værdier taget af variablen af interesse.

fik jeg dette?: Sandsynlighedsregel to

Sandsynlighedsregel tre

I sandsynlighed og i dens applikationer er vi ofte interesserede i at finde ud af sandsynligheden for, at en bestemt begivenhed ikke vil forekomme.

et vigtigt punkt at forstå her er, at “Begivenhed A ikke forekommer” er en separat begivenhed, der består af alle de mulige resultater, der ikke er i A og kaldes “komplementbegivenheden for A.”

Notation: vi vil skrive “ikke A” for at betegne den begivenhed, som A ikke forekommer. Her er en visuel repræsentation af, hvordan begivenhed A og dens komplementbegivenhed “ikke A” tilsammen repræsenterer alle mulige resultater.

hele prøveområdet S er repræsenteret med en grå boks. Inde i denne boks er en blå cirkel, repræsenterer alle resultater i A. alt andet i den grå boks, men uden for den blå cirkel er "ikke en"."not A".

kommentar:

  • et sådant visuelt display kaldes et “Venn-diagram.”Et Venn-diagram er en enkel måde at visualisere begivenheder og forholdet mellem dem ved hjælp af rektangler og cirkler.

regel 3 omhandler forholdet mellem sandsynligheden for en begivenhed og sandsynligheden for dens komplementbegivenhed.

i betragtning af at Begivenhed A og begivenhed “ikke A” tilsammen udgør alle mulige resultater, og da regel 2 fortæller os, at summen af sandsynlighederne for alle mulige resultater er 1, skal følgende regel være ret intuitiv:

Sandsynlighedsregel tre (Komplementreglen):

  • P(ikke a) = 1 – p(a)
  • det vil sige sandsynligheden for at at en begivenhed ikke forekommer er 1 minus sandsynligheden for, at den forekommer.

eksempel: blodtyper

Tilbage til blodtype eksempel:

Her er nogle yderligere oplysninger:

  • en person med type A kan donere blod til en person med type A eller ab.
  • en person med type B kan donere blod til en person med type B eller AB.
  • en person med type AB kan kun donere blod til en person med type AB.
  • en person med type O-blod kan donere til nogen.

Hvad er sandsynligheden for, at en tilfældigt valgt person ikke kan donere blod til alle? Med andre ord, Hvad er sandsynligheden for, at en tilfældigt valgt person ikke har blodtype O? Vi skal finde P (ikke O). Brug af Komplementreglen, P (ikke O) = 1 – P(O) = 1 – 0,44 = 0,56. Med andre ord har 56% af den amerikanske befolkning ikke blodtype O:

det er klart, at vi også kunne finde P(ikke O) direkte ved at tilføje sandsynlighederne for B, AB og A.

kommentar:

  • Bemærk, at Komplementreglen, P(ikke a) = 1 – P(A) kan omformuleres som P(A) = 1-p(ikke a).
    • P(ikke a) = 1 – P(a)
    • kan omformuleres som P(A) = 1-p(ikke a).
    • denne tilsyneladende trivielle algebraiske manipulation har en vigtig anvendelse og fanger faktisk styrken af komplementreglen.
    • i nogle tilfælde, når det er meget kompliceret at finde P(a) direkte, kan det være meget lettere at finde P(ikke A) og derefter bare trække det fra 1 for at få den ønskede P(a).
    • vi vender snart tilbage til denne kommentar og giver yderligere eksempler.

fik jeg dette?: Sandsynlighedsregel tre
  • komplementreglen kan være nyttig, når det er lettere at beregne sandsynligheden for komplementet til begivenheden snarere end selve begivenheden.
  • Bemærk, Vi brugte igen sætningen “mindst en.”
  • nu har vi set, at komplementet til “mindst en …” er “ingen …” eller ” nej ….”(som vi tidligere nævnte med hensyn til begivenhederne som “modsætninger”).
  • i ovenstående aktivitet ser vi, at
    • P(ingen af disse to bivirkninger) = 1 – P(mindst en af disse to bivirkninger )
  • dette er en almindelig anvendelse af komplementreglen, som du ofte kan genkende ved udtrykket “mindst en” i problemet.

sandsynligheder, der involverer flere begivenheder

vi vil ofte være interesserede i at finde sandsynligheder, der involverer flere begivenheder såsom

  • P(A eller B) = P(begivenhed a forekommer eller begivenhed B forekommer eller begge forekommer)
  • P (A og B)= P(både begivenhed a forekommer og begivenhed B forekommer)

et almindeligt problem med terminologi vedrører, hvordan vi normalt tænker på “eller” i vores daglige livet. For eksempel, når en forælder siger til sit barn i en legetøjsbutik “vil du have legetøj a eller legetøj B?”betyder det, at barnet kun får et legetøj, og han eller hun skal vælge mellem dem. At få begge legetøj er normalt ikke en mulighed.

i modsætning:

i Sandsynlighed betyder “Eller” enten den ene eller den anden eller begge dele.

og så P(A eller B) = P(begivenhed a forekommer eller begivenhed B forekommer eller begge forekommer)

når det er sagt, skal det bemærkes, at der er nogle tilfælde, hvor det simpelthen er umuligt for de to begivenheder at begge forekommer på samme tid.

Sandsynlighedsregel fire

sondringen mellem begivenheder, der kan ske sammen, og dem, der ikke kan, er vigtig.

Disjoint: To begivenheder, der ikke kan forekomme på samme tid, kaldes uensartede eller gensidigt eksklusive. (Vi vil bruge disjoint.)

et Venn-diagram med titlen " A og B er uensartede."Hele prøveområdet er repræsenteret som et rektangel. Inde i rektanglet er to separate cirkler. Den ene cirkel repræsenterer begivenhederne i A, og den anden repræsenterer begivenhederne i B."A and B are Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two separate circles. One circle represents the events in A and the other represents the events in B.et Venn-diagram med titlen "A og B er ikke uensartede."Hele prøveområdet er repræsenteret som et rektangel. Inde i rektanglet er to cirkler. Den ene cirkel repræsenterer forekomsterne i A, og den anden repræsenterer forekomsterne i B. Disse to er ikke uensartede, så de to cirkler overlapper hinanden delvist. (Da de ikke var uensartede, kunne to cirkler overlappe hinanden fuldstændigt, men i dette eksempel gør de det ikke.)"A and B are NOT Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two circles. One circle represents the occurrences in A and the other represents the occurrences in B. These two are not disjoint, so the two circles partially overlap each other. (Being NOT disjoint, two circles could overlap each other completely, but in this example they do not.)

det skal fremgå af billedet, at

  • i det første tilfælde, hvor begivenhederne ikke er uensartede, P(A og B) 0
  • i det andet tilfælde, hvor begivenhederne er uensartede, P(A og B) = 0.

Her er to eksempler:

eksempel:

overvej følgende to begivenheder:

A — en tilfældigt valgt person har blodtype A, og

B — en tilfældigt valgt person har blodtype B.

I sjældne tilfælde er det muligt for en person at have mere end en type blod, der strømmer gennem hans eller hendes årer, men til vores formål antager vi, at hver person kun kan have en blodtype. Derfor er det umuligt for begivenhederne A og B at forekomme sammen.

  • begivenheder A og B er uensartede

på den anden side …

eksempel:

overvej følgende to begivenheder:

A — en tilfældigt valgt person har blodtype A

B — en tilfældigt valgt person er en kvinde.

i dette tilfælde er det muligt for hændelser A og B at forekomme sammen.

  • begivenheder A og B er ikke uensartede.

Venn-diagrammerne antyder, at en anden måde at tænke på uensartede versus ikke uensartede begivenheder er, at uensartede begivenheder ikke overlapper hinanden. De deler ikke nogen af de mulige resultater, og kan derfor ikke ske sammen.

på den anden side overlapper begivenheder, der ikke er adskilte, i den forstand, at de deler nogle af de mulige resultater og derfor kan forekomme på samme tid.

Vi begynder nu med en simpel regel for at finde P(A eller B) til uensartede begivenheder.

Sandsynlighedsregel fire (Tilføjelsesreglen for adskilte begivenheder):

  • hvis A og B er adskilte begivenheder, så P(A eller B) = P(A) + P(B).

kommentar:

  • når man beskæftiger sig med sandsynligheder, vil ordet “eller” altid være forbundet med driften af tilføjelse; derfor navnet på denne regel, “Tilføjelsesreglen.”

eksempel: blodtyper

Recall blodtype eksempel:

Data givet i "blodtype: Sandsynlighed" Format: O: 0.44; a: 0.42; B: 0.10; ab: 0.04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Her er nogle yderligere oplysninger

  • en person med type acan donere blod til en person med type A eller ab.
  • en person med type Bkan donere blod til en person med type B eller AB.
  • en person med type ABcan donere blod til en person med type AB
  • en person med type Oblood kan donere til nogen.

Hvad er sandsynligheden for, at en tilfældigt valgt person er en potentiel donor for en person med blodtype A?

fra de givne oplysninger ved vi, at det at være en potentiel donor for en person med blodtype A betyder at have blodtype A eller O.

vi er derfor nødt til at finde P(A eller O). Da begivenhederne A og O er uensartede, kan vi bruge tilføjelsesreglen for uensartede begivenheder til at få:

  • P(A eller O) = P(A) + P(O) = 0,42 + 0,44 = 0,86.

det er let at se, hvorfor tilføjelse af sandsynligheden faktisk giver mening.

Hvis 42% af befolkningen har blodtype A og 44% af befolkningen har blodtype O,

  • så 42% + 44% = 86% af befolkningen har enten blodtype A eller O, og dermed er potentielle donorer til en person med blodtype A.

denne begrundelse for, hvorfor tilføjelsesreglen giver mening, kan visualiseres ved hjælp af cirkeldiagrammet nedenfor:

et cirkeldiagram med titlen "blodtyper."Type A fylder 42% af cirkeldiagrammet, og type O fylder 44%. Sammen, som A eller O, optager de 86% af cirkeldiagrammet."Blood Types." Type A takes up 42% of the pie chart, and type O takes up 44%. Together, as A or O, they take up 86% of the pie chart.

Lær ved at gøre: Sandsynlighedsregel fire

kommentar:

  • Tilføjelsesreglen for adskilte begivenheder kan naturligvis udvides til mere end to adskilte begivenheder. Lad os tage tre, for eksempel. Hvis A, B og C er tre uensartede begivenheder

et Venn-Diagram, der viser 3 uensartede begivenheder. Som sædvanligt er der en grå boks, der viser hele prøveområdet. Inde i denne grå boks er tre helt separate cirkler. Den første cirkel er for forekomsterne i A, den anden for forekomster i B og den tredje for forekomster i C.

derefter P(A eller B eller C) = P(A) + P(B) + P(C). Reglen er den samme for et vilkårligt antal uensartede begivenheder.

fik jeg dette?: Sandsynlighedsregel fire

Vi er nu færdige med den første version af Tilføjelsesreglen (regel fire), som er den version, der er begrænset til uensartede begivenheder. Før vi dækker den anden version, skal vi først diskutere P(A og B).

find P(A og B) ved hjælp af logik

vi vender nu til beregning

  • P(A og B)= P(både begivenhed a forekommer og begivenhed B forekommer)

senere vil vi diskutere reglerne for beregning af P(A og B).

først vil vi illustrere, at en regel ikke er nødvendig, når du kan bestemme svaret gennem logik og tælling.

Special Case:

der er et specielt tilfælde, som vi ved, hvad P(A og B) er lig med uden at anvende nogen regel.

Lær ved at gøre: Find P (A og B) # 1

så hvis begivenhederne A og B er uensartede, så (pr.definition) P(A og B)= 0. Men hvad nu hvis begivenhederne ikke er uensartede?

Husk, at Regel 4, Tilføjelsesreglen, har to versioner. Den ene er begrænset til uensartede begivenheder, som vi allerede har dækket, og vi behandler den mere generelle version senere i dette modul. Det samme vil være tilfældet med sandsynligheder, der involverer og

men undtagen i særlige tilfælde vil vi stole på logik for at finde P(A og B) i dette kursus.

før vi dækker formelle regler, Lad os se på et eksempel, hvor begivenhederne ikke er uensartede.

eksempel: Periodontal Status og køn

overvej følgende tabel vedrørende individers periodontale status og deres køn. Periodontal status refererer til tandkødssygdomme, hvor individer klassificeres som enten sunde, har tandkødsbetændelse eller har periodontal sygdom.

Vi har set denne type tabel før, da vi diskuterede analyse af data i tilfælde C-kur C. Med henblik på dette spørgsmål vil vi bruge disse data som vores “befolkning” og overveje tilfældigt at vælge en person.

Lær ved at gøre: Periodontal Status og køn

Vi kan godt lide at stille sandsynlighedsspørgsmål svarende til det foregående eksempel (ved hjælp af en tovejstabel baseret på data), da dette giver dig mulighed for at lave forbindelser mellem disse emner og hjælper dig med at holde noget af det, du har lært om data, frisk i dit sind.

husk, vores primære mål i dette kursus er at analysere virkelige data!

Sandsynlighedsregel fem

Vi er nu klar til at gå videre til den udvidede version af Tilføjelsesreglen.

i dette afsnit lærer vi, hvordan man finder P(A eller B), Når A og B ikke nødvendigvis er uensartede.

  • vi kalder denne udvidede version “generel Tilføjelsesregel” og angiver den som Sandsynlighedsregel fem.

Vi begynder med at angive reglen og give et eksempel svarende til de typer problemer, vi generelt stiller i dette kursus. Derefter vil vi præsentere et mere andet eksempel, hvor vi ikke har rådataene fra en prøve at arbejde ud fra.

Sandsynlighedsregel fem:

  • den generelle Tilføjelsesregel: P(A eller B) = P(A) + P(B) – P(A og B).

BEMÆRK: Det er bedst at bruge logik til at finde P(A og B), ikke en anden formel.

en meget almindelig fejl er forkert anvendelse af multiplikationsreglen for uafhængige begivenheder, der er dækket på Næste side. Dette vil kun være korrekt, hvis A og B er uafhængige (se definitioner, der skal følges), hvilket sjældent er tilfældet i data præsenteret i tovejstabeller.

som vi var vidne til i tidligere eksempler, når de to begivenheder ikke er uensartede, er der en vis overlapning mellem begivenhederne.

  • hvis vi blot tilføjer de to sandsynligheder sammen, får vi det forkerte svar, fordi vi har talt en vis “sandsynlighed” to gange!
  • således skal vi trække denne” ekstra ” Sandsynlighed ud for at nå frem til det rigtige svar. Venn-diagrammet og tovejstabellerne er nyttige til at visualisere denne ide.

et venn-diagram med titlen "A og B er ikke uensartede."En grå boks repræsenterer prøveområdet, og indeni er to blå cirkler, der har et overlappende område. Den ene cirkel er mærket A, og den anden er mærket B. Det område, hvor de to cirkler overlapper hinanden, repræsenterer, at begivenhederne A og B kan forekomme på samme tid, så P(A og B) er 0."A and B are NOT Disjoint." A gray box represents the sample space, and inside are two blue circles which have an overlapping area. One circle is labeled A and the other is labeled B. The area where the two circles overlap represents that Events A and B can occur at the same time, so P(A and B) ≠ 0.

denne regel er mere generel, da den fungerer for ethvert par begivenheder (endda uensartede begivenheder). Vores råd er stadig at forsøge at besvare spørgsmålet ved hjælp af logik og tælling, når det er muligt, ellers skal vi være yderst forsigtige med at vælge den rigtige regel for problemet.

princip:

Hvis du kan beregne en sandsynlighed ved hjælp af logik og tælling, behøver du ikke en sandsynlighedsregel (selvom den korrekte regel altid kan anvendes)

Bemærk, at hvis A og B er uensartede, reduceres P(A og B) = 0 og Regel 5 til Regel 4 for dette specielle tilfælde.

et Venn-Diagram med titlen " A og B er uensartede. Hele prøveområdet S er repræsenteret som et gråt rektangel. Inde er to, separate, ikke-overlappende blå cirkler. Den ene cirkel er for forekomsterne i A og den anden for forekomster i B."A and B are Disjoint. The entire sample space S is represented as a gray rectangle. Inside are two, separate, non-overlapping blue circles. One circle is for the occurrences in A and the other for occurrences in B.

lad os se det sidste eksempel igen:

eksempel: Periodontal Status og køn

overvej tilfældigt at vælge et individ blandt dem, der er repræsenteret i følgende tabel vedrørende individers periodontale status og deres køn. Periodontal status refererer til tandkødssygdomme, hvor individer klassificeres som enten sunde, har tandkødsbetændelse eller har periodontal sygdom.

lad os gennemgå, hvad vi har lært hidtil. Vi kan beregne enhver Sandsynlighed i dette scenarie, hvis vi kan bestemme, hvor mange individer der tilfredsstiller begivenheden eller kombinationen af begivenheder.

  • P (mand) = 3009/8027 = 0,3749
  • P (kvinde) = 5018/8027 = 0,6251
  • P (sund) = 3750/8027 = 0,4672
  • P (ikke sund) = P(Gingivitis eller Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
    vi kunne også beregne dette ved hjælp af komplementreglen: 1-P(sund)

Vi fandt også tidligere, at

  • P(mandlig og sund) = 1143/8027 = 0.1424

husk regel 5, P(A eller B) = P(A) + P(B) – P(A og B). Vi bruger nu denne regel til at beregne P (mand eller sund)

  • P (mand eller sund) = P (mand) + P (sund) – P (mand og sund) = 0.3749 + 0.4672 – 0.1424 = 0.6997 eller omkring 70%

vi løste dette spørgsmål tidligere ved blot at tælle, hvor mange individer der er enten mandlige eller sunde eller begge dele. Billedet nedenfor illustrerer de værdier, vi skal kombinere. Vi er nødt til at tælle

  • alle mænd
  • alle sunde individer
  • men ikke tælle nogen to gange!!

Ved hjælp af denne logiske tilgang ville vi finde

  • P (mand eller sund) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996

Vi har en mindre forskel i vores svar i den sidste decimal på grund af afrundingen, der opstod, da vi beregnede P(mand), P(sund) og P(mand og sund) og derefter anvendte regel 5.

det er klart, at svaret faktisk er det samme, omkring 70%. Hvis vi Bar vores svar til flere decimaler, eller hvis vi brugte de originale fraktioner, kunne vi eliminere denne lille uoverensstemmelse helt.

lad os se på et sidste eksempel for at illustrere Sandsynlighedsregel 5, når reglen er nødvendig – dvs.når vi ikke har faktiske data.

eksempel: vigtig levering!

det er vigtigt, at et bestemt dokument når sin destination inden for en dag. For at maksimere chancerne for levering til tiden sendes to kopier af dokumentet ved hjælp af to tjenester, service A og service B. Det er kendt, at sandsynligheden for levering til tiden er:

  • 0.90 for service a (P(a) = 0.90)
  • 0.80 for service B (P(B) = 0.80)
  • 0.75 for begge tjenester er til tiden(P(A og B) = 0,75)
    (Bemærk, at A og B ikke er uensartede. De kan ske sammen med Sandsynlighed 0,75.)

Venn-diagrammerne nedenfor illustrerer sandsynlighederne P(A), P(B) og P(A og B):

tre Venn-diagrammer. I dem alle er der et stort rektangel, der repræsenterer hele prøveområdet S. inde i dette rektangel er to cirkler, der overlapper delvist. Den ene cirkel er mærket A og den anden er mærket B. I det første Venn-Diagram er cirklen for a farvet blå, og vi ser, at P(a) = 0,90 . I en vis forstand er P (a) området for a-cirklen. I det andet Venn-Diagram er cirklen for B farvet blå, og det er markeret, at P(B) = 0,80 . Ligesom i det første Venn-diagram kan man tro, at cirklen for B har et areal på 0,80 . I det tredje Venn-Diagram er det område, der er overlapningen af cirklerne A og B, farvet blåt. P (A og B) = 0,75 . Overlapningsområdet kan betragtes som et areal på 0,75 .

i forbindelse med dette problem er det indlysende spørgsmål af interesse:

  • hvad er sandsynligheden for levering til tiden af dokumentet ved hjælp af denne strategi (for at sende det via begge tjenester)?

dokumentet når sin destination til tiden, så længe det leveres til tiden af service A eller af service B eller af begge tjenester. Med andre ord, når begivenhed a opstår, eller begivenhed B forekommer, eller begge forekommer. så….

P (til tiden levering ved hjælp af denne strategi)= P(A eller B), som er repræsenteret af det skraverede område i diagrammet nedenfor:

det samme Venn-Diagram undtagen området for de to cirkler er farvet blå (skraveret). Dette betyder, at området i overlapningen også er farvet blåt. Bemærk, at overlapningsområdet kun er farvet en gang, så selvom det er i begge cirkler, tæller vi det en gang.

Vi kan nu

  • bruge de tre Venn-diagrammer, der repræsenterer P(A), P(B) og P(A og B)
  • for at se, at vi kan finde P(A eller B) ved at tilføje P(A) (repræsenteret af den venstre cirkel) og P(B) (repræsenteret af den højre cirkel),
  • derefter trække P(A og B) (repræsenteret af overlapningen), da vi inkluderede det to gange, en gang som en del af AF P(A) og en gang som en del af p(B).

Dette vises på følgende billede:

arealet af begge cirkler i Venn - diagrammet (tæller overlapningsområdet en gang) beregnes som: arealet af A 'S cirkel (som inkluderer overlapningen) + arealet af B' s cirkel (som også inkluderer overlapningen) - arealet af overlapningen. Vi får derfor: P(A eller B) = P(A) + P(B) - P (A og B).'s circle (which includes the overlap) + the area of B's circle (which also includes the overlap) - the area of the overlap. We therefore get: P(A or B) = P(A) + P(B) - P(A and B).

Hvis vi anvender dette på vores eksempel, finder vi, at:

  • P (A eller B)= P (levering til tiden ved hjælp af denne strategi)= 0.90 + 0.80 – 0.75 = 0.95.

så vores strategi for at bruge to leveringstjenester øger vores Sandsynlighed for levering til tiden til 0,95.

mens Venn-diagrammerne var gode til at visualisere den generelle Tilføjelsesregel, er det i tilfælde som disse meget lettere at vise informationen i og arbejde med en tovejs sandsynlighedstabel, ligesom vi undersøgte forholdet mellem to kategoriske variabler i afsnittet sonderende dataanalyse.

Vi viser dig simpelthen tabellen, ikke hvordan vi udleder den, da du ikke bliver bedt om at gøre dette for os. Du skal være i stand til at se, at noget logik og enkel tilføjelse/subtraktion er alt, hvad vi brugte til at udfylde nedenstående tabel.

tabellen har kolonner "B", "ikke B" og "Total."Rækkerne er "A", "ikke A" og " Total."Her er nogle oplysninger om tabellen, organiseret efter celle: i cellen A,B er værdien der (0, 75) P(A og B) = P(levering til tiden af begge tjenester). I cellen a, Ikke B, er værdien der(0,15) P(A og ikke B) = P (levering til tiden kun ved service a). Ved celle ikke A og B er værdien (0,05) P(ikke A og B) = P(levering til tiden kun ved service B). I celle ikke A og ikke B er værdien(0,05) P(ikke A og ikke B) = P (hverken service A eller B leveret til tiden)."B," "not B," and "Total." The rows are "A," "not A," and "Total." Here are is some information about the table, organized by cell: At the cell A,B, the value there (0.75) is P(A and B) = P(on-time delivery by both services). At the cell A,not B, the value there (0.15) is P(A and Not B) = P(on-time delivery ONLY by service A). At cell Not A and B, the value (0.05) is P(not A and B) = P(on-time delivery ONLY by service B). At cell Not A and Not B, the value (0.05) is P(not A and not B) = P(Neither service A nor B delivered on time).

når vi bruger en tovejstabel, skal vi huske at se på hele rækken eller kolonnen for at finde overordnede sandsynligheder, der kun involverer a eller kun B.

  • P(a) = 0,90 betyder, at i 90% af tilfældene, når service A bruges, leverer det dokumentet til tiden. For at finde dette ser vi på den samlede sandsynlighed for rækken, der indeholder A. Ved at finde P(A) ved vi ikke, om B sker eller ej.

tabellens første række er blevet fremhævet. Her er de fremhævede data i række, kolonneformat: A, B: P(A og B) = 0,75; A, ikke B: P(A og ikke B) = 0,15; a, Total: P(a) = 0,90 = P(A og B) + P(A og ikke B)'s first row has been highlighted. Here is the highlighted data in "Row, Column" format: A, B: P(A and B) = 0.75; A, not B: P(A and not B) = 0.15; A, Total: P(A) = 0.90 = P(A and B) + P(A and not B)

  • P(B) = 0,80 betyder, at i 80% af tilfældene, når service B anvendes, leverer det dokumentet til tiden. For at finde dette ser vi på den samlede sandsynlighed for kolonnen indeholdende B. ved at finde P(B) ved vi ikke, om a sker eller ej.

tabellens første kolonne er blevet fremhævet. Her er de fremhævede data i række, kolonneformat: A, B: P(A og B) = 0,75; ikke A, B: P(ikke A og B) = 0.05; B, Total: P(B) = 0,80 = P(A og B) + P(ikke A og B)'s first column has been highlighted. Here is the highlighted data in "Row, Column" format: A,B: P(A and B) = 0.75; not A, B: P(not A and B) = 0.05; B,Total: P(B) = 0.80 = P(A and B) + P(not A and B)

kommentar

  • da vi brugte tovejstabeller i afsnittet sonderende dataanalyse (EDA), var det at registrere værdier for to kategoriske variabler for en konkret prøve af individer.
  • i modsætning hertil er informationen i en sandsynlighedsvejstabel for en hel befolkning, og værdierne er ret abstrakte.
  • hvis vi havde behandlet noget som leveringseksemplet i EDA-sektionen, ville vi have registreret det faktiske antal on-time (og ikke-on-time) leverancer for prøver af dokumenter sendt med service A eller B.
  • i dette afsnit præsenteres de langsigtede sandsynligheder som værende kendt.
  • formentlig var de rapporterede sandsynligheder i dette leveringseksempel baseret på relative frekvenser registreret over mange gentagelser.

interaktiv Applet: Sandsynlighed Venn Diagram

afrunding tommelfingerregel for Sandsynlighed:

følg følgende generelle retningslinjer i dette kursus. Hvis du er i tvivl bære flere decimaler. Hvis vi angiver give præcis, hvad der anmodes om.

  • generelt skal du bære sandsynligheder til mindst 4 decimaler for mellemliggende trin.
  • vi runder ofte vores endelige svar med to eller tre decimaler.
  • for ekstremt små sandsynligheder er det vigtigt at have 1 eller to signifikante cifre (ikke-nul cifre), såsom 0,000001 eller 0,000034 osv.

mange computerpakker kan vise ekstremt små værdier ved hjælp af videnskabelig notation som

  • 58 list 10-5 eller 1.58 E-5 for at repræsentere 0.0000158

lad os opsummere

indtil videre i vores undersøgelse af sandsynlighed er du blevet introduceret til sandsynlighedens undertiden kontraintuitive karakter og de grundlæggende elementer, der ligger til grund for sandsynligheden, såsom en relativ frekvens.

Vi gav dig også nogle værktøjer til at hjælpe dig med at finde sandsynlighederne for begivenheder — nemlig sandsynlighedsreglerne.

du har sikkert bemærket, at sandsynlighedsafsnittet var signifikant forskelligt fra de to foregående afsnit; Det har en meget større teknisk/matematisk komponent, så resultaterne har tendens til at være mere af den “rigtige eller forkerte” karakter.

i afsnittet sonderende dataanalyse tog computeren for det meste sig af det tekniske aspekt af tingene, og vores opgaver var at bede den om at gøre det rigtige og derefter fortolke resultaterne.

i Sandsynlighed gør vi arbejdet fra start til slut, fra at vælge det rigtige værktøj (regel) til brug, til at bruge det korrekt, til at fortolke resultaterne.

Her er en oversigt over de regler, vi har præsenteret indtil videre.

1. Sandsynlighedsregel # 1 angiver:

  • for enhver begivenhed A, 0 lp(a) lp 1

    2. Sandsynlighedsregel #2 siger:

    • summen af sandsynlighederne for alle mulige resultater er 1

    3. Komplementreglen (#3) angiver, at

    • P(ikke a) = 1 – p(a)

    eller når omarrangeret

    • P(a) = 1 – p(ikke A)

    sidstnævnte repræsentation af Komplementreglen er især nyttig, når vi skal finde sandsynligheder for begivenheder af den slags “mindst en af …”

    4. Den generelle Tilføjelsesregel (#5) angiver, at for to begivenheder

    • P(A eller B) = P(A) + P(B) – P(A og B),

    hvor vi med P(A eller B) mener P(A forekommer eller B forekommer eller begge dele).

    i det særlige tilfælde af uensartede begivenheder, begivenheder, der ikke kan forekomme sammen, kan den generelle Tilføjelsesregel reduceres til Tilføjelsesreglen for uensartede begivenheder (#4), som er

    • P(A eller B) = P(A) + P(B). *

    *brug kun, når du er overbevist om, at begivenhederne er uensartede (de overlapper ikke)

    5. Den begrænsede version af tilføjelsesreglen (for uensartede begivenheder) kan let udvides til mere end to begivenheder.

    6. Indtil videre har vi kun fundet P (A og B) ved hjælp af logik og tælling i enkle eksempler

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *