Grunnleggende Sannsynlighetsregler

  • Introduksjon
  • Sannsynlighetsregler
    • Sannsynlighetsregel En (For alle hendelser A, 0 ≤ p(A) ≤ 1)
    • Sannsynlighetsregel To (summen av sannsynlighetene for alle mulige utfall er 1)
    • Sannsynlighetsregel Tre (Komplement-Regelen)
    • Sannsynlighetsregel Tre (Komplement-Regelen)
    • Sannsynlighetsregel Tre(Komplement-Regelen)
    • Sannsynlighet Som Involverer Flere Hendelser

  • li>

  • Sannsynlighetsregel Fire (Tilleggsregel For Disjunkte Hendelser)
  • Finne P (a og b) ved hjelp av logikk
  • sannsynlighetsregel Fem (Den Generelle Tilleggsregelen)
  • Avrunding Tommelfingerregel For Sannsynlighet
  • La Oss Oppsummere
  • CO-6: Bruk grunnleggende begreper om sannsynlighet, tilfeldig variasjon og vanlige statistiske sannsynlighetsfordelinger.
    LO 6.4: Relatere sannsynligheten for en hendelse til sannsynligheten for at denne hendelsen inntreffer.
    LO 6.5: Bruk den relative frekvenstilnærmingen for å estimere sannsynligheten for en hendelse.
    LO 6.6: Bruk grunnleggende logikk og sannsynlighetsregler for å finne den empiriske sannsynligheten for en hendelse.
    Video: Grunnleggende Sannsynlighetsregler (25: 17)

    i forrige avsnitt introduserte vi sannsynlighet som en måte å kvantifisere usikkerheten som oppstår ved å utføre eksperimenter ved hjelp av et tilfeldig utvalg fra populasjonen av interesse.Vi så at sannsynligheten for en hendelse (for eksempel hendelsen at en tilfeldig valgt person har blodtype O) kan estimeres av den relative frekvensen som hendelsen oppstår i en lang rekke forsøk. Så vi vil samle inn data fra mange individer for å estimere sannsynligheten for at noen har blodtype O.

    I denne delen vil vi etablere de grunnleggende metodene og prinsippene for å finne sannsynligheter for hendelser.

    vi vil også dekke noen av de grunnleggende reglene for sannsynlighet som kan brukes til å beregne sannsynligheter.

    Innledning

    vi vil begynne med et klassisk sannsynlighetseksempel på å kaste en rettferdig mynt tre ganger.Siden mynt og mynt er like sannsynlige for hvert kast i dette scenariet, vil hver av mulighetene som kan oppstå fra tre kaster også være like sannsynlige, slik at vi kan liste alle mulige verdier og bruke denne listen til å beregne sannsynligheter.Siden vårt fokus i dette kurset er på data og statistikk (ikke teoretisk sannsynlighet), vil vi i de fleste av våre fremtidige problemer bruke et oppsummert datasett, vanligvis en frekvenstabell eller toveis tabell, for å beregne sannsynligheter.

    EKSEMPEL: Kaste en rettferdig mynt tre ganger

    la oss liste hvert mulig utfall (eller mulig resultat):

    {HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}

    la Oss nå definere følgende hendelser:

    Hendelse A: «Får ingen H»

    Hendelse B: «Får nøyaktig En H»

    Hendelse C: «Får minst En H»

    merk at hver hendelse faktisk er en uttalelse om utfallet som eksperimentet skal produsere. I praksis tilsvarer hver hendelse en samling (delmengde) av de mulige utfallene.

    Hendelse A: «Får ingen H» → ttt

    Hendelse B: «Får nøyaktig EN H» → htt, THT, TTH

    Hendelse C:» Får minst EN H» → HTT, THT, TTH, THH, HTH, HHT, hhh

    her er en visuell representasjon av hendelser A, B og C.

    Vi har et stort rektangel merket" S " som representerer HELHETEN AV PRØVEPLASSEN. Inne i dette rektangelet har vi en sirkel merket " C. "alt utenfor" C skjer sammenfalt med hendelse A som bare inneholder "TTT". Inne I C ser vi "HHH", "THH", "HTH"," HHT " og en sirkel som representerer hendelse B. Inne I B er "HHT", " THT " og " TTH."Merk at alle elementene Inne I B også er inne I C, Så C omslutter B."S" which represents the entirety of the sample space. Inside this rectangle we have a circle labeled "C." Everything outside of "C happens to coincied with event A containing only "TTT". Inside of C, we see "HHH," "THH," "HTH," "HHT," and a circle representing event B. Inside B are "HHT," "THT," and "TTH." Note that all of the items inside B are also inside C, so C fully encloses B.

    Fra denne visuelle representasjonen av hendelsene er det lett å se at hendelse B er helt inkludert I hendelse C, i den forstand at hvert utfall I hendelse B også er et utfall i hendelse C. vær også oppmerksom på at hendelse A står bortsett Fra hendelser B og C, i den forstand at de ikke har noe utfall til felles, eller ingen overlapping. På dette punktet er disse bare bemerkelsesverdige observasjoner, men som du vil oppdage senere, er de svært viktige.

    Hva om vi la til den nye hendelsen:

    Hendelse D: «Å få En T på første kaste» → THH, THT, TTH, TTT

    Hvordan ville det se ut Hvis vi la til hendelse D til diagrammet ovenfor? Husk, Siden H Og T er like sannsynlige på hvert kast, og siden det er 8 mulige utfall, er sannsynligheten for hvert utfall 1/8.

    Se om du kan svare på følgende spørsmål ved hjelp av diagrammene og / eller listen over utfall for hver hendelse sammen med det du har lært så langt om sannsynlighet.

    Lær Ved Å Gjøre: Kaste En Rettferdig Mynt Tre Ganger

    Hvis du var i stand til å svare på disse spørsmålene riktig, har du sannsynligvis et godt instinkt for å beregne sannsynlighet! Les videre for å lære hvordan vi vil bruke denne kunnskapen.

    Hvis ikke, vil vi prøve å hjelpe deg med å utvikle denne ferdigheten i denne delen.

    Kommentar:

    • Merk at I tilfelle C,» Får minst ett hode » er det bare ett mulig utfall som mangler,» Får INGEN hoder » = TTT. Vi vil ta opp dette igjen når vi snakker om sannsynlighetsregler, spesielt komplementregelen. På dette punktet vil vi bare at du skal tenke på hvordan disse to hendelsene er «motsetninger» i dette scenariet.Det ER VELDIG viktig å innse at bare fordi vi kan liste ut de mulige utfallene, betyr dette ikke at hvert utfall er like sannsynlig.

      dette er den (morsomme) meldingen i Daily Show-klippet vi ga på forrige side. Men la oss tenke på dette igjen. I det klippet hevder Walter at siden det er to mulige utfall, er sannsynligheten 0,5. De to mulige utfallene er

      • verden vil bli ødelagt på grunn av bruk av large hadron collider
      • verden vil Ikke bli ødelagt på grunn av bruk av large hadron collider

      Forhåpentligvis Er det klart at disse to utfallene Ikke er like sannsynlige!!

      la oss vurdere et mer vanlig eksempel.

      EKSEMPEL: Fødselsskader

      Anta at vi tilfeldig velger tre barn og vi er interessert i sannsynligheten for at ingen av barna har noen fødselsskader.

      vi bruker notasjonen D for å representere et barn født med fødselsdefekt og N for å representere barnet født uten fødselsdefekt. Vi kan liste de mulige utfallene akkurat som vi gjorde for myntkastet, de er:

      {DDD, NDD, DND, DDN, DNN, NDN, NND, NNN}

      er hendelsene DDD (alle tre barn er født med fødselsskader) og NNN (ingen av barna er født med fødselsskader) like sannsynlig?

      Det bør være rimelig for DEG AT P (NNN) er mye større ENN P (DDD).

      Dette er fordi P(N) og P (D) ikke er like sannsynlige hendelser.

      det er sjeldent (absolutt ikke 50%) at et tilfeldig valgt barn blir født med en fødselsdefekt.

      Sannsynlighetsregler

      nå går Vi videre til å lære noen av de grunnleggende sannsynlighetsreglene.Heldigvis er disse reglene veldig intuitive, Og så lenge de brukes systematisk, vil de la oss løse mer kompliserte problemer; spesielt de problemene som vår intuisjon kan være utilstrekkelig for.

      siden de fleste sannsynlighetene du vil bli bedt om å finne, kan beregnes ved å bruke både

      • logikk og telling

      og

      • reglene vi skal lære,

      vi gir følgende råd som et prinsipp.

      PRINSIPP:

      HVIS du kan beregne en sannsynlighet ved hjelp av logikk OG telling, TRENGER du ikke en sannsynlighetsregel (selv om den riktige regelen alltid kan brukes)

      Sannsynlighetsregel En

      Vår første regel minner oss bare om den grunnleggende egenskapen til sannsynlighet som vi allerede har lært.

      sannsynligheten for en hendelse, som informerer oss om sannsynligheten for at den inntreffer, kan variere alt fra 0 (indikerer at hendelsen aldri vil inntreffe) til 1(indikerer at hendelsen er sikker).

      Sannsynlighetsregel En:

      • For enhver Hendelse A, 0 ≤ p(A) ≤ 1.

      MERK: en praktisk bruk av denne regelen er at den kan brukes til å identifisere en sannsynlighetsberegning som kommer ut til å være mer enn 1 (eller mindre enn 0) som feil.

      før vi går videre til de andre reglene, la oss først se på et eksempel som vil gi en kontekst for å illustrere de neste flere reglene.

      EKSEMPEL: Blodtyper

      som tidligere omtalt kan alt humant blod skrives Som O, A, B eller AB.

      i tillegg varierer hyppigheten av forekomsten av disse blodtyper etter etniske og rasegrupper.

      Ifølge Stanford Universitys Blodsenter (bloodcenter.Stanford.edu), dette er sannsynlighetene for humane blodtyper i Usa (sannsynligheten for Type A er utelatt med vilje):

      Motiverende spørsmål for regel 2: en person i Usa er valgt tilfeldig. Hva er sannsynligheten for at en person har blodtype A?

      Svar: Vår intuisjon forteller oss at siden de fire blodtypene O, A, B og AB utmerker alle mulighetene, må deres sannsynligheter sammen summere til 1, som er sannsynligheten for en «bestemt» hendelse(en person har en av disse 4 blodtypene for visse).

      siden sannsynlighetene For O, B og AB sammen summerer til 0.44 + 0.1 + 0.04 = 0,58, sannsynligheten for type A må være den gjenværende 0.42 (1 – 0.58 = 0.42):

      Data gitt i" Blodtype: Sannsynlighet " Format: O: 0,44; A: 0,42; B: 0,10; AB: 0,04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

      Sannsynlighetsregel To

      dette eksemplet illustrerer vår andre regel, som forteller oss at sannsynligheten for alle mulige utfall sammen må være 1.

      Sannsynlighetsregel To:

      summen av sannsynlighetene for alle mulige utfall er 1.

      Dette er et godt sted å sammenligne og kontrastere hva vi gjør her med det vi lærte i Exploratory Data Analysis (EDA) – delen.

      • Legg Merke til at i dette problemet fokuserer vi i hovedsak på en enkelt kategorisk variabel: blodtype.
      • vi oppsummerte denne variabelen ovenfor, da vi oppsummerte enkelt kategoriske variabler I EDA-delen, ved å notere hvilke verdier variabelen tar og hvor ofte det tar dem.
      • I EDA brukte vi prosenter, og her bruker vi sannsynligheter, men de to formidler den samme informasjonen.
      • I EDA-delen lærte vi at et kakediagram gir en passende visning når en enkelt kategorisk variabel er involvert, og på samme måte kan vi bruke den her (ved hjelp av prosenter i stedet for sannsynligheter):

      et kakediagram med tittelen " Blodtyper."Type O tar opp 44% av kakediagrammet, A bruker 42%, AB representerer 4%, Og B representerer resten, 10%. Merk at blodtypene som er "ikke O" tar opp 56% av kakediagrammet."Blood Types." Type O takes up 44% of the pie chart, A uses 42%, AB represents 4%, and B represents the rest, 10%. Note that the types of blood which are "not O" take up 56% of the pie chart.

      Selv om det vi gjør her faktisk ligner på DET vi har gjort I EDA-delen, er det en subtil, men viktig forskjell mellom de underliggende situasjonene

      • I EDA oppsummerte vi data som ble hentet fra en prøveav personer for hvem verdier av variabelen av interesse ble registrert.
      • Her, når vi presenterer sannsynligheten for hver blodtype, har vi i tankene hele befolkningenav Mennesker i Usa, som vi antar å vite den generelle frekvensen av verdier tatt av variabelen av interesse.
      Fikk Jeg Dette?: Sannsynlighetsregel To

      Sannsynlighetsregel Tre

      i sannsynlighet og i dens applikasjoner er vi ofte interessert i å finne ut sannsynligheten for at en bestemt hendelse ikke vil forekomme.

      et viktig poeng å forstå her er at «hendelse A ikke forekommer» er en separat hendelse som består av alle mulige utfall som ikke er I A og kalles » komplement-hendelsen Til A. «

      Notasjon: vi vil skrive «ikke A» for å betegne hendelsen At A ikke forekommer. Her er en visuell representasjon av hvordan hendelse A og komplement hendelsen «ikke a» sammen representerer alle mulige utfall.

      hele prøveområdet S er representert med en grå boks. Inne i denne boksen er en blå sirkel, som representerer alle utfall I A. Alt annet i den grå boksen, men utenfor den blå sirkelen er "ikke A"."not A".

      Kommentar:

      • et slikt visuelt display kalles Et » Venn-diagram.»Et Venn-diagram er en enkel måte å visualisere hendelser og forholdet mellom dem ved hjelp av rektangler og sirkler.

      Regel 3 omhandler forholdet mellom sannsynligheten for en hendelse og sannsynligheten for dens komplementhendelse.

      gitt at hendelse A og hendelse «ikke a» sammen utgjør alle mulige utfall, og siden regel 2 forteller oss at summen av sannsynlighetene for alle mulige utfall er 1, bør følgende regel være ganske intuitiv:

      Sannsynlighetsregel Tre (Komplement – Regelen):

      • P(ikke a) = 1-P(A)
      • det vil si sannsynligheten For At Alle mulige utfall er mulige.en hendelse forekommer ikke Er 1 Minus sannsynligheten for at det skjer.

      Eksempel: Blodtyper

      tilbake til blodtype eksempel:

      her er noen tilleggsinformasjon:

        en person med type a kan donere blod til en person med type a eller ab.

      • en Person med Type B kan donere blod til en person med Type B eller AB.
      • en PERSON med TYPE AB kan donere blod til en person med TYPE AB bare.
      • en Person med Type o blod kan donere til noen.

      hva er sannsynligheten for at en tilfeldig valgt person ikke kan donere blod til alle? Med andre ord, hva er sannsynligheten for at en tilfeldig valgt person ikke har blodtype O? Vi må finne P (ikke O). Ved Hjelp Av Komplementregelen, P (ikke O) = 1-P (O) = 1-0,44 = 0,56. Med andre ord, 56% AV DEN AMERIKANSKE befolkningen ikke har blodtype O:

      Klart, Vi Kan Også finne P(ikke O) direkte ved å legge sannsynlighetene FOR B, AB, OG A.

      Kommentar:

      • Merk At Komplementregelen, P (ikke A) = 1-P(A) kan omformuleres Som P(A) = 1-P (ikke A).
        • P(ikke A) = 1 – P(A)
        • Kan omformuleres Som P (A) = 1-P (ikke A).
        • denne tilsynelatende trivielle algebraiske manipulasjonen har et viktig program, og fanger faktisk styrken til komplementregelen.
        • i noen tilfeller, når det er svært komplisert å finne P(a) direkte, kan Det være mye lettere å finne P(ikke A) og bare trekke den fra 1 for å få ønsket P (A).
        • Vi kommer snart tilbake til denne kommentaren og gir flere eksempler.
      Fikk Jeg Dette?: Sannsynlighetsregel Tre
      • komplementregelen kan være nyttig når det er lettere å beregne sannsynligheten for komplementet til hendelsen i stedet for selve hendelsen.
      • Legg Merke til, vi brukte igjen uttrykket » minst en.»
      • Nå har Vi sett at komplementet til «minst en …» er «ingen …» eller » nei ….»(som vi nevnte tidligere i forhold til hendelsene som «motsetninger»).
      • I ovennevnte aktivitet ser vi at
        • P(INGEN av disse to bivirkningene) = 1 – P(minst en av disse to bivirkningene)
      • Dette er en vanlig anvendelse av komplementregelen som du ofte kan gjenkjenne med uttrykket «minst en» i problemet.

      Sannsynligheter Som Involverer Flere Hendelser

      Vi vil ofte være interessert i å finne sannsynligheter som involverer flere hendelser som

      • P (a eller B) = p(hendelse a oppstår eller hendelse B oppstår eller begge forekommer)

      et vanlig problem med terminologi er relatert til hvordan vi vanligvis tenker på «eller» i vårt daglige liv. For eksempel, når en forelder sier til sitt barn i en leketøybutikk «vil du ha leketøy A eller leketøy B?», betyr dette at barnet bare skal få ett leketøy, og han eller hun må velge mellom dem. Å få begge lekene er vanligvis ikke et alternativ.

      i kontrast:

      i sannsynlighet «eller» betyr enten den ene eller den andre eller begge deler.

      og Så P(a Eller B) = p(hendelse a oppstår Eller hendelse B oppstår eller begge forekommer)

      når det er sagt, bør det bemerkes at det er noen tilfeller der det er rett og slett umulig for de to hendelsene å begge skje samtidig.

      Sannsynlighetsregel Fire

      skillet mellom hendelser som kan skje sammen og de som ikke kan er en viktig en.

      : To hendelser som ikke kan skje samtidig kalles disjoint eller gjensidig utelukkende. (Vi vil bruke disjoint.)

      Et Venn-diagram med tittelen " A og B Er Usammenhengende."Hele prøveplassen er representert som et rektangel. Inne i rektangelet er to separate sirkler. En sirkel representerer hendelsene I A og den andre representerer hendelsene I B."A and B are Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two separate circles. One circle represents the events in A and the other represents the events in B.Et Venn-diagram med tittelen " A Og B er IKKE Disjoint."Hele prøveplassen er representert som et rektangel. Inne i rektangelet er to sirkler. En sirkel representerer forekomstene I A og den andre representerer forekomstene I B. Disse to er ikke usammenhengende, så de to sirklene delvis overlapper hverandre. (Å være ikke disjoint, kan to sirkler overlappe hverandre helt, men i dette eksemplet gjør de det ikke.)"A and B are NOT Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two circles. One circle represents the occurrences in A and the other represents the occurrences in B. These two are not disjoint, so the two circles partially overlap each other. (Being NOT disjoint, two circles could overlap each other completely, but in this example they do not.)

      det skal være klart fra bildet at

      • i det første tilfellet, der hendelsene IKKE er usammenhengende, p(A og B) ≠ 0
      • i det andre tilfellet, der hendelsene er usammenhengende, P(A og B) = 0.

      her er to eksempler:

      EKSEMPEL:

      Tenk på følgende to hendelser:

      A-en tilfeldig valgt person har blodtype A, og

      B-en tilfeldig valgt person har blodtype B.

      i sjeldne tilfeller er det mulig for en person å ha mer enn en type blod som strømmer gjennom hans eller hennes årer, men for vårt formål, vi kommer til å anta at hver person kan ha bare en blodtype. Derfor er det umulig for hendelsene A Og B å skje sammen.

      • Hendelser A og B ER USAMMENHENGENDE

      på den annen side …

      EKSEMPEL:

      Vurder følgende to hendelser:

      A-en tilfeldig valgt person har blodtype A

      B-en tilfeldig valgt person er en kvinne.

      i dette tilfellet er det mulig for hendelser A og B å skje sammen.

      • Hendelser A og B er IKKE USAMMENHENGENDE.Venn-diagrammene antyder at en annen måte å tenke på disjoint versus ikke disjoint hendelser er at disjoint hendelser ikke overlapper. De deler ikke noen av de mulige utfallene, og kan derfor ikke skje sammen.

        på den annen side er hendelser som ikke er disjoint overlappende i den forstand at de deler noen av de mulige utfallene og derfor kan forekomme samtidig.

        Vi begynner nå med en enkel regel for å finne P (A eller B) for disjoint hendelser.

        Sannsynlighetsregel Fire (Tilleggsregelen for Disjoint Events):

        • Hvis A og B er disjoint events, Så Er P(a eller b) = P(A) + P(B).

        Kommentar:

        • når det gjelder sannsynligheter, vil ordet «eller» alltid være knyttet til driften av tillegg; dermed navnet på denne regelen, » Addisjonsregelen.»

        EKSEMPEL: Blodtyper

        Tilbakekall blodtype eksempel:

        Data gitt I" Blodtype: Sannsynlighet " Format: O: 0,44; A: 0,42; B: 0,10; ab: 0.04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

        her er noen tilleggsinformasjon

        • en person Med type akan donere blod Til En person Med type a eller ab.
        • en person med Type Bkan donere blod til en person med Type B eller AB.
        • en Person med Type Abkan donere blod til en person med TYPE AB
        • en person med Type Oblood kan donere til noen.

        hva er sannsynligheten for at en tilfeldig valgt person er en potensiell donor for en person med blodtype A?

        Fra informasjonen som er gitt, vet vi at det å være en potensiell donor for en person med blodtype a betyr å ha blodtype a Eller O.

        Vi må derfor finne P(A eller O). Siden hendelsene A og O er usammenhengende, kan vi bruke tilleggsregelen for usammenhengende hendelser for å få:

        • P (a eller O) = P(a) + P(O) = 0,42 + 0,44 = 0,86.

        det er lett å se hvorfor legge sannsynligheten faktisk er fornuftig.

        hvis 42% av befolkningen har blodtype a og 44% av befolkningen har blodtype O,

        • så har 42% + 44% = 86% av befolkningen enten blodtype a eller O, og dermed er potensielle donorer til en person med blodtype a.

        denne begrunnelsen om hvorfor tilleggsregelen gir mening kan visualiseres ved hjelp av kakediagrammet nedenfor:

        et kakediagram Med Tittelen "blodtyper."Type A tar opp 42% av kakediagrammet, og Type O tar opp 44%. Sammen, som A eller O, tar de opp 86% av kakediagrammet."Blood Types." Type A takes up 42% of the pie chart, and type O takes up 44%. Together, as A or O, they take up 86% of the pie chart.

        Lær Ved Å Gjøre: Sannsynlighetsregel Fire

        Kommentar:

        • Addisjonsregelen for Disjoint Hendelser kan naturligvis utvides til mer enn to disjoint hendelser. La oss ta tre, for eksempel. Hvis A, B og C er tre disjoint hendelser
        Et Venn-Diagram som viser 3 disjoint hendelser. Som vanlig er det en grå boks som viser hele prøveplassen. Inne i denne grå boksen er tre helt separate sirkler. Den første sirkelen er for forekomster I A, den andre for forekomster I B, og den tredje for forekomster I C.

        deretter p(a eller B eller C) = P(A) + P(B) + P(C). Regelen er den samme for et hvilket som helst antall disjoint hendelser.

        Fikk Jeg Dette?: Sannsynlighetsregel Fire

        Vi er nå ferdig med den første versjonen Av Tilleggsregelen (Regel fire) som er versjonen begrenset til disjoint hendelser. Før vi dekker den andre versjonen, må vi først diskutere P (A og B).

        Finne P(A og B) Ved Hjelp Av Logikk

        vi går nå til beregning

        • P (A og B)= P(både hendelse a oppstår og hendelse B oppstår)

        Senere vil vi diskutere reglene For beregning Av P(A og B).

        Først vil Vi illustrere at en regel ikke er nødvendig når du kan bestemme svaret gjennom logikk og telling.

        Spesielt Tilfelle:

        Det er et spesielt tilfelle som Vi vet Hva P (A Og B) er lik uten å bruke noen regel.

        Lær ved Å Gjøre: Finne P (A og B) # 1

        Så, hvis hendelser A Og B er usammenhengende, så (per definisjon) P (A og B)= 0. Men hva om hendelsene ikke er disjoint?

        Husk at regel 4, Tilleggsregelen, har to versjoner. En er begrenset til disjoint hendelser, som vi allerede har dekket, og vi skal håndtere den mer generelle versjonen senere i denne modulen. Det samme gjelder sannsynligheter som involverer og

        , men bortsett fra i spesielle tilfeller vil VI stole PÅ LOGIKK for å finne P (A og B) i dette kurset.

        før vi dekker noen formelle regler, la oss se på et eksempel der hendelsene ikke er usammenhengende.

        EKSEMPEL: Periodontal Status og Kjønn

        Vurder følgende tabell angående periodontal status for individer og deres kjønn. Periodontal status refererer til tannkjøttsykdom der individer er klassifisert som enten sunn, har gingivitt, eller har periodontal sykdom.

        vi har sett denne typen bord før når vi diskuterte analyse av data i Tilfelle C → C. For dette spørsmålet vil vi bruke disse dataene som vår «befolkning» og vurdere tilfeldig å velge en person.

        Lær Ved Å Gjøre: Periodontal Status og Kjønn

        forbindelser mellom disse emnene og hjelper deg med å holde noe av det du har lært om data friskt i tankene dine.

        Husk at vårt primære mål i dette kurset er å analysere virkelige data!

        Sannsynlighetsregel Fem

        Vi er nå klare Til å gå videre til den utvidede versjonen av Tilleggsregelen.

        i denne delen lærer Vi Hvordan Vi finner P (A eller B) Når A og B ikke nødvendigvis er usammenhengende.

        • vi kaller denne utvidede versjonen «Generell Tilleggsregel» og oppgir Den Som Sannsynlighetsregel Fem.

        Vi vil begynne med å angi regelen og gi et eksempel som ligner på de typer problemer vi vanligvis spør i dette kurset. Da vil vi presentere et annet eksempel der vi ikke har rådataene fra en prøve å jobbe fra.

        Sannsynlighetsregel Fem:

        • Den Generelle Tilleggsregelen: P(a eller b) = P(A) + P(b) – P(a og b).

        MERK: det er best å bruke logikk for å finne P (A og B), ikke en annen formel.

        en svært vanlig feil er feilaktig å bruke multiplikasjonsregelen for uavhengige hendelser som dekkes på neste side. Dette vil bare være riktig Hvis A Og B er uavhengige (se definisjoner å følge) som sjelden er tilfelle i data presentert i toveis tabeller.

        som vi har sett i tidligere eksempler, når de to hendelsene ikke er usammenhengende, er det noe overlapping mellom hendelsene.

        • hvis vi bare legger til de to sannsynlighetene sammen, får vi feil svar fordi vi har talt noen «sannsynlighet» to ganger!
        • Dermed må vi trekke ut denne «ekstra» sannsynligheten for å komme frem til riktig svar. Venn-diagrammet og toveisbordene er nyttige for å visualisere denne ideen.

        et venn-diagram med Tittelen " A og B Er IKKE Usammenhengende."En grå boks representerer prøveplassen, og inne er to blå sirkler som har et overlappende område. En sirkel er Merket A og Den andre er merket B. området der de to sirklene overlapper representerer At Hendelser A og B kan forekomme samtidig, Så P (A og B) ≠ 0."A and B are NOT Disjoint." A gray box represents the sample space, and inside are two blue circles which have an overlapping area. One circle is labeled A and the other is labeled B. The area where the two circles overlap represents that Events A and B can occur at the same time, so P(A and B) ≠ 0.

        denne regelen er mer generell siden den fungerer for alle par hendelser (selv disjoint hendelser). Vårt råd er fortsatt å prøve å svare på spørsmålet ved hjelp av logikk og telling når det er mulig, ellers må vi være svært forsiktig med å velge riktig regel for problemet.

        PRINSIPP:

        HVIS du kan beregne en sannsynlighet ved hjelp av logikk OG telling, TRENGER du ikke en sannsynlighetsregel (selv om den riktige regelen alltid kan brukes)

        Legg Merke til at Hvis A og b er usammenhengende, vil P(A og B) = 0 og regel 5 reduseres til regel 4 for dette spesielle tilfellet.

        Et Venn-Diagram med tittelen " A og B Er Usammenhengende. Hele prøveområdet S er representert som et grått rektangel. Innsiden er to, separate, ikke-overlappende blå sirkler. En sirkel er for forekomsten I A og Den andre for forekomsten I B."A and B are Disjoint. The entire sample space S is represented as a gray rectangle. Inside are two, separate, non-overlapping blue circles. One circle is for the occurrences in A and the other for occurrences in B.

        La oss gå tilbake til det siste eksemplet:

        EKSEMPEL: Periodontal Status og Kjønn

        Vurder tilfeldig å velge ett individ fra de som er representert i følgende tabell angående periodontal status for individer og deres kjønn. Periodontal status refererer til tannkjøttsykdom der individer er klassifisert som enten sunn, har gingivitt, eller har periodontal sykdom.

        la oss se gjennom hva vi har lært så langt. Vi kan beregne noen sannsynlighet i dette scenariet hvis vi kan bestemme hvor mange personer som tilfredsstiller hendelsen eller kombinasjonen av hendelser.

        • P(Hann) = 3009/8027 = 0,3749
        • P(Hunn) = 5018/8027 = 0,6251
        • P(Sunn) = 3750/8027 = 0,4672
        • P(Ikke Sunn) = P(Gingivitt eller Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
          Vi kunne også beregne dette ved hjelp av komplementregelen: 1-P (Sunn)

        vi har også tidligere funnet at

        • P(Mannlig og Sunn) = 1143/8027 = 0.1424

        Tilbakekall regel 5, P(a eller B) = P(A) + P(B) – P(a og B). Vi bruker nå denne regelen til å beregne P (Mann ELLER Sunn)

        • P (Mann eller Sunn) = P(Mann) + P (Sunn – – P(Mann og Sunn) = 0.3749 + 0.4672 – 0.1424 = 0.6997 eller ca 70%

        vi løste dette spørsmålet tidligere ved å bare telle hvor mange individer Som Er Enten Mannlige Eller Sunne eller begge deler. Bildet nedenfor illustrerer verdiene vi må kombinere. Vi må telle

        • Alle menn
        • alle friske individer
        • MEN ikke telle noen to ganger!!

        Ved å Bruke denne logiske tilnærmingen finner vi

        • P(Mannlig eller Sunn) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996

        Vi har en liten forskjell i svarene våre i siste desimal på grunn av avrundingen som skjedde da Vi beregnet P(Mann), P(Sunn) og P(Mann og Sunn) og deretter brukte regel 5.

        Klart svaret er effektivt det samme, ca 70%. Hvis vi bar svarene våre til flere desimaler, eller hvis vi brukte de opprinnelige fraksjonene, kunne vi eliminere denne lille uoverensstemmelsen helt.

        La oss se på et siste eksempel for å illustrere Sannsynlighetsregel 5 når regelen er nødvendig-dvs. når vi ikke har faktiske data.

        EKSEMPEL: Viktig Levering!

        det er viktig at et bestemt dokument når målet innen en dag. For å maksimere sjansene for levering til rett tid, sendes to kopier av dokumentet ved hjelp av to tjenester, service a og service B. det er kjent at sannsynlighetene for levering til rett tid er:

        • 0.90 for service A (P (A) = 0.90)
        • 0.80 for service B (P (B) = 0.80)
        • 0.75 for begge tjenestene er i tide(P (A og B) = 0,75)
          (Merk At A og B ikke er usammenhengende. De kan skje sammen med sannsynlighet 0,75.)

        Venn-diagrammene nedenfor illustrerer sannsynlighetene P(A), P(B) og P(a og B):

        Tre Venn-Diagrammer. I alle av dem er det et stort rektangel som representerer alle prøveområdet s. Inne i dette rektangelet er to sirkler som overlapper delvis. En sirkel er Merket A og Den andre er merket B. i Det første Venn-Diagrammet er sirkelen for a farget blå, og Vi ser At P (A) = 0,90 . I en viss forstand Er P (A) arealet Av a-sirkelen. I Det Andre Venn-Diagrammet er sirkelen for b farget blå, og det er merket At P (B) = 0,80 . På samme måte som i Det første Venn-diagrammet kan det antas at sirkelen For B har et areal på 0,80 . I Det tredje Venn-Diagrammet er området som er overlappingen av sirkler A Og B farget blå. P (a og B) = 0,75 . Arealet av overlappingen kan betraktes som å ha et areal på 0,75 .

        i sammenheng med dette problemet er det åpenbare spørsmålet om interesse:

        • hva er sannsynligheten for levering av dokumentet ved hjelp av denne strategien (for å sende det via begge tjenestene)?

        dokumentet vil nå sin destinasjon i tide så lenge det leveres i tide av tjeneste A Eller av tjeneste B eller av begge tjenestene. Med andre ord, når hendelse a oppstår eller hendelse B oppstår eller begge forekommer. så….

        P(levering i tide ved hjelp av denne strategien) = P( a eller B), som er representert ved det skyggelagte området i diagrammet nedenfor:

        Det samme Venn-Diagrammet, bortsett fra at området til de to sirklene er farget blå (skyggelagt). Dette betyr at området i overlappingen også er farget blå. Merk at overlappingsområdet bare har blitt farget en gang, så selv om det er i begge sirkler, teller vi det en gang.

        vi kan nå

        • bruke De Tre Venn-diagrammene som representerer P(A), P(B) og P(a og b)
        • for å se at Vi kan finne P(a eller b) ved å legge Til P(a) (representert ved den venstre sirkelen) og P(b) (representert ved den høyre sirkelen),
        • og deretter trekke P(A og B) (representert ved overlappingen), siden vi inkluderte Den to ganger, en gang som en del av av p(a) og en gang som en del av p(B).

        dette vises på følgende bilde:

        arealet av begge sirkler i Venn-diagrammet (teller overlappingsområdet en gang) beregnes som: arealet Av a-sirkelen (som inkluderer overlappingen) + arealet Av b-sirkelen ( som også inkluderer overlappingen) - arealet av overlappingen. Vi får Derfor: P (a eller B) = P (A) + P (B) - P (A og B).'s circle (which includes the overlap) + the area of B's circle (which also includes the overlap) - the area of the overlap. We therefore get: P(A or B) = P(A) + P(B) - P(A and B).

        hvis vi bruker dette til vårt eksempel, finner vi at:

        • P (a eller B)= P (levering på tid ved hjelp av denne strategien)= 0.90 + 0.80 – 0.75 = 0.95.

        så vår strategi for å bruke to leveringstjenester øker vår sannsynlighet for levering på tid til 0,95.Mens Venn-diagrammene var flotte å visualisere Den Generelle Tilleggsregelen, er det i tilfeller som disse mye lettere å vise informasjonen i og jobbe med en toveis tabell med sannsynligheter, mye som vi undersøkte forholdet mellom to kategoriske variabler i Den Utforskende Dataanalyseseksjonen.

        Vi vil bare vise deg bordet, ikke hvordan vi utlede det som du ikke vil bli bedt om å gjøre dette for oss. Du bor kunne se at noen logikk og enkel tillegg / subtraksjon er alt vi pleide a fylle i tabellen nedenfor.

        tabellen har kolonnene "B", "ikke B" og " Total."Radene er "A", "ikke A" og "Totalt"."Her er litt informasjon om bordet, organisert av celle: i cellen A,B, er verdien Der(0,75) P (A Og B) = P(levering på tid av begge tjenestene). Ved cellen A, ikke B, er verdien der (0,15) P (A Og Ikke B) = P (levering på tid bare ved tjeneste A). Ved celle Ikke A og B er verdien (0,05) P(ikke A Og B) = P (levering på tid bare ved tjeneste B). Ved celle Ikke A og Ikke B er verdien (0,05) P(ikke a Og Ikke B) = P (verken tjeneste a eller B levert i tide)."B," "not B," and "Total." The rows are "A," "not A," and "Total." Here are is some information about the table, organized by cell: At the cell A,B, the value there (0.75) is P(A and B) = P(on-time delivery by both services). At the cell A,not B, the value there (0.15) is P(A and Not B) = P(on-time delivery ONLY by service A). At cell Not A and B, the value (0.05) is P(not A and B) = P(on-time delivery ONLY by service B). At cell Not A and Not B, the value (0.05) is P(not A and not B) = P(Neither service A nor B delivered on time).

        når du bruker en toveis tabell, må vi huske å se på hele raden eller kolonnen for å finne generelle sannsynligheter som bare involverer A Eller bare B.

        • P (a) = 0,90 betyr at i 90% av tilfellene når tjeneste A brukes, leverer den dokumentet i tide. For å finne Dette ser vi på den totale sannsynligheten for raden som inneholder A. I å finne P (A), vet Vi ikke Om B skjer eller ikke.

        tabellens første rad er uthevet. Her er de uthevede dataene I Rad, Kolonneformat: A, B: P (a Og B) = 0,75; a, ikke B: P(a og ikke B) = 0,15; A, Totalt: P(A) = 0,90 = P(A Og B) + P(a og ikke B)'s first row has been highlighted. Here is the highlighted data in "Row, Column" format: A, B: P(A and B) = 0.75; A, not B: P(A and not B) = 0.15; A, Total: P(A) = 0.90 = P(A and B) + P(A and not B)

        • P (B) = 0,80 betyr at i 80% av tilfellene når service B brukes, leverer den dokumentet til tiden. For å finne dette ser vi på den totale sannsynligheten for kolonnen som inneholder B. i å finne P (B) vet Vi ikke om A skjer eller ikke.

        tabellens første kolonne er uthevet. Her er de uthevede dataene I Rad, Kolonneformat: A, B: P(a og B) = 0,75; ikke A, B: P (ikke a og B) = 0.05; B, Totalt: P (B) = 0,80 = P (a og B) + P (ikke a og B)'s first column has been highlighted. Here is the highlighted data in "Row, Column" format: A,B: P(A and B) = 0.75; not A, B: P(not A and B) = 0.05; B,Total: P(B) = 0.80 = P(A and B) + P(not A and B)

        Kommentar

        • Når vi brukte toveis tabeller i Eda-delen, var det å registrere verdier av to kategoriske variabler for et konkret utvalg av individer.
        • derimot er informasjonen i en sannsynlighetstabell for en hel populasjon, og verdiene er ganske abstrakte.
        • Hvis vi hadde behandlet noe som leveringseksemplet I EDA-delen, ville vi ha registrert det faktiske antallet leveranser på tid (og ikke-til-tid) for prøver av dokumenter sendt med service A Eller B.
        • i denne delen presenteres de langsiktige sannsynlighetene som kjent.
        • Formodentlig var de rapporterte sannsynlighetene i dette leveringseksemplet basert på relative frekvenser registrert over mange repetisjoner.
        Interaktiv Applet: Sannsynlighet Venn Diagram

        Avrunding Tommelfingerregel For Sannsynlighet:

        Følg følgende generelle retningslinjer i dette kurset. Hvis du er i tvil bære flere desimaler. Hvis vi angir gi nøyaktig hva som er forespurt.

        • generelt bør du ha sannsynligheter til minst 4 desimaler for mellomliggende trinn.
        • vi runder ofte vårt endelige svar til to eller tre desimaler.
        • for ekstremt små sannsynligheter er det viktig å ha 1 eller to signifikante sifre (ikke-null sifre), for eksempel 0.000001 eller 0.000034, etc.

        Mange datamaskinpakker kan vise ekstremt små verdier ved hjelp av vitenskapelig notasjon som

        • 58×10-5 eller 1.58 E-5 for å representere 0.0000158

        La Oss Oppsummere

        Så langt i vår studie av sannsynlighet har du blitt introdusert til den noen ganger motintuitive naturen av sannsynlighet og grunnleggende som ligger til grunn for sannsynlighet, for eksempel en relativ frekvens.

        Vi ga deg også noen verktøy for å hjelpe deg med å finne sannsynlighetene for hendelser – nemlig sannsynlighetsreglene.

        du har sikkert lagt merke til at sannsynlighetsdelen var signifikant forskjellig fra de to foregående avsnittene; den har en mye større teknisk / matematisk komponent, så resultatene har en tendens til å være mer av «rett eller galt» natur.

        i Delen Utforskende Dataanalyse tok datamaskinen for det meste seg av det tekniske aspektet av ting, og våre oppgaver var å fortelle det å gjøre det rette og deretter tolke resultatene.i sannsynlighet gjør vi arbeidet fra begynnelse til slutt, fra å velge riktig verktøy (regel) å bruke, til å bruke det riktig, for å tolke resultatene.

        her er et sammendrag av reglene vi har presentert så langt.

        1. Sannsynlighetsregel #1 sier:

        • For enhver hendelse A, 0 ≤ P (A) ≤ 1

        2. Sannsynlighetsregel # 2 sier:

        • summen av sannsynlighetene for alle mulige utfall er 1

        3. Komplement – Regelen (#3) sier at

        • P(ikke A) = 1 – P(a)
        • eller når den omarrangeres

          • P(A) = 1-P(ikke a)
          • den siste representasjonen Av Komplement-Regelen er Spesielt Nyttig når vi trenger å finne sannsynligheter for hendelser av typen «minst En av …»

            4. Den Generelle Tilleggsregelen (#5) sier at for to hendelser,

            • P(a Eller B) = P(a) + P(B) – P(a og B),

            hvor, Med P(a eller B) mener Vi P(a oppstår eller b oppstår eller begge deler).

            i det spesielle tilfellet av disjoint hendelser, hendelser som ikke kan forekomme sammen, Kan Den Generelle Addisjonsregelen reduseres til Addisjonsregelen For Disjoint Hendelser (#4), som er

            • P(a eller b) = P(a) + P(B). *

            * brukes kun NÅR du ER OVERBEVIST om at hendelsene er usammenhengende (de overlapper IKKE)

            5. Den begrensede versjonen av addisjonsregelen (for disjunkte hendelser) kan enkelt utvides til mer enn to hendelser.

            6. Så langt har Vi bare funnet P (A og B) ved hjelp av logikk og telling i enkle eksempler

    Legg igjen en kommentar

    Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *