grundläggande Sannolikhetsregler

  • Inledning
  • Sannolikhetsregler
    • Sannolikhetsregel ett (för varje händelse a, 0 kg P(A) kg 1)
    • Sannolikhetsregel två (summan av sannolikheterna för alla möjliga resultat är 1)
    • Sannolikhetsregel tre (Komplementregeln)
    • Sannolikhetsregler som involverar flera händelser
    • Sannolikhetsregel fyra (Tilläggsregel för ojämna händelser)
    • hitta P(A och B) med hjälp av logik
    • sannolikhetsregel Fem (den allmänna Tilläggsregeln)
  • Avrundningsregel för Sannolikhet
  • Låt oss sammanfatta
CO-6: tillämpa grundläggande begrepp Sannolikhet, slumpmässig variation och vanligt använda statistiska sannolikhetsfördelningar.
LO 6.4: relatera sannolikheten för en händelse till sannolikheten för att denna händelse inträffar.
LO 6.5: använd den relativa frekvensmetoden för att uppskatta sannolikheten för en händelse.
LO 6.6: Tillämpa grundläggande logik och sannolikhetsregler för att hitta den empiriska sannolikheten för en händelse.
Video: grundläggande Sannolikhetsregler (25:17)

i föregående avsnitt introducerade vi Sannolikhet som ett sätt att kvantifiera osäkerheten som uppstår genom att utföra experiment med hjälp av ett slumpmässigt urval från befolkningen av intresse.

vi såg att sannolikheten för en händelse (till exempel händelsen att en slumpmässigt vald person har blodtyp O) kan uppskattas med den relativa frekvensen med vilken händelsen inträffar i en lång serie försök. Så vi skulle samla in data från många individer för att uppskatta sannolikheten för att någon har blodtyp O.

I det här avsnittet kommer vi att fastställa de grundläggande metoderna och principerna för att hitta sannolikheter för händelser.

Vi kommer också att täcka några av de grundläggande reglerna för Sannolikhet som kan användas för att beräkna sannolikheter.

introduktion

vi börjar med ett klassiskt sannolikhetsexempel på att kasta ett rättvist mynt tre gånger.

eftersom huvuden och svansarna är lika troliga för varje kast i detta scenario kommer var och en av de möjligheter som kan bero på tre kast också att vara lika troliga så att vi kan lista alla möjliga värden och använda denna lista för att beräkna sannolikheter.

eftersom vårt fokus i denna kurs är på data och statistik (inte teoretisk sannolikhet), kommer vi i de flesta av våra framtida problem att använda en sammanfattad dataset, vanligtvis en frekvenstabell eller tvåvägstabell, för att beräkna sannolikheter.

exempel: Kasta ett rättvist mynt tre gånger

låt oss lista varje möjligt resultat (eller möjligt resultat):

{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}

låt oss nu definiera följande händelser:

Händelse a: ”Få ingen H”

Händelse B: ”få exakt en H”

Händelse C: ”få minst en H”

Observera att varje händelse verkligen är ett uttalande om resultatet som experimentet kommer att producera. I praktiken motsvarar varje händelse en viss samling (delmängd) av de möjliga resultaten.

Event A:” får ingen H ” TTT

event B: ”Att få exakt en H ”av HTT, THT, tth

Händelse C:” att få minst en H”av HTT, THT, TTH, THH, HTH, HHT, HHH

Här är en visuell representation av händelserna A, B och C.

vi har en stor rektangel märkt" S " som representerar hela provutrymmet. Inuti denna rektangel har vi en cirkel märkt "C." allt utanför "C råkar sammanfalla med Händelse a som bara innehåller "TTT". Inuti C ser vi "HHH", "THH", "HTH", "HHT" och en cirkel som representerar händelse B. inuti B är "HHT", "THT" och "TTH."Observera att alla objekt inuti B också är inuti C, så c omsluter helt B."S" which represents the entirety of the sample space. Inside this rectangle we have a circle labeled "C." Everything outside of "C happens to coincied with event A containing only "TTT". Inside of C, we see "HHH," "THH," "HTH," "HHT," and a circle representing event B. Inside B are "HHT," "THT," and "TTH." Note that all of the items inside B are also inside C, so C fully encloses B.

från denna visuella representation av händelserna är det lätt att se att Händelse B Helt ingår i händelse C, i den meningen att varje utfall i händelse B också är ett resultat i händelse C. Observera också att Händelse a skiljer sig från händelser B och C, i den meningen att de inte har något resultat gemensamt eller ingen överlappning. Vid denna tidpunkt är det bara anmärkningsvärda observationer, men som du kommer att upptäcka senare är de mycket viktiga.

vad händer om vi lagt till den nya händelsen:

Händelse D: ”Få en T på den första kastet” sacr THH, THT, TTH, TTT

hur skulle det se ut om vi lade till händelse D i diagrammet ovan? (Länk till svaret)

Kom ihåg, eftersom H och T är lika troliga på varje kasta, och eftersom det finns 8 möjliga resultat är sannolikheten för varje resultat 1/8.

se om du kan svara på följande frågor med hjälp av diagrammen och / eller listan över resultat för varje händelse tillsammans med vad du hittills har lärt dig om Sannolikhet.

lär dig genom att göra: Kasta ett rättvist mynt tre gånger

Om du kunde svara på dessa frågor korrekt har du sannolikt en bra instinkt för att beräkna sannolikheten! Läs vidare för att lära oss hur vi kommer att tillämpa denna kunskap.

om inte, kommer vi att försöka hjälpa dig att utveckla denna färdighet i det här avsnittet.

kommentar:

  • Observera att i händelse C, ”att få minst ett huvud” finns det bara ett möjligt resultat som saknas, ”att få inga huvuden” = TTT. Vi kommer att ta itu med detta igen när vi talar om sannolikhetsregler, särskilt komplementregeln. Vid denna tidpunkt vill vi bara att du tänker på hur dessa två händelser är ”motsatser” i detta scenario.

det är mycket viktigt att inse att bara för att vi kan lista ut de möjliga resultaten innebär det inte att varje resultat är lika troligt.

detta är det (roliga) meddelandet i det dagliga Showklippet som vi tillhandahöll på föregående sida. Men låt oss tänka på det här igen. I det klippet hävdar Walter att eftersom det finns två möjliga resultat är sannolikheten 0.5. De två möjliga resultaten är

  • världen kommer att förstöras på grund av användning av large hadron collider
  • världen kommer inte att förstöras på grund av användning av large hadron collider

förhoppningsvis är det klart att dessa två resultat inte är lika troliga!!

låt oss överväga ett vanligare exempel.

exempel: fosterskador

Antag att vi slumpmässigt väljer tre barn och vi är intresserade av sannolikheten för att inget av barnen har några fosterskador.

vi använder notationen D för att representera ett barn som föddes med en födelsedefekt och N för att representera barnet som föddes utan födelsedefekt. Vi kan lista de möjliga resultaten precis som vi gjorde för myntkastningen, de är:

{DDD, NDD, DND, DNN, NDN, NND, NNN}

är händelserna DDD (alla tre barnen är födda med fosterskador) och NNN (inget av barnen är födda med fosterskador) lika troliga?

det borde vara rimligt för dig att P(NNN) är mycket större än P(DDD).

detta beror på att P (N) och P(D) inte är lika troliga händelser.

det är sällsynt (absolut inte 50%) för ett slumpmässigt valt barn att födas med en födelsedefekt.

Sannolikhetsregler

nu går vi vidare till att lära oss några av de grundläggande reglerna för Sannolikhet.

lyckligtvis är dessa Regler mycket intuitiva, och så länge de tillämpas systematiskt kommer de att låta oss lösa mer komplicerade problem; i synnerhet de problem som vår intuition kan vara otillräcklig för.

eftersom de flesta sannolikheterna du kommer att bli ombedd att hitta kan beräknas med både

  • logik och räkning

och

  • reglerna vi kommer att lära oss,

vi ger följande råd som en princip.

princip:

Om du kan beräkna en sannolikhet med logik och räkna behöver du inte en sannolikhetsregel (även om rätt regel alltid kan tillämpas)

Sannolikhetsregel en

vår första regel påminner oss helt enkelt om den grundläggande egenskapen för Sannolikhet som vi redan har lärt oss.

sannolikheten för en händelse, som informerar oss om sannolikheten för att den inträffar, kan variera var som helst från 0 (vilket indikerar att händelsen aldrig kommer att inträffa) till 1 (vilket indikerar att händelsen är säker).

Sannolikhetsregel ett:

  • för varje händelse a, 0 C / C(a) c / c 1.

OBS: En praktisk användning av denna regel är att den kan användas för att identifiera eventuell sannolikhetsberäkning som kommer ut att vara mer än 1 (eller mindre än 0) som felaktig.

innan vi går vidare till de andra reglerna, låt oss först titta på ett exempel som kommer att ge ett sammanhang för att illustrera nästa flera regler.

exempel: blodtyper

som tidigare diskuterats kan allt humant blod skrivas som O, A, B eller AB.dessutom varierar frekvensen av förekomsten av dessa blodtyper beroende på etniska och rasgrupper.

enligt Stanford Universitys Blood Center (bloodcenter.Stanford.edu), det här är sannolikheten för humana blodtyper i USA (sannolikheten för typ A har utelämnats med avsikt):

motiverande Fråga för regel 2: en person i USA väljs slumpmässigt. Vad är sannolikheten för att personen har blodtyp A?

svar: Vår intuition berättar för oss att eftersom de fyra blodtyperna O, A, B och AB uttömmer alla möjligheter, måste deras sannolikheter tillsammans summera till 1, vilket är sannolikheten för en ”viss” händelse (en person har en av dessa 4 blodtyper för vissa).

eftersom sannolikheten för O, B och AB tillsammans summerar till 0.44 + 0.1 + 0.04 = 0,58, sannolikheten för typ A måste vara den återstående 0.42 (1 – 0.58 = 0.42):

Data som ges i" blodtyp: Sannolikhet " Format: O: 0,44; a: 0,42; B: 0,10; AB: 0,04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Sannolikhetsregel två

detta exempel illustrerar vår andra regel, som berättar att sannolikheten för alla möjliga resultat tillsammans måste vara 1.

Sannolikhetsregel två:

summan av sannolikheterna för alla möjliga resultat är 1.

detta är ett bra ställe att jämföra och kontrastera vad vi gör här med vad vi lärde oss i avsnittet Exploratory Data Analysis (EDA).

  • Lägg märke till att vi i detta problem i huvudsak fokuserar på en enda kategorisk variabel: blodtyp.
  • vi sammanfattade denna variabel ovan, som vi sammanfattade enskilda kategoriska variabler i Eda-avsnittet, genom att lista vilka värden variabeln tar och hur ofta den tar dem.
  • i EDA använde vi procentsatser, och här använder vi sannolikheter, men de två förmedlar samma information.
  • i Eda-avsnittet lärde vi oss att ett cirkeldiagram ger en lämplig visning när en enda kategorisk variabel är inblandad, och på samma sätt kan vi använda den här (med procentsatser istället för sannolikheter):

ett cirkeldiagram med titeln " blodtyper."Typ O tar upp 44% av cirkeldiagrammet, a använder 42%, AB representerar 4% och B representerar resten, 10%. Observera att blodtyperna som är "inte O" tar upp 56% av cirkeldiagrammet."Blood Types." Type O takes up 44% of the pie chart, A uses 42%, AB represents 4%, and B represents the rest, 10%. Note that the types of blood which are "not O" take up 56% of the pie chart.

även om det vi gör här verkligen liknar det vi har gjort i Eda-avsnittet, finns det en subtil men viktig skillnad mellan de underliggande situationerna

  • i EDA sammanfattade vi data som erhölls från ett sampleof individer för vilka värden av variabeln av intresse registrerades.
  • här, när vi presenterar sannolikheten för varje blodtyp, har vi i åtanke hela befolkningenav människor i USA, för vilka vi antar att känna till den totala frekvensen av värden som tas av variabeln av intresse.
fick jag det här?: Sannolikhetsregel två

Sannolikhetsregel tre

i sannolikhet och i dess tillämpningar är vi ofta intresserade av att ta reda på sannolikheten för att en viss händelse inte kommer att inträffa.

en viktig punkt att förstå här är att” Händelse A inte inträffar ”är en separat händelse som består av alla möjliga resultat som inte finns i A och kallas”komplementhändelsen av A. ”

Notation: vi skriver” inte A ” för att beteckna händelsen att A inte inträffar. Här är en visuell representation av hur händelse a och dess komplementhändelse ”inte A” tillsammans representerar alla möjliga resultat.

hela provutrymmet s representeras med en grå ruta. Inuti denna ruta är en blå cirkel, representerar alla resultat i A. Allt annat i den grå rutan men utanför den blå cirkeln är "inte en"."not A".

kommentar:

  • en sådan visuell display kallas ett ”Venn-diagram.”Ett Venn-diagram är ett enkelt sätt att visualisera händelser och relationerna mellan dem med rektanglar och cirklar.

regel 3 behandlar förhållandet mellan sannolikheten för en händelse och sannolikheten för dess komplementhändelse.

Med tanke på att Händelse A och Händelse ”inte A” tillsammans utgör alla möjliga resultat, och eftersom regel 2 säger att summan av sannolikheterna för alla möjliga resultat är 1, bör följande regel vara ganska intuitiv:

Sannolikhetsregel tre (Komplementregeln):

  • P(inte A) = 1 – P(a)
  • det vill säga sannolikheten för att en händelse inträffar inte är 1 minus sannolikheten för att den inträffar.

exempel: blodtyper

tillbaka till blodtypsexemplet:

Här är ytterligare information:

    en person med typ A kan donera blod till en person med typ A eller AB.

  • en person med typ B kan donera blod till en person med typ B eller AB.
  • en person med typ AB kan endast donera blod till en person med typ AB.
  • en person med typ O-blod kan donera till någon.

vad är sannolikheten för att en slumpmässigt vald person inte kan donera blod till alla? Med andra ord, Vad är sannolikheten för att en slumpmässigt vald person inte har blodtyp O? Vi måste hitta P (inte O). Med hjälp av Komplementregeln, P(inte O) = 1 – P(O) = 1 – 0,44 = 0,56. Med andra ord har 56% av den amerikanska befolkningen inte blodtyp O:

klart kan vi också hitta P (inte O) direkt genom att lägga till sannolikheten för B, AB och A.

kommentar:

  • Observera att Komplementregeln, P(inte A) = 1 – P(A) kan formuleras om som P(A) = 1-P(inte a).
    • P (inte A) = 1 – P(a)
    • kan omformuleras som P(A) = 1-P(inte A).
    • denna till synes triviala algebraiska manipulation har en viktig tillämpning och fångar faktiskt styrkan i komplementregeln.
    • i vissa fall, när det är mycket komplicerat att hitta P(A) direkt, kan det vara mycket lättare att hitta P(inte A) och sedan bara subtrahera det från 1 för att få önskad P(a).
    • Vi kommer snart tillbaka till denna kommentar och ger ytterligare exempel.
fick jag det här?: Sannolikhetsregel tre
  • komplementregeln kan vara användbar när det är lättare att beräkna sannolikheten för komplementet till händelsen snarare än själva händelsen.
  • meddelande, vi använde igen frasen ”minst en.”
  • nu har vi sett att komplementet till ”minst en …” är ”ingen …” eller ” nej ….”(som vi nämnde tidigare när det gäller händelserna som”motsatser”).
  • i ovanstående aktivitet ser vi att
    • P(ingen av dessa två biverkningar) = 1 – P(minst en av dessa två biverkningar )
  • Detta är en vanlig tillämpning av komplementregeln som du ofta kan känna igen med frasen ”minst en” i problemet.

sannolikheter som involverar flera händelser

Vi kommer ofta att vara intresserade av att hitta sannolikheter som involverar flera händelser som

  • P(a eller B) = P(händelse a inträffar eller händelse B inträffar eller båda inträffar)
  • P(a och B)= P(både händelse a inträffar och Händelse B inträffar)

ett vanligt problem med terminologi avser hur vi vanligtvis tänker på ”eller” i vårt dagliga liv. Till exempel, när en förälder säger till sitt barn i en leksaksaffär ”vill du ha leksak a eller leksak B?”, det betyder att barnet bara får en leksak och han eller hon måste välja mellan dem. Att få båda leksakerna är vanligtvis inte ett alternativ.

i kontrast:

i Sannolikhet betyder ”eller” antingen den ena eller den andra eller båda.

och så P (A eller B) = P(händelse a inträffar eller händelse B inträffar eller båda inträffar)

med detta sagt bör det noteras att det finns vissa fall där det helt enkelt är omöjligt för de två händelserna att båda inträffar samtidigt.

Sannolikhetsregel fyra

skillnaden mellan händelser som kan hända tillsammans och de som inte kan är en viktig.

osammanhängande: Två händelser som inte kan inträffa samtidigt kallas ojämn eller ömsesidigt uteslutande. (Vi kommer att använda disjoint.)

ett Venn-diagram med titeln " A och B är ojämna."Hela provutrymmet representeras som en rektangel. Inuti rektangeln finns två separata cirklar. En cirkel representerar händelserna i A och den andra representerar händelserna i B."A and B are Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two separate circles. One circle represents the events in A and the other represents the events in B.ett Venn-diagram med titeln "A och B är inte ojämna."Hela provutrymmet representeras som en rektangel. Inuti rektangeln finns två cirklar. En cirkel representerar förekomsterna i A och den andra representerar förekomsterna i B. Dessa två är inte ojämna, så de två cirklarna överlappar varandra delvis. (Att inte vara ojämn kan två cirklar överlappa varandra helt, men i det här exemplet gör de det inte.)"A and B are NOT Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two circles. One circle represents the occurrences in A and the other represents the occurrences in B. These two are not disjoint, so the two circles partially overlap each other. (Being NOT disjoint, two circles could overlap each other completely, but in this example they do not.)

det bör framgå av bilden att

  • i det första fallet, där händelserna inte är ojämna, p(a och B) 0
  • i det andra fallet, där händelserna är ojämna, P(A och B) = 0.

här är två exempel:

exempel:

Tänk på följande två händelser:

A — en slumpmässigt vald person har blodtyp A och

B — en slumpmässigt vald person har blodtyp B.

I sällsynta fall är det möjligt för en person att ha mer än en typ av blod som strömmar genom hans eller hennes ådror, men för våra ändamål kommer vi att anta att varje person bara kan ha en blodtyp. Därför är det omöjligt för händelserna a och B att inträffa tillsammans.

  • händelser A och B är osammanhängande

å andra sidan …

exempel:

Tänk på följande två händelser:

A — en slumpmässigt vald person har blodtyp A

B — en slumpmässigt vald person är en kvinna.

i det här fallet är det möjligt för händelser a och B att inträffa tillsammans.

  • händelserna A och B är inte osammanhängande.

Venn-diagrammen tyder på att ett annat sätt att tänka på ojämna kontra inte ojämna händelser är att ojämna händelser inte överlappar varandra. De delar inte något av de möjliga resultaten och kan därför inte hända tillsammans.

å andra sidan överlappar händelser som inte är ojämna i den meningen att de delar några av de möjliga resultaten och därför kan inträffa samtidigt.

vi börjar nu med en enkel regel för att hitta P(A eller B) för ojämna händelser.

Sannolikhetsregel fyra (Tilläggsregeln för ojämna händelser):

  • Om A och B är ojämna händelser, då P(A eller B) = P(A) + P(B).

kommentar:

  • när man hanterar sannolikheter kommer ordet ”eller” alltid att associeras med additionsoperationen; därav namnet på denna regel, ”Tilläggsregeln.”

exempel: blodtyper

minns blodtypsexemplet:

Data som ges i" blodtyp: Sannolikhet " Format: O: 0,44; a: 0,42; B: 0,10; AB: 0.04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

här är ytterligare information

  • en person med typ acan donerar blod till en person med typ A eller AB.
  • en person med typ Bkan donera blod till en person med typ B eller AB.en person med typ Abkan donera blod till en person med typ AB
  • en person med typ Oblood kan donera till någon.

vad är sannolikheten för att en slumpmässigt vald person är en potentiell givare för en person med blodtyp A?

från den information som ges vet vi att det är en potentiell givare för en person med blodtyp A som har blodtyp A eller O.

Vi måste därför hitta P(A eller O). Eftersom händelserna A och O är osammanhängande kan vi använda tilläggsregeln för osammanhängande händelser för att få:

  • P(a eller O) = P(A) + P(O) = 0.42 + 0.44 = 0.86.

det är lätt att se varför det är vettigt att lägga till sannolikheten.

Om 42% av befolkningen har blodtyp A och 44% av befolkningen har blodtyp O,

  • då 42% + 44% = 86% av befolkningen har antingen blodtyp A eller O, och därmed är potentiella givare till en person med blodtyp A.

denna resonemang om varför tilläggsregeln är meningsfull kan visualiseras med hjälp av cirkeldiagrammet nedan:

ett cirkeldiagram med titeln "blodtyper."Typ A tar upp 42% av cirkeldiagrammet och typ O tar upp 44%. Tillsammans, som A eller O, tar de upp 86% av cirkeldiagrammet."Blood Types." Type A takes up 42% of the pie chart, and type O takes up 44%. Together, as A or O, they take up 86% of the pie chart.

lär dig genom att göra: Sannolikhetsregel fyra

kommentar:

  • Tilläggsregeln för ojämna händelser kan naturligtvis utvidgas till mer än två ojämna händelser. Låt oss ta tre, till exempel. Om A, B och C är tre ojämna händelser
ett Venn-Diagram som visar 3 ojämna händelser. Som vanligt finns det en grå ruta som visar hela provutrymmet. Inuti denna grå låda finns tre helt separata cirklar. Den första cirkeln är för förekomsterna i A, Den andra för förekomster i B och den tredje för förekomster i C.

sedan P(A eller B eller C) = P(A) + P(B) + P(C). Regeln är densamma för valfritt antal ojämna händelser.

fick jag det här?: Sannolikhetsregel fyra

Vi är nu färdiga med den första versionen av Tilläggsregeln (regel fyra) som är versionen begränsad till ojämna händelser. Innan vi täcker den andra versionen måste vi först diskutera P(A och B).

hitta P (A och B) med hjälp av logik

vi vänder oss nu till beräkning

  • P(A och B)= P(både händelse a inträffar och Händelse B inträffar)

senare diskuterar vi reglerna för beräkning av P(A och B).

först vill vi illustrera att en regel inte behövs när du kan bestämma svaret genom logik och räkning.

specialfall:

det finns ett specialfall för vilket vi vet vad P(A och B) är lika med utan att tillämpa någon regel.

lär dig genom att göra: Hitta P (A och B) #1

Så, om händelserna A och B är ojämna, då (per definition) P(A och B)= 0. Men vad händer om händelserna inte är ojämna?

Kom ihåg att Regel 4, Tilläggsregeln, har två versioner. En är begränsad till ojämna händelser, som vi redan har täckt, och vi kommer att ta itu med den mer allmänna versionen senare i den här modulen. Detsamma gäller sannolikheter som involverar och

men förutom i speciella fall kommer vi att förlita oss på logik för att hitta P(A och B) i den här kursen.

innan vi täcker några formella regler, Låt oss titta på ett exempel där händelserna inte är ojämna.

exempel: Periodontal Status och kön

Tänk på följande tabell angående parodontal status för individer och deras kön. Periodontal status avser tandköttssjukdom där individer klassificeras som antingen friska, har gingivit eller har periodontal sjukdom.

Vi har sett denna typ av tabell tidigare när vi diskuterade analys av data i fall C C. För denna fråga kommer vi att använda dessa data som vår” befolkning ” och överväga att slumpmässigt välja en person.

kopplingar mellan dessa ämnen och hjälper dig att hålla lite av det du har lärt dig om data fräsch i ditt sinne.

kom ihåg att vårt primära mål i denna kurs är att analysera verkliga data!

Sannolikhetsregel fem

Vi är nu redo att gå vidare till den utökade versionen av Tilläggsregeln.

i det här avsnittet lär vi oss att hitta P(A eller B) när A och B inte nödvändigtvis är ojämna.

  • vi kallar den här utökade versionen ”allmän Tilläggsregel” och anger den som Sannolikhetsregel fem.

vi börjar med att ange regeln och ge ett exempel som liknar de typer av problem vi vanligtvis frågar i den här kursen. Då kommer vi att presentera ett annat exempel där vi inte har rådata från ett prov att arbeta från.

Sannolikhetsregel fem:

  • den allmänna Tilläggsregeln: P(A eller B) = P(A) + P(B) – P(A och B).

OBS: Det är bäst att använda logik för att hitta P(A och B), inte en annan formel.

ett mycket vanligt fel är att felaktigt tillämpa multiplikationsregeln för oberoende händelser som omfattas på Nästa sida. Detta kommer endast att vara korrekt om A och B är oberoende (se definitioner att följa) vilket sällan är fallet i data som presenteras i tvåvägstabeller.

som vi bevittnade i tidigare exempel, när de två händelserna inte är ojämna, finns det viss överlappning mellan händelserna.

  • Om vi helt enkelt lägger till de två sannolikheterna tillsammans får vi fel svar eftersom vi har räknat lite ”Sannolikhet” två gånger!
  • således måste vi subtrahera denna ”extra” Sannolikhet för att komma fram till rätt svar. Venn-diagrammet och tvåvägstabellerna är till hjälp för att visualisera den här tanken.

ett venn-diagram med titeln " A och B är inte ojämna."En grå ruta representerar provutrymmet och inuti finns två blå cirklar som har ett överlappande område. En cirkel är märkt A och den andra är märkt B. Det område där de två cirklarna överlappar representerar att händelserna A och B kan inträffa samtidigt, så P(A och B) 0."A and B are NOT Disjoint." A gray box represents the sample space, and inside are two blue circles which have an overlapping area. One circle is labeled A and the other is labeled B. The area where the two circles overlap represents that Events A and B can occur at the same time, so P(A and B) ≠ 0.

denna regel är mer allmän eftersom den fungerar för alla par händelser (även ojämna händelser). Vårt råd är fortfarande att försöka svara på frågan med logik och räkna när det är möjligt, annars måste vi vara extremt noga med att välja rätt regel för problemet.

princip:

Om du kan beräkna en sannolikhet med hjälp av logik och räkning behöver du inte en sannolikhetsregel (även om rätt regel alltid kan tillämpas)

Observera att om A och B är ojämna, minskar P(A och B) = 0 och regel 5 till regel 4 för detta speciella fall.

ett Venn-Diagram med titeln " A och B är ojämna. Hela provutrymmet s representeras som en grå rektangel. Inuti finns två, separata, icke-överlappande blå cirklar. En cirkel är för förekomsterna i A och den andra för förekomster i B."A and B are Disjoint. The entire sample space S is represented as a gray rectangle. Inside are two, separate, non-overlapping blue circles. One circle is for the occurrences in A and the other for occurrences in B.

låt oss se över det sista exemplet:

exempel: Periodontal Status och kön

överväg att slumpmässigt välja en individ från de som representeras i följande tabell angående periodontal status för individer och deras kön. Periodontal status avser tandköttssjukdom där individer klassificeras som antingen friska, har gingivit eller har periodontal sjukdom.

låt oss granska vad vi har lärt oss hittills. Vi kan beräkna vilken sannolikhet som helst i detta scenario om vi kan bestämma hur många individer som uppfyller händelsen eller kombinationen av händelser.

  • P (Man) = 3009/8027 = 0,3749
  • P (Kvinna) = 5018/8027 = 0,6251
  • P (frisk) = 3750/8027 = 0,4672
  • P (inte frisk) = P (gingivit eller Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
    vi kunde också beräkna detta med hjälp av komplementregeln: 1 – P(hälsosam)

Vi fann också tidigare att

  • P(manlig och frisk) = 1143/8027 = 0.1424

minns regel 5, P(A eller B) = P(A) + P(B) – P(A och B). Vi använder nu denna regel för att beräkna P (manlig eller frisk)

  • P (manlig eller frisk) = P (manlig) + P (hälsosam) – P (manlig och frisk) = 0.3749 + 0.4672 – 0.1424 = 0.6997 eller ca 70%

Vi löste denna fråga tidigare genom att helt enkelt räkna hur många individer som är antingen manliga eller friska eller båda. Bilden nedan illustrerar de värden vi behöver kombinera. Vi måste räkna

  • Alla män
  • alla friska individer
  • men räkna inte någon två gånger!!

med detta logiska tillvägagångssätt skulle vi hitta

  • P (manlig eller frisk) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996

Vi har en mindre skillnad i våra svar i sista decimalen på grund av avrundningen som inträffade när vi beräknade P(manlig), P(frisk) och P(manlig och frisk) och tillämpade sedan regel 5.

svaret är helt klart detsamma, cirka 70%. Om vi Bar våra svar på fler decimaler eller om vi använde de ursprungliga fraktionerna, kunde vi helt eliminera denna lilla skillnad.

Låt oss titta på ett sista exempel för att illustrera Sannolikhetsregel 5 när regeln behövs – dvs. när vi inte har faktiska data.

exempel: viktig leverans!

det är viktigt att ett visst dokument når sin destination inom en dag. För att maximera chanserna för leverans i tid skickas två kopior av dokumentet med två tjänster, service a och service B. Det är känt att sannolikheten för leverans i tid är:

  • 0,90 för service a (P(a) = 0,90)
  • 0,80 för service B (P(B) = 0,80)
  • 0.75 för båda tjänsterna är i tid(P(a och B) = 0.75)
    (Observera att A och B inte är osammanhängande. De kan hända tillsammans med Sannolikhet 0,75.)

Venn-diagrammen nedan illustrerar sannolikheterna P(A), P(B) och P (A och B):

tre Venn-diagram. I dem alla finns en stor rektangel som representerar hela provutrymmet S. inuti denna rektangel finns två cirklar som överlappar delvis. En cirkel är märkt A och den andra är märkt B. I det första Venn-diagrammet är cirkeln för a färgad blå, och vi ser att P(a) = 0,90 . I viss mening är P (A) området för a-cirkeln. I det andra Venn-diagrammet är cirkeln för B färgad blå, och den är markerad att P(B) = 0,80 . Precis som i det första Venn-diagrammet kan man tro att cirkeln för B har ett område på 0,80 . I det tredje Venn-diagrammet är området som överlappar cirklarna A och B färgat blått. P (A och B) = 0,75 . Överlappningsområdet kan anses ha ett område på 0,75 .

i samband med detta problem är den uppenbara frågan om intresse:

  • vad är sannolikheten för leverans i tid av dokumentet med hjälp av denna strategi (att skicka det via båda tjänsterna)?

dokumentet kommer att nå sin destination i tid så länge det levereras i tid av tjänst A eller av tjänst B eller av båda tjänsterna. Med andra ord, när händelse a inträffar eller händelse B inträffar eller båda inträffar. så….

P (on time delivery med denna strategi)=P(A eller B), som representeras av det skuggade området i diagrammet nedan:

samma Venn-Diagram utom området för de två cirklarna har färgats blått (skuggat). Detta innebär att området i överlappningen också är färgat blått. Observera att överlappningsområdet bara har färgats en gång, så även om det är i båda cirklarna räknar vi det en gång.

Vi kan nu

  • använda de tre Venn-diagrammen som representerar P(A), P(B) och P(A och B)
  • för att se att vi kan hitta P(A eller B) genom att lägga till P(A) (representerad av den vänstra cirkeln) och P(B) (representerad av den högra cirkeln),
  • sedan subtrahera P(A och B) (representerad av överlappningen), eftersom vi inkluderade den två gånger, en gång som en del av P(A) och en gång som en del av p(b).

detta visas i följande bild:

området för båda cirklarna i Venn - diagrammet (räknar överlappningsområdet en gång) beräknas som: området för A: S cirkel (som inkluderar överlappningen) + området för B: s cirkel (som också inkluderar överlappningen) - överlappningsområdet. Vi får därför: P (A eller B) = P(A) + P(B) - P(A och B).'s circle (which includes the overlap) + the area of B's circle (which also includes the overlap) - the area of the overlap. We therefore get: P(A or B) = P(A) + P(B) - P(A and B).

om vi tillämpar detta på vårt exempel finner vi att:

  • P (a eller B)= P(leverans i tid med denna strategi)= 0.90 + 0.80 – 0.75 = 0.95.

så vår strategi att använda två leveranstjänster ökar vår Sannolikhet för leverans i tid till 0,95.medan Venn-diagrammen var bra att visualisera den allmänna Tilläggsregeln, är det i fall som dessa mycket lättare att visa informationen i och arbeta med en tvåvägs sannolikhetstabell, mycket som vi undersökte förhållandet mellan två kategoriska variabler i undersökande Dataanalyssektion.

Vi kommer helt enkelt visa dig tabellen, inte hur vi härleda det som du inte kommer att bli ombedd att göra detta för oss. Du bör kunna se att viss logik och enkel addition/subtraktion är allt vi använde för att fylla i tabellen nedan.

tabellen har kolumnerna "B", "inte B" och "totalt."Raderna är "A", "Inte A" och " totalt."Här är lite information om tabellen, organiserad av cell: vid cellen A,B är värdet där (0,75) P(A och B) = P(leverans i tid av båda tjänsterna). I cellen a, Inte B, är värdet där (0,15) P(A och inte B) = P(leverans i tid endast genom service a). Vid cell inte A och B är värdet (0,05) P(inte A och B) = P(leverans i tid endast genom tjänst B). Vid cell inte A och inte B är värdet (0,05) P(inte A och inte B) = P(varken service a eller B levereras i tid)."B," "not B," and "Total." The rows are "A," "not A," and "Total." Here are is some information about the table, organized by cell: At the cell A,B, the value there (0.75) is P(A and B) = P(on-time delivery by both services). At the cell A,not B, the value there (0.15) is P(A and Not B) = P(on-time delivery ONLY by service A). At cell Not A and B, the value (0.05) is P(not A and B) = P(on-time delivery ONLY by service B). At cell Not A and Not B, the value (0.05) is P(not A and not B) = P(Neither service A nor B delivered on time).

När vi använder en tvåvägstabell måste vi komma ihåg att titta på hela raden eller kolumnen för att hitta övergripande sannolikheter som endast involverar A eller endast B.

  • P(a) = 0.90 betyder att i 90% av fallen när service a används, levererar det dokumentet i tid. För att hitta detta tittar vi på den totala sannolikheten för raden som innehåller A. När vi hittar P(a) vet vi inte Om B händer eller inte.

tabellens första rad har markerats. Här är de markerade data i rad, kolumnformat: A, B: P(A och B) = 0,75; A, Inte B: P(A och inte B) = 0,15; a, totalt: P(a) = 0,90 = P(A och B) + P(A och inte B)'s first row has been highlighted. Here is the highlighted data in "Row, Column" format: A, B: P(A and B) = 0.75; A, not B: P(A and not B) = 0.15; A, Total: P(A) = 0.90 = P(A and B) + P(A and not B)

  • P(B) = 0,80 betyder att i 80% av de fall då service B används, levererar det dokumentet i tid. För att hitta detta tittar vi på den totala sannolikheten för kolumnen som innehåller B. När vi hittar P(B) vet vi inte om A händer eller inte.

tabellens första kolumn har markerats. Här är de markerade data i rad, kolumnformat: A,B: P(A och B) = 0,75; inte A, B: P(inte A och B) = 0.05; B, totalt: P (B) = 0.80 = P(A och B) + P(inte A och B)'s first column has been highlighted. Here is the highlighted data in "Row, Column" format: A,B: P(A and B) = 0.75; not A, B: P(not A and B) = 0.05; B,Total: P(B) = 0.80 = P(A and B) + P(not A and B)

kommentar

  • när vi använde tvåvägstabeller i avsnittet Exploratory Data Analysis (EDA) var det att registrera värden för två kategoriska variabler för ett konkret prov av individer.
  • däremot är informationen i en sannolikhets tvåvägstabell för en hel population, och värdena är ganska abstrakta.
  • Om vi hade behandlat något som leveransexemplet i Eda-avsnittet skulle vi ha registrerat det faktiska antalet leveranser i tid (och inte i tid) för prover av dokument som skickas med service A eller B.
  • i det här avsnittet presenteras de långsiktiga sannolikheterna som kända.
  • förmodligen baserades de rapporterade sannolikheterna i detta leveransexempel på relativa frekvenser registrerade över många repetitioner.
interaktiv Applet: Sannolikhet Venn Diagram

avrundning tumregel för Sannolikhet:

följ följande allmänna riktlinjer i denna kurs. Om du är osäker bär fler decimaler. Om vi anger ge exakt vad som begärs.

  • i allmänhet bör du bära sannolikheter till minst 4 decimaler för mellansteg.
  • vi avrundar ofta vårt slutliga svar till två eller tre decimaler.
  • för extremt små sannolikheter är det viktigt att ha 1 eller två signifikanta siffror (icke-noll siffror), till exempel 0,000001 eller 0,000034, etc.

många datorpaket kan visa extremt små värden med hjälp av vetenskaplig notation som

  • 58 10-5 eller 1.58 e-5 för att representera 0.0000158

Låt oss sammanfatta

hittills i vår studie av sannolikhet har du introducerats till sannolikhetens ibland kontraintuitiva natur och de grunder som ligger till grund för sannolikheten, till exempel en relativ frekvens.

Vi gav dig också några verktyg som hjälper dig att hitta sannolikheten för händelser — nämligen sannolikhetsreglerna.

du märkte förmodligen att sannolikhetsavsnittet skilde sig avsevärt från de två tidigare avsnitten; Den har en mycket större teknisk/matematisk komponent, så resultaten tenderar att vara mer av ”rätt eller fel” natur.

i avsnittet Exploratory data Analysis tog datorn för det mesta hand om den tekniska aspekten av saker och våra uppgifter var att berätta för den att göra rätt sak och sedan tolka resultaten.

med Sannolikhet gör vi arbetet från början till slut, från att välja rätt verktyg (regel) att använda, att använda det korrekt, att tolka resultaten.

Här är en sammanfattning av de regler vi hittills har presenterat.

1. Sannolikhetsregel # 1 anger:

  • för varje händelse a, 0 oc(a) oc 1

2. Sannolikhetsregel # 2 anger:

  • summan av sannolikheterna för alla möjliga resultat är 1

3. Komplementregeln (#3) anger att

  • P(inte A) = 1 – P(a)

eller när den omarrangeras

  • P(a) = 1 – P(inte a)

den senare representationen av Komplementregeln är särskilt användbart när vi behöver hitta sannolikheter för händelser av typen ”minst en av …”

4. Den allmänna Tilläggsregeln (#5) anger att för två händelser,

  • P(a eller B) = P(A) + P(B) – P(A och B),

där vi med P(A eller B) menar P(a inträffar eller B inträffar eller båda).

I det speciella fallet med ojämna händelser, händelser som inte kan inträffa tillsammans, kan den allmänna Tilläggsregeln reduceras till Tilläggsregeln för ojämna händelser (#4), vilket är

  • P(a eller B) = P(A) + P(B). *

*använd endast när du är övertygad om att händelserna är ojämna (de överlappar inte)

5. Den begränsade versionen av tilläggsregeln (för ojämna händelser) kan enkelt utvidgas till mer än två händelser.

6. Hittills har vi bara hittat P (A och B) med hjälp av logik och räkning i enkla exempel

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *