Basic Probability Rules

  • Introduction
  • Rules of Probability
    • Probability Rule One (for any event A, 0 ≤ P(A) ≤ 1)
    • Probability Rule Two (The Summum of the probabilities of all possible outcomes is 1)
    • Todennäköisyyssääntö kolme (the Complement Rule)
    • todennäköisyydet, joihin liittyy useita tapahtumia
    • Todennäköisyyssääntö neljä (Yhteenlaskusääntö Epäyhtenäisille tapahtumille)
    • löytää P(A ja B) logiikan avulla
    • todennäköisyyssääntö Viisi (yleinen Yhteenlaskusääntö)
  • Pyöristyssääntö todennäköisyydelle
  • tiivistetään
CO-6: sovelletaan todennäköisyyden peruskäsitteitä, satunnaisvaihtelua ja yleisesti käytettyjä tilastollisia todennäköisyysjakaumia.
LO 6.4: suhteuta tapahtuman todennäköisyys tämän tapahtuman toteutumisen todennäköisyyteen.
LO 6.5: sovelletaan suhteellisen frekvenssin lähestymistapaa tapahtuman todennäköisyyden arvioimiseen.
LO 6, 6: Soveltaa peruslogiikkaa ja todennäköisyyssääntöjä löytääkseen empiirisen todennäköisyyden tapahtumalle.
Video: Basic Probability Rules (25:17)

edellisessä jaksossa esitimme todennäköisyyden keinona kvantifioida epävarmuutta, joka syntyy kokeista satunnaisotannalla kiinnostavasta populaatiosta.

näimme, että tapahtuman todennäköisyys (esimerkiksi se, että satunnaisesti valitulla henkilöllä on veriryhmä O) voidaan arvioida sen suhteellisen yleisyyden perusteella, jolla tapahtuma esiintyy pitkässä koesarjassa. Keräämme siis paljon tietoa henkilöistä arvioidaksemme todennäköisyyden sille, että jollakulla on veriryhmä O.

tässä osiossa määritämme perusmenetelmät ja periaatteet tapahtumien todennäköisyyksien löytämiseksi.

käsittelemme myös joitakin todennäköisyyden perussääntöjä, joita voidaan käyttää todennäköisyyksien laskemiseen.

Johdanto

aloitamme klassisella todennäköisyysesimerkillä reilun kolikon heittämisestä kolme kertaa.

koska Kruuna ja klaava ovat tässä skenaariossa yhtä todennäköisiä jokaiselle heitolle, jokainen kolmesta heitosta johtuva mahdollisuus on myös yhtä todennäköinen, jotta voimme luetella kaikki mahdolliset arvot ja käyttää tätä luetteloa todennäköisyyksien laskemiseen.

koska keskitymme tällä kurssilla dataan ja tilastoihin (ei teoreettiseen todennäköisyyteen), käytämme useimmissa tulevissa ongelmissamme todennäköisyyksien laskemiseen tiivistettyä aineistoa, yleensä frekvenssitaulukkoa tai kaksisuuntaista taulukkoa.

esimerkki: Heitä reilu kolikko kolme kertaa

listaa jokainen mahdollinen lopputulos (tai mahdollinen tulos):

{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}

nyt määritellään seuraavat tapahtumat:

tapahtuma A: ”ei saa H: ta”

tapahtuma B: ”saa tasan yhden H: n”

tapahtuma C: ”saa ainakin yhden H: n”

huomaa, että jokainen tapahtuma on todellakin kannanotto lopputuloksesta, jonka kokeilu tulee tuottamaan. Käytännössä jokainen tapahtuma vastaa jonkinlaista kokoelmaa (osajoukkoa) mahdollisista lopputuloksista.

tapahtuma A:” Getting no h ” → TTT

tapahtuma B: ”Getting exactly one H” → HTT, THT, TTH

tapahtuma C:” Getting at least one H” → HTT, THT, TTH, THH, HTH, HHT, hhh

tässä on visuaalinen esitys tapahtumista A, B ja C.

meillä on suuri suorakulmio, jossa on merkintä" S", joka edustaa koko NÄYTETILAA. Tämän suorakulmion sisällä on ympyrä, jossa on merkintä " C. " kaikki "C: n ulkopuolella sattuukin sattumaan yhteen tapahtuman A kanssa, joka sisältää vain "TTT": n. C: n sisällä näkyy "HHH", "THH", "HTH", "HHT" ja tapahtumaa B edustava ympyrä.B: n sisällä ovat "HHT", "THT" ja "TTH."Huomaa, että kaikki B: n sisällä olevat kohteet ovat myös C: n sisällä, joten C sulkee kokonaan B: n sisään."S" which represents the entirety of the sample space. Inside this rectangle we have a circle labeled "C." Everything outside of "C happens to coincied with event A containing only "TTT". Inside of C, we see "HHH," "THH," "HTH," "HHT," and a circle representing event B. Inside B are "HHT," "THT," and "TTH." Note that all of the items inside B are also inside C, so C fully encloses B.

tästä tapahtumien visuaalisesta esityksestä on helppo nähdä, että tapahtuma B sisältyy kokonaan tapahtumaan C, siinä mielessä, että jokainen tulos tapauksessa B on myös tulos tapauksessa C. huomaa myös, että tapahtuma a erottuu tapahtumista B ja C siinä mielessä, että niillä ei ole yhteistä lopputulosta tai päällekkäisyyttä. Tässä vaiheessa nämä ovat vain huomionarvoisia havaintoja, mutta kuten huomaat myöhemmin, ne ovat erittäin tärkeitä.

What if we added the new event:

Event D: ”Getting A T on the first Hess” → THH, THT, TTH, TTT

miltä näyttäisi, jos lisäämme tapahtuman D yllä olevaan kaavioon? (Linkki vastaukseen)

muista, että koska H ja T ovat yhtä todennäköisiä jokaisessa heitossa, ja koska mahdollisia lopputuloksia on 8, jokaisen tuloksen todennäköisyys on 1/8.

Katso, osaatko vastata seuraaviin kysymyksiin käyttäen kaavioita ja / tai luetteloa kunkin tapahtuman tuloksista sekä sitä, mitä olet tähän mennessä oppinut todennäköisyydestä.

Opi tekemällä: Reilun kolikon heittäminen kolme kertaa

Jos osasit vastata näihin kysymyksiin oikein, sinulla on todennäköisesti hyvä vaisto todennäköisyyden laskemiseen! Lue lisää, miten sovellamme tätä tietoa.

Jos ei, yritämme auttaa sinua kehittämään tätä taitoa tässä osiossa.

kommentti:

  • huomaa, että tapauksessa C ”vähintään yhden pään saaminen” on vain yksi mahdollinen lopputulos, joka puuttuu, ”pään puuttuminen” = TTT. Käsittelemme tätä uudelleen, kun puhumme todennäköisyyssäännöistä, erityisesti komplementtisäännöstä. Tässä vaiheessa haluamme vain sinun ajattelevan, miten nämä kaksi tapahtumaa ovat ”vastakohtia” tässä skenaariossa.

on hyvin tärkeää ymmärtää, että vaikka voimme luetella mahdolliset lopputulokset, tämä ei tarkoita, että jokainen lopputulos olisi yhtä todennäköinen.

Tämä on (hauska) viesti Daily Show-klipissä, jonka annoimme edellisellä sivulla. Mutta Mietitäänpä vielä. Kyseisessä klipissä Walter väittää, että koska on olemassa kaksi mahdollista lopputulosta, todennäköisyys on 0,5. Kaksi mahdollista lopputulosta ovat

  • maailma tuhoutuu large hadron Colliderin käytön vuoksi
  • maailma ei tuhoudu large hadron Colliderin käytön vuoksi

toivottavasti on selvää, että nämä kaksi lopputulosta eivät ole yhtä todennäköisiä!!

tarkastellaan yleisempää esimerkkiä.

esimerkki: Syntymävauriot

Oletetaan, että valitsemme sattumanvaraisesti kolme lasta ja meitä kiinnostaa todennäköisyys, että yhdelläkään lapsista ei ole syntymävaurioita.

käytämme merkintää d kuvaamaan syntynyttä lasta, jolla on syntymävika, ja N edustamaan syntynyttä lasta, jolla ei ole syntymävikaa. Voimme luetella mahdollisia lopputuloksia aivan kuten kolikonheitossa, ne ovat:

{DDD, NDD, DND, DDN, DNN, NDN, NDND, NNN}

ovatko tapahtumat DDD (kaikilla kolmella lapsella on syntymävika) ja NNN (kenelläkään lapsista ei ole syntymävikaa) yhtä todennäköisiä?

sinulle pitäisi olla kohtuullista, että P(NNN) on paljon suurempi kuin P(DDD).

Tämä johtuu siitä, että P(N) ja P(D) eivät ole yhtä todennäköisiä tapahtumia.

on harvinaista (ei ainakaan 50%), että sattumanvaraisesti valittu lapsi syntyy syntymävian kanssa.

todennäköisyyden säännöt

nyt siirrytään opettelemaan joitakin todennäköisyyden perussääntöjä.

onneksi nämä säännöt ovat hyvin intuitiivisia, ja niin kauan kuin niitä sovelletaan järjestelmällisesti, ne antavat meille mahdollisuuden ratkaista monimutkaisempia ongelmia; erityisesti niitä ongelmia, joihin intuitiomme saattaa olla riittämätön.

koska suurin osa todennäköisyyksistä, joita pyydetään etsimään, voidaan laskea sekä

  • logiikan ja laskemisen

että

  • oppimiemme sääntöjen avulla,

annamme periaatteena seuraavan neuvon.

periaate:

jos voit laskea todennäköisyyden logiikalla ja laskemalla, et tarvitse todennäköisyyssääntöä (vaikka oikeaa sääntöä voi aina soveltaa)

Todennäköisyyssääntö yksi

ensimmäinen sääntömme muistuttaa meitä yksinkertaisesti jo oppimastamme todennäköisyyden perusominaisuudesta.

tapahtuman todennäköisyys, joka ilmoittaa meille sen toteutumisen todennäköisyyden, voi vaihdella missä tahansa välillä 0 (mikä osoittaa, että tapahtuma ei koskaan tapahdu) – 1 (mikä osoittaa, että tapahtuma on varma).

Todennäköisyyssääntö yksi:

  • missä tahansa tapahtumassa A, 0 ≤ P(A) ≤ 1.

huomautus: eräs tämän säännön käytännön käyttötarkoitus on, että sen avulla voidaan tunnistaa mikä tahansa todennäköisyyslaskenta, joka osoittautuu yli 1: ksi (tai alle 0: ksi) virheelliseksi.

ennen kuin siirrytään muihin sääntöihin, katsotaan ensin esimerkki, joka antaa kontekstin useiden seuraavien sääntöjen kuvaamiseen.

esimerkki: veriryhmät

kuten aiemmin on keskusteltu, kaikki ihmisveri voidaan tyypittää O: ksi, A: ksi, B: ksi tai AB: ksi.

lisäksi näiden veriryhmien esiintymistiheys vaihtelee etnisesti ja rodullisesti.

Stanfordin yliopiston Verikeskuksen (bloodcenter.stanford.edu), nämä ovat ihmisen veriryhmien todennäköisyydet Yhdysvalloissa (tyypin A todennäköisyys on jätetty tarkoituksella pois):

motivoiva kysymys säännölle 2: henkilö valitaan Yhdysvalloissa sattumanvaraisesti. Mikä on todennäköisyys, että henkilöllä on veriryhmä A?

vastaus: Intuitiomme kertoo meille, että koska neljä veriryhmää O, A, B ja AB tyhjentävät kaikki mahdollisuudet, niiden todennäköisyyksien on oltava yhdessä 1, joka on ”tietyn” tapahtuman todennäköisyys (henkilöllä on jokin näistä 4 veriryhmästä varmasti).

koska todennäköisyydet O, B, ja AB yhdessä summa 0.44 + 0.1 + 0.04 = 0,58, tyypin A todennäköisyyden on oltava jäljellä 0.42 (1 – 0.58 = 0.42):

tiedot annettu "Blood Type: Probability" muodossa: O: 0, 44; A: 0, 42; B: 0, 10; AB: 0, 04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Todennäköisyyssääntö kaksi

Tämä esimerkki havainnollistaa toista sääntöämme, jonka mukaan kaikkien mahdollisten lopputulosten todennäköisyyden yhdessä on oltava 1.

Todennäköisyyssääntö kaksi:

kaikkien mahdollisten lopputulosten todennäköisyyksien summa on 1.

Tämä on hyvä paikka verrata ja verrata mitä teemme täällä siihen, mitä opimme Eksploratory Data Analysis (Eda) – osiossa.

  • huomaa, että tässä ongelmassa keskitytään olennaisesti yhteen kategoriseen muuttujaan: veriryhmään.
  • tiivistimme edellä mainitun muuttujan EDA-osion yksittäisiin kategorisiin muuttujiin luettelemalla, mitä arvoja muuttuja ottaa ja kuinka usein se ottaa niitä.
  • Eda: ssa käytimme prosenttilukuja, ja tässä käytämme todennäköisyyksiä, mutta nämä kaksi välittävät samaa tietoa.
  • Eda-osiossa opimme, että piirakkakaavio tarjoaa sopivan näytön, kun kyseessä on yksittäinen kategorinen muuttuja, ja vastaavasti Voimme käyttää sitä tässä (käyttäen prosenttilukuja todennäköisyyksien sijaan):

piirakkakaavio, otsikolla "veriryhmät."Tyyppi O vie 44% piirakasta, a käyttää 42%, AB edustaa 4% ja B edustaa loput, 10%. Huomaa, että veriryhmät, jotka ovat "ei O", vievät 56% piirakkakaaviosta."Blood Types." Type O takes up 44% of the pie chart, A uses 42%, AB represents 4%, and B represents the rest, 10%. Note that the types of blood which are "not O" take up 56% of the pie chart.

vaikka se, mitä teemme täällä, on todellakin samanlaista kuin mitä olemme tehneet EDA-osiossa, on hienovarainen mutta merkittävä ero taustalla olevien tilanteiden välillä

  • Eda: ssa, tiivistimme tiedot, jotka saatiin näytteestä henkilöistä, joille merkittiin kiinnostavan muuttujan arvot.
  • tässä, kun esitämme kunkin veriryhmän todennäköisyyden, mielessämme on koko Yhdysvaltojen väestö, jolle oletamme tietävämme kiinnostavan muuttujan ottamien arvojen yleisyyden.
sainko tämän?: Todennäköisyyssääntö kaksi

Todennäköisyyssääntö kolme

todennäköisyydessä ja sen sovellutuksissa meitä kiinnostaa usein selvittää todennäköisyys sille, että jokin tapahtuma ei toteudu.

tärkeä asia tässä on ymmärtää, että ”tapahtuma A ei esiinny” on erillinen tapahtuma, joka koostuu kaikista mahdollisista lopputuloksista, jotka eivät ole A: ssa ja jota kutsutaan ”A: n komplementtitapahtumaksi”.

notaatio: kirjoitamme ”Ei a” merkitsemään tapahtumaa, jota a ei esiinny. Tässä on visuaalinen esitys siitä, miten tapahtuma A ja sen täydennystapahtuma ”Ei A” yhdessä edustavat kaikkia mahdollisia lopputuloksia.

koko näytetila S esitetään harmaalla laatikolla. Tämän laatikon sisällä on sininen ympyrä, joka edustaa kaikkia tuloksia A: ssa.kaikki muu harmaassa laatikossa mutta sinisen ympyrän ulkopuolella on "ei a"."not A".

kommentti:

  • tällaista visuaalista näyttöä kutsutaan ”Venn-diagrammiksi.”Venn-Diagrammi on yksinkertainen tapa visualisoida tapahtumia ja niiden välisiä suhteita suorakulmioiden ja ympyröiden avulla.

Sääntö 3 käsittelee tapahtuman todennäköisyyden ja sen komplementtitapahtuman todennäköisyyden suhdetta.

ottaen huomioon, että tapahtuma A ja tapahtuma ”ei a” muodostavat yhdessä kaikki mahdolliset lopputulokset, ja koska sääntö 2 kertoo, että kaikkien mahdollisten tulosten todennäköisyyksien summa on 1, seuraavan säännön tulisi olla varsin intuitiivinen:

Todennäköisyyssääntö kolme (Komplementtisääntö):

  • P(ei a) = 1 – P(A)
  • eli todennäköisyys, että tapahtuma ei tapahdu on 1 miinus todennäköisyys, että se tapahtuu.

esimerkki: verityypit

Back to the blood type example:

Tässä muutamia lisätietoja:

  • A-tyypin henkilö voi luovuttaa verta A-tai ab-tyypin henkilölle.
  • B-tyyppiä sairastava voi luovuttaa verta B-tai AB-tyyppiä sairastavalle.
  • AB-tyyppiä sairastava henkilö voi luovuttaa verta vain AB-tyyppiä sairastavalle.
  • henkilö, jolla on O-tyypin verta, voi luovuttaa kenelle tahansa.

mikä on todennäköisyys sille, että satunnaisesti valittu henkilö ei voi luovuttaa verta kaikille? Toisin sanoen, mikä on todennäköisyys, että satunnaisesti valitulla henkilöllä ei ole veriryhmää O? Meidän on löydettävä P(Ei O). Komplementtisäännön mukaan P(Ei O) = 1 – P(O) = 1 – 0, 44 = 0, 56. Toisin sanoen 56 prosentilla Yhdysvaltain väestöstä ei ole verityyppiä O:

selvästi myös P(ei o) voitaisiin löytää suoraan lisäämällä B: n, AB: n ja A: n todennäköisyydet.

kommentti:

  • huomaa, että Komplementtisääntö, P(ei a) = 1 – P(A) voidaan muotoilla uudelleen muotoon P(A) = 1-P(Ei a).
    • P(not a) = 1 – P(a)
    • voidaan muotoilla uudelleen muotoon P(A) = 1-P (not a).
    • tällä näennäisen triviaalilla algebrallisella manipuloinnilla on tärkeä sovellus, ja se itse asiassa kaappaa komplementtisäännön vahvuuden.
    • joissakin tapauksissa, kun P(A): n löytäminen suoraan on hyvin monimutkaista, saattaa olla paljon helpompaa löytää P(ei A) ja sitten vain vähentää se 1: stä, jotta saadaan haluttu P(A).
    • palaamme tähän kommenttiin pian ja annamme lisää esimerkkejä.
sainko tämän?: Todennäköisyyssääntö kolme
  • komplementtisääntö voi olla hyödyllinen aina, kun on helpompi laskea komplementin todennäköisyys kuin itse tapahtuma.
  • huomaa, että käytimme jälleen lausetta ”ainakin yksi.”
  • nyt on huomattu, että komplementti ”ainakin yksi … ”on” ei yhtään … ” tai ” ei ….”(kuten aiemmin mainittiin tapahtumien olevan”vastakohtia”).
  • edellä mainitusta aktiivisuudesta näemme, että
    • P(mikään näistä kahdesta haittavaikutuksesta) = 1 – P(ainakin toinen näistä haittavaikutuksista)
  • tämä on yleinen komplementtisäännön soveltaminen, jonka usein tunnistaa lauseesta ”ainakin yksi” ongelmassa.

todennäköisyydet, joihin liittyy useita tapahtumia

meitä kiinnostaa usein löytää todennäköisyyksiä, joihin liittyy useita tapahtumia, kuten

  • P(A tai b) = P(tapahtuma a tapahtuu tai b tapahtuu tai molemmat tapahtuvat)
  • p(sekä tapahtuma a tapahtuu että B tapahtuu)

yleinen terminologian ongelma liittyy siihen, miten yleensä ajattelemme ”tai” jokapäiväisessä elämässämme. Esimerkiksi, kun vanhempi sanoo lapselleen lelukaupassa ”Haluatko toy A: n vai toy B: n?”, tämä tarkoittaa, että lapsi saa vain yhden lelun ja hänen on valittava niiden välillä. Molempien lelujen hankkiminen ei yleensä ole vaihtoehto.

sen sijaan:

todennäköisyydellä ”tai” tarkoittaa jompaakumpaa tai molempia.

ja niin P(A tai b) = P(tapahtuma a esiintyy tai tapahtuma B esiintyy tai molemmat esiintyvät)

tämän sanottuaan on huomattava, että on olemassa tapauksia, joissa on yksinkertaisesti mahdotonta, että molemmat tapahtumat sattuisivat samaan aikaan.

Todennäköisyyssääntö neljä

ero niiden tapahtumien välillä, jotka voivat tapahtua yhdessä ja niiden, jotka eivät voi, on tärkeä.

Disjoint: Kahta tapahtumaa, jotka eivät voi tapahtua samanaikaisesti, kutsutaan disjointiksi tai toisensa poissulkeviksi. (Käytämme disjoint.)

Venn-Diagrammi otsikolla "A ja B ovat hajanaisia."Koko otosavaruus esitetään suorakulmiona. Suorakulmion sisällä on kaksi erillistä ympyrää. Toinen ympyrä edustaa A: n tapahtumia ja toinen B: n tapahtumia."A and B are Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two separate circles. One circle represents the events in A and the other represents the events in B.Venn-Diagrammi otsikolla "A ja B eivät ole hajaantuneita."Koko otosavaruus esitetään suorakulmiona. Suorakulmion sisällä on kaksi ympyrää. Yksi ympyrä edustaa esiintymiä A: ssa ja toinen edustaa esiintymiä B: ssä.nämä kaksi eivät ole hajanaisia, joten kaksi ympyrää menevät osittain päällekkäin. (Koska ei ole disjoint, kaksi ympyrää voisi limittyä toisiinsa täysin, mutta tässä esimerkissä ne eivät.)"A and B are NOT Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two circles. One circle represents the occurrences in A and the other represents the occurrences in B. These two are not disjoint, so the two circles partially overlap each other. (Being NOT disjoint, two circles could overlap each other completely, but in this example they do not.)

kuvasta pitäisi olla selvää, että

  • ensimmäisessä tapauksessa, jossa tapahtumat eivät ole disjoint, P(A ja B) ≠ 0
  • toisessa tapauksessa, jossa tapahtumat ovat disjoint, P(A ja B) = 0.

tässä on kaksi esimerkkiä:

esimerkki:

harkitse seuraavia kahta tapahtumaa:

a — satunnaisesti valitulla henkilöllä on veriryhmä A, ja

b — satunnaisesti valitulla henkilöllä on veriryhmä B.

harvoissa tapauksissa henkilön suonissa voi virrata useampaa kuin yhtä verityyppiä, mutta meidän tarkoituksemme on olettaa, että jokaisella henkilöllä voi olla vain yksi veriryhmä. Siksi on mahdotonta, että tapahtumat A ja B sattuisivat yhdessä.

  • tapahtumat A ja B ovat hajanaisia

toisaalta …

esimerkki:

harkitse seuraavia kahta tapahtumaa:

a — satunnaisesti valitulla henkilöllä on veriryhmä A

B — satunnaisesti valittu henkilö on nainen.

tällöin on mahdollista, että tapahtumat A ja B esiintyvät yhdessä.

  • tapahtumat A ja B eivät ole erillisiä.

Venn-diagrammit viittaavat siihen, että toinen tapa ajatella disjoint vs. ei disjoint-tapahtumia on, että disjoint-tapahtumat eivät ole päällekkäisiä. Ne eivät jaa mitään mahdollisista tuloksista, eivätkä siksi voi tapahtua yhdessä.

toisaalta tapahtumat, jotka eivät ole irrallisia, ovat päällekkäisiä siinä mielessä, että ne jakavat osan mahdollisista lopputuloksista ja voivat siksi esiintyä samanaikaisesti.

nyt aloitetaan yksinkertaisella säännöllä, jolla voidaan löytää P(A tai B) epäyhtenäisille tapahtumille.

Todennäköisyyssääntö neljä (Yhteenlaskusääntö Epäyhtenäisille tapahtumille):

  • Jos A ja B ovat epäyhtenäisiä tapahtumia, niin P(A tai B) = P(A) + P(B).

kommentti:

  • todennäköisyyksiä käsiteltäessä sana” tai ” liitetään aina yhteenlaskun operaatioon; tästä johtuu tämän säännön nimi, ” Yhteenlaskusääntö.”

EXAMPLE: Blood Types

Recall the blood type example:

tiedot annettu "Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0, 10; ab: 0, 04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

tässä on joitakin lisätietoja

  • henkilö, jolla on tyyppi Acan, luovuttaa verta henkilölle, jolla on tyyppi A tai ab.
  • bcan-tyyppiä sairastava henkilö luovuttaa verta B-tai AB-tyyppiä sairastavalle henkilölle.
  • abcan-tyyppinen henkilö luovuttaa verta AB
  • – tyyppinen henkilö voi luovuttaa verta kenelle tahansa.

mikä on todennäköisyys sille, että sattumanvaraisesti valittu henkilö on mahdollinen veriryhmän A luovuttaja?

annettujen tietojen perusteella tiedämme, että mahdollinen luovuttaja veriryhmään a kuuluvalle henkilölle tarkoittaa sitä, että hänellä on veriryhmä A tai O.

siksi meidän on löydettävä P(A tai O). Koska tapahtumat A ja O ovat disjoint, voidaan disjoint-tapahtumien yhteenlaskusäännön avulla saada:

  • P(A tai O) = P(A) + P(O) = 0, 42 + 0, 44 = 0, 86.

on helppo ymmärtää, miksi todennäköisyyden lisääminen on oikeastaan järkevää.

Jos 42% väestöstä on veriryhmä A ja 44% väestöstä on veriryhmä O,

  • niin 42% + 44% = 86% väestöstä on joko veriryhmä A tai O, ja näin ollen he ovat mahdollisia luovuttajia henkilölle, jolla on veriryhmä A.

tämä päättely siitä, miksi yhteenlaskusääntö on järkevä, voidaan havainnollistaa alla olevan piirakankaavion avulla:

piirakkakaavio otsikolla "veriryhmät."A-tyyppi vie 42% piirakkakaaviosta ja O-tyyppi 44%. Yhdessä ne vievät A tai O: na 86 prosenttia piirakkakaaviosta."Blood Types." Type A takes up 42% of the pie chart, and type O takes up 44%. Together, as A or O, they take up 86% of the pie chart.

Opi tekemällä: Todennäköisyyssääntö neljä

kommentti:

  • disjoint-tapahtumien Yhteenlaskusääntö voidaan luonnollisesti laajentaa koskemaan useampaa kuin kahta disjoint-tapahtumaa. Otetaan esimerkiksi kolme. Jos A, B ja C ovat kolme disjoint-tapahtumaa
Venn-kaavio, joka esittää 3 disjoint-tapahtumaa. Kuten tavallista, on harmaa laatikko, jossa näkyy koko näytetila. Tämän harmaan laatikon sisällä on kolme täysin erillistä ympyrää. Ensimmäinen ympyrä on esiintymille A: ssa, toinen esiintymille B: ssä ja kolmas esiintymille C: ssä.

sitten P(A tai b tai C) = P(A) + P(B) + P(C). Sääntö on sama kaikille disjoint-tapahtumille.

sainko tämän?: Todennäköisyyssääntö neljä

olemme nyt lopettaneet Yhteenlaskusäännön ensimmäisen version (sääntö neljä), joka on disjoint-tapahtumiin rajoitettu versio. Ennen kuin käsittelemme toista versiota, meidän on ensin keskusteltava P (A ja B).

p: n(A ja B) löytäminen logiikan avulla

siirrymme nyt laskemaan

  • P(A ja B)= P(sekä tapahtuma A että tapahtuma B)

myöhemmin käsitellään P: N(A ja B) laskemisen sääntöjä.

Ensinnäkin haluamme havainnollistaa, että sääntöä ei tarvita aina, kun vastauksen voi määrittää logiikan ja laskennan avulla.

erikoistapaus:

on yksi erikoistapaus, jolle tiedämme, mitä P(A ja B) on yhtä kuin soveltamatta mitään sääntöä.

Opi tekemällä: Löydetään P (A ja B) #1

joten, jos tapahtumat A ja B ovat hajanaisia, niin(määritelmän mukaan) P (A ja B)= 0. Mutta entä jos tapahtumat eivät ole hajanaisia?

muista, että säännöstä 4, Yhteenlaskusäännöstä, on kaksi versiota. Yksi on rajoitettu erillisiin tapahtumiin, jotka olemme jo käsitelleet, ja käsittelemme yleisempää versiota myöhemmin tässä moduulissa. Sama pätee todennäköisyyksiin, joihin ja

kuitenkin, poikkeustapauksia lukuun ottamatta, luotamme logiikkaan löytääksemme P (A ja B) tässä kurssissa.

ennen kuin käsitellään mitään muodollisia sääntöjä, katsotaan esimerkki, jossa tapahtumat eivät ole hajanaisia.

esimerkki: parodontiitin Status ja sukupuoli

tarkastellaan seuraavaa taulukkoa koskien yksilöiden parodontiitin asemaa ja heidän sukupuoltaan. Parodontiitin tila viittaa iensairaus, jossa yksilöt luokitellaan joko terve, on ientulehdus,tai on parodontiitin.

olemme nähneet tämän tyyppisen taulukon aiemminkin, kun keskustelimme tietojen analysoinnista tapauksessa C → C. Tätä kysymystä varten käytämme näitä tietoja ”populaationamme” ja harkitsemme satunnaisesti yhden henkilön valitsemista.

Opi tekemällä: Parodontaalitilanne ja sukupuoli

haluamme esittää edellisen esimerkin kaltaisia todennäköisyyskysymyksiä (käyttäen aineistoon perustuvaa kaksisuuntaista taulukkoa), koska näin voit tehdä yhteydet näiden aiheiden välillä ja auttaa pitämään osan siitä, mitä olet oppinut datasta tuoreena mielessäsi.

muista, että ensisijainen tavoitteemme tällä kurssilla on analysoida tosielämän dataa!

Todennäköisyyssääntö viisi

olemme nyt valmiita siirtymään Yhteenlaskusäännön laajennettuun versioon.

tässä osiossa opitaan löytämään P(A tai B), Kun A ja B eivät välttämättä ole erillään toisistaan.

  • kutsumme tätä laajennettua versiota ”yleiseksi Yhteenlaskusäännöksi” ja toteamme sen Todennäköisyyssäännöksi viisi.

aloitamme toteamalla säännön ja antamalla esimerkin, joka on samantyyppinen kuin ne ongelmat, joita yleensä kysymme tällä kurssilla. Sitten esittelemme enemmän toinen esimerkki, jossa meillä ei ole raakadataa otoksesta työskennellä.

Todennäköisyyssääntö viisi:

  • yleinen Yhteenlaskusääntö: P(A tai B) = P(A) + P(B) – P(A ja b).

huomautus: on parasta käyttää logiikkaa P(A ja B) löytämiseen, ei toiseen kaavaan.

hyvin yleinen virhe on kertolaskusäännön virheellinen soveltaminen seuraavalla sivulla käsiteltyihin itsenäisiin tapahtumiin. Tämä pitää paikkansa vain, jos A ja B ovat riippumattomia (KS.seuraavat määritelmät), mikä on harvinaista kaksisuuntaisissa taulukoissa esitetyissä tiedoissa.

kuten aiemmissa esimerkeissä nähtiin, kun nämä kaksi tapahtumaa eivät ole irrallisia, on tapahtumien välillä jonkin verran päällekkäisyyttä.

  • Jos yksinkertaisesti laskemme kaksi todennäköisyyttä yhteen, saamme väärän vastauksen, koska olemme laskeneet jonkin ”todennäköisyyden” kahdesti!
  • näin ollen meidän on vähennettävä tästä ”ylimääräisestä” todennäköisyydestä saadaksemme oikean vastauksen. Venn-Diagrammi ja kaksisuuntaiset taulukot auttavat tämän idean visualisoinnissa.

venn-Diagrammi otsikolla "A ja B eivät ole irrallisia."Harmaa laatikko edustaa näytetilaa, ja sen sisällä on kaksi sinistä ympyrää, joilla on päällekkäinen alue. Yksi ympyrä merkitään A: ksi ja toinen B: ksi.alue, jolla kaksi ympyrää limittyvät, tarkoittaa, että tapahtumat A ja B voivat esiintyä samaan aikaan, joten P(A ja B) ≠ 0."A and B are NOT Disjoint." A gray box represents the sample space, and inside are two blue circles which have an overlapping area. One circle is labeled A and the other is labeled B. The area where the two circles overlap represents that Events A and B can occur at the same time, so P(A and B) ≠ 0.

tämä sääntö on yleisempi, koska se toimii mille tahansa tapahtumaparille (jopa erillisille tapahtumille). Meidän neuvomme on edelleen yrittää vastata kysymykseen käyttäen logiikkaa ja laskenta aina kun mahdollista, muuten meidän on oltava erittäin varovainen valita oikea sääntö ongelmaan.

periaate:

jos voit laskea todennäköisyyden logiikalla ja laskemalla, et tarvitse todennäköisyyssääntöä (vaikka oikeaa sääntöä voidaan aina soveltaa)

huomaa, että jos A ja B ovat disjoint, niin P(A ja B) = 0 ja sääntö 5 pienenee säännöksi 4 Tässä erikoistapauksessa.

Venn-Diagrammi otsikolla "A ja B ovat hajanaisia. Koko näyteavaruus S esitetään harmaana suorakulmiona. Sisällä on kaksi erillistä, ei-päällekkäistä sinistä ympyrää. Yksi ympyrä on esiintymille A: ssa ja toinen esiintymille B: ssä."A and B are Disjoint. The entire sample space S is represented as a gray rectangle. Inside are two, separate, non-overlapping blue circles. One circle is for the occurrences in A and the other for occurrences in B.

palataan viimeiseen esimerkkiin:

esimerkki: Parodontaalitilanne ja sukupuoli

harkitse satunnaisesti yhden yksilön valitsemista seuraavassa taulukossa esitetyistä yksilöiden parodontaalitilasta ja heidän sukupuolestaan. Parodontiitin tila viittaa iensairaus, jossa yksilöt luokitellaan joko terve, on ientulehdus,tai on parodontiitin.

Kerrataanpa, mitä olemme tähän mennessä oppineet. Voimme laskea minkä tahansa todennäköisyyden tässä skenaariossa, jos voimme määrittää, kuinka monta henkilöä täyttää tapahtuman tai tapahtumien yhdistelmän.

  • P (mies) = 3009/8027 = 0, 3749
  • P (nainen) = 5018/8027 = 0, 6251
  • P (terve) = 3750/8027 = 0, 4672
  • P (ei terve) = P (ientulehdus tai Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
    voisimme myös laskea tämän komplementtisäännön avulla: 1-P(terve)

myös aiemmin todettiin, että

  • P(mies ja terve) = 1143/8027 = 0.1424

Takaisinkutsusääntö 5, P(A tai B) = P(A) + P(B) – P(A ja b). Tällä säännöllä lasketaan nyt P(mies tai terve)

  • P(mies tai terve) = P(mies) + P(terve) – P (mies ja terve) = 0.3749 + 0.4672 – 0.1424 = 0,6997 tai noin 70%

ratkaisimme tämän kysymyksen aiemmin yksinkertaisesti laskemalla, kuinka moni yksilö on joko mies tai terve tai molempia. Alla oleva kuva havainnollistaa niitä arvoja, joita meidän on yhdistettävä. Meidän täytyy laskea

  • kaikki urokset
  • kaikki terveet yksilöt
  • , mutta ei laskea ketään kahdesti!!

käyttämällä tätä loogista lähestymistapaa löytäisimme

  • P (mies tai terve) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996

meillä on pieni ero vastauksissamme viimeisessä desimaalissa johtuen pyöristyksestä, joka tapahtui laskettaessa P(mies), P(terve) ja P(mies ja terve) ja sovellettaessa sitten sääntöä 5.

selvästi vastaus on käytännössä sama, noin 70%. Jos kantaisimme vastauksemme useampaan desimaaliin tai jos käyttäisimme alkuperäisiä murtolukuja, voisimme poistaa tämän pienen ristiriidan kokonaan.

katsotaan vielä yksi esimerkki kuvaamaan Todennäköisyyssääntöä 5, kun sääntöä tarvitaan – eli kun meillä ei ole todellista dataa.

esimerkki: tärkeä toimitus!

on tärkeää, että tietty asiakirja saapuu määränpäähänsä yhden päivän kuluessa. Aikatoimituksen mahdollisuuksien maksimoimiseksi asiakirjasta lähetetään kaksi kopiota käyttäen kahta palvelua, palvelua A ja palvelua B. tiedetään, että aikatoimituksen todennäköisyydet ovat:

  • 0,90 palvelulle A (P(A) = 0,90)
  • 0,80 palvelulle B (P(B) = 0,80)
  • 0.75 sillä molemmat palvelut ovat ajallaan(P(A ja B) = 0,75)
    (Huomaa, että A ja B eivät ole erillään. Ne voivat tapahtua yhdessä todennäköisyydellä 0,75.)

alla olevat Venn-diagrammit kuvaavat todennäköisyyksiä P(A), P(B) ja P(A ja B):

kolme Venn-diagrammia. Niissä kaikissa on suuri suorakulmio, joka edustaa kaikkia näyteavaruuksia S. tämän suorakulmion sisällä on kaksi ympyrää, jotka menevät osittain päällekkäin. Yksi ympyrä on merkitty A ja toinen on merkitty B. Ensimmäisessä Venn-kaaviossa ympyrän A on värillinen sininen, ja näemme, että P (A) = 0,90 . Jossain mielessä P (A) on a-ympyrän pinta-ala. Toisessa Venn-diagrammissa B: n ympyrä on värjätty siniseksi, ja merkitään, että P(B) = 0,80 . Aivan kuten ensimmäisessä Venn-kaaviossa voidaan ajatella, että B: n ympyrän pinta-ala on 0,80 . Kolmannessa Venn-kaaviossa alue, joka on ympyröiden A ja B päällekkäisyys, värjätään siniseksi. P (A ja B) = 0, 75 . Päällekkäisyyden pinta-alaksi voidaan ajatella 0,75 .

tämän ongelman yhteydessä ilmeinen kiinnostuskysymys on:

  • mikä on todennäköisyys sille, että asiakirja toimitetaan ajoissa tätä strategiaa käyttäen (lähettää se molempien palvelujen kautta)?

asiakirja saapuu määränpäähänsä ajallaan, kunhan se toimitetaan ajoissa palvelun A tai palvelun B tai molempien palvelujen kautta. Toisin sanoen, kun tapahtuma a tapahtuu tai tapahtuma B tapahtuu tai molemmat tapahtuvat. niin….

P(on time delivery using this strategy)= P(A tai B), joka on esitetty alla olevan kaavion varjostetulla alueella:

sama Venn-kaavio lukuun ottamatta kahden ympyrän aluetta on värjätty siniseksi (varjostettu). Tämä tarkoittaa, että pinta-ala päällekkäisyydessä on myös värjätty siniseksi. Huomaa, että päällekkäisyysalue on väritetty vain kerran, joten vaikka se on molemmissa ympyröissä, laskemme sen kerran.

voimme nyt

  • käyttää kolmea Venn-diagrammia, jotka esittävät P(A), P(B) ja P(A ja B)
  • nähdäksemme, että voimme löytää P(A tai b) lisäämällä P(A) (jota edustaa vasen ympyrä) ja P(B) (jota edustaa oikea ympyrä),
  • vähentämällä sitten P(A ja b) (jota edustaa päällekkäisyys), koska sisällytimme sen kahdesti, kerran osana P(A) ja kerran p(B): n osana.

Tämä näkyy seuraavassa kuvassa:

Venn - diagrammissa molempien ympyröiden pinta-ala (lasketaan päällekkäisyys kerran) lasketaan seuraavasti: A: n ympyrän pinta-ala (joka sisältää päällekkäisyyden) + B: n ympyrän pinta-ala (joka sisältää myös päällekkäisyyden) - päällekkäisyyden pinta-ala. Saamme siis: P (A tai B) = P(A) + P(B) - P(A ja B).'s circle (which includes the overlap) + the area of B's circle (which also includes the overlap) - the area of the overlap. We therefore get: P(A or B) = P(A) + P(B) - P(A and B).

Jos sovellamme tätä esimerkkiimme, huomaamme, että:

  • P (A tai B)= P (on-time delivery using this strategy)= 0.90 + 0.80 – 0.75 = 0.95.

joten strategiamme kahden jakelupalvelun käyttämisestä nostaa todennäköisyytemme ajoissa tapahtuvaan toimitukseen 0,95: een.

vaikka Venn-diagrammit olivat loistavia havainnollistamaan yleistä Yhteenlaskusääntöä, tällaisissa tapauksissa on paljon helpompaa näyttää tietoa ja työskennellä kaksisuuntaisen todennäköisyystaulukon kanssa, paljolti kun tutkimme kahden kategorisen muuttujan välistä suhdetta Eksploratiivisessa Data-analyysi-osiossa.

me vain näytämme taulukon, emme miten saamme sen, koska sinua ei pyydetä tekemään tätä puolestamme. Sinun pitäisi pystyä näkemään, että jokin logiikka ja yksinkertainen yhteen – / vähennyslasku on kaikki mitä käytimme täyttääksemme alla olevan taulukon.

taulukossa on sarakkeet "B", "ei B" ja "yhteensä."Rivit ovat "A", "ei A" ja " yhteensä."Tässä on joitakin tietoja taulukosta, järjestetty solu: solussa A, B, arvo siellä (0,75) on P(A ja B) = P(on-time toimitus molemmat palvelut). Solussa a, Ei B, arvo siellä (0,15) on P(A eikä B) = P(on-time delivery ONLY by service a). Soluissa, jotka eivät ole A ja B, arvo (0,05) on P(ei A ja B) = P(on-time delivery ONLY by service B). Solussa ei A eikä B arvo (0,05) on P(ei A eikä B) = P(ei palvelua A eikä B ajoissa)."B," "not B," and "Total." The rows are "A," "not A," and "Total." Here are is some information about the table, organized by cell: At the cell A,B, the value there (0.75) is P(A and B) = P(on-time delivery by both services). At the cell A,not B, the value there (0.15) is P(A and Not B) = P(on-time delivery ONLY by service A). At cell Not A and B, the value (0.05) is P(not A and B) = P(on-time delivery ONLY by service B). At cell Not A and Not B, the value (0.05) is P(not A and not B) = P(Neither service A nor B delivered on time).

käytettäessä kaksisuuntaista taulukkoa on muistettava katsoa koko rivi tai sarake löytääksemme kokonaistodennäköisyydet, joissa on vain A tai vain B.

  • P(A) = 0,90 tarkoittaa, että 90%: ssa palvelua a käytettäessä se toimittaa asiakirjan ajallaan. Löytää tämä katsomme kokonaistodennäköisyys rivi, joka sisältää A. vuonna löytää P (A), emme tiedä, onko B tapahtuu vai ei.

taulukon ensimmäinen rivi on korostettu. Tässä on korostetut tiedot rivillä, Sarakemuodossa: A, B: P(A ja B) = 0.75; a, Ei B: P(A eikä B) = 0.15; A, yhteensä: P(A) = 0.90 = P(A ja B) + P(A eikä B)'s first row has been highlighted. Here is the highlighted data in "Row, Column" format: A, B: P(A and B) = 0.75; A, not B: P(A and not B) = 0.15; A, Total: P(A) = 0.90 = P(A and B) + P(A and not B)

  • P (B) = 0.80 tarkoittaa, että 80%: ssa tapauksista, joissa palvelua B käytetään, se toimittaa asiakirjan ajallaan. Löytää tämä katsomme kokonaistodennäköisyys sarake sisältää B. vuonna löytää P (B), emme tiedä, onko tapahtuu vai ei.

taulukon ensimmäinen sarake on korostettu. Tässä on korostetut tiedot rivillä, sarakkeen muodossa: A, B: P(A ja B) = 0,75; ei A, B: P(ei A ja B) = 0.05; B, yhteensä: P(B) = 0,80 = P(A ja B) + P(ei A ja B)'s first column has been highlighted. Here is the highlighted data in "Row, Column" format: A,B: P(A and B) = 0.75; not A, B: P(not A and B) = 0.05; B,Total: P(B) = 0.80 = P(A and B) + P(not A and B)

kommentti

  • kun käytimme kahdensuuntaisia taulukoita Eksploratorisessa Data Analysis (EDA)-osiossa, oli tarkoitus tallentaa kahden kategorisen muuttujan arvot konkreettiselle otokselle yksilöistä.
  • sen sijaan todennäköisyystaulukon tiedot koskevat kokonaista populaatiota, ja arvot ovat melko abstrakteja.
  • Jos olisimme EDA-osiossa käsitelleet jotain toimitusesimerkin kaltaista, olisimme kirjanneet palveluun A tai b postitettujen asiakirjojen näytteiden toimitusten todelliset määrät (ja ei-on-on-time).
  • tässä osiossa pitkän aikavälin todennäköisyydet esitetään tiedossa olevina.
  • oletettavasti tässä toimitusesimerkissä ilmoitetut todennäköisyydet perustuivat useiden toistojen aikana tallennettuihin suhteellisiin frekvensseihin.

interaktiivinen sovelma: todennäköisyys Venn kaavio

todennäköisyyden nyrkkisääntö:

noudata tällä kurssilla seuraavia Yleisohjeita. Jos olet epävarma kuljettaa enemmän desimaaleja. Jos määritämme antaa mitä pyydetään.

  • yleensä välivaiheiden todennäköisyydet kannattaa pitää vähintään 4 desimaalin tarkkuudella.
  • kierrämme usein lopullisen vastauksemme kahden tai kolmen desimaalin tarkkuudella.
  • äärimmäisen pienillä todennäköisyyksillä on tärkeää olla 1 tai kaksi merkitsevää numeroa (ei-nolla numeroa), kuten 0.000001 tai 0.000034 jne.

monet tietokonepaketit saattavat näyttää äärimmäisen pieniä arvoja käyttäen tieteellistä notaatiota, kuten

  • 58×10-5 tai 1,58 E-5 edustamaan 0,0000158

Tiivistetäänpä

tähän mennessä todennäköisyystutkimuksessamme on esitelty todennäköisyyden joskus vastavaikutteinen luonne ja todennäköisyyden taustalla olevat perusteet, kuten suhteellinen frekvenssi.

annoimme myös joitakin työkaluja, joiden avulla voit löytää tapahtumien todennäköisyydet — nimittäin todennäköisyyssäännöt.

olet luultavasti huomannut, että todennäköisyysosiossa oli huomattavasti eroa kahdesta edellisestä osiosta; siinä on paljon suurempi tekninen / matemaattinen komponentti, joten tulokset ovat yleensä enemmän ”oikea tai väärä” – luonnetta.

Tutkiva Data-analyysi-osiossa tietokone hoiti suurimmaksi osaksi asioiden teknisen puolen, ja meidän tehtävämme oli käskeä sitä tekemään oikein ja sitten tulkita tuloksia.

todennäköisyydellä teemme työtä alusta loppuun, oikean työkalun (säännön) valinnasta sen oikeaan käyttöön, tulosten tulkintaan.

tässä on yhteenveto tähän mennessä esittämistämme säännöistä.

1. Todennäköisyyssäännön #1 mukaan:

  • missä tahansa tapahtumassa A, 0 ≤ P(A) ≤ 1

2. Todennäköisyyssäännön #2 mukaan:

  • kaikkien mahdollisten lopputulosten todennäköisyyksien summa on 1

3. Komplementtisäännön (#3) mukaan

  • p(not a) = 1 – P(a)

tai uudelleen järjestettynä

  • P(A) = 1 – P(not a)

Komplementtisäännön jälkimmäinen esitys on erityisen hyödyllinen, kun meidän on löydettävä todennäköisyydet tapahtumille, jotka ovat sellaisia kuin ”ainakin yksi …”

4. Yleisen Yhteenlaskusäännön (#5) mukaan mille tahansa kahdelle tapahtumalle

  • P(A tai B) = P(A) + P(B) – P(A ja B),

missä P(A tai b) tarkoittaa P(A esiintyy tai b esiintyy tai molempia).

disjoint-tapahtumien erikoistapauksessa, jotka eivät voi esiintyä yhdessä, yleinen Yhteenlaskusääntö voidaan supistaa Disjoint-tapahtumien Yhteenlaskusäännöksi (#4), joka on

  • P(A tai B) = P(A) + P(B). *

*käytä vain, jos olet vakuuttunut tapahtumien jakautumisesta (ne eivät ole päällekkäisiä)

5. Yhteenlaskusäännön rajoitettu versio (disjoint-tapahtumille) voidaan helposti laajentaa useampaan kuin kahteen tapahtumaan.

6. Tähän mennessä on löydetty vain P (A ja B) logiikkaa ja laskemista käyttäen yksinkertaisissa esimerkeissä

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *