- Introduction
- Rules of Probability
- Probability Rule One (for any event A, 0 ≤ P(A) ≤ 1)
- Probability Rule Two (The Summum of the probabilities of all possible outcomes is 1)
- Todennäköisyyssääntö kolme (the Complement Rule)
- todennäköisyydet, joihin liittyy useita tapahtumia
- Todennäköisyyssääntö neljä (Yhteenlaskusääntö Epäyhtenäisille tapahtumille)
- löytää P(A ja B) logiikan avulla
- todennäköisyyssääntö Viisi (yleinen Yhteenlaskusääntö)
- Pyöristyssääntö todennäköisyydelle
- tiivistetään
edellisessä jaksossa esitimme todennäköisyyden keinona kvantifioida epävarmuutta, joka syntyy kokeista satunnaisotannalla kiinnostavasta populaatiosta.
näimme, että tapahtuman todennäköisyys (esimerkiksi se, että satunnaisesti valitulla henkilöllä on veriryhmä O) voidaan arvioida sen suhteellisen yleisyyden perusteella, jolla tapahtuma esiintyy pitkässä koesarjassa. Keräämme siis paljon tietoa henkilöistä arvioidaksemme todennäköisyyden sille, että jollakulla on veriryhmä O.
tässä osiossa määritämme perusmenetelmät ja periaatteet tapahtumien todennäköisyyksien löytämiseksi.
käsittelemme myös joitakin todennäköisyyden perussääntöjä, joita voidaan käyttää todennäköisyyksien laskemiseen.
Johdanto
aloitamme klassisella todennäköisyysesimerkillä reilun kolikon heittämisestä kolme kertaa.
koska Kruuna ja klaava ovat tässä skenaariossa yhtä todennäköisiä jokaiselle heitolle, jokainen kolmesta heitosta johtuva mahdollisuus on myös yhtä todennäköinen, jotta voimme luetella kaikki mahdolliset arvot ja käyttää tätä luetteloa todennäköisyyksien laskemiseen.
koska keskitymme tällä kurssilla dataan ja tilastoihin (ei teoreettiseen todennäköisyyteen), käytämme useimmissa tulevissa ongelmissamme todennäköisyyksien laskemiseen tiivistettyä aineistoa, yleensä frekvenssitaulukkoa tai kaksisuuntaista taulukkoa.
esimerkki: Heitä reilu kolikko kolme kertaa
listaa jokainen mahdollinen lopputulos (tai mahdollinen tulos):
{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}
nyt määritellään seuraavat tapahtumat:
tapahtuma A: ”ei saa H: ta”
tapahtuma B: ”saa tasan yhden H: n”
tapahtuma C: ”saa ainakin yhden H: n”
huomaa, että jokainen tapahtuma on todellakin kannanotto lopputuloksesta, jonka kokeilu tulee tuottamaan. Käytännössä jokainen tapahtuma vastaa jonkinlaista kokoelmaa (osajoukkoa) mahdollisista lopputuloksista.
tapahtuma A:” Getting no h ” → TTT
tapahtuma B: ”Getting exactly one H” → HTT, THT, TTH
tapahtuma C:” Getting at least one H” → HTT, THT, TTH, THH, HTH, HHT, hhh
tässä on visuaalinen esitys tapahtumista A, B ja C.
tästä tapahtumien visuaalisesta esityksestä on helppo nähdä, että tapahtuma B sisältyy kokonaan tapahtumaan C, siinä mielessä, että jokainen tulos tapauksessa B on myös tulos tapauksessa C. huomaa myös, että tapahtuma a erottuu tapahtumista B ja C siinä mielessä, että niillä ei ole yhteistä lopputulosta tai päällekkäisyyttä. Tässä vaiheessa nämä ovat vain huomionarvoisia havaintoja, mutta kuten huomaat myöhemmin, ne ovat erittäin tärkeitä.
What if we added the new event:
Event D: ”Getting A T on the first Hess” → THH, THT, TTH, TTT
miltä näyttäisi, jos lisäämme tapahtuman D yllä olevaan kaavioon? (Linkki vastaukseen)
muista, että koska H ja T ovat yhtä todennäköisiä jokaisessa heitossa, ja koska mahdollisia lopputuloksia on 8, jokaisen tuloksen todennäköisyys on 1/8.
Katso, osaatko vastata seuraaviin kysymyksiin käyttäen kaavioita ja / tai luetteloa kunkin tapahtuman tuloksista sekä sitä, mitä olet tähän mennessä oppinut todennäköisyydestä.
Jos osasit vastata näihin kysymyksiin oikein, sinulla on todennäköisesti hyvä vaisto todennäköisyyden laskemiseen! Lue lisää, miten sovellamme tätä tietoa.
Jos ei, yritämme auttaa sinua kehittämään tätä taitoa tässä osiossa.
kommentti:
- huomaa, että tapauksessa C ”vähintään yhden pään saaminen” on vain yksi mahdollinen lopputulos, joka puuttuu, ”pään puuttuminen” = TTT. Käsittelemme tätä uudelleen, kun puhumme todennäköisyyssäännöistä, erityisesti komplementtisäännöstä. Tässä vaiheessa haluamme vain sinun ajattelevan, miten nämä kaksi tapahtumaa ovat ”vastakohtia” tässä skenaariossa.
on hyvin tärkeää ymmärtää, että vaikka voimme luetella mahdolliset lopputulokset, tämä ei tarkoita, että jokainen lopputulos olisi yhtä todennäköinen.
Tämä on (hauska) viesti Daily Show-klipissä, jonka annoimme edellisellä sivulla. Mutta Mietitäänpä vielä. Kyseisessä klipissä Walter väittää, että koska on olemassa kaksi mahdollista lopputulosta, todennäköisyys on 0,5. Kaksi mahdollista lopputulosta ovat
- maailma tuhoutuu large hadron Colliderin käytön vuoksi
- maailma ei tuhoudu large hadron Colliderin käytön vuoksi
toivottavasti on selvää, että nämä kaksi lopputulosta eivät ole yhtä todennäköisiä!!
tarkastellaan yleisempää esimerkkiä.
esimerkki: Syntymävauriot
Oletetaan, että valitsemme sattumanvaraisesti kolme lasta ja meitä kiinnostaa todennäköisyys, että yhdelläkään lapsista ei ole syntymävaurioita.
käytämme merkintää d kuvaamaan syntynyttä lasta, jolla on syntymävika, ja N edustamaan syntynyttä lasta, jolla ei ole syntymävikaa. Voimme luetella mahdollisia lopputuloksia aivan kuten kolikonheitossa, ne ovat:
{DDD, NDD, DND, DDN, DNN, NDN, NDND, NNN}
ovatko tapahtumat DDD (kaikilla kolmella lapsella on syntymävika) ja NNN (kenelläkään lapsista ei ole syntymävikaa) yhtä todennäköisiä?
sinulle pitäisi olla kohtuullista, että P(NNN) on paljon suurempi kuin P(DDD).
Tämä johtuu siitä, että P(N) ja P(D) eivät ole yhtä todennäköisiä tapahtumia.
on harvinaista (ei ainakaan 50%), että sattumanvaraisesti valittu lapsi syntyy syntymävian kanssa.
todennäköisyyden säännöt
nyt siirrytään opettelemaan joitakin todennäköisyyden perussääntöjä.
onneksi nämä säännöt ovat hyvin intuitiivisia, ja niin kauan kuin niitä sovelletaan järjestelmällisesti, ne antavat meille mahdollisuuden ratkaista monimutkaisempia ongelmia; erityisesti niitä ongelmia, joihin intuitiomme saattaa olla riittämätön.
koska suurin osa todennäköisyyksistä, joita pyydetään etsimään, voidaan laskea sekä
- logiikan ja laskemisen
että
- oppimiemme sääntöjen avulla,
annamme periaatteena seuraavan neuvon.
periaate:
jos voit laskea todennäköisyyden logiikalla ja laskemalla, et tarvitse todennäköisyyssääntöä (vaikka oikeaa sääntöä voi aina soveltaa)
Todennäköisyyssääntö yksi
ensimmäinen sääntömme muistuttaa meitä yksinkertaisesti jo oppimastamme todennäköisyyden perusominaisuudesta.
tapahtuman todennäköisyys, joka ilmoittaa meille sen toteutumisen todennäköisyyden, voi vaihdella missä tahansa välillä 0 (mikä osoittaa, että tapahtuma ei koskaan tapahdu) – 1 (mikä osoittaa, että tapahtuma on varma).
Todennäköisyyssääntö yksi:
- missä tahansa tapahtumassa A, 0 ≤ P(A) ≤ 1.
huomautus: eräs tämän säännön käytännön käyttötarkoitus on, että sen avulla voidaan tunnistaa mikä tahansa todennäköisyyslaskenta, joka osoittautuu yli 1: ksi (tai alle 0: ksi) virheelliseksi.
ennen kuin siirrytään muihin sääntöihin, katsotaan ensin esimerkki, joka antaa kontekstin useiden seuraavien sääntöjen kuvaamiseen.
esimerkki: veriryhmät
kuten aiemmin on keskusteltu, kaikki ihmisveri voidaan tyypittää O: ksi, A: ksi, B: ksi tai AB: ksi.
lisäksi näiden veriryhmien esiintymistiheys vaihtelee etnisesti ja rodullisesti.
Stanfordin yliopiston Verikeskuksen (bloodcenter.stanford.edu), nämä ovat ihmisen veriryhmien todennäköisyydet Yhdysvalloissa (tyypin A todennäköisyys on jätetty tarkoituksella pois):
motivoiva kysymys säännölle 2: henkilö valitaan Yhdysvalloissa sattumanvaraisesti. Mikä on todennäköisyys, että henkilöllä on veriryhmä A?
vastaus: Intuitiomme kertoo meille, että koska neljä veriryhmää O, A, B ja AB tyhjentävät kaikki mahdollisuudet, niiden todennäköisyyksien on oltava yhdessä 1, joka on ”tietyn” tapahtuman todennäköisyys (henkilöllä on jokin näistä 4 veriryhmästä varmasti).
koska todennäköisyydet O, B, ja AB yhdessä summa 0.44 + 0.1 + 0.04 = 0,58, tyypin A todennäköisyyden on oltava jäljellä 0.42 (1 – 0.58 = 0.42):
Todennäköisyyssääntö kaksi
Tämä esimerkki havainnollistaa toista sääntöämme, jonka mukaan kaikkien mahdollisten lopputulosten todennäköisyyden yhdessä on oltava 1.
Todennäköisyyssääntö kaksi:
kaikkien mahdollisten lopputulosten todennäköisyyksien summa on 1.
Tämä on hyvä paikka verrata ja verrata mitä teemme täällä siihen, mitä opimme Eksploratory Data Analysis (Eda) – osiossa.
- huomaa, että tässä ongelmassa keskitytään olennaisesti yhteen kategoriseen muuttujaan: veriryhmään.
- tiivistimme edellä mainitun muuttujan EDA-osion yksittäisiin kategorisiin muuttujiin luettelemalla, mitä arvoja muuttuja ottaa ja kuinka usein se ottaa niitä.
- Eda: ssa käytimme prosenttilukuja, ja tässä käytämme todennäköisyyksiä, mutta nämä kaksi välittävät samaa tietoa.
- Eda-osiossa opimme, että piirakkakaavio tarjoaa sopivan näytön, kun kyseessä on yksittäinen kategorinen muuttuja, ja vastaavasti Voimme käyttää sitä tässä (käyttäen prosenttilukuja todennäköisyyksien sijaan):
vaikka se, mitä teemme täällä, on todellakin samanlaista kuin mitä olemme tehneet EDA-osiossa, on hienovarainen mutta merkittävä ero taustalla olevien tilanteiden välillä
- Eda: ssa, tiivistimme tiedot, jotka saatiin näytteestä henkilöistä, joille merkittiin kiinnostavan muuttujan arvot.
- tässä, kun esitämme kunkin veriryhmän todennäköisyyden, mielessämme on koko Yhdysvaltojen väestö, jolle oletamme tietävämme kiinnostavan muuttujan ottamien arvojen yleisyyden.
Todennäköisyyssääntö kolme
todennäköisyydessä ja sen sovellutuksissa meitä kiinnostaa usein selvittää todennäköisyys sille, että jokin tapahtuma ei toteudu.
tärkeä asia tässä on ymmärtää, että ”tapahtuma A ei esiinny” on erillinen tapahtuma, joka koostuu kaikista mahdollisista lopputuloksista, jotka eivät ole A: ssa ja jota kutsutaan ”A: n komplementtitapahtumaksi”.
notaatio: kirjoitamme ”Ei a” merkitsemään tapahtumaa, jota a ei esiinny. Tässä on visuaalinen esitys siitä, miten tapahtuma A ja sen täydennystapahtuma ”Ei A” yhdessä edustavat kaikkia mahdollisia lopputuloksia.
kommentti:
- tällaista visuaalista näyttöä kutsutaan ”Venn-diagrammiksi.”Venn-Diagrammi on yksinkertainen tapa visualisoida tapahtumia ja niiden välisiä suhteita suorakulmioiden ja ympyröiden avulla.
Sääntö 3 käsittelee tapahtuman todennäköisyyden ja sen komplementtitapahtuman todennäköisyyden suhdetta.
ottaen huomioon, että tapahtuma A ja tapahtuma ”ei a” muodostavat yhdessä kaikki mahdolliset lopputulokset, ja koska sääntö 2 kertoo, että kaikkien mahdollisten tulosten todennäköisyyksien summa on 1, seuraavan säännön tulisi olla varsin intuitiivinen:
Todennäköisyyssääntö kolme (Komplementtisääntö):
- P(ei a) = 1 – P(A)
- eli todennäköisyys, että tapahtuma ei tapahdu on 1 miinus todennäköisyys, että se tapahtuu.
esimerkki: verityypit
Back to the blood type example:
Tässä muutamia lisätietoja:
- A-tyypin henkilö voi luovuttaa verta A-tai ab-tyypin henkilölle.
- B-tyyppiä sairastava voi luovuttaa verta B-tai AB-tyyppiä sairastavalle.
- AB-tyyppiä sairastava henkilö voi luovuttaa verta vain AB-tyyppiä sairastavalle.
- henkilö, jolla on O-tyypin verta, voi luovuttaa kenelle tahansa.
mikä on todennäköisyys sille, että satunnaisesti valittu henkilö ei voi luovuttaa verta kaikille? Toisin sanoen, mikä on todennäköisyys, että satunnaisesti valitulla henkilöllä ei ole veriryhmää O? Meidän on löydettävä P(Ei O). Komplementtisäännön mukaan P(Ei O) = 1 – P(O) = 1 – 0, 44 = 0, 56. Toisin sanoen 56 prosentilla Yhdysvaltain väestöstä ei ole verityyppiä O:
selvästi myös P(ei o) voitaisiin löytää suoraan lisäämällä B: n, AB: n ja A: n todennäköisyydet.
kommentti:
- huomaa, että Komplementtisääntö, P(ei a) = 1 – P(A) voidaan muotoilla uudelleen muotoon P(A) = 1-P(Ei a).
- P(not a) = 1 – P(a)
- voidaan muotoilla uudelleen muotoon P(A) = 1-P (not a).
- tällä näennäisen triviaalilla algebrallisella manipuloinnilla on tärkeä sovellus, ja se itse asiassa kaappaa komplementtisäännön vahvuuden.
- joissakin tapauksissa, kun P(A): n löytäminen suoraan on hyvin monimutkaista, saattaa olla paljon helpompaa löytää P(ei A) ja sitten vain vähentää se 1: stä, jotta saadaan haluttu P(A).
- palaamme tähän kommenttiin pian ja annamme lisää esimerkkejä.
- komplementtisääntö voi olla hyödyllinen aina, kun on helpompi laskea komplementin todennäköisyys kuin itse tapahtuma.
- huomaa, että käytimme jälleen lausetta ”ainakin yksi.”
- nyt on huomattu, että komplementti ”ainakin yksi … ”on” ei yhtään … ” tai ” ei ….”(kuten aiemmin mainittiin tapahtumien olevan”vastakohtia”).
- edellä mainitusta aktiivisuudesta näemme, että
- P(mikään näistä kahdesta haittavaikutuksesta) = 1 – P(ainakin toinen näistä haittavaikutuksista)
- tämä on yleinen komplementtisäännön soveltaminen, jonka usein tunnistaa lauseesta ”ainakin yksi” ongelmassa.
todennäköisyydet, joihin liittyy useita tapahtumia
meitä kiinnostaa usein löytää todennäköisyyksiä, joihin liittyy useita tapahtumia, kuten
- P(A tai b) = P(tapahtuma a tapahtuu tai b tapahtuu tai molemmat tapahtuvat)
- p(sekä tapahtuma a tapahtuu että B tapahtuu)
yleinen terminologian ongelma liittyy siihen, miten yleensä ajattelemme ”tai” jokapäiväisessä elämässämme. Esimerkiksi, kun vanhempi sanoo lapselleen lelukaupassa ”Haluatko toy A: n vai toy B: n?”, tämä tarkoittaa, että lapsi saa vain yhden lelun ja hänen on valittava niiden välillä. Molempien lelujen hankkiminen ei yleensä ole vaihtoehto.
sen sijaan:
todennäköisyydellä ”tai” tarkoittaa jompaakumpaa tai molempia.
ja niin P(A tai b) = P(tapahtuma a esiintyy tai tapahtuma B esiintyy tai molemmat esiintyvät)
tämän sanottuaan on huomattava, että on olemassa tapauksia, joissa on yksinkertaisesti mahdotonta, että molemmat tapahtumat sattuisivat samaan aikaan.
Todennäköisyyssääntö neljä
ero niiden tapahtumien välillä, jotka voivat tapahtua yhdessä ja niiden, jotka eivät voi, on tärkeä.
Disjoint: Kahta tapahtumaa, jotka eivät voi tapahtua samanaikaisesti, kutsutaan disjointiksi tai toisensa poissulkeviksi. (Käytämme disjoint.)
kuvasta pitäisi olla selvää, että
- ensimmäisessä tapauksessa, jossa tapahtumat eivät ole disjoint, P(A ja B) ≠ 0
- toisessa tapauksessa, jossa tapahtumat ovat disjoint, P(A ja B) = 0.
tässä on kaksi esimerkkiä:
esimerkki:
harkitse seuraavia kahta tapahtumaa:
a — satunnaisesti valitulla henkilöllä on veriryhmä A, ja
b — satunnaisesti valitulla henkilöllä on veriryhmä B.
harvoissa tapauksissa henkilön suonissa voi virrata useampaa kuin yhtä verityyppiä, mutta meidän tarkoituksemme on olettaa, että jokaisella henkilöllä voi olla vain yksi veriryhmä. Siksi on mahdotonta, että tapahtumat A ja B sattuisivat yhdessä.
- tapahtumat A ja B ovat hajanaisia
toisaalta …
esimerkki:
harkitse seuraavia kahta tapahtumaa:
a — satunnaisesti valitulla henkilöllä on veriryhmä A
B — satunnaisesti valittu henkilö on nainen.
tällöin on mahdollista, että tapahtumat A ja B esiintyvät yhdessä.
- tapahtumat A ja B eivät ole erillisiä.
Venn-diagrammit viittaavat siihen, että toinen tapa ajatella disjoint vs. ei disjoint-tapahtumia on, että disjoint-tapahtumat eivät ole päällekkäisiä. Ne eivät jaa mitään mahdollisista tuloksista, eivätkä siksi voi tapahtua yhdessä.
toisaalta tapahtumat, jotka eivät ole irrallisia, ovat päällekkäisiä siinä mielessä, että ne jakavat osan mahdollisista lopputuloksista ja voivat siksi esiintyä samanaikaisesti.
nyt aloitetaan yksinkertaisella säännöllä, jolla voidaan löytää P(A tai B) epäyhtenäisille tapahtumille.
Todennäköisyyssääntö neljä (Yhteenlaskusääntö Epäyhtenäisille tapahtumille):
- Jos A ja B ovat epäyhtenäisiä tapahtumia, niin P(A tai B) = P(A) + P(B).
kommentti:
- todennäköisyyksiä käsiteltäessä sana” tai ” liitetään aina yhteenlaskun operaatioon; tästä johtuu tämän säännön nimi, ” Yhteenlaskusääntö.”
EXAMPLE: Blood Types
Recall the blood type example:
tässä on joitakin lisätietoja
- henkilö, jolla on tyyppi Acan, luovuttaa verta henkilölle, jolla on tyyppi A tai ab.
- bcan-tyyppiä sairastava henkilö luovuttaa verta B-tai AB-tyyppiä sairastavalle henkilölle.
- abcan-tyyppinen henkilö luovuttaa verta AB
- – tyyppinen henkilö voi luovuttaa verta kenelle tahansa.
mikä on todennäköisyys sille, että sattumanvaraisesti valittu henkilö on mahdollinen veriryhmän A luovuttaja?
annettujen tietojen perusteella tiedämme, että mahdollinen luovuttaja veriryhmään a kuuluvalle henkilölle tarkoittaa sitä, että hänellä on veriryhmä A tai O.
siksi meidän on löydettävä P(A tai O). Koska tapahtumat A ja O ovat disjoint, voidaan disjoint-tapahtumien yhteenlaskusäännön avulla saada:
- P(A tai O) = P(A) + P(O) = 0, 42 + 0, 44 = 0, 86.
on helppo ymmärtää, miksi todennäköisyyden lisääminen on oikeastaan järkevää.
Jos 42% väestöstä on veriryhmä A ja 44% väestöstä on veriryhmä O,
- niin 42% + 44% = 86% väestöstä on joko veriryhmä A tai O, ja näin ollen he ovat mahdollisia luovuttajia henkilölle, jolla on veriryhmä A.
tämä päättely siitä, miksi yhteenlaskusääntö on järkevä, voidaan havainnollistaa alla olevan piirakankaavion avulla:
kommentti:
- disjoint-tapahtumien Yhteenlaskusääntö voidaan luonnollisesti laajentaa koskemaan useampaa kuin kahta disjoint-tapahtumaa. Otetaan esimerkiksi kolme. Jos A, B ja C ovat kolme disjoint-tapahtumaa
sitten P(A tai b tai C) = P(A) + P(B) + P(C). Sääntö on sama kaikille disjoint-tapahtumille.
olemme nyt lopettaneet Yhteenlaskusäännön ensimmäisen version (sääntö neljä), joka on disjoint-tapahtumiin rajoitettu versio. Ennen kuin käsittelemme toista versiota, meidän on ensin keskusteltava P (A ja B).
p: n(A ja B) löytäminen logiikan avulla
siirrymme nyt laskemaan
- P(A ja B)= P(sekä tapahtuma A että tapahtuma B)
myöhemmin käsitellään P: N(A ja B) laskemisen sääntöjä.
Ensinnäkin haluamme havainnollistaa, että sääntöä ei tarvita aina, kun vastauksen voi määrittää logiikan ja laskennan avulla.
erikoistapaus:
on yksi erikoistapaus, jolle tiedämme, mitä P(A ja B) on yhtä kuin soveltamatta mitään sääntöä.
joten, jos tapahtumat A ja B ovat hajanaisia, niin(määritelmän mukaan) P (A ja B)= 0. Mutta entä jos tapahtumat eivät ole hajanaisia?
muista, että säännöstä 4, Yhteenlaskusäännöstä, on kaksi versiota. Yksi on rajoitettu erillisiin tapahtumiin, jotka olemme jo käsitelleet, ja käsittelemme yleisempää versiota myöhemmin tässä moduulissa. Sama pätee todennäköisyyksiin, joihin ja
kuitenkin, poikkeustapauksia lukuun ottamatta, luotamme logiikkaan löytääksemme P (A ja B) tässä kurssissa.
ennen kuin käsitellään mitään muodollisia sääntöjä, katsotaan esimerkki, jossa tapahtumat eivät ole hajanaisia.
esimerkki: parodontiitin Status ja sukupuoli
tarkastellaan seuraavaa taulukkoa koskien yksilöiden parodontiitin asemaa ja heidän sukupuoltaan. Parodontiitin tila viittaa iensairaus, jossa yksilöt luokitellaan joko terve, on ientulehdus,tai on parodontiitin.
olemme nähneet tämän tyyppisen taulukon aiemminkin, kun keskustelimme tietojen analysoinnista tapauksessa C → C. Tätä kysymystä varten käytämme näitä tietoja ”populaationamme” ja harkitsemme satunnaisesti yhden henkilön valitsemista.
haluamme esittää edellisen esimerkin kaltaisia todennäköisyyskysymyksiä (käyttäen aineistoon perustuvaa kaksisuuntaista taulukkoa), koska näin voit tehdä yhteydet näiden aiheiden välillä ja auttaa pitämään osan siitä, mitä olet oppinut datasta tuoreena mielessäsi.
Todennäköisyyssääntö viisi
olemme nyt valmiita siirtymään Yhteenlaskusäännön laajennettuun versioon.
tässä osiossa opitaan löytämään P(A tai B), Kun A ja B eivät välttämättä ole erillään toisistaan.
- kutsumme tätä laajennettua versiota ”yleiseksi Yhteenlaskusäännöksi” ja toteamme sen Todennäköisyyssäännöksi viisi.
aloitamme toteamalla säännön ja antamalla esimerkin, joka on samantyyppinen kuin ne ongelmat, joita yleensä kysymme tällä kurssilla. Sitten esittelemme enemmän toinen esimerkki, jossa meillä ei ole raakadataa otoksesta työskennellä.
Todennäköisyyssääntö viisi:
- yleinen Yhteenlaskusääntö: P(A tai B) = P(A) + P(B) – P(A ja b).
huomautus: on parasta käyttää logiikkaa P(A ja B) löytämiseen, ei toiseen kaavaan.
hyvin yleinen virhe on kertolaskusäännön virheellinen soveltaminen seuraavalla sivulla käsiteltyihin itsenäisiin tapahtumiin. Tämä pitää paikkansa vain, jos A ja B ovat riippumattomia (KS.seuraavat määritelmät), mikä on harvinaista kaksisuuntaisissa taulukoissa esitetyissä tiedoissa.
kuten aiemmissa esimerkeissä nähtiin, kun nämä kaksi tapahtumaa eivät ole irrallisia, on tapahtumien välillä jonkin verran päällekkäisyyttä.
- Jos yksinkertaisesti laskemme kaksi todennäköisyyttä yhteen, saamme väärän vastauksen, koska olemme laskeneet jonkin ”todennäköisyyden” kahdesti!
- näin ollen meidän on vähennettävä tästä ”ylimääräisestä” todennäköisyydestä saadaksemme oikean vastauksen. Venn-Diagrammi ja kaksisuuntaiset taulukot auttavat tämän idean visualisoinnissa.
tämä sääntö on yleisempi, koska se toimii mille tahansa tapahtumaparille (jopa erillisille tapahtumille). Meidän neuvomme on edelleen yrittää vastata kysymykseen käyttäen logiikkaa ja laskenta aina kun mahdollista, muuten meidän on oltava erittäin varovainen valita oikea sääntö ongelmaan.
periaate:
jos voit laskea todennäköisyyden logiikalla ja laskemalla, et tarvitse todennäköisyyssääntöä (vaikka oikeaa sääntöä voidaan aina soveltaa)
huomaa, että jos A ja B ovat disjoint, niin P(A ja B) = 0 ja sääntö 5 pienenee säännöksi 4 Tässä erikoistapauksessa.
palataan viimeiseen esimerkkiin:
esimerkki: Parodontaalitilanne ja sukupuoli
harkitse satunnaisesti yhden yksilön valitsemista seuraavassa taulukossa esitetyistä yksilöiden parodontaalitilasta ja heidän sukupuolestaan. Parodontiitin tila viittaa iensairaus, jossa yksilöt luokitellaan joko terve, on ientulehdus,tai on parodontiitin.
Kerrataanpa, mitä olemme tähän mennessä oppineet. Voimme laskea minkä tahansa todennäköisyyden tässä skenaariossa, jos voimme määrittää, kuinka monta henkilöä täyttää tapahtuman tai tapahtumien yhdistelmän.
- P (mies) = 3009/8027 = 0, 3749
- P (nainen) = 5018/8027 = 0, 6251
- P (terve) = 3750/8027 = 0, 4672
- P (ei terve) = P (ientulehdus tai Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
voisimme myös laskea tämän komplementtisäännön avulla: 1-P(terve)
myös aiemmin todettiin, että
- P(mies ja terve) = 1143/8027 = 0.1424
Takaisinkutsusääntö 5, P(A tai B) = P(A) + P(B) – P(A ja b). Tällä säännöllä lasketaan nyt P(mies tai terve)
- P(mies tai terve) = P(mies) + P(terve) – P (mies ja terve) = 0.3749 + 0.4672 – 0.1424 = 0,6997 tai noin 70%
ratkaisimme tämän kysymyksen aiemmin yksinkertaisesti laskemalla, kuinka moni yksilö on joko mies tai terve tai molempia. Alla oleva kuva havainnollistaa niitä arvoja, joita meidän on yhdistettävä. Meidän täytyy laskea
- kaikki urokset
- kaikki terveet yksilöt
- , mutta ei laskea ketään kahdesti!!
käyttämällä tätä loogista lähestymistapaa löytäisimme
- P (mies tai terve) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996
meillä on pieni ero vastauksissamme viimeisessä desimaalissa johtuen pyöristyksestä, joka tapahtui laskettaessa P(mies), P(terve) ja P(mies ja terve) ja sovellettaessa sitten sääntöä 5.
selvästi vastaus on käytännössä sama, noin 70%. Jos kantaisimme vastauksemme useampaan desimaaliin tai jos käyttäisimme alkuperäisiä murtolukuja, voisimme poistaa tämän pienen ristiriidan kokonaan.
katsotaan vielä yksi esimerkki kuvaamaan Todennäköisyyssääntöä 5, kun sääntöä tarvitaan – eli kun meillä ei ole todellista dataa.
esimerkki: tärkeä toimitus!
on tärkeää, että tietty asiakirja saapuu määränpäähänsä yhden päivän kuluessa. Aikatoimituksen mahdollisuuksien maksimoimiseksi asiakirjasta lähetetään kaksi kopiota käyttäen kahta palvelua, palvelua A ja palvelua B. tiedetään, että aikatoimituksen todennäköisyydet ovat:
- 0,90 palvelulle A (P(A) = 0,90)
- 0,80 palvelulle B (P(B) = 0,80)
- 0.75 sillä molemmat palvelut ovat ajallaan(P(A ja B) = 0,75)
(Huomaa, että A ja B eivät ole erillään. Ne voivat tapahtua yhdessä todennäköisyydellä 0,75.)
alla olevat Venn-diagrammit kuvaavat todennäköisyyksiä P(A), P(B) ja P(A ja B):
tämän ongelman yhteydessä ilmeinen kiinnostuskysymys on:
- mikä on todennäköisyys sille, että asiakirja toimitetaan ajoissa tätä strategiaa käyttäen (lähettää se molempien palvelujen kautta)?
asiakirja saapuu määränpäähänsä ajallaan, kunhan se toimitetaan ajoissa palvelun A tai palvelun B tai molempien palvelujen kautta. Toisin sanoen, kun tapahtuma a tapahtuu tai tapahtuma B tapahtuu tai molemmat tapahtuvat. niin….
P(on time delivery using this strategy)= P(A tai B), joka on esitetty alla olevan kaavion varjostetulla alueella:
voimme nyt
- käyttää kolmea Venn-diagrammia, jotka esittävät P(A), P(B) ja P(A ja B)
- nähdäksemme, että voimme löytää P(A tai b) lisäämällä P(A) (jota edustaa vasen ympyrä) ja P(B) (jota edustaa oikea ympyrä),
- vähentämällä sitten P(A ja b) (jota edustaa päällekkäisyys), koska sisällytimme sen kahdesti, kerran osana P(A) ja kerran p(B): n osana.
Tämä näkyy seuraavassa kuvassa:
Jos sovellamme tätä esimerkkiimme, huomaamme, että:
- P (A tai B)= P (on-time delivery using this strategy)= 0.90 + 0.80 – 0.75 = 0.95.
joten strategiamme kahden jakelupalvelun käyttämisestä nostaa todennäköisyytemme ajoissa tapahtuvaan toimitukseen 0,95: een.
vaikka Venn-diagrammit olivat loistavia havainnollistamaan yleistä Yhteenlaskusääntöä, tällaisissa tapauksissa on paljon helpompaa näyttää tietoa ja työskennellä kaksisuuntaisen todennäköisyystaulukon kanssa, paljolti kun tutkimme kahden kategorisen muuttujan välistä suhdetta Eksploratiivisessa Data-analyysi-osiossa.
me vain näytämme taulukon, emme miten saamme sen, koska sinua ei pyydetä tekemään tätä puolestamme. Sinun pitäisi pystyä näkemään, että jokin logiikka ja yksinkertainen yhteen – / vähennyslasku on kaikki mitä käytimme täyttääksemme alla olevan taulukon.
käytettäessä kaksisuuntaista taulukkoa on muistettava katsoa koko rivi tai sarake löytääksemme kokonaistodennäköisyydet, joissa on vain A tai vain B.
- P(A) = 0,90 tarkoittaa, että 90%: ssa palvelua a käytettäessä se toimittaa asiakirjan ajallaan. Löytää tämä katsomme kokonaistodennäköisyys rivi, joka sisältää A. vuonna löytää P (A), emme tiedä, onko B tapahtuu vai ei.
- P (B) = 0.80 tarkoittaa, että 80%: ssa tapauksista, joissa palvelua B käytetään, se toimittaa asiakirjan ajallaan. Löytää tämä katsomme kokonaistodennäköisyys sarake sisältää B. vuonna löytää P (B), emme tiedä, onko tapahtuu vai ei.
kommentti
- kun käytimme kahdensuuntaisia taulukoita Eksploratorisessa Data Analysis (EDA)-osiossa, oli tarkoitus tallentaa kahden kategorisen muuttujan arvot konkreettiselle otokselle yksilöistä.
- sen sijaan todennäköisyystaulukon tiedot koskevat kokonaista populaatiota, ja arvot ovat melko abstrakteja.
- Jos olisimme EDA-osiossa käsitelleet jotain toimitusesimerkin kaltaista, olisimme kirjanneet palveluun A tai b postitettujen asiakirjojen näytteiden toimitusten todelliset määrät (ja ei-on-on-time).
- tässä osiossa pitkän aikavälin todennäköisyydet esitetään tiedossa olevina.
- oletettavasti tässä toimitusesimerkissä ilmoitetut todennäköisyydet perustuivat useiden toistojen aikana tallennettuihin suhteellisiin frekvensseihin.
todennäköisyyden nyrkkisääntö:
noudata tällä kurssilla seuraavia Yleisohjeita. Jos olet epävarma kuljettaa enemmän desimaaleja. Jos määritämme antaa mitä pyydetään.
- yleensä välivaiheiden todennäköisyydet kannattaa pitää vähintään 4 desimaalin tarkkuudella.
- kierrämme usein lopullisen vastauksemme kahden tai kolmen desimaalin tarkkuudella.
- äärimmäisen pienillä todennäköisyyksillä on tärkeää olla 1 tai kaksi merkitsevää numeroa (ei-nolla numeroa), kuten 0.000001 tai 0.000034 jne.
monet tietokonepaketit saattavat näyttää äärimmäisen pieniä arvoja käyttäen tieteellistä notaatiota, kuten
- 58×10-5 tai 1,58 E-5 edustamaan 0,0000158
Tiivistetäänpä
tähän mennessä todennäköisyystutkimuksessamme on esitelty todennäköisyyden joskus vastavaikutteinen luonne ja todennäköisyyden taustalla olevat perusteet, kuten suhteellinen frekvenssi.
annoimme myös joitakin työkaluja, joiden avulla voit löytää tapahtumien todennäköisyydet — nimittäin todennäköisyyssäännöt.
olet luultavasti huomannut, että todennäköisyysosiossa oli huomattavasti eroa kahdesta edellisestä osiosta; siinä on paljon suurempi tekninen / matemaattinen komponentti, joten tulokset ovat yleensä enemmän ”oikea tai väärä” – luonnetta.
Tutkiva Data-analyysi-osiossa tietokone hoiti suurimmaksi osaksi asioiden teknisen puolen, ja meidän tehtävämme oli käskeä sitä tekemään oikein ja sitten tulkita tuloksia.
todennäköisyydellä teemme työtä alusta loppuun, oikean työkalun (säännön) valinnasta sen oikeaan käyttöön, tulosten tulkintaan.
tässä on yhteenveto tähän mennessä esittämistämme säännöistä.
1. Todennäköisyyssäännön #1 mukaan:
- missä tahansa tapahtumassa A, 0 ≤ P(A) ≤ 1
2. Todennäköisyyssäännön #2 mukaan:
- kaikkien mahdollisten lopputulosten todennäköisyyksien summa on 1
3. Komplementtisäännön (#3) mukaan
- p(not a) = 1 – P(a)
tai uudelleen järjestettynä
- P(A) = 1 – P(not a)
Komplementtisäännön jälkimmäinen esitys on erityisen hyödyllinen, kun meidän on löydettävä todennäköisyydet tapahtumille, jotka ovat sellaisia kuin ”ainakin yksi …”
4. Yleisen Yhteenlaskusäännön (#5) mukaan mille tahansa kahdelle tapahtumalle
- P(A tai B) = P(A) + P(B) – P(A ja B),
missä P(A tai b) tarkoittaa P(A esiintyy tai b esiintyy tai molempia).
disjoint-tapahtumien erikoistapauksessa, jotka eivät voi esiintyä yhdessä, yleinen Yhteenlaskusääntö voidaan supistaa Disjoint-tapahtumien Yhteenlaskusäännöksi (#4), joka on
- P(A tai B) = P(A) + P(B). *
*käytä vain, jos olet vakuuttunut tapahtumien jakautumisesta (ne eivät ole päällekkäisiä)
5. Yhteenlaskusäännön rajoitettu versio (disjoint-tapahtumille) voidaan helposti laajentaa useampaan kuin kahteen tapahtumaan.
6. Tähän mennessä on löydetty vain P (A ja B) logiikkaa ja laskemista käyttäen yksinkertaisissa esimerkeissä