reguli de probabilitate de bază

  • Introducere
  • reguli de probabilitate
    • regula de probabilitate unu (pentru orice eveniment a, 0 la sută P(A) la sută 1)
    • regula de probabilitate doi (suma probabilităților tuturor rezultatelor posibile este 1)
    • regula de probabilitate trei (regula complementului)
    • Li>
    • regula de probabilitate patru (regula plus pentru evenimente disjuncte)
    • găsirea P(A și B) folosind logica
    • regula de probabilitate Cinci (regula generală de adăugare)
  • regula de rotunjire pentru probabilitate
  • să rezumăm
CO-6: Aplicați conceptele de bază ale probabilității, variației aleatorii și distribuțiilor statistice de probabilitate utilizate în mod obișnuit.
LO 6.4: corelați probabilitatea unui eveniment cu probabilitatea apariției acestui eveniment.
LO 6.5: aplicați abordarea frecvenței relative pentru a estima probabilitatea unui eveniment.
LO 6.6: Aplicați logica de bază și regulile de probabilitate pentru a găsi probabilitatea empirică a unui eveniment.
Video: reguli de probabilitate de bază (25:17)

în secțiunea anterioară, am introdus probabilitatea ca o modalitate de a cuantifica incertitudinea care apare din efectuarea experimentelor folosind un eșantion aleatoriu din populația de interes.

am văzut că probabilitatea unui eveniment (de exemplu, evenimentul în care o persoană aleasă aleatoriu are tipul de sânge O) poate fi estimată prin frecvența relativă cu care evenimentul are loc într-o serie lungă de studii. Deci, am colecta date de la o mulțime de indivizi pentru a estima probabilitatea ca cineva să aibă grupa sanguină O.

în această secțiune, vom stabili metodele și principiile de bază pentru găsirea probabilităților evenimentelor.

vom acoperi, de asemenea, unele dintre regulile de bază ale probabilității care pot fi utilizate pentru a calcula probabilitățile.

Introducere

vom începe cu un exemplu clasic de probabilitate de aruncare a unei monede corecte de trei ori.

deoarece capetele și cozile sunt la fel de probabile pentru fiecare aruncare din acest scenariu, fiecare dintre posibilitățile care pot rezulta din trei aruncări va fi, de asemenea, la fel de probabilă, astfel încât să putem enumera toate valorile posibile și să folosim această listă pentru a calcula probabilitățile.deoarece accentul nostru în acest curs este pe date și statistici (nu probabilitatea teoretică), în majoritatea problemelor noastre viitoare vom folosi un set de date rezumat, de obicei un tabel de frecvență sau un tabel bidirecțional, pentru a calcula probabilitățile.

exemplu: Aruncați o monedă corectă de trei ori

să enumerăm fiecare rezultat posibil (sau rezultat posibil):

{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}

acum să definim următoarele evenimente:

evenimentul a: „nu obține H”

evenimentul B: „obține exact un H”

evenimentul c: „obține cel puțin un H”

rețineți că fiecare eveniment este într-adevăr o declarație despre rezultatul pe care experimentul îl va produce. În practică, fiecare eveniment corespunde unei anumite colecții (subset) a rezultatelor posibile.

evenimentul a:” no Getting H ” TTT

evenimentul B: „Noțiuni de bază exact un H „htt, THT, TTH

eveniment c:” Noțiuni de bază cel puțin un H”htt, THT, TTH, THH, HTH, HHT, HHH

aici este o reprezentare vizuală a evenimentelor A, B și C.

avem un dreptunghi mare etichetat" S " care reprezintă întregul spațiu al eșantionului. În interiorul acestui dreptunghi avem un cerc etichetat " C. " totul în afara "C se întâmplă să coincidă cu evenimentul a care conține doar"TTT". În interiorul lui C, vedem "HHH", "THH", "HTH", "HHT" și un cerc reprezentând evenimentul B. În interiorul B sunt "HHT", "THT" și "TTH."Rețineți că toate elementele din interiorul B sunt, de asemenea, în interiorul C, astfel încât C cuprinde complet B."S" which represents the entirety of the sample space. Inside this rectangle we have a circle labeled "C." Everything outside of "C happens to coincied with event A containing only "TTT". Inside of C, we see "HHH," "THH," "HTH," "HHT," and a circle representing event B. Inside B are "HHT," "THT," and "TTH." Note that all of the items inside B are also inside C, so C fully encloses B.

Din această reprezentare vizuală a evenimentelor, este ușor de văzut că evenimentul B este total inclus în evenimentul C, în sensul că fiecare rezultat din evenimentul B este, de asemenea, un rezultat în evenimentul C. De asemenea, rețineți că evenimentul a se deosebește de evenimentele B și C, în sensul că nu au niciun rezultat în comun sau nu se suprapun. În acest moment, acestea sunt doar observații demne de remarcat, dar după cum veți descoperi mai târziu, acestea sunt foarte importante.

Ce se întâmplă dacă am adăugat noul eveniment:

evenimentul D: „Noțiuni de bază un T la prima aruncare” THH, tht, TTH, TTT

cum ar arăta dacă am adăugat eveniment D la diagrama de mai sus? (Link către răspuns)

amintiți-vă, deoarece H și T sunt la fel de probabile la fiecare aruncare și, deoarece există 8 rezultate posibile, probabilitatea fiecărui rezultat este de 1/8.

vedeți dacă puteți răspunde la următoarele întrebări folosind diagramele și / sau lista de rezultate pentru fiecare eveniment împreună cu ceea ce ați învățat până acum despre probabilitate.

învață făcând: Aruncarea unei monede corecte de trei ori

dacă ați reușit să răspundeți corect la aceste întrebări, probabil că aveți un instinct bun pentru calcularea probabilității! Citiți mai departe pentru a afla cum vom aplica aceste cunoștințe.

dacă nu, vom încerca să vă ajutăm să dezvoltați această abilitate în această secțiune.

comentariu:

  • rețineți că în cazul C, „obținerea a cel puțin unui cap” lipsește un singur rezultat posibil, „obținerea fără capete” = TTT. Vom aborda acest lucru din nou atunci când vorbim despre regulile de probabilitate, în special regula complementului. În acest moment, vrem doar să vă gândiți la modul în care aceste două evenimente sunt „opuse” în acest scenariu.

este foarte important să ne dăm seama că doar pentru că putem enumera rezultatele posibile, acest lucru nu implică faptul că fiecare rezultat este la fel de probabil.

acesta este mesajul (amuzant) din clipul Daily Show pe care l-am furnizat pe pagina anterioară. Dar să ne gândim din nou la asta. În acel clip, Walter susține că, deoarece există două rezultate posibile, probabilitatea este de 0,5. Cele două rezultate posibile sunt

  • lumea va fi distrusă datorită utilizării Large Hadron collider
  • lumea nu va fi distrusă datorită utilizării Large Hadron collider

sperăm că este clar că aceste două rezultate nu sunt la fel de probabile!!

să luăm în considerare un exemplu mai comun.

exemplu: defecte congenitale

Să presupunem că selectăm aleatoriu trei copii și suntem interesați de probabilitatea ca niciunul dintre copii să nu aibă defecte congenitale.

folosim notația D pentru a reprezenta un copil născut cu un defect din naștere și N pentru a reprezenta copilul născut fără defect din naștere. Putem enumera rezultatele posibile la fel cum am făcut pentru aruncarea monedei, acestea sunt:

{DDD, NDD, DND, DDN, DNN, NDN, NND, nnn}

evenimentele DDD (toți cei trei copii se nasc cu defecte din naștere) și NNN (niciunul dintre copii nu se nasc cu defecte din naștere) sunt la fel de probabile?

ar trebui să fie rezonabil pentru tine că P(NNN) este mult mai mare decât P(DDD).

acest lucru se datorează faptului că P(N) și P(D) nu sunt evenimente la fel de probabile.

este rar (cu siguranță nu 50%) ca un copil selectat aleatoriu să se nască cu un defect din naștere.

reguli de probabilitate

acum trecem la învățarea unora dintre regulile de bază ale probabilității.din fericire, aceste reguli sunt foarte intuitive și, atâta timp cât sunt aplicate sistematic, ne vor permite să rezolvăm probleme mai complicate; în special, acele probleme pentru care intuiția noastră ar putea fi inadecvată.

deoarece majoritatea probabilităților pe care vi se va cere să le găsiți pot fi calculate folosind atât

  • logică și numărare

și

  • Regulile pe care le vom învăța,

oferim următoarele sfaturi ca principiu.

principiu:

dacă puteți calcula o probabilitate folosind logica și numărarea, nu aveți nevoie de o regulă de probabilitate (deși regula corectă poate fi întotdeauna aplicată)

regula de probabilitate unu

prima noastră regulă ne amintește pur și simplu de proprietatea de bază a probabilității pe care am învățat-o deja.

probabilitatea unui eveniment, care ne informează despre probabilitatea apariției acestuia, poate varia de la 0 (indicând faptul că evenimentul nu va avea loc niciodată) la 1 (indicând faptul că evenimentul este sigur).

regula de probabilitate unu:

  • pentru orice eveniment a, 0 Int.

notă: o utilizare practică a acestei reguli este că poate fi utilizată pentru a identifica orice calcul de probabilitate care se dovedește a fi mai mare de 1 (sau mai mic de 0) ca fiind incorect.

înainte de a trece la celelalte reguli, Să analizăm mai întâi un exemplu care va oferi un context pentru ilustrarea următoarelor câteva reguli.

exemplu: tipuri de sânge

după cum sa discutat anterior, tot sângele uman poate fi tastat ca O, A, B sau AB.în plus, frecvența apariției acestor tipuri de sânge variază în funcție de grupurile etnice și rasiale.

potrivit Centrului de sânge al Universității Stanford (bloodcenter.stanford.edu), acestea sunt probabilitățile tipurilor de sânge uman din Statele Unite (probabilitatea pentru tipul A a fost omisă intenționat):

întrebare motivantă pentru regula 2: o persoană din Statele Unite este aleasă la întâmplare. Care este probabilitatea ca persoana să aibă tipul de sânge a?

răspuns: Intuiția noastră ne spune că, din moment ce cele patru grupe de sânge O, A, B și AB epuizează toate posibilitățile, probabilitățile lor împreună trebuie să însumeze 1, Care este probabilitatea unui eveniment „anumit” (o persoană are una dintre aceste 4 grupe de sânge pentru anumite).

deoarece probabilitățile lui O, B și AB însumează împreună 0.44 + 0.1 + 0.04 = 0,58, probabilitatea de tip A trebuie să fie restul 0.42 (1 – 0.58 = 0.42):

date date în formatul "grupa sanguină: probabilitate": O: 0,44; a: 0,42; B: 0,10; AB: 0,04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

regula de probabilitate doi

acest exemplu ilustrează a doua regulă, care ne spune că probabilitatea tuturor rezultatelor posibile împreună trebuie să fie 1.

regula probabilității doi:

suma probabilităților tuturor rezultatelor posibile este 1.

acesta este un loc bun pentru a compara și a contrasta ceea ce facem aici cu ceea ce am învățat în secțiunea Analiza datelor Exploratorii (Eda).

  • observați că în această problemă ne concentrăm în esență pe o singură variabilă categorică: tipul de sânge.
  • am rezumat această variabilă mai sus, așa cum am rezumat variabile categorice unice în secțiunea EDA, enumerând ce valori ia variabila și cât de des le ia.
  • în EDA am folosit procente, iar aici folosim probabilități, dar cele două transmit aceleași informații.
  • în secțiunea EDA, am aflat că o diagramă circulară oferă un afișaj adecvat atunci când este implicată o singură variabilă categorică și, în mod similar, o putem folosi aici (folosind procente în loc de probabilități):

o diagramă circulară, intitulată "tipuri de sânge."Tipul O ocupă 44% din diagrama circulară, a folosește 42%, AB reprezintă 4%, iar B reprezintă restul, 10%. Rețineți că tipurile de sânge care sunt "nu O" ocupă 56% din graficul plăcintă."Blood Types." Type O takes up 44% of the pie chart, A uses 42%, AB represents 4%, and B represents the rest, 10%. Note that the types of blood which are "not O" take up 56% of the pie chart.

chiar dacă ceea ce facem aici este într-adevăr similar cu ceea ce am făcut în secțiunea EDA, există o diferență subtilă, dar importantă între situațiile de bază

  • În EDA, am sintetizat date care au fost obținute dintr-un eșantion de indivizi pentru care au fost înregistrate valori ale variabilei de interes.
  • aici, când prezentăm probabilitatea fiecărui tip de sânge, avem în vedere întreaga populațiede oameni din Statele Unite, pentru care presupunem că cunoaștem frecvența generală a valorilor luate de variabila de interes.
am primit asta?: Regula de probabilitate doi

regula de probabilitate trei

în Probabilitate și în aplicațiile sale, suntem frecvent interesați să aflăm probabilitatea ca un anumit eveniment să nu aibă loc.

un punct important de înțeles aici este că „evenimentul A nu are loc” este un eveniment separat care constă din toate rezultatele posibile care nu sunt în A și se numește „evenimentul complementar al lui A.”

notație: vom scrie „nu A” pentru a desemna evenimentul că A nu are loc. Iată o reprezentare vizuală a modului în care evenimentul a și evenimentul complementar „nu A” reprezintă împreună toate rezultatele posibile.

întregul spațiu de probă S este reprezentat cu o cutie gri. În interiorul acestei cutii este un cerc albastru, reprezentând toate rezultatele în A. Orice altceva în caseta gri, dar în afara cercului albastru este"nu A"."not A".

comentariu:

  • un astfel de afișaj vizual se numește „Diagrama Venn.”O diagramă Venn este o modalitate simplă de a vizualiza evenimentele și relațiile dintre ele folosind dreptunghiuri și cercuri.

Regula 3 se referă la relația dintre probabilitatea unui eveniment și probabilitatea evenimentului complementar.

având în vedere că evenimentul a și evenimentul „nu A” alcătuiesc împreună toate rezultatele posibile și, din moment ce regula 2 ne spune că suma probabilităților tuturor rezultatelor posibile este 1, următoarea regulă ar trebui să fie destul de intuitivă:

regula de probabilitate trei (regula complementului):

  • P(nu A) = 1 – P(A)
  • adică probabilitatea ca un eveniment nu are loc este 1 minus probabilitatea ca aceasta să apară.

exemplu: tipuri de sânge

înapoi la tipul de sânge exemplu:

iată câteva informații suplimentare:

  • o persoană cu tip A poate dona sânge unei persoane cu tip A sau ab.
  • o persoană cu tip B poate dona sânge unei persoane cu tip B sau AB.
  • o persoană cu tip AB poate dona sânge numai unei persoane cu tip AB.
  • o persoană cu sânge de tip o poate dona oricui.

care este probabilitatea ca o persoană aleasă aleatoriu să nu poată dona sânge tuturor? Cu alte cuvinte, care este probabilitatea ca o persoană aleasă aleatoriu să nu aibă tipul de sânge O? Trebuie să găsim P (nu O). Folosind regula complementului, P ( nu O) = 1 – P(O) = 1 – 0,44 = 0,56. Cu alte cuvinte, 56% din populația SUA nu are grupa sanguină O:

în mod clar, am putea găsi și P(nu O) direct prin adăugarea probabilităților B, AB și A.

comentariu:

  • rețineți că regula complementului, P(nu A) = 1 – P(A) poate fi reformulată Ca P(A) = 1-P (nu A).
    • P ( nu A) = 1 – P(A)
    • poate fi reformulat ca P(A) = 1-P(nu A).
    • această manipulare algebrică aparent banală are o aplicație importantă și surprinde de fapt puterea regulii complementului.
    • în unele cazuri, atunci când găsirea p(a) direct este foarte complicată, ar putea fi mult mai ușor să găsiți P(nu A) și apoi să o scădeți de la 1 pentru a obține p(a) dorit.
    • vom reveni la acest comentariu în curând și vom oferi exemple suplimentare.
am primit asta?: Regula de probabilitate trei
  • regula complementului poate fi utilă ori de câte ori este mai ușor să se calculeze probabilitatea complementului evenimentului, mai degrabă decât evenimentul în sine.
  • observați, am folosit din nou expresia „cel puțin unul.”
  • acum am văzut că complementul „cel puțin unul … „este” nici unul … ” sau ” nu ….”(așa cum am menționat anterior în ceea ce privește evenimentele fiind”opuse”).
  • în activitatea de mai sus vedem că
    • P(niciunul dintre aceste două efecte secundare) = 1 – P(cel puțin unul dintre aceste două efecte secundare )
  • aceasta este o aplicație comună a regulii complementului pe care o puteți recunoaște adesea prin sintagma „cel puțin una” din problemă.

probabilități care implică mai multe evenimente

vom fi adesea interesați să găsim probabilități care implică mai multe evenimente, cum ar fi

  • P(A sau b) = p(evenimentul a apare sau evenimentul B apare sau ambele apar)
  • P(atât evenimentul a apare, cât și evenimentul B apare)

o problemă comună cu terminologia se referă la modul în care ne gândim de obicei la „sau” în viața noastră de zi cu zi. De exemplu, atunci când un părinte îi spune copilului său într-un magazin de jucării „vrei jucăria a sau jucăria B?”, aceasta înseamnă că copilul va primi o singură jucărie și el sau ea trebuie să aleagă între ele. Obținerea ambelor jucării nu este de obicei o opțiune.

în contrast:

în probabilitate, „sau” înseamnă unul sau altul sau ambele.

și astfel P(A sau B) = P(evenimentul a apare sau evenimentul B apare sau ambele apar)

acestea fiind spuse, trebuie remarcat faptul că există unele cazuri în care este pur și simplu imposibil ca cele două evenimente să apară ambele în același timp.

regula probabilității patru

distincția dintre evenimentele care se pot întâmpla împreună și cele care nu pot este una importantă.

disjunct: Două evenimente care nu pot apărea în același timp sunt numite disjuncte sau care se exclud reciproc. (Vom folosi disjuncția.)

o diagramă Venn intitulată "A și B sunt disjuncte."Întregul spațiu de probă este reprezentat ca un dreptunghi. În interiorul dreptunghiului sunt două cercuri separate. Un cerc reprezintă evenimentele din A, iar celălalt reprezintă evenimentele din B."A and B are Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two separate circles. One circle represents the events in A and the other represents the events in B.o diagramă Venn intitulată "A și B nu sunt disjuncte."Întregul spațiu de probă este reprezentat ca un dreptunghi. În interiorul dreptunghiului sunt două cercuri. Un cerc reprezintă aparițiile din A, iar celălalt reprezintă aparițiile din B. Aceste două nu sunt disjuncte, deci cele două cercuri se suprapun parțial. (Nefiind disjuncte, două cercuri s-ar putea suprapune complet, dar în acest exemplu nu.)"A and B are NOT Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two circles. One circle represents the occurrences in A and the other represents the occurrences in B. These two are not disjoint, so the two circles partially overlap each other. (Being NOT disjoint, two circles could overlap each other completely, but in this example they do not.)

ar trebui să fie clar din imagine că

  • În primul caz, în cazul în care evenimentele nu sunt disjuncte, p(a și b) 0
  • în al doilea caz, în cazul în care evenimentele sunt disjuncte, P(A și B) = 0.

iată două exemple:

exemplu:

luați în considerare următoarele două evenimente:

A — o persoană aleasă aleatoriu are grupa de sânge a și

B — o persoană aleasă aleatoriu are grupa de sânge B.

în cazuri rare, este posibil ca o persoană să aibă mai mult de un tip de sânge care curge prin venele sale, dar pentru scopurile noastre, vom presupune că fiecare persoană poate avea doar o singură grupă de sânge. Prin urmare, este imposibil ca evenimentele A și B să aibă loc împreună.

  • evenimentele A și B sunt disjuncte

Pe de altă parte …

exemplu:

luați în considerare următoarele două evenimente:

A — o persoană aleasă aleatoriu are grupa sanguină A

B — o persoană aleasă aleatoriu este o femeie.

în acest caz, este posibil ca evenimentele A și B să aibă loc împreună.

  • evenimentele A și B nu sunt disjuncte.

diagramele Venn sugerează că un alt mod de a gândi despre evenimente disjuncte versus NU disjuncte este că evenimentele disjuncte nu se suprapun. Ele nu împărtășesc niciunul dintre rezultatele posibile și, prin urmare, nu se pot întâmpla împreună.

pe de altă parte, evenimentele care nu sunt disjuncte se suprapun în sensul că împărtășesc unele dintre rezultatele posibile și, prin urmare, pot apărea în același timp.

începem acum cu o regulă simplă pentru găsirea P(A sau B) pentru evenimente disjuncte.

regula de probabilitate patru (regula de adăugare pentru evenimente disjuncte):

  • dacă a și B sunt evenimente disjuncte, atunci P(A sau B) = P(A) + P(B).

comentariu:

  • atunci când se ocupă cu probabilități, cuvântul ” sau ” va fi întotdeauna asociat cu funcționarea plus; de aici și numele acestei reguli, „regula adăugării.”

exemplu: tipuri de sânge

reamintiți exemplul tipului de sânge:

Date furnizate în formatul" Tip de sânge: probabilitate": O: 0,44; A: 0,42; B: 0,10; ab: 0,04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

iată câteva informații suplimentare

  • o persoană cu tip ac poate dona sânge unei persoane cu tip A sau AB.
  • o persoană cu tip Bpoate dona sânge unei persoane cu tip B sau AB.
  • o persoană cu tip ABC poate dona sânge unei persoane cu tip AB
  • o persoană cu tip Oblood poate dona oricui.

care este probabilitatea ca o persoană aleasă aleatoriu să fie un potențial donator pentru o persoană cu sânge de tip a?

Din informațiile furnizate, știm că a fi donator potențial pentru o persoană cu grupa sanguină A înseamnă a avea grupa sanguină a sau O.

prin urmare, trebuie să găsim P(A sau O). Deoarece evenimentele A și o sunt disjuncte, putem folosi regula de adăugare pentru evenimentele disjuncte pentru a obține:

  • P(A sau o) = P(a) + P(o) = 0,42 + 0,44 = 0,86.

este ușor de văzut de ce adăugarea probabilității are sens.

dacă 42% din populație are sânge de tip A și 44% din populație are sânge de tip O,

  • atunci 42% + 44% = 86% din populație are fie sânge de tip A, fie O și, prin urmare, sunt potențiali donatori unei persoane cu sânge de tip A.

acest raționament despre motivul pentru care regula de adăugare are sens poate fi vizualizat folosind graficul de mai jos:

o diagramă circulară intitulată "tipuri de sânge."Tipul A ocupă 42% din graficul radial, iar tipul O ocupă 44%. Împreună, ca A sau O, ocupă 86% din graficul circular."Blood Types." Type A takes up 42% of the pie chart, and type O takes up 44%. Together, as A or O, they take up 86% of the pie chart.

aflați făcând: regula de probabilitate patru

comentariu:

  • regula de adăugare pentru evenimente disjuncte poate fi extinsă în mod natural la mai mult de două evenimente disjuncte. Să luăm trei, de exemplu. Dacă A, B și C sunt trei evenimente disjuncte
o diagramă Venn care prezintă 3 evenimente disjuncte. Ca de obicei, există o cutie gri care arată întregul spațiu de probă. În interiorul acestei cutii gri sunt trei cercuri complet separate. Primul cerc este pentru aparițiile din A, al doilea pentru aparițiile din B și al treilea pentru aparițiile din C.

apoi P(A sau B sau C) = P(A) + P(B) + P(C). Regula este aceeași pentru orice număr de evenimente disjuncte.

am primit asta?: Regula de probabilitate patru

acum am terminat cu prima versiune a regulii de adăugare (regula patru), care este versiunea limitată la evenimente disjuncte. Înainte de a acoperi a doua versiune, trebuie să discutăm mai întâi P(A și B).

găsirea P(A și B) folosind logica

acum ne întoarcem la calcularea

  • P(a și B)= P(apare atât evenimentul a, cât și evenimentul B)

mai târziu, vom discuta regulile de calcul P(A și b).

În primul rând, vrem să ilustrăm că o regulă nu este necesară ori de câte ori puteți determina răspunsul prin logică și numărare.

caz Special:

există un caz special pentru care știm ce P(A și B) este egal fără a aplica nicio regulă.

învață făcând: Găsirea P(A și B) # 1

deci, dacă evenimentele a și B sunt disjuncte, atunci (prin definiție) P(A și B)= 0. Dar dacă evenimentele nu sunt disjuncte?

reamintim că regula 4, regula de adăugare, are două versiuni. Unul este limitat la evenimente disjuncte, pe care le-am acoperit deja, și ne vom ocupa de versiunea mai generală mai târziu în acest modul. Același lucru va fi valabil și pentru probabilitățile care implică și

cu toate acestea, cu excepția cazurilor speciale, ne vom baza pe logică pentru a găsi P(A și B) în acest curs.

înainte de a acoperi orice reguli formale, să ne uităm la un exemplu în care evenimentele nu sunt disjuncte.

exemplu: starea parodontală și sexul

luați în considerare următorul tabel privind starea parodontală a indivizilor și sexul acestora. Statutul parodontal se referă la boala gingiilor în care indivizii sunt clasificați ca fiind sănătoși, au gingivită sau au boală parodontală.

am mai văzut acest tip de tabel când am discutat analiza datelor în cazul C. În scopul acestei întrebări, vom folosi aceste date ca „populație” și vom lua în considerare selectarea aleatorie a unei persoane.

aflați făcând: starea parodontală și sexul

ne place să punem întrebări de probabilitate similare cu exemplul anterior (folosind un tabel bidirecțional bazat pe date), deoarece acest lucru vă permite să faceți conexiuni între aceste subiecte și vă ajută să păstrați o parte din ceea ce ați învățat despre date proaspete în mintea ta.

amintiți-vă, scopul nostru principal în acest curs este de a analiza datele din viața reală!

regula de probabilitate cinci

acum suntem gata să trecem la versiunea extinsă a regulii de adăugare.

în această secțiune, vom învăța cum să găsim P(A sau B) când A și B nu sunt neapărat disjuncte.

  • vom numi această versiune extinsă „regula generală de adăugare” și o vom declara ca regula de probabilitate cinci.

vom începe prin a preciza regula și a oferi un exemplu similar tipurilor de probleme pe care le cerem în general în acest curs. Apoi vom prezenta un alt exemplu în care nu avem datele brute dintr-un eșantion din care să lucrăm.

regula de probabilitate cinci:

  • regula generală de adăugare: P(A sau B) = P(A) + P(B) – P(A și B).

notă: cel mai bine este să folosiți logica pentru a găsi P(A și B), nu o altă formulă.

o eroare foarte frecventă este aplicarea incorectă a regulii de multiplicare pentru evenimentele independente acoperite pe pagina următoare. Acest lucru va fi corect numai dacă A și B sunt independente (a se vedea definițiile de urmat), ceea ce este rareori cazul în datele prezentate în tabelele bidirecționale.

așa cum am văzut în exemplele anterioare, când cele două evenimente nu sunt disjuncte, există o oarecare suprapunere între evenimente.

  • dacă pur și simplu adăugăm cele două probabilități împreună, vom primi un răspuns greșit pentru că am numărat unele „probabilități” de două ori!
  • astfel, trebuie să scădem această probabilitate „extra” pentru a ajunge la răspunsul corect. Diagrama Venn și tabelele bidirecționale sunt utile în vizualizarea acestei idei.

o diagramă venn intitulată "A și B nu sunt disjuncte."O cutie gri reprezintă spațiul eșantionului, iar în interior sunt două cercuri albastre care au o zonă suprapusă. Un cerc este etichetat A, iar celălalt este etichetat B. zona în care se suprapun cele două cercuri reprezintă faptul că evenimentele a și B pot apărea în același timp, deci P(A și b) 0."A and B are NOT Disjoint." A gray box represents the sample space, and inside are two blue circles which have an overlapping area. One circle is labeled A and the other is labeled B. The area where the two circles overlap represents that Events A and B can occur at the same time, so P(A and B) ≠ 0.

această regulă este mai generală, deoarece funcționează pentru orice pereche de evenimente (chiar evenimente disjuncte). Sfatul nostru este încă să încercăm să răspundem la întrebare folosind logica și Numărarea ori de câte ori este posibil, în caz contrar, trebuie să fim extrem de atenți să alegem regula corectă pentru problemă.

principiu:

dacă puteți calcula o probabilitate folosind logica și numărarea, nu aveți nevoie de o regulă de probabilitate (deși regula corectă poate fi întotdeauna aplicată)

observați că, dacă A și B sunt disjuncte, atunci P(A și B) = 0 și regula 5 se reduce la regula 4 pentru acest caz special.

o diagramă Venn intitulată "A și B sunt disjuncte. Întregul spațiu de probă S este reprezentat ca un dreptunghi gri. În interior sunt două cercuri albastre separate, care nu se suprapun. Un cerc este pentru aparițiile din A și celălalt pentru aparițiile din B."A and B are Disjoint. The entire sample space S is represented as a gray rectangle. Inside are two, separate, non-overlapping blue circles. One circle is for the occurrences in A and the other for occurrences in B.

să revedem ultimul exemplu:

exemplu: starea parodontală și sexul

luați în considerare selectarea aleatorie a unui individ dintre cei reprezentați în tabelul următor în ceea ce privește starea parodontală a indivizilor și sexul lor. Statutul parodontal se referă la boala gingiilor în care indivizii sunt clasificați ca fiind sănătoși, au gingivită sau au boală parodontală.

să trecem în revistă ceea ce am învățat până acum. Putem calcula orice probabilitate în acest scenariu dacă putem determina câte persoane satisfac evenimentul sau combinația de evenimente.

  • P (masculin) = 3009/8027 = 0,3749
  • P (feminin) = 5018/8027 = 0,6251
  • P(sănătos) = 3750/8027 = 0,4672
  • P(nu este sănătos) = P (gingivită sau Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
    De asemenea, am putea calcula acest lucru folosind regula complementului: 1 – P(sănătos)

de asemenea, am constatat anterior că

  • P(masculin și sănătos) = 1143/8027 = 0.1424

regula de rechemare 5, P(A sau B) = P(A) + P(B) – P(A și B). Acum folosim această regulă pentru a calcula P (bărbat sau sănătos)

  • P (bărbat sau sănătos) = P (bărbat) + P (sănătos) – P(bărbat și sănătos) = 0.3749 + 0.4672 – 0.1424 = 0.6997 sau aproximativ 70%

am rezolvat această întrebare mai devreme prin simpla numărare a numărului de indivizi fie bărbați, fie sănătoși sau ambii. Imaginea de mai jos ilustrează valorile pe care trebuie să le combinăm. Trebuie să numărăm

  • toți bărbații
  • toți indivizii sănătoși
  • dar, să nu numărăm pe nimeni de două ori!!

folosind această abordare logică am găsi

  • P(masculin sau sănătos) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996

avem o diferență minoră în răspunsurile noastre în ultima zecimală datorită rotunjirii care a avut loc atunci când am calculat P(masculin), P(sănătos) și P(masculin și sănătos) și apoi am aplicat regula 5.

în mod clar răspunsul este efectiv același, aproximativ 70%. Dacă am duce răspunsurile noastre la mai multe zecimale sau dacă am folosi fracțiile originale, am putea elimina complet această mică discrepanță.

să ne uităm la un ultim exemplu pentru a ilustra regula probabilității 5 atunci când este necesară regula – adică atunci când nu avem date reale.

exemplu: livrare importantă!

este vital ca un anumit document să ajungă la destinație într-o zi. Pentru a maximiza șansele de livrare la timp, două copii ale documentului sunt trimise folosind două servicii, serviciul a și serviciul B. Se știe că probabilitățile livrării la timp sunt:

  • 0,90 pentru serviciul a (P(a) = 0,90)
  • 0,80 pentru serviciul B (P(B) = 0,80)
  • 0.75 pentru ambele servicii fiind la timp (P(A și B) = 0,75)
    (rețineți că A și B nu sunt disjuncte. Ele se pot întâmpla împreună cu probabilitatea 0,75.)

diagramele Venn de mai jos ilustrează probabilitățile P(A), P(B) și P(A și b):

trei diagrame Venn. În toate acestea există un dreptunghi mare reprezentând tot spațiul eșantionului S. În interiorul acestui dreptunghi sunt două cercuri care se suprapun parțial. Un cerc este etichetat A, iar celălalt este etichetat B. În prima diagramă Venn cercul pentru A este colorat în albastru și vedem că P(a) = 0,90 . Într-un anumit sens P(A) este aria cercului A. În a doua diagramă Venn cercul pentru B este colorat în albastru și este marcat că P(B) = 0,80 . La fel ca în prima diagramă Venn se poate crede că cercul pentru B are o suprafață de 0,80 . În a treia diagramă Venn zona care este suprapunerea cercurilor a și B este colorată în albastru. P (A și B) = 0,75 . Zona suprapunerii poate fi considerată ca având o suprafață de 0,75 .

în contextul acestei probleme, problema evidentă de interes este:

  • care este probabilitatea livrării la timp a documentului folosind această strategie (de a-l trimite prin ambele servicii)?

documentul va ajunge la destinație la timp, atâta timp cât este livrat la timp de serviciul a sau de serviciul B sau de ambele servicii. Cu alte cuvinte, când apare evenimentul a sau evenimentul B sau ambele apar. deci….

P(on time delivery folosind această strategie)= P(A sau B), care este reprezentat de regiunea umbrită în diagrama de mai jos:

aceeași diagramă Venn, cu excepția zonei celor două cercuri, a fost colorată în albastru (umbrită). Aceasta înseamnă că zona din suprapunere este de asemenea colorată în albastru. Rețineți că zona de suprapunere a fost colorată o singură dată, așa că, deși este în ambele cercuri, o vom număra o singură dată.

putem acum

  • să folosim cele trei diagrame Venn reprezentând P(A), P(B) și P(A și B)
  • pentru a vedea că putem găsi P(A sau B) adăugând P(a) (reprezentat de cercul din stânga) și P(B) (reprezentat de cercul din dreapta),
  • apoi scăzând P(A și B) (reprezentat de suprapunere), deoarece l-am inclus de două ori, o dată p(a) și o dată ca parte a p(b).

acest lucru este prezentat în următoarea imagine:

aria ambelor cercuri din diagrama Venn (numărarea zonei de suprapunere o dată) este calculată ca: aria cercului lui a (care include suprapunerea) + aria cercului lui B (care include și suprapunerea) - aria suprapunerii. Prin urmare, obținem: P(A sau B) = P(A) + P(B) - P(A și B).'s circle (which includes the overlap) + the area of B's circle (which also includes the overlap) - the area of the overlap. We therefore get: P(A or B) = P(A) + P(B) - P(A and B).

dacă aplicăm acest lucru la exemplul nostru, constatăm că:

  • P (A sau B) = P (livrare la timp folosind această strategie)= 0.90 + 0.80 – 0.75 = 0.95.

deci, strategia noastră de a utiliza două servicii de livrare crește probabilitatea noastră de livrare la timp la 0,95.

în timp ce diagramele Venn au fost excelente pentru a vizualiza regula generală de adăugare, în astfel de cazuri este mult mai ușor să afișați informațiile și să lucrați cu un tabel bidirecțional de probabilități, la fel cum am examinat relația dintre două variabile categorice în secțiunea de analiză a datelor Exploratorii.

vă vom arăta pur și simplu tabelul, nu cum îl derivăm, deoarece nu vi se va cere să faceți acest lucru pentru noi. Ar trebui să puteți vedea că o anumită logică și o simplă adunare/scădere este tot ce am folosit pentru a completa tabelul de mai jos.

tabelul are coloanele "B", "Nu B" și "Total."Rândurile sunt" A"," nu A "și" Total."Iată câteva informații despre tabel, organizate pe celule: la celula a,B, valoarea de acolo (0,75) este P(A și B) = P(livrare la timp de către ambele servicii). La celula a, nu B, valoarea de acolo (0,15) este P(A și nu B) = P(livrare la timp numai prin serviciul a). La celula nu A și B, valoarea (0,05) este P(nu A și B) = P(livrare la timp numai prin serviciul B). La celula nu A și nu B, valoarea (0,05) este P(nu A și nu B) = P(nici serviciul a, Nici B livrat la timp)."B," "not B," and "Total." The rows are "A," "not A," and "Total." Here are is some information about the table, organized by cell: At the cell A,B, the value there (0.75) is P(A and B) = P(on-time delivery by both services). At the cell A,not B, the value there (0.15) is P(A and Not B) = P(on-time delivery ONLY by service A). At cell Not A and B, the value (0.05) is P(not A and B) = P(on-time delivery ONLY by service B). At cell Not A and Not B, the value (0.05) is P(not A and not B) = P(Neither service A nor B delivered on time).

când folosim un tabel bidirecțional, trebuie să ne amintim să ne uităm la întregul rând sau coloană pentru a găsi probabilități globale care implică doar A sau doar B.

  • P(a) = 0,90 înseamnă că în 90% din cazurile în care serviciul A este utilizat, acesta livrează documentul la timp. Pentru a găsi acest lucru, ne uităm la probabilitatea totală pentru rândul care conține A. în găsirea P(a), nu știm dacă B se întâmplă sau nu.

primul rând al tabelului a fost evidențiat. Iată datele evidențiate în rândul, formatul coloanei: A, B: P(A și B) = 0,75; a, nu B: P(A și nu B) = 0,15; a, Total: P(a) = 0,90 = p(a și B) + P(A și nu B)'s first row has been highlighted. Here is the highlighted data in "Row, Column" format: A, B: P(A and B) = 0.75; A, not B: P(A and not B) = 0.15; A, Total: P(A) = 0.90 = P(A and B) + P(A and not B)

  • P(b) = 0,80 înseamnă că în 80% din cazurile în care se utilizează serviciul B, acesta livrează documentul la timp. Pentru a găsi acest lucru, ne uităm la probabilitatea totală pentru coloana care conține B. în găsirea P(B), nu știm dacă A se întâmplă sau nu.

prima coloană a tabelului a fost evidențiată. Iată datele evidențiate în rândul, formatul coloanei: A, B: P(A și B) = 0,75; Nu A, B: P(nu A și B) = 0.05; B, Total: P ( B) = 0,80 = P(A și B) + P(nu A și B)'s first column has been highlighted. Here is the highlighted data in "Row, Column" format: A,B: P(A and B) = 0.75; not A, B: P(not A and B) = 0.05; B,Total: P(B) = 0.80 = P(A and B) + P(not A and B)

comentariu

  • când am folosit tabele bidirecționale în secțiunea Analiza datelor Exploratorii (EDA), s-au înregistrat valori a două variabile categorice pentru un eșantion concret de indivizi.
  • în schimb, informațiile dintr-un tabel de probabilitate bidirecțional sunt pentru o întreagă populație, iar valorile sunt mai degrabă abstracte.
  • dacă am fi tratat ceva de genul exemplului de livrare din secțiunea EDA, am fi înregistrat numărul real de livrări la timp (și nu la timp) pentru eșantioane de documente trimise prin poștă cu serviciul a sau B.
  • în această secțiune, probabilitățile pe termen lung sunt prezentate ca fiind cunoscute.probabil, probabilitățile raportate în acest exemplu de livrare s-au bazat pe frecvențele relative înregistrate pe mai multe repetări.

Applet interactiv: Diagrama Venn de probabilitate

regula de rotunjire pentru probabilitate:

urmați următoarele orientări generale în acest curs. Dacă aveți dubii, aveți mai multe zecimale. Dacă specificăm da exact ceea ce se solicită.

  • În general, ar trebui să purtați probabilități la cel puțin 4 zecimale pentru pașii intermediari.
  • de multe ori ne rotunjim răspunsul final la două sau trei zecimale.
  • pentru probabilități extrem de mici, este important să aveți 1 sau două cifre semnificative (cifre diferite de zero), cum ar fi 0,000001 sau 0,000034 etc.

multe pachete de calculator ar putea afișa valori extrem de mici folosind notație științifică, cum ar fi

  • 58 10-5 sau 1.58 e-5 pentru a reprezenta 0.0000158

să rezumăm

până în prezent, în studiul nostru de probabilitate, ați fost introdus la natura uneori contra-intuitivă a probabilității și fundamentele care stau la baza probabilității, cum ar fi o frecvență relativă.

de asemenea, v — am oferit câteva instrumente pentru a vă ajuta să găsiți probabilitățile evenimentelor-și anume regulile de probabilitate.

probabil ați observat că secțiunea de probabilitate a fost semnificativ diferită de cele două secțiuni anterioare; are o componentă tehnică / matematică mult mai mare, astfel încât rezultatele tind să fie mai mult de natura „corectă sau greșită”.

în secțiunea de analiză a datelor exploratorii, în cea mai mare parte, computerul a avut grijă de aspectul tehnic al lucrurilor, iar sarcinile noastre au fost să-i spunem să facă ceea ce trebuie și apoi să interpreteze rezultatele.

în probabilitate, facem munca de la început până la sfârșit, de la alegerea instrumentului (regulii) potrivit de utilizat, la utilizarea corectă a acestuia, la interpretarea rezultatelor.

iată un rezumat al regulilor pe care le-am prezentat până acum.

1. Regula de probabilitate nr. 1 prevede:

  • Pentru orice eveniment a, 0 Int.P. (a) int. 1

2. Regula de probabilitate # 2 afirmă:

  • suma probabilităților tuturor rezultatelor posibile este 1

3. Regula complementului (#3) afirmă că

  • P(not A) = 1 – P(a)

sau când este rearanjată

  • P(a) = 1 – p(not a)

ultima reprezentare a regulii complementului este în special util atunci când trebuie să găsim probabilități de evenimente de genul „cel puțin unul din …”

4. Regula generală de adăugare (#5) afirmă că pentru oricare două evenimente,

  • P(A sau B) = P(A) + P(B) – P(A și b),

unde, prin P(A sau B) înțelegem P(A apare sau B apare sau ambele).

în cazul special al evenimentelor disjuncte, evenimente care nu pot apărea împreună, regula generală de adăugare poate fi redusă la regula de adăugare pentru evenimentele disjuncte (#4), care este

  • P(A sau B) = P(A) + P(B). *

* utilizați numai atunci când sunteți convins că evenimentele sunt disjuncte (nu se suprapun)

5. Versiunea restricționată a regulii de adăugare (pentru evenimente disjuncte) poate fi extinsă cu ușurință la mai mult de două evenimente.

6. Până în prezent, am găsit doar P (A și B) folosind logica și numărarea în exemple simple

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *