Probabilità di Base Regole

  • Introduzione
  • le Regole di Probabilità
    • Probabilità Regola (Per ogni evento A, 0 ≤ P(A) ≤ 1)
    • Probabilità di Regola Due (La somma delle probabilità di tutti i possibili esiti: 1)
    • Probabilità Regola del Tre (Il Complemento Regola)
    • le Probabilità che Coinvolgono Molteplici Eventi
    • Probabilità di Regola Quattro (Oltre Regola per Eventi Disgiunti)
    • Trovare P(A e B) usando la Logica
    • Probabilità Regola Cinque (La regola generale di addizione)
  • Arrotondamento Regola empirica per probabilità
  • Riassumiamo
CO-6: Applicare concetti di base di probabilità, variazione casuale, e comunemente usato distribuzioni di probabilità statistica.
LO 6.4: Mettere in relazione la probabilità di un evento con la probabilità che questo evento si verifichi.
LO 6.5: Applicare l’approccio relativo alla frequenza per stimare la probabilità di un evento.
LO 6.6: Applicare la logica di base e le regole di probabilità al fine di trovare la probabilità empirica di un evento.
Video: Basic Probability Rules (25:17)

Nella sezione precedente, abbiamo introdotto la probabilità come un modo per quantificare l’incertezza che deriva dalla conduzione di esperimenti utilizzando un campione casuale dalla popolazione di interesse.

Abbiamo visto che la probabilità di un evento (ad esempio, l’evento in cui una persona scelta a caso ha il gruppo sanguigno O) può essere stimata dalla frequenza relativa con cui l’evento si verifica in una lunga serie di prove. Quindi raccoglieremo dati da molti individui per stimare la probabilità che qualcuno abbia il gruppo sanguigno O.

In questa sezione, stabiliremo i metodi e i principi di base per trovare le probabilità degli eventi.

Tratteremo anche alcune delle regole di base della probabilità che possono essere utilizzate per calcolare le probabilità.

Introduzione

Inizieremo con un classico esempio di probabilità di lanciare una moneta giusta tre volte.

Poiché teste e code sono ugualmente probabili per ogni lancio in questo scenario, ciascuna delle possibilità che può derivare da tre lanci sarà ugualmente probabile in modo da poter elencare tutti i valori possibili e utilizzare questa lista per calcolare le probabilità.

Poiché il nostro focus in questo corso è su dati e statistiche (non probabilità teorica), nella maggior parte dei nostri problemi futuri useremo un set di dati riepilogati, di solito una tabella di frequenza o una tabella a due vie, per calcolare le probabilità.

ESEMPIO: Lancio di una moneta tre volte

la lista ogni possibile risultato (o risultato possibile):

{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}

Ora si possono definire i seguenti eventi:

Evento: “non H”

l’Evento B: “Ottenere esattamente un H”

l’Evento C: “Ottenere almeno un H”

si noti che ogni evento è, infatti, una dichiarazione circa l’esito che l’esperimento sta per produrre. In pratica, ogni evento corrisponde ad una raccolta (sottoinsieme) dei possibili risultati.

Evento A:” Non ottenere H ” → TTT

Evento B: “Ottenere esattamente un H” → HTT, THT, TTH

l’Evento C: “Ottenere almeno un H” → HTT, THT, TTH, THH, HTH, HHT, HHH

Qui è una rappresentazione visiva di eventi, B e C.

Abbiamo un grande rettangolo etichettato come "S", che rappresenta la totalità dello spazio campionario. All

Da questa rappresentazione visiva degli eventi, è facile vedere che l’evento B è totalmente compresa nel caso C, nel senso che ogni risultato in un evento B è anche un risultato in caso C. si noti, Inoltre, che l’evento A si distingue da eventi B e C, nel senso che essi non hanno alcun esito in comune, o non si sovrappongono. A questo punto queste sono solo osservazioni degne di nota, ma come scoprirai più avanti, sono molto importanti.

Cosa succede se abbiamo aggiunto il nuovo evento:

Evento D: “Ottenere una T al primo lancio” → THH, THT, TTH, TTT

Come apparirebbe se avessimo aggiunto l’evento D al diagramma sopra? (Link alla risposta)

Ricorda, poiché H e T sono ugualmente probabili su ogni lancio, e poiché ci sono 8 possibili risultati, la probabilità di ciascun risultato è 1/8.

Vedi se puoi rispondere alle seguenti domande usando i diagrammi e / o l’elenco dei risultati per ogni evento insieme a ciò che hai imparato finora sulla probabilità.

Impara facendo: Lanciare una moneta giusta tre volte

Se sei stato in grado di rispondere correttamente a queste domande, probabilmente hai un buon istinto per calcolare la probabilità! Continua a leggere per imparare come applicheremo questa conoscenza.

In caso contrario, cercheremo di aiutarti a sviluppare questa abilità in questa sezione.

Commento:

  • Nota che nell’evento C, “Ottenere almeno una testa” c’è solo un risultato possibile che manca, “Non ottenere teste” = TTT. Ci occuperemo di questo ancora una volta quando si parla di regole di probabilità, in particolare la regola del complemento. A questo punto, vogliamo solo che tu pensi a come questi due eventi siano “opposti” in questo scenario.

È MOLTO importante rendersi conto che solo perché possiamo elencare i possibili risultati, questo non implica che ogni risultato sia ugualmente probabile.

Questo è il messaggio (divertente) nella clip di Daily Show che abbiamo fornito nella pagina precedente. Ma ripensiamoci. In quella clip, Walter afferma che poiché ci sono due possibili risultati, la probabilità è 0.5. I due esiti possibili sono:

  • Il mondo sarà distrutto a causa dell’uso del large hadron collider
  • Il mondo NON sarà distrutto a causa dell’uso del large hadron collider

Speriamo sia chiaro che questi due risultati non sono altrettanto probabile!!

Consideriamo un esempio più comune.

ESEMPIO: Difetti alla nascita

Supponiamo di selezionare casualmente tre bambini e siamo interessati alla probabilità che nessuno dei bambini abbia difetti alla nascita.

Usiamo la notazione D per rappresentare un bambino nato con un difetto di nascita e N per rappresentare il bambino nato senza difetto di nascita. Possiamo elencare i possibili esiti, proprio come abbiamo fatto per il lancio della moneta, sono:

{DDD, NDD, DND, DDN, DNN, NDN, NND, NNN}

Sono eventi DDD (tutti e tre i bambini sono nati con difetti alla nascita) e NNN (nessuno dei bambini sono nati con difetti alla nascita), altrettanto probabilmente?

Dovrebbe essere ragionevole per te che P(NNN) è molto più grande di P (DDD).

Questo perché P(N) e P(D) non sono eventi altrettanto probabili.

È raro (certamente non il 50%) che un bambino selezionato casualmente nasca con un difetto alla nascita.

Regole di probabilità

Ora passiamo ad imparare alcune delle regole di base di probabilità.

Fortunatamente, queste regole sono molto intuitive, e finché vengono applicate sistematicamente, ci permetteranno di risolvere problemi più complicati; in particolare, quei problemi per i quali la nostra intuizione potrebbe essere inadeguata.

Poiché la maggior parte delle probabilità che ti verrà chiesto di trovare può essere calcolata utilizzando sia la logica

  • che il conteggio

e

  • le regole che impareremo,

diamo il seguente consiglio come principio.

PRINCIPIO:

Se non è possibile calcolare una probabilità usando la logica e il conteggio non hai BISOGNO di una probabilità regola (anche se la regola corretta può essere sempre applicata)

Probabilità la Regola numero Uno

la Nostra prima regola, semplicemente ci ricorda le proprietà di base di probabilità che abbiamo già imparato.

La probabilità di un evento, che ci informa della probabilità che si verifichi, può variare da 0 (indicando che l’evento non si verificherà mai) a 1 (indicando che l’evento è certo).

Regola di probabilità Uno:

  • Per qualsiasi evento A, 0 ≤ P(A) ≤ 1.

NOTA: Un uso pratico di questa regola è che può essere utilizzato per identificare qualsiasi calcolo di probabilità che risulta essere più di 1 (o meno di 0) come errato.

Prima di passare alle altre regole, diamo prima un’occhiata a un esempio che fornirà un contesto per illustrare le prossime regole.

ESEMPIO: Gruppi sanguigni

Come discusso in precedenza, tutto il sangue umano può essere digitato come O, A, B o AB.

Inoltre, la frequenza del verificarsi di questi tipi di sangue varia in base ai gruppi etnici e razziali.

Secondo il Blood Center della Stanford University (bloodcenter.Stanford.edu), queste sono le probabilità dei gruppi sanguigni umani negli Stati Uniti (la probabilità per il tipo A è stata omessa di proposito):

Domanda motivante per la regola 2: una persona negli Stati Uniti viene scelta a caso. Qual è la probabilità che la persona abbia il gruppo sanguigno A?

Risposta: La nostra intuizione ci dice che poiché i quattro tipi di sangue O, A, B e AB esauriscono tutte le possibilità, le loro probabilità insieme devono sommare a 1, che è la probabilità di un evento “certo” (una persona ha uno di questi 4 tipi di sangue per certo).

Poiché le probabilità di O, B e AB insieme si sommano a 0.44 + 0.1 + 0.04 = 0.58, la probabilità di tipo A deve essere il restante 0.42 (1 – 0.58 = 0.42):

Dati forniti nel formato "Gruppo sanguigno: Probabilità": O: 0,44; A: 0,42; B: 0,10; AB: 0,04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Regola di probabilità Due

Questo esempio illustra la nostra seconda regola, che ci dice che la probabilità di tutti i possibili risultati insieme deve essere 1.

Probabilità Regola due:

La somma delle probabilità di tutti i possibili risultati è 1.

Questo è un buon posto per confrontare e contrastare ciò che stiamo facendo qui con ciò che abbiamo imparato nella sezione Exploratory Data Analysis (EDA).

  • Si noti che in questo problema ci stiamo essenzialmente concentrando su una singola variabile categoriale: il gruppo sanguigno.
  • Abbiamo riassunto questa variabile sopra, come abbiamo riassunto le singole variabili categoriali nella sezione EDA, elencando quali valori assume la variabile e quanto spesso li prende.
  • In EDA abbiamo usato le percentuali, e qui stiamo usando le probabilità, ma i due trasmettono le stesse informazioni.
  • Nella sezione EDA, abbiamo appreso che un grafico a torta fornisce una visualizzazione appropriata quando è coinvolta una singola variabile categoriale, e allo stesso modo possiamo usarlo qui (usando percentuali invece di probabilità):

Un grafico a torta, intitolato "Gruppi sanguigni."Il tipo O occupa il 44% del grafico a torta, A usa il 42%, AB rappresenta il 4% e B rappresenta il resto, il 10%. Si noti che i tipi di sangue che sono "non O" occupano il 56% del grafico a torta."Blood Types." Type O takes up 44% of the pie chart, A uses 42%, AB represents 4%, and B represents the rest, 10%. Note that the types of blood which are "not O" take up 56% of the pie chart.

Anche se quello che stiamo facendo qui è davvero simile a quello che abbiamo fatto in EDA sezione, c’è una sottile ma importante differenza tra il sottostante situazioni

  • In EDA, abbiamo riassunto i dati che sono stati ottenuti da un sampleof individui per i quali i valori della variabile di interesse sono stati registrati.
  • Qui, quando presentiamo la probabilità di ciascun gruppo sanguigno, abbiamo in mente l’intera popolazione di persone negli Stati Uniti, per la quale presumiamo di conoscere la frequenza complessiva dei valori presi dalla variabile di interesse.
Ho ricevuto questo?: Probability Rule Two

Probability Rule Three

Nella probabilità e nelle sue applicazioni, siamo spesso interessati a scoprire la probabilità che un determinato evento non si verifichi.

Un punto importante da capire è che “l’evento non si verifica” è un evento separato che consiste di tutti i possibili esiti che non sono in e viene chiamato “il complemento caso di A.”

Notazione: si scrive “non” per indicare l’evento che non si verifica. Ecco una rappresentazione visiva di come l’evento A e il suo evento complementare “non A” insieme rappresentano tutti i possibili risultati.

L

Commento:

  • Tale visualizzazione è chiamata “diagramma di Venn.”Un diagramma di Venn è un modo semplice per visualizzare gli eventi e le relazioni tra loro utilizzando rettangoli e cerchi.

La regola 3 riguarda la relazione tra la probabilità di un evento e la probabilità del suo evento complementare.

Dato che l’evento A e l’evento “non è Un” insieme di tutti i possibili esiti, e poiché la regola 2 ci dice che la somma delle probabilità di tutti i possibili esiti è 1, la seguente regola dovrebbe essere abbastanza intuitivo:

Probabilità Regola del Tre (Il Complemento Regola):

  • P(A) = 1 – P(A)
  • che è, la probabilità che un evento non si verifica è 1 meno la probabilità che si verifichi.

ESEMPIO: Tipi di Sangue

Torna per il tipo di sangue esempio:

Ecco alcune informazioni aggiuntive:

  • Una persona con tipo Un possibile donare il sangue per una persona con tipo A o AB.
  • Una persona con tipo B può donare sangue a una persona con tipo B o AB.
  • Una persona con tipo AB può donare il sangue solo a una persona con tipo AB.
  • Una persona con sangue di tipo O può donare a chiunque.

Qual è la probabilità che una persona scelta a caso non possa donare il sangue a tutti? In altre parole, qual è la probabilità che una persona scelta a caso non abbia il gruppo sanguigno O? Dobbiamo trovare P (non O). Usando la regola del complemento, P (non O) = 1 – P(O) = 1 – 0,44 = 0,56. In altre parole, il 56% della popolazione statunitense non ha il gruppo sanguigno O:

Chiaramente, potremmo anche trovare P(non O) direttamente aggiungendo le probabilità di B, AB e A.

Commento:

  • Si noti che la regola del complemento, P(non A) = 1 – P(A) può essere riformulata come P(A) = 1-P(non A).
    • P(non A) = 1 – P(A)
    • può essere riformulato come P(A) = 1-P(non A).
    • Questa manipolazione algebrica apparentemente banale ha un’applicazione importante e cattura effettivamente la forza della regola del complemento.
    • In alcuni casi, quando trovare P(A) direttamente è molto complicato, potrebbe essere molto più facile trovare P(non A) e quindi sottrarlo da 1 per ottenere il P(A) desiderato.
    • Torneremo presto a questo commento e forniremo ulteriori esempi.
Ho ricevuto questo?: Regola di probabilità Tre
  • La regola del complemento può essere utile ogni volta che è più facile calcolare la probabilità del complemento dell’evento piuttosto che dell’evento stesso.
  • Avviso, abbiamo di nuovo usato la frase “almeno uno.”
  • Ora abbiamo visto che il complemento di “almeno uno …” è “nessuno none” o ” no….”(come abbiamo accennato in precedenza in termini di eventi che sono “opposti”).
  • Nell’attività di cui sopra vediamo che
    • P(NESSUNO di questi due effetti collaterali) = 1 – P(almeno uno di questi due effetti collaterali)
  • Questa è un’applicazione comune della regola del complemento che spesso puoi riconoscere con la frase “almeno uno” nel problema.

le Probabilità che Coinvolgono Molteplici Eventi

Ci sarà spesso interessati a trovare la probabilità che coinvolgono più eventi come

  • P(A o B) = P(evento A si verifica o di un evento B si verifica o entrambi si verificano)
  • P(A e B)= P(entrambi evento si verifica, e l’evento B si verifica)

Un problema comune con la terminologia si riferisce a quanto siamo soliti pensare “o” nella nostra vita quotidiana. Ad esempio, quando un genitore dice a suo figlio in un negozio di giocattoli “Vuoi un giocattolo A o un giocattolo B?”, questo significa che il bambino sta per ottenere un solo giocattolo e lui o lei deve scegliere tra di loro. Ottenere entrambi i giocattoli di solito non è un’opzione.

Al contrario:

In probabilità, “O” significa uno o l’altro o entrambi.

e così P(A o B) = P(si verifica l’evento A o si verifica l’evento B o SI verificano ENTRAMBI)

Detto questo, va notato che ci sono alcuni casi in cui è semplicemente impossibile che i due eventi si verifichino entrambi allo stesso tempo.

Probabilità Regola Quattro

La distinzione tra eventi che possono accadere insieme e quelli che non possono è importante.

Disgiunto: Due eventi che non possono verificarsi contemporaneamente sono chiamati disgiunti o si escludono a vicenda. (Useremo disgiunto.)

Un diagramma di Venn intitolato "A e B sono disgiunti."LUn diagramma di Venn intitolato "A e B NON sono disgiunti."L

Dovrebbe essere chiaro dall’immagine che

  • nel primo caso, dove gli eventi NON sono disgiunti, P(A e B) 0 0
  • nel secondo caso, dove gli eventi SONO disgiunti, P(A e B) = 0.

Ecco due esempi:

ESEMPIO:

Considera i seguenti due eventi:

A — una persona scelta a caso ha il gruppo sanguigno A, e

B — una persona scelta a caso ha il gruppo sanguigno B.

In rari casi, è possibile che una persona abbia più di un tipo di sangue che scorre attraverso le sue vene, ma per i nostri scopi, assumeremo che ogni persona possa avere un solo gruppo sanguigno. Pertanto, è impossibile che gli eventi A e B si verifichino insieme.

  • Gli eventi A e B sono DISGIUNTI

D’altra parte …

ESEMPIO:

Considera i seguenti due eventi:

A — una persona scelta a caso ha un gruppo sanguigno A

B — una persona scelta a caso è una donna.

In questo caso, è possibile che gli eventi A e B si verifichino insieme.

  • Gli eventi A e B NON sono DISGIUNTI.

I diagrammi di Venn suggeriscono che un altro modo di pensare agli eventi disgiunti rispetto a quelli non disgiunti è che gli eventi disgiunti non si sovrappongono. Non condividono nessuno dei possibili risultati, e quindi non possono accadere insieme.

D’altra parte, gli eventi che non sono disgiunti si sovrappongono nel senso che condividono alcuni dei possibili risultati e quindi possono verificarsi allo stesso tempo.

Ora iniziamo con una semplice regola per trovare P(A o B) per eventi disgiunti.

Regola di probabilità Quattro (la regola di aggiunta per gli eventi disgiunti):

  • Se A e B sono eventi disgiunti, allora P(A o B) = P(A) + P(B).

Commento:

  • Quando si ha a che fare con le probabilità, la parola ” or ” sarà sempre associata all’operazione di addizione; da qui il nome di questa regola, ” La regola aggiunta.”

ESEMPIO: Tipi di Sangue

Richiamare il sangue di tipo esempio:

i Dati indicati nel "Sangue di Tipo: Probabilità" Formato: O: 0.44; Un: 0.42; B: 0.10; AB: 0.04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Ecco alcune informazioni aggiuntive

  • Una persona con il tipo di Acan donare il sangue per una persona con tipo A o AB.
  • Una persona con tipo Bpuò donare sangue a una persona con tipo B o AB.
  • Una persona con tipo ABpuò donare il sangue a una persona con tipo AB
  • Una persona con tipo Oblood può donare a chiunque.

Qual è la probabilità che una persona scelta a caso sia un potenziale donatore per una persona con gruppo sanguigno A?

Dalle informazioni fornite, sappiamo che essere un potenziale donatore per una persona con gruppo sanguigno A significa avere gruppo sanguigno A o O.

Abbiamo quindi bisogno di trovare P(A o O). Poiché gli eventi A e O sono disgiunti, possiamo usare la regola di aggiunta per gli eventi disgiunti per ottenere:

  • P (A o O) = P(A) + P(O) = 0.42 + 0.44 = 0.86.

È facile capire perché aggiungere la probabilità ha effettivamente senso.

Se il 42% della popolazione ha il sangue di tipo A e il 44% della popolazione ha sangue di tipo O,

  • quindi il 42% + 44% = 86% della popolazione ha il sangue di tipo A o O e, quindi, i potenziali donatori per una persona con sangue di tipo A.

Questo ragionamento sul perché l’aggiunta della regola di senso possono essere visualizzati utilizzando il grafico a torta sottostante:

Un grafico a torta dal titolo "Tipi di Sangue."Il tipo A occupa il 42% del grafico a torta e il tipo O occupa il 44%. Insieme, come A o O, occupano l

Impara facendo: Regola di probabilità Quattro

Commento:

  • La regola di aggiunta per gli eventi disgiunti può naturalmente essere estesa a più di due eventi disgiunti. Prendiamo tre, per esempio. Se A, B e C sono tre eventi disgiunti
Un diagramma di Venn che mostra 3 eventi disgiunti. Come al solito c'è una scatola grigia che mostra l'intero spazio del campione. All'interno di questa scatola grigia ci sono tre cerchi completamente separati. Il primo cerchio è per le occorrenze in A, il secondo per le occorrenze in B e il terzo per le occorrenze in C.

quindi P(A o B o C) = P(A) + P(B) + P(C). La regola è la stessa per qualsiasi numero di eventi disgiunti.

Ho ricevuto questo?: Regola di probabilità Quattro

Ora abbiamo finito con la prima versione della regola di aggiunta (Regola quattro) che è la versione limitata agli eventi disgiunti. Prima di coprire la seconda versione, dobbiamo prima discutere P (A e B).

Trovare P(A e B) usando la logica

Passiamo ora al calcolo

  • P(A e B)= P(si verifica sia l’evento A che l’evento B)

Più tardi, discuteremo le regole per il calcolo di P(A e B).

In primo luogo, vogliamo illustrare che una regola non è necessaria ogni volta che è possibile determinare la risposta attraverso la logica e il conteggio.

Caso speciale:

C’è un caso speciale per il quale sappiamo cosa è uguale a P(A e B) senza applicare alcuna regola.

Impara facendo: Trovare P (A e B) # 1

Quindi, se gli eventi A e B sono disgiunti, allora (per definizione) P(A e B)= 0. Ma cosa succede se gli eventi non sono disgiunti?

Ricorda che la regola 4, la regola di aggiunta, ha due versioni. Uno è limitato agli eventi disgiunti, che abbiamo già trattato, e ci occuperemo della versione più generale più avanti in questo modulo. Lo stesso vale per le probabilità che coinvolgono E

Tuttavia, tranne in casi speciali, ci baseremo sulla LOGICA per trovare P(A e B) in questo corso.

Prima di coprire qualsiasi regola formale, diamo un’occhiata a un esempio in cui gli eventi non sono disgiunti.

ESEMPIO: Stato e genere parodontale

Si consideri la seguente tabella riguardante lo stato parodontale degli individui e il loro genere. Lo stato parodontale si riferisce alla malattia gengivale in cui gli individui sono classificati come sani, hanno gengivite o hanno malattia parodontale.

Abbiamo visto questo tipo di tabella prima quando abbiamo discusso l’analisi dei dati nel caso C → C. Ai fini di questa domanda, useremo questi dati come la nostra “popolazione” e prenderemo in considerazione la selezione casuale di una persona.

Imparare Facendo: Stato Parodontale e di Genere

Ci piace chiedere probabilità domande simili all’esempio precedente (con un due vie tabella sulla base di dati) questo permette di creare connessioni tra questi argomenti e aiuta a tenere un po ‘ di quello che hai imparato su dati fresco nella vostra mente.

Ricordate, il nostro obiettivo primario in questo corso è quello di analizzare i dati della vita reale!

Probabilità Regola Cinque

Ora siamo pronti a passare alla versione estesa della regola Aggiunta.

In questa sezione, impareremo come trovare P(A o B) quando A e B non sono necessariamente disgiunti.

  • Chiameremo questa versione estesa “Regola generale di aggiunta” e la definiremo come Regola di probabilità cinque.

Inizieremo indicando la regola e fornendo un esempio simile ai tipi di problemi che generalmente chiediamo in questo corso. Quindi presenteremo un altro esempio in cui non abbiamo i dati grezzi da un campione da cui lavorare.

Regola di probabilità Cinque:

  • La regola generale di addizione: P(A o B) = P(A) + P(B) – P(A e B).

NOTA: È meglio usare la logica per trovare P(A e B), non un’altra formula.

Un errore molto comune è l’applicazione errata della regola di moltiplicazione per gli eventi indipendenti trattati nella pagina successiva. Ciò sarà corretto solo se A e B sono indipendenti (vedere le definizioni da seguire), il che è raramente il caso nei dati presentati in tabelle bidirezionali.

Come abbiamo visto negli esempi precedenti, quando i due eventi non sono disgiunti, c’è una certa sovrapposizione tra gli eventi.

  • Se aggiungiamo semplicemente le due probabilità insieme, otterremo la risposta sbagliata perché abbiamo contato alcune “probabilità” due volte!
  • Quindi, dobbiamo sottrarre questa probabilità “extra” per arrivare alla risposta corretta. Il diagramma di Venn e le tabelle a due vie sono utili per visualizzare questa idea.

Un diagramma di venn intitolato "A e B NON sono disgiunti."Una scatola grigia rappresenta lo spazio campione e all

Questa regola è più generale poiché funziona per qualsiasi coppia di eventi (anche eventi disgiunti). Il nostro consiglio è ancora quello di cercare di rispondere alla domanda usando la logica e contando quando possibile, altrimenti, dobbiamo essere estremamente attenti a scegliere la regola corretta per il problema.

PRINCIPIO:

Se non è possibile calcolare una probabilità usando la logica e il conteggio non hai BISOGNO di una probabilità regola (anche se la regola corretta può essere sempre applicata)

si Noti che, se A e B sono disgiunti, allora P(A e B) = 0 e regola 5 riduce a regola 4, per questo caso particolare.

Un diagramma di Venn intitolato "A e B sono disgiunti. L

Rivisitiamo l’ultimo esempio:

ESEMPIO: Stato e genere parodontale

Considera la selezione casuale di un individuo tra quelli rappresentati nella seguente tabella per quanto riguarda lo stato parodontale degli individui e il loro genere. Lo stato parodontale si riferisce alla malattia gengivale in cui gli individui sono classificati come sani, hanno gengivite o hanno malattia parodontale.

Esaminiamo ciò che abbiamo imparato finora. Possiamo calcolare qualsiasi probabilità in questo scenario se possiamo determinare quanti individui soddisfano l’evento o la combinazione di eventi.

  • P(Maschio) = 3009/8027 = 0.3749
  • P(Femmina) = 5018/8027 = 0.6251
  • P(Sano) = 3750/8027 = 0.4672
  • P(Sano) = P(Gengivite o Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
    potremmo anche calcolare utilizzando il complemento regola: 1 – P(Sano)

Abbiamo anche trovato in precedenza che

  • P(Maschio E Sano) = 1143/8027 = 0.1424

Regola di richiamo 5, P(A o B) = P(A) + P(B) – P(A e B). Possiamo ora utilizzare questa regola per calcolare P(Maschio O Sano)

  • P(Maschio o Sano) = P(Maschio) + P(Sana) – P(Maschio e Sano) = 0.3749 + 0.4672 – 0.1424 = 0.6997 o circa il 70%

Abbiamo risolto questa domanda prima semplicemente contando quante persone sono di sesso Maschile o Sano o entrambi. L’immagine qui sotto illustra i valori che dobbiamo combinare. Abbiamo bisogno di contare

  • Tutti i maschi
  • Tutti gli individui sani
  • MA, non contare nessuno due volte!!

l’Utilizzo di questo approccio logico avremmo trovato

  • P(Maschio o Sano) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996

Abbiamo una piccola differenza nelle nostre risposte in ultima posizione decimale a causa dell’arrotondamento che si è verificato quando abbiamo calcolato P(Maschio), P(Sano), e P(Maschio e Sano) e poi applicato la regola 5.

Chiaramente la risposta è effettivamente la stessa, circa il 70%. Se portassimo le nostre risposte a più cifre decimali o se usassimo le frazioni originali, potremmo eliminare completamente questa piccola discrepanza.

Diamo un’occhiata a un ultimo esempio per illustrare la regola di probabilità 5 quando è necessaria la regola, cioè quando non abbiamo dati reali.

ESEMPIO: Consegna importante!

È fondamentale che un determinato documento raggiunga la sua destinazione entro un giorno. Per massimizzare le possibilità di consegna puntuale, vengono inviate due copie del documento utilizzando due servizi, il servizio A e il servizio B. È noto che le probabilità di consegna puntuale sono:

  • 0,90 per il servizio A (P(A) = 0,90)
  • 0,80 per il servizio B (P(B) = 0,80)
  • 0.75 per entrambi i servizi in orario (P (A e B) = 0,75)
    (Si noti che A e B non sono disgiunti. Possono accadere insieme alla probabilità 0.75.)

I diagrammi di Venn che seguono illustrano le probabilità P(A), P(B) e P(A e B):

Tre diagrammi di Venn. In tutti c'è un grande rettangolo che rappresenta tutto lo spazio campione S. All'interno di questo rettangolo ci sono due cerchi che si sovrappongono parzialmente. Un cerchio è etichettato A e l'altro è etichettato B. Nel primo diagramma di Venn il cerchio per A è colorato di blu, e vediamo che P(A) = 0,90 . In un certo senso P (A) è l'area del cerchio A. Nel secondo diagramma di Venn il cerchio per B è colorato di blu, ed è contrassegnato che P (B) = 0.80 . Proprio come nel primo diagramma di Venn si può pensare che il cerchio per B abbia un'area di 0,80 . Nel terzo diagramma di Venn l'area che è la sovrapposizione dei cerchi A e B è colorata di blu. P (A e B) = 0,75 . L'area della sovrapposizione può essere pensata come avente un'area di 0,75 .

Nel contesto di questo problema, l’ovvia domanda di interesse è:

  • Qual è la probabilità di consegna puntuale del documento utilizzando questa strategia (di inviarlo tramite entrambi i servizi)?

Il documento raggiungerà la sua destinazione in tempo purché sia consegnato in tempo dal servizio A o dal servizio B o da entrambi i servizi. In altre parole, quando si verifica l’evento A o si verifica l’evento B o si verificano entrambi. cosi….

P(sulla consegna di tempo usando questa strategia)= P (A o B), che è rappresentato dalla regione ombreggiata nel diagramma qui sotto:

Lo stesso diagramma di Venn tranne l'area dei due cerchi è stato colorato di blu (ombreggiato). Ciò significa che anche l'area nella sovrapposizione è colorata di blu. Si noti che l'area di sovrapposizione è stata colorata solo una volta, quindi anche se è in entrambi i cerchi la conteremo una volta.

E ‘ ora possibile

  • utilizzare i tre diagrammi di Venn che rappresenta P(A), P(B) e P(A e B)
  • per vedere che possiamo trovare P(A o B) con l’aggiunta di P(A), rappresentato dal circolo di sinistra) e P(B), rappresentato dal cerchio di destra),
  • quindi sottraendo P(A e B) (rappresentato dalla sovrapposizione), dal momento che abbiamo incluso due volte, una volta come parte di P(A) e una volta come parte di P(B).

Questo è mostrato nella seguente immagine:

L'area di entrambi i cerchi nel diagramma di Venn (contando l'area di sovrapposizione una volta) è calcolata come: l'area di Un cerchio (che include la sovrapposizione) + zona B del cerchio (che comprende anche la sovrapposizione) - area di sovrapposizione. Otteniamo quindi: P(A o B) = P(A) + P(B) - P (A e B).'s circle (which includes the overlap) + the area of B's circle (which also includes the overlap) - the area of the overlap. We therefore get: P(A or B) = P(A) + P(B) - P(A and B).

Se applichiamo questo al nostro esempio, troviamo che:

  • P (A o B)= P (consegna puntuale utilizzando questa strategia)= 0.90 + 0.80 – 0.75 = 0.95.

Quindi la nostra strategia di utilizzare due servizi di consegna aumenta la nostra probabilità di consegna puntuale a 0,95.

Mentre i diagrammi di Venn erano ottimi per visualizzare la regola generale di addizione, in casi come questi è molto più facile visualizzare le informazioni e lavorare con una tabella bidirezionale di probabilità, proprio come abbiamo esaminato la relazione tra due variabili categoriali nella sezione di analisi dei dati esplorativi.

Ti mostreremo semplicemente la tabella, non come la deriviamo poiché non ti verrà chiesto di farlo per noi. Dovresti essere in grado di vedere che alcune logiche e semplici addizioni/sottrazioni sono tutto ciò che abbiamo usato per compilare la tabella sottostante.

La tabella ha le colonne "B", "non B" e "Totale."Le righe sono "A", "non A" e " Totale."Ecco alcune informazioni sulla tabella, organizzate per cella: Alla cella A, B, il valore lì (0.75) è P(A e B) = P(consegna puntuale da entrambi i servizi). Nella cella A, non B, il valore lì (0.15) è P(A e non B) = P(consegna puntuale SOLO per servizio A). Nella cella Non A e B, il valore(0.05) è P(non A e B) = P (consegna puntuale SOLO per servizio B). Nella cella Non A e non B, il valore(0.05) è P(non A e non B) = P (Né servizio A né B consegnati in tempo)."B," "not B," and "Total." The rows are "A," "not A," and "Total." Here are is some information about the table, organized by cell: At the cell A,B, the value there (0.75) is P(A and B) = P(on-time delivery by both services). At the cell A,not B, the value there (0.15) is P(A and Not B) = P(on-time delivery ONLY by service A). At cell Not A and B, the value (0.05) is P(not A and B) = P(on-time delivery ONLY by service B). At cell Not A and Not B, the value (0.05) is P(not A and not B) = P(Neither service A nor B delivered on time).

Quando si utilizza una tabella bidirezionale, dobbiamo ricordarci di guardare l’intera riga o colonna per trovare probabilità complessive che coinvolgono solo A o solo B.

  • P(A) = 0.90 significa che nel 90% dei casi in cui viene utilizzato il servizio A, consegna il documento in tempo. Per trovare questo guardiamo la probabilità totale per la riga contenente A. Nel trovare P (A), non sappiamo se B accade o meno.

La prima riga della tabella è stata evidenziata. Ecco i dati evidenziati in formato riga, colonna: A, B: P(A e B) = 0,75; A, non B: P(A e non B) = 0,15; A, Totale: P(A) = 0,90 = P(A e B) + P(A e non B)'s first row has been highlighted. Here is the highlighted data in "Row, Column" format: A, B: P(A and B) = 0.75; A, not B: P(A and not B) = 0.15; A, Total: P(A) = 0.90 = P(A and B) + P(A and not B)

  • P(B) = 0,80 significa che nell ‘ 80% dei casi in cui viene utilizzato il servizio B, consegna il documento in tempo. Per trovare questo guardiamo la probabilità totale per la colonna contenente B. Nel trovare P (B), non sappiamo se A accade o meno.

La prima colonna della tabella è stata evidenziata. Ecco i dati evidenziati in formato riga, colonna: A, B: P(A e B) = 0,75; non A, B: P (non A e B) = 0.05; B,Totale: P ( B) = 0.80 = P(A e B) + P(non A e B)'s first column has been highlighted. Here is the highlighted data in "Row, Column" format: A,B: P(A and B) = 0.75; not A, B: P(not A and B) = 0.05; B,Total: P(B) = 0.80 = P(A and B) + P(not A and B)

Commento

  • Quando abbiamo usato tabelle bidirezionali nella sezione Exploratory Data Analysis (EDA), è stato quello di registrare i valori di due variabili categoriali per un campione concreto di individui.
  • Al contrario, le informazioni in una tabella a due vie di probabilità sono per un’intera popolazione e i valori sono piuttosto astratti.
  • Se avessimo trattato qualcosa come l’esempio di consegna nella sezione EDA, avremmo registrato il numero effettivo di consegne puntuali (e non puntuali) per campioni di documenti inviati con il servizio A o B.
  • In questa sezione, le probabilità a lungo termine sono presentate come note.
  • Presumibilmente, le probabilità riportate in questo esempio di consegna erano basate su frequenze relative registrate su molte ripetizioni.

Applet interattiva: Probability Venn Diagram

Regola empirica di arrotondamento per probabilità:

Seguire le seguenti linee guida generali in questo corso. In caso di dubbio portare più cifre decimali. Se specifichiamo dare esattamente ciò che viene richiesto.

  • In generale è necessario portare le probabilità ad almeno 4 cifre decimali per i passaggi intermedi.
  • Spesso arrotondiamo la nostra risposta finale a due o tre cifre decimali.
  • Per probabilità estremamente ridotte, è importante avere 1 o due cifre significative (cifre diverse da zero), come 0,000001 o 0,000034, ecc.

computer di Molti pacchetti, potrebbe apparire estremamente piccoli valori utilizzando la notazione scientifica come

  • 58×10-5 o 1.58 E-5 per rappresentare 0.0000158

riassumiamo

finora nel nostro studio di probabilità, sono stati introdotti al volte contro-intuitivo natura della probabilità e i fondamenti che sono alla base di probabilità, come frequenza relativa.

Ti abbiamo anche dato alcuni strumenti per aiutarti a trovare le probabilità degli eventi — vale a dire le regole di probabilità.

Probabilmente hai notato che la sezione di probabilità era significativamente diversa dalle due sezioni precedenti; ha una componente tecnico/matematica molto più grande, quindi i risultati tendono ad essere più di natura “giusta o sbagliata”.

Nella sezione di analisi dei dati esplorativi, per la maggior parte, il computer si occupava dell’aspetto tecnico delle cose, e il nostro compito era quello di dirgli di fare la cosa giusta e quindi interpretare i risultati.

In probabilità, facciamo il lavoro dall’inizio alla fine, dalla scelta dello strumento giusto (regola) da usare, all’utilizzo corretto, all’interpretazione dei risultati.

Ecco un riassunto delle regole che abbiamo presentato finora.

1. La regola di probabilità n. 1 afferma:

  • Per ogni evento A, 0 ≤ P (A) ≤ 1

2. La regola di probabilità n. 2 afferma:

  • La somma delle probabilità di tutti i possibili risultati è 1

3. Il Complemento Regola (#3) afferma che

  • P(A) = 1 – P(A)

o quando riorganizzate

  • P(A) = 1 – P(A)

L’ultima rappresentazione del Complemento Regola è particolarmente utile quando abbiamo bisogno di trovare la probabilità di eventi del tipo “almeno uno dei …”

4. La Regola Generale di addizione (#5) afferma che per due eventi qualsiasi,

  • P(A o B) = P(A) + P(B) – P(A e B),

dove, per P(A o B) intendiamo P (A si verifica o B si verifica o entrambi).

Nel caso speciale di eventi disgiunti, eventi che non possono verificarsi insieme, la Regola Generale di aggiunta può essere ridotta alla Regola di aggiunta per Eventi disgiunti (#4), che è

  • P(A o B) = P(A) + P(B). *

* Utilizzare SOLO quando si è CONVINTI che gli eventi siano disgiunti (NON si sovrappongono)

5. La versione limitata della regola di aggiunta (per gli eventi disgiunti) può essere facilmente estesa a più di due eventi.

6. Finora, abbiamo trovato solo P (A e B) usando la logica e il conteggio in semplici esempi

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *