- Introduzione
- le Regole di Probabilità
- Probabilità Regola (Per ogni evento A, 0 ≤ P(A) ≤ 1)
- Probabilità di Regola Due (La somma delle probabilità di tutti i possibili esiti: 1)
- Probabilità Regola del Tre (Il Complemento Regola)
- le Probabilità che Coinvolgono Molteplici Eventi
- Probabilità di Regola Quattro (Oltre Regola per Eventi Disgiunti)
- Trovare P(A e B) usando la Logica
- Probabilità Regola Cinque (La regola generale di addizione)
- Arrotondamento Regola empirica per probabilità
- Riassumiamo
Nella sezione precedente, abbiamo introdotto la probabilità come un modo per quantificare l’incertezza che deriva dalla conduzione di esperimenti utilizzando un campione casuale dalla popolazione di interesse.
Abbiamo visto che la probabilità di un evento (ad esempio, l’evento in cui una persona scelta a caso ha il gruppo sanguigno O) può essere stimata dalla frequenza relativa con cui l’evento si verifica in una lunga serie di prove. Quindi raccoglieremo dati da molti individui per stimare la probabilità che qualcuno abbia il gruppo sanguigno O.
In questa sezione, stabiliremo i metodi e i principi di base per trovare le probabilità degli eventi.
Tratteremo anche alcune delle regole di base della probabilità che possono essere utilizzate per calcolare le probabilità.
Introduzione
Inizieremo con un classico esempio di probabilità di lanciare una moneta giusta tre volte.
Poiché teste e code sono ugualmente probabili per ogni lancio in questo scenario, ciascuna delle possibilità che può derivare da tre lanci sarà ugualmente probabile in modo da poter elencare tutti i valori possibili e utilizzare questa lista per calcolare le probabilità.
Poiché il nostro focus in questo corso è su dati e statistiche (non probabilità teorica), nella maggior parte dei nostri problemi futuri useremo un set di dati riepilogati, di solito una tabella di frequenza o una tabella a due vie, per calcolare le probabilità.
ESEMPIO: Lancio di una moneta tre volte
la lista ogni possibile risultato (o risultato possibile):
{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}
Ora si possono definire i seguenti eventi:
Evento: “non H”
l’Evento B: “Ottenere esattamente un H”
l’Evento C: “Ottenere almeno un H”
si noti che ogni evento è, infatti, una dichiarazione circa l’esito che l’esperimento sta per produrre. In pratica, ogni evento corrisponde ad una raccolta (sottoinsieme) dei possibili risultati.
Evento A:” Non ottenere H ” → TTT
Evento B: “Ottenere esattamente un H” → HTT, THT, TTH
l’Evento C: “Ottenere almeno un H” → HTT, THT, TTH, THH, HTH, HHT, HHH
Qui è una rappresentazione visiva di eventi, B e C.
Da questa rappresentazione visiva degli eventi, è facile vedere che l’evento B è totalmente compresa nel caso C, nel senso che ogni risultato in un evento B è anche un risultato in caso C. si noti, Inoltre, che l’evento A si distingue da eventi B e C, nel senso che essi non hanno alcun esito in comune, o non si sovrappongono. A questo punto queste sono solo osservazioni degne di nota, ma come scoprirai più avanti, sono molto importanti.
Cosa succede se abbiamo aggiunto il nuovo evento:
Evento D: “Ottenere una T al primo lancio” → THH, THT, TTH, TTT
Come apparirebbe se avessimo aggiunto l’evento D al diagramma sopra? (Link alla risposta)
Ricorda, poiché H e T sono ugualmente probabili su ogni lancio, e poiché ci sono 8 possibili risultati, la probabilità di ciascun risultato è 1/8.
Vedi se puoi rispondere alle seguenti domande usando i diagrammi e / o l’elenco dei risultati per ogni evento insieme a ciò che hai imparato finora sulla probabilità.
Se sei stato in grado di rispondere correttamente a queste domande, probabilmente hai un buon istinto per calcolare la probabilità! Continua a leggere per imparare come applicheremo questa conoscenza.
In caso contrario, cercheremo di aiutarti a sviluppare questa abilità in questa sezione.
Commento:
- Nota che nell’evento C, “Ottenere almeno una testa” c’è solo un risultato possibile che manca, “Non ottenere teste” = TTT. Ci occuperemo di questo ancora una volta quando si parla di regole di probabilità, in particolare la regola del complemento. A questo punto, vogliamo solo che tu pensi a come questi due eventi siano “opposti” in questo scenario.
È MOLTO importante rendersi conto che solo perché possiamo elencare i possibili risultati, questo non implica che ogni risultato sia ugualmente probabile.
Questo è il messaggio (divertente) nella clip di Daily Show che abbiamo fornito nella pagina precedente. Ma ripensiamoci. In quella clip, Walter afferma che poiché ci sono due possibili risultati, la probabilità è 0.5. I due esiti possibili sono:
- Il mondo sarà distrutto a causa dell’uso del large hadron collider
- Il mondo NON sarà distrutto a causa dell’uso del large hadron collider
Speriamo sia chiaro che questi due risultati non sono altrettanto probabile!!
Consideriamo un esempio più comune.
ESEMPIO: Difetti alla nascita
Supponiamo di selezionare casualmente tre bambini e siamo interessati alla probabilità che nessuno dei bambini abbia difetti alla nascita.
Usiamo la notazione D per rappresentare un bambino nato con un difetto di nascita e N per rappresentare il bambino nato senza difetto di nascita. Possiamo elencare i possibili esiti, proprio come abbiamo fatto per il lancio della moneta, sono:
{DDD, NDD, DND, DDN, DNN, NDN, NND, NNN}
Sono eventi DDD (tutti e tre i bambini sono nati con difetti alla nascita) e NNN (nessuno dei bambini sono nati con difetti alla nascita), altrettanto probabilmente?
Dovrebbe essere ragionevole per te che P(NNN) è molto più grande di P (DDD).
Questo perché P(N) e P(D) non sono eventi altrettanto probabili.
È raro (certamente non il 50%) che un bambino selezionato casualmente nasca con un difetto alla nascita.
Regole di probabilità
Ora passiamo ad imparare alcune delle regole di base di probabilità.
Fortunatamente, queste regole sono molto intuitive, e finché vengono applicate sistematicamente, ci permetteranno di risolvere problemi più complicati; in particolare, quei problemi per i quali la nostra intuizione potrebbe essere inadeguata.
Poiché la maggior parte delle probabilità che ti verrà chiesto di trovare può essere calcolata utilizzando sia la logica
- che il conteggio
e
- le regole che impareremo,
diamo il seguente consiglio come principio.
PRINCIPIO:
Se non è possibile calcolare una probabilità usando la logica e il conteggio non hai BISOGNO di una probabilità regola (anche se la regola corretta può essere sempre applicata)
Probabilità la Regola numero Uno
la Nostra prima regola, semplicemente ci ricorda le proprietà di base di probabilità che abbiamo già imparato.
La probabilità di un evento, che ci informa della probabilità che si verifichi, può variare da 0 (indicando che l’evento non si verificherà mai) a 1 (indicando che l’evento è certo).
Regola di probabilità Uno:
- Per qualsiasi evento A, 0 ≤ P(A) ≤ 1.
NOTA: Un uso pratico di questa regola è che può essere utilizzato per identificare qualsiasi calcolo di probabilità che risulta essere più di 1 (o meno di 0) come errato.
Prima di passare alle altre regole, diamo prima un’occhiata a un esempio che fornirà un contesto per illustrare le prossime regole.
ESEMPIO: Gruppi sanguigni
Come discusso in precedenza, tutto il sangue umano può essere digitato come O, A, B o AB.
Inoltre, la frequenza del verificarsi di questi tipi di sangue varia in base ai gruppi etnici e razziali.
Secondo il Blood Center della Stanford University (bloodcenter.Stanford.edu), queste sono le probabilità dei gruppi sanguigni umani negli Stati Uniti (la probabilità per il tipo A è stata omessa di proposito):
Domanda motivante per la regola 2: una persona negli Stati Uniti viene scelta a caso. Qual è la probabilità che la persona abbia il gruppo sanguigno A?
Risposta: La nostra intuizione ci dice che poiché i quattro tipi di sangue O, A, B e AB esauriscono tutte le possibilità, le loro probabilità insieme devono sommare a 1, che è la probabilità di un evento “certo” (una persona ha uno di questi 4 tipi di sangue per certo).
Poiché le probabilità di O, B e AB insieme si sommano a 0.44 + 0.1 + 0.04 = 0.58, la probabilità di tipo A deve essere il restante 0.42 (1 – 0.58 = 0.42):
Regola di probabilità Due
Questo esempio illustra la nostra seconda regola, che ci dice che la probabilità di tutti i possibili risultati insieme deve essere 1.
Probabilità Regola due:
La somma delle probabilità di tutti i possibili risultati è 1.
Questo è un buon posto per confrontare e contrastare ciò che stiamo facendo qui con ciò che abbiamo imparato nella sezione Exploratory Data Analysis (EDA).
- Si noti che in questo problema ci stiamo essenzialmente concentrando su una singola variabile categoriale: il gruppo sanguigno.
- Abbiamo riassunto questa variabile sopra, come abbiamo riassunto le singole variabili categoriali nella sezione EDA, elencando quali valori assume la variabile e quanto spesso li prende.
- In EDA abbiamo usato le percentuali, e qui stiamo usando le probabilità, ma i due trasmettono le stesse informazioni.
- Nella sezione EDA, abbiamo appreso che un grafico a torta fornisce una visualizzazione appropriata quando è coinvolta una singola variabile categoriale, e allo stesso modo possiamo usarlo qui (usando percentuali invece di probabilità):
Anche se quello che stiamo facendo qui è davvero simile a quello che abbiamo fatto in EDA sezione, c’è una sottile ma importante differenza tra il sottostante situazioni
- In EDA, abbiamo riassunto i dati che sono stati ottenuti da un sampleof individui per i quali i valori della variabile di interesse sono stati registrati.
- Qui, quando presentiamo la probabilità di ciascun gruppo sanguigno, abbiamo in mente l’intera popolazione di persone negli Stati Uniti, per la quale presumiamo di conoscere la frequenza complessiva dei valori presi dalla variabile di interesse.
Probability Rule Three
Nella probabilità e nelle sue applicazioni, siamo spesso interessati a scoprire la probabilità che un determinato evento non si verifichi.
Un punto importante da capire è che “l’evento non si verifica” è un evento separato che consiste di tutti i possibili esiti che non sono in e viene chiamato “il complemento caso di A.”
Notazione: si scrive “non” per indicare l’evento che non si verifica. Ecco una rappresentazione visiva di come l’evento A e il suo evento complementare “non A” insieme rappresentano tutti i possibili risultati.
Commento:
- Tale visualizzazione è chiamata “diagramma di Venn.”Un diagramma di Venn è un modo semplice per visualizzare gli eventi e le relazioni tra loro utilizzando rettangoli e cerchi.
La regola 3 riguarda la relazione tra la probabilità di un evento e la probabilità del suo evento complementare.
Dato che l’evento A e l’evento “non è Un” insieme di tutti i possibili esiti, e poiché la regola 2 ci dice che la somma delle probabilità di tutti i possibili esiti è 1, la seguente regola dovrebbe essere abbastanza intuitivo:
Probabilità Regola del Tre (Il Complemento Regola):
- P(A) = 1 – P(A)
- che è, la probabilità che un evento non si verifica è 1 meno la probabilità che si verifichi.
ESEMPIO: Tipi di Sangue
Torna per il tipo di sangue esempio:
Ecco alcune informazioni aggiuntive:
- Una persona con tipo Un possibile donare il sangue per una persona con tipo A o AB.
- Una persona con tipo B può donare sangue a una persona con tipo B o AB.
- Una persona con tipo AB può donare il sangue solo a una persona con tipo AB.
- Una persona con sangue di tipo O può donare a chiunque.
Qual è la probabilità che una persona scelta a caso non possa donare il sangue a tutti? In altre parole, qual è la probabilità che una persona scelta a caso non abbia il gruppo sanguigno O? Dobbiamo trovare P (non O). Usando la regola del complemento, P (non O) = 1 – P(O) = 1 – 0,44 = 0,56. In altre parole, il 56% della popolazione statunitense non ha il gruppo sanguigno O:
Chiaramente, potremmo anche trovare P(non O) direttamente aggiungendo le probabilità di B, AB e A.
Commento:
- Si noti che la regola del complemento, P(non A) = 1 – P(A) può essere riformulata come P(A) = 1-P(non A).
- P(non A) = 1 – P(A)
- può essere riformulato come P(A) = 1-P(non A).
- Questa manipolazione algebrica apparentemente banale ha un’applicazione importante e cattura effettivamente la forza della regola del complemento.
- In alcuni casi, quando trovare P(A) direttamente è molto complicato, potrebbe essere molto più facile trovare P(non A) e quindi sottrarlo da 1 per ottenere il P(A) desiderato.
- Torneremo presto a questo commento e forniremo ulteriori esempi.
- La regola del complemento può essere utile ogni volta che è più facile calcolare la probabilità del complemento dell’evento piuttosto che dell’evento stesso.
- Avviso, abbiamo di nuovo usato la frase “almeno uno.”
- Ora abbiamo visto che il complemento di “almeno uno …” è “nessuno none” o ” no….”(come abbiamo accennato in precedenza in termini di eventi che sono “opposti”).
- Nell’attività di cui sopra vediamo che
- P(NESSUNO di questi due effetti collaterali) = 1 – P(almeno uno di questi due effetti collaterali)
- Questa è un’applicazione comune della regola del complemento che spesso puoi riconoscere con la frase “almeno uno” nel problema.
le Probabilità che Coinvolgono Molteplici Eventi
Ci sarà spesso interessati a trovare la probabilità che coinvolgono più eventi come
- P(A o B) = P(evento A si verifica o di un evento B si verifica o entrambi si verificano)
- P(A e B)= P(entrambi evento si verifica, e l’evento B si verifica)
Un problema comune con la terminologia si riferisce a quanto siamo soliti pensare “o” nella nostra vita quotidiana. Ad esempio, quando un genitore dice a suo figlio in un negozio di giocattoli “Vuoi un giocattolo A o un giocattolo B?”, questo significa che il bambino sta per ottenere un solo giocattolo e lui o lei deve scegliere tra di loro. Ottenere entrambi i giocattoli di solito non è un’opzione.
Al contrario:
In probabilità, “O” significa uno o l’altro o entrambi.
e così P(A o B) = P(si verifica l’evento A o si verifica l’evento B o SI verificano ENTRAMBI)
Detto questo, va notato che ci sono alcuni casi in cui è semplicemente impossibile che i due eventi si verifichino entrambi allo stesso tempo.
Probabilità Regola Quattro
La distinzione tra eventi che possono accadere insieme e quelli che non possono è importante.
Disgiunto: Due eventi che non possono verificarsi contemporaneamente sono chiamati disgiunti o si escludono a vicenda. (Useremo disgiunto.)
Dovrebbe essere chiaro dall’immagine che
- nel primo caso, dove gli eventi NON sono disgiunti, P(A e B) 0 0
- nel secondo caso, dove gli eventi SONO disgiunti, P(A e B) = 0.
Ecco due esempi:
ESEMPIO:
Considera i seguenti due eventi:
A — una persona scelta a caso ha il gruppo sanguigno A, e
B — una persona scelta a caso ha il gruppo sanguigno B.
In rari casi, è possibile che una persona abbia più di un tipo di sangue che scorre attraverso le sue vene, ma per i nostri scopi, assumeremo che ogni persona possa avere un solo gruppo sanguigno. Pertanto, è impossibile che gli eventi A e B si verifichino insieme.
- Gli eventi A e B sono DISGIUNTI
D’altra parte …
ESEMPIO:
Considera i seguenti due eventi:
A — una persona scelta a caso ha un gruppo sanguigno A
B — una persona scelta a caso è una donna.
In questo caso, è possibile che gli eventi A e B si verifichino insieme.
- Gli eventi A e B NON sono DISGIUNTI.
I diagrammi di Venn suggeriscono che un altro modo di pensare agli eventi disgiunti rispetto a quelli non disgiunti è che gli eventi disgiunti non si sovrappongono. Non condividono nessuno dei possibili risultati, e quindi non possono accadere insieme.
D’altra parte, gli eventi che non sono disgiunti si sovrappongono nel senso che condividono alcuni dei possibili risultati e quindi possono verificarsi allo stesso tempo.
Ora iniziamo con una semplice regola per trovare P(A o B) per eventi disgiunti.
Regola di probabilità Quattro (la regola di aggiunta per gli eventi disgiunti):
- Se A e B sono eventi disgiunti, allora P(A o B) = P(A) + P(B).
Commento:
- Quando si ha a che fare con le probabilità, la parola ” or ” sarà sempre associata all’operazione di addizione; da qui il nome di questa regola, ” La regola aggiunta.”
ESEMPIO: Tipi di Sangue
Richiamare il sangue di tipo esempio:
Ecco alcune informazioni aggiuntive
- Una persona con il tipo di Acan donare il sangue per una persona con tipo A o AB.
- Una persona con tipo Bpuò donare sangue a una persona con tipo B o AB.
- Una persona con tipo ABpuò donare il sangue a una persona con tipo AB
- Una persona con tipo Oblood può donare a chiunque.
Qual è la probabilità che una persona scelta a caso sia un potenziale donatore per una persona con gruppo sanguigno A?
Dalle informazioni fornite, sappiamo che essere un potenziale donatore per una persona con gruppo sanguigno A significa avere gruppo sanguigno A o O.
Abbiamo quindi bisogno di trovare P(A o O). Poiché gli eventi A e O sono disgiunti, possiamo usare la regola di aggiunta per gli eventi disgiunti per ottenere:
- P (A o O) = P(A) + P(O) = 0.42 + 0.44 = 0.86.
È facile capire perché aggiungere la probabilità ha effettivamente senso.
Se il 42% della popolazione ha il sangue di tipo A e il 44% della popolazione ha sangue di tipo O,
- quindi il 42% + 44% = 86% della popolazione ha il sangue di tipo A o O e, quindi, i potenziali donatori per una persona con sangue di tipo A.
Questo ragionamento sul perché l’aggiunta della regola di senso possono essere visualizzati utilizzando il grafico a torta sottostante:
Commento:
- La regola di aggiunta per gli eventi disgiunti può naturalmente essere estesa a più di due eventi disgiunti. Prendiamo tre, per esempio. Se A, B e C sono tre eventi disgiunti
quindi P(A o B o C) = P(A) + P(B) + P(C). La regola è la stessa per qualsiasi numero di eventi disgiunti.
Ora abbiamo finito con la prima versione della regola di aggiunta (Regola quattro) che è la versione limitata agli eventi disgiunti. Prima di coprire la seconda versione, dobbiamo prima discutere P (A e B).
Trovare P(A e B) usando la logica
Passiamo ora al calcolo
- P(A e B)= P(si verifica sia l’evento A che l’evento B)
Più tardi, discuteremo le regole per il calcolo di P(A e B).
In primo luogo, vogliamo illustrare che una regola non è necessaria ogni volta che è possibile determinare la risposta attraverso la logica e il conteggio.
Caso speciale:
C’è un caso speciale per il quale sappiamo cosa è uguale a P(A e B) senza applicare alcuna regola.
Quindi, se gli eventi A e B sono disgiunti, allora (per definizione) P(A e B)= 0. Ma cosa succede se gli eventi non sono disgiunti?
Ricorda che la regola 4, la regola di aggiunta, ha due versioni. Uno è limitato agli eventi disgiunti, che abbiamo già trattato, e ci occuperemo della versione più generale più avanti in questo modulo. Lo stesso vale per le probabilità che coinvolgono E
Tuttavia, tranne in casi speciali, ci baseremo sulla LOGICA per trovare P(A e B) in questo corso.
Prima di coprire qualsiasi regola formale, diamo un’occhiata a un esempio in cui gli eventi non sono disgiunti.
ESEMPIO: Stato e genere parodontale
Si consideri la seguente tabella riguardante lo stato parodontale degli individui e il loro genere. Lo stato parodontale si riferisce alla malattia gengivale in cui gli individui sono classificati come sani, hanno gengivite o hanno malattia parodontale.
Abbiamo visto questo tipo di tabella prima quando abbiamo discusso l’analisi dei dati nel caso C → C. Ai fini di questa domanda, useremo questi dati come la nostra “popolazione” e prenderemo in considerazione la selezione casuale di una persona.
Ci piace chiedere probabilità domande simili all’esempio precedente (con un due vie tabella sulla base di dati) questo permette di creare connessioni tra questi argomenti e aiuta a tenere un po ‘ di quello che hai imparato su dati fresco nella vostra mente.
Probabilità Regola Cinque
Ora siamo pronti a passare alla versione estesa della regola Aggiunta.
In questa sezione, impareremo come trovare P(A o B) quando A e B non sono necessariamente disgiunti.
- Chiameremo questa versione estesa “Regola generale di aggiunta” e la definiremo come Regola di probabilità cinque.
Inizieremo indicando la regola e fornendo un esempio simile ai tipi di problemi che generalmente chiediamo in questo corso. Quindi presenteremo un altro esempio in cui non abbiamo i dati grezzi da un campione da cui lavorare.
Regola di probabilità Cinque:
- La regola generale di addizione: P(A o B) = P(A) + P(B) – P(A e B).
NOTA: È meglio usare la logica per trovare P(A e B), non un’altra formula.
Un errore molto comune è l’applicazione errata della regola di moltiplicazione per gli eventi indipendenti trattati nella pagina successiva. Ciò sarà corretto solo se A e B sono indipendenti (vedere le definizioni da seguire), il che è raramente il caso nei dati presentati in tabelle bidirezionali.
Come abbiamo visto negli esempi precedenti, quando i due eventi non sono disgiunti, c’è una certa sovrapposizione tra gli eventi.
- Se aggiungiamo semplicemente le due probabilità insieme, otterremo la risposta sbagliata perché abbiamo contato alcune “probabilità” due volte!
- Quindi, dobbiamo sottrarre questa probabilità “extra” per arrivare alla risposta corretta. Il diagramma di Venn e le tabelle a due vie sono utili per visualizzare questa idea.
Questa regola è più generale poiché funziona per qualsiasi coppia di eventi (anche eventi disgiunti). Il nostro consiglio è ancora quello di cercare di rispondere alla domanda usando la logica e contando quando possibile, altrimenti, dobbiamo essere estremamente attenti a scegliere la regola corretta per il problema.
PRINCIPIO:
Se non è possibile calcolare una probabilità usando la logica e il conteggio non hai BISOGNO di una probabilità regola (anche se la regola corretta può essere sempre applicata)
si Noti che, se A e B sono disgiunti, allora P(A e B) = 0 e regola 5 riduce a regola 4, per questo caso particolare.
Rivisitiamo l’ultimo esempio:
ESEMPIO: Stato e genere parodontale
Considera la selezione casuale di un individuo tra quelli rappresentati nella seguente tabella per quanto riguarda lo stato parodontale degli individui e il loro genere. Lo stato parodontale si riferisce alla malattia gengivale in cui gli individui sono classificati come sani, hanno gengivite o hanno malattia parodontale.
Esaminiamo ciò che abbiamo imparato finora. Possiamo calcolare qualsiasi probabilità in questo scenario se possiamo determinare quanti individui soddisfano l’evento o la combinazione di eventi.
- P(Maschio) = 3009/8027 = 0.3749
- P(Femmina) = 5018/8027 = 0.6251
- P(Sano) = 3750/8027 = 0.4672
- P(Sano) = P(Gengivite o Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
potremmo anche calcolare utilizzando il complemento regola: 1 – P(Sano)
Abbiamo anche trovato in precedenza che
- P(Maschio E Sano) = 1143/8027 = 0.1424
Regola di richiamo 5, P(A o B) = P(A) + P(B) – P(A e B). Possiamo ora utilizzare questa regola per calcolare P(Maschio O Sano)
- P(Maschio o Sano) = P(Maschio) + P(Sana) – P(Maschio e Sano) = 0.3749 + 0.4672 – 0.1424 = 0.6997 o circa il 70%
Abbiamo risolto questa domanda prima semplicemente contando quante persone sono di sesso Maschile o Sano o entrambi. L’immagine qui sotto illustra i valori che dobbiamo combinare. Abbiamo bisogno di contare
- Tutti i maschi
- Tutti gli individui sani
- MA, non contare nessuno due volte!!
l’Utilizzo di questo approccio logico avremmo trovato
- P(Maschio o Sano) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996
Abbiamo una piccola differenza nelle nostre risposte in ultima posizione decimale a causa dell’arrotondamento che si è verificato quando abbiamo calcolato P(Maschio), P(Sano), e P(Maschio e Sano) e poi applicato la regola 5.
Chiaramente la risposta è effettivamente la stessa, circa il 70%. Se portassimo le nostre risposte a più cifre decimali o se usassimo le frazioni originali, potremmo eliminare completamente questa piccola discrepanza.
Diamo un’occhiata a un ultimo esempio per illustrare la regola di probabilità 5 quando è necessaria la regola, cioè quando non abbiamo dati reali.
ESEMPIO: Consegna importante!
È fondamentale che un determinato documento raggiunga la sua destinazione entro un giorno. Per massimizzare le possibilità di consegna puntuale, vengono inviate due copie del documento utilizzando due servizi, il servizio A e il servizio B. È noto che le probabilità di consegna puntuale sono:
- 0,90 per il servizio A (P(A) = 0,90)
- 0,80 per il servizio B (P(B) = 0,80)
- 0.75 per entrambi i servizi in orario (P (A e B) = 0,75)
(Si noti che A e B non sono disgiunti. Possono accadere insieme alla probabilità 0.75.)
I diagrammi di Venn che seguono illustrano le probabilità P(A), P(B) e P(A e B):
Nel contesto di questo problema, l’ovvia domanda di interesse è:
- Qual è la probabilità di consegna puntuale del documento utilizzando questa strategia (di inviarlo tramite entrambi i servizi)?
Il documento raggiungerà la sua destinazione in tempo purché sia consegnato in tempo dal servizio A o dal servizio B o da entrambi i servizi. In altre parole, quando si verifica l’evento A o si verifica l’evento B o si verificano entrambi. cosi….
P(sulla consegna di tempo usando questa strategia)= P (A o B), che è rappresentato dalla regione ombreggiata nel diagramma qui sotto:
E ‘ ora possibile
- utilizzare i tre diagrammi di Venn che rappresenta P(A), P(B) e P(A e B)
- per vedere che possiamo trovare P(A o B) con l’aggiunta di P(A), rappresentato dal circolo di sinistra) e P(B), rappresentato dal cerchio di destra),
- quindi sottraendo P(A e B) (rappresentato dalla sovrapposizione), dal momento che abbiamo incluso due volte, una volta come parte di P(A) e una volta come parte di P(B).
Questo è mostrato nella seguente immagine:
Se applichiamo questo al nostro esempio, troviamo che:
- P (A o B)= P (consegna puntuale utilizzando questa strategia)= 0.90 + 0.80 – 0.75 = 0.95.
Quindi la nostra strategia di utilizzare due servizi di consegna aumenta la nostra probabilità di consegna puntuale a 0,95.
Mentre i diagrammi di Venn erano ottimi per visualizzare la regola generale di addizione, in casi come questi è molto più facile visualizzare le informazioni e lavorare con una tabella bidirezionale di probabilità, proprio come abbiamo esaminato la relazione tra due variabili categoriali nella sezione di analisi dei dati esplorativi.
Ti mostreremo semplicemente la tabella, non come la deriviamo poiché non ti verrà chiesto di farlo per noi. Dovresti essere in grado di vedere che alcune logiche e semplici addizioni/sottrazioni sono tutto ciò che abbiamo usato per compilare la tabella sottostante.
Quando si utilizza una tabella bidirezionale, dobbiamo ricordarci di guardare l’intera riga o colonna per trovare probabilità complessive che coinvolgono solo A o solo B.
- P(A) = 0.90 significa che nel 90% dei casi in cui viene utilizzato il servizio A, consegna il documento in tempo. Per trovare questo guardiamo la probabilità totale per la riga contenente A. Nel trovare P (A), non sappiamo se B accade o meno.
- P(B) = 0,80 significa che nell ‘ 80% dei casi in cui viene utilizzato il servizio B, consegna il documento in tempo. Per trovare questo guardiamo la probabilità totale per la colonna contenente B. Nel trovare P (B), non sappiamo se A accade o meno.
Commento
- Quando abbiamo usato tabelle bidirezionali nella sezione Exploratory Data Analysis (EDA), è stato quello di registrare i valori di due variabili categoriali per un campione concreto di individui.
- Al contrario, le informazioni in una tabella a due vie di probabilità sono per un’intera popolazione e i valori sono piuttosto astratti.
- Se avessimo trattato qualcosa come l’esempio di consegna nella sezione EDA, avremmo registrato il numero effettivo di consegne puntuali (e non puntuali) per campioni di documenti inviati con il servizio A o B.
- In questa sezione, le probabilità a lungo termine sono presentate come note.
- Presumibilmente, le probabilità riportate in questo esempio di consegna erano basate su frequenze relative registrate su molte ripetizioni.
Regola empirica di arrotondamento per probabilità:
Seguire le seguenti linee guida generali in questo corso. In caso di dubbio portare più cifre decimali. Se specifichiamo dare esattamente ciò che viene richiesto.
- In generale è necessario portare le probabilità ad almeno 4 cifre decimali per i passaggi intermedi.
- Spesso arrotondiamo la nostra risposta finale a due o tre cifre decimali.
- Per probabilità estremamente ridotte, è importante avere 1 o due cifre significative (cifre diverse da zero), come 0,000001 o 0,000034, ecc.
computer di Molti pacchetti, potrebbe apparire estremamente piccoli valori utilizzando la notazione scientifica come
- 58×10-5 o 1.58 E-5 per rappresentare 0.0000158
riassumiamo
finora nel nostro studio di probabilità, sono stati introdotti al volte contro-intuitivo natura della probabilità e i fondamenti che sono alla base di probabilità, come frequenza relativa.
Ti abbiamo anche dato alcuni strumenti per aiutarti a trovare le probabilità degli eventi — vale a dire le regole di probabilità.
Probabilmente hai notato che la sezione di probabilità era significativamente diversa dalle due sezioni precedenti; ha una componente tecnico/matematica molto più grande, quindi i risultati tendono ad essere più di natura “giusta o sbagliata”.
Nella sezione di analisi dei dati esplorativi, per la maggior parte, il computer si occupava dell’aspetto tecnico delle cose, e il nostro compito era quello di dirgli di fare la cosa giusta e quindi interpretare i risultati.
In probabilità, facciamo il lavoro dall’inizio alla fine, dalla scelta dello strumento giusto (regola) da usare, all’utilizzo corretto, all’interpretazione dei risultati.
Ecco un riassunto delle regole che abbiamo presentato finora.
1. La regola di probabilità n. 1 afferma:
- Per ogni evento A, 0 ≤ P (A) ≤ 1
2. La regola di probabilità n. 2 afferma:
- La somma delle probabilità di tutti i possibili risultati è 1
3. Il Complemento Regola (#3) afferma che
- P(A) = 1 – P(A)
o quando riorganizzate
- P(A) = 1 – P(A)
L’ultima rappresentazione del Complemento Regola è particolarmente utile quando abbiamo bisogno di trovare la probabilità di eventi del tipo “almeno uno dei …”
4. La Regola Generale di addizione (#5) afferma che per due eventi qualsiasi,
- P(A o B) = P(A) + P(B) – P(A e B),
dove, per P(A o B) intendiamo P (A si verifica o B si verifica o entrambi).
Nel caso speciale di eventi disgiunti, eventi che non possono verificarsi insieme, la Regola Generale di aggiunta può essere ridotta alla Regola di aggiunta per Eventi disgiunti (#4), che è
- P(A o B) = P(A) + P(B). *
* Utilizzare SOLO quando si è CONVINTI che gli eventi siano disgiunti (NON si sovrappongono)
5. La versione limitata della regola di aggiunta (per gli eventi disgiunti) può essere facilmente estesa a più di due eventi.
6. Finora, abbiamo trovato solo P (A e B) usando la logica e il conteggio in semplici esempi