- Einführung
- Wahrscheinlichkeitsregeln
- Wahrscheinlichkeitsregel Eins (Für jedes Ereignis A, 0 ≤ P(A) ≤ 1)
- Wahrscheinlichkeitsregel Zwei (Die Summe der Wahrscheinlichkeiten aller möglichen Ergebnisse ist 1)
- Wahrscheinlichkeitsregel drei (Die Komplementregel)
- Wahrscheinlichkeiten mit mehreren Ereignissen
- Wahrscheinlichkeitsregel Vier (Additionsregel für disjunkte Ereignisse)
- P(A und B) mit Logik finden
- Wahrscheinlichkeitsregel Fünf (Die allgemeine Additionsregel)
- Faustregel für die Rundung der Wahrscheinlichkeit
- Fassen wir zusammen
Im vorherigen Abschnitt haben wir die Wahrscheinlichkeit eingeführt, um die Unsicherheit zu quantifizieren, die sich aus der Durchführung von Experimenten mit einer Zufallsstichprobe aus der interessierenden Population ergibt.
Wir haben gesehen, dass die Wahrscheinlichkeit eines Ereignisses (z. B. das Ereignis, dass eine zufällig ausgewählte Person Blutgruppe O hat) anhand der relativen Häufigkeit geschätzt werden kann, mit der das Ereignis in einer langen Reihe von Studien auftritt. Daher würden wir Daten von vielen Personen sammeln, um die Wahrscheinlichkeit abzuschätzen, dass jemand die Blutgruppe O hat.
In diesem Abschnitt werden wir die grundlegenden Methoden und Prinzipien zum Ermitteln von Wahrscheinlichkeiten von Ereignissen festlegen.
Wir werden auch einige der Grundregeln der Wahrscheinlichkeit behandeln, die zur Berechnung von Wahrscheinlichkeiten verwendet werden können.
Einleitung
Wir beginnen mit einem klassischen Wahrscheinlichkeitsbeispiel, bei dem eine faire Münze dreimal geworfen wird.
Da Kopf und Zahl in diesem Szenario für jeden Wurf gleich wahrscheinlich sind, ist auch jede der Möglichkeiten, die sich aus drei Würfen ergeben können, gleich wahrscheinlich, so dass wir alle möglichen Werte auflisten und diese Liste verwenden können, um Wahrscheinlichkeiten zu berechnen.Da unser Fokus in diesem Kurs auf Daten und Statistiken liegt (nicht auf theoretischer Wahrscheinlichkeit), werden wir in den meisten unserer zukünftigen Probleme einen zusammengefassten Datensatz verwenden, normalerweise eine Häufigkeitstabelle oder eine bidirektionale Tabelle, um Wahrscheinlichkeiten zu berechnen.
BEISPIEL: Wirf eine faire Münze dreimal
Lass uns jedes mögliche Ergebnis (oder mögliches Ergebnis) auflisten:
{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}
Nun definieren wir die folgenden Ereignisse:
Ereignis A: „Kein H bekommen“
Ereignis B: „Genau ein H bekommen“
Ereignis C: „Mindestens ein H bekommen“
Beachten Sie, dass jedes Ereignis in der Tat eine Aussage über das Ergebnis des Experiments ist. In der Praxis entspricht jedes Ereignis einer Sammlung (Teilmenge) der möglichen Ergebnisse.
Ereignis A: „Kein H erhalten“ → TTT
Ereignis B: „Genau ein H bekommen“ → HTT, THT, TTH
Ereignis C: „Mindestens ein H bekommen“ → HTT, THT, TTH, THH, HTH, HHT, HHH
Hier ist eine visuelle Darstellung der Ereignisse A, B und C.
Aus dieser visuellen Darstellung der Ereignisse ist leicht ersichtlich, dass Ereignis B vollständig in Ereignis C enthalten ist, in dem Sinne, dass jedes Ergebnis in Ereignis B auch ein Ergebnis in Ereignis C ist. An dieser Stelle sind dies nur bemerkenswerte Beobachtungen, aber wie Sie später feststellen werden, sind sie sehr wichtig.
Was wäre, wenn wir das neue Ereignis hinzufügen würden:
Ereignis D: „Beim ersten Wurf ein T bekommen“ → THH, THT, TTH, TTT
Wie würde es aussehen, wenn wir dem obigen Diagramm das Ereignis D hinzufügen würden? (Link zur Antwort)
Denken Sie daran, da H und T bei jedem Wurf gleich wahrscheinlich sind und es 8 mögliche Ergebnisse gibt, beträgt die Wahrscheinlichkeit jedes Ergebnisses 1/8.
Sehen Sie, ob Sie die folgenden Fragen anhand der Diagramme und / oder der Ergebnisliste für jedes Ereignis beantworten können, zusammen mit dem, was Sie bisher über die Wahrscheinlichkeit gelernt haben.
Wenn Sie diese Fragen richtig beantworten konnten, haben Sie wahrscheinlich einen guten Instinkt für die Berechnung der Wahrscheinlichkeit! Lesen Sie weiter, um zu erfahren, wie wir dieses Wissen anwenden werden.
Wenn nicht, werden wir versuchen, Ihnen zu helfen, diese Fähigkeit in diesem Abschnitt zu entwickeln.
Kommentar:
- Beachten Sie, dass in Ereignis C, „Mindestens einen Kopf bekommen“, nur ein mögliches Ergebnis fehlt, „Keine Köpfe bekommen“ = TTT. Wir werden dies noch einmal ansprechen, wenn wir über Wahrscheinlichkeitsregeln sprechen, insbesondere über die Komplementregel. An dieser Stelle möchten wir nur, dass Sie darüber nachdenken, wie diese beiden Ereignisse in diesem Szenario „Gegensätze“ sind.
Es ist SEHR wichtig zu erkennen, dass nur weil wir die möglichen Ergebnisse auflisten können, dies nicht bedeutet, dass jedes Ergebnis gleich wahrscheinlich ist.
Dies ist die (lustige) Nachricht im Daily Show-Clip, den wir auf der vorherigen Seite bereitgestellt haben. Aber denken wir noch einmal darüber nach. In diesem Clip behauptet Walter, dass die Wahrscheinlichkeit 0,5 beträgt, da es zwei mögliche Ergebnisse gibt. Die beiden möglichen Ergebnisse sind
- Die Welt wird durch den Large Hadron Collider zerstört
- Die Welt wird durch den Large Hadron Collider NICHT zerstört
Hoffentlich ist klar, dass diese beiden Ergebnisse nicht gleich wahrscheinlich sind!!
Betrachten wir ein allgemeineres Beispiel.
BEISPIEL: Geburtsfehler
Angenommen, wir wählen zufällig drei Kinder aus und interessieren uns für die Wahrscheinlichkeit, dass keines der Kinder Geburtsfehler hat.
Wir verwenden die Notation D, um ein Kind darzustellen, das mit einem Geburtsfehler geboren wurde, und N, um das Kind darzustellen, das ohne Geburtsfehler geboren wurde. Wir können die möglichen Ergebnisse genau wie beim Münzwurf auflisten, sie sind:
{DDD, NDD, DND, DDN, DNN, NDN, NND, NNN}
Sind die Ereignisse DDD (alle drei Kinder sind mit Geburtsfehlern geboren) und NNN (keines der Kinder ist mit Geburtsfehlern geboren) gleich wahrscheinlich?
Es sollte Ihnen vernünftig sein, dass P(NNN) viel größer ist als P(DDD).Dies liegt daran, dass P (N) und P(D) nicht gleich wahrscheinliche Ereignisse sind.
Es ist selten (sicherlich nicht 50%), dass ein zufällig ausgewähltes Kind mit einem Geburtsfehler geboren wird.
Regeln der Wahrscheinlichkeit
Nun lernen wir einige der Grundregeln der Wahrscheinlichkeit kennen.Glücklicherweise sind diese Regeln sehr intuitiv, und solange sie systematisch angewendet werden, werden sie uns kompliziertere Probleme lösen lassen; insbesondere jene Probleme, für die unsere Intuition unzureichend sein könnte.
Da die meisten Wahrscheinlichkeiten, die Sie finden müssen, sowohl mit
- Logik als auch mit
und
- berechnet werden können die Regeln, die wir lernen werden,
Wir geben den folgenden Rat als Prinzip.
PRINZIP:
Wenn Sie eine Wahrscheinlichkeit mit Logik und Zählen berechnen können, benötigen Sie keine Wahrscheinlichkeitsregel (obwohl immer die richtige Regel angewendet werden kann)
Wahrscheinlichkeitsregel Eins
Unsere erste Regel erinnert uns einfach an die grundlegende Eigenschaft der Wahrscheinlichkeit, die wir bereits gelernt haben.
Die Wahrscheinlichkeit eines Ereignisses, die uns über die Wahrscheinlichkeit seines Auftretens informiert, kann zwischen 0 (was anzeigt, dass das Ereignis niemals eintreten wird) und 1 (was anzeigt, dass das Ereignis sicher ist) liegen.
Wahrscheinlichkeitsregel Eins:
- Für jedes Ereignis A, 0 ≤ P(A) ≤ 1.
HINWEIS: Eine praktische Anwendung dieser Regel besteht darin, dass sie verwendet werden kann, um jede Wahrscheinlichkeitsberechnung, die mehr als 1 (oder weniger als 0) ergibt, als falsch zu identifizieren.
Bevor wir zu den anderen Regeln übergehen, schauen wir uns zunächst ein Beispiel an, das einen Kontext zur Veranschaulichung der nächsten Regeln bietet.
BEISPIEL: Blutgruppen
Wie bereits erwähnt, kann alles menschliche Blut als O, A, B oder AB typisiert werden.
Darüber hinaus variiert die Häufigkeit des Auftretens dieser Blutgruppen nach ethnischen und rassischen Gruppen.
Laut dem Blood Center der Stanford University (bloodcenter.Stanford.edu), dies sind die Wahrscheinlichkeiten menschlicher Blutgruppen in den Vereinigten Staaten (die Wahrscheinlichkeit für Typ A wurde absichtlich weggelassen):
Motivierende Frage für Regel 2: Eine Person in den Vereinigten Staaten wird zufällig ausgewählt. Wie hoch ist die Wahrscheinlichkeit, dass die Person Blutgruppe A hat?
Antwort: Unsere Intuition sagt uns, dass, da die vier Blutgruppen O, A, B und AB alle Möglichkeiten ausschöpfen, ihre Wahrscheinlichkeiten zusammen 1 ergeben müssen, was die Wahrscheinlichkeit eines „bestimmten“ Ereignisses ist (eine Person hat eine dieser 4 Blutgruppen) sicher).
Da sich die Wahrscheinlichkeiten von O, B und AB zusammen zu 0.44 + 0.1 + 0.04 = 0,58, die Wahrscheinlichkeit des Typs A muss die verbleibende sein 0.42 (1 – 0.58 = 0.42):
Wahrscheinlichkeitsregel Zwei
Dieses Beispiel veranschaulicht unsere zweite Regel, die besagt, dass die Wahrscheinlichkeit aller möglichen Ergebnisse zusammen 1 sein muss.
Wahrscheinlichkeitsregel Zwei:
Die Summe der Wahrscheinlichkeiten aller möglichen Ergebnisse ist 1.
Dies ist ein guter Ort, um das, was wir hier tun, mit dem zu vergleichen, was wir im Abschnitt Explorative Datenanalyse (EDA) gelernt haben.
- Beachten Sie, dass wir uns in diesem Problem im Wesentlichen auf eine einzige kategoriale Variable konzentrieren: die Blutgruppe.
- Wir haben diese Variable oben zusammengefasst, wie wir einzelne kategoriale Variablen im EDA-Abschnitt zusammengefasst haben, indem wir aufgelistet haben, welche Werte die Variable annimmt und wie oft sie verwendet wird.
- In EDA haben wir Prozentsätze verwendet, und hier verwenden wir Wahrscheinlichkeiten, aber die beiden vermitteln die gleichen Informationen.
- Im EDA-Abschnitt haben wir gelernt, dass ein Kreisdiagramm eine geeignete Anzeige bietet, wenn eine einzelne kategoriale Variable beteiligt ist, und in ähnlicher Weise können wir es hier verwenden (mit Prozentsätzen anstelle von Wahrscheinlichkeiten):
Obwohl das, was wir hier tun, tatsächlich dem ähnelt, was wir im EDA-Abschnitt getan haben, gibt es einen subtilen, aber wichtigen Unterschied zwischen den zugrunde liegenden Situationen
- In EDA haben wir Daten zusammengefasst, die von einer Stichprobe von Personen erhalten wurden, für die Werte der interessierenden Variablen aufgezeichnet wurden.
- Wenn wir hier die Wahrscheinlichkeit jeder Blutgruppe darstellen, denken wir an die gesamte Bevölkerung der Menschen in den Vereinigten Staaten, für die wir davon ausgehen, die Gesamthäufigkeit der Werte zu kennen, die von der interessierenden Variablen genommen werden.
Wahrscheinlichkeitsregel drei
In der Wahrscheinlichkeit und in ihren Anwendungen sind wir häufig daran interessiert, die Wahrscheinlichkeit herauszufinden, dass ein bestimmtes Ereignis nicht eintritt.
Ein wichtiger Punkt, den Sie hier verstehen sollten, ist, dass „Ereignis A tritt nicht auf“ ein separates Ereignis ist, das aus allen möglichen Ergebnissen besteht, die nicht in A enthalten sind, und als „Komplementereignis von A“ bezeichnet wird. Hier ist eine visuelle Darstellung, wie Ereignis A und sein Komplementereignis „nicht A“ zusammen alle möglichen Ergebnisse darstellen.
Kommentar:
- Eine solche visuelle Darstellung wird als „Venn-Diagramm“ bezeichnet.“ Ein Venn-Diagramm ist eine einfache Möglichkeit, Ereignisse und die Beziehungen zwischen ihnen mithilfe von Rechtecken und Kreisen zu visualisieren.Regel 3 befasst sich mit der Beziehung zwischen der Wahrscheinlichkeit eines Ereignisses und der Wahrscheinlichkeit seines Komplementereignisses.
Da Ereignis A und Ereignis „nicht A“ zusammen alle möglichen Ergebnisse ausmachen, und da Regel 2 uns sagt, dass die Summe der Wahrscheinlichkeiten aller möglichen Ergebnisse 1 ist, sollte die folgende Regel ziemlich intuitiv sein:
Wahrscheinlichkeitsregel Drei (Die Komplementregel):
- P(nicht A) = 1 – P(A)
- das heißt, die Wahrscheinlichkeit, dass ein Ereignis tritt nicht auf, ist 1 minus der Wahrscheinlichkeit, dass es auftritt.
BEISPIEL: Blutgruppen
Zurück zum Blutgruppenbeispiel:
Hier sind einige zusätzliche Informationen:
- Eine Person mit Typ A kann Blut an eine Person mit Typ A oder AB spenden.
- Eine Person mit Typ B kann Blut an eine Person mit Typ B oder AB spenden.
- Eine Person mit Typ AB kann Blut nur an eine Person mit Typ AB spenden.
- Eine Person mit Blutgruppe O kann an jeden spenden.
Wie hoch ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person nicht jedem Blut spenden kann? Mit anderen Worten, wie hoch ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person keine Blutgruppe O hat? Wir müssen P (nicht O) finden. Unter Verwendung der Komplementregel ist P (nicht O) = 1 – P (O) = 1 – 0,44 = 0,56. Mit anderen Worten, 56% der US-Bevölkerung haben keine Blutgruppe O:
Natürlich könnten wir auch P(nicht O) direkt finden, indem wir die Wahrscheinlichkeiten von B, AB und A addieren.
Kommentar:
- Beachten Sie, dass die Komplementregel P(nicht A) = 1 – P(A) als P(A) = 1 – P(nicht A) umformuliert werden kann.
- P(nicht A) = 1 – P(A)
- kann zu P(A) = 1 – P(nicht A)umformuliert werden.
- Diese scheinbar triviale algebraische Manipulation hat eine wichtige Anwendung und erfasst tatsächlich die Stärke der Komplementregel.
- In einigen Fällen, wenn das direkte Finden von P(A) sehr kompliziert ist, ist es möglicherweise viel einfacher, P(nicht A) zu finden und es dann einfach von 1 zu subtrahieren, um das gewünschte P(A) zu erhalten.
- Wir werden in Kürze auf diesen Kommentar zurückkommen und weitere Beispiele bereitstellen.
Habe ich das bekommen?: Wahrscheinlichkeitsregel Drei- Die Komplementregel kann nützlich sein, wenn es einfacher ist, die Wahrscheinlichkeit des Komplements des Ereignisses zu berechnen als das Ereignis selbst.
- Beachten Sie, dass wir erneut den Ausdruck „mindestens einer.“
- Jetzt haben wir gesehen, dass das Komplement von „mindestens einem …“ „none … “ oder „no ….“ (wie wir bereits erwähnt haben, dass die Ereignisse „Gegensätze“ sind).
- In der obigen Aktivität sehen wir, dass
- P(KEINE dieser beiden Nebenwirkungen) = 1 – P(mindestens eine dieser beiden Nebenwirkungen)
- Dies ist eine häufige Anwendung der Komplementregel, die Sie oft an der Phrase „mindestens eine“ im Problem erkennen können.
Wahrscheinlichkeiten mit mehreren Ereignissen
Wir werden oft daran interessiert sein, Wahrscheinlichkeiten mit mehreren Ereignissen zu finden, wie
- P(A oder B) = P(Ereignis A tritt auf oder Ereignis B tritt auf oder beide treten auf)
- P(A und B)= P(sowohl Ereignis A tritt auf als auch Ereignis B tritt auf)
Ein häufiges Problem mit der Terminologie bezieht sich darauf, wie wir normalerweise an „oder“ in unserem täglichen Leben denken. Zum Beispiel, wenn ein Elternteil zu seinem Kind in einem Spielzeugladen sagt: „Willst du Spielzeug A oder Spielzeug B?“, das bedeutet, dass das Kind nur ein Spielzeug bekommen wird und er oder sie zwischen ihnen wählen muss. Beide Spielzeuge zu bekommen ist normalerweise keine Option.
Im Gegensatz dazu:
In der Wahrscheinlichkeit bedeutet „ODER“ entweder das eine oder das andere oder beides.
und so ist P(A oder B) = P(Ereignis A tritt auf oder Ereignis B tritt auf oder BEIDE treten auf)
Trotzdem sollte beachtet werden, dass es einige Fälle gibt, in denen es einfach unmöglich ist, dass die beiden Ereignisse gleichzeitig auftreten.
Wahrscheinlichkeitsregel Vier
Die Unterscheidung zwischen Ereignissen, die zusammen passieren können, und solchen, die nicht passieren können, ist wichtig.
Disjunkt: Zwei Ereignisse, die nicht gleichzeitig auftreten können, werden als disjunkt oder sich gegenseitig ausschließend bezeichnet. (Wir werden disjunkt verwenden.)
Aus dem Bild sollte ersichtlich sein, dass
- im ersten Fall, wo die Ereignisse NICHT disjunkt sind, P(A und B) ≠ 0
- im zweiten Fall, wo die Ereignisse disjunkt sind, P(A und B) = 0.
Hier sind zwei Beispiele:
BEISPIEL:
Betrachten Sie die folgenden zwei Ereignisse:
A — eine zufällig ausgewählte Person hat Blutgruppe A und
B — eine zufällig ausgewählte Person hat Blutgruppe B.
In seltenen Fällen ist es möglich, dass eine Person mehr als eine Blutgruppe durch ihre Venen fließt, aber für unsere Zwecke gehen wir davon aus, dass jede Person nur eine Blutgruppe haben kann. Daher ist es unmöglich, dass die Ereignisse A und B zusammen auftreten.
- Die Ereignisse A und B sind DISJUNKT
Andererseits …
BEISPIEL:
Betrachten Sie die folgenden zwei Ereignisse:
A — eine zufällig ausgewählte Person hat Blutgruppe A
B — eine zufällig ausgewählte Person ist eine Frau.
In diesem Fall können die Ereignisse A und B zusammen auftreten.
- Ereignisse A und B sind NICHT DISJUNKT.
Die Venn-Diagramme legen nahe, dass eine andere Möglichkeit, über disjunkte versus nicht disjunkte Ereignisse nachzudenken, darin besteht, dass disjunkte Ereignisse sich nicht überlappen. Sie teilen keines der möglichen Ergebnisse und können daher nicht zusammen stattfinden.
Andererseits überlappen sich Ereignisse, die nicht disjunkt sind, in dem Sinne, dass sie einige der möglichen Ergebnisse teilen und daher gleichzeitig auftreten können.
Wir beginnen nun mit einer einfachen Regel, um P(A oder B) für disjunkte Ereignisse zu finden.
Wahrscheinlichkeitsregel Vier (Die Additionsregel für disjunkte Ereignisse):
- Wenn A und B disjunkte Ereignisse sind, dann ist P(A oder B) = P(A) + P(B).
Kommentar:
- Wenn es um Wahrscheinlichkeiten geht, wird das Wort „oder“ immer mit der Operation der Addition verbunden sein; daher der Name dieser Regel, „Die Additionsregel.“
BEISPIEL: Blutgruppen
Rufen Sie das Blutgruppenbeispiel zurück:
Hier sind einige zusätzliche Informationen
- Eine Person mit Typ Ackann Blut an eine Person mit Typ A oder AB spenden.
- Eine Person mit Typ Bkann Blut an eine Person mit Typ B oder AB spenden.
- Eine Person mit Typ abkann Blut an eine Person mit Typ AB spenden
- Eine Person mit Typ ABBLUT kann an jeden spenden.
Wie hoch ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person ein potenzieller Spender für eine Person mit Blutgruppe A ist?
Aus den gegebenen Informationen wissen wir, dass ein potenzieller Spender für eine Person mit Blutgruppe A bedeutet, Blutgruppe A oder O zu haben.
Wir müssen daher P (A oder O) finden. Da die Ereignisse A und O disjunkt sind, können wir die Additionsregel für disjunkte Ereignisse verwenden, um Folgendes zu erhalten:
- P(A oder O) = P(A) + P(O) = 0,42 + 0,44 = 0,86.
Es ist leicht einzusehen, warum das Hinzufügen der Wahrscheinlichkeit tatsächlich sinnvoll ist.
Wenn 42% der Bevölkerung Blutgruppe A und 44% der Bevölkerung Blutgruppe O haben,
- dann haben 42% + 44% = 86% der Bevölkerung entweder Blutgruppe A oder O und sind somit potenzielle Spender für eine Person mit Blutgruppe A.
Diese Argumentation, warum die Additionsregel sinnvoll ist, kann anhand des folgenden Kreisdiagramms visualisiert werden:
Learn By Doing: Wahrscheinlichkeitsregel VierKommentar:
- Die Additionsregel für disjunkte Ereignisse kann natürlich auf mehr als zwei disjunkte Ereignisse erweitert werden. Nehmen wir zum Beispiel drei. Wenn A, B und C drei disjunkte Ereignisse sind
dann ist P(A oder B oder C) = P(A) + P(B) + P(C). Die Regel ist die gleiche für eine beliebige Anzahl von disjunkten Ereignissen.
Habe ich das bekommen?: Wahrscheinlichkeitsregel VierWir sind jetzt mit der ersten Version der Additionsregel (Regel vier) fertig, die auf disjunkte Ereignisse beschränkt ist. Bevor wir die zweite Version behandeln, müssen wir zuerst P (A und B) diskutieren.
P(A und B) mit Logik finden
Wir wenden uns nun der Berechnung zu
- P(A und B)= P(sowohl Ereignis A tritt auf als auch Ereignis B tritt auf)
Später werden wir die Regeln für die Berechnung von P(A und B) diskutieren.
Zunächst möchten wir veranschaulichen, dass eine Regel nicht benötigt wird, wenn Sie die Antwort durch Logik und Zählen bestimmen können.
Sonderfall:
Es gibt einen Sonderfall, für den wir wissen, was P(A und B) gleich ist, ohne eine Regel anzuwenden.
Lernen Sie, indem Sie: Finden von P(A und B) # 1Wenn also die Ereignisse A und B disjunkt sind, dann ist (per Definition) P(A und B)= 0. Aber was ist, wenn die Ereignisse nicht unzusammenhängend sind?
Denken Sie daran, dass Regel 4, die Additionsregel, zwei Versionen hat. Eines ist auf disjunkte Ereignisse beschränkt, die wir bereits behandelt haben, und wir werden uns später in diesem Modul mit der allgemeineren Version befassen. Das gleiche gilt für Wahrscheinlichkeiten mit UND
Außer in besonderen Fällen werden wir uns jedoch auf die LOGIK verlassen, um P(A und B) in diesem Kurs zu finden.
Bevor wir uns mit formalen Regeln befassen, schauen wir uns ein Beispiel an, in dem die Ereignisse nicht disjunkt sind.
BEISPIEL: Parodontalstatus und Geschlecht
Betrachten Sie die folgende Tabelle bezüglich des Parodontalstatus von Individuen und ihres Geschlechts. Der Parodontalstatus bezieht sich auf Zahnfleischerkrankungen, bei denen Personen entweder als gesund eingestuft werden, Gingivitis haben oder Parodontitis haben.
Wir haben diese Art von Tabelle schon einmal gesehen, als wir über die Analyse von Daten im Fall C → C diskutierten. Für die Zwecke dieser Frage verwenden wir diese Daten als unsere „Population“ und erwägen die zufällige Auswahl einer Person.
Learn by Doing: Parodontalstatus und GeschlechtWir stellen gerne Wahrscheinlichkeitsfragen ähnlich dem vorherigen Beispiel (unter Verwendung einer bidirektionalen Tabelle basierend auf Daten), da Sie so Verbindungen zwischen diesen Themen herstellen können und Ihnen dabei helfen, die halten Sie etwas von dem, was Sie über Daten gelernt haben, frisch im Kopf.
Denken Sie daran, unser primäres Ziel in diesem Kurs ist es, reale Daten zu analysieren!Wahrscheinlichkeitsregel Fünf
Wir sind nun bereit, zur erweiterten Version der Additionsregel überzugehen.
In diesem Abschnitt lernen wir, wie man P(A oder B) findet, wenn A und B nicht unbedingt disjunkt sind.
- Wir nennen diese erweiterte Version die „Allgemeine Additionsregel“ und geben sie als Wahrscheinlichkeitsregel Fünf an.
Wir beginnen mit der Angabe der Regel und geben ein Beispiel an, das den Arten von Problemen ähnelt, die wir in diesem Kurs im Allgemeinen stellen. Dann werden wir ein weiteres Beispiel vorstellen, in dem wir nicht die Rohdaten aus einer Stichprobe haben, aus denen wir arbeiten können.
Wahrscheinlichkeitsregel Fünf:
- Die allgemeine Additionsregel: P(A oder B) = P(A) + P(B) – P(A und B).
HINWEIS: Es ist am besten, Logik zu verwenden, um P(A und B) zu finden, nicht eine andere Formel.
Ein SEHR häufiger Fehler ist die falsche Anwendung der Multiplikationsregel für unabhängige Ereignisse, die auf der nächsten Seite behandelt werden. Dies ist nur dann korrekt, wenn A und B unabhängig sind (siehe nachfolgende Definitionen), was bei Daten, die in bidirektionalen Tabellen dargestellt werden, selten der Fall ist.
Wie wir in früheren Beispielen gesehen haben, gibt es, wenn die beiden Ereignisse nicht disjunkt sind, einige Überschneidungen zwischen den Ereignissen.
- Wenn wir einfach die beiden Wahrscheinlichkeiten addieren, erhalten wir die falsche Antwort, weil wir eine „Wahrscheinlichkeit“ zweimal gezählt haben!
- Daher müssen wir diese „zusätzliche“ Wahrscheinlichkeit abziehen, um zur richtigen Antwort zu gelangen. Das Venn-Diagramm und die Zwei-Wege-Tabellen sind hilfreich, um diese Idee zu visualisieren.
Diese Regel ist allgemeiner, da sie für jedes Ereignispaar funktioniert (auch für disjunkte Ereignisse). Unser Rat ist immer noch zu versuchen, die Frage nach Möglichkeit mit Logik und Zählen zu beantworten, andernfalls müssen wir äußerst vorsichtig sein, um die richtige Regel für das Problem zu wählen.
PRINZIP:
Wenn Sie eine Wahrscheinlichkeit mit Logik und Zählen berechnen können, benötigen Sie keine Wahrscheinlichkeitsregel (obwohl immer die richtige Regel angewendet werden kann)
Beachten Sie, dass, wenn A und B disjunkt sind, P(A und B) = 0 ist und Regel 5 für diesen Sonderfall auf Regel 4 reduziert wird.
Schauen wir uns das letzte Beispiel noch einmal an:
BEISPIEL: Parodontalstatus und Geschlecht
Erwägen Sie, zufällig eine Person aus den in der folgenden Tabelle dargestellten Personen bezüglich des Parodontalstatus von Personen und ihres Geschlechts auszuwählen. Der Parodontalstatus bezieht sich auf Zahnfleischerkrankungen, bei denen Personen entweder als gesund eingestuft werden, Gingivitis haben oder Parodontitis haben.
Lassen Sie uns überprüfen, was wir bisher gelernt haben. Wir können jede Wahrscheinlichkeit in diesem Szenario berechnen, wenn wir bestimmen können, wie viele Personen das Ereignis oder die Kombination von Ereignissen erfüllen.
- P(Männlich) = 3009/8027 = 0,3749
- P(Weiblich) = 5018/8027 = 0,6251
- P(Gesund) = 3750/8027 = 0,4672
- P(Nicht gesund) = P(Gingivitis oder Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
Wir könnten dies auch mit der Komplementregel berechnen: 1 – P(Gesund)
Wir haben auch zuvor festgestellt, dass
- P(männlich UND gesund) = 1143/8027 = 0.1424
Erinnern Sie sich an Regel 5, P(A oder B) = P(A) + P(B) – P(A und B). Mit dieser Regel berechnen wir nun P(Männlich ODER gesund)
- P(Männlich oder gesund) = P(Männlich) + P(Gesund) – P(männlich und gesund) = 0.3749 + 0.4672 – 0.1424 = 0,6997 oder etwa 70%
Wir haben diese Frage früher gelöst, indem wir einfach gezählt haben, wie viele Personen entweder männlich oder gesund oder beides sind. Das Bild unten zeigt die Werte, die wir kombinieren müssen. Wir müssen
- Alle Männchen
- Alle gesunden Individuen
- zählen, ABER zählen Sie niemanden zweimal!!
Mit diesem logischen Ansatz würden wir finden
- P(Männlich oder gesund) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996
Wir haben einen kleinen Unterschied in unseren Antworten an der letzten Dezimalstelle aufgrund der Rundung, die auftrat, als wir P (Männlich), P (Gesund) und P (männlich und gesund) berechneten und dann Regel 5 anwendeten.
Die Antwort ist eindeutig dieselbe, etwa 70%. Wenn wir unsere Antworten auf mehr Dezimalstellen übertragen oder die ursprünglichen Brüche verwenden würden, könnten wir diese kleine Diskrepanz vollständig beseitigen.
Schauen wir uns ein letztes Beispiel an, um die Wahrscheinlichkeitsregel 5 zu veranschaulichen, wenn die Regel benötigt wird – dh wenn wir keine tatsächlichen Daten haben.
BEISPIEL: Wichtige Lieferung!
Es ist wichtig, dass ein bestimmtes Dokument innerhalb eines Tages sein Ziel erreicht. Um die Wahrscheinlichkeit einer pünktlichen Lieferung zu maximieren, werden zwei Kopien des Dokuments unter Verwendung von zwei Diensten gesendet, Dienst A und Dienst B. Es ist bekannt, dass die Wahrscheinlichkeiten einer pünktlichen Lieferung sind:
- 0,90 für Dienst A (P(A) = 0,90)
- 0,80 für Dienst B (P(B) = 0,80)
- 0.75 für beide Dienste, die pünktlich sind (P (A und B) = 0,75)
(Beachten Sie, dass A und B nicht disjunkt sind. Sie können zusammen mit einer Wahrscheinlichkeit von 0,75 auftreten.)
Die folgenden Venn-Diagramme veranschaulichen die Wahrscheinlichkeiten P(A), P(B) und P(A und B) :
Im Zusammenhang mit diesem Problem ist die offensichtliche Frage von Interesse:
- Wie hoch ist die Wahrscheinlichkeit einer pünktlichen Zustellung des Dokuments mit dieser Strategie (des Versendens über beide Dienste)?
Das Dokument erreicht seinen Bestimmungsort rechtzeitig, solange es rechtzeitig von Dienst A oder Dienst B oder von beiden Diensten zugestellt wird. Mit anderen Worten, wenn Ereignis A auftritt oder Ereignis B auftritt oder beide auftreten. so….
P (pünktliche Lieferung mit dieser Strategie)= P (A oder B), die durch den schattierten Bereich im folgenden Diagramm dargestellt wird:
Wir können jetzt
- die drei Venn-Diagramme verwenden, die P(A), P(B) und P(A und B) darstellen
- um zu sehen, dass wir P(A oder B) finden können, indem wir P(A) (dargestellt durch den linken Kreis) und P(B) (dargestellt durch den rechten Kreis) addieren,
- dann P(A und B) (dargestellt durch die Überlappung) subtrahieren, da wir es zweimal als Teil von P (A) und einmal als Teil von P(B).
Dies wird im folgenden Bild gezeigt:
Wenn wir dies auf unser Beispiel anwenden, finden wir Folgendes:
- P(A oder B)= P(pünktliche Lieferung mit dieser Strategie)= 0.90 + 0.80 – 0.75 = 0.95.
Unsere Strategie, zwei Lieferservices zu nutzen, erhöht also unsere Wahrscheinlichkeit einer pünktlichen Lieferung auf 0,95.
Während die Venn-Diagramme großartig waren, um die allgemeine Additionsregel zu visualisieren, ist es in Fällen wie diesen viel einfacher, die Informationen in einer bidirektionalen Wahrscheinlichkeitstabelle anzuzeigen und damit zu arbeiten, ähnlich wie wir die Beziehung zwischen zwei kategorialen Variablen im Abschnitt Explorative Datenanalyse untersucht haben.
Wir zeigen Ihnen einfach die Tabelle, nicht wie wir sie ableiten, da Sie nicht aufgefordert werden, dies für uns zu tun. Sie sollten in der Lage sein zu sehen, dass einige Logik und einfache Addition / Subtraktion alles ist, was wir verwendet haben, um die folgende Tabelle auszufüllen.
Wenn Sie eine bidirektionale Tabelle verwenden, müssen Sie daran denken, die gesamte Zeile oder Spalte zu betrachten, um die Gesamtwahrscheinlichkeiten zu ermitteln, die nur A oder nur B betreffen.
- P(A) = 0,90 bedeutet, dass in 90% der Fälle, in denen Service A verwendet wird, das Dokument pünktlich geliefert wird. Um dies herauszufinden, betrachten wir die Gesamtwahrscheinlichkeit für die Zeile, die A enthält.
- P(B) = 0,80 bedeutet, dass in 80% der Fälle, in denen Service B verwendet wird, das Dokument pünktlich geliefert wird. Um dies herauszufinden, betrachten wir die Gesamtwahrscheinlichkeit für die Spalte, die B enthält.
Kommentar
- Als wir im Abschnitt Explorative Datenanalyse (EDA) Zweiwegtabellen verwendeten, wurden Werte von zwei kategorialen Variablen für eine konkrete Stichprobe von Personen aufgezeichnet.
- Im Gegensatz dazu beziehen sich die Informationen in einer Zwei-Wege-Wahrscheinlichkeitstabelle auf eine ganze Population, und die Werte sind eher abstrakt.
- Wenn wir so etwas wie das Lieferbeispiel im EDA-Abschnitt behandelt hätten, hätten wir die tatsächliche Anzahl der pünktlichen (und nicht pünktlichen) Lieferungen für Muster von Dokumenten erfasst, die mit Service A oder B verschickt wurden.
- In diesem Abschnitt werden die langfristigen Wahrscheinlichkeiten als bekannt dargestellt.
- Vermutlich basierten die gemeldeten Wahrscheinlichkeiten in diesem Lieferbeispiel auf relativen Häufigkeiten, die über viele Wiederholungen aufgezeichnet wurden.
Interaktives Applet: Wahrscheinlichkeits-Venn-DiagrammRundungs-Faustregel für die Wahrscheinlichkeit:
Befolgen Sie in diesem Kurs die folgenden allgemeinen Richtlinien. Im Zweifelsfall mehr Dezimalstellen tragen. Wenn wir angeben, geben Sie genau das, was angefordert wird.
- Im Allgemeinen sollten Sie Wahrscheinlichkeiten für Zwischenschritte auf mindestens 4 Dezimalstellen bringen.
- Wir runden unsere endgültige Antwort oft auf zwei oder drei Dezimalstellen.
- Für extrem kleine Wahrscheinlichkeiten ist es wichtig, 1 oder zwei signifikante Stellen (Ziffern ungleich Null) zu haben, z. B. 0,000001 oder 0,000034 usw.
Viele Computerpakete zeigen möglicherweise extrem kleine Werte in wissenschaftlicher Notation an, z. B.
- 58 ×10-5 oder 1,58 E-5, um 0,0000158 darzustellen
Fassen wir zusammen
Bisher wurden Sie in unserer Wahrscheinlichkeitsstudie mit der manchmal kontraintuitiven Natur der Wahrscheinlichkeit und den Grundlagen, die der Wahrscheinlichkeit zugrunde liegen, wie z. B. einer relativen Häufigkeit, vertraut gemacht.
Wir haben Ihnen auch einige Tools zur Verfügung gestellt, mit denen Sie die Wahrscheinlichkeiten von Ereignissen ermitteln können — nämlich die Wahrscheinlichkeitsregeln.
Sie haben wahrscheinlich bemerkt, dass sich der Wahrscheinlichkeitsabschnitt signifikant von den beiden vorherigen Abschnitten unterschied; Es hat eine viel größere technische / mathematische Komponente, so dass die Ergebnisse eher „richtig oder falsch“ sind.
Im Bereich der explorativen Datenanalyse kümmerte sich der Computer größtenteils um den technischen Aspekt der Dinge, und unsere Aufgabe bestand darin, ihm zu sagen, dass er das Richtige tun und dann die Ergebnisse interpretieren soll.
In der Wahrscheinlichkeit erledigen wir die Arbeit von Anfang bis Ende, von der Auswahl des richtigen Werkzeugs (Regel) über die korrekte Verwendung bis hin zur Interpretation der Ergebnisse.
Hier ist eine Zusammenfassung der Regeln, die wir bisher vorgestellt haben.
1. Wahrscheinlichkeitsregel #1 besagt:
- Für jedes Ereignis A, 0 ≤ P(A) ≤ 1
2. Wahrscheinlichkeitsregel #2 besagt:
- Die Summe der Wahrscheinlichkeiten aller möglichen Ergebnisse ist 1
3. Die Komplementregel (#3) besagt, dass
- P(nicht A) = 1 – P(A)
oder wenn neu angeordnet
- P(A) = 1 – P(nicht A)
Die letztere Darstellung der Komplementregel ist besonders nützlich, wenn wir müssen Wahrscheinlichkeiten von Ereignissen der Art „mindestens eines von …“
4 finden. Die allgemeine Additionsregel (# 5) besagt, dass für zwei beliebige Ereignisse
- P(A oder B) = P(A) + P(B) – P(A und B),
wobei wir mit P(A oder B) P(A tritt auf oder B tritt auf oder beides) meinen.
Im speziellen Fall von disjunkten Ereignissen, Ereignissen, die nicht zusammen auftreten können, kann die allgemeine Additionsregel auf die Additionsregel für disjunkte Ereignisse (# 4) reduziert werden, die
- P(A oder B) = P(A) + P(B) lautet. *
*Verwenden Sie NUR, wenn Sie DAVON ÜBERZEUGT sind, dass die Ereignisse disjunkt sind (sie überlappen sich NICHT)
5. Die eingeschränkte Version der Additionsregel (für disjunkte Ereignisse) kann problemlos auf mehr als zwei Ereignisse erweitert werden.
6. Bisher haben wir nur P(A und B) mit Logik und Zählen in einfachen Beispielen gefunden