Règles de Probabilité de base

  • Introduction
  • Règles de Probabilité
    • Règle de probabilité Un (Pour tout événement A, 0 ≤ P (A) ≤ 1)
    • Règle de probabilité Deux (La somme des probabilités de tous les résultats possibles est 1)
    • Règle de probabilité Trois (La Règle du complément)
    • Probabilités Impliquant plusieurs Événements
    • li>

    • Règle de probabilité Quatre (Règle d’Addition pour les Événements Disjoints)
    • Trouver P(A et B) en utilisant la Logique
    • Règle de probabilité Cinq (La Règle générale d’addition)
  • Règle empirique d’arrondi pour la probabilité
  • Résumons
CO-6: Appliquons les concepts de base de la probabilité, de la variation aléatoire et des distributions de probabilité statistiques couramment utilisées.
LO 6.4: Relie la probabilité d’un événement à la probabilité que cet événement se produise.
LO 6.5: Appliquez l’approche de la fréquence relative pour estimer la probabilité d’un événement.
LO 6.6: Appliquer des règles de logique et de probabilité de base afin de trouver la probabilité empirique d’un événement.
Vidéo: Règles de probabilité de base (25:17)

Dans la section précédente, nous avons introduit la probabilité comme moyen de quantifier l’incertitude résultant de la réalisation d’expériences à l’aide d’un échantillon aléatoire de la population d’intérêt.

Nous avons vu que la probabilité d’un événement (par exemple, l’événement selon lequel une personne choisie au hasard a un groupe sanguin O) peut être estimée par la fréquence relative à laquelle l’événement se produit dans une longue série d’essais. Nous recueillons donc des données auprès de nombreuses personnes pour estimer la probabilité qu’une personne ait un groupe sanguin O.

Dans cette section, nous établirons les méthodes et principes de base pour trouver des probabilités d’événements.

Nous couvrirons également certaines des règles de base de probabilité qui peuvent être utilisées pour calculer les probabilités.

Introduction

Nous allons commencer par un exemple de probabilité classique de lancer une pièce de monnaie équitable trois fois.

Étant donné que les têtes et les queues sont également probables pour chaque lancer dans ce scénario, chacune des possibilités pouvant résulter de trois lancers le sera également afin que nous puissions lister toutes les valeurs possibles et utiliser cette liste pour calculer les probabilités.

Comme nous nous concentrons dans ce cours sur les données et les statistiques (et non sur les probabilités théoriques), dans la plupart de nos problèmes futurs, nous utiliserons un ensemble de données résumées, généralement une table de fréquences ou une table bidirectionnelle, pour calculer les probabilités.

EXEMPLE: Lancez une pièce équitable trois fois

Listons chaque résultat possible (ou résultat possible):

{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}

Définissons maintenant les événements suivants:

Événement A: « N’obtenir aucun H”

Événement B: « Obtenir exactement un H”

Événement C: « Obtenir au moins un H”

/p>

Notez que chaque événement est en effet une déclaration sur le résultat que l’expérience va produire. En pratique, chaque événement correspond à une collection (sous-ensemble) des résultats possibles.

Événement A: ”Ne pas obtenir de H » → TTT

Événement B: « Obtenir exactement un H” → HTT, THT, TTH

Événement C: « Obtenir au moins un H” → HTT, THT, TTH, THH, HTH, HHT, HHH

Voici une représentation visuelle des événements A, B et C.

Nous avons un grand rectangle étiqueté " S " qui représente la totalité de l

À partir de cette représentation visuelle des événements, il est facile de voir que l’événement B est totalement inclus dans l’événement C, en ce sens que chaque résultat de l’événement B est également un résultat de l’événement C. Notez également que l’événement A se distingue des événements B et C, en ce sens qu’ils n’ont aucun résultat en commun, ou aucun chevauchement. À ce stade, ce ne sont que des observations remarquables, mais comme vous le découvrirez plus tard, ce sont des observations très importantes.

Et si nous ajoutions le nouvel événement :

Événement D: « Obtenir un T au premier lancer » → THH, THT, TTH, TTT

À quoi cela ressemblerait-il si nous ajoutions l’événement D au diagramme ci-dessus? (Lien vers la réponse)

Rappelez-vous, puisque H et T sont également probables à chaque lancer, et comme il y a 8 résultats possibles, la probabilité de chaque résultat est de 1/8.

Voyez si vous pouvez répondre aux questions suivantes en utilisant les diagrammes et / ou la liste des résultats de chaque événement ainsi que ce que vous avez appris jusqu’à présent sur les probabilités.

Apprendre en faisant: Lancer une juste pièce Trois fois

Si vous avez pu répondre correctement à ces questions, vous avez probablement un bon instinct pour calculer la probabilité! Lisez la suite pour savoir comment nous allons appliquer ces connaissances.

Sinon, nous essaierons de vous aider à développer cette compétence dans cette section.

Commentaire:

  • Notez que dans l’événement C, « Obtenir au moins une tête », il n’y a qu’un seul résultat possible qui manque, « Ne PAS avoir de tête » = TTT. Nous aborderons à nouveau cette question lorsque nous parlerons des règles de probabilité, en particulier de la règle du complément. À ce stade, nous voulons juste que vous réfléchissiez à la façon dont ces deux événements sont « opposés » dans ce scénario.

Il est TRÈS important de réaliser que ce n’est pas parce que nous pouvons énumérer les résultats possibles que chaque résultat est également probable.

C’est le message (drôle) du clip du Daily Show que nous avons fourni à la page précédente. Mais réfléchissons à nouveau à cela. Dans ce clip, Walter affirme que puisqu’il y a deux résultats possibles, la probabilité est de 0,5. Les deux résultats possibles sont

  • Le monde sera détruit en raison de l’utilisation du grand collisionneur de hadrons
  • Le monde ne sera PAS détruit en raison de l’utilisation du grand collisionneur de hadrons

Espérons qu’il soit clair que ces deux résultats ne sont pas également probables!!

Considérons un exemple plus courant.

EXEMPLE: Malformations congénitales

Supposons que nous sélectionnions au hasard trois enfants et que nous nous intéressions à la probabilité qu’aucun des enfants ne présente de malformations congénitales.

Nous utilisons la notation D pour représenter un enfant né avec une anomalie congénitale et N pour représenter l’enfant né sans anomalie congénitale. Nous pouvons énumérer les résultats possibles tout comme nous l’avons fait pour le tirage au sort, ils sont:

{DDD, NDD, MDN, DDN, DNN, NDN, NND, NNN}

Les événements DDD (les trois enfants sont nés avec des malformations congénitales) et NNN (aucun des enfants ne naît avec des malformations congénitales) sont-ils également probables?

Il devrait être raisonnable pour vous que P(NNN) soit beaucoup plus grand que P(DDD).

Ceci est dû au fait que P(N) et P(D) ne sont pas des événements également probables.

Il est rare (certainement pas 50%) qu’un enfant sélectionné au hasard naisse avec une malformation congénitale.

Règles de probabilité

Maintenant, nous passons à l’apprentissage de certaines des règles de base de probabilité.

Heureusement, ces règles sont très intuitives, et tant qu’elles sont appliquées systématiquement, elles nous permettront de résoudre des problèmes plus compliqués; en particulier, les problèmes pour lesquels notre intuition pourrait être inadéquate.

Comme la plupart des probabilités que vous serez invité à trouver peuvent être calculées en utilisant à la fois la logique et le comptage

et

  • les règles que nous allons apprendre,

nous donnons les conseils suivants en principe.

PRINCIPE:

Si vous pouvez calculer une probabilité en utilisant la logique et le comptage, vous n’avez pas besoin de règle de probabilité (bien que la règle correcte puisse toujours être appliquée)

Règle de probabilité Une

Notre première règle nous rappelle simplement la propriété de base de la probabilité que nous avons déjà apprise.

La probabilité d’un événement, qui nous informe de la probabilité qu’il se produise, peut aller de 0 (indiquant que l’événement ne se produira jamais) à 1 (indiquant que l’événement est certain).

Règle de probabilité Une :

  • Pour tout événement A, 0 ≤ P (A) ≤ 1.

REMARQUE: Une utilisation pratique de cette règle est qu’elle peut être utilisée pour identifier tout calcul de probabilité qui s’avère supérieur à 1 (ou inférieur à 0) comme incorrect.

Avant de passer aux autres règles, regardons d’abord un exemple qui fournira un contexte pour illustrer les plusieurs règles suivantes.

EXEMPLE: Groupes sanguins

Comme indiqué précédemment, tout le sang humain peut être typé O, A, B ou AB.

De plus, la fréquence d’apparition de ces groupes sanguins varie selon les groupes ethniques et raciaux.

Selon le Centre du sang de l’Université de Stanford (bloodcenter.Stanford.edu), ce sont les probabilités des groupes sanguins humains aux États-Unis (la probabilité pour le type A a été volontairement omise):

Question motivante pour la règle 2: Une personne aux États-Unis est choisie au hasard. Quelle est la probabilité que la personne ait le groupe sanguin A?

Réponse: Notre intuition nous dit que puisque les quatre groupes sanguins O, A, B et AB épuisent toutes les possibilités, leurs probabilités ensemble doivent s’élever à 1, qui est la probabilité d’un événement « certain” (une personne a l’un de ces 4 groupes sanguins pour certains).

Puisque les probabilités de O, B et AB s’additionnent à 0.44 + 0.1 + 0.04 = 0,58, la probabilité de type A doit être la valeur restante 0.42 (1 – 0.58 = 0.42):

Données données au format "Groupe sanguin: Probabilité": O: 0,44; A: 0,42; B: 0,10; AB: 0,04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Règle de probabilité Deux

Cet exemple illustre notre deuxième règle, qui nous dit que la probabilité de tous les résultats possibles ensemble doit être de 1.

Règle de probabilité Deux:

La somme des probabilités de tous les résultats possibles est 1.

C’est un bon endroit pour comparer et comparer ce que nous faisons ici avec ce que nous avons appris dans la section Analyse exploratoire des données (EDA).

  • Notez que dans ce problème, nous nous concentrons essentiellement sur une seule variable catégorielle: le groupe sanguin.
  • Nous avons résumé cette variable ci-dessus, comme nous l’avons résumé dans la section EDA, en énumérant les valeurs prises par la variable et la fréquence à laquelle elle les prend.
  • Dans EDA, nous avons utilisé des pourcentages, et ici nous utilisons des probabilités, mais les deux transmettent les mêmes informations.
  • Dans la section EDA, nous avons appris qu’un graphique circulaire fournit un affichage approprié lorsqu’une seule variable catégorielle est impliquée, et de même nous pouvons l’utiliser ici (en utilisant des pourcentages au lieu de probabilités):

Un graphique circulaire intitulé "Groupes sanguins."Le type O occupe 44% du graphique circulaire, A utilise 42%, AB représente 4% et B représente le reste, 10%. Notez que les types de sang qui ne sont "pas O" occupent 56% du graphique circulaire."Blood Types." Type O takes up 44% of the pie chart, A uses 42%, AB represents 4%, and B represents the rest, 10%. Note that the types of blood which are "not O" take up 56% of the pie chart.

Même si ce que nous faisons ici est en effet similaire à ce que nous avons fait dans la section EDA, il existe une différence subtile mais importante entre les situations sous-jacentes

  • Dans EDA, nous avons résumé les données obtenues à partir d’un échantillon d’individus pour lesquels les valeurs de la variable d’intérêt ont été enregistrées.
  • Ici, lorsque nous présentons la probabilité de chaque groupe sanguin, nous avons à l’esprit l’ensemble de la populationde personnes aux États-Unis, pour lesquelles nous supposons connaître la fréquence globale des valeurs prises par la variable d’intérêt.
Ai-Je Obtenu Cela?: Règle de probabilité Deux

Règle de probabilité Trois

Dans la probabilité et dans ses applications, nous sommes fréquemment intéressés à trouver la probabilité qu’un certain événement ne se produise pas.

Un point important à comprendre ici est que « l’événement A ne se produit pas” est un événement distinct qui comprend tous les résultats possibles qui ne sont pas dans A et est appelé « l’événement complémentaire de A.”

Notation: nous écrirons « pas A” pour désigner l’événement que A ne se produit pas. Voici une représentation visuelle de la façon dont l’événement A et son événement complémentaire « pas A” représentent ensemble tous les résultats possibles.

Tout l

Commentaire:

  • Un tel affichage visuel s’appelle un « diagramme de Venn. »Un diagramme de Venn est un moyen simple de visualiser les événements et les relations entre eux à l’aide de rectangles et de cercles.

La règle 3 traite de la relation entre la probabilité d’un événement et la probabilité de son événement de complément.

Étant donné que l’événement A et l’événement « pas A” constituent ensemble tous les résultats possibles, et puisque la règle 2 nous indique que la somme des probabilités de tous les résultats possibles est 1, la règle suivante devrait être assez intuitive:

Règle de probabilité Trois (La règle du complément):

  • P (not A) = 1–P(A)
  • c’est-à-dire la probabilité que un événement ne se produit pas vaut 1 moins la probabilité qu’il se produise.

EXEMPLE: Groupes sanguins

Retour à l’exemple de groupe sanguin:

Voici quelques informations supplémentaires:

  • Une personne de type A peut donner du sang à une personne de type A ou AB.
  • Une personne de type B peut donner du sang à une personne de type B ou AB.
  • Une personne de type AB peut donner du sang à une personne de type AB uniquement.
  • Une personne avec du sang de type O peut faire un don à n’importe qui.

Quelle est la probabilité qu’une personne choisie au hasard ne puisse pas donner de sang à tout le monde? En d’autres termes, quelle est la probabilité qu’une personne choisie au hasard n’ait pas de groupe sanguin O? Nous devons trouver P (pas O). En utilisant la règle du complément, P (pas O) = 1- P(O) = 1 – 0,44 = 0,56. En d’autres termes, 56% de la population américaine n’a pas de groupe sanguin O:

Clairement, nous pourrions également trouver P (pas O) directement en ajoutant les probabilités de B, AB et A.

Commentaire:

  • Notez que la règle du complément, P(pas A) = 1-P(A) peut être reformulée en P(A) = 1–P (pas A).
    • P(not A) = 1-P(A)
    • peut être reformulé en P(A) = 1–P (not A).
    • Cette manipulation algébrique apparemment triviale a une application importante et capture en fait la force de la règle du complément.
    • Dans certains cas, lorsque trouver directement P(A) est très compliqué, il peut être beaucoup plus facile de trouver P (pas A) et de simplement le soustraire de 1 pour obtenir le P (A) souhaité.
    • Nous reviendrons bientôt sur ce commentaire et fournirons des exemples supplémentaires.
Ai-Je Obtenu Cela?: Règle de probabilité Trois
  • La règle du complément peut être utile lorsqu’il est plus facile de calculer la probabilité du complément de l’événement plutôt que l’événement lui-même.
  • Remarquez, nous avons encore utilisé l’expression « au moins un. »
  • Maintenant, nous avons vu que le complément de « au moins un … » est « aucun … » ou « non …. » (comme nous l’avons mentionné précédemment en termes d’événements « opposés « ).
  • Dans l’activité ci-dessus, nous voyons que
    • P (AUCUN de ces deux effets secondaires) = 1-P (au moins un de ces deux effets secondaires)
  • Il s’agit d’une application courante de la règle du complément que vous pouvez souvent reconnaître par la phrase « au moins un” dans le problème.

Probabilités Impliquant plusieurs événements

Nous serons souvent intéressés à trouver des probabilités impliquant plusieurs événements tels que

  • P(A ou B) =P (l’événement A se produit ou l’événement B se produit ou les deux se produisent)
  • P(A et B) =P (l’événement A se produit et l’événement B se produit)

Un problème courant de terminologie concerne la façon dont nous pensons habituellement à « ou » dans notre vie quotidienne. Par exemple, lorsqu’un parent dit à son enfant dans un magasin de jouets « Voulez-vous un jouet A ou un jouet B? », cela signifie que l’enfant n’aura qu’un seul jouet et qu’il devra choisir entre eux. Obtenir les deux jouets n’est généralement pas une option.

En revanche :

En probabilité, « OU” signifie l’un ou l’autre ou les deux.

et donc P(A ou B) = P(l’événement A se produit ou l’événement B se produit ou LES DEUX se produisent)

Cela dit, il convient de noter qu’il existe certains cas où il est tout simplement impossible que les deux événements se produisent en même temps.

Règle de probabilité Quatre

La distinction entre les événements qui peuvent se produire ensemble et ceux qui ne le peuvent pas est importante.

Disjoint: Deux événements qui ne peuvent pas se produire en même temps sont appelés disjoints ou mutuellement exclusifs. (Nous utiliserons disjoints.)

Un diagramme de Venn intitulé "A et B sont disjoints."Tout lUn diagramme de Venn intitulé "A et B ne sont PAS disjoints."Tout l

Il devrait être clair d’après l’image que

  • dans le premier cas, où les événements ne sont PAS disjoints, P(A et B) ≠ 0
  • dans le second cas, où les événements SONT disjoints, P(A et B) = 0.

Voici deux exemples :

EXEMPLE:

Considérez les deux événements suivants:

A – une personne choisie au hasard a le groupe sanguin A, et

B- une personne choisie au hasard a le groupe sanguin B.

Dans de rares cas, il est possible qu’une personne ait plus d’un type de sang qui coule dans ses veines, mais pour nos besoins, nous allons supposer que chaque personne ne peut avoir qu’un seul groupe sanguin. Par conséquent, il est impossible que les événements A et B se produisent ensemble.

  • Les événements A et B sont DISJOINTS

D’autre part …

EXEMPLE:

Considérez les deux événements suivants:

A – une personne choisie au hasard a un groupe sanguin A

B — une personne choisie au hasard est une femme.

Dans ce cas, il est possible que les événements A et B se produisent ensemble.

  • Les événements A et B ne sont PAS DISJOINTS.

Les diagrammes de Venn suggèrent qu’une autre façon de penser aux événements disjoints par rapport aux événements non disjoints est que les événements disjoints ne se chevauchent pas. Ils ne partagent aucun des résultats possibles et ne peuvent donc pas se produire ensemble.

D’autre part, les événements qui ne sont pas disjoints se chevauchent en ce sens qu’ils partagent certains des résultats possibles et peuvent donc se produire en même temps.

Nous commençons maintenant avec une règle simple pour trouver P(A ou B) pour les événements disjoints.

Règle de probabilité Quatre (La Règle d’addition pour les événements Disjoints) :

  • Si A et B sont des événements disjoints, alors P(A ou B) = P(A) +P(B).

Commentaire :

  • Lorsqu’il s’agit de probabilités, le mot « ou” sera toujours associé à l’opération d’addition; d’où le nom de cette règle, « La règle d’addition.”

EXEMPLE: Groupes sanguins

Rappelez l’exemple de groupe sanguin:

Données données au format "Groupe sanguin: Probabilité": O: 0,44; A: 0,42; B: 0,10 ;AB: 0,04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Voici quelques informations supplémentaires

  • Une personne de type Acan donne du sang à une personne de type A ou AB.
  • Une personne de type Bpeut donner du sang à une personne de type B ou AB.
  • Une personne de type Abpeut donner du sang à une personne de type AB
  • Une personne de type Oblood peut faire un don à n’importe qui.

Quelle est la probabilité qu’une personne choisie au hasard soit un donneur potentiel pour une personne de groupe sanguin A?

D’après les informations données, nous savons qu’être donneur potentiel pour une personne de groupe sanguin A signifie avoir un groupe sanguin A ou O.

Nous devons donc trouver P (A ou O). Puisque les événements A et O sont disjoints, nous pouvons utiliser la règle d’addition pour les événements disjoints pour obtenir :

  • P(A ou O) = P(A) + P(O) = 0,42 + 0,44 = 0,86.

Il est facile de voir pourquoi l’ajout de la probabilité a du sens.

Si 42% de la population a le groupe sanguin A et 44% de la population a le groupe sanguin O,

  • alors 42% + 44% = 86% de la population a le groupe sanguin A ou O, et sont donc des donneurs potentiels à une personne de groupe sanguin A.

Ce raisonnement sur la raison pour laquelle la règle d’addition est logique peut être visualisé à l’aide du graphique circulaire ci-dessous:

Un graphique circulaire intitulé "Groupes sanguins."Le type A occupe 42% du graphique circulaire et le type O 44%. Ensemble, en tant que A ou O, ils occupent 86% du graphique circulaire."Blood Types." Type A takes up 42% of the pie chart, and type O takes up 44%. Together, as A or O, they take up 86% of the pie chart.

Apprendre en faisant: Règle de probabilité Quatre

Commentaire:

  • La Règle d’addition pour les événements Disjoints peut naturellement être étendue à plus de deux événements disjoints. Prenons trois, par exemple. Si A, B et C sont trois événements disjoints
Un diagramme de Venn montrant 3 événements disjoints. Comme d'habitude, il y a une boîte grise montrant tout l'espace d'échantillon. À l'intérieur de cette boîte grise se trouvent trois cercles complètement séparés. Le premier cercle est pour les occurrences en A, le deuxième pour les occurrences en B et le troisième pour les occurrences en C.

alors P(A ou B ou C) = P(A) + P(B) +P(C). La règle est la même pour un nombre quelconque d’événements disjoints.

Ai-Je Obtenu Cela?: Règle de probabilité Quatre

Nous avons maintenant terminé avec la première version de la Règle d’addition (Règle quatre) qui est la version limitée aux événements disjoints. Avant de couvrir la deuxième version, nous devons d’abord discuter de P (A et B).

Trouver P(A et B) en utilisant la logique

Nous passons maintenant au calcul

  • P(A et B) =P (l’événement A se produit et l’événement B se produit)

Plus tard, nous discuterons des règles de calcul de P(A et B).

Tout d’abord, nous voulons illustrer qu’une règle n’est pas nécessaire chaque fois que vous pouvez déterminer la réponse par la logique et le comptage.

Cas particulier :

Il y a un cas particulier pour lequel nous savons ce que P(A et B) est égal sans appliquer de règle.

Apprendre en faisant: Trouver P(A et B) #1

Donc, si les événements A et B sont disjoints, alors (par définition) P(A et B) = 0. Mais que se passe-t-il si les événements ne sont pas disjoints?

Rappelons que la règle 4, la règle d’addition, a deux versions. L’un est limité aux événements disjoints, que nous avons déjà couverts, et nous traiterons de la version plus générale plus tard dans ce module. Il en sera de même pour les probabilités impliquant ET

Cependant, sauf cas particuliers, nous nous baserons sur la LOGIQUE pour trouver P(A et B) dans ce cours.

Avant de couvrir toute règle formelle, regardons un exemple où les événements ne sont pas disjoints.

EXEMPLE: Statut parodontal et sexe

Considérez le tableau suivant concernant le statut parodontal des individus et leur sexe. L’état parodontal fait référence à une maladie des gencives où les individus sont classés comme étant en bonne santé, atteints de gingivite ou atteints d’une maladie parodontale.

Nous avons déjà vu ce type de tableau lorsque nous avons discuté de l’analyse des données dans le cas C → C. Aux fins de cette question, nous utiliserons ces données comme notre « population” et envisagerons de sélectionner au hasard une personne.

Apprendre en faisant: Statut parodontal et sexe

Nous aimons poser des questions de probabilité similaires à l’exemple précédent (en utilisant une table bidirectionnelle basée sur des données) car cela vous permet de établissez des liens entre ces sujets et vous aide à garder à l’esprit une partie de ce que vous avez appris sur les données.

Rappelez-vous, notre objectif principal dans ce cours est d’analyser des données réelles!

Règle de probabilité Cinq

Nous sommes maintenant prêts à passer à la version étendue de la Règle d’addition.

Dans cette section, nous allons apprendre à trouver P(A ou B) lorsque A et B ne sont pas nécessairement disjoints.

  • Nous appellerons cette version étendue la « Règle générale d’addition » et l’indiquerons comme Règle de probabilité Cinq.

Nous commencerons par énoncer la règle et fournir un exemple similaire aux types de problèmes que nous posons généralement dans ce cours. Ensuite, nous présenterons un autre exemple où nous n’avons pas les données brutes d’un échantillon à partir desquelles travailler.

Règle de probabilité Cinq:

  • La Règle d’addition générale: P(A ou B) = P(A) + P(B) – P(A et B).

REMARQUE: Il est préférable d’utiliser la logique pour trouver P (A et B), pas une autre formule.

Une erreur TRÈS courante consiste à appliquer incorrectement la règle de multiplication pour les événements indépendants couverts à la page suivante. Cela ne sera correct que si A et B sont indépendants (voir définitions à suivre), ce qui est rarement le cas dans les données présentées dans des tableaux bidirectionnels.

Comme nous l’avons vu dans les exemples précédents, lorsque les deux événements ne sont pas disjoints, il y a un certain chevauchement entre les événements.

  • Si nous additionnons simplement les deux probabilités ensemble, nous obtiendrons la mauvaise réponse car nous avons compté une « probabilité” deux fois!
  • Ainsi, il faut soustraire cette probabilité « supplémentaire » pour arriver à la bonne réponse. Le diagramme de Venn et les tableaux bidirectionnels sont utiles pour visualiser cette idée.

Un diagramme de venn intitulé "A et B ne sont PAS disjoints."Une boîte grise représente l

Cette règle est plus générale car elle fonctionne pour n’importe quelle paire d’événements (même des événements disjoints). Notre conseil est toujours d’essayer de répondre à la question en utilisant la logique et le comptage dans la mesure du possible, sinon, nous devons être extrêmement prudents pour choisir la bonne règle pour le problème.

PRINCIPE:

Si vous pouvez calculer une probabilité en utilisant la logique et le comptage, vous n’avez pas besoin de règle de probabilité (bien que la règle correcte puisse toujours être appliquée)

Notez que, si A et B sont disjoints, alors P(A et B) = 0 et la règle 5 se réduit à la règle 4 pour ce cas particulier.

Un diagramme de Venn intitulé "A et B sont disjoints. L

Revenons sur le dernier exemple:

EXEMPLE: Statut parodontal et sexe

Envisagez de sélectionner au hasard un individu parmi ceux représentés dans le tableau suivant concernant le statut parodontal des individus et leur sexe. L’état parodontal fait référence à une maladie des gencives où les individus sont classés comme étant en bonne santé, atteints de gingivite ou atteints d’une maladie parodontale.

Passons en revue ce que nous avons appris jusqu’à présent. Nous pouvons calculer n’importe quelle probabilité dans ce scénario si nous pouvons déterminer combien d’individus satisfont l’événement ou la combinaison d’événements.

  • P (Mâle) = 3009/8027 = 0,3749
  • P (Femelle) = 5018/8027 = 0,6251
  • P (Sain) = 3750/8027 = 0,4672
  • P (Non sain) = P (Gingivite ou Périodicité) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
    Nous pourrions également calculer cela en utilisant la règle du complément: 1-P (Sain)

Nous avons également constaté précédemment que

  • P (Mâle ET Sain) = 1143/8027 = 0.1424

Règle de rappel 5, P(A ou B) = P(A) + P(B) – P(A et B). Nous utilisons maintenant cette règle pour calculer P (Mâle OU Sain)

  • P (Mâle ou Sain) = P (Mâle) + P (Sain) – P (Mâle et Sain) = 0.3749 + 0.4672 – 0.1424 = 0,6997 ou environ 70%

Nous avons résolu cette question plus tôt en comptant simplement le nombre d’individus de sexe masculin ou en bonne santé ou les deux. L’image ci-dessous illustre les valeurs que nous devons combiner. Nous devons compter

  • Tous les mâles
  • Tous les individus en bonne santé
  • MAIS, ne comptez personne deux fois!!

En utilisant cette approche logique, nous trouverions

  • P (Mâle ou en bonne santé) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996

Nous avons une différence mineure dans nos réponses à la dernière décimale en raison de l’arrondi qui s’est produit lorsque nous avons calculé P (Mâle), P (Sain) et P (Mâle et Sain), puis appliqué la règle 5.

Clairement, la réponse est effectivement la même, environ 70%. Si nous portions nos réponses à plus de décimales ou si nous utilisions les fractions d’origine, nous pourrions éliminer complètement ce petit écart.

Regardons un dernier exemple pour illustrer la règle de probabilité 5 lorsque la règle est nécessaire – c’est-à-dire lorsque nous n’avons pas de données réelles.

EXEMPLE : Livraison importante!

Il est essentiel qu’un certain document atteigne sa destination en une journée. Pour maximiser les chances de livraison à temps, deux copies du document sont envoyées en utilisant deux services, le service A et le service B. On sait que les probabilités de livraison à temps sont:

  • 0,90 pour le service A (P(A) = 0,90)
  • 0,80 pour le service B (P(B) = 0,80)
  • 0.75 pour les deux services étant à l’heure (P(A et B) = 0,75)
    (Notez que A et B ne sont pas disjoints. Ils peuvent se produire avec une probabilité de 0,75.)

Les diagrammes de Venn ci-dessous illustrent les probabilités P(A), P(B) et P(A et B) :

Trois diagrammes de Venn. Dans chacun d'eux, il y a un grand rectangle représentant tout l'espace d'échantillon S. À l'intérieur de ce rectangle se trouvent deux cercles qui se chevauchent partiellement. Un cercle est étiqueté A et l'autre est étiqueté B. Dans le premier diagramme de Venn, le cercle pour A est coloré en bleu, et nous voyons que P (A) = 0,90. Dans un certain sens, P(A) est l'aire du cercle A. Dans le deuxième diagramme de Venn, le cercle pour B est coloré en bleu, et il est marqué que P(B) = 0,80. Tout comme dans le premier diagramme de Venn, on peut penser que le cercle pour B a une aire de 0,80. Dans le troisième diagramme de Venn, la zone qui est le chevauchement des cercles A et B est colorée en bleu. P (A et B) = 0,75. L'aire du chevauchement peut être considérée comme ayant une aire de 0,75.

Dans le contexte de ce problème, la question évidente d’intérêt est:

  • Quelle est la probabilité de livraison à temps du document en utilisant cette stratégie (de l’envoyer via les deux services)?

Le document arrivera à destination à temps tant qu’il sera livré à temps par le service A ou par le service B ou par les deux services. En d’autres termes, lorsque l’événement A se produit ou que l’événement B se produit ou que les deux se produisent. si….

P (livraison à temps en utilisant cette stratégie) = P(A ou B), qui est représenté par la région ombrée dans le diagramme ci-dessous:

Le même diagramme de Venn, à l'exception de la zone des deux cercles, a été coloré en bleu (ombré). Cela signifie que la zone du chevauchement est également colorée en bleu. Notez que la zone de chevauchement n'a été colorée qu'une seule fois, donc même si elle est dans les deux cercles, nous la compterons une fois.

Nous pouvons maintenant

  • utiliser les trois diagrammes de Venn représentant P(A), P(B) et P(A et B)
  • pour voir que nous pouvons trouver P(A ou B) en ajoutant P(A) (représenté par le cercle de gauche) et P(B) (représenté par le cercle de droite),
  • puis en soustrayant P(A et B) (représenté par le chevauchement), puisque nous l’avons inclus deux fois, une fois dans le cadre de P(A) et une fois dans le cadre de P(B).

Ceci est illustré dans l’image suivante:

L'aire des deux cercles dans le diagramme de Venn (en comptant une fois la zone de chevauchement) est calculée comme suit: l'aire du cercle de A (qui inclut le chevauchement) + l'aire du cercle de B (qui inclut également le chevauchement) - l'aire du chevauchement. On obtient donc : P(A ou B) = P(A) + P(B) - P(A et B).'s circle (which includes the overlap) + the area of B's circle (which also includes the overlap) - the area of the overlap. We therefore get: P(A or B) = P(A) + P(B) - P(A and B).

Si nous appliquons ceci à notre exemple, nous constatons que:

  • P(A ou B) =P (livraison à temps en utilisant cette stratégie)= 0.90 + 0.80 – 0.75 = 0.95.

Ainsi, notre stratégie d’utilisation de deux services de livraison augmente notre probabilité de livraison à temps à 0,95.

Alors que les diagrammes de Venn étaient parfaits pour visualiser la Règle d’addition générale, dans de tels cas, il est beaucoup plus facile d’afficher les informations et de travailler avec une table de probabilités bidirectionnelle, tout comme nous avons examiné la relation entre deux variables catégorielles dans la section Analyse exploratoire des données.

Nous allons simplement vous montrer le tableau, pas comment nous le dérivons car il ne vous sera pas demandé de le faire pour nous. Vous devriez pouvoir voir qu’une addition / soustraction simple et logique est tout ce que nous avons utilisé pour remplir le tableau ci-dessous.

La table a des colonnes "B", "pas B" et "Total." Les lignes sont "A", "pas A" et "Total."Voici quelques informations sur le tableau, organisé par cellule: À la cellule A, B, la valeur y (0,75) est P(A et B) = P (livraison à temps par les deux services). A la cellule A, et non B, la valeur y (0,15) est P(A et non B) = P (livraison à temps UNIQUEMENT par le service A). À la cellule Non A et B, la valeur (0,05) est P (pas A et B) = P (livraison à temps UNIQUEMENT par le service B). A la cellule Pas A et Pas B, la valeur (0,05) est P (pas A et pas B) = P (Ni service A ni B livrés à temps)."B," "not B," and "Total." The rows are "A," "not A," and "Total." Here are is some information about the table, organized by cell: At the cell A,B, the value there (0.75) is P(A and B) = P(on-time delivery by both services). At the cell A,not B, the value there (0.15) is P(A and Not B) = P(on-time delivery ONLY by service A). At cell Not A and B, the value (0.05) is P(not A and B) = P(on-time delivery ONLY by service B). At cell Not A and Not B, the value (0.05) is P(not A and not B) = P(Neither service A nor B delivered on time).

Lors de l’utilisation d’une table bidirectionnelle, il faut se rappeler de regarder toute la ligne ou la colonne pour trouver des probabilités globales impliquant uniquement A ou seulement B.

  • P(A) = 0,90 signifie que dans 90% des cas où le service A est utilisé, il livre le document à temps. Pour trouver cela, nous examinons la probabilité totale pour la ligne contenant A. En trouvant P (A), nous ne savons pas si B se produit ou non.

La première ligne de la table a été mise en surbrillance. Voici les données en surbrillance au format Ligne, Colonne: A, B: P(A et B) = 0,75; A, pas B: P(A et pas B) = 0,15; A, Total: P(A) = 0,90 = P(A et B) + P(A et pas B)'s first row has been highlighted. Here is the highlighted data in "Row, Column" format: A, B: P(A and B) = 0.75; A, not B: P(A and not B) = 0.15; A, Total: P(A) = 0.90 = P(A and B) + P(A and not B)

  • P(B) = 0,80 signifie que dans 80% des cas où le service B est utilisé, il livre le document à temps. Pour trouver cela, nous examinons la probabilité totale pour la colonne contenant B. En trouvant P (B), nous ne savons pas si A se produit ou non.

La première colonne du tableau a été mise en surbrillance. Voici les données en surbrillance au format Ligne, colonne: A, B: P(A et B) = 0,75; pas A, B:P (pas A et B) = 0.05;B, Total: P(B) = 0,80 = P(A et B) + P (pas A et B)'s first column has been highlighted. Here is the highlighted data in "Row, Column" format: A,B: P(A and B) = 0.75; not A, B: P(not A and B) = 0.05; B,Total: P(B) = 0.80 = P(A and B) + P(not A and B)

Commentaire

  • Lorsque nous avons utilisé des tableaux bidirectionnels dans la section Analyse exploratoire des données (EDA), il s’agissait d’enregistrer les valeurs de deux variables catégorielles pour un échantillon concret d’individus.
  • En revanche, les informations d’une table de probabilité bidirectionnelle concernent une population entière et les valeurs sont plutôt abstraites.
  • Si nous avions traité quelque chose comme l’exemple de livraison dans la section EDA, nous aurions enregistré le nombre réel de livraisons à temps (et non à temps) pour des échantillons de documents postés avec le service A ou B.
  • Dans cette section, les probabilités à long terme sont présentées comme étant connues.
  • Vraisemblablement, les probabilités rapportées dans cet exemple de livraison étaient basées sur des fréquences relatives enregistrées au cours de nombreuses répétitions.

Applet interactif: Diagramme de Venn de probabilité

Règle d’arrondi pour la probabilité:

Suivez les directives générales suivantes dans ce cours. En cas de doute, portez plus de décimales. Si nous spécifions donner exactement ce qui est demandé.

  • En général, vous devez porter les probabilités à au moins 4 décimales pour les étapes intermédiaires.
  • Nous arrondissons souvent notre réponse finale à deux ou trois décimales.
  • Pour des probabilités extrêmement faibles, il est important d’avoir 1 ou deux chiffres significatifs (chiffres non nuls), tels que 0,000001 ou 0,000034, etc.

De nombreux paquets informatiques peuvent afficher des valeurs extrêmement petites en utilisant une notation scientifique telle que

  • 58×10-5 ou 1,58 E-5 pour représenter 0,0000158

Résumons

Jusqu’à présent, dans notre étude des probabilités, vous avez été initiés à la nature parfois contre-intuitive de la probabilité et aux principes fondamentaux qui sous-tendent la probabilité, tels qu’une fréquence relative.

Nous vous avons également donné quelques outils pour vous aider à trouver les probabilités des événements — à savoir les règles de probabilité.

Vous avez probablement remarqué que la section de probabilité était significativement différente des deux sections précédentes; elle a une composante technique / mathématique beaucoup plus grande, de sorte que les résultats ont tendance à être plus de nature « bonne ou mauvaise”.

Dans la section Analyse exploratoire des données, pour la plupart, l’ordinateur s’occupait de l’aspect technique des choses, et nos tâches étaient de lui dire de faire la bonne chose et ensuite d’interpréter les résultats.

En probabilité, nous faisons le travail du début à la fin, du choix du bon outil (règle) à utiliser, à son utilisation correcte, à l’interprétation des résultats.

Voici un résumé des règles que nous avons présentées jusqu’à présent.

1. La règle de probabilité #1 indique :

  • Pour tout événement A, 0 ≤ P(A) ≤ 1

2. La règle de probabilité #2 stipule:

  • La somme des probabilités de tous les résultats possibles est 1

3. La Règle du complément (#3) indique que

  • P(not A) = 1–P(A)

ou lorsqu’elle est réarrangée

  • P(A) =1–P(not A)

Cette dernière représentation de la Règle du complément est particulièrement utile lorsque nous devons trouver des probabilités d’événements du genre « au moins un des …”

4. La Règle générale d’addition (#5) stipule que pour deux événements quelconques,

  • P(A ou B) = P(A) + P(B) – P(A et B),

où, par P(A ou B), nous entendons P(A se produit ou B se produit ou les deux).

Dans le cas particulier des événements disjoints, des événements qui ne peuvent pas se produire ensemble, la Règle d’addition Générale peut être réduite à la Règle d’addition pour les Événements Disjoints (#4), qui est

  • P(A ou B) = P(A) +P(B). *

* Utilisez UNIQUEMENT lorsque vous êtes CONVAINCU que les événements sont disjoints (ils ne se chevauchent PAS)

5. La version restreinte de la règle d’addition (pour les événements disjoints) peut être facilement étendue à plus de deux événements.

6. Jusqu’à présent, nous n’avons trouvé que P(A et B) en utilisant la logique et le comptage dans des exemples simples

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *