- Introduction
- Règles de Probabilité
- Règle de probabilité Un (Pour tout événement A, 0 ≤ P (A) ≤ 1)
- Règle de probabilité Deux (La somme des probabilités de tous les résultats possibles est 1)
- Règle de probabilité Trois (La Règle du complément)
- Probabilités Impliquant plusieurs Événements
- Règle de probabilité Quatre (Règle d’Addition pour les Événements Disjoints)
- Trouver P(A et B) en utilisant la Logique
- Règle de probabilité Cinq (La Règle générale d’addition)
li>
- Règle empirique d’arrondi pour la probabilité
- Résumons
Dans la section précédente, nous avons introduit la probabilité comme moyen de quantifier l’incertitude résultant de la réalisation d’expériences à l’aide d’un échantillon aléatoire de la population d’intérêt.
Nous avons vu que la probabilité d’un événement (par exemple, l’événement selon lequel une personne choisie au hasard a un groupe sanguin O) peut être estimée par la fréquence relative à laquelle l’événement se produit dans une longue série d’essais. Nous recueillons donc des données auprès de nombreuses personnes pour estimer la probabilité qu’une personne ait un groupe sanguin O.
Dans cette section, nous établirons les méthodes et principes de base pour trouver des probabilités d’événements.
Nous couvrirons également certaines des règles de base de probabilité qui peuvent être utilisées pour calculer les probabilités.
Introduction
Nous allons commencer par un exemple de probabilité classique de lancer une pièce de monnaie équitable trois fois.
Étant donné que les têtes et les queues sont également probables pour chaque lancer dans ce scénario, chacune des possibilités pouvant résulter de trois lancers le sera également afin que nous puissions lister toutes les valeurs possibles et utiliser cette liste pour calculer les probabilités.
Comme nous nous concentrons dans ce cours sur les données et les statistiques (et non sur les probabilités théoriques), dans la plupart de nos problèmes futurs, nous utiliserons un ensemble de données résumées, généralement une table de fréquences ou une table bidirectionnelle, pour calculer les probabilités.
EXEMPLE: Lancez une pièce équitable trois fois
Listons chaque résultat possible (ou résultat possible):
{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}
Définissons maintenant les événements suivants:
Événement A: « N’obtenir aucun H”
Événement B: « Obtenir exactement un H”
Événement C: « Obtenir au moins un H”
/p>
Notez que chaque événement est en effet une déclaration sur le résultat que l’expérience va produire. En pratique, chaque événement correspond à une collection (sous-ensemble) des résultats possibles.
Événement A: ”Ne pas obtenir de H » → TTT
Événement B: « Obtenir exactement un H” → HTT, THT, TTH
Événement C: « Obtenir au moins un H” → HTT, THT, TTH, THH, HTH, HHT, HHH
Voici une représentation visuelle des événements A, B et C.
À partir de cette représentation visuelle des événements, il est facile de voir que l’événement B est totalement inclus dans l’événement C, en ce sens que chaque résultat de l’événement B est également un résultat de l’événement C. Notez également que l’événement A se distingue des événements B et C, en ce sens qu’ils n’ont aucun résultat en commun, ou aucun chevauchement. À ce stade, ce ne sont que des observations remarquables, mais comme vous le découvrirez plus tard, ce sont des observations très importantes.
Et si nous ajoutions le nouvel événement :
Événement D: « Obtenir un T au premier lancer » → THH, THT, TTH, TTT
À quoi cela ressemblerait-il si nous ajoutions l’événement D au diagramme ci-dessus? (Lien vers la réponse)
Rappelez-vous, puisque H et T sont également probables à chaque lancer, et comme il y a 8 résultats possibles, la probabilité de chaque résultat est de 1/8.
Voyez si vous pouvez répondre aux questions suivantes en utilisant les diagrammes et / ou la liste des résultats de chaque événement ainsi que ce que vous avez appris jusqu’à présent sur les probabilités.
Si vous avez pu répondre correctement à ces questions, vous avez probablement un bon instinct pour calculer la probabilité! Lisez la suite pour savoir comment nous allons appliquer ces connaissances.
Sinon, nous essaierons de vous aider à développer cette compétence dans cette section.
Commentaire:
- Notez que dans l’événement C, « Obtenir au moins une tête », il n’y a qu’un seul résultat possible qui manque, « Ne PAS avoir de tête » = TTT. Nous aborderons à nouveau cette question lorsque nous parlerons des règles de probabilité, en particulier de la règle du complément. À ce stade, nous voulons juste que vous réfléchissiez à la façon dont ces deux événements sont « opposés » dans ce scénario.
Il est TRÈS important de réaliser que ce n’est pas parce que nous pouvons énumérer les résultats possibles que chaque résultat est également probable.
C’est le message (drôle) du clip du Daily Show que nous avons fourni à la page précédente. Mais réfléchissons à nouveau à cela. Dans ce clip, Walter affirme que puisqu’il y a deux résultats possibles, la probabilité est de 0,5. Les deux résultats possibles sont
- Le monde sera détruit en raison de l’utilisation du grand collisionneur de hadrons
- Le monde ne sera PAS détruit en raison de l’utilisation du grand collisionneur de hadrons
Espérons qu’il soit clair que ces deux résultats ne sont pas également probables!!
Considérons un exemple plus courant.
EXEMPLE: Malformations congénitales
Supposons que nous sélectionnions au hasard trois enfants et que nous nous intéressions à la probabilité qu’aucun des enfants ne présente de malformations congénitales.
Nous utilisons la notation D pour représenter un enfant né avec une anomalie congénitale et N pour représenter l’enfant né sans anomalie congénitale. Nous pouvons énumérer les résultats possibles tout comme nous l’avons fait pour le tirage au sort, ils sont:
{DDD, NDD, MDN, DDN, DNN, NDN, NND, NNN}
Les événements DDD (les trois enfants sont nés avec des malformations congénitales) et NNN (aucun des enfants ne naît avec des malformations congénitales) sont-ils également probables?
Il devrait être raisonnable pour vous que P(NNN) soit beaucoup plus grand que P(DDD).
Ceci est dû au fait que P(N) et P(D) ne sont pas des événements également probables.
Il est rare (certainement pas 50%) qu’un enfant sélectionné au hasard naisse avec une malformation congénitale.
Règles de probabilité
Maintenant, nous passons à l’apprentissage de certaines des règles de base de probabilité.
Heureusement, ces règles sont très intuitives, et tant qu’elles sont appliquées systématiquement, elles nous permettront de résoudre des problèmes plus compliqués; en particulier, les problèmes pour lesquels notre intuition pourrait être inadéquate.
Comme la plupart des probabilités que vous serez invité à trouver peuvent être calculées en utilisant à la fois la logique et le comptage
et
- les règles que nous allons apprendre,
nous donnons les conseils suivants en principe.
PRINCIPE:
Si vous pouvez calculer une probabilité en utilisant la logique et le comptage, vous n’avez pas besoin de règle de probabilité (bien que la règle correcte puisse toujours être appliquée)
Règle de probabilité Une
Notre première règle nous rappelle simplement la propriété de base de la probabilité que nous avons déjà apprise.
La probabilité d’un événement, qui nous informe de la probabilité qu’il se produise, peut aller de 0 (indiquant que l’événement ne se produira jamais) à 1 (indiquant que l’événement est certain).
Règle de probabilité Une :
- Pour tout événement A, 0 ≤ P (A) ≤ 1.
REMARQUE: Une utilisation pratique de cette règle est qu’elle peut être utilisée pour identifier tout calcul de probabilité qui s’avère supérieur à 1 (ou inférieur à 0) comme incorrect.
Avant de passer aux autres règles, regardons d’abord un exemple qui fournira un contexte pour illustrer les plusieurs règles suivantes.
EXEMPLE: Groupes sanguins
Comme indiqué précédemment, tout le sang humain peut être typé O, A, B ou AB.
De plus, la fréquence d’apparition de ces groupes sanguins varie selon les groupes ethniques et raciaux.
Selon le Centre du sang de l’Université de Stanford (bloodcenter.Stanford.edu), ce sont les probabilités des groupes sanguins humains aux États-Unis (la probabilité pour le type A a été volontairement omise):
Question motivante pour la règle 2: Une personne aux États-Unis est choisie au hasard. Quelle est la probabilité que la personne ait le groupe sanguin A?
Réponse: Notre intuition nous dit que puisque les quatre groupes sanguins O, A, B et AB épuisent toutes les possibilités, leurs probabilités ensemble doivent s’élever à 1, qui est la probabilité d’un événement « certain” (une personne a l’un de ces 4 groupes sanguins pour certains).
Puisque les probabilités de O, B et AB s’additionnent à 0.44 + 0.1 + 0.04 = 0,58, la probabilité de type A doit être la valeur restante 0.42 (1 – 0.58 = 0.42):
Règle de probabilité Deux
Cet exemple illustre notre deuxième règle, qui nous dit que la probabilité de tous les résultats possibles ensemble doit être de 1.
Règle de probabilité Deux:
La somme des probabilités de tous les résultats possibles est 1.
C’est un bon endroit pour comparer et comparer ce que nous faisons ici avec ce que nous avons appris dans la section Analyse exploratoire des données (EDA).
- Notez que dans ce problème, nous nous concentrons essentiellement sur une seule variable catégorielle: le groupe sanguin.
- Nous avons résumé cette variable ci-dessus, comme nous l’avons résumé dans la section EDA, en énumérant les valeurs prises par la variable et la fréquence à laquelle elle les prend.
- Dans EDA, nous avons utilisé des pourcentages, et ici nous utilisons des probabilités, mais les deux transmettent les mêmes informations.
- Dans la section EDA, nous avons appris qu’un graphique circulaire fournit un affichage approprié lorsqu’une seule variable catégorielle est impliquée, et de même nous pouvons l’utiliser ici (en utilisant des pourcentages au lieu de probabilités):
Même si ce que nous faisons ici est en effet similaire à ce que nous avons fait dans la section EDA, il existe une différence subtile mais importante entre les situations sous-jacentes
- Dans EDA, nous avons résumé les données obtenues à partir d’un échantillon d’individus pour lesquels les valeurs de la variable d’intérêt ont été enregistrées.
- Ici, lorsque nous présentons la probabilité de chaque groupe sanguin, nous avons à l’esprit l’ensemble de la populationde personnes aux États-Unis, pour lesquelles nous supposons connaître la fréquence globale des valeurs prises par la variable d’intérêt.
Règle de probabilité Trois
Dans la probabilité et dans ses applications, nous sommes fréquemment intéressés à trouver la probabilité qu’un certain événement ne se produise pas.
Un point important à comprendre ici est que « l’événement A ne se produit pas” est un événement distinct qui comprend tous les résultats possibles qui ne sont pas dans A et est appelé « l’événement complémentaire de A.”
Notation: nous écrirons « pas A” pour désigner l’événement que A ne se produit pas. Voici une représentation visuelle de la façon dont l’événement A et son événement complémentaire « pas A” représentent ensemble tous les résultats possibles.
Commentaire:
- Un tel affichage visuel s’appelle un « diagramme de Venn. »Un diagramme de Venn est un moyen simple de visualiser les événements et les relations entre eux à l’aide de rectangles et de cercles.
La règle 3 traite de la relation entre la probabilité d’un événement et la probabilité de son événement de complément.
Étant donné que l’événement A et l’événement « pas A” constituent ensemble tous les résultats possibles, et puisque la règle 2 nous indique que la somme des probabilités de tous les résultats possibles est 1, la règle suivante devrait être assez intuitive:
Règle de probabilité Trois (La règle du complément):
- P (not A) = 1–P(A)
- c’est-à-dire la probabilité que un événement ne se produit pas vaut 1 moins la probabilité qu’il se produise.
EXEMPLE: Groupes sanguins
Retour à l’exemple de groupe sanguin:
Voici quelques informations supplémentaires:
- Une personne de type A peut donner du sang à une personne de type A ou AB.
- Une personne de type B peut donner du sang à une personne de type B ou AB.
- Une personne de type AB peut donner du sang à une personne de type AB uniquement.
- Une personne avec du sang de type O peut faire un don à n’importe qui.
Quelle est la probabilité qu’une personne choisie au hasard ne puisse pas donner de sang à tout le monde? En d’autres termes, quelle est la probabilité qu’une personne choisie au hasard n’ait pas de groupe sanguin O? Nous devons trouver P (pas O). En utilisant la règle du complément, P (pas O) = 1- P(O) = 1 – 0,44 = 0,56. En d’autres termes, 56% de la population américaine n’a pas de groupe sanguin O:
Clairement, nous pourrions également trouver P (pas O) directement en ajoutant les probabilités de B, AB et A.
Commentaire:
- Notez que la règle du complément, P(pas A) = 1-P(A) peut être reformulée en P(A) = 1–P (pas A).
- P(not A) = 1-P(A)
- peut être reformulé en P(A) = 1–P (not A).
- Cette manipulation algébrique apparemment triviale a une application importante et capture en fait la force de la règle du complément.
- Dans certains cas, lorsque trouver directement P(A) est très compliqué, il peut être beaucoup plus facile de trouver P (pas A) et de simplement le soustraire de 1 pour obtenir le P (A) souhaité.
- Nous reviendrons bientôt sur ce commentaire et fournirons des exemples supplémentaires.
- La règle du complément peut être utile lorsqu’il est plus facile de calculer la probabilité du complément de l’événement plutôt que l’événement lui-même.
- Remarquez, nous avons encore utilisé l’expression « au moins un. »
- Maintenant, nous avons vu que le complément de « au moins un … » est « aucun … » ou « non …. » (comme nous l’avons mentionné précédemment en termes d’événements « opposés « ).
- Dans l’activité ci-dessus, nous voyons que
- P (AUCUN de ces deux effets secondaires) = 1-P (au moins un de ces deux effets secondaires)
- Il s’agit d’une application courante de la règle du complément que vous pouvez souvent reconnaître par la phrase « au moins un” dans le problème.
Probabilités Impliquant plusieurs événements
Nous serons souvent intéressés à trouver des probabilités impliquant plusieurs événements tels que
- P(A ou B) =P (l’événement A se produit ou l’événement B se produit ou les deux se produisent)
- P(A et B) =P (l’événement A se produit et l’événement B se produit)
Un problème courant de terminologie concerne la façon dont nous pensons habituellement à « ou » dans notre vie quotidienne. Par exemple, lorsqu’un parent dit à son enfant dans un magasin de jouets « Voulez-vous un jouet A ou un jouet B? », cela signifie que l’enfant n’aura qu’un seul jouet et qu’il devra choisir entre eux. Obtenir les deux jouets n’est généralement pas une option.
En revanche :
En probabilité, « OU” signifie l’un ou l’autre ou les deux.
et donc P(A ou B) = P(l’événement A se produit ou l’événement B se produit ou LES DEUX se produisent)
Cela dit, il convient de noter qu’il existe certains cas où il est tout simplement impossible que les deux événements se produisent en même temps.
Règle de probabilité Quatre
La distinction entre les événements qui peuvent se produire ensemble et ceux qui ne le peuvent pas est importante.
Disjoint: Deux événements qui ne peuvent pas se produire en même temps sont appelés disjoints ou mutuellement exclusifs. (Nous utiliserons disjoints.)
Il devrait être clair d’après l’image que
- dans le premier cas, où les événements ne sont PAS disjoints, P(A et B) ≠ 0
- dans le second cas, où les événements SONT disjoints, P(A et B) = 0.
Voici deux exemples :
EXEMPLE:
Considérez les deux événements suivants:
A – une personne choisie au hasard a le groupe sanguin A, et
B- une personne choisie au hasard a le groupe sanguin B.
Dans de rares cas, il est possible qu’une personne ait plus d’un type de sang qui coule dans ses veines, mais pour nos besoins, nous allons supposer que chaque personne ne peut avoir qu’un seul groupe sanguin. Par conséquent, il est impossible que les événements A et B se produisent ensemble.
- Les événements A et B sont DISJOINTS
D’autre part …
EXEMPLE:
Considérez les deux événements suivants:
A – une personne choisie au hasard a un groupe sanguin A
B — une personne choisie au hasard est une femme.
Dans ce cas, il est possible que les événements A et B se produisent ensemble.
- Les événements A et B ne sont PAS DISJOINTS.
Les diagrammes de Venn suggèrent qu’une autre façon de penser aux événements disjoints par rapport aux événements non disjoints est que les événements disjoints ne se chevauchent pas. Ils ne partagent aucun des résultats possibles et ne peuvent donc pas se produire ensemble.
D’autre part, les événements qui ne sont pas disjoints se chevauchent en ce sens qu’ils partagent certains des résultats possibles et peuvent donc se produire en même temps.
Nous commençons maintenant avec une règle simple pour trouver P(A ou B) pour les événements disjoints.
Règle de probabilité Quatre (La Règle d’addition pour les événements Disjoints) :
- Si A et B sont des événements disjoints, alors P(A ou B) = P(A) +P(B).
Commentaire :
- Lorsqu’il s’agit de probabilités, le mot « ou” sera toujours associé à l’opération d’addition; d’où le nom de cette règle, « La règle d’addition.”
EXEMPLE: Groupes sanguins
Rappelez l’exemple de groupe sanguin:
Voici quelques informations supplémentaires
- Une personne de type Acan donne du sang à une personne de type A ou AB.
- Une personne de type Bpeut donner du sang à une personne de type B ou AB.
- Une personne de type Abpeut donner du sang à une personne de type AB
- Une personne de type Oblood peut faire un don à n’importe qui.
Quelle est la probabilité qu’une personne choisie au hasard soit un donneur potentiel pour une personne de groupe sanguin A?
D’après les informations données, nous savons qu’être donneur potentiel pour une personne de groupe sanguin A signifie avoir un groupe sanguin A ou O.
Nous devons donc trouver P (A ou O). Puisque les événements A et O sont disjoints, nous pouvons utiliser la règle d’addition pour les événements disjoints pour obtenir :
- P(A ou O) = P(A) + P(O) = 0,42 + 0,44 = 0,86.
Il est facile de voir pourquoi l’ajout de la probabilité a du sens.
Si 42% de la population a le groupe sanguin A et 44% de la population a le groupe sanguin O,
- alors 42% + 44% = 86% de la population a le groupe sanguin A ou O, et sont donc des donneurs potentiels à une personne de groupe sanguin A.
Ce raisonnement sur la raison pour laquelle la règle d’addition est logique peut être visualisé à l’aide du graphique circulaire ci-dessous:
Commentaire:
- La Règle d’addition pour les événements Disjoints peut naturellement être étendue à plus de deux événements disjoints. Prenons trois, par exemple. Si A, B et C sont trois événements disjoints
alors P(A ou B ou C) = P(A) + P(B) +P(C). La règle est la même pour un nombre quelconque d’événements disjoints.
Nous avons maintenant terminé avec la première version de la Règle d’addition (Règle quatre) qui est la version limitée aux événements disjoints. Avant de couvrir la deuxième version, nous devons d’abord discuter de P (A et B).
Trouver P(A et B) en utilisant la logique
Nous passons maintenant au calcul
- P(A et B) =P (l’événement A se produit et l’événement B se produit)
Plus tard, nous discuterons des règles de calcul de P(A et B).
Tout d’abord, nous voulons illustrer qu’une règle n’est pas nécessaire chaque fois que vous pouvez déterminer la réponse par la logique et le comptage.
Cas particulier :
Il y a un cas particulier pour lequel nous savons ce que P(A et B) est égal sans appliquer de règle.
Donc, si les événements A et B sont disjoints, alors (par définition) P(A et B) = 0. Mais que se passe-t-il si les événements ne sont pas disjoints?
Rappelons que la règle 4, la règle d’addition, a deux versions. L’un est limité aux événements disjoints, que nous avons déjà couverts, et nous traiterons de la version plus générale plus tard dans ce module. Il en sera de même pour les probabilités impliquant ET
Cependant, sauf cas particuliers, nous nous baserons sur la LOGIQUE pour trouver P(A et B) dans ce cours.
Avant de couvrir toute règle formelle, regardons un exemple où les événements ne sont pas disjoints.
EXEMPLE: Statut parodontal et sexe
Considérez le tableau suivant concernant le statut parodontal des individus et leur sexe. L’état parodontal fait référence à une maladie des gencives où les individus sont classés comme étant en bonne santé, atteints de gingivite ou atteints d’une maladie parodontale.
Nous avons déjà vu ce type de tableau lorsque nous avons discuté de l’analyse des données dans le cas C → C. Aux fins de cette question, nous utiliserons ces données comme notre « population” et envisagerons de sélectionner au hasard une personne.
Nous aimons poser des questions de probabilité similaires à l’exemple précédent (en utilisant une table bidirectionnelle basée sur des données) car cela vous permet de établissez des liens entre ces sujets et vous aide à garder à l’esprit une partie de ce que vous avez appris sur les données.
Règle de probabilité Cinq
Nous sommes maintenant prêts à passer à la version étendue de la Règle d’addition.
Dans cette section, nous allons apprendre à trouver P(A ou B) lorsque A et B ne sont pas nécessairement disjoints.
- Nous appellerons cette version étendue la « Règle générale d’addition » et l’indiquerons comme Règle de probabilité Cinq.
Nous commencerons par énoncer la règle et fournir un exemple similaire aux types de problèmes que nous posons généralement dans ce cours. Ensuite, nous présenterons un autre exemple où nous n’avons pas les données brutes d’un échantillon à partir desquelles travailler.
Règle de probabilité Cinq:
- La Règle d’addition générale: P(A ou B) = P(A) + P(B) – P(A et B).
REMARQUE: Il est préférable d’utiliser la logique pour trouver P (A et B), pas une autre formule.
Une erreur TRÈS courante consiste à appliquer incorrectement la règle de multiplication pour les événements indépendants couverts à la page suivante. Cela ne sera correct que si A et B sont indépendants (voir définitions à suivre), ce qui est rarement le cas dans les données présentées dans des tableaux bidirectionnels.
Comme nous l’avons vu dans les exemples précédents, lorsque les deux événements ne sont pas disjoints, il y a un certain chevauchement entre les événements.
- Si nous additionnons simplement les deux probabilités ensemble, nous obtiendrons la mauvaise réponse car nous avons compté une « probabilité” deux fois!
- Ainsi, il faut soustraire cette probabilité « supplémentaire » pour arriver à la bonne réponse. Le diagramme de Venn et les tableaux bidirectionnels sont utiles pour visualiser cette idée.
Cette règle est plus générale car elle fonctionne pour n’importe quelle paire d’événements (même des événements disjoints). Notre conseil est toujours d’essayer de répondre à la question en utilisant la logique et le comptage dans la mesure du possible, sinon, nous devons être extrêmement prudents pour choisir la bonne règle pour le problème.
PRINCIPE:
Si vous pouvez calculer une probabilité en utilisant la logique et le comptage, vous n’avez pas besoin de règle de probabilité (bien que la règle correcte puisse toujours être appliquée)
Notez que, si A et B sont disjoints, alors P(A et B) = 0 et la règle 5 se réduit à la règle 4 pour ce cas particulier.
Revenons sur le dernier exemple:
EXEMPLE: Statut parodontal et sexe
Envisagez de sélectionner au hasard un individu parmi ceux représentés dans le tableau suivant concernant le statut parodontal des individus et leur sexe. L’état parodontal fait référence à une maladie des gencives où les individus sont classés comme étant en bonne santé, atteints de gingivite ou atteints d’une maladie parodontale.
Passons en revue ce que nous avons appris jusqu’à présent. Nous pouvons calculer n’importe quelle probabilité dans ce scénario si nous pouvons déterminer combien d’individus satisfont l’événement ou la combinaison d’événements.
- P (Mâle) = 3009/8027 = 0,3749
- P (Femelle) = 5018/8027 = 0,6251
- P (Sain) = 3750/8027 = 0,4672
- P (Non sain) = P (Gingivite ou Périodicité) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
Nous pourrions également calculer cela en utilisant la règle du complément: 1-P (Sain)
Nous avons également constaté précédemment que
- P (Mâle ET Sain) = 1143/8027 = 0.1424
Règle de rappel 5, P(A ou B) = P(A) + P(B) – P(A et B). Nous utilisons maintenant cette règle pour calculer P (Mâle OU Sain)
- P (Mâle ou Sain) = P (Mâle) + P (Sain) – P (Mâle et Sain) = 0.3749 + 0.4672 – 0.1424 = 0,6997 ou environ 70%
Nous avons résolu cette question plus tôt en comptant simplement le nombre d’individus de sexe masculin ou en bonne santé ou les deux. L’image ci-dessous illustre les valeurs que nous devons combiner. Nous devons compter
- Tous les mâles
- Tous les individus en bonne santé
- MAIS, ne comptez personne deux fois!!
En utilisant cette approche logique, nous trouverions
- P (Mâle ou en bonne santé) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996
Nous avons une différence mineure dans nos réponses à la dernière décimale en raison de l’arrondi qui s’est produit lorsque nous avons calculé P (Mâle), P (Sain) et P (Mâle et Sain), puis appliqué la règle 5.
Clairement, la réponse est effectivement la même, environ 70%. Si nous portions nos réponses à plus de décimales ou si nous utilisions les fractions d’origine, nous pourrions éliminer complètement ce petit écart.
Regardons un dernier exemple pour illustrer la règle de probabilité 5 lorsque la règle est nécessaire – c’est-à-dire lorsque nous n’avons pas de données réelles.
EXEMPLE : Livraison importante!
Il est essentiel qu’un certain document atteigne sa destination en une journée. Pour maximiser les chances de livraison à temps, deux copies du document sont envoyées en utilisant deux services, le service A et le service B. On sait que les probabilités de livraison à temps sont:
- 0,90 pour le service A (P(A) = 0,90)
- 0,80 pour le service B (P(B) = 0,80)
- 0.75 pour les deux services étant à l’heure (P(A et B) = 0,75)
(Notez que A et B ne sont pas disjoints. Ils peuvent se produire avec une probabilité de 0,75.)
Les diagrammes de Venn ci-dessous illustrent les probabilités P(A), P(B) et P(A et B) :
Dans le contexte de ce problème, la question évidente d’intérêt est:
- Quelle est la probabilité de livraison à temps du document en utilisant cette stratégie (de l’envoyer via les deux services)?
Le document arrivera à destination à temps tant qu’il sera livré à temps par le service A ou par le service B ou par les deux services. En d’autres termes, lorsque l’événement A se produit ou que l’événement B se produit ou que les deux se produisent. si….
P (livraison à temps en utilisant cette stratégie) = P(A ou B), qui est représenté par la région ombrée dans le diagramme ci-dessous:
Nous pouvons maintenant
- utiliser les trois diagrammes de Venn représentant P(A), P(B) et P(A et B)
- pour voir que nous pouvons trouver P(A ou B) en ajoutant P(A) (représenté par le cercle de gauche) et P(B) (représenté par le cercle de droite),
- puis en soustrayant P(A et B) (représenté par le chevauchement), puisque nous l’avons inclus deux fois, une fois dans le cadre de P(A) et une fois dans le cadre de P(B).
Ceci est illustré dans l’image suivante:
Si nous appliquons ceci à notre exemple, nous constatons que:
- P(A ou B) =P (livraison à temps en utilisant cette stratégie)= 0.90 + 0.80 – 0.75 = 0.95.
Ainsi, notre stratégie d’utilisation de deux services de livraison augmente notre probabilité de livraison à temps à 0,95.
Alors que les diagrammes de Venn étaient parfaits pour visualiser la Règle d’addition générale, dans de tels cas, il est beaucoup plus facile d’afficher les informations et de travailler avec une table de probabilités bidirectionnelle, tout comme nous avons examiné la relation entre deux variables catégorielles dans la section Analyse exploratoire des données.
Nous allons simplement vous montrer le tableau, pas comment nous le dérivons car il ne vous sera pas demandé de le faire pour nous. Vous devriez pouvoir voir qu’une addition / soustraction simple et logique est tout ce que nous avons utilisé pour remplir le tableau ci-dessous.
Lors de l’utilisation d’une table bidirectionnelle, il faut se rappeler de regarder toute la ligne ou la colonne pour trouver des probabilités globales impliquant uniquement A ou seulement B.
- P(A) = 0,90 signifie que dans 90% des cas où le service A est utilisé, il livre le document à temps. Pour trouver cela, nous examinons la probabilité totale pour la ligne contenant A. En trouvant P (A), nous ne savons pas si B se produit ou non.
- P(B) = 0,80 signifie que dans 80% des cas où le service B est utilisé, il livre le document à temps. Pour trouver cela, nous examinons la probabilité totale pour la colonne contenant B. En trouvant P (B), nous ne savons pas si A se produit ou non.
Commentaire
- Lorsque nous avons utilisé des tableaux bidirectionnels dans la section Analyse exploratoire des données (EDA), il s’agissait d’enregistrer les valeurs de deux variables catégorielles pour un échantillon concret d’individus.
- En revanche, les informations d’une table de probabilité bidirectionnelle concernent une population entière et les valeurs sont plutôt abstraites.
- Si nous avions traité quelque chose comme l’exemple de livraison dans la section EDA, nous aurions enregistré le nombre réel de livraisons à temps (et non à temps) pour des échantillons de documents postés avec le service A ou B.
- Dans cette section, les probabilités à long terme sont présentées comme étant connues.
- Vraisemblablement, les probabilités rapportées dans cet exemple de livraison étaient basées sur des fréquences relatives enregistrées au cours de nombreuses répétitions.
Règle d’arrondi pour la probabilité:
Suivez les directives générales suivantes dans ce cours. En cas de doute, portez plus de décimales. Si nous spécifions donner exactement ce qui est demandé.
- En général, vous devez porter les probabilités à au moins 4 décimales pour les étapes intermédiaires.
- Nous arrondissons souvent notre réponse finale à deux ou trois décimales.
- Pour des probabilités extrêmement faibles, il est important d’avoir 1 ou deux chiffres significatifs (chiffres non nuls), tels que 0,000001 ou 0,000034, etc.
De nombreux paquets informatiques peuvent afficher des valeurs extrêmement petites en utilisant une notation scientifique telle que
- 58×10-5 ou 1,58 E-5 pour représenter 0,0000158
Résumons
Jusqu’à présent, dans notre étude des probabilités, vous avez été initiés à la nature parfois contre-intuitive de la probabilité et aux principes fondamentaux qui sous-tendent la probabilité, tels qu’une fréquence relative.
Nous vous avons également donné quelques outils pour vous aider à trouver les probabilités des événements — à savoir les règles de probabilité.
Vous avez probablement remarqué que la section de probabilité était significativement différente des deux sections précédentes; elle a une composante technique / mathématique beaucoup plus grande, de sorte que les résultats ont tendance à être plus de nature « bonne ou mauvaise”.
Dans la section Analyse exploratoire des données, pour la plupart, l’ordinateur s’occupait de l’aspect technique des choses, et nos tâches étaient de lui dire de faire la bonne chose et ensuite d’interpréter les résultats.
En probabilité, nous faisons le travail du début à la fin, du choix du bon outil (règle) à utiliser, à son utilisation correcte, à l’interprétation des résultats.
Voici un résumé des règles que nous avons présentées jusqu’à présent.
1. La règle de probabilité #1 indique :
- Pour tout événement A, 0 ≤ P(A) ≤ 1
2. La règle de probabilité #2 stipule:
- La somme des probabilités de tous les résultats possibles est 1
3. La Règle du complément (#3) indique que
- P(not A) = 1–P(A)
ou lorsqu’elle est réarrangée
- P(A) =1–P(not A)
Cette dernière représentation de la Règle du complément est particulièrement utile lorsque nous devons trouver des probabilités d’événements du genre « au moins un des …”
4. La Règle générale d’addition (#5) stipule que pour deux événements quelconques,
- P(A ou B) = P(A) + P(B) – P(A et B),
où, par P(A ou B), nous entendons P(A se produit ou B se produit ou les deux).
Dans le cas particulier des événements disjoints, des événements qui ne peuvent pas se produire ensemble, la Règle d’addition Générale peut être réduite à la Règle d’addition pour les Événements Disjoints (#4), qui est
- P(A ou B) = P(A) +P(B). *
* Utilisez UNIQUEMENT lorsque vous êtes CONVAINCU que les événements sont disjoints (ils ne se chevauchent PAS)
5. La version restreinte de la règle d’addition (pour les événements disjoints) peut être facilement étendue à plus de deux événements.
6. Jusqu’à présent, nous n’avons trouvé que P(A et B) en utilisant la logique et le comptage dans des exemples simples