Reglas Básicas de Probabilidad

  • Introducción
  • Reglas de Probabilidad
    • Regla de Probabilidad Uno (Para cualquier evento A, 0 ≤ P(A) ≤ 1)
    • Regla de Probabilidad Dos (La suma de las probabilidades de todos los resultados posibles es 1)
    • Regla de Probabilidad Tres (La Regla del Complemento)
    • li>
    • Regla de Probabilidad Cuatro (Regla de Suma para Eventos Disjuntos)
    • Encontrar P(A y B) usando Lógica
    • Regla de Probabilidad Cinco (La Regla General de Suma)
  • Regla Empírica de redondeo para la Probabilidad
  • Resumamos
CO-6: Aplique los conceptos básicos de probabilidad, variación aleatoria y distribuciones de probabilidad estadísticas comúnmente utilizadas.
LO 6.4: Relacionar la probabilidad de un evento a la probabilidad de que este evento ocurra.
LO 6.5: Aplique el enfoque de frecuencia relativa para estimar la probabilidad de un evento.
LO 6.6: Aplique reglas básicas de lógica y probabilidad para encontrar la probabilidad empírica de un evento.
Video: Reglas básicas de probabilidad (25:17)

En la sección anterior, presentamos la probabilidad como una forma de cuantificar la incertidumbre que surge de la realización de experimentos utilizando una muestra aleatoria de la población de interés.

Vimos que la probabilidad de un evento (por ejemplo, el evento de que una persona elegida al azar tenga el tipo de sangre O) se puede estimar por la frecuencia relativa con la que se produce el evento en una larga serie de ensayos. Por lo tanto, recopilaríamos datos de muchos individuos para estimar la probabilidad de que alguien tenga el tipo de sangre O.

En esta sección, estableceremos los métodos y principios básicos para encontrar probabilidades de eventos.

También cubriremos algunas de las reglas básicas de probabilidad que se pueden usar para calcular probabilidades.

Introducción

Comenzaremos con un ejemplo clásico de probabilidad de lanzar una moneda justa tres veces.

Dado que las caras y las colas son igualmente probables para cada lanzamiento en este escenario, cada una de las posibilidades que pueden resultar de tres lanzamientos también serán igualmente probables para que podamos enumerar todos los valores posibles y usar esta lista para calcular probabilidades.

Dado que nuestro enfoque en este curso es en datos y estadísticas (no en probabilidades teóricas), en la mayoría de nuestros problemas futuros usaremos un conjunto de datos resumido, generalmente una tabla de frecuencias o una tabla bidireccional, para calcular probabilidades.

EJEMPLO: Lanzar una moneda justa tres veces

Enumeremos cada posible resultado (o posible resultado):

{HHH, THH, HTH, HHT, HTT, THT, TTH, TTT}

Ahora definamos los siguientes eventos:

Evento A: «No obtener H»

Evento B: «Obtener exactamente una H»

Evento C: «Obtener al menos una H»

Tenga en cuenta que cada evento es de hecho una declaración sobre el resultado que el experimento va a producir. En la práctica, cada evento corresponde a una colección (subconjunto) de los posibles resultados.

Evento A: «No obtener H» → TTT

Evento B: «Obtener exactamente una H» → HTT, THT, TTH

Evento C:» Obtener al menos una H» → HTT, THT, TTH, THH, HTH, HHT, HHH

Aquí hay una representación visual de los eventos A, B y C.

Tenemos un rectángulo grande etiquetado como" S " que representa la totalidad del espacio de muestra. Dentro de este rectángulo tenemos un círculo etiquetado como " C. "Todo lo que está fuera de" C sucede que coinciado con el evento A contiene solo "TTT". Dentro de C, vemos "HHH", "THH", "HTH", "HHT" y un círculo que representa el evento B. Dentro de B están "HHT", "THT" y " TTH."Tenga en cuenta que todos los elementos dentro de B también están dentro de C, por lo que C encierra completamente a B."S" which represents the entirety of the sample space. Inside this rectangle we have a circle labeled "C." Everything outside of "C happens to coincied with event A containing only "TTT". Inside of C, we see "HHH," "THH," "HTH," "HHT," and a circle representing event B. Inside B are "HHT," "THT," and "TTH." Note that all of the items inside B are also inside C, so C fully encloses B.

De esta representación visual de los eventos, es fácil ver que el evento B está totalmente incluido en el evento C, en el sentido de que cada resultado en el evento B es también un resultado en el evento C. También, tenga en cuenta que el evento A se distingue de los eventos B y C, en el sentido de que no tienen un resultado en común o no se superponen. En este punto, estas son solo observaciones notables, pero como descubrirá más adelante, son muy importantes.

Y si agregamos el nuevo evento:

Evento D: «Obtener una T en el primer lanzamiento» → THH, THT, TTH, TTT

¿Cómo se vería si agregáramos el evento D al diagrama de arriba? (Enlace a la respuesta)

Recuerde, dado que H y T son igualmente probables en cada lanzamiento, y dado que hay 8 resultados posibles, la probabilidad de cada resultado es de 1/8.

Vea si puede responder las siguientes preguntas utilizando los diagramas y / o la lista de resultados para cada evento junto con lo que ha aprendido hasta ahora sobre la probabilidad.

Aprender Haciendo: Lanzar una Moneda Justa Tres Veces

Si fue capaz de responder a esas preguntas correctamente, es probable que tenga un buen instinto para calcular la probabilidad. Siga leyendo para aprender cómo aplicaremos este conocimiento.

Si no, intentaremos ayudarte a desarrollar esta habilidad en esta sección.

Comentario:

  • Tenga en cuenta que en el evento C, «Obtener al menos una cabeza», solo falta un resultado posible, «NO obtener cabezas» = TTT. Abordaremos esto de nuevo cuando hablemos de reglas de probabilidad, en particular la regla del complemento. En este punto, solo queremos que piensen en cómo estos dos eventos son «opuestos» en este escenario.

Es MUY importante darse cuenta de que solo porque podamos enumerar los posibles resultados, esto no implica que cada resultado sea igual de probable.

Este es el mensaje (divertido) en el clip de Daily Show que proporcionamos en la página anterior. Pero pensemos en esto de nuevo. En ese clip, Walter afirma que, dado que hay dos posibles resultados, la probabilidad es de 0,5. Los dos resultados posibles son:

  • El mundo será destruido por el uso del gran colisionador de hadrones
  • El mundo NO será destruido por el uso del gran colisionador de hadrones

Espero que está claro que estos dos resultados no son igualmente probables!!

Consideremos un ejemplo más común.

EJEMPLO: Defectos de nacimiento

Supongamos que seleccionamos al azar a tres niños y estamos interesados en la probabilidad de que ninguno de los niños tenga defectos de nacimiento.

Utilizamos la notación D para representar a un niño nacido con un defecto de nacimiento y N para representar al niño nacido sin defecto de nacimiento. Podemos enumerar los posibles resultados tal como lo hicimos para el lanzamiento de la moneda, son:

{DDD, NDD, DND, DDN, DNN, NDN, NND, NNN}

¿Son los eventos DDD (los tres niños nacen con defectos de nacimiento) y NNN (ninguno de los niños nace con defectos de nacimiento) igualmente probables?

Debería ser razonable para usted que P(NNN) es mucho más grande que P(DDD).

Esto se debe a que P (N) y P(D) no son eventos igualmente probables.

Es raro (ciertamente no el 50%) que un niño seleccionado al azar nazca con un defecto de nacimiento.

Reglas de Probabilidad

Ahora vamos a aprender algunas de las reglas básicas de la probabilidad.

Afortunadamente, estas reglas son muy intuitivas, y mientras se apliquen sistemáticamente, nos permitirán resolver problemas más complicados; en particular, aquellos problemas para los que nuestra intuición pueda ser inadecuada.

Dado que la mayoría de las probabilidades que se le pedirá que encuentre se pueden calcular utilizando la lógica

  • y contando

y

  • las reglas que aprenderemos,

damos los siguientes consejos como principio.

PRINCIPIO:

Si puedes calcular una probabilidad usando lógica y contando, no necesitas una regla de probabilidad (aunque siempre se puede aplicar la regla correcta)

Regla de probabilidad Uno

Nuestra primera regla simplemente nos recuerda la propiedad básica de la probabilidad que ya hemos aprendido.

La probabilidad de un evento, que nos informa de la probabilidad de que ocurra, puede variar entre 0 (lo que indica que el evento nunca ocurrirá) y 1 (lo que indica que el evento es cierto).

Regla de probabilidad Uno:

  • Para cualquier evento A, 0 ≤ P(A) ≤ 1.

NOTA: Un uso práctico de esta regla es que se puede usar para identificar cualquier cálculo de probabilidad que resulte ser más de 1 (o menos de 0) como incorrecto.

Antes de pasar a las otras reglas, veamos primero un ejemplo que proporcionará un contexto para ilustrar las siguientes reglas.

EJEMPLO: Tipos sanguíneos

Como se mencionó anteriormente, toda la sangre humana se puede escribir como O, A, B o AB.

Además, la frecuencia de aparición de estos tipos de sangre varía según los grupos étnicos y raciales.

Según el Centro de Sangre de la Universidad de Stanford (bloodcenter.Stanford.edu), estas son las probabilidades de los tipos de sangre humana en los Estados Unidos (la probabilidad para el tipo A se ha omitido a propósito):

Pregunta motivadora para la regla 2: Una persona en los Estados Unidos se elige al azar. ¿Cuál es la probabilidad de que la persona tenga el grupo sanguíneo A?

Respuesta: Nuestra intuición nos dice que dado que los cuatro tipos de sangre O, A, B y AB agotan todas las posibilidades, sus probabilidades juntas deben sumar 1, que es la probabilidad de un evento «cierto» (una persona tiene uno de estos 4 tipos de sangre con certeza).

Ya que las probabilidades de O, B y AB juntas suman a 0.44 + 0.1 + 0.04 = 0,58, la probabilidad de tipo A debe ser la restante 0.42 (1 – 0.58 = 0.42):

Datos dados en el formato "Grupo sanguíneo: Probabilidad": O: 0,44; A: 0,42; B: 0,10; AB: 0,04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Regla de probabilidad Dos

Este ejemplo ilustra nuestra segunda regla, que nos dice que la probabilidad de todos los resultados posibles juntos debe ser 1.

Regla de probabilidad Dos:

La suma de las probabilidades de todos los resultados posibles es 1.

Este es un buen lugar para comparar y contrastar lo que estamos haciendo aquí con lo que aprendimos en la sección Análisis Exploratorio de Datos (EDA).

  • Observe que en este problema nos estamos centrando esencialmente en una sola variable categórica: el tipo de sangre.
  • Resumimos esta variable anteriormente, como resumimos variables categóricas individuales en la sección EDA, enumerando qué valores toma la variable y con qué frecuencia los toma.
  • En EDA usamos porcentajes, y aquí estamos usando probabilidades, pero los dos transmiten la misma información.
  • En la sección EDA, aprendimos que un gráfico circular proporciona una visualización adecuada cuando se trata de una sola variable categórica, y de manera similar podemos usarlo aquí (utilizando porcentajes en lugar de probabilidades):

Un gráfico circular, titulado "Tipos de Sangre."El tipo O ocupa el 44% del gráfico circular, A utiliza el 42%, AB representa el 4% y B representa el resto, el 10%. Tenga en cuenta que los tipos de sangre que no son "O" ocupan el 56% del gráfico circular."Blood Types." Type O takes up 44% of the pie chart, A uses 42%, AB represents 4%, and B represents the rest, 10%. Note that the types of blood which are "not O" take up 56% of the pie chart.

Aunque lo que estamos haciendo aquí es de hecho similar a lo que hemos hecho en la sección de EDA, hay una diferencia sutil pero importante entre las situaciones subyacentes

  • En EDA, resumimos los datos que se obtuvieron de una muestra de individuos para los que se registraron valores de la variable de interés.
  • Aquí, cuando presentamos la probabilidad de cada tipo de sangre, tenemos en mente toda la población de personas en los Estados Unidos, para lo cual suponemos conocer la frecuencia general de los valores tomados por la variable de interés.
¿puedo Obtener de Esto?: Regla de Probabilidad Dos

Regla de Probabilidad Tres

En probabilidad y en sus aplicaciones, con frecuencia estamos interesados en averiguar la probabilidad de que un determinado evento no ocurra.

Un punto importante a entender aquí es que » el evento A no ocurre «es un evento separado que consiste en todos los resultados posibles que no están en A y se llama»el evento de complemento de A». Notación

: escribiremos» no A » para denotar el evento que A no ocurre. Aquí hay una representación visual de cómo el evento A y su evento complementario «no A» representan juntos todos los resultados posibles.

Todo el espacio de muestra S se representa con un cuadro gris. Dentro de esta caja hay un círculo azul, que representa todos los resultados en A. Todo lo demás en la caja gris pero fuera del círculo azul es "no A"."not A".

Comentario:

  • Esta visualización se denomina «diagrama de Venn».»Un diagrama de Venn es una forma sencilla de visualizar eventos y las relaciones entre ellos mediante rectángulos y círculos.

La regla 3 trata de la relación entre la probabilidad de un evento y la probabilidad de su evento complementario.

Dado que el evento A y el evento «no A» juntos conforman todos los resultados posibles, y dado que la regla 2 nos dice que la suma de las probabilidades de todos los resultados posibles es 1, la siguiente regla debería ser bastante intuitiva:

Regla de Probabilidad Tres (La Regla del Complemento):

  • P(no A) = 1 – P(A)
  • es decir, la probabilidad de que un evento no ocurre es 1 menos la probabilidad de que ocurra.

EJEMPLO: Tipos sanguíneos

Volver al ejemplo de tipo sanguíneo:

Aquí hay información adicional:

  • Una persona con tipo A puede donar sangre a una persona con tipo A o AB.
  • Una persona con tipo B puede donar sangre a una persona con tipo B o AB.
  • Una persona con tipo AB puede donar sangre solo a una persona con tipo AB.
  • Una persona con sangre tipo O puede donar a cualquier persona.

¿Cuál es la probabilidad de que una persona elegida al azar no pueda donar sangre a todos? En otras palabras, ¿cuál es la probabilidad de que una persona elegida al azar no tenga el grupo sanguíneo O? Necesitamos encontrar P (no O). Usando la Regla del Complemento, P (no O) = 1 – P(O) = 1 – 0.44 = 0.56. En otras palabras, el 56% de la población estadounidense no tiene el tipo sanguíneo O:

Claramente, también podríamos encontrar P (no O) directamente agregando las probabilidades de B, AB y A.

Comentario:

  • Tenga en cuenta que la Regla del Complemento, P(no A) = 1 – P(A) se puede reformular como P(A) = 1-P(no A).
    • P(no A) = 1 – P(a)
    • puede ser re-formulado como P(a) = 1 – P(no A).
    • Esta manipulación algebraica aparentemente trivial tiene una aplicación importante, y en realidad captura la fuerza de la regla del complemento.
    • En algunos casos, cuando encontrar P (A) directamente es muy complicado, podría ser mucho más fácil encontrar P(no A) y luego restarlo de 1 para obtener la P (A) deseada.
    • Volveremos a este comentario pronto y proporcionaremos ejemplos adicionales.
¿puedo Obtener de Esto?: Regla de Probabilidad Tres
  • La regla del complemento puede ser útil siempre que sea más fácil calcular la probabilidad del complemento del evento en lugar del evento en sí.
  • Aviso, nuevamente utilizamos la frase «al menos uno.»
  • Ahora hemos visto que el complemento de «al menos uno …» es «ninguno» o «no ….»(como mencionamos anteriormente en términos de que los eventos son»opuestos»).
  • En la actividad anterior vemos que
    • P (NINGUNO de estos dos efectos secundarios) = 1 – P(al menos uno de estos dos efectos secundarios)
  • Esta es una aplicación común de la regla del complemento que a menudo se puede reconocer por la frase «al menos uno» en el problema.

Probabilidades que Involucran Múltiples Eventos

A menudo estaremos interesados en encontrar probabilidades que involucren múltiples eventos, como

  • P(A o B) = P(ocurre el evento A o el evento B o ambos ocurren)
  • P(A y B)= P(ocurre tanto el evento A como el evento B)

Un problema común con la terminología se relaciona con cómo generalmente pensamos en «o» en nuestra vida diaria. Por ejemplo, cuando un padre le dice a su hijo en una juguetería: «¿Quieres el juguete A o el juguete B?», esto significa que el niño solo va a tener un juguete y tiene que elegir entre ellos. Conseguir ambos juguetes no suele ser una opción.

En contraste:

En probabilidad,» O » significa uno o el otro o ambos.

y así P(A o B) = P(ocurre el evento A o ocurre el evento B o AMBOS ocurren)

Dicho esto, debe tenerse en cuenta que hay algunos casos en los que es simplemente imposible que los dos eventos ocurran al mismo tiempo.

Regla de probabilidad Cuatro

La distinción entre los eventos que pueden ocurrir juntos y los que no pueden ocurrir es importante.

Separe: Dos eventos que no pueden ocurrir al mismo tiempo se denominan disjuntos o mutuamente excluyentes. (Usaremos disjuntos.)

Un diagrama de Venn titulado "a y B son Disjuntos."Todo el espacio de muestra se representa como un rectángulo. Dentro del rectángulo hay dos círculos separados. Un círculo representa los eventos en A y el otro representa los eventos en B."A and B are Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two separate circles. One circle represents the events in A and the other represents the events in B.Un diagrama de Venn titulado " A y B NO están Disjuntos."Todo el espacio de muestra se representa como un rectángulo. Dentro del rectángulo hay dos círculos. Un círculo representa las ocurrencias en A y el otro representa las ocurrencias en B. Estos dos no son disjuntos, por lo que los dos círculos se superponen parcialmente entre sí. (Al NO estar disjuntos, dos círculos podrían superponerse por completo, pero en este ejemplo no lo hacen.)"A and B are NOT Disjoint." The entire sample space is represented as a rectangle. Inside the rectangle are two circles. One circle represents the occurrences in A and the other represents the occurrences in B. These two are not disjoint, so the two circles partially overlap each other. (Being NOT disjoint, two circles could overlap each other completely, but in this example they do not.)

debe estar claro de que la imagen que

  • en el primer caso, donde los acontecimientos NO son disjuntas, P(a y B) ≠ 0
  • en el segundo caso, donde los eventos SON disjuntos, P(a y B) = 0.

Aquí hay dos ejemplos:

EJEMPLO:

Considere los siguientes dos eventos:

A — una persona elegida al azar tiene el tipo de sangre A, y

B — una persona elegida al azar tiene el tipo de sangre B.

En casos raros, es posible que una persona tenga más de un tipo de sangre que fluye a través de sus venas, pero para nuestros propósitos, vamos a suponer que cada persona solo puede tener un tipo de sangre. Por lo tanto, es imposible que los eventos A y B ocurran juntos.

  • los Sucesos a y B son DISJUNTOS

En el otro lado …

EJEMPLO:

Considere los dos eventos siguientes:

A — una persona elegida al azar tiene un grupo sanguíneo A

B — una persona elegida al azar es una mujer.

En este caso, es posible que los eventos A y B ocurran juntos.

  • Los eventos A y B NO son DISJUNTOS.

Los diagramas de Venn sugieren que otra forma de pensar en eventos disjuntos versus no disjuntos es que los eventos disjuntos no se solapan. No comparten ninguno de los posibles resultados y, por lo tanto, no pueden ocurrir juntos.

Por otro lado, los eventos que no son disjuntos se superponen en el sentido de que comparten algunos de los posibles resultados y, por lo tanto, pueden ocurrir al mismo tiempo.

Ahora comenzamos con una regla simple para encontrar P (A o B) para eventos disjuntos.

Regla de Probabilidad Cuatro (La Regla de Suma para Eventos Disjuntos):

  • Si A y B son eventos disjuntos, entonces P(A o B) = P(A) + P(B).

Comentario:

  • Cuando se trata de probabilidades, la palabra «o» siempre estará asociada con la operación de suma; de ahí el nombre de esta regla, «La Regla de la Suma.»

EJEMPLO: Tipos sanguíneos

Recordar el tipo sanguíneo ejemplo:

Datos dados en formato "Tipo sanguíneo: Probabilidad": O: 0.44; A: 0.42; B: 0.10; AB: 0.04;"Blood Type: Probability" Format: O: 0.44; A: 0.42; B: 0.10; AB: 0.04;

Aquí hay información adicional

  • Una persona con el tipo Acan dona sangre a una persona con el tipo A o AB.
  • Una persona con tipo B puede donar sangre a una persona con tipo B o AB.
  • Una persona con tipo AB puede donar sangre a una persona con tipo AB
  • Una persona con tipo Oblood puede donar a cualquier persona.

¿Cuál es la probabilidad de que una persona elegida al azar sea un donante potencial para una persona con grupo sanguíneo A?

De la información proporcionada, sabemos que ser un donante potencial para una persona con grupo sanguíneo A significa tener grupo sanguíneo A u O.

Por lo tanto, necesitamos encontrar P(A u O). Dado que los eventos A y O son disjuntos, podemos usar la regla de suma para eventos disjuntos para obtener:

  • P(A u O) = P(A) + P(O) = 0.42 + 0.44 = 0.86.

Es fácil ver por qué agregar la probabilidad realmente tiene sentido.

Si el 42% de la población tiene el tipo de sangre A y el 44% de la población tiene el tipo de sangre O,

  • entonces el 42% + 44% = 86% de la población tiene el tipo de sangre A u O, y por lo tanto son donantes potenciales a una persona con el tipo de sangre A.

Este razonamiento sobre por qué la regla de adición tiene sentido se puede visualizar utilizando el siguiente gráfico circular:

Un gráfico circular titulado "Tipos de sangre."El tipo A ocupa el 42% del gráfico circular, y el tipo O ocupa el 44%. Juntos, como A u O, ocupan el 86% del gráfico circular."Blood Types." Type A takes up 42% of the pie chart, and type O takes up 44%. Together, as A or O, they take up 86% of the pie chart.

Aprenda haciendo: Regla de Probabilidad Cuatro

Comentario:

  • La Regla de Suma para Eventos disjuntos se puede extender naturalmente a más de dos eventos disjuntos. Tomemos tres, por ejemplo. Si A, B y C son tres eventos disjuntos
Un diagrama de Venn que muestra 3 eventos disjuntos. Como de costumbre, hay una caja gris que muestra todo el espacio de muestra. Dentro de esta caja gris hay tres círculos completamente separados. El primer círculo es para las apariciones de Una, la segunda de las apariciones en B, y el tercero para las apariciones en C.

entonces P(a o B o C) = P(a) + P(B) + P(C). La regla es la misma para cualquier número de eventos disjuntos.

¿Recibí Esto?: Regla de Probabilidad Cuatro

Hemos terminado con la primera versión de la Regla de Suma (Regla cuatro), que es la versión restringida a eventos disjuntos. Antes de cubrir la segunda versión, primero debemos discutir P (A y B).

Encontrar P(A y B) usando la lógica

Ahora pasamos a calcular

  • P(A y B)= P(ocurre tanto el evento A como el evento B)

Más adelante, discutiremos las reglas para calcular P(A y B).

En primer lugar, queremos ilustrar que no se necesita una regla siempre que pueda determinar la respuesta a través de la lógica y el conteo.

Caso especial:

Hay un caso especial para el que sabemos lo que es igual a P(A y B) sin aplicar ninguna regla.

Aprender Haciendo: Encontrar P(A y B) #1

Entonces, si los eventos A y B son disjuntos, entonces(por definición) P (A y B)= 0. Pero, ¿y si los eventos no son disjuntos?

Recuerde que la regla 4, la Regla de Adición, tiene dos versiones. Uno está restringido a eventos disjuntos, que ya hemos cubierto, y trataremos la versión más general más adelante en este módulo. Lo mismo será cierto para las probabilidades que involucran Y

Sin embargo, excepto en casos especiales, dependeremos de la LÓGICA para encontrar P(A y B) en este curso.

Antes de cubrir cualquier regla formal, veamos un ejemplo en el que los eventos no están disjuntos.

EJEMPLO: Estado periodontal y Género

Considere la siguiente tabla con respecto al estado periodontal de los individuos y su género. El estado periodontal se refiere a la enfermedad de las encías donde los individuos se clasifican como sanos, tienen gingivitis o tienen enfermedad periodontal.

Hemos visto este tipo de tabla antes cuando discutimos el análisis de datos en el caso C → C. Para el propósito de esta pregunta, utilizaremos estos datos como nuestra «población» y consideraremos la selección aleatoria de una persona.

Aprenda haciendo: Estado periodontal y Género

Nos gusta hacer preguntas de probabilidad similares al ejemplo anterior (utilizando una tabla bidireccional basada en datos) ya que esto le permite establezca conexiones entre estos temas y lo ayude a mantener algo de lo que ha aprendido sobre los datos fresco en su mente.

Recuerde, nuestro objetivo principal en este curso es analizar datos de la vida real.

Regla de probabilidad Cinco

Ahora estamos listos para pasar a la versión extendida de la Regla de Suma.

En esta sección, aprenderemos a encontrar P(A o B) cuando A y B no son necesariamente disjuntos.

  • Llamaremos a esta versión extendida la «Regla General de Suma» y la declararemos como Regla de Probabilidad Cinco.

Comenzaremos indicando la regla y proporcionando un ejemplo similar a los tipos de problemas que generalmente pedimos en este curso. Luego presentaremos un ejemplo más en el que no tenemos los datos sin procesar de una muestra para trabajar.

Regla de probabilidad Cinco:

  • La Regla General de Suma: P(A o B) = P(A) + P(B) – P(A y B).

NOTA: Es mejor usar la lógica para encontrar P (A y B), no otra fórmula.

Un error MUY común es aplicar incorrectamente la regla de multiplicación para eventos independientes cubiertos en la página siguiente. Esto solo será correcto si A y B son independientes (véanse las definiciones a continuación), lo que rara vez ocurre en los datos presentados en tablas bidireccionales.

Como vimos en ejemplos anteriores, cuando los dos eventos no están disjuntos, hay cierta superposición entre los eventos.

  • Si simplemente sumamos las dos probabilidades, obtendremos la respuesta incorrecta porque hemos contado algunas «probabilidades» dos veces.
  • Por lo tanto, debemos restar esta probabilidad «extra» para llegar a la respuesta correcta. El diagrama de Venn y las tablas bidireccionales son útiles para visualizar esta idea.

Un diagrama de venn titulado "a y B NO son Disjuntos."Una caja gris representa el espacio de la muestra, y en el interior hay dos círculos azules que tienen un área superpuesta. Un círculo está etiquetado como A y el otro como B. El área donde los dos círculos se superponen representa que los Eventos A y B pueden ocurrir al mismo tiempo, por lo que P(A y B) ≠ 0."A and B are NOT Disjoint." A gray box represents the sample space, and inside are two blue circles which have an overlapping area. One circle is labeled A and the other is labeled B. The area where the two circles overlap represents that Events A and B can occur at the same time, so P(A and B) ≠ 0.

Esta regla es más general, ya que funciona para cualquier par de eventos (incluso eventos disjuntos). Nuestro consejo sigue siendo tratar de responder a la pregunta utilizando la lógica y contando siempre que sea posible, de lo contrario, debemos ser extremadamente cuidadosos para elegir la regla correcta para el problema.

PRINCIPIO:

Si puede calcular una probabilidad usando lógica y contando, no NECESITA una regla de probabilidad (aunque siempre se puede aplicar la regla correcta)

Observe que, si A y B son disjuntos, entonces P(A y B) = 0 y la regla 5 se reduce a la regla 4 para este caso especial.

Un Diagrama de Venn titulado "a y B son Disjuntos. Todo el espacio de muestra S se representa como un rectángulo gris. En el interior hay dos círculos azules separados que no se superponen. Un círculo es para las ocurrencias en A y el otro para las ocurrencias en B."A and B are Disjoint. The entire sample space S is represented as a gray rectangle. Inside are two, separate, non-overlapping blue circles. One circle is for the occurrences in A and the other for occurrences in B.

Revisemos el último ejemplo:

EJEMPLO: Estado periodontal y Género

Considere seleccionar aleatoriamente un individuo de los representados en la siguiente tabla con respecto al estado periodontal de los individuos y su género. El estado periodontal se refiere a la enfermedad de las encías donde los individuos se clasifican como sanos, tienen gingivitis o tienen enfermedad periodontal.

Vamos a repasar lo que hemos aprendido hasta ahora. Podemos calcular cualquier probabilidad en este escenario si podemos determinar cuántos individuos satisfacen el evento o la combinación de eventos.

  • P(Hombre) = 3009/8027 = 0.3749
  • P(Mujer) = 5018/8027 = 0.6251
  • P(Sano) = 3750/8027 = 0.4672
  • P(No Saludable) = P(Gingivitis o Perio) = (2419 + 1858)/8027 = 4277/8027 = 0.5328
    también Podemos calcular utilizando el complemento de la regla: 1 – P(Sano)

también Hemos encontrado previamente que

  • P(Masculino Y Saludable) = 1143/8027 = 0.1424

Recordar la regla 5, P(a o B) = P(a) + P(B) – P(a y B). Ahora usamos esta regla para calcular P (Hombre O Sano)

  • P(Hombre o Sano) = P (Hombre) + P (Sano – – P (Hombre y Sano) = 0.3749 + 0.4672 – 0.1424 = 0.6997 o aproximadamente 70%

Resolvimos esta pregunta anteriormente simplemente contando cuántos individuos son Hombres o sanos o ambos. La siguiente imagen ilustra los valores que necesitamos combinar. Necesitamos contar

  • Todos los hombres
  • Todos los individuos sanos
  • PERO, no contar a nadie dos veces!!

Usando este enfoque lógico, encontraríamos

  • P (Masculino o saludable) = (1143 + 929 + 937 + 2607)/8027 = 5616/8027 = 0.6996

Tenemos una diferencia menor en nuestras respuestas en el último decimal debido al redondeo que se produjo cuando calculamos P(Masculino), P(Saludable) y P(Masculino y Saludable) y luego aplicamos la regla 5.

Claramente la respuesta es efectivamente la misma, alrededor del 70%. Si lleváramos nuestras respuestas a más decimales o si usáramos las fracciones originales, podríamos eliminar por completo esta pequeña discrepancia.

Veamos un último ejemplo para ilustrar la Regla de Probabilidad 5 cuando se necesita la regla, es decir, cuando no tenemos datos reales.

EJEMPLO: Entrega importante!

Es vital que un determinado documento llegue a su destino en el plazo de un día. Para maximizar las posibilidades de entrega a tiempo, se envían dos copias del documento utilizando dos servicios, servicio A y servicio B. Se sabe que las probabilidades de entrega a tiempo son:

  • 0.90 para el servicio A (P(A) = 0.90)
  • 0.80 para el servicio B (P(B) = 0.80)
  • 0.75 para que ambos servicios estén a tiempo(P (A y B) = 0.75)
    (Tenga en cuenta que A y B no son disjuntos. Pueden ocurrir juntos con una probabilidad de 0,75.)

Los diagramas Venn de abajo ilustran las probabilidades P( A), P(B) y P(A y B):

Tres diagramas Venn. En todos ellos hay un rectángulo grande que representa todo el espacio de muestra S. Dentro de este rectángulo hay dos círculos que se superponen parcialmente. Un círculo está etiquetado como A y el otro como B. En el primer diagrama de Venn, el círculo para A es de color azul, y vemos que P(A) = 0.90 . En cierto sentido, P (A) es el área del círculo A. En el segundo Diagrama de Venn el círculo para B es de color azul, y está marcado que P (B) = 0.80 . Al igual que en el primer diagrama de Venn, se puede pensar que el círculo de B tiene un área de 0,80 . En el tercer Diagrama de Venn, el área que es la superposición de los círculos A y B es de color azul. P (A y B) = 0,75 . Se puede pensar que el área de la superposición tiene un área de 0,75 .

En el contexto de este problema, la cuestión obvia de interés es:

  • ¿Cuál es la probabilidad de entrega a tiempo del documento utilizando esta estrategia (de enviarlo a través de ambos servicios)?

El documento llegará a su destino a tiempo siempre que se entregue a tiempo por el servicio A o por el servicio B o por ambos servicios. En otras palabras, cuando ocurre el evento A o el evento B o ambos ocurren. tan….

P (entrega a tiempo utilizando esta estrategia)= P(A o B), que se representa por la región sombreada en el diagrama siguiente:

El mismo Diagrama de Venn, excepto el área de los dos círculos, se ha coloreado en azul (sombreado). Esto significa que el área en la superposición también es de color azul. Tenga en cuenta que el área de superposición solo se ha coloreado una vez, por lo que, aunque esté en ambos círculos, lo contaremos una vez.

Ahora podemos

  • usar los tres diagramas de Venn que representan P(A), P(B) y P(A y B)
  • para ver que podemos encontrar P(A o B) agregando P(A) (representado por el círculo izquierdo) y P(B) (representado por el círculo derecho),
  • luego restando P(A y B) (representado por la superposición), ya que lo incluimos dos veces, una de P(A) y una vez como parte de P(B).

Esto se muestra en la siguiente imagen:

El área de ambos círculos en el diagrama de Venn (contando el área de superposición una vez) se calcula como: el área del círculo de A (que incluye la superposición) + el área del círculo de B (que también incluye la superposición) - el área de la superposición. Por lo tanto, obtener: P(a o B) = P(a) + P(B) - P(a y B).'s circle (which includes the overlap) + the area of B's circle (which also includes the overlap) - the area of the overlap. We therefore get: P(A or B) = P(A) + P(B) - P(A and B).

Si aplicamos esto a nuestro ejemplo, encontramos que:

  • P (A o B) = P (entrega a tiempo utilizando esta estrategia)= 0.90 + 0.80 – 0.75 = 0.95.

Por lo tanto, nuestra estrategia de usar dos servicios de entrega aumenta nuestra probabilidad de entrega a tiempo a 0,95.

Mientras que los diagramas de Venn fueron excelentes para visualizar la Regla General de Adición, en casos como estos es mucho más fácil mostrar la información y trabajar con una tabla de probabilidades bidireccional, al igual que examinamos la relación entre dos variables categóricas en la sección de Análisis de Datos Exploratorios.

Simplemente le mostraremos la tabla, no cómo la derivamos, ya que no se le pedirá que haga esto por nosotros. Debería ser capaz de ver que un poco de lógica y suma/resta simple es todo lo que usamos para completar la tabla a continuación.

La tabla tiene las columnas "B", "no B" y "Total"."Las filas son "A", "no A" y "Total"."Aquí hay información sobre la tabla, organizada por celda: En la celda A,B, el valor allí (0.75) es P(A y B) = P(entrega a tiempo por ambos servicios). En la celda A, no B, el valor allí (0.15) es P(A y No B) = P(entrega a tiempo SOLO por servicio A). En la celda No A y B, el valor (0.05) es P(no A y B) = P(entrega a tiempo SOLO por servicio B). En la celda No A y No B, el valor (0.05) es P(no A y no B) = P(Ni servicio A ni B entregado a tiempo)."B," "not B," and "Total." The rows are "A," "not A," and "Total." Here are is some information about the table, organized by cell: At the cell A,B, the value there (0.75) is P(A and B) = P(on-time delivery by both services). At the cell A,not B, the value there (0.15) is P(A and Not B) = P(on-time delivery ONLY by service A). At cell Not A and B, the value (0.05) is P(not A and B) = P(on-time delivery ONLY by service B). At cell Not A and Not B, the value (0.05) is P(not A and not B) = P(Neither service A nor B delivered on time).

Cuando se utiliza una tabla bidireccional, debemos recordar mirar toda la fila o columna para encontrar probabilidades generales que involucren solo A o solo B.

  • P(A) = 0.90 significa que en el 90% de los casos en que se utiliza el servicio A, entrega el documento a tiempo. Para encontrar esto nos fijamos en la probabilidad total de la fila que contiene A. En la búsqueda de P(A), no sabemos si B sucede o no.

La primera fila de la tabla ha sido resaltada. Aquí están los datos resaltados en formato de fila y columna: A, B: P(A y B) = 0,75; A, no B: P(A y no B) = 0,15; A, Total: P(A) = 0,90 = P(A y B) + P(A y no B)'s first row has been highlighted. Here is the highlighted data in "Row, Column" format: A, B: P(A and B) = 0.75; A, not B: P(A and not B) = 0.15; A, Total: P(A) = 0.90 = P(A and B) + P(A and not B)

  • P (B) = 0,80 significa que en el 80% de los casos en que se utiliza el servicio B, entrega el documento a tiempo. Para encontrar esto nos fijamos en la probabilidad total de la columna que contiene B. En la búsqueda de P(B), no sabemos si A sucede o no.

La primera columna de la tabla ha sido resaltada. Aquí están los datos resaltados en formato de fila y columna: A, B: P(A y B) = 0.75; no A, B: P(no A y B) = 0.05; B, Total: P(B) = 0,80 = P(A y B) + P(no A y B)'s first column has been highlighted. Here is the highlighted data in "Row, Column" format: A,B: P(A and B) = 0.75; not A, B: P(not A and B) = 0.05; B,Total: P(B) = 0.80 = P(A and B) + P(not A and B)

Comentario

  • Cuando utilizamos tablas bidireccionales en la sección Análisis Exploratorio de Datos (EDA), fue para registrar los valores de dos variables categóricas para una muestra concreta de individuos.
  • Por el contrario, la información en una tabla de probabilidad bidireccional es para toda una población, y los valores son bastante abstractos.
  • Si hubiéramos tratado algo como el ejemplo de entrega en la sección EDA, habríamos registrado el número real de entregas a tiempo (y no a tiempo) para muestras de documentos enviados por correo con el servicio A o B.
  • En esta sección, las probabilidades a largo plazo se presentan como conocidas.
  • Presumiblemente, las probabilidades reportadas en este ejemplo de entrega se basaron en frecuencias relativas registradas en muchas repeticiones.

Applet interactivo: Diagrama de Probabilidad Venn

Regla Empírica de Redondeo para la Probabilidad:

Siga las siguientes pautas generales en este curso. En caso de duda, lleve más decimales. Si especificamos dar exactamente lo que se solicita.

  • En general, debe llevar las probabilidades a al menos 4 decimales para los pasos intermedios.
  • A menudo redondeamos nuestra respuesta final a dos o tres decimales.
  • Para probabilidades extremadamente pequeñas, es importante tener 1 o dos dígitos significativos (dígitos distintos de cero), como 0.000001 o 0.000034, etc.

Muchos paquetes de computadoras pueden mostrar valores extremadamente pequeños utilizando notación científica, como

  • 58×10-5 o 1.58 E-5 para representar 0.0000158

Resumamos

Hasta ahora en nuestro estudio de probabilidad, se le ha presentado la naturaleza a veces contra-intuitiva de la probabilidad y los fundamentos que subyacen a la probabilidad, como una frecuencia relativa.

También le dimos algunas herramientas para ayudarlo a encontrar las probabilidades de los eventos, a saber, las reglas de probabilidad.

Probablemente haya notado que la sección de probabilidad era significativamente diferente de las dos secciones anteriores; tiene un componente técnico/matemático mucho más grande, por lo que los resultados tienden a ser más de la naturaleza «correcta o incorrecta».

En la sección de Análisis de Datos Exploratorios, en su mayor parte, la computadora se encargó del aspecto técnico de las cosas, y nuestras tareas eran decirle que hiciera lo correcto y luego interpretar los resultados.

En probabilidad, hacemos el trabajo de principio a fin, desde elegir la herramienta correcta (regla) a usar, a usarla correctamente, a interpretar los resultados.

Aquí hay un resumen de las reglas que hemos presentado hasta ahora.

1. La Regla de probabilidad # 1 establece:

  • Para cualquier evento A, 0 ≤ P (A) ≤ 1

2. La Regla de probabilidad # 2 establece:

  • La suma de las probabilidades de todos los resultados posibles es 1

3. El Complemento de la Regla (#3) afirma que

  • P(no A) = 1 – P(a)

o cuando se reorganizan

  • P(a) = 1 – P(no A)

El último representación del Complemento de la Regla es especialmente útil cuando se necesita para encontrar las probabilidades de los eventos de la clase «al menos uno de los …»

4. La Regla General de Adición (#5) establece que para dos eventos cualesquiera,

  • P(A o B) = P(A) + P(B) – P(A y B),

donde, por P(A o B) queremos decir P (A ocurre o B ocurre o ambos).

En el caso especial de eventos disjuntos, eventos que no pueden ocurrir juntos, la Regla de Suma General se puede reducir a la Regla de Suma para Eventos disjuntos (#4), que es

  • P(A o B) = P(A) + P(B). *

* ÚSELO SOLO cuando esté CONVENCIDO de que los eventos están disjuntos (NO se superponen)

5. La versión restringida de la regla de adición (para eventos disjuntos) se puede extender fácilmente a más de dos eventos.

6. Hasta ahora, solo hemos encontrado P(A y B) usando lógica y contando en ejemplos simples

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *