Probabilidad
"La probabilidad no te dice qué va a pasar. Te dice qué tan seguido pasará si lo repetís muchas veces."
Qué vas a aprender en este capítulo
La probabilidad es el lenguaje matemático de la incertidumbre. Sin ella, la inferencia estadística no existe — porque inferir implica hacer afirmaciones inciertas sobre la realidad. Este capítulo establece las reglas básicas de la probabilidad que necesitás para entender distribuciones, intervalos de confianza y pruebas de hipótesis.
1.1 ¿Qué es la probabilidad?
💡 Intuición
Tirás una moneda. ¿Qué probabilidad hay de sacar cara?
Si la moneda es justa, la respuesta es . ¿Por qué? Porque hay 2 resultados posibles igualmente probables, y solo 1 es "cara".
Esta es la definición clásica (o frecuentista): la probabilidad es la fracción de veces que ocurre un evento si repetís el experimento infinitas veces en condiciones idénticas.
En la práctica:
- Tirás 1000 veces la moneda: salen 507 caras. (muy cerca de 0.5).
- Si el experimento no se puede repetir (¿qué probabilidad hay de que llueva mañana?), usamos interpretaciones distintas.
La probabilidad siempre está entre 0 y 1:
- : imposible
- : certeza
- : igual de probable que improbable
📐 Fundamento
Espacio muestral (): Conjunto de todos los resultados posibles de un experimento.
Evento (): Subconjunto del espacio muestral.
Definición clásica de probabilidad:
(Asume que todos los resultados son igualmente probables.)
Axiomas de Kolmogorov:
- para cualquier evento
- — algo siempre pasa
- Si y son mutuamente excluyentes ():
Complemento:
"La probabilidad de que NO ocurra A es 1 menos la probabilidad de que ocurra."
Definición frecuentista:
🛠️ En la práctica
Ejemplo — dado equilibrado:
. Evento = "sacar número par" = .
Complemento: .
Ejemplo — empleados en empresa:
Una empresa tiene 80 empleados: 30 de contabilidad, 25 de ventas, 25 de sistemas. Se elige uno al azar.
1.2 Reglas de probabilidad
💡 Intuición
Hay dos operaciones básicas con eventos: unión (A o B) y intersección (A y B).
- "Tirás un dado. ¿Cuánta probabilidad de sacar 2 o 5?" → unión de eventos mutuamente excluyentes.
- "Tirás un dado. ¿Cuánta probabilidad de sacar par y mayor que 3?" → intersección.
La trampa: si los eventos se solapan (no son mutuamente excluyentes), no podés simplemente sumar las probabilidades — estarías contando el solapamiento dos veces.
📐 Fundamento
Regla de adición (unión):
Para eventos cualesquiera y :
Si y son mutuamente excluyentes ():
Regla de multiplicación (intersección):
Para eventos cualesquiera:
donde es la probabilidad de dado que ya ocurrió (probabilidad condicional).
Si y son independientes ():
🛠️ En la práctica
Ejemplo — carta de baraja:
Una baraja estándar tiene 52 cartas: 13 de cada palo (♠, ♥, ♦, ♣), 4 cartas de cada valor.
¿Probabilidad de sacar un As o un corazón?
- (el As de corazón)
Ejemplo — defectos en producción:
Una fábrica produce artículos. La probabilidad de que un artículo tenga defecto de pintura es 0.05. La probabilidad de que tenga defecto de forma es 0.03. Si son independientes, ¿probabilidad de que tenga ambos defectos?
¿Probabilidad de que tenga al menos uno de los dos?
1.3 Probabilidad condicional e independencia
💡 Intuición
Probabilidad condicional: La probabilidad de dado que ya sabemos que ocurrió. El conocimiento de puede cambiar nuestras estimaciones sobre .
Ejemplo: en un grupo de 100 personas, 40 fuman. De los fumadores, 15 tienen tos crónica. De los no fumadores, 5 tienen tos.
Sabiendo que alguien fuma, la probabilidad de que tenga tos casi se quintuplica.
Independencia: y son independientes si saber que ocurrió no cambia la probabilidad de . Tirar dos dados: el resultado del primero no afecta al segundo.
📐 Fundamento
Probabilidad condicional:
"La probabilidad de B dado A es la probabilidad de que ambos ocurran, dividida por la probabilidad de A."
Independencia:
y son independientes si y solo si:
Equivalentemente: y .
Regla de la probabilidad total:
Si es una partición de :
🛠️ En la práctica
Ejemplo — control de calidad:
Una empresa tiene tres turnos: matutino (50% de producción), vespertino (30%), nocturno (20%).
Las tasas de defecto por turno son: 2%, 3%, 5%.
¿Cuál es la probabilidad de que un artículo elegido al azar sea defectuoso?
La probabilidad de encontrar un defecto es 2.9%.
1.4 Teorema de Bayes
💡 Intuición
El teorema de Bayes responde a una pregunta muy natural: dada una evidencia observada, ¿cuál fue la causa más probable?
Sabemos que un artículo es defectuoso. ¿Cuál fue el turno que lo produjo con más probabilidad?
Esta es la lógica del diagnóstico médico (dado que el síntoma ocurrió, ¿qué enfermedad es más probable?), del spam (dado que el email tiene ciertas palabras, ¿es spam?), de la detección de fraude.
📐 Fundamento
Teorema de Bayes:
Dado un evento y una partición del espacio muestral:
Terminología:
- : probabilidad a priori — qué sabemos antes de la evidencia.
- : verosimilitud — qué tan probable es la evidencia dado cada causa.
- : probabilidad a posteriori — qué sabemos después de ver la evidencia.
"La probabilidad a posteriori es proporcional a la verosimilitud por la a priori."
🛠️ En la práctica
Continuando el ejemplo de turnos:
Un artículo resultó defectuoso. ¿Qué probabilidad hay de que lo haya producido el turno nocturno?
El turno nocturno, que produce solo el 20% de los artículos, es responsable del 34.5% de los defectos. El sistema de control de calidad debería enfocarse ahí.
Aplicación en medicina: Un test de enfermedades tiene 99% de sensibilidad (detecta si hay enfermedad) y 99% de especificidad (no da falso positivo). La enfermedad afecta al 0.1% de la población. Si el test da positivo, ¿cuánta probabilidad hay de que la persona realmente esté enferma?
, ,
¡Con un test del 99%, un positivo solo implica 9% de probabilidad real de estar enfermo! Esto se debe a que la enfermedad es rarísima (0.1%). La mayoría de positivos son falsos positivos. Por eso en medicina se hacen varias pruebas de confirmación.
1.5 Ejercicios
✏️ Ejercicio 1.1 — Probabilidad básica
En una clase de 30 estudiantes: 12 son mujeres, 8 tienen beca, y 5 son mujeres con beca. Se elige un estudiante al azar.
a. ¿P(mujer)? b. ¿P(con beca)? c. ¿P(mujer o con beca)? d. ¿P(mujer y con beca)?
Solución
a.
b.
c.
d.
✏️ Ejercicio 1.2 — Probabilidad condicional
En el ejercicio anterior:
a. ¿P(beca | mujer)? — probabilidad de tener beca dado que es mujer b. ¿P(mujer | beca)? — probabilidad de ser mujer dado que tiene beca c. ¿Son independientes los eventos "mujer" y "beca"?
Solución
a.
b.
c. Para independencia necesitamos : Como , no son independientes.
✏️ Ejercicio 1.3 — Teorema de Bayes
Un banco tiene tres tipos de clientes con morosidad histórica distinta:
- Clientes A (bajo riesgo): 60% del total, morosidad 2%
- Clientes B (riesgo medio): 30% del total, morosidad 8%
- Clientes C (alto riesgo): 10% del total, morosidad 20%
Un cliente está en mora. ¿Cuál es la probabilidad de que sea de tipo C (alto riesgo)?
Solución
Aunque el tipo C es solo el 10% del total de clientes, representa el 35.7% de los morosos. El banco debería priorizar su seguimiento.
1.6 Para profundizar
- Walpole, Myers & Myers, Probabilidad y Estadística para Ingeniería y Ciencias, cap. 2.
- DeGroot & Schervish, Probability and Statistics, cap. 1-2.
- Siguiente: Distribuciones de probabilidad — modelar cómo se distribuye la probabilidad en una variable aleatoria.
Definiciones nuevas: espacio muestral, evento, probabilidad, complemento, unión, intersección, eventos mutuamente excluyentes, eventos independientes, probabilidad condicional, teorema de Bayes, a priori, a posteriori, verosimilitud.