Distribuciones de probabilidad
"La normalidad es solo una distribución más. La que sucede estar en el centro de todo lo que encontramos en la naturaleza."
Qué vas a aprender en este capítulo
Una variable aleatoria es una variable cuyo valor depende del resultado de un experimento aleatorio. Las distribuciones de probabilidad describen cómo se distribuyen los posibles valores y sus probabilidades. Este capítulo cubre las tres distribuciones más usadas en estadística: binomial (conteos), normal (fenómenos continuos) y t-Student (inferencia con muestras pequeñas).
2.1 Variables aleatorias
💡 Intuición
Tirás 3 monedas. El número de caras es un valor aleatorio — puede ser 0, 1, 2 o 3, cada uno con diferente probabilidad. Ese número es una variable aleatoria.
Discreta: toma valores contables (0, 1, 2, 3...). Ejemplo: número de defectos, número de ventas en un día.
Continua: puede tomar cualquier valor en un rango. Ejemplo: la altura de una persona (1.65, 1.651, 1.6512...), el tiempo de espera, el peso de un producto.
La diferencia importa porque el cálculo de probabilidades es distinto: en discretas se suman probabilidades; en continuas se integran (pero en este libro usamos tablas y software en lugar de cálculo).
📐 Fundamento
Variable aleatoria discreta :
Función de probabilidad (FP): , satisface:
- para todo
Valor esperado (media):
Varianza:
Equivalente (más fácil de calcular):
Variable aleatoria continua :
Función de densidad de probabilidad (FDP): , satisface:
(área bajo la curva)
Para continuas: exactamente — siempre se pregunta por intervalos.
🛠️ En la práctica
Ejemplo — número de ventas:
Una vendedora tiene la siguiente distribución de ventas diarias:
| (ventas) | 0 | 1 | 2 | 3 | 4 |
|---|---|---|---|---|---|
| 0.10 | 0.20 | 0.35 | 0.25 | 0.10 |
Esperanza:
ventas/día
Varianza:
ventas (desviación estándar)
2.2 Distribución binomial
💡 Intuición
La distribución binomial modela el número de éxitos en ensayos independientes, donde cada ensayo tiene probabilidad de éxito.
Ejemplos:
- ¿Cuántos de 10 clientes compran? (si cada uno compra con probabilidad 0.3)
- ¿Cuántos artículos de 100 son defectuosos? (si cada uno tiene 2% de defecto)
- ¿Cuántas respuestas correctas al azar en un examen de 20 preguntas verdadero/falso?
El patrón: n ensayos, 2 resultados posibles (éxito/fracaso), probabilidad constante, independencia entre ensayos.
📐 Fundamento
— "X tiene distribución binomial con ensayos y probabilidad de éxito ."
Función de probabilidad:
donde es el coeficiente binomial (" elige ").
Media y varianza:
Condiciones para usar binomial:
- ensayos fijos.
- Cada ensayo tiene solo 2 resultados: éxito (p) o fracaso (1-p).
- Los ensayos son independientes.
- La probabilidad es constante.
🛠️ En la práctica
Ejemplo — control de calidad:
Una máquina produce artículos con 5% de defecto. Se revisa una muestra de 10 artículos. ¿Cuánta probabilidad hay de que exactamente 2 sean defectuosos?
, , :
Hay 7.46% de probabilidad de encontrar exactamente 2 defectuosos.
defectuosos en promedio. .
Probabilidad acumulada: ¿Probabilidad de encontrar 2 o menos defectuosos?
Con 98.84% de probabilidad, una muestra de 10 tiene 2 o menos defectuosos.
2.3 Distribución normal
💡 Intuición
La distribución normal (o "gaussiana") es la famosa curva de campana. Aparece en casi todo en la naturaleza y en los negocios: alturas de personas, pesos de productos, errores de medición, calificaciones de exámenes.
¿Por qué es tan común? El Teorema Central del Límite (TLC) lo explica: si sumás muchas variables aleatorias independientes (sin importar su distribución individual), la suma tiende a ser normal. La campana no es solo un capricho — es una consecuencia matemática profunda.
La normal tiene dos parámetros: la media (dónde está centrada) y la desviación estándar (qué tan ancha es).
📐 Fundamento
— "X tiene distribución normal con media y varianza ."
Función de densidad:
Propiedades:
- Simétrica alrededor de
- Media = Mediana = Moda =
- El área total bajo la curva = 1
- Regla 68-95-99.7:
- 68% de los datos están en
- 95% en
- 99.7% en
Normal estándar :
Transformación: (estandarización)
Esta transformación convierte cualquier normal en la normal estándar, que tiene tablas precalculadas. En la práctica moderna se usa software (Excel, Python, R) para calcular directamente.
En Excel / Python:
from scipy.stats import norm
# P(X < x) para N(mu, sigma)
norm.cdf(x, loc=mu, scale=sigma)
# Percentil (valor x tal que P(X < x) = p)
norm.ppf(p, loc=mu, scale=sigma)
🛠️ En la práctica
Ejemplo — salarios en San Miguel:
Los salarios mensuales de cierta industria en San Miguel siguen una distribución normal con media $\mu = $450$ y desviación estándar $\sigma = $80$.
¿Qué porcentaje gana entre 530?
y . Regla del 68%: 68% de los empleados.
¿Probabilidad de ganar más de $600?
Solo el 3% gana más de $600.
¿Cuánto gana el 90% más bajo (percentil 90)?
→ $X = 450 + 1.282 \times 80 \approx $552.6$
El 90% de los empleados gana menos de $552.60.
Verificar normalidad: Antes de usar la distribución normal, verificá visualmente con un histograma (debería ser aproximadamente simétrico y con forma de campana) o con un QQ-plot.
2.4 Distribución t-Student
💡 Intuición
La distribución normal requiere conocer (la desviación estándar de la población). Pero casi nunca la conocés — solo tenés la muestra y su desviación estándar .
William Gosset (que firmaba como "Student" por razones de confidencialidad) encontró en 1908 la distribución exacta para muestras pequeñas cuando no se conoce : la distribución t-Student.
La t-Student se parece a la normal (curva de campana) pero tiene colas más pesadas — es más conservadora, asignando más probabilidad a valores extremos. Cuando el tamaño de muestra aumenta, la t-Student se acerca cada vez más a la normal. Para o (según el criterio), la diferencia es mínima.
📐 Fundamento
— distribución t-Student con grados de libertad (donde es el tamaño de muestra).
Cuándo usar t-Student:
- La muestra es relativamente pequeña (, aunque algunos dicen )
- La variable de interés sigue (aproximadamente) distribución normal
- (desviación de la población) es desconocida — se usa en su lugar
Estadístico t:
donde:
- : media muestral
- : media hipotética bajo
- : desviación estándar muestral
- : tamaño de muestra
Valores críticos comunes ( grados de libertad, prueba bilateral):
| (95%) | (99%) | |
|---|---|---|
| 5 | 2.571 | 4.032 |
| 10 | 2.228 | 3.169 |
| 20 | 2.086 | 2.845 |
| 30 | 2.042 | 2.750 |
| ∞ (normal) | 1.960 | 2.576 |
En Python: from scipy.stats import t; t.ppf(0.975, df=n-1)
🛠️ En la práctica
Ejemplo — tiempo de entrega:
Una empresa de mensajería asegura entrega en 24 horas. Se toma una muestra de 15 entregas: media horas, desviación estándar muestral horas.
¿Cuánta probabilidad hay de obtener o más si la media real fuera 24?
Con grados de libertad, .
Si hubiera que decidir si el tiempo real supera 24 horas, este valor () sugeriría que sí — la empresa no cumple su promesa. Esto es lo que verás en detalle en el capítulo de pruebas de hipótesis.
2.5 Teorema Central del Límite
💡 Intuición
Este es el teorema más importante de la estadística. Dice que si tomás muestras de tamaño de cualquier distribución con media y varianza finitas, la distribución de las medias muestrales se aproxima a una normal cuando es suficientemente grande.
¿Por qué importa? Porque te permite hacer inferencias (intervalos de confianza, pruebas de hipótesis) usando la distribución normal o t-Student, incluso si la variable original no es normal, siempre que la muestra sea suficientemente grande ( como regla práctica).
📐 Fundamento
Teorema Central del Límite (TLC):
Si son variables aleatorias i.i.d. (independientes e idénticamente distribuidas) con y , entonces:
Error estándar de la media:
A medida que aumenta, el error estándar disminuye — las medias muestrales se concentran más alrededor de la media real.
Implicación práctica: Con , la media muestral sigue aproximadamente una distribución normal, independientemente de la distribución original.
2.6 Ejercicios
✏️ Ejercicio 2.1 — Binomial
Un vendedor de seguros llama a 8 personas. La probabilidad de vender un seguro en cada llamada es 0.25.
a. ¿P(exactamente 3 ventas)? b. ¿P(al menos 1 venta)? c. ¿Cuál es el número esperado de ventas y su desviación estándar?
Solución
,
a.
b.
c. ventas. ventas.
✏️ Ejercicio 2.2 — Normal
El peso de bolsas de maíz en una distribuidora sigue .
a. ¿P(bolsa pesa entre 1.9 y 2.1 kg)? b. ¿P(bolsa pesa menos de 1.85 kg)? c. ¿Qué peso tiene el 5% más pesado de las bolsas?
Solución
,
a. . Regla del 68%: P ≈ 0.68.
Más preciso: , . .
b. . . El 6.68% de bolsas pesa menos de 1.85 kg.
c. Percentil 95: . kg. El 5% más pesado supera 2.16 kg.
✏️ Ejercicio 2.3 — TLC
El gasto diario de clientes en una tienda tiene media $\mu = $45$ y desviación estándar $\sigma = $15$ (distribución desconocida, no normal).
Se toma una muestra de 36 clientes.
a. ¿Cuál es la distribución de la media muestral ? b. ¿P()? c. ¿Para qué tamaño de muestra el error estándar sería menor a $$2$?
Solución
a. Por TLC con : . Error estándar = .
b. . . Solo 2.28% de muestras tendrían media mayor a $50.
c. . Se necesitan al menos clientes.
2.7 Para profundizar
- Walpole et al., Probabilidad y Estadística para Ingeniería — cap. 3-6.
- OpenStax, Introductory Statistics (gratis en línea) — cap. 4-6.
- Siguiente: Intervalos de confianza — usar la distribución de para estimar parámetros poblacionales.
Definiciones nuevas: variable aleatoria, discreta, continua, valor esperado, varianza, distribución binomial, distribución normal, distribución t-Student, grados de libertad, estandarización, error estándar, Teorema Central del Límite.