Intervalos de confianza
"Un investigador dice: 'El salario promedio es 25 con 95% de confianza.' ¿Qué significa eso exactamente? No que el verdadero promedio 'probablemente' esté ahí — sino que el procedimiento que usó captura el verdadero valor el 95% de las veces."
Qué vas a aprender en este capítulo
Cuando estimamos un parámetro de la población (la media, una proporción) a partir de una muestra, siempre hay incertidumbre. Un intervalo de confianza cuantifica esa incertidumbre dando un rango plausible de valores, en lugar de un único número. Este capítulo te enseña a construirlos e interpretarlos correctamente — incluyendo el error interpretativo más común (que casi todo el mundo comete).
3.1 ¿Qué es un intervalo de confianza?
💡 Intuición
Imaginá que querés saber la temperatura media del océano Pacífico. No podés medirlo todo, así que tomás 50 muestras de agua al azar y calculás la media: .
¿Cuál es la temperatura "real" del océano? No sabés exactamente. Pero podés decir: "Estoy 95% seguro de que la temperatura real está entre 17.1°C y 19.5°C." Eso es un intervalo de confianza.
Importante — interpretación correcta:
❌ "Hay 95% de probabilidad de que el verdadero valor esté en este intervalo." (Incorrecto — el verdadero valor es fijo, no aleatorio.)
✅ "Si repitieras este procedimiento 100 veces con distintas muestras, en 95 de esas veces el intervalo construido contendría el verdadero valor."
La diferencia es sutil pero importante en ciencia.
📐 Fundamento
Intervalo de confianza (IC):
Un intervalo tal que:
donde es el parámetro a estimar y es el nivel de confianza.
Nivel de confianza vs nivel de significancia:
- Nivel de confianza: (típicamente 0.90, 0.95, 0.99)
- Nivel de significancia: (la probabilidad de que el IC no contenga al verdadero valor)
Estructura general:
3.2 IC para la media — sigma conocida
📐 Fundamento
Caso: Se conoce (poco frecuente en la práctica, pero sirve para introducir la lógica).
Valores críticos más comunes:
| Confianza | ||
|---|---|---|
| 90% | 0.10 | 1.645 |
| 95% | 0.05 | 1.960 |
| 99% | 0.01 | 2.576 |
Margen de error:
Tamaño de muestra para un margen de error dado:
🛠️ En la práctica
Ejemplo — tiempo de atención en banco:
El tiempo de atención al cliente en una sucursal bancaria tiene minutos (histórico). Se mide una muestra de 40 clientes: minutos.
IC al 95%:
minutos
minutos
Interpretación: Con 95% de confianza, el tiempo medio de atención en toda la sucursal está entre 11.26 y 13.74 minutos.
Tamaño de muestra para E = 0.5 min: clientes.
3.3 IC para la media — sigma desconocida
💡 Intuición
En la práctica casi nunca conocés . Tenés que estimarla con la desviación muestral . Eso introduce más incertidumbre → las colas del intervalo son más anchas → se usa la distribución t-Student en lugar de la normal.
La fórmula es la misma, pero con en lugar de y en lugar de .
📐 Fundamento
IC para con desconocida:
donde es el valor crítico de la t-Student con grados de libertad.
Cuándo usar z vs t:
| Condición | Distribución |
|---|---|
| conocida (o muy grande) | (normal) |
| desconocida, pequeña | |
| desconocida, –100 | (prácticamente igual a ) |
En la práctica moderna: siempre usá t, es más conservador y correcto.
🛠️ En la práctica
Ejemplo — costo de transporte:
Una empresa toma una muestra de 16 envíos y registra el costo en dólares:
$\bar{x} = $34.80s = $6.20n = 16$
IC al 95% con :
$IC = (34.80 - 3.30, ; 34.80 + 3.30) = ($31.50, ; $38.10)$
Con 95% de confianza, el costo promedio de envío está entre 38.10.
¿Cómo se reduce el intervalo? Aumentando (más muestra) o bajando el nivel de confianza (de 95% a 90%). Hay un trade-off entre precisión y confianza.
3.4 IC para proporciones
💡 Intuición
A veces el parámetro de interés es una proporción: ¿qué porcentaje de clientes está satisfecho? ¿qué fracción de productos tiene defecto?
La muestra nos da (la proporción observada). Queremos un IC para la proporción real de la población.
Si la muestra es suficientemente grande ( y ), la distribución de es aproximadamente normal — y usamos esa normalidad para construir el intervalo.
📐 Fundamento
IC para una proporción :
Error estándar de la proporción:
Tamaño de muestra para estimar :
Con margen de error deseado:
Si no tenés estimado previo de , usá (el caso más conservador — maximiza la varianza).
🛠️ En la práctica
Ejemplo — satisfacción de clientes:
Se encuesta a 200 clientes de un banco. 148 dicen estar "satisfechos" o "muy satisfechos".
IC al 95%:
Con 95% de confianza, entre el 67.9% y el 80.1% de los clientes están satisfechos.
Tamaño de muestra para futura encuesta:
Si queremos un margen de error de 3% (0.03) con 95% de confianza, usando :
personas.
3.5 Ejercicios
✏️ Ejercicio 3.1 — IC para la media
Un médico mide la presión arterial sistólica (mmHg) en 25 pacientes y obtiene , .
Construí el IC al 95% para la media poblacional.
Solución
, , .
mmHg
Con 95% de confianza, la presión media de la población está entre 121.8 y 134.2 mmHg.
✏️ Ejercicio 3.2 — IC para proporción
En una encuesta a 500 micro y pequeñas empresas salvadoreñas, 185 reportaron haber invertido en capacitación en el último año.
a. Construí el IC al 99% para la proporción real. b. Interpretá el resultado para un directivo no técnico. c. ¿Cuántas empresas habría que encuestar para lograr un margen de error de 2% con 95% de confianza?
Solución
a. . . . .
IC al 99%: (31.4%, 42.6%).
b. "Con alta certeza (99%), podemos afirmar que entre el 31% y el 43% de las micro y pequeñas empresas del país invirtió en capacitación el año pasado. Es decir, alrededor de 1 de cada 3 empresas."
c. . Se necesitan 2,238 empresas.
✏️ Ejercicio 3.3 — Interpretación
Un investigador construye un IC al 95% para el salario promedio y obtiene ($480, $520).
Evaluá cada afirmación como Verdadera o Falsa y justificá:
a. "Hay 95% de probabilidad de que el verdadero salario promedio esté entre 520." b. "Si tomáramos 100 muestras distintas y construyéramos 100 ICs, aproximadamente 95 de ellos contendrían el verdadero promedio." c. "El 95% de los empleados gana entre 520."
Solución
a. Falsa — El verdadero parámetro es fijo (no aleatorio). No tiene sentido decirle "probabilidad" de que esté en un rango. Lo que es aleatorio es el IC (varía de muestra a muestra). La interpretación correcta es la de (b).
b. Verdadera — Esta es la interpretación frecuentista correcta del IC al 95%.
c. Falsa — El IC es sobre la media, no sobre la distribución individual de salarios. El 95% es sobre la certeza del procedimiento, no sobre cuántos empleados caen en ese rango. La desviación estándar individual podría ser muy grande y la mayoría de empleados podría estar fuera de ese rango.
3.6 Para profundizar
- Walpole et al., cap. 9 — Intervalos de confianza.
- Montgomery & Runger, Applied Statistics and Probability for Engineers — cap. 8.
- Siguiente: Pruebas de hipótesis — decidir formalmente si una hipótesis sobre la población es verdadera.
Definiciones nuevas: intervalo de confianza, nivel de confianza, nivel de significancia, margen de error, error estándar, valor crítico, IC para la media, IC para la proporción, tamaño de muestra.