Intervalos de confianza

"Un investigador dice: 'El salario promedio es 450±450 ± 25 con 95% de confianza.' ¿Qué significa eso exactamente? No que el verdadero promedio 'probablemente' esté ahí — sino que el procedimiento que usó captura el verdadero valor el 95% de las veces."

Qué vas a aprender en este capítulo

Cuando estimamos un parámetro de la población (la media, una proporción) a partir de una muestra, siempre hay incertidumbre. Un intervalo de confianza cuantifica esa incertidumbre dando un rango plausible de valores, en lugar de un único número. Este capítulo te enseña a construirlos e interpretarlos correctamente — incluyendo el error interpretativo más común (que casi todo el mundo comete).


3.1 ¿Qué es un intervalo de confianza?

💡 Intuición

Imaginá que querés saber la temperatura media del océano Pacífico. No podés medirlo todo, así que tomás 50 muestras de agua al azar y calculás la media: xˉ=18.3°C\bar{x} = 18.3°C.

¿Cuál es la temperatura "real" del océano? No sabés exactamente. Pero podés decir: "Estoy 95% seguro de que la temperatura real está entre 17.1°C y 19.5°C." Eso es un intervalo de confianza.

Importante — interpretación correcta:

❌ "Hay 95% de probabilidad de que el verdadero valor esté en este intervalo." (Incorrecto — el verdadero valor es fijo, no aleatorio.)

✅ "Si repitieras este procedimiento 100 veces con distintas muestras, en 95 de esas veces el intervalo construido contendría el verdadero valor."

La diferencia es sutil pero importante en ciencia.

📐 Fundamento

Intervalo de confianza (IC):

Un intervalo (L,U)(L, U) tal que:

P(LθU)=1αP(L \leq \theta \leq U) = 1 - \alpha

donde θ\theta es el parámetro a estimar y 1α1 - \alpha es el nivel de confianza.

Nivel de confianza vs nivel de significancia:

  • Nivel de confianza: 1α1 - \alpha (típicamente 0.90, 0.95, 0.99)
  • Nivel de significancia: α\alpha (la probabilidad de que el IC no contenga al verdadero valor)

Estructura general:

Estimador±(Valor crıˊtico)×(Error estaˊndar)\text{Estimador} \pm \text{(Valor crítico)} \times \text{(Error estándar)}
xˉ±zσn(cuando se conoce σ)\bar{x} \pm z^* \cdot \frac{\sigma}{\sqrt{n}} \quad \text{(cuando se conoce } \sigma\text{)}

3.2 IC para la media — sigma conocida

📐 Fundamento

Caso: Se conoce σ\sigma (poco frecuente en la práctica, pero sirve para introducir la lógica).

IC:xˉ±zα/2σnIC: \bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

Valores críticos zz más comunes:

Confianza α\alpha zα/2z_{\alpha/2}
90% 0.10 1.645
95% 0.05 1.960
99% 0.01 2.576

Margen de error:

E=zα/2σnE = z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

Tamaño de muestra para un margen de error EE dado:

n=(zα/2σE)2n = \left\lceil \left(\frac{z_{\alpha/2} \cdot \sigma}{E}\right)^2 \right\rceil

🛠️ En la práctica

Ejemplo — tiempo de atención en banco:

El tiempo de atención al cliente en una sucursal bancaria tiene σ=4\sigma = 4 minutos (histórico). Se mide una muestra de 40 clientes: xˉ=12.5\bar{x} = 12.5 minutos.

IC al 95%:

E=1.960×440=1.960×0.632=1.24E = 1.960 \times \frac{4}{\sqrt{40}} = 1.960 \times 0.632 = 1.24 minutos

IC=(12.51.24,  12.5+1.24)=(11.26,  13.74)IC = (12.5 - 1.24, ; 12.5 + 1.24) = (11.26, ; 13.74) minutos

Interpretación: Con 95% de confianza, el tiempo medio de atención en toda la sucursal está entre 11.26 y 13.74 minutos.

Tamaño de muestra para E = 0.5 min: n=(1.960×4/0.5)2=(15.68)2=245.9=246n = \lceil (1.960 \times 4 / 0.5)^2 \rceil = \lceil (15.68)^2 \rceil = \lceil 245.9 \rceil = 246 clientes.


3.3 IC para la media — sigma desconocida

💡 Intuición

En la práctica casi nunca conocés σ\sigma. Tenés que estimarla con la desviación muestral ss. Eso introduce más incertidumbre → las colas del intervalo son más anchas → se usa la distribución t-Student en lugar de la normal.

La fórmula es la misma, pero con tt en lugar de zz y ss en lugar de σ\sigma.

📐 Fundamento

IC para μ\mu con σ\sigma desconocida:

IC:xˉ±tα/2,n1snIC: \bar{x} \pm t_{\alpha/2, \, n-1} \cdot \frac{s}{\sqrt{n}}

donde tα/2,n1t_{\alpha/2, n-1} es el valor crítico de la t-Student con n1n-1 grados de libertad.

Cuándo usar z vs t:

Condición Distribución
σ\sigma conocida (o nn muy grande) zz (normal)
σ\sigma desconocida, nn pequeña tt
σ\sigma desconocida, n30n \geq 30–100 tt (prácticamente igual a zz)

En la práctica moderna: siempre usá t, es más conservador y correcto.

🛠️ En la práctica

Ejemplo — costo de transporte:

Una empresa toma una muestra de 16 envíos y registra el costo en dólares:

$\bar{x} = $34.80,, s = $6.20,, n = 16$

IC al 95% con ν=15\nu = 15: t0.025,15=2.131t_{0.025, 15} = 2.131

E=2.131×6.2016=2.131×1.55=3.30E = 2.131 \times \frac{6.20}{\sqrt{16}} = 2.131 \times 1.55 = 3.30

$IC = (34.80 - 3.30, ; 34.80 + 3.30) = ($31.50, ; $38.10)$

Con 95% de confianza, el costo promedio de envío está entre 31.50y31.50 y 38.10.

¿Cómo se reduce el intervalo? Aumentando nn (más muestra) o bajando el nivel de confianza (de 95% a 90%). Hay un trade-off entre precisión y confianza.


3.4 IC para proporciones

💡 Intuición

A veces el parámetro de interés es una proporción: ¿qué porcentaje de clientes está satisfecho? ¿qué fracción de productos tiene defecto?

La muestra nos da p^=k/n\hat{p} = k/n (la proporción observada). Queremos un IC para la proporción real pp de la población.

Si la muestra es suficientemente grande (np5np \geq 5 y n(1p)5n(1-p) \geq 5), la distribución de p^\hat{p} es aproximadamente normal — y usamos esa normalidad para construir el intervalo.

📐 Fundamento

IC para una proporción pp:

IC:p^±zα/2p^(1p^)nIC: \hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}

Error estándar de la proporción:

SE(p^)=p^(1p^)nSE(\hat{p}) = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}

Tamaño de muestra para estimar pp:

Con margen de error EE deseado:

n=zα/22p^(1p^)E2n = \left\lceil \frac{z_{\alpha/2}^2 \cdot \hat{p}(1-\hat{p})}{E^2} \right\rceil

Si no tenés estimado previo de pp, usá p^=0.5\hat{p} = 0.5 (el caso más conservador — maximiza la varianza).

🛠️ En la práctica

Ejemplo — satisfacción de clientes:

Se encuesta a 200 clientes de un banco. 148 dicen estar "satisfechos" o "muy satisfechos".

p^=148/200=0.74\hat{p} = 148/200 = 0.74

IC al 95%:

SE=(0.74)(0.26)/200=0.000962=0.031SE = \sqrt{(0.74)(0.26)/200} = \sqrt{0.000962} = 0.031

E=1.960×0.031=0.061E = 1.960 \times 0.031 = 0.061

IC=(0.740.061,  0.74+0.061)=(0.679,  0.801)=(67.9%,  80.1%)IC = (0.74 - 0.061, ; 0.74 + 0.061) = (0.679, ; 0.801) = (67.9%, ; 80.1%)

Con 95% de confianza, entre el 67.9% y el 80.1% de los clientes están satisfechos.

Tamaño de muestra para futura encuesta:

Si queremos un margen de error de 3% (0.03) con 95% de confianza, usando p^=0.74\hat{p} = 0.74:

n=(1.960)2(0.74)(0.26)/(0.03)2=3.8416×0.1924/0.0009=820.9=821n = \lceil (1.960)^2 (0.74)(0.26) / (0.03)^2 \rceil = \lceil 3.8416 \times 0.1924 / 0.0009 \rceil = \lceil 820.9 \rceil = 821 personas.


3.5 Ejercicios

✏️ Ejercicio 3.1 — IC para la media

Un médico mide la presión arterial sistólica (mmHg) en 25 pacientes y obtiene xˉ=128\bar{x} = 128, s=15s = 15.

Construí el IC al 95% para la media poblacional.

✏️ Ejercicio 3.2 — IC para proporción

En una encuesta a 500 micro y pequeñas empresas salvadoreñas, 185 reportaron haber invertido en capacitación en el último año.

a. Construí el IC al 99% para la proporción real. b. Interpretá el resultado para un directivo no técnico. c. ¿Cuántas empresas habría que encuestar para lograr un margen de error de 2% con 95% de confianza?

✏️ Ejercicio 3.3 — Interpretación

Un investigador construye un IC al 95% para el salario promedio y obtiene ($480, $520).

Evaluá cada afirmación como Verdadera o Falsa y justificá:

a. "Hay 95% de probabilidad de que el verdadero salario promedio esté entre 480y480 y 520." b. "Si tomáramos 100 muestras distintas y construyéramos 100 ICs, aproximadamente 95 de ellos contendrían el verdadero promedio." c. "El 95% de los empleados gana entre 480y480 y 520."


3.6 Para profundizar


Definiciones nuevas: intervalo de confianza, nivel de confianza, nivel de significancia, margen de error, error estándar, valor crítico, IC para la media, IC para la proporción, tamaño de muestra.