Intervalos de confianza

"Un investigador dice: 'El salario promedio es $450 ±$ 25 con 95% de confianza.' ¿Qué significa eso exactamente? No que el verdadero promedio 'probablemente' esté ahí — sino que el procedimiento que usó captura el verdadero valor el 95% de las veces."

Qué vas a aprender en este capítulo

Cuando estimamos un parámetro de la población (la media, una proporción) a partir de una muestra, siempre hay incertidumbre. Un intervalo de confianza cuantifica esa incertidumbre dando un rango plausible de valores, en lugar de un único número. Este capítulo te enseña a construirlos e interpretarlos correctamente — incluyendo el error interpretativo más común (que casi todo el mundo comete).

3.1 ¿Qué es un intervalo de confianza?

💡 Intuición

Imaginá que querés saber la temperatura media del océano Pacífico. No podés medirlo todo, así que tomás 50 muestras de agua al azar y calculás la media: $\bar{x} = 18.3°C$ .

¿Cuál es la temperatura "real" del océano? No sabés exactamente. Pero podés decir: "Estoy 95% seguro de que la temperatura real está entre 17.1°C y 19.5°C." Eso es un intervalo de confianza.

Importante — interpretación correcta:

❌ "Hay 95% de probabilidad de que el verdadero valor esté en este intervalo." (Incorrecto — el verdadero valor es fijo, no aleatorio.)

✅ "Si repitieras este procedimiento 100 veces con distintas muestras, en 95 de esas veces el intervalo construido contendría el verdadero valor."

La diferencia es sutil pero importante en ciencia.

📐 Fundamento

Intervalo de confianza (IC):

Un intervalo $(L, U)$ tal que:

P(L \leq \theta \leq U) = 1 - \alpha

donde $\theta$ es el parámetro a estimar y $1 - \alpha$ es el nivel de confianza.

Nivel de confianza vs nivel de significancia:

Nivel de confianza: $1 - \alpha$ (típicamente 0.90, 0.95, 0.99)
Nivel de significancia: $\alpha$ (la probabilidad de que el IC no contenga al verdadero valor)

Estructura general:

\text{Estimador} \pm \text{(Valor crítico)} \times \text{(Error estándar)}

\bar{x} \pm z^* \cdot \frac{\sigma}{\sqrt{n}} \quad \text{(cuando se conoce } \sigma\text{)}

3.2 IC para la media — sigma conocida

📐 Fundamento

Caso: Se conoce $\sigma$ (poco frecuente en la práctica, pero sirve para introducir la lógica).

IC: \bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

Valores críticos $z$ más comunes:

Confianza	$\alpha$	$z_{\alpha/2}$
90%	0.10	1.645
95%	0.05	1.960
99%	0.01	2.576

Margen de error:

E = z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

Tamaño de muestra para un margen de error $E$ dado:

n = \left\lceil \left(\frac{z_{\alpha/2} \cdot \sigma}{E}\right)^2 \right\rceil

🛠️ En la práctica

Ejemplo — tiempo de atención en banco:

El tiempo de atención al cliente en una sucursal bancaria tiene $\sigma = 4$ minutos (histórico). Se mide una muestra de 40 clientes: $\bar{x} = 12.5$ minutos.

IC al 95%:

$E = 1.960 \times \frac{4}{\sqrt{40}} = 1.960 \times 0.632 = 1.24$ minutos

$IC = (12.5 - 1.24, ; 12.5 + 1.24) = (11.26, ; 13.74)$ minutos

Interpretación: Con 95% de confianza, el tiempo medio de atención en toda la sucursal está entre 11.26 y 13.74 minutos.

Tamaño de muestra para E = 0.5 min: $n = \lceil (1.960 \times 4 / 0.5)^2 \rceil = \lceil (15.68)^2 \rceil = \lceil 245.9 \rceil = 246$ clientes.

3.3 IC para la media — sigma desconocida

💡 Intuición

En la práctica casi nunca conocés $\sigma$ . Tenés que estimarla con la desviación muestral $s$ . Eso introduce más incertidumbre → las colas del intervalo son más anchas → se usa la distribución t-Student en lugar de la normal.

La fórmula es la misma, pero con $t$ en lugar de $z$ y $s$ en lugar de $\sigma$ .

📐 Fundamento

IC para $\mu$ con $\sigma$ desconocida:

IC: \bar{x} \pm t_{\alpha/2, \, n-1} \cdot \frac{s}{\sqrt{n}}

donde $t_{\alpha/2, n-1}$ es el valor crítico de la t-Student con $n-1$ grados de libertad.

Cuándo usar z vs t:

Condición	Distribución
$\sigma$ conocida (o $n$ muy grande)	$z$ (normal)
$\sigma$ desconocida, $n$ pequeña	$t$
$\sigma$ desconocida, $n \geq 30$ –100	$t$ (prácticamente igual a $z$ )

En la práctica moderna: siempre usá t, es más conservador y correcto.

🛠️ En la práctica

Ejemplo — costo de transporte:

Una empresa toma una muestra de 16 envíos y registra el costo en dólares:

$\bar{x} = $34.80 $,$ s = $6.20 $,$ n = 16$

IC al 95% con $\nu = 15$ : $t_{0.025, 15} = 2.131$

$E = 2.131 \times \frac{6.20}{\sqrt{16}} = 2.131 \times 1.55 = 3.30$

$IC = (34.80 - 3.30, ; 34.80 + 3.30) = ($31.50, ; $38.10)$

Con 95% de confianza, el costo promedio de envío está entre $31.50 y$ 38.10.

¿Cómo se reduce el intervalo? Aumentando $n$ (más muestra) o bajando el nivel de confianza (de 95% a 90%). Hay un trade-off entre precisión y confianza.

3.4 IC para proporciones

💡 Intuición

A veces el parámetro de interés es una proporción: ¿qué porcentaje de clientes está satisfecho? ¿qué fracción de productos tiene defecto?

La muestra nos da $\hat{p} = k/n$ (la proporción observada). Queremos un IC para la proporción real $p$ de la población.

Si la muestra es suficientemente grande ( $np \geq 5$ y $n(1-p) \geq 5$ ), la distribución de $\hat{p}$ es aproximadamente normal — y usamos esa normalidad para construir el intervalo.

📐 Fundamento

IC para una proporción $p$ :

IC: \hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}

Error estándar de la proporción:

SE(\hat{p}) = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}

Tamaño de muestra para estimar $p$ :

Con margen de error $E$ deseado:

n = \left\lceil \frac{z_{\alpha/2}^2 \cdot \hat{p}(1-\hat{p})}{E^2} \right\rceil

Si no tenés estimado previo de $p$ , usá $\hat{p} = 0.5$ (el caso más conservador — maximiza la varianza).

🛠️ En la práctica

Ejemplo — satisfacción de clientes:

Se encuesta a 200 clientes de un banco. 148 dicen estar "satisfechos" o "muy satisfechos".

$\hat{p} = 148/200 = 0.74$

IC al 95%:

$SE = \sqrt{(0.74)(0.26)/200} = \sqrt{0.000962} = 0.031$

$E = 1.960 \times 0.031 = 0.061$

$IC = (0.74 - 0.061, ; 0.74 + 0.061) = (0.679, ; 0.801) = (67.9%, ; 80.1%)$

Con 95% de confianza, entre el 67.9% y el 80.1% de los clientes están satisfechos.

Tamaño de muestra para futura encuesta:

Si queremos un margen de error de 3% (0.03) con 95% de confianza, usando $\hat{p} = 0.74$ :

$n = \lceil (1.960)^2 (0.74)(0.26) / (0.03)^2 \rceil = \lceil 3.8416 \times 0.1924 / 0.0009 \rceil = \lceil 820.9 \rceil = 821$ personas.

3.5 Ejercicios

✏️ Ejercicio 3.1 — IC para la media

Un médico mide la presión arterial sistólica (mmHg) en 25 pacientes y obtiene $\bar{x} = 128$ , $s = 15$ .

Construí el IC al 95% para la media poblacional.

✏️ Ejercicio 3.2 — IC para proporción

En una encuesta a 500 micro y pequeñas empresas salvadoreñas, 185 reportaron haber invertido en capacitación en el último año.

a. Construí el IC al 99% para la proporción real. b. Interpretá el resultado para un directivo no técnico. c. ¿Cuántas empresas habría que encuestar para lograr un margen de error de 2% con 95% de confianza?

✏️ Ejercicio 3.3 — Interpretación

Un investigador construye un IC al 95% para el salario promedio y obtiene ($480, $520).

Evaluá cada afirmación como Verdadera o Falsa y justificá:

a. "Hay 95% de probabilidad de que el verdadero salario promedio esté entre $480 y$ 520." b. "Si tomáramos 100 muestras distintas y construyéramos 100 ICs, aproximadamente 95 de ellos contendrían el verdadero promedio." c. "El 95% de los empleados gana entre $480 y$ 520."

3.6 Para profundizar

Walpole et al., cap. 9 — Intervalos de confianza.
Montgomery & Runger, Applied Statistics and Probability for Engineers — cap. 8.
Siguiente: Pruebas de hipótesis — decidir formalmente si una hipótesis sobre la población es verdadera.

Definiciones nuevas: intervalo de confianza, nivel de confianza, nivel de significancia, margen de error, error estándar, valor crítico, IC para la media, IC para la proporción, tamaño de muestra.

← Anterior Distribuciones de probabilidad Siguiente → Pruebas de hipótesis

Reportar error en este capítulo · Patrocinar este libro