Teoría de decisiones
"Una decisión perfecta con la información de hoy no es la misma que con la información de mañana — pero hoy es cuando hay que decidir."
Qué vas a aprender en este capítulo
Hasta acá asumimos certeza total: los costos, demandas y capacidades eran conocidos. La realidad rara vez es así. Este capítulo:
- Clasifica las decisiones según el nivel de incertidumbre.
- Aplica criterios clásicos: maximax, maximin, minimax-regret, Hurwicz.
- Usa valor esperado y EVPI (valor de información perfecta).
- Construye árboles de decisión.
- Introduce cadenas de Markov para sistemas que evolucionan.
- Cuando los modelos cerrados no alcanzan: simulación Monte Carlo.
5.1 Decisión bajo certeza, riesgo o incertidumbre
💡 Intuición
| Tipo | ¿Qué sabés? | Ejemplo |
|---|---|---|
| Certeza | Resultados exactos de cada acción | Comprar a precio fijo |
| Riesgo | Resultados posibles y sus probabilidades | Apostar en una ruleta |
| Incertidumbre | Resultados posibles sin probabilidades | Lanzar un producto en un mercado desconocido |
La transición de incertidumbre → riesgo ocurre cuando recolectás datos suficientes para estimar probabilidades. Ese es el rol clave de la estadística inferencial (capítulo 4 del otro libro): convertir lo desconocido en lo cuantificable.
El criterio "óptimo" depende del nivel: bajo certeza, optimizás directamente. Bajo riesgo, optimizás esperanza. Bajo incertidumbre, usás criterios que no requieren probabilidades.
5.2 Criterios bajo incertidumbre
📐 Fundamento
Setup: matriz de pagos donde es una acción y es un estado de la naturaleza.
Ejemplo — La pupusería evalúa 3 opciones de inversión:
| Acción \ Estado | Crece economía | Estancada | Recesión |
|---|---|---|---|
| Expandir local | 100 | 30 | -50 |
| Nuevo producto | 60 | 40 | 0 |
| No hacer nada | 0 | 0 | 0 |
(Ganancias en miles de USD.)
Criterio maximax (optimista)
Para cada acción, mirás su mejor resultado. Elegís la acción con el mejor de los mejores.
Mejores: Expandir 100, Nuevo 60, Nada 0. Maximax: Expandir (100).
Criterio maximin (pesimista / Wald)
Para cada acción, mirás su peor resultado. Elegís la acción con el mejor de los peores.
Peores: Expandir -50, Nuevo 0, Nada 0. Maximin: Nuevo o Nada (0).
Criterio minimax-regret (Savage)
Calculás la matriz de arrepentimiento: para cada estado, restás cada pago del mejor pago en esa columna.
| Acción \ Estado | Crece | Estanca | Recesión |
|---|---|---|---|
| Expandir | 0 | 10 | 50 |
| Nuevo | 40 | 0 | 0 |
| Nada | 100 | 40 | 0 |
Máximo regret por acción: Expandir 50, Nuevo 40, Nada 100. Minimax-regret: Nuevo (40).
Criterio Hurwicz (mezcla)
Con un coeficiente de optimismo :
Con :
- Expandir: .
- Nuevo: .
- Nada: 0.
Hurwicz con : Expandir (40).
Distinto criterio → distinta acción. Ninguno es "el correcto". Refleja tu actitud frente al riesgo. En la vida profesional, declarálo explícitamente: "usé maximin porque la empresa no puede absorber una pérdida 50k".
5.3 Decisión bajo riesgo: valor esperado
📐 Fundamento
Con probabilidades para cada estado, el valor esperado de la acción :
Elegís la acción con mayor .
Ejemplo: asumamos , , .
- .
- .
- .
Mejor por EV: Expandir (42).
Limitaciones del valor esperado
- No captura aversión al riesgo. Dos acciones con mismo EV pueden tener varianzas muy distintas. Una empresa que no puede absorber pérdidas grandes prefiere baja varianza.
- No funciona para eventos no repetibles. EV es una media a largo plazo. Para una sola decisión irreversible (vender la empresa), la "media a largo plazo" no tiene mucho sentido.
Soluciones: función de utilidad (transforma dinero en utilidad cóncava, capturando aversión al riesgo), o agregar restricciones de varianza/CVaR.
5.4 Valor de la información perfecta (EVPI)
📐 Fundamento
¿Cuánto pagarías por saber el futuro?
EV con información perfecta (EVwPI): suponé que antes de actuar, conocés el estado. Elegís la mejor acción para ese estado. EVwPI = esperanza ponderada de los mejores pagos.
EVwPI = .
EVPI = EVwPI − mejor EV sin información = .
Interpretación: vale acceder a un estudio de mercado perfecto que te diga con certeza qué estado ocurrirá. Si el estudio cuesta 5k, conviene; si cuesta $20k, no.
EVPI es el techo máximo de lo que pagarías. La información real nunca es perfecta, así que su valor real es menor.
5.5 Árboles de decisión
📐 Fundamento
Cuando hay secuencia de decisiones (decidir, observar, decidir de nuevo), los árboles de decisión los modelan visualmente.
Convención:
- Cuadrado ◻ = nodo de decisión (vos elegís).
- Círculo ○ = nodo de azar (la naturaleza decide).
- Triángulo ▷ = fin (con un pago asociado).
Algoritmo (rollback / inducción hacia atrás):
- Para cada nodo final: el valor es el pago.
- Para cada nodo azar: el valor es la suma ponderada de los valores de sus hijos.
- Para cada nodo decisión: el valor es el máximo de los valores de sus hijos.
- Subís desde las hojas hasta la raíz.
Ejemplo (compacto):
Cliente compra
┌─────── (p=0.6) → +200
│
◻ Lanzar producto
│
└─────── No compra (p=0.4) → -50
◻ No lanzar → 0
EV(Lanzar) = . EV(No lanzar) = .
Decisión: lanzar.
Para árboles más complejos, software como SilverDecisions, Lumina Analytica o un buen Excel + visualización manual.
5.6 Cadenas de Markov
📐 Fundamento
Un proceso de Markov describe un sistema que cambia entre estados con probabilidades de transición que dependen solo del estado actual (propiedad de Markov, sin memoria).
Matriz de transición :
Cada fila suma 1 (es una distribución de probabilidad).
Ejemplo: cliente de pupusería. Estados: F (fiel), O (ocasional), P (perdido).
Lectura: un cliente fiel sigue fiel con 0.8, se vuelve ocasional con 0.15, se pierde con 0.05.
Distribución después de pasos: .
Distribución estacionaria : cumple . Resolviendo el sistema con la restricción :
Para esta matriz: . Lectura: a largo plazo, sin acciones, el 50 % de clientes serán fieles, 21 % ocasionales, 29 % perdidos.
Aplicaciones:
- Customer Lifetime Value (LTV): markov del cliente.
- Reliability de un sistema (estados: operando, degradado, fallado).
- Inventarios (probabilidad de stockout dado patrón de demanda).
- PageRank (matriz de transición entre páginas web).
5.7 Cuando los modelos cerrados no alcanzan: Monte Carlo
🛠️ Aplicado
Si tu modelo tiene muchas fuentes de incertidumbre interactuando, los métodos analíticos se complican. Simulación Monte Carlo los reemplaza:
- Modelás cada incertidumbre como una distribución (normal, triangular, lognormal, etc.).
- Muestreás veces (típicamente a ).
- Para cada muestra, ejecutás el modelo y registrás el resultado.
- Analizás la distribución de resultados: media, desviación, percentiles, probabilidad de eventos malos.
import numpy as np
N = 100_000
# Modelo simple: ganancia = ingreso - costo, ambos con incertidumbre
ingreso = np.random.normal(loc=100_000, scale=15_000, size=N)
costo_unit = np.random.triangular(left=2.5, mode=3.0, right=4.0, size=N)
volumen = np.random.normal(loc=30_000, scale=5_000, size=N)
costo = costo_unit * volumen
ganancia = ingreso - costo
print(f"Media: ${ganancia.mean():,.0f}")
print(f"Std: ${ganancia.std():,.0f}")
print(f"Percentil 5: ${np.percentile(ganancia, 5):,.0f}")
print(f"Prob pérdida: {(ganancia < 0).mean():.1%}")
Output típico (3 líneas que ayudan a decidir más que 20 páginas de análisis):
Media: $13,500
Std: $51,200
Percentil 5: -$70,800
Prob pérdida: 37.5%
Una "ganancia esperada de -70k, ya no tanto.
Monte Carlo es subestimado en la enseñanza universitaria. En la industria es omnipresente para análisis de riesgo, valoración de opciones (Black-Scholes empezó así), proyectos de capital, planeación de inventarios.
5.8 Errores comunes
⚠️ Trampa común
Usar valor esperado para decisiones únicas e irreversibles. EV es la media en muchas repeticiones. Si una decisión "promedia bien" pero el único intento puede arruinarte, el promedio no te salva.
Tip: mostrá la distribución completa, no solo la media. Reportá probabilidad de pérdida, peor caso 5 %, peor caso 1 %. Para personas no técnicas, usá un gráfico de distribución acumulada — comunica mejor que números sueltos.
⚠️ Trampa común
Sobre-confianza en las probabilidades estimadas. "Asumimos ." ¿De dónde sale ese 0.2? Si lo inventaste, todo tu análisis depende de un número arbitrario.
Tip: hacé análisis de sensibilidad sobre las probabilidades. Si la decisión cambia cuando varía de 0.15 a 0.25, tu conclusión es frágil. Si no cambia, la decisión es robusta y podés defenderla.
⚠️ Trampa común
Confundir Markov con "predicción del futuro". La cadena describe comportamiento promedio a largo plazo asumiendo que las probabilidades de transición no cambian. Si tu mercado cambia (nueva competencia, cambio cultural), la matriz misma cambia y la predicción se invalida.
Tip: los modelos Markov son útiles para steady-state y comparar políticas (¿qué cambia si subo retención de 0.8 a 0.85?), no para predecir exactamente qué pasará el próximo trimestre. Ese tipo de predicción punto-a-punto se hace mejor con modelos de series de tiempo o ML.
5.9 Resumen visual
NIVEL DE INFORMACIÓN ENFOQUE
───────────────────── ──────────────────────────
Certeza → PL clásica (cap. 2-4)
Riesgo (probs conocidas) → Valor esperado / utilidad
Árbol de decisión
Cadenas de Markov
Monte Carlo
Incertidumbre → Maximax, maximin, minimax-regret
(sin probs) Hurwicz
Escenarios / what-if
5.10 Ejercicios
- Para la matriz de pagos del cap. 5.2, aplicá Hurwicz con , , . ¿Para qué rango cada acción gana?
- Calculá EVPI para un caso de tu invención (3 acciones, 3 estados, probabilidades sumando 1).
- Construí un árbol de decisión secuencial: lanzar producto, observar primer mes, decidir si seguir o cancelar. Resolvé con rollback.
- Para la cadena de Markov del cap. 5.6, calculá partiendo de (un cliente fiel). ¿En qué estado tiene más probabilidad de estar?
- Implementá una simulación Monte Carlo de tu proyecto del libro. Reportá media, std, percentil 5, probabilidad de pérdida.
- Investigá la diferencia entre valor esperado y utilidad esperada (función de utilidad cóncava). ¿Qué decisión cambia con utilidad?
5.11 Para profundizar
- Render, Stair & Hanna, Quantitative Analysis for Management — capítulos de decisiones y Markov, orientado a negocios.
- Howard, Decision Analysis — referencia académica.
- Ross, Introduction to Probability Models — Markov en profundidad.
- Vose, Risk Analysis — Monte Carlo aplicado.
5.12 Cierre del libro
Recorriste el camino completo:
- Fundamentos — qué es la IO, cómo modelar.
- PL & Simplex — la herramienta principal.
- Dualidad y sensibilidad — interpretar y robustecer.
- PE y redes — discreto y combinatorio.
- Decisiones bajo incertidumbre — lo realista.
Con esto podés:
- Modelar problemas operativos en notación matemática.
- Resolverlos en Excel, Python (PuLP, scipy), o software comercial.
- Comunicar las recomendaciones con precios sombra, escenarios y riesgo.
- Reconocer cuándo IO no es la herramienta correcta (problemas que no son cuantificables o donde la decisión es política).
Próximos pasos:
- Optimización no-lineal (gradient descent, programación cuadrática).
- Optimización estocástica (escenarios, recourse, robusta).
- Optimización combinatoria avanzada (TSP, vehicle routing).
- Decision under deep uncertainty (multi-criterio, exploración de escenarios).
- Operations research + machine learning (campo emergente: usar ML para acelerar B&B, RL para políticas).
5.13 Mini-proyecto integrador — Cierre
🏗️ Proyecto final — Decisión con incertidumbre
Cierre del proyecto del libro.
Entregables (cap. 5):
- Agregá incertidumbre a uno o dos parámetros de tu modelo (rango plausible).
- Aplicá uno de los criterios bajo incertidumbre, o asigná probabilidades y calculá EV.
- Si aplica, construí un árbol de decisión simple para una secuencia.
- Corré una simulación Monte Carlo (1000+ iteraciones) y reportá:
- Histograma del resultado.
- Media, std, percentil 5, percentil 95.
- Probabilidad de superar / no superar un umbral.
- Reporte final del proyecto (5-8 páginas) integrando todo el libro:
- Caso y stakeholders (cap. 1).
- Modelo PL completo y solución (cap. 2-3).
- Análisis dual y recomendaciones de recursos (cap. 3).
- Variantes discretas si aplican (cap. 4).
- Análisis de riesgo / decisiones bajo incertidumbre (cap. 5).
- Conclusiones y plan de implementación.
Criterio de éxito: este reporte sería entregable real a un cliente. Cualquier persona con formación cuantitativa básica puede leerlo, entender el problema, la solución, los riesgos y las acciones recomendadas.
Tiempo estimado total del proyecto: 4-6 semanas distribuidas en el semestre.
Definiciones nuevas: decisión bajo certeza/riesgo/incertidumbre, criterio maximax, maximin (Wald), minimax-regret (Savage), Hurwicz, valor esperado (EV), valor esperado con información perfecta (EVwPI), EVPI, árbol de decisión, nodo decisión, nodo azar, rollback / inducción hacia atrás, función de utilidad, cadena de Markov, propiedad de Markov, matriz de transición, distribución estacionaria, simulación Monte Carlo, percentil, probabilidad de pérdida.