Teoría de decisiones

"Una decisión perfecta con la información de hoy no es la misma que con la información de mañana — pero hoy es cuando hay que decidir."

Qué vas a aprender en este capítulo

Hasta acá asumimos certeza total: los costos, demandas y capacidades eran conocidos. La realidad rara vez es así. Este capítulo:

Clasifica las decisiones según el nivel de incertidumbre.
Aplica criterios clásicos: maximax, maximin, minimax-regret, Hurwicz.
Usa valor esperado y EVPI (valor de información perfecta).
Construye árboles de decisión.
Introduce cadenas de Markov para sistemas que evolucionan.
Cuando los modelos cerrados no alcanzan: simulación Monte Carlo.

5.1 Decisión bajo certeza, riesgo o incertidumbre

💡 Intuición

Tipo	¿Qué sabés?	Ejemplo
Certeza	Resultados exactos de cada acción	Comprar a precio fijo
Riesgo	Resultados posibles y sus probabilidades	Apostar en una ruleta
Incertidumbre	Resultados posibles sin probabilidades	Lanzar un producto en un mercado desconocido

La transición de incertidumbre → riesgo ocurre cuando recolectás datos suficientes para estimar probabilidades. Ese es el rol clave de la estadística inferencial (capítulo 4 del otro libro): convertir lo desconocido en lo cuantificable.

El criterio "óptimo" depende del nivel: bajo certeza, optimizás directamente. Bajo riesgo, optimizás esperanza. Bajo incertidumbre, usás criterios que no requieren probabilidades.

5.2 Criterios bajo incertidumbre

📐 Fundamento

Setup: matriz de pagos $V[a][s]$ donde $a$ es una acción y $s$ es un estado de la naturaleza.

Ejemplo — La pupusería evalúa 3 opciones de inversión:

Acción \ Estado	Crece economía	Estancada	Recesión
Expandir local	100	30	-50
Nuevo producto	60	40	0
No hacer nada	0	0	0

(Ganancias en miles de USD.)

Criterio maximax (optimista)

Para cada acción, mirás su mejor resultado. Elegís la acción con el mejor de los mejores.

Mejores: Expandir 100, Nuevo 60, Nada 0. Maximax: Expandir (100).

Criterio maximin (pesimista / Wald)

Para cada acción, mirás su peor resultado. Elegís la acción con el mejor de los peores.

Peores: Expandir -50, Nuevo 0, Nada 0. Maximin: Nuevo o Nada (0).

Criterio minimax-regret (Savage)

Calculás la matriz de arrepentimiento: para cada estado, restás cada pago del mejor pago en esa columna.

Acción \ Estado	Crece	Estanca	Recesión
Expandir	0	10	50
Nuevo	40	0	0
Nada	100	40	0

Máximo regret por acción: Expandir 50, Nuevo 40, Nada 100. Minimax-regret: Nuevo (40).

Criterio Hurwicz (mezcla)

Con un coeficiente de optimismo $\alpha \in [0, 1]$ :

H(a) = \alpha \cdot \max + (1 - \alpha) \cdot \min

Con $\alpha = 0.6$ :

Expandir: $0.6 \cdot 100 + 0.4 \cdot (-50) = 40$ .
Nuevo: $0.6 \cdot 60 + 0.4 \cdot 0 = 36$ .
Nada: 0.

Hurwicz con $\alpha = 0.6$ : Expandir (40).

Distinto criterio → distinta acción. Ninguno es "el correcto". Refleja tu actitud frente al riesgo. En la vida profesional, declarálo explícitamente: "usé maximin porque la empresa no puede absorber una pérdida $>$ 50k".

5.3 Decisión bajo riesgo: valor esperado

📐 Fundamento

Con probabilidades $p(s)$ para cada estado, el valor esperado de la acción $a$ :

EV(a) = \sum_s p(s) \cdot V[a][s]

Elegís la acción con mayor $EV$ .

Ejemplo: asumamos $p(\text{crece}) = 0.4$ , $p(\text{estancada}) = 0.4$ , $p(\text{recesión}) = 0.2$ .

$EV(\text{Expandir}) = 0.4(100) + 0.4(30) + 0.2(-50) = 40 + 12 - 10 = 42$ .
$EV(\text{Nuevo}) = 0.4(60) + 0.4(40) + 0.2(0) = 24 + 16 = 40$ .
$EV(\text{Nada}) = 0$ .

Mejor por EV: Expandir (42).

Limitaciones del valor esperado

No captura aversión al riesgo. Dos acciones con mismo EV pueden tener varianzas muy distintas. Una empresa que no puede absorber pérdidas grandes prefiere baja varianza.
No funciona para eventos no repetibles. EV es una media a largo plazo. Para una sola decisión irreversible (vender la empresa), la "media a largo plazo" no tiene mucho sentido.

Soluciones: función de utilidad (transforma dinero en utilidad cóncava, capturando aversión al riesgo), o agregar restricciones de varianza/CVaR.

5.4 Valor de la información perfecta (EVPI)

📐 Fundamento

¿Cuánto pagarías por saber el futuro?

EV con información perfecta (EVwPI): suponé que antes de actuar, conocés el estado. Elegís la mejor acción para ese estado. EVwPI = esperanza ponderada de los mejores pagos.

EVwPI = $0.4 \cdot 100 + 0.4 \cdot 40 + 0.2 \cdot 0 = 56$ .

EVPI = EVwPI − mejor EV sin información = $56 - 42 = 14$ .

Interpretación: vale $14k$ acceder a un estudio de mercado perfecto que te diga con certeza qué estado ocurrirá. Si el estudio cuesta $14 k * * a cce d er a u n es t u d i o d e m er c a d o * * p er f ec t o * * q u e t e d i g a co n cer t ez a q u \overset{e}{ˊ} es t a d ooc u r r i r \overset{a}{ˊ} . S i e l es t u d i oc u es t a$ 5k, conviene; si cuesta $20k, no.

EVPI es el techo máximo de lo que pagarías. La información real nunca es perfecta, así que su valor real es menor.

5.5 Árboles de decisión

📐 Fundamento

Cuando hay secuencia de decisiones (decidir, observar, decidir de nuevo), los árboles de decisión los modelan visualmente.

Convención:

Cuadrado ◻ = nodo de decisión (vos elegís).
Círculo ○ = nodo de azar (la naturaleza decide).
Triángulo ▷ = fin (con un pago asociado).

Algoritmo (rollback / inducción hacia atrás):

Para cada nodo final: el valor es el pago.
Para cada nodo azar: el valor es la suma ponderada de los valores de sus hijos.
Para cada nodo decisión: el valor es el máximo de los valores de sus hijos.
Subís desde las hojas hasta la raíz.

Ejemplo (compacto):

                  Cliente compra
       ┌─────── (p=0.6) → +200
       │
   ◻ Lanzar producto
       │
       └─────── No compra (p=0.4) → -50
                                          
                                          
   ◻ No lanzar                            → 0

EV(Lanzar) = $0.6(200) + 0.4(-50) = 120 - 20 = 100$ . EV(No lanzar) = $0$ .

Decisión: lanzar.

Para árboles más complejos, software como SilverDecisions, Lumina Analytica o un buen Excel + visualización manual.

5.6 Cadenas de Markov

📐 Fundamento

Un proceso de Markov describe un sistema que cambia entre estados $S_1, S_2, \ldots, S_n$ con probabilidades de transición que dependen solo del estado actual (propiedad de Markov, sin memoria).

Matriz de transición $P$ :

P_{ij} = P(\text{próximo} = S_j \mid \text{ahora} = S_i)

Cada fila suma 1 (es una distribución de probabilidad).

Ejemplo: cliente de pupusería. Estados: F (fiel), O (ocasional), P (perdido).

P = \begin{pmatrix} 0.8 & 0.15 & 0.05 \\ 0.3 & 0.5 & 0.2 \\ 0.1 & 0.1 & 0.8 \end{pmatrix}

Lectura: un cliente fiel sigue fiel con 0.8, se vuelve ocasional con 0.15, se pierde con 0.05.

Distribución después de $n$ pasos: $\pi^{(n)} = \pi^{(0)} \cdot P^n$ .

Distribución estacionaria $\pi^$ : cumple $\pi^$ = \pi^* P $π^{*} = π^{*} P$ . Resolviendo el sistema con la restricción $\sum \pi_i^* = 1$ :

Para esta matriz: $\pi^* \approx (0.5, 0.21, 0.29)$ . Lectura: a largo plazo, sin acciones, el 50 % de clientes serán fieles, 21 % ocasionales, 29 % perdidos.

Aplicaciones:

Customer Lifetime Value (LTV): markov del cliente.
Reliability de un sistema (estados: operando, degradado, fallado).
Inventarios (probabilidad de stockout dado patrón de demanda).
PageRank (matriz de transición entre páginas web).

5.7 Cuando los modelos cerrados no alcanzan: Monte Carlo

🛠️ Aplicado

Si tu modelo tiene muchas fuentes de incertidumbre interactuando, los métodos analíticos se complican. Simulación Monte Carlo los reemplaza:

Modelás cada incertidumbre como una distribución (normal, triangular, lognormal, etc.).
Muestreás $N$ veces (típicamente $10^4$ a $10^6$ ).
Para cada muestra, ejecutás el modelo y registrás el resultado.
Analizás la distribución de resultados: media, desviación, percentiles, probabilidad de eventos malos.

import numpy as np

N = 100_000
# Modelo simple: ganancia = ingreso - costo, ambos con incertidumbre
ingreso = np.random.normal(loc=100_000, scale=15_000, size=N)
costo_unit = np.random.triangular(left=2.5, mode=3.0, right=4.0, size=N)
volumen = np.random.normal(loc=30_000, scale=5_000, size=N)
costo = costo_unit * volumen

ganancia = ingreso - costo

print(f"Media:      ${ganancia.mean():,.0f}")
print(f"Std:        ${ganancia.std():,.0f}")
print(f"Percentil 5:  ${np.percentile(ganancia, 5):,.0f}")
print(f"Prob pérdida: {(ganancia < 0).mean():.1%}")

Output típico (3 líneas que ayudan a decidir más que 20 páginas de análisis):

Media:        $13,500
Std:          $51,200
Percentil 5:  -$70,800
Prob pérdida:  37.5%

Una "ganancia esperada de $13.5k" suena bien — pero con$ -70k, ya no tanto.

Monte Carlo es subestimado en la enseñanza universitaria. En la industria es omnipresente para análisis de riesgo, valoración de opciones (Black-Scholes empezó así), proyectos de capital, planeación de inventarios.

5.8 Errores comunes

⚠️ Trampa común

Usar valor esperado para decisiones únicas e irreversibles. EV es la media en muchas repeticiones. Si una decisión "promedia bien" pero el único intento puede arruinarte, el promedio no te salva.

Tip: mostrá la distribución completa, no solo la media. Reportá probabilidad de pérdida, peor caso 5 %, peor caso 1 %. Para personas no técnicas, usá un gráfico de distribución acumulada — comunica mejor que números sueltos.

⚠️ Trampa común

Sobre-confianza en las probabilidades estimadas. "Asumimos $p(\text{recesión}) = 0.2$ ." ¿De dónde sale ese 0.2? Si lo inventaste, todo tu análisis depende de un número arbitrario.

Tip: hacé análisis de sensibilidad sobre las probabilidades. Si la decisión cambia cuando $p$ varía de 0.15 a 0.25, tu conclusión es frágil. Si no cambia, la decisión es robusta y podés defenderla.

⚠️ Trampa común

Confundir Markov con "predicción del futuro". La cadena describe comportamiento promedio a largo plazo asumiendo que las probabilidades de transición no cambian. Si tu mercado cambia (nueva competencia, cambio cultural), la matriz misma cambia y la predicción se invalida.

Tip: los modelos Markov son útiles para steady-state y comparar políticas (¿qué cambia si subo retención de 0.8 a 0.85?), no para predecir exactamente qué pasará el próximo trimestre. Ese tipo de predicción punto-a-punto se hace mejor con modelos de series de tiempo o ML.

5.9 Resumen visual

NIVEL DE INFORMACIÓN              ENFOQUE
─────────────────────             ──────────────────────────
Certeza                  →        PL clásica (cap. 2-4)
                                  
Riesgo (probs conocidas) →        Valor esperado / utilidad
                                  Árbol de decisión
                                  Cadenas de Markov
                                  Monte Carlo
                                  
Incertidumbre            →        Maximax, maximin, minimax-regret
(sin probs)                       Hurwicz
                                  Escenarios / what-if

5.10 Ejercicios

Para la matriz de pagos del cap. 5.2, aplicá Hurwicz con $\alpha = 0$ , $\alpha = 0.5$ , $\alpha = 1$ . ¿Para qué rango cada acción gana?
Calculá EVPI para un caso de tu invención (3 acciones, 3 estados, probabilidades sumando 1).
Construí un árbol de decisión secuencial: lanzar producto, observar primer mes, decidir si seguir o cancelar. Resolvé con rollback.
Para la cadena de Markov del cap. 5.6, calculá $\pi^{(5)}$ partiendo de $\pi^{(0)} = (1, 0, 0)$ (un cliente fiel). ¿En qué estado tiene más probabilidad de estar?
Implementá una simulación Monte Carlo de tu proyecto del libro. Reportá media, std, percentil 5, probabilidad de pérdida.
Investigá la diferencia entre valor esperado y utilidad esperada (función de utilidad cóncava). ¿Qué decisión cambia con utilidad?

5.11 Para profundizar

Render, Stair & Hanna, Quantitative Analysis for Management — capítulos de decisiones y Markov, orientado a negocios.
Howard, Decision Analysis — referencia académica.
Ross, Introduction to Probability Models — Markov en profundidad.
Vose, Risk Analysis — Monte Carlo aplicado.

5.12 Cierre del libro

Recorriste el camino completo:

Fundamentos — qué es la IO, cómo modelar.
PL & Simplex — la herramienta principal.
Dualidad y sensibilidad — interpretar y robustecer.
PE y redes — discreto y combinatorio.
Decisiones bajo incertidumbre — lo realista.

Con esto podés:

Modelar problemas operativos en notación matemática.
Resolverlos en Excel, Python (PuLP, scipy), o software comercial.
Comunicar las recomendaciones con precios sombra, escenarios y riesgo.
Reconocer cuándo IO no es la herramienta correcta (problemas que no son cuantificables o donde la decisión es política).

Próximos pasos:

Optimización no-lineal (gradient descent, programación cuadrática).
Optimización estocástica (escenarios, recourse, robusta).
Optimización combinatoria avanzada (TSP, vehicle routing).
Decision under deep uncertainty (multi-criterio, exploración de escenarios).
Operations research + machine learning (campo emergente: usar ML para acelerar B&B, RL para políticas).

5.13 Mini-proyecto integrador — Cierre

🏗️ Proyecto final — Decisión con incertidumbre

Cierre del proyecto del libro.

Entregables (cap. 5):

Agregá incertidumbre a uno o dos parámetros de tu modelo (rango plausible).
Aplicá uno de los criterios bajo incertidumbre, o asigná probabilidades y calculá EV.
Si aplica, construí un árbol de decisión simple para una secuencia.
Corré una simulación Monte Carlo (1000+ iteraciones) y reportá:
- Histograma del resultado.
- Media, std, percentil 5, percentil 95.
- Probabilidad de superar / no superar un umbral.
Reporte final del proyecto (5-8 páginas) integrando todo el libro:
- Caso y stakeholders (cap. 1).
- Modelo PL completo y solución (cap. 2-3).
- Análisis dual y recomendaciones de recursos (cap. 3).
- Variantes discretas si aplican (cap. 4).
- Análisis de riesgo / decisiones bajo incertidumbre (cap. 5).
- Conclusiones y plan de implementación.

Criterio de éxito: este reporte sería entregable real a un cliente. Cualquier persona con formación cuantitativa básica puede leerlo, entender el problema, la solución, los riesgos y las acciones recomendadas.

Tiempo estimado total del proyecto: 4-6 semanas distribuidas en el semestre.

Definiciones nuevas: decisión bajo certeza/riesgo/incertidumbre, criterio maximax, maximin (Wald), minimax-regret (Savage), Hurwicz, valor esperado (EV), valor esperado con información perfecta (EVwPI), EVPI, árbol de decisión, nodo decisión, nodo azar, rollback / inducción hacia atrás, función de utilidad, cadena de Markov, propiedad de Markov, matriz de transición, distribución estacionaria, simulación Monte Carlo, percentil, probabilidad de pérdida.

← Anterior Programación entera y problemas de redes

Reportar error en este capítulo · Patrocinar este libro