Teoría de decisiones

"Una decisión perfecta con la información de hoy no es la misma que con la información de mañana — pero hoy es cuando hay que decidir."

Qué vas a aprender en este capítulo

Hasta acá asumimos certeza total: los costos, demandas y capacidades eran conocidos. La realidad rara vez es así. Este capítulo:

  1. Clasifica las decisiones según el nivel de incertidumbre.
  2. Aplica criterios clásicos: maximax, maximin, minimax-regret, Hurwicz.
  3. Usa valor esperado y EVPI (valor de información perfecta).
  4. Construye árboles de decisión.
  5. Introduce cadenas de Markov para sistemas que evolucionan.
  6. Cuando los modelos cerrados no alcanzan: simulación Monte Carlo.

5.1 Decisión bajo certeza, riesgo o incertidumbre

💡 Intuición

Tipo ¿Qué sabés? Ejemplo
Certeza Resultados exactos de cada acción Comprar a precio fijo
Riesgo Resultados posibles y sus probabilidades Apostar en una ruleta
Incertidumbre Resultados posibles sin probabilidades Lanzar un producto en un mercado desconocido

La transición de incertidumbre → riesgo ocurre cuando recolectás datos suficientes para estimar probabilidades. Ese es el rol clave de la estadística inferencial (capítulo 4 del otro libro): convertir lo desconocido en lo cuantificable.

El criterio "óptimo" depende del nivel: bajo certeza, optimizás directamente. Bajo riesgo, optimizás esperanza. Bajo incertidumbre, usás criterios que no requieren probabilidades.

5.2 Criterios bajo incertidumbre

📐 Fundamento

Setup: matriz de pagos V[a][s]V[a][s] donde aa es una acción y ss es un estado de la naturaleza.

Ejemplo — La pupusería evalúa 3 opciones de inversión:

Acción \ Estado Crece economía Estancada Recesión
Expandir local 100 30 -50
Nuevo producto 60 40 0
No hacer nada 0 0 0

(Ganancias en miles de USD.)

Criterio maximax (optimista)

Para cada acción, mirás su mejor resultado. Elegís la acción con el mejor de los mejores.

Mejores: Expandir 100, Nuevo 60, Nada 0. Maximax: Expandir (100).

Criterio maximin (pesimista / Wald)

Para cada acción, mirás su peor resultado. Elegís la acción con el mejor de los peores.

Peores: Expandir -50, Nuevo 0, Nada 0. Maximin: Nuevo o Nada (0).

Criterio minimax-regret (Savage)

Calculás la matriz de arrepentimiento: para cada estado, restás cada pago del mejor pago en esa columna.

Acción \ Estado Crece Estanca Recesión
Expandir 0 10 50
Nuevo 40 0 0
Nada 100 40 0

Máximo regret por acción: Expandir 50, Nuevo 40, Nada 100. Minimax-regret: Nuevo (40).

Criterio Hurwicz (mezcla)

Con un coeficiente de optimismo α[0,1]\alpha \in [0, 1]:

H(a)=αmax+(1α)minH(a) = \alpha \cdot \max + (1 - \alpha) \cdot \min

Con α=0.6\alpha = 0.6:

  • Expandir: 0.6100+0.4(50)=400.6 \cdot 100 + 0.4 \cdot (-50) = 40.
  • Nuevo: 0.660+0.40=360.6 \cdot 60 + 0.4 \cdot 0 = 36.
  • Nada: 0.

Hurwicz con α=0.6\alpha = 0.6: Expandir (40).

Distinto criterio → distinta acción. Ninguno es "el correcto". Refleja tu actitud frente al riesgo. En la vida profesional, declarálo explícitamente: "usé maximin porque la empresa no puede absorber una pérdida >> 50k".

5.3 Decisión bajo riesgo: valor esperado

📐 Fundamento

Con probabilidades p(s)p(s) para cada estado, el valor esperado de la acción aa:

EV(a)=sp(s)V[a][s]EV(a) = \sum_s p(s) \cdot V[a][s]

Elegís la acción con mayor EVEV.

Ejemplo: asumamos p(crece)=0.4p(\text{crece}) = 0.4, p(estancada)=0.4p(\text{estancada}) = 0.4, p(recesioˊn)=0.2p(\text{recesión}) = 0.2.

  • EV(Expandir)=0.4(100)+0.4(30)+0.2(50)=40+1210=42EV(\text{Expandir}) = 0.4(100) + 0.4(30) + 0.2(-50) = 40 + 12 - 10 = 42.
  • EV(Nuevo)=0.4(60)+0.4(40)+0.2(0)=24+16=40EV(\text{Nuevo}) = 0.4(60) + 0.4(40) + 0.2(0) = 24 + 16 = 40.
  • EV(Nada)=0EV(\text{Nada}) = 0.

Mejor por EV: Expandir (42).

Limitaciones del valor esperado

  • No captura aversión al riesgo. Dos acciones con mismo EV pueden tener varianzas muy distintas. Una empresa que no puede absorber pérdidas grandes prefiere baja varianza.
  • No funciona para eventos no repetibles. EV es una media a largo plazo. Para una sola decisión irreversible (vender la empresa), la "media a largo plazo" no tiene mucho sentido.

Soluciones: función de utilidad (transforma dinero en utilidad cóncava, capturando aversión al riesgo), o agregar restricciones de varianza/CVaR.

5.4 Valor de la información perfecta (EVPI)

📐 Fundamento

¿Cuánto pagarías por saber el futuro?

EV con información perfecta (EVwPI): suponé que antes de actuar, conocés el estado. Elegís la mejor acción para ese estado. EVwPI = esperanza ponderada de los mejores pagos.

EVwPI = 0.4100+0.440+0.20=560.4 \cdot 100 + 0.4 \cdot 40 + 0.2 \cdot 0 = 56.

EVPI = EVwPI − mejor EV sin información = 5642=1456 - 42 = 14.

Interpretación: vale 14kaccederaunestudiodemercadoperfectoquetedigaconcertezaqueˊestadoocurriraˊ.Sielestudiocuesta14k acceder a un estudio de mercado perfecto que te diga con certeza qué estado ocurrirá. Si el estudio cuesta 5k, conviene; si cuesta $20k, no.

EVPI es el techo máximo de lo que pagarías. La información real nunca es perfecta, así que su valor real es menor.

5.5 Árboles de decisión

📐 Fundamento

Cuando hay secuencia de decisiones (decidir, observar, decidir de nuevo), los árboles de decisión los modelan visualmente.

Convención:

  • Cuadrado ◻ = nodo de decisión (vos elegís).
  • Círculo ○ = nodo de azar (la naturaleza decide).
  • Triángulo ▷ = fin (con un pago asociado).

Algoritmo (rollback / inducción hacia atrás):

  1. Para cada nodo final: el valor es el pago.
  2. Para cada nodo azar: el valor es la suma ponderada de los valores de sus hijos.
  3. Para cada nodo decisión: el valor es el máximo de los valores de sus hijos.
  4. Subís desde las hojas hasta la raíz.

Ejemplo (compacto):

                  Cliente compra
       ┌─────── (p=0.6) → +200
       │
   ◻ Lanzar producto
       │
       └─────── No compra (p=0.4) → -50
                                          
                                          
   ◻ No lanzar                            → 0

EV(Lanzar) = 0.6(200)+0.4(50)=12020=1000.6(200) + 0.4(-50) = 120 - 20 = 100. EV(No lanzar) = 00.

Decisión: lanzar.

Para árboles más complejos, software como SilverDecisions, Lumina Analytica o un buen Excel + visualización manual.

5.6 Cadenas de Markov

📐 Fundamento

Un proceso de Markov describe un sistema que cambia entre estados S1,S2,,SnS_1, S_2, \ldots, S_n con probabilidades de transición que dependen solo del estado actual (propiedad de Markov, sin memoria).

Matriz de transición PP:

Pij=P(proˊximo=Sjahora=Si)P_{ij} = P(\text{próximo} = S_j \mid \text{ahora} = S_i)

Cada fila suma 1 (es una distribución de probabilidad).

Ejemplo: cliente de pupusería. Estados: F (fiel), O (ocasional), P (perdido).

P=(0.80.150.050.30.50.20.10.10.8)P = \begin{pmatrix} 0.8 & 0.15 & 0.05 \\ 0.3 & 0.5 & 0.2 \\ 0.1 & 0.1 & 0.8 \end{pmatrix}

Lectura: un cliente fiel sigue fiel con 0.8, se vuelve ocasional con 0.15, se pierde con 0.05.

Distribución después de nn pasos: π(n)=π(0)Pn\pi^{(n)} = \pi^{(0)} \cdot P^n.

Distribución estacionaria π\pi^: cumple π=πP\pi^ = \pi^* P. Resolviendo el sistema con la restricción πi=1\sum \pi_i^* = 1:

Para esta matriz: π(0.5,0.21,0.29)\pi^* \approx (0.5, 0.21, 0.29). Lectura: a largo plazo, sin acciones, el 50 % de clientes serán fieles, 21 % ocasionales, 29 % perdidos.

Aplicaciones:

  • Customer Lifetime Value (LTV): markov del cliente.
  • Reliability de un sistema (estados: operando, degradado, fallado).
  • Inventarios (probabilidad de stockout dado patrón de demanda).
  • PageRank (matriz de transición entre páginas web).

5.7 Cuando los modelos cerrados no alcanzan: Monte Carlo

🛠️ Aplicado

Si tu modelo tiene muchas fuentes de incertidumbre interactuando, los métodos analíticos se complican. Simulación Monte Carlo los reemplaza:

  1. Modelás cada incertidumbre como una distribución (normal, triangular, lognormal, etc.).
  2. Muestreás NN veces (típicamente 10410^4 a 10610^6).
  3. Para cada muestra, ejecutás el modelo y registrás el resultado.
  4. Analizás la distribución de resultados: media, desviación, percentiles, probabilidad de eventos malos.
import numpy as np

N = 100_000
# Modelo simple: ganancia = ingreso - costo, ambos con incertidumbre
ingreso = np.random.normal(loc=100_000, scale=15_000, size=N)
costo_unit = np.random.triangular(left=2.5, mode=3.0, right=4.0, size=N)
volumen = np.random.normal(loc=30_000, scale=5_000, size=N)
costo = costo_unit * volumen

ganancia = ingreso - costo

print(f"Media:      ${ganancia.mean():,.0f}")
print(f"Std:        ${ganancia.std():,.0f}")
print(f"Percentil 5:  ${np.percentile(ganancia, 5):,.0f}")
print(f"Prob pérdida: {(ganancia < 0).mean():.1%}")

Output típico (3 líneas que ayudan a decidir más que 20 páginas de análisis):

Media:        $13,500
Std:          $51,200
Percentil 5:  -$70,800
Prob pérdida:  37.5%

Una "ganancia esperada de 13.5k"suenabienperocon37.513.5k" suena bien — pero con 37.5 % de probabilidad de pérdida y un peor 5 % de -70k, ya no tanto.

Monte Carlo es subestimado en la enseñanza universitaria. En la industria es omnipresente para análisis de riesgo, valoración de opciones (Black-Scholes empezó así), proyectos de capital, planeación de inventarios.

5.8 Errores comunes

⚠️ Trampa común

Usar valor esperado para decisiones únicas e irreversibles. EV es la media en muchas repeticiones. Si una decisión "promedia bien" pero el único intento puede arruinarte, el promedio no te salva.

Tip: mostrá la distribución completa, no solo la media. Reportá probabilidad de pérdida, peor caso 5 %, peor caso 1 %. Para personas no técnicas, usá un gráfico de distribución acumulada — comunica mejor que números sueltos.

⚠️ Trampa común

Sobre-confianza en las probabilidades estimadas. "Asumimos p(recesioˊn)=0.2p(\text{recesión}) = 0.2." ¿De dónde sale ese 0.2? Si lo inventaste, todo tu análisis depende de un número arbitrario.

Tip: hacé análisis de sensibilidad sobre las probabilidades. Si la decisión cambia cuando pp varía de 0.15 a 0.25, tu conclusión es frágil. Si no cambia, la decisión es robusta y podés defenderla.

⚠️ Trampa común

Confundir Markov con "predicción del futuro". La cadena describe comportamiento promedio a largo plazo asumiendo que las probabilidades de transición no cambian. Si tu mercado cambia (nueva competencia, cambio cultural), la matriz misma cambia y la predicción se invalida.

Tip: los modelos Markov son útiles para steady-state y comparar políticas (¿qué cambia si subo retención de 0.8 a 0.85?), no para predecir exactamente qué pasará el próximo trimestre. Ese tipo de predicción punto-a-punto se hace mejor con modelos de series de tiempo o ML.

5.9 Resumen visual

NIVEL DE INFORMACIÓN              ENFOQUE
─────────────────────             ──────────────────────────
Certeza                  →        PL clásica (cap. 2-4)
                                  
Riesgo (probs conocidas) →        Valor esperado / utilidad
                                  Árbol de decisión
                                  Cadenas de Markov
                                  Monte Carlo
                                  
Incertidumbre            →        Maximax, maximin, minimax-regret
(sin probs)                       Hurwicz
                                  Escenarios / what-if

5.10 Ejercicios

  1. Para la matriz de pagos del cap. 5.2, aplicá Hurwicz con α=0\alpha = 0, α=0.5\alpha = 0.5, α=1\alpha = 1. ¿Para qué rango cada acción gana?
  2. Calculá EVPI para un caso de tu invención (3 acciones, 3 estados, probabilidades sumando 1).
  3. Construí un árbol de decisión secuencial: lanzar producto, observar primer mes, decidir si seguir o cancelar. Resolvé con rollback.
  4. Para la cadena de Markov del cap. 5.6, calculá π(5)\pi^{(5)} partiendo de π(0)=(1,0,0)\pi^{(0)} = (1, 0, 0) (un cliente fiel). ¿En qué estado tiene más probabilidad de estar?
  5. Implementá una simulación Monte Carlo de tu proyecto del libro. Reportá media, std, percentil 5, probabilidad de pérdida.
  6. Investigá la diferencia entre valor esperado y utilidad esperada (función de utilidad cóncava). ¿Qué decisión cambia con utilidad?

5.11 Para profundizar

5.12 Cierre del libro

Recorriste el camino completo:

  1. Fundamentos — qué es la IO, cómo modelar.
  2. PL & Simplex — la herramienta principal.
  3. Dualidad y sensibilidad — interpretar y robustecer.
  4. PE y redes — discreto y combinatorio.
  5. Decisiones bajo incertidumbre — lo realista.

Con esto podés:

Próximos pasos:

5.13 Mini-proyecto integrador — Cierre

🏗️ Proyecto final — Decisión con incertidumbre

Cierre del proyecto del libro.

Entregables (cap. 5):

  1. Agregá incertidumbre a uno o dos parámetros de tu modelo (rango plausible).
  2. Aplicá uno de los criterios bajo incertidumbre, o asigná probabilidades y calculá EV.
  3. Si aplica, construí un árbol de decisión simple para una secuencia.
  4. Corré una simulación Monte Carlo (1000+ iteraciones) y reportá:
    • Histograma del resultado.
    • Media, std, percentil 5, percentil 95.
    • Probabilidad de superar / no superar un umbral.
  5. Reporte final del proyecto (5-8 páginas) integrando todo el libro:
    • Caso y stakeholders (cap. 1).
    • Modelo PL completo y solución (cap. 2-3).
    • Análisis dual y recomendaciones de recursos (cap. 3).
    • Variantes discretas si aplican (cap. 4).
    • Análisis de riesgo / decisiones bajo incertidumbre (cap. 5).
    • Conclusiones y plan de implementación.

Criterio de éxito: este reporte sería entregable real a un cliente. Cualquier persona con formación cuantitativa básica puede leerlo, entender el problema, la solución, los riesgos y las acciones recomendadas.

Tiempo estimado total del proyecto: 4-6 semanas distribuidas en el semestre.


Definiciones nuevas: decisión bajo certeza/riesgo/incertidumbre, criterio maximax, maximin (Wald), minimax-regret (Savage), Hurwicz, valor esperado (EV), valor esperado con información perfecta (EVwPI), EVPI, árbol de decisión, nodo decisión, nodo azar, rollback / inducción hacia atrás, función de utilidad, cadena de Markov, propiedad de Markov, matriz de transición, distribución estacionaria, simulación Monte Carlo, percentil, probabilidad de pérdida.