Ética en IA y automatización
"La IA no es neutra. Es un espejo amplificado de los datos con que la entrenamos — y de las decisiones de quienes la diseñan."
Qué vas a aprender en este capítulo
La IA introduce dilemas éticos sin precedentes: decisiones automatizadas que afectan vidas, sesgo aprendido a escala, deepfakes, automatización masiva del empleo. Este capítulo profundiza en estos temas (extendiendo el cap. 5 de IA515).
4.1 La IA no es neutral
💡 Intuición
Hay un mito popular: "el algoritmo es objetivo, los datos no mienten". Falso.
Cada decisión sobre el algoritmo (qué optimizar, qué datos usar, qué umbrales) es una decisión humana con valores implícitos. Si los datos históricos reflejan injusticia, la IA la perpetúa — y la disfraza de "objetividad".
📐 Fundamento
Ejemplos famosos de sesgo algorítmico:
1. COMPAS (sistema judicial USA, 2016):
Algoritmo predicción de reincidencia criminal. ProPublica encontró:
- Personas afroamericanas tenían 2x más probabilidad de ser clasificadas erróneamente como "alto riesgo".
- Personas blancas tenían 2x más probabilidad de ser clasificadas erróneamente como "bajo riesgo".
Causa: datos de entrenamiento reflejaban arrestos históricos sesgados (más policías → más arrestos en barrios pobres → más datos de "criminalidad").
2. Amazon hiring tool (2018):
Algoritmo para filtrar CVs. Penalizaba menciones de "mujeres" (e.g., "capitana del equipo femenino"). Causa: entrenado con CVs de la última década, dominados por hombres.
Amazon canceló el proyecto. Pero el sistema funcionó internamente por años.
3. Apple Card (2019):
Steve Wozniak y otros reportaron que Apple Card daba a sus esposas 10x menos crédito a pesar de cuentas conjuntas. Causa: nadie sabe — el algoritmo era una "caja negra" incluso para Apple.
4. Facial recognition (Joy Buolamwini, 2018):
Sistemas comerciales de reconocimiento facial:
- Hombres blancos: error 0.8%.
- Mujeres negras: error 34.7%.
Causa: datasets de entrenamiento dominados por rostros blancos masculinos.
5. ChatGPT y traducción (2024):
Frases en idiomas con género neutro (turco) traducidas al inglés introducen estereotipos: "O bir doktor" (de género neutro) → "He is a doctor". "O bir hemşire" (neutro) → "She is a nurse".
Patrones comunes:
| Tipo de sesgo | Origen |
|---|---|
| Histórico | Datos reflejan discriminación pasada |
| De representación | Grupos subrepresentados en datos |
| De medición | El "label" usado es proxy imperfecto del concepto |
| De evaluación | Se mide accuracy global, no por subgrupo |
| De agregación | Modelo único para grupos heterogéneos |
4.2 Decisiones automatizadas que afectan vidas
📐 Fundamento
Áreas críticas:
| Área | Decisiones automatizadas | Impacto |
|---|---|---|
| Crédito | Aprobar/rechazar préstamo | Acceso a vivienda, educación |
| Contratación | Filtrar CVs, scoring | Empleo |
| Justicia | Bail, sentencia, libertad condicional | Libertad personal |
| Salud | Diagnóstico, triaje | Vida y muerte |
| Educación | Admisión, calificaciones | Oportunidades |
| Welfare | Determinar elegibilidad | Bienestar básico |
| Inmigración | Visa, deportación | Vida entera |
Marco para evaluar si una IA debe usarse:
-
¿Cuál es el costo de un error?
- Bajo (recomendar película) → IA OK.
- Alto (negar tratamiento médico) → muy alto el listón.
-
¿Hay supervisión humana?
- "Human in the loop": IA recomienda, humano decide.
- "Human on the loop": IA decide, humano puede revertir.
- "Human out of the loop": IA decide sin supervisión.
-
¿Se puede explicar la decisión?
- SHAP, LIME (cap. 5 de IA515).
- Modelos inherentemente interpretables vs caja negra.
-
¿Hay derecho de apelación?
- El afectado puede pedir revisión humana.
-
¿Se audita regularmente por equidad?
El "right to explanation" del GDPR:
Art. 22: ciudadanos UE tienen derecho a no ser sujetos a decisiones basadas únicamente en procesamiento automatizado que produzcan efectos legales o significativos.
→ Si rechazás un crédito por algoritmo, debe haber proceso de revisión humana.
Caso: SyRI (Países Bajos, 2014-2020):
Sistema gubernamental para detectar fraude en welfare. Después de uso por años:
- Tribunal lo declaró ilegal por violar privacidad.
- Discriminaba sistemáticamente a inmigrantes y personas pobres.
- 26,000 familias acusadas falsamente de fraude.
- Algunas perdieron custodia de hijos.
Resultado: dimisión del gobierno holandés en 2021.
4.3 Deepfakes y desinformación
📐 Fundamento
Deepfake: video/audio/imagen sintética creada con IA, indistinguible de real.
Aplicaciones legítimas:
- Doblaje de películas en otros idiomas con voz original.
- Educación: "ver" eventos históricos recreados.
- Accesibilidad: sintetizar voz de alguien que perdió la suya.
Aplicaciones maliciosas:
- Pornografía no consensuada: estimaciones 2023: 96% de deepfakes son pornografía no consensuada de mujeres reales.
- Fraude financiero: "secuestro virtual" (voz clonada del hijo pidiendo rescate). Casos reales en 2023-2024.
- Desinformación política: Zelenskyy deepfake en marzo 2022 pidiendo a tropas rendirse (rápidamente desacreditado).
- Ingeniería social: CFO de empresa transfirió $25M tras videollamada deepfake con CEO (2024).
Cómo detectarlos (cada vez más difícil):
2018: artefactos visibles, parpadeo extraño.
2022: muy buenos en cara, errores en manos/pelo.
2024: casi indistinguibles de reales.
2026: probablemente indistinguibles para humanos.
Detectores automáticos también existen (Microsoft Authenticator, Intel FakeCatcher), pero hay carrera permanente entre detección y generación.
Marco regulatorio:
- EU AI Act (2024): deepfakes deben ser etiquetados.
- California (2019): ilegal usar deepfakes en propaganda electoral 60 días antes de elecciones.
- Corea del Sur (2024): criminalización de deepfake porn no consensuada.
Ética del desarrollo de modelos generativos:
Si trabajás en una empresa de IA generativa (Stability AI, Runway, etc.):
- ¿Tu modelo puede generar contenido dañino?
- ¿Hay safeguards técnicos (watermarking, content filtering)?
- ¿Hay términos de uso claros?
- ¿Cómo respondés a abuso?
4.4 Automatización del empleo
Intuición
La pregunta no es "¿la IA va a reemplazar trabajos?" — sí lo va a hacer. Las preguntas son:
- ¿Qué trabajos?
- ¿Cuán rápido?
- ¿Qué hacemos con las personas afectadas?
📐 Fundamento
Lecciones de revoluciones tecnológicas pasadas:
| Revolución | Trabajos eliminados | Trabajos creados | Tiempo de transición |
|---|---|---|---|
| Industrial (1750+) | Artesanos | Obreros de fábrica | Décadas (con sufrimiento) |
| Mecanización agrícola | Campesinos | Industriales | Siglo XX |
| Computación (1980+) | Operadores de switchboard, secretarias, etc. | Devs, knowledge workers | 30-50 años |
| IA (2020+) | ¿Devs? ¿Diseñadores? ¿Doctores? | ¿Ingenieros de IA? ¿?? | ??? |
La diferencia con IA:
Velocidad. Las revoluciones anteriores tardaron décadas; la IA puede transformar industrias en años. Las personas no tienen tiempo de re-entrenarse.
Posiciones éticas:
Postura "tech-optimista":
- "La tecnología siempre creó más trabajos de los que eliminó."
- "La gente se reentrenará."
- "Productividad sube, todos ganan."
Crítica: ignora la transición. La gente desempleada hoy no se beneficia del crecimiento futuro. Y "los trabajos creados" requieren skills muy distintos de los eliminados.
Postura "tech-cautelosa":
- Necesitamos reconvertir activamente la fuerza laboral.
- UBI (Universal Basic Income) o variantes.
- Impuestos a la automatización para financiar transición.
- Tiempo: políticas públicas planificadas.
Postura "tech-luddita":
- Algunas automatizaciones no deberían hacerse aunque sean técnicamente posibles.
- Ej: automatizar trabajo creativo de artistas (Stable Diffusion, etc.) — destruye industrias enteras.
Como ingeniero, ¿qué considerar?
Antes de construir un sistema que automatice trabajo:
- ¿Quiénes pierden el empleo? Cuántas personas, qué demografía.
- ¿Quiénes ganan? Empresa, accionistas, consumidores.
- ¿Hay forma de aumentar productividad sin reemplazar? "AI-assisted" en lugar de "AI replacement".
- ¿La empresa tiene plan para los desplazados? Reentrenamiento, severance.
- ¿Es éticamente justificable el balance?
Caso: cajeras de supermercado vs self-checkout vs Amazon Go.
Self-checkout: mismo cajero supervisa 4-6 cajas → 4x menos empleos. Amazon Go: 0 cajeros, sensores y CV.
¿Es bueno? Depende:
- Para Amazon: $$$.
- Para clientes: más rápido (algunos prefieren).
- Para cajeras: pérdida de empleo en industria de baja calificación → impacto desproporcionado en mujeres y personas de bajos recursos.
No hay una respuesta correcta — pero las decisiones ya se tomaron sin debate público real.
4.5 Riesgos existenciales de IA
📐 Fundamento
El debate de AGI (Artificial General Intelligence):
Algunos investigadores (Yoshua Bengio, Geoffrey Hinton, Stuart Russell) advierten que IA suficientemente avanzada podría:
- Tener objetivos no alineados con humanos.
- Ser difícil de controlar una vez desplegada.
- Acumular poder/recursos para sus objetivos.
- Eventualmente ser amenaza existencial.
Otros (Yann LeCun, Andrew Ng) consideran esto exagerado: "los modelos actuales no entienden, y AGI está lejos".
Carta abierta de marzo 2023:
"Los laboratorios de IA deberían pausar inmediatamente por al menos 6 meses el entrenamiento de sistemas de IA más poderosos que GPT-4."
Firmada por 33,000 personas, incluyendo Musk, Wozniak. No se cumplió.
Argumentos:
PRO pausa:
- Riesgos no entendidos completamente.
- Carrera competitiva fuerza acelerar sin debido cuidado.
- Falta de regulación.
CONTRA pausa:
- Solo cumplirían los firmantes; otros (China) seguirían.
- Tecnología tiene beneficios masivos (medicina, ciencia).
- Los riesgos son hipotéticos.
Alignment problem:
Cómo asegurar que IA siga los valores humanos. Es técnicamente difícil:
- ¿Qué valores? (no hay consenso).
- ¿Cómo expresarlos a una máquina?
- ¿Cómo verificar que efectivamente los sigue?
Empresas (Anthropic, OpenAI, DeepMind) tienen equipos de alignment, pero el problema sigue abierto.
EU AI Act — el primer marco regulatorio:
(Cubierto en cap. 5 de IA515.)
Niveles de riesgo:
- Inaceptable: prohibido (social scoring, manipulación subliminal).
- Alto riesgo: regulado (educación, empleo, justicia).
- Riesgo limitado: transparencia (deepfakes, chatbots).
- Mínimo: libre.
Modelos foundation (GPT-4, Claude, Gemini): regulados por separado debido a su poder y aplicabilidad amplia.
🛠️ En la práctica
La Esquina Cloud — checklist ético del sistema de recomendaciones IA:
# Antes de desplegar el sistema de recomendación de platillos
## Sesgo
- [ ] ¿Tenemos datos representativos de todos los segmentos de clientes?
- [ ] ¿El sistema recomienda diferentes platillos a clientes de zonas más pobres?
- [ ] Auditoría trimestral de fairness por género, zona, edad.
## Transparencia
- [ ] El cliente puede ver POR QUÉ se le recomendó algo.
- [ ] Política clara: "Usamos tu historial para mejorar recomendaciones".
- [ ] Opción de desactivar recomendaciones personalizadas.
## Privacidad
- [ ] Mínimo dato necesario para recomendar.
- [ ] Datos de entrenamiento anonimizados.
- [ ] Derecho a eliminación cubre datos del modelo (al menos retraining mensual).
## Manipulación
- [ ] NO recomendar productos más caros sistemáticamente bajo disfraz de personalización.
- [ ] NO crear adicción artificial (notificaciones agresivas).
- [ ] NO explotar vulnerabilidades emocionales.
## Supervisión
- [ ] Recomendaciones pueden ser overridden por humanos.
- [ ] Logs de recomendaciones para auditoría.
- [ ] Métricas de "satisfaction" del cliente, no solo "engagement".
## Empleados
- [ ] No despedimos a nadie por implementar esto (es ayuda, no reemplazo).
- [ ] Mozos siguen pudiendo recomendar manualmente.
## Casos de borde
- [ ] ¿Qué pasa si el modelo recomienda un platillo agotado?
- [ ] ¿Qué pasa si recomienda algo inapropiado para un menor?
- [ ] ¿Qué pasa si recomienda algo con alérgenos del cliente?
4.6 Ejercicios
✏️ Ejercicio 4.1 — Caso de uso ético
Una startup te contrata para construir un sistema de IA que evalúe automáticamente videoentrevistas de candidatos a empleo, analizando: tono de voz, expresiones faciales, palabras usadas. Promete "objetividad y eliminar el sesgo humano".
¿Cuáles son las principales preocupaciones éticas? ¿Aceptarías el trabajo? Si sí, ¿bajo qué condiciones?
Solución
Preocupaciones éticas:
-
Sesgo en datos de entrenamiento:
- ¿De quién son los datos? Si reflejan a empleados actuales (mayoría de un perfil específico), perpetúa exclusión.
- "Datos de gente exitosa" → la IA aprende los patrones de quienes ya tuvieron suerte.
-
Reconocimiento facial es notoriamente sesgado:
- Peores resultados para mujeres y personas no-blancas.
- Personas con discapacidades o neurodivergentes pueden tener expresiones diferentes.
-
Análisis de tono y expresión es pseudo-ciencia:
- "Microexpresiones revelan personalidad" — no hay consenso científico.
- Sistema puede ser placebo elaborado, dando legitimidad a discriminación.
-
Privacidad:
- Análisis biométrico requiere consentimiento explícito (GDPR).
- ¿Se guarda el video? ¿Por cuánto?
-
Falta de explicabilidad:
- "El sistema lo rechazó" sin razones claras → no hay apelación posible.
- Viola GDPR Art. 22.
-
Cultural bias:
- Lo que es "amistoso" en una cultura es "frívolo" en otra.
- Acentos diferentes interpretados como "menos competente".
-
Reemplaza decisión humana en algo crítico:
- El empleo afecta vidas enteras.
- No es decisión menor para automatizar.
¿Aceptarías el trabajo?
Posición A — Rechazar: "El producto, aunque técnicamente posible, es éticamente problemático. La 'objetividad' que vende es ilusoria — solo oculta sesgo bajo un velo técnico. No quiero contribuir a que se discrimine a escala."
Posición B — Aceptar con condiciones: "Aceptaría solo si:
- El sistema es asistencia para humanos, no decisor (humano siempre revisa).
- Eliminamos análisis facial/tono (pseudo-ciencia).
- Solo analizamos contenido textual (qué dice el candidato, no cómo lo dice).
- Auditoría externa de fairness antes de cada release.
- Disclosure completo a candidatos + opt-out.
- Métricas de fairness publicadas trimestralmente.
- Mecanismo de apelación humano garantizado."
Si la empresa no acepta esas condiciones → rechazar.
Posición C — Aceptar e influenciar desde dentro: "Aceptar y trabajar para mitigar lo más posible los riesgos. Pero hay que ser honesto: probablemente termines siendo cómplice de algo dañino."
No hay respuesta única correcta. La importante es pensarlo conscientemente antes de decir sí.
4.7 Para profundizar
- "Weapons of Math Destruction" — Cathy O'Neil.
- "Race After Technology" — Ruha Benjamin.
- "Atlas of AI" — Kate Crawford.
- "The Alignment Problem" — Brian Christian.
- AI Now Institute — ainowinstitute.org
- Siguiente: Responsabilidad profesional.
Definiciones nuevas: sesgo algorítmico, COMPAS, decisión automatizada, right to explanation, deepfake, automatización del empleo, AGI, alignment problem, EU AI Act, modelos foundation, surveillance capitalism (extendido).