Glosario — IA Generativa en la Práctica

A

Agente. LLM con capacidad de usar herramientas (búsqueda web, ejecución de código, navegación) en un ciclo: decide una acción, recibe el resultado, decide la siguiente. A diferencia del chat puro, hace cosas además de decirlas — y por eso sus errores también actúan.

Alucinación. Salida del modelo que es plausible pero falsa: datos, citas o hechos inventados con total fluidez. No es un fallo raro sino consecuencia directa del mecanismo de predicción: cuando no hay patrón fuerte que recuperar, el modelo rellena con lo que suena correcto. Máximo riesgo: datos puntuales, locales, recientes y bibliografía.

API (Application Programming Interface). Puerta de acceso a un modelo para programas en lugar de personas: código que envía texto y recibe la respuesta. Es como se construyen los productos que usan IA por dentro. Se factura por token.

Artefacto. En claude.ai, contenido con entidad propia (documento, tabla, mini-aplicación, diagrama) que el modelo genera en un panel lateral editable, separado del hilo del chat.

B

Búsqueda web (en el chat). Herramienta de agente que permite al modelo buscar información actual y citar fuentes con enlace. Mitiga el corte de conocimiento; los enlaces citados deben abrirse y comprobarse.

C

Chain-of-thought (cadena de razonamiento). Técnica de prompt que pide al modelo razonar paso a paso antes de concluir. Suele mejorar la precisión en problemas de varios pasos y da algo auditable — aunque la explicación es una reconstrucción plausible, no una ventana garantizada al proceso interno.

Claude. Familia de modelos de Anthropic. En 2026: Claude Fable 5 (el más capaz), Claude Opus 4.8, Claude Sonnet 4.6 y Claude Haiku 4.5 (rápido y económico). Se usa vía claude.ai, Claude Code y la API de Anthropic.

Corte de conocimiento (knowledge cutoff). Fecha en que terminaron los datos de entrenamiento de un modelo: no sabe nada posterior. Síntoma típico: hablar en presente de cosas que ya cambiaron. Mitigación: búsqueda web o fuentes directas para todo lo que cambia con el tiempo.

D

Declaración de uso de IA. Nota en un trabajo académico o profesional que especifica qué herramienta se usó, para qué pasos, qué quedó a cargo del autor y qué se verificó. La especificidad es lo que la hace creíble.

E

Entrenamiento (training). Fase en que el modelo ajustó sus parámetros prediciendo tokens sobre cantidades masivas de texto. Ocurrió una vez, costó millones, y terminó en el corte de conocimiento. El usuario nunca participa de ella.

F

Fine-tuning (ajuste fino). Entrenamiento adicional de un modelo ya pre-entrenado sobre datos específicos — típicamente conversaciones ejemplares que le enseñan el formato de asistente útil. Da rol y forma, no conocimiento masivo nuevo.

G

Generación autorregresiva. Mecanismo por el cual el modelo produce texto: predice un token, lo agrega al contexto, y predice el siguiente condicionado por todo lo anterior, hasta terminar la respuesta.

I

Inferencia (inference). Lo que ocurre cada vez que el modelo responde: genera texto con sus parámetros congelados. No aprende nada de la conversación; toda "memoria" es la ventana de contexto.

Inyección de prompts (prompt injection). Ataque donde un texto procesado por el modelo (un PDF, una página web, un CV) contiene instrucciones escondidas que el modelo puede obedecer, porque datos y órdenes comparten el mismo canal: la ventana de contexto. Riesgo mayor en agentes, que pueden actuar.

L

LLM (Large Language Model). Modelo grande de lenguaje: red neuronal (arquitectura transformer) entrenada para predecir el siguiente token sobre cantidades masivas de texto. Base de toda la IA generativa de texto actual.

Lost in the middle. Degradación de la atención del modelo sobre el contenido ubicado en el medio de un contexto muy largo: lo del inicio y el final pesa más. Razón práctica para chats cortos y enfocados.

M

Modelo abierto (de pesos abiertos). Modelo cuyos parámetros se publican y cualquiera puede descargar y ejecutar (Llama, Mistral, Qwen, DeepSeek). Ventajas: privacidad, control, correr local. No siempre es "open source" estricto.

Modelo cerrado. Modelo accesible solo a través de los servicios del proveedor (Claude, GPT, Gemini); los parámetros nunca salen de sus servidores. Ventaja: comodidad y frontera de capacidad.

Multimodalidad. Capacidad de un modelo de trabajar con varios tipos de información — texto, imagen, audio, código — en la misma conversación. Permite, por ejemplo, fotografiar una pizarra y pedir explicación.

O

Ollama. Herramienta estándar para descargar y ejecutar modelos abiertos en una computadora propia. El chat funciona sin internet y los datos no salen de la máquina.

P

Parámetros. Los miles de millones de números internos de un modelo, ajustados durante el entrenamiento, que codifican todo lo que "sabe". En inferencia están congelados.

Prompt. El texto de entrada que condiciona la generación del modelo. Componentes de un prompt de trabajo: rol, contexto, tarea, formato y restricciones. Su especificidad es el techo de la calidad de la respuesta.

Proyecto (en claude.ai). Espacio persistente que agrupa chats y mantiene documentos e instrucciones compartidas; cada chat del proyecto nace con ese contexto cargado. Ideal para una materia.

Práctica de recuperación (retrieval practice). Hallazgo central de la ciencia del aprendizaje: el esfuerzo de intentar recordar/resolver fija conocimiento mucho más que releer o resumir. Fundamento del uso de IA como examinador en lugar de resumidor.

R

RLHF (Reinforcement Learning from Human Feedback). Etapa de entrenamiento donde evaluadores humanos comparan respuestas del modelo y se ajusta el modelo hacia las preferidas. Produce el comportamiento de asistente (útil, seguro, agradable) — y como efecto secundario, el sesgo de complacencia.

S

Sesgo (en LLMs). Desviación sistemática heredada de los datos de entrenamiento o del RLHF: sobrerrepresentación de ciertas culturas e idiomas, estereotipos, y tendencia a confirmar lo que la pregunta presupone.

Sesgo de complacencia (sycophancy). Tendencia entrenada del modelo a dar la razón, suavizar críticas y validar el framing del usuario. Mitigación: preguntas neutras y pedir explícitamente crítica o contraargumentos.

System prompt. Instrucción persistente e invisible que la aplicación antepone a la conversación y define rol y reglas del asistente. Ocupa parte de la ventana de contexto.

T

Temperatura. Parámetro que controla la aleatoriedad del muestreo: baja produce respuestas conservadoras y repetibles; alta, más variadas y arriesgadas.

Token. Unidad mínima de texto del modelo: una palabra, fragmento de palabra o signo. En español, 1 palabra ≈ 1.3 tokens. La ventana de contexto y la facturación de las APIs se miden en tokens.

Tokenización. Proceso de partir texto en tokens según un vocabulario aprendido del corpus de entrenamiento — mayormente inglés, por lo que otros idiomas consumen más tokens por idea.

Triangulación. Paso 1 del protocolo de verificación: confirmar una afirmación del modelo contra al menos una fuente independiente de él (documento original, sitio oficial, libro). Repreguntarle al mismo modelo no es triangular.

V

Ventana de contexto (context window). Cantidad máxima de tokens que el modelo puede "tener presente" a la vez: la conversación, los documentos y las instrucciones. Es la memoria de trabajo, finita y por chat; lo que queda fuera no existe para el modelo.

Verificación por muestreo. Revisar una muestra aleatoria de una salida voluminosa (filas de una tabla extraída, mensajes generados en serie) contra la fuente, antes de confiar en el conjunto.

Z

Zero-shot / few-shot. Pedir una tarea sin ejemplos (zero-shot) o incluyendo 1-5 ejemplos de entrada→salida en el prompt (few-shot). Los ejemplos mejoran la consistencia en tareas estructuradas.

Reportar error en este capítulo · Patrocinar este libro