El ecosistema
"No existe el mejor modelo. Existe el mejor modelo para tu tarea, tu bolsillo y tus datos."
Qué vas a aprender en este capítulo
En el capítulo 1 abriste la caja de un LLM. Ahora toca el mapa completo: en 2026 hay decenas de modelos, tres formas de acceder a ellos, y un vocabulario de marketing diseñado para confundirte. Después de este capítulo vas a poder:
- Nombrar las familias principales (Claude, GPT, Gemini, Llama y compañía) y qué caracteriza a cada una.
- Entender la diferencia abierto vs cerrado y por qué a veces importa muchísimo y a veces nada.
- Distinguir los tres "lugares" donde corre un modelo: app de chat, API y tu propia máquina.
- Saber qué significa que un modelo sea multimodal y qué es un agente.
- Aplicar una lista de criterios para elegir herramienta sin casarte con ninguna marca.
Y avanzás el proyecto-hilo: vas a elegir, con criterios y no por moda, la herramienta donde va a vivir tu asistente de estudio.
2.1 Las familias de modelos en 2026
💡 Intuición
Pensá en las marcas de carros. Toyota, Hyundai, Kia: todas fabrican sedanes, camionetas y carros de trabajo. Ninguna marca tiene "el mejor carro" — tiene una línea, y dentro de la línea elegís según para qué lo querés y cuánto podés gastar.
Con los LLMs pasa igual. Cada empresa grande de IA mantiene una familia de modelos: dentro de cada familia hay un modelo tope de línea (el más capaz y caro de operar), uno intermedio (el caballo de batalla) y uno liviano (rápido y barato, para tareas simples). Aprendete las familias, no los nombres puntuales: los números de versión cambian cada pocos meses, la estructura se mantiene.
📐 Fundamento
Foto del ecosistema a mediados de 2026 (los nombres exactos van a cambiar; las familias y sus posiciones, mucho menos):
| Familia | Empresa | Modelos actuales | Rasgos distintivos |
|---|---|---|---|
| Claude | Anthropic | Claude Fable 5 (el más capaz), Claude Opus 4.8, Claude Sonnet 4.6, Claude Haiku 4.5 (rápido y económico) | Fuerte en escritura, análisis de documentos largos y código; énfasis en seguridad y honestidad; Proyectos y artefactos en claude.ai |
| GPT | OpenAI | La línea GPT, con variantes grandes y mini | La familia más conocida por el público (ChatGPT); ecosistema enorme de integraciones |
| Gemini | La línea Gemini en varios tamaños | Integración con el ecosistema Google (Docs, Gmail, Android); ventanas de contexto muy grandes | |
| Llama | Meta | La línea Llama, de pesos abiertos | Cualquiera puede descargarlo y correrlo en su propia infraestructura |
| Otros abiertos | Mistral, Qwen (Alibaba), DeepSeek y más | Varios tamaños | Alternativas abiertas competitivas, algunas especializadas por idioma o por código |
Tres observaciones que valen más que cualquier tabla:
- La estructura "grande / medio / chico" se repite en todas las familias. El grande razona mejor y cuesta más operar; el chico responde más rápido y cuesta una fracción. La habilidad práctica no es saber cuál es "el mejor del mundo", sino cuál es el más chico que resuelve tu tarea.
- Las posiciones rotan. El líder de los benchmarks cambia varias veces al año. Cualquier afirmación de "X es el mejor" tiene fecha de vencimiento de meses. Por eso este capítulo te da criterios, no un ranking.
- Para el 90% de las tareas de un estudiante, cualquier modelo de primera línea sobra. Las diferencias se notan en los extremos: razonamiento muy complejo, documentos enormes, código de producción. Para explicarte la fotosíntesis, todos son excelentes.
🛠️ En la práctica
Cómo se ve esto en el mundo Claude, que vamos a usar de ejemplo recurrente en el libro:
- Claude Haiku 4.5 para lo rápido y simple: resumir un texto corto, corregir un correo, responder una duda puntual. Cuesta una fracción de los grandes y casi no lo vas a notar más lento que tu lectura.
- Claude Sonnet 4.6 como caballo de batalla: estudiar, redactar, analizar documentos, programar. El equilibrio capacidad/velocidad que vas a usar a diario.
- Claude Opus 4.8 y Claude Fable 5 para lo pesado: razonamiento de varios pasos, análisis fino de documentos largos, trabajo donde la calidad marginal importa.
La misma lógica aplica si tu app es ChatGPT o Gemini: localizá en el selector de modelos cuál es el liviano, cuál el medio y cuál el tope, y adquirí el hábito de elegir conscientemente en lugar de aceptar el que venga por defecto.
2.2 Abiertos vs cerrados
💡 Intuición
Pensá en una receta de cocina contra un plato de restaurante. El restaurante (modelo cerrado) te sirve el plato: rico, consistente, pero no te dan la receta, comés donde ellos dicen y al precio que ellos ponen. La receta publicada (modelo abierto) te la llevás a tu casa: la cocinás vos, la modificás, nadie ve qué cenaste — pero necesitás cocina, ingredientes y saber cocinar.
📐 Fundamento
Un modelo cerrado (Claude, GPT, Gemini) solo se usa a través de los servicios de la empresa: su app de chat o su API. Los parámetros — esos miles de millones de números que codifican lo aprendido — nunca salen de sus servidores.
Un modelo de pesos abiertos (Llama, Mistral, Qwen, DeepSeek) publica sus parámetros: cualquiera los descarga y los ejecuta en su propia computadora o servidor. Ojo con el matiz: "pesos abiertos" no siempre significa "open source" en sentido estricto — a veces los datos de entrenamiento son secretos y la licencia trae condiciones. Pero para efectos prácticos: lo podés correr vos.
| Criterio | Cerrados | Abiertos |
|---|---|---|
| Calidad tope | Suelen ir adelante en la frontera | Cada vez más cerca, a veces empatan |
| Facilidad de uso | Máxima: abrís la app y listo | Requiere instalar y configurar |
| Privacidad | Tus datos pasan por servidores de la empresa | Pueden no salir nunca de tu máquina |
| Costo | Suscripción o pago por uso | "Gratis" el modelo; pagás el hardware y la operación |
| Control | El proveedor puede cambiar o retirar el modelo | El archivo descargado es tuyo para siempre |
| Hardware necesario | Ninguno especial | De una laptop decente (modelos chicos) a servidores con GPU (grandes) |
¿Cuándo importa de verdad la distinción? Cuando hay datos sensibles que no pueden salir de una organización (expedientes médicos, datos financieros), cuando se necesita control total (que el modelo no cambie bajo tus pies), o cuando el volumen es tan alto que operar uno propio sale más barato. Para estudiar y para el uso personal típico, los cerrados vía app de chat son el camino simple y suficiente.
2.3 Dónde corre el modelo: chat, API o tu máquina
💡 Intuición
La energía eléctrica te llega de tres maneras posibles: enchufás un aparato a la pared (simple, para cualquiera), contratás una acometida industrial (para mover una fábrica), o ponés paneles solares en tu techo (autonomía total, pero el mantenimiento es tuyo). La electricidad es la misma; cambia el punto de acceso y quién se encarga de qué.
Un LLM se consume igual: app de chat (el enchufe de la pared), API (la acometida industrial, para conectar el modelo a programas) y local (tus paneles solares: el modelo corre en tu propia máquina).
📐 Fundamento
1. Apps de chat — claude.ai, chatgpt.com, gemini.google.com. La interfaz conversacional que ya conocés, en web, móvil y escritorio. Es la capa con más comodidades construidas encima:
- Adjuntar archivos (PDFs, imágenes, hojas de cálculo) directo a la conversación.
- Proyectos (en claude.ai): espacios que agrupan chats y mantienen documentos e instrucciones compartidas — cada chat del proyecto nace con ese contexto ya cargado. Ideal para una materia entera.
- Artefactos: cuando pedís algo con entidad propia (un documento, una tabla, una página web, un diagrama), aparece en un panel lateral editable en vez de perderse en el hilo del chat.
- Búsqueda web integrada en varios de estos productos, que mitiga el corte de conocimiento.
Para este libro, y para la mayoría de tu vida de estudiante, esta capa es suficiente. El proyecto-hilo completo se hace acá, sin una línea de código.
2. API (Application Programming Interface) — la puerta para programas. En lugar de una persona escribiendo en un chat, es código enviando peticiones: "acá va este texto, devolveme la respuesta del modelo". Así se construyen los productos que usan IA por dentro: la app que resume tus reuniones, el soporte automático de una tienda, Claude Code. Se paga por token procesado — y acá la regla de oro es la de siempre: los modelos chicos cuestan una fracción de los grandes, así que se elige el menor que resuelva la tarea. No necesitás la API para este libro; otra guía de esta serie la cubre a fondo.
3. Local — el modelo corre en tu computadora. La herramienta más popular para esto es Ollama: instalás el programa, ejecutás ollama run llama3 (o el modelo abierto que quieras) y tenés un chat funcionando sin internet y sin que ningún dato salga de tu máquina. Los límites son de hardware: una laptop común corre bien modelos chicos (que son notablemente menos capaces que los de frontera); los grandes piden GPUs caras. Es la opción para privacidad máxima, para experimentar gratis y para lugares con internet inestable.
⚠️ Trampa común
Creer que "la IA" es una sola cosa y juzgarla por una mala experiencia. El error suena así: "probé la IA en 2023 y era mala para matemática, así que no sirve". Esa persona probó un modelo, de una generación, en una interfaz — y generalizó al ecosistema entero, que además cambia cada pocos meses.
Cómo se ve lo correcto: hablar con precisión ("el modelo liviano de la app gratuita se equivocó en este problema de álgebra") y re-evaluar periódicamente. Quien dice "la IA no puede X" suele estar describiendo el pasado; en este ecosistema, las afirmaciones sobre capacidades caducan rápido — en ambos sentidos: también hay quien le atribuye capacidades que todavía no tiene.
📜 Historia
La separación abierto/cerrado tiene una historia con ironía incluida. OpenAI nació en 2015 prometiendo IA abierta (de ahí el nombre), pero al ver el poder de GPT decidió cerrar sus modelos por seguridad y negocio. El estandarte de lo abierto lo terminó tomando, contra todo pronóstico, Meta (Facebook): en 2023 publicó los pesos de Llama y desató un ecosistema mundial de modelos descargables — en parte porque a Meta le convenía comoditizar lo que sus competidores vendían. Después se sumaron laboratorios de Francia (Mistral) y China (Qwen, DeepSeek), convirtiendo lo abierto en un asunto geopolítico: ningún país quiere depender de los modelos cerrados de otro. Moraleja para tu carrera: las posiciones de las empresas en este mapa responden a estrategia, no a filosofía — leé los anuncios del sector con esa lupa.
2.4 Multimodalidad: más que texto
💡 Intuición
Los primeros LLMs eran como hablar por teléfono: solo palabras. Los modelos actuales son como estar presente: les mostrás una foto, un diagrama, un documento escaneado, y lo "ven". Eso es la multimodalidad — la capacidad de trabajar con varios tipos de información (texto, imagen, audio, código) en la misma conversación.
📐 Fundamento
¿Qué pueden recibir y producir los modelos de frontera en 2026?
| Modalidad | Entrada (el modelo la entiende) | Salida (el modelo la genera) |
|---|---|---|
| Texto | Sí, es la base | Sí |
| Imagen | Sí: fotos, diagramas, capturas, documentos escaneados | Según el producto: hay modelos y modos específicos de generación de imágenes |
| Audio | En varios productos: hablás en vez de escribir | Voz sintetizada en los modos de conversación por voz |
| Código | Sí: lo lee como texto, pero entrenado a fondo para entenderlo | Sí, y es uno de sus usos más potentes |
El truco conceptual: para el modelo, todo termina convertido en los mismos vectores internos. Una imagen se parte en parches que se proyectan al mismo espacio que los tokens de texto; por eso puede "razonar" mezclando lo que ve con lo que lee.
Usos multimodales que cambian la vida estudiantil, hoy, desde la app de chat:
- Foto de la pizarra al final de la clase → "transcribí esto y explicame el paso 3".
- Foto de un ejercicio del libro (con el diagrama incluido) → "guiame sin darme la respuesta".
- Captura de un error en pantalla → "¿qué significa y cómo lo arreglo?" (sin tipear el error completo).
- Documento escaneado o manuscrito → extraer el texto, resumirlo, traducirlo.
- Un gráfico de un paper → "¿qué muestra este gráfico, en simple?".
Limitación honesta: la visión de los modelos es buena pero no perfecta — letra manuscrita enredada, fotos borrosas y diagramas muy densos producen errores de lectura. Verificá las transcripciones de cifras importantes.
🛠️ En la práctica
Experimento multimodal de cinco minutos que te convence más que cualquier párrafo:
- Sacale una foto a una página de tus apuntes manuscritos (luz decente, sin recortar perfecto — que sea realista).
- Subila al chat con: "Transcribí esta página. Marcá con [?] cada palabra de la que no estés seguro. Después listá los conceptos que aparecen y decime cuál parece menos desarrollado en mis notas."
- Verificá la transcripción contra el original, con atención especial a números y fórmulas.
Tres cosas vas a comprobar: que la transcripción es sorprendentemente buena, que el marcado [?] te dice dónde mirar (un modelo que declara incertidumbre puntual es un modelo bien usado), y que el paso 3 — la verificación — encontró al menos un detalle que el modelo leyó mal. Las tres lecciones, en una foto.
2.5 Agentes: modelos que usan herramientas
💡 Intuición
Un chat normal es como un asesor encerrado en una cabina de vidrio: sabe muchísimo, pero solo puede hablarte. Un agente es ese mismo asesor con permiso para salir de la cabina: puede buscar en internet, abrir archivos, ejecutar código, usar una calculadora — y volver con resultados, no solo con palabras.
La diferencia práctica es enorme: al asesor de la cabina le preguntás "¿cómo ordeno estos datos?" y te explica cómo; al agente le decís "ordená estos datos" y te entrega el archivo ordenado.
📐 Fundamento
Mecánicamente, un agente es un LLM en un ciclo con herramientas:
- El modelo recibe tu objetivo.
- En lugar de (o además de) responder texto, puede emitir una llamada a herramienta: "ejecutá esta búsqueda", "corré este código", "leé este archivo".
- El sistema ejecuta la herramienta de verdad y le devuelve el resultado al modelo.
- El modelo decide el siguiente paso con esa información nueva: otra herramienta, o la respuesta final.
Ese ciclo se repite las veces necesarias. Seguís hablando con un predictor de tokens — pero ahora algunos de sus tokens hacen cosas en el mundo, y los resultados realimentan su contexto.
Agentes que ya usás o vas a usar pronto:
- Búsqueda web en el chat: el modelo decide qué buscar, lee resultados y responde citando fuentes. Es el agente más básico y el que resuelve el corte de conocimiento.
- Análisis de datos en el chat: le subís una hoja de cálculo, el modelo escribe y ejecuta código para analizarla y te muestra tablas y gráficos. Vos no ves el código si no querés.
- Claude Code: el agente de programación de Anthropic — lee un proyecto de software completo, escribe código, lo ejecuta, corrige sus propios errores. Es la categoría que más está cambiando el trabajo de los programadores.
- Agentes de computadora: modelos que operan una interfaz (clic, tipeo, navegación) para completar trámites de varios pasos. En 2026 funcionan, con supervisión.
La contracara: un agente tiene capacidad de acción, y por lo tanto sus errores también actúan. Un chat que alucina te da un texto falso; un agente confundido puede borrar el archivo equivocado o comprar el pasaje en la fecha errada. Por eso los agentes serios piden confirmación antes de acciones irreversibles — y por eso el capítulo 4 te va a insistir en supervisar.
⚠️ Trampa común
Delegar a un agente sin definir el resultado verificable. El error: "organizame los archivos" o "investigá este tema y armame el informe", y aceptar lo que vuelva. Un agente confundido no se queda quieto: ejecuta su confusión — reorganiza con un criterio que no era el tuyo, o arma un informe donde no distinguís qué salió de fuentes y qué rellenó el modelo. El chat que alucina te cuesta una lectura crítica; el agente desbocado te cuesta deshacer acciones.
Cómo se ve lo correcto: a un agente se le da (1) un objetivo con criterio de éxito verificable ("listá los archivos duplicados y proponé cuáles borrar — no borres nada"), (2) permisos mínimos para la tarea, y (3) revisión del plan antes de las acciones irreversibles. La regla nemotécnica: a un agente se le habla como a un practicante nuevo y capaz — instrucciones claras, supervisión proporcional al riesgo, y jamás "hacé lo que te parezca" con las llaves de todo.
2.6 Cómo elegir: tarea, costo y privacidad
📐 Fundamento
Los tres ejes de toda decisión de herramienta:
Eje 1 — La tarea. ¿Qué necesitás de verdad?
| Si tu tarea es... | Buscá... |
|---|---|
| Dudas rápidas, correcciones, resúmenes cortos | Cualquier modelo, incluso el liviano |
| Estudiar a fondo, redactar, analizar documentos | Un modelo medio o tope de cualquier familia de frontera |
| Trabajar una materia todo el ciclo con los mismos materiales | Una app con espacios persistentes (p. ej. Proyectos en claude.ai) |
| Información actual (noticias, precios, normativa vigente) | Un producto con búsqueda web que cite fuentes |
| Trabajar con fotos, diagramas, documentos escaneados | Un modelo multimodal (los de frontera lo son) |
| Programar en serio | Un agente de código (p. ej. Claude Code) además del chat |
Eje 2 — El costo. Las apps de chat tienen niveles gratuitos con límites de uso y modelos más livianos, y suscripciones mensuales con más capacidad. La pregunta correcta no es "¿cuál es gratis?" sino "¿cuánto vale mi tiempo?": si la herramienta te ahorra horas por semana, una suscripción puede ser de las mejores inversiones educativas disponibles. Y si no podés pagar: el nivel gratuito de cualquier app de frontera, bien usado con lo que aprendés en este libro, supera al nivel pago mal usado.
Regla transversal a la tabla: empezá simple y escalá con evidencia. El camino sano es app de chat → funciones avanzadas (Proyectos, búsqueda) → y solo si una necesidad real lo exige, API o local. Saltar directo a lo complejo "porque es lo profesional" es el equivalente a comprar el carro de carreras para aprender a manejar.
Eje 3 — La privacidad. Pregunta obligatoria antes de pegar algo en un chat: "¿estaría bien que este texto lo leyera un desconocido?". Los proveedores tienen políticas distintas sobre si tus conversaciones pueden usarse para entrenar modelos futuros — revisá la configuración de tu app, que suele permitir desactivarlo. La regla práctica (que el capítulo 4 desarrolla): datos personales sensibles, tuyos o ajenos, no entran a un chat en la nube; para eso existe la opción local con Ollama.
🛠️ En la práctica — elegí la casa de tu asistente (proyecto-hilo, parte 2)
Avancemos el proyecto. Tu asistente de estudio necesita una "casa": el lugar donde van a vivir sus instrucciones y materiales. Hacé esto hoy:
- Elegí una app de frontera que puedas usar de forma estable (claude.ai, chatgpt.com o gemini.google.com — los criterios de arriba mandan; este libro usa claude.ai en los ejemplos).
- Creá un espacio persistente para UNA materia. En claude.ai: creá un Proyecto llamado "Asistente — [tu materia]". Pegá en las instrucciones del proyecto el prompt de tutor que escribiste en el capítulo 1. Subí como documentos del proyecto: el programa de la materia, tus apuntes principales y, si existe, un parcial de años anteriores.
- Probá la diferencia. Abrí un chat dentro del proyecto y preguntá: "Según el programa de la materia, ¿qué temas entran en el próximo parcial y cuáles me conviene priorizar según mis apuntes?". Fijate que responde usando tus documentos — eso, con la app de chat, es lo más cerca que vas a estar de un modelo "entrenado en vos" sin entrenar nada: es contexto persistente, bien usado.
- Anotá en tu documento del proyecto ("Mi asistente de estudio") qué app elegiste y por qué, en dos líneas. Documentar decisiones es parte del proyecto final.
Resumen visual
Mermaid
flowchart TD
A["¿Necesito IA generativa para esta tarea?"] --> B{"¿Datos sensibles
o sin internet?"}
B -- "Sí" --> C["Modelo abierto LOCAL
(Ollama + Llama/Mistral/Qwen)"]
B -- "No" --> D{"¿Soy yo chateando
o es un programa?"}
D -- "Un programa" --> E["API
(se paga por token;
otro libro de la serie)"]
D -- "Soy yo" --> F{"¿Qué tan exigente
es la tarea?"}
F -- "Simple y rápida" --> G["Modelo liviano
(p. ej. Claude Haiku 4.5)"]
F -- "Trabajo diario" --> H["Modelo medio
(p. ej. Claude Sonnet 4.6)"]
F -- "Razonamiento pesado
o documentos enormes" --> I["Modelo tope
(p. ej. Claude Opus 4.8 / Fable 5)"]
G --> J{"¿Info actual?
→ activá búsqueda web
¿Materia recurrente?
→ usá Proyectos"}
H --> J
I --> J
| Concepto | Idea clave |
|---|---|
| Familias | Cada empresa tiene línea grande/media/chica; elegí el menor que resuelva |
| Abierto vs cerrado | Cerrado = comodidad y frontera; abierto = control, privacidad, correrlo vos |
| Chat / API / local | Enchufe de pared / acometida industrial / paneles solares |
| Multimodalidad | Fotos, audio, documentos y código en la misma conversación |
| Agentes | LLM + herramientas en un ciclo: hace, no solo dice |
| Elegir | Tarea + costo + privacidad, en ese orden de preguntas |
| Escalar | Empezá simple (chat) y subí de capa solo con necesidad demostrada |
| Re-evaluar | El mapa rota varias veces al año; tus criterios no |
Ejercicios
✏️ Ejercicio 1 — Mapa de tu app
Abrí la app de chat que más usás y respondé explorando (no de memoria): (a) ¿qué modelos ofrece el selector y cuál es el liviano, el medio y el tope? (b) ¿puede recibir imágenes? (c) ¿tiene búsqueda web y cómo se activa? (d) ¿tiene espacios persistentes tipo Proyectos? (e) ¿dónde está la configuración de privacidad sobre uso de tus datos para entrenamiento?
✅ Solución
Las respuestas dependen de tu app, pero el patrón a encontrar: (a) toda app de frontera tiene un selector con al menos un modelo rápido/económico y uno capaz (en claude.ai: Haiku 4.5 como liviano, Sonnet 4.6 como medio, Opus 4.8/Fable 5 como tope); (b) sí en todas las de frontera; (c) sí, generalmente como botón o se activa sola ante preguntas de actualidad; (d) claude.ai tiene Proyectos, otras apps tienen equivalentes; (e) en ajustes de privacidad — si no lo encontraste, buscalo en serio: es la configuración más importante de la app. Si respondiste todo sin abrir la app y le pegaste, igual valió: ahora lo verificaste, que es el hábito del capítulo 4.
✏️ Ejercicio 2 — Cerrado, abierto o local
Para cada escenario, recomendá cerrado-en-chat, abierto-local, o API, y justificá con los tres ejes (tarea, costo, privacidad): (1) una estudiante prepara su parcial de anatomía; (2) una clínica de San Miguel quiere resumir expedientes de pacientes; (3) un emprendedor quiere que su tienda en línea responda preguntas de clientes automáticamente; (4) un periodista investiga un tema sensible y no quiere dejar rastro de sus consultas.
✅ Solución
(1) Cerrado en chat: tarea de estudio estándar, sin datos sensibles, máxima comodidad — Proyectos con sus apuntes. (2) Abierto local (u opción empresarial con garantías contractuales): expedientes médicos son datos sensibilísimos que no deberían ir a un chat de consumo; un modelo en servidores propios mantiene los datos en casa. (3) API: es un programa respondiendo solo, no una persona chateando; se conecta el modelo a la tienda y se paga por uso, idealmente con un modelo chico que cuesta una fracción. (4) Abierto local con Ollama: las consultas nunca salen de su máquina y funciona sin internet. Si justificaste distinto pero usaste los tres ejes explícitamente, el ejercicio cumplió su función.
✏️ Ejercicio 3 — Chat vs agente
Clasificá cada interacción como "chat puro" (el modelo solo genera texto) o "agente" (el modelo usó herramientas), y nombrá la herramienta: (1) "Explicame la diferencia entre mitosis y meiosis" → respuesta de texto; (2) "¿Qué dice la prensa hoy sobre el nuevo hospital?" → respuesta con enlaces a noticias de esta mañana; (3) le subís ventas.xlsx y pedís "¿cuál fue el mejor mes?" → te responde con una tabla y un gráfico; (4) "escribime un poema sobre el río Grande de San Miguel" → poema.
✅ Solución
(1) Chat puro: conocimiento del entrenamiento, solo predicción de texto. (2) Agente con búsqueda web: noticias de hoy no pueden estar en sus parámetros (corte de conocimiento); buscó, leyó y citó. (3) Agente con ejecución de código: para calcular sobre tu archivo escribió y corrió código de análisis — un LLM "a pelo" no puede computar con fiabilidad sobre miles de filas. (4) Chat puro: generación creativa, cero herramientas. Pista general: si la respuesta depende de información posterior al corte, de tus archivos procesados con exactitud, o de acciones, hubo herramientas de por medio.
✏️ Ejercicio 4 — Defendé tu elección (retador)
Escribí un párrafo de 5-8 líneas defendiendo la app que elegiste para tu asistente de estudio en la parte 2 del proyecto, usando los tres ejes del capítulo. Después abrí un chat y pedile al modelo que ataque tu párrafo: "Actuá como abogado del diablo: dame los 3 mejores argumentos en contra de esta elección". ¿Algún contraargumento te hizo dudar? ¿Cambiás algo?
✅ Solución
No hay solución única — el criterio de corrección es el proceso: (1) tu defensa menciona tarea, costo y privacidad explícitamente (si solo dijiste "porque es la mejor", repetí el ejercicio); (2) los contraargumentos del modelo suelen incluir dependencia de un solo proveedor, límites del plan gratuito, y políticas de datos — todos válidos; (3) una respuesta madura no es cambiar de app ante el primer contraargumento, sino anotar mitigaciones ("activé la opción de no entrenar con mis datos", "si toco el límite del plan gratuito, roto a otra app para tareas simples"). De paso usaste al modelo como adversario intelectual — uno de sus mejores usos, que reaparece en el capítulo 5.
Para profundizar
- Documentación de Anthropic (docs.anthropic.com) — descripción oficial de la familia Claude, sus capacidades y las guías de uso de claude.ai, Proyectos y Claude Code.
- Páginas oficiales de modelos: openai.com, ai.google.dev, llama.com — para ver cómo cada empresa describe su propia familia (y entrenar tu ojo para separar marketing de capacidades).
- Ollama (ollama.com) — la herramienta estándar para correr modelos abiertos en tu máquina; la documentación de inicio se sigue en quince minutos.
- Bommasani et al. (2021), On the Opportunities and Risks of Foundation Models — el reporte de Stanford que acuñó el término "modelos de fundación"; largo, pero su introducción explica por qué unos pocos modelos base sostienen todo el ecosistema.
- Chatbot Arena (lmarena.ai) — ranking comunitario de modelos basado en comparaciones a ciegas por usuarios reales; útil para ver el estado de la competencia sin confiar en el marketing de nadie.
Definiciones nuevas: familia de modelos, modelo cerrado, modelo de pesos abiertos, app de chat, Proyecto, artefacto, API, Ollama, modelo local, multimodalidad, agente, llamada a herramienta, búsqueda web integrada.