¿Es esto un problema para un agente? Un curso acelerado
3 compuertas · 3 giros equivocados · un camino claro
Dos personas llevan una pequeña tienda en línea. Un lunes, ambas reciben el mismo encargo: se ha acumulado un montón de 400 mensajes de clientes, y deben clasificarlos en grupos (quejas, preguntas, pedidos, otros) y escribir un resumen breve para el viernes.
Ana se detiene y piensa durante diez minutos antes de abrir cualquier herramienta. Se hace tres preguntas sencillas. Primera: ¿es esto siquiera un trabajo para la IA, o podrían hacerlo la búsqueda y los filtros de la propia app de mensajes? Los grupos necesitan criterio (decidir qué cuenta como una "queja" no es algo que pueda hacer un filtro simple), así que sí, es un trabajo para la IA. Segunda: ¿lo hará una vez, o cada semana? Cada semana. Así que anota que más adelante construirá algo que lo haga por sí solo, y por ahora hace una versión rápida a mano para llegar al viernes. Tercera: ¿cómo debería verse el trabajo terminado? Una hoja de cálculo con una fila por mensaje, más un resumen de una página. Abre la herramienta de IA sabiendo ya exactamente qué quiere.
Yusuf abre la herramienta de IA de inmediato y escribe "ayúdame con estos mensajes de clientes". La herramienta le pregunta qué quiere. No está seguro, así que lo va improvisando sobre la marcha. Dos horas después tiene un resumen del que no está seguro de poder fiarse, ninguna forma de repetir el trabajo la próxima semana y el mismo montón esperándolo otra vez el lunes siguiente, que volverá a clasificar a mano.
Mismo encargo. Misma herramienta. Ana pasó el trabajo por tres compuertas antes de escribir nada. Yusuf entró directo a la herramienta y dejó que ella hiciera las preguntas. Este curso enseña esas tres compuertas.
Para quién es esto
Cualquiera que tenga una de estas herramientas de IA (Claude Code, OpenCode, Cowork u OpenWork) y un montón de trabajo real, y que no siempre tenga claro si la herramienta es el lugar adecuado para ponerlo. Este curso está en medio: después de que hayas conocido estas herramientas y visto lo que pueden hacer, pero antes de que aprendas a resolver problemas reales con ellas. Trata de decidir qué darle a la herramienta y a dónde debe ir el trabajo.
Este libro se lee en todo el mundo, por personas que trabajan y estudian en muchos idiomas distintos. Los ejemplos de esta página usan un lenguaje sencillo y situaciones cotidianas (una tienda pequeña, una carpeta de archivos, un montón de mensajes) que significan lo mismo vivas donde vivas. No necesitas conocer las herramientas, las leyes ni la moneda de ningún país en particular para seguir el hilo.
Un agente general es una herramienta de IA que no solo habla: hace cosas. Puede abrir tus archivos, leerlos, escribir otros nuevos, ejecutar pequeños programas y usar otras apps por ti. Los cuatro agentes generales de este libro son Claude Code, OpenCode, Cowork y OpenWork: Claude Code y OpenCode son para personas que trabajan con código, mientras que Cowork y OpenWork son para todos los demás. La forma corta de recordarlo: un chatbot responde tu pregunta; un agente va y hace la tarea. Esa única diferencia es la base de todo este curso.
Dos cosas antes de esta página. Primero, termina Cómo pensar en la era de la IA: te enseña a conservar tu propio criterio cuando trabajas con IA. Este curso no repite eso. Segundo, termina al menos un curso de herramientas, Claude Code y OpenCode o Cowork y OpenWork, para que hayas visto lo que un agente puede hacer. No puedes decidir "¿es esto un problema para un agente?" hasta que sepas qué es un agente.
📚 Material de apoyo
Ver la presentación completa: ¿Es esto un problema para un agente? Un curso acelerado
La regla en una línea
El error más barato de corregir es el que detectas antes de empezar.
Esto es lo que significa. Un error en tu plan no cuesta nada de corregir: solo cambias de idea. Un error que notas solo después de que el agente pasó una hora haciendo lo equivocado te cuesta esa hora entera. Así que el lugar más inteligente para invertir tu esfuerzo es justo al principio, antes de escribir nada.
Casi todo lo que sale mal con un agente salió mal aquí, al principio:
- Usaste un agente para algo que una hoja de cálculo hace en un solo paso.
- Hiciste la misma tarea a mano cada semana durante dos meses, cuando podrías haber construido algo que la hiciera por ti.
- Abriste el agente con una idea difusa de lo que querías, así que hizo un trabajo pulcro sobre lo equivocado.
Ninguno de esos casos lo causa escribir mal. Los causa empezar en el lugar equivocado. Por más ingeniosa que sea la redacción, no los arregla, porque una respuesta perfecta a la pregunta equivocada sigue siendo equivocada. Este curso te da tres comprobaciones, que llamamos compuertas, por las que pasar tu trabajo antes de empezar. Cada compuerta detiene un error común.
Tres compuertas, y a dónde te envía cada respuesta. La mayor parte del tiempo perdido viene de saltar directo al final.
Las tres compuertas, en orden:
| Compuerta | La pregunta | El error que detiene |
|---|---|---|
| 1 | ¿Esto necesita siquiera un agente? | Usar una herramienta grande para un trabajo diminuto, o una herramienta diminuta para uno grande |
| 2 | ¿Una vez, o cada semana? | Construir un ayudante para un trabajo único, o hacer por siempre a mano un trabajo que se repite |
| 3 | ¿Cómo se ve lo "terminado"? | Trabajo pulcro dirigido al objetivo equivocado |
Tómalas en orden. La Compuerta 2 solo importa una vez que la Compuerta 1 dice "sí, un agente". La Compuerta 3 solo importa una vez que la Compuerta 2 dice "hazlo ahora". Salta una compuerta y cometes su error.
Cómo leer esta página
| El tiempo que tienes | Qué leer |
|---|---|
| 15 minutos | La regla, la imagen de arriba y el breve resumen bajo cada compuerta. Suficiente para clasificar tu próxima tarea. |
| 45 minutos | Las tres compuertas con los ejemplos, solo lectura. |
| Un día de trabajo (lo mejor) | Todo, probando cada "tu turno" en una tarea real de tu propia semana. |
Estas compuertas se fijan cuando las pruebas en tu propio trabajo. Leer te muestra los movimientos. Hacerlas en tres tareas reales es como se convierten en un hábito.
La versión corta (tres viñetas)
Si recuerdas solo estas tres, tienes casi todo lo que importa:
- No todo trabajo es un trabajo para la IA, y no todo trabajo para la IA necesita un agente. Si lo resuelve una hoja de cálculo, un buscador o treinta segundos de tu propio tiempo, hazlo así. Si solo necesitas una respuesta, eso es un chatbot. Un agente es para trabajo difuso, repartido entre distintos tipos de archivos, que necesita que la herramienta haga algo de verdad con tus archivos, datos o apps, no solo que hable de ellos.
- Con qué frecuencia lo haces lo decide todo. Una tarea que haces una vez → abre un agente, resuélvela, listo. Una tarea que haces cada semana, de la misma forma → deja de hacerla a mano y construye un ayudante que la haga por ti. El desperdicio más común del mundo es hacer a mano, una y otra vez, una tarea del tipo "construir un ayudante".
- Decide cómo se ve lo "terminado" antes de abrir el agente. Nombra tres cosas: con qué trabaja, qué quieres al final y la única comprobación que te dice que está correcto. Un agente con un objetivo claro lo acierta. Un agente con un objetivo difuso hace algo pulcro y equivocado.
El resto de la página convierte estas tres en compuertas que puedes ejecutar de verdad.
Compuerta 1: ¿esto necesita siquiera un agente?
El error que detiene: "Pasé veinte minutos logrando que un agente hiciera algo que una hoja de cálculo hace en un solo paso, o abrí todo un agente solo para responder una pregunta que un chatbot responde en cinco segundos."
Esta compuerta tiene dos pequeñas comprobaciones, en orden.
Comprobación 1a: ¿necesita IA, o una herramienta normal que ya tienes?
Los agentes son buenos para el trabajo difuso: trabajo que necesita criterio, que mezcla distintos tipos de archivos y que ninguna app normal fue diseñada para hacer. No son la mejor opción para trabajo que una herramienta normal ya hace a la perfección.
Aquí está la prueba sencilla. Si puedes describir la tarea como un paso exacto que es el mismo cada vez, una herramienta normal es probablemente más rápida y más confiable:
- "Suma esta columna de números." → Eso es una hoja de cálculo. No es IA.
- "Encuentra a todos mis contactos que se apellidan Khan." → Eso es el buscador de tu app de contactos. No es IA.
- "Cambia cada '2024' por '2025' en este documento." → Eso es buscar y reemplazar. No es IA.
En el momento en que la tarea necesita criterio (como "clasifica estos mensajes por tema", donde tienes que decidir qué significa cada tema), o mezcla distintos tipos de archivos que ninguna app por sí sola puede abrir juntos (fotos y PDF y capturas de pantalla), o sencillamente no hay app que lo haga, entonces ya superaste la Comprobación 1a. Es un trabajo para la IA.
Comprobación 1b: ¿necesita un agente, o solo un chatbot?
Esta es la comprobación que la gente se salta con más frecuencia. Recuerda la regla del recuadro recordatorio: un chatbot responde, un agente hace.
Así que pregunta: ¿esta tarea necesita que la herramienta toque mis cosas reales?
- "Explica la diferencia entre un débito y un crédito." → Esto necesita una respuesta. No toca nada tuyo. Es un trabajo para un chatbot. La habilidad para obtener buenas respuestas de un chatbot está en Cómo pensar en la era de la IA, no en este curso.
- "Revisa mis 400 mensajes de clientes y pon cada uno en un grupo." → Esto necesita que la herramienta abra tus archivos reales y actúe sobre ellos. Es un trabajo para un agente.
Toda la diferencia es respuesta frente a acción. Si solo necesitas saber algo, o quieres un borrador o algunas ideas, eso es trabajo de respuesta: un chatbot. Si necesitas que la herramienta abra tus archivos, los cambie, ejecute algo o use otra app por ti, eso es trabajo de acción: un agente.
Dos preguntas pequeñas, tres salidas. Solo la de abajo es un agente.
Primero un ejemplo cotidiano
Piensa en cocinar. "¿Cuánto tiempo hiervo un huevo?" es una respuesta: preguntas, obtienes un número, listo. Eso es un chatbot. Pero "mira en mi refrigerador, ve qué tengo y hazme una lista de compras para tres cenas de esta semana" necesita que alguien vaya de verdad y haga varias cosas. Ese es el tipo de tarea para la que sirve un agente. Y "suma los precios de mi recibo del supermercado" no es ninguna de las dos: eso es solo una calculadora.
Un ejemplo de trabajo
Mei ayuda a llevar la oficina de una empresa pequeña. Cuatro encargos llegan la misma mañana. Pasa cada uno por la Compuerta 1:
- "¿Cuál es el total de esta lista de gastos?" → Una hoja de cálculo lo suma. Ni siquiera es IA. Se detiene en 1a.
- "Explica qué es una orden de compra." → Solo necesita una respuesta; no toca nada suyo. Chatbot. Se detiene en 1b.
- "Revisa esta carpeta de facturas y encuentra las que les falta una firma." → Esto necesita criterio (leer cada una) y actúa sobre sus archivos. Agente. Pasa la Compuerta 1.
- "Compara la lista de pagos del banco con nuestra propia lista y dime qué no coincide." → Dos archivos distintos, necesita criterio, actúa sobre sus datos. Agente. Pasa la Compuerta 1.
Dos de sus cuatro "tareas de IA" no eran tareas para un agente en absoluto. Eso es normal y bueno. La Compuerta 1 no está para empujar trabajo hacia el agente. Está para evitar que llegue allí el trabajo que no le corresponde.
Tu turno
Toma cinco tareas de tu propia semana, cualquier cosa que hayas pensado en "pedirle a la IA" que hiciera. Para cada una, escribe qué salida toma: herramienta normal, chatbot o agente. Luego escribe una oración breve que diga por qué.
Enumera tus cinco tareas abajo. El evaluador califica tu clasificación y marca la tarea que con más probabilidad te salió mal, en especial cualquier tarea enviada a "agente" que en realidad solo necesita una respuesta.
Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.
Si las cinco salen como "agente", probablemente lo estás forzando: vuelve a mirar y encuentra la que en realidad es una hoja de cálculo o un chatbot. Si ninguna sale como "agente", eso también es un hallazgo real. Quizá esta semana sencillamente no tuvo trabajo con forma de agente. Está bien.
Por qué funciona (la investigación detrás) — opcional
El instinto de recurrir a una herramienta favorita para cada trabajo tiene nombre. Abraham Kaplan lo llamó la ley del instrumento en 1964, y Abraham Maslow le dio su forma famosa dos años después: si la única herramienta que tienes es un martillo, todo problema empieza a parecer un clavo. Un agente es una herramienta potente y emocionante, así que se convierte en el nuevo martillo, y la Compuerta 1 es el hábito que evita que lo descargues sobre un tornillo.
También hay una versión más medida de la misma idea. El modelo de ajuste entre tarea y tecnología (Task-Technology Fit) de Goodhue y Thompson (1995) se preguntó por qué cierto software de verdad mejora el trabajo de las personas mientras que otro no, y descubrió que la ganancia depende menos de lo bueno o popular que sea una herramienta que de si encaja con la tarea. Una herramienta muy apreciada usada en la tarea equivocada aporta poco; una herramienta más simple que encaja aporta mucho. La Compuerta 1 es el ajuste entre tarea y tecnología reducido a dos preguntas que puedes responder en diez segundos.
Fuentes: Kaplan, A. (1964). The Conduct of Inquiry. Maslow, A. (1966). The Psychology of Science. Goodhue, D. L., & Thompson, R. L. (1995). "Task-Technology Fit and Individual Performance," MIS Quarterly, 19(2), 213-236.
Compuerta 2: ¿una vez, o cada semana?
El error que detiene: "Construí todo un ayudante permanente para algo que haré exactamente una vez, o, mucho más a menudo, hice la misma tarea a mano cada semana durante meses, y nunca noté que podría haber construido un ayudante que la hiciera por mí."
Una vez que la Compuerta 1 dice "sí, un agente", la siguiente pregunta es qué tipo de trabajo para agente es este. Esta es la idea más importante de todo el libro, así que les damos nombre a los dos tipos.
- Modo 1: resuélvelo una vez. Abres un agente, haces la tarea, tomas el resultado y te vas. Nada queda atrás. Esto es la mayor parte del trabajo, la mayor parte del tiempo.
- Modo 2: construye un ayudante. Construyes un trabajador de IA permanente que hace la tarea una y otra vez, por sí solo, sin que tú la hagas cada vez. (El libro llama a este trabajador un Digital FTE, un "empleado digital a tiempo completo".) Esto requiere más esfuerzo de preparación, y solo vale la pena si la tarea vuelve a menudo.
¿Cómo distingues cuál tienes delante? Comprueba tres cosas. Imagina cada una como una perilla que puedes subir o bajar. Una tarea es de Modo 2 solo cuando las tres perillas están subidas:
- ¿Con qué frecuencia? ¿Haces esto una vez o rara vez (perilla abajo → Modo 1), o una y otra vez, cada semana o cada día (perilla arriba → Modo 2)?
- ¿Qué tan igual? ¿Tiene la misma forma cada vez (mismo tipo de entrada, mismos pasos, mismo resultado terminado; perilla arriba → Modo 2)? ¿O cada vez se ve distinta y necesita pensar de nuevo (perilla abajo → Modo 1)?
- ¿Vale la pena? ¿El trabajo es lo bastante grande como para compensar el esfuerzo de construir un ayudante (perilla arriba → Modo 2)? Pesa más que la frecuencia con que ocurre: cuánto tiempo te cuesta cada ejecución, cuántos elementos maneja, qué tan caro sería un error y la molestia de dejar otro trabajo para hacerlo. Una tarea que repites cada semana pero que toma cuatro minutos, maneja dos elementos y no causa daño si se te pasa quizá no valga la pena construirla. (Por eso el nombre pegadizo de la compuerta, "una vez o cada semana", es solo el disparador: en esta perilla vive la verdadera decisión.)
Si incluso una perilla está abajo (lo haces rara vez, o cambia cada vez, o es demasiado pequeña para molestarse), quédate en el Modo 1. Construye un ayudante solo cuando la tarea sea repetida, igual cada vez y valga la pena.
El Modo 2 necesita las tres perillas subidas. Cualquiera de ellas abajo te mantiene en el Modo 1.
El error más caro
Hay dos formas de equivocarse en la Compuerta 2. Construir un ayudante permanente para un trabajo único es el error menor: pierdes una tarde, lo notas, sigues adelante.
El caro es silencioso, y casi todos lo cometen: hacer una tarea de Modo 2 a mano, una y otra vez, para siempre.
Se esconde porque cada vez parece pequeña. Cada lunes pasas veinticinco minutos logrando que un agente reúna los mensajes de la semana, los clasifique y escriba un resumen. Funciona bien cada vez. Nunca lo sumas. Pero a lo largo de un año son más de veinte horas dedicadas a mano a una tarea que se repite, es igual cada vez y claramente vale la pena construir una sola vez. Nunca construiste el ayudante porque ningún lunes individual pareció lo bastante grande como para hacerte parar y decidir.
La solución es convertir la decisión en una comprobación deliberada, no en algo que esperas sentir. Hay una vieja y conocida tira cómica de Randall Munroe llamada "Is It Worth the Time?" (tira cómica xkcd 1205). Muestra una tabla simple: si una tarea se repite a menudo, puedes dedicar una buena cantidad de tiempo a construir algo que la haga, y aun así ahorrar tiempo en total. No necesitas los números exactos. Solo necesitas el hábito. Así que aquí está la regla simple:
La tercera vez que haces la misma tarea de la misma forma, detente y ejecuta la Compuerta 2. Si las tres perillas están arriba, ya no estás realmente resolviendo un problema: estás siendo el ayudante que aún no has construido. Esa es tu señal para convertirla en un trabajador.
Un ejemplo de trabajo
David lleva el trabajo del día a día en una empresa de 12 personas. Dos tareas que ambas parecen repetirse:
- Configurar cuentas y accesos para un nuevo empleado. Esto ocurre quizá una vez cada pocos meses, y cada persona nueva es un poco distinta: distinto rol, distintas apps, distintos casos especiales. ¿Con qué frecuencia? Baja. ¿Qué tan igual? Baja. Dos perillas abajo. Esto se queda en Modo 1: resuélvelo desde cero cada vez con un agente. Un ayudante rígido se rompería la primera vez que se incorpore alguien fuera de lo común.
- El resumen de mensajes del lunes. Cada semana, el mismo tipo de entrada, el mismo resultado terminado, y toma 25 minutos cada vez. ¿Con qué frecuencia? Alta. ¿Qué tan igual? Alta. ¿Vale la pena? Sí. Las tres perillas arriba. Esto es Modo 2. La jugada de David es convertirla en un trabajador: seguir resolviéndola a mano hasta que el método esté probado, luego promoverla para que se ejecute sin él. De tarea puntual a trabajador te muestra cómo.
La misma persona, la misma semana, dos respuestas opuestas. La tarea del nuevo empleado parece repetida, pero no pasa la perilla de "¿qué tan igual?". El resumen del lunes pasa las tres. La Compuerta 2 es lo que las distingue, antes de que sobreconstruyas la primera o sigas haciendo a mano la segunda durante un año.
Tu turno
Enumera tres tareas que hayas hecho con un agente más de una vez. Para cada una, ajusta las tres perillas (con qué frecuencia, qué tan igual, vale la pena) y escribe la respuesta: Modo 1 o Modo 2.
Enumera tus tres tareas abajo con sus perillas y veredictos. El evaluador comprueba si los ajustes de tus perillas de verdad sustentan cada decisión de Modo 1 o Modo 2, y marca cualquier tarea de "Modo 2" que en realidad varíe demasiado en cada ejecución como para entregarla a un trabajador rígido.
Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.
La tarea que te sorprende, la que has estado haciendo a mano y resulta ser de Modo 2, es lo más valioso que encontrarás en toda esta página. Esas son horas que estás a punto de recuperar.
Por qué funciona (la investigación detrás) — opcional
La Compuerta 2 es una regla vieja con ropa nueva. En software, Refactoring (1999) de Martin Fowler popularizó la regla de tres, que él atribuye a Don Roberts: la primera vez que haces algo, solo lo haces; la segunda vez, lo vuelves a hacer aunque se repita; la tercera vez, te detienes y construyes la versión reutilizable. La tercera repetición es la señal, no la primera, porque construir demasiado pronto significa construir lo equivocado antes de entender el patrón. Ese es exactamente el disparador de la Compuerta 2: la tercera vez que haces la misma tarea de la misma forma, detente y decide si construir el ayudante.
La perilla de "¿vale la pena?" hace eco de una segunda advertencia muy conocida. La frase de Donald Knuth de que la optimización prematura es la raíz de todos los males (1974) trata en realidad sobre el esfuerzo: no viertas trabajo en hacer algo automático hasta saber que vale la pena automatizarlo. Construir un ayudante permanente para una tarea que harás una sola vez es ese error al revés. Y la aritmética aproximada de cuándo automatizar compensa está capturada en la tabla "Is It Worth the Time?" de Randall Munroe (xkcd 1205): cuanto más a menudo se repite una tarea, más tiempo puedes dedicar a construir un ayudante y aun así ahorrar tiempo en total.
Fuentes: Fowler, M. (1999). Refactoring: Improving the Design of Existing Code (regla de tres, atribuida a Don Roberts). Knuth, D. E. (1974). "Structured Programming with go to Statements," ACM Computing Surveys, 6(4). Munroe, R. "Is It Worth the Time?", xkcd 1205.
Compuerta 3: ¿cómo se ve lo "terminado"?
El error que detiene: "El agente hizo un trabajo precioso. Solo que no era el trabajo que yo necesitaba, y me enteré cuando ya estaba hecho."
Has decidido que es un trabajo para un agente (Compuerta 1) y que lo resolverás una vez (Compuerta 2). La última compuerta antes de abrir el agente: decide qué significa terminado, por escrito, en tres líneas breves.
- Con qué trabaja (la entrada). Exactamente qué debe mirar el agente: qué carpeta, qué archivos, qué mensajes. Sé específico. "Mis correos" es demasiado vago. "Los 400 mensajes de mi carpeta de Soporte de los últimos 7 días" es claro.
- Qué quieres al final (la salida). Lo que quieres que exista cuando esté terminado: una hoja de cálculo, un resumen de una página, una carpeta de archivos renombrados. Di la forma, no solo el tema.
- La comprobación que significa que está terminado (la comprobación de terminado). Lo único que puedes mirar para saber que el trabajo está terminado y correcto. Por ejemplo: "Cada mensaje está en exactamente un grupo, y los conteos de los grupos suman 400." Cuando eso es cierto, terminaste. Cuando no, no.
Eso es todo: tres líneas. Todavía no estás escribiendo las instrucciones completas, y no le estás diciendo al agente cómo hacer el trabajo. Solo estás decidiendo el objetivo, para que cuando el agente lo acierte, lo sepas.
La Compuerta 3 decide cómo se ve lo terminado: el objetivo. Las instrucciones reales que le das al agente mientras trabaja (cómo formular la solicitud, pedir tablas, comprobar el resultado) se enseñan en el siguiente curso, Resolución de problemas con agentes generales. Piénsalo así: la Compuerta 3 es elegir el objetivo. El siguiente curso es aprender a acertarle. Elige el objetivo aquí, luego ve a ese curso para aprender la puntería.
Tres líneas antes de empezar. Un agente puede acertar un objetivo que puede ver.
Un ejemplo de trabajo
Volvamos a Ana, la del inicio, con sus 400 mensajes de clientes. (Su tarea tiene un futuro de Modo 2, pero hasta que ese trabajador exista sigue resolviéndola una vez por semana, así que la Compuerta 3 se aplica a cada ejecución.) Antes de abrir el agente, escribe las tres líneas:
Trabaja con: Los 400 mensajes de mi carpeta de Soporte de los últimos 7 días.
Quiero al final: Una hoja de cálculo con una fila por mensaje: columnas para quién lo envió, la fecha, el grupo (uno de: queja, pregunta, pedido, otro) y un resumen de una línea. Más una nota de una página con el conteo de cada grupo y las tres quejas más comunes.
Terminado cuando: Cada mensaje está en exactamente un grupo, los conteos de los grupos suman 400 y los números de la nota coinciden con la hoja de cálculo.
Ahora abre el agente. Cuando este responde, ella tiene una forma exacta de comprobar si está de verdad terminado, y la comprobación de terminado ("los conteos suman 400") es algo que ella o el agente pueden confirmar en segundos. Yusuf, que abrió el agente con "ayúdame con estos mensajes", no tenía nada de esto. Por eso exactamente su resultado fue algo de lo que no podía fiarse y que no podía comprobar.
Tu turno
Toma la tarea real más reciente que le diste a un agente, o la próxima que estás por darle. Escribe las tres líneas: trabaja con, quiero al final, terminado cuando. Luego mira con atención la comprobación de terminado: ¿de verdad puedes comprobarla? ¿Podrías tú, o el agente, confirmarla en menos de un minuto? Si tu comprobación de terminado es algo vago como "el resumen es bueno", todavía no es una comprobación real. Afínala hasta que sea algo que puedas probar con claridad.
Escribe tus tres líneas abajo. La prueba más afilada del evaluador es tu línea de "Terminado cuando": ¿es algo que de verdad podrías comprobar en menos de un minuto, o una opinión vaga disfrazada?
Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.
Por qué funciona (la investigación detrás) — opcional
Décadas de investigación sobre metas apuntan en la misma dirección. La teoría del establecimiento de metas de Edwin Locke y Gary Latham (resumida en su artículo de 2002 en American Psychologist) encontró, a lo largo de cientos de estudios, que las metas específicas y medibles llevan a un desempeño mucho mejor que las metas vagas de "haz lo mejor que puedas", porque una meta específica te dice exactamente a qué apuntar y exactamente cuándo le has acertado. Una instrucción difusa a un agente ("haz un buen resumen") es una meta de "haz lo mejor que puedas". Las tres líneas la convierten en una específica.
Los equipos de software llegaron a la misma conclusión en la práctica y la llamaron la Definición de Terminado. Antes de empezar el trabajo, el equipo acuerda la lista de verificación exacta que marca una tarea como completa, de modo que "terminado" sea un hecho compartido y comprobable en lugar de una opinión que se discute después. La Compuerta 3 es tu Definición de Terminado personal para una sola tarea, escrita antes de que el agente empiece, para que tenga un objetivo que pueda ver.
Fuentes: Locke, E. A., & Latham, G. P. (2002). "Building a Practically Useful Theory of Goal Setting and Task Motivation," American Psychologist, 57(9), 705-717. "Definition of Done": práctica estándar en el desarrollo de software Agile/Scrum.
Ahora ejecuta las tres en una tarea real
Las compuertas siguen siendo teoría hasta que empujas una tarea real por las tres compuertas de una sola sentada.
Elige algo que necesites hacer ahora mismo. Recórrelo:
- Compuerta 1. ¿Herramienta normal, chatbot o agente? Si se detiene antes de "agente", acabas de ahorrarte toda una sesión: usa la herramienta correcta y sigue adelante.
- Compuerta 2. Si es un trabajo para agente: ¿hacerlo una vez (Modo 1), o construir un ayudante (Modo 2)? Si las tres perillas están arriba, es una tarea de Modo 2: sigue resolviéndola a mano hasta que el método deje de cambiar, luego conviértela en un trabajador. De tarea puntual a trabajador te muestra cuándo está probada y cómo promoverla.
- Compuerta 3. Si es un trabajo para agente de resolver una vez: escribe las tres líneas. Trabaja con, quiero al final, terminado cuando.
Si la tarea sale por el otro extremo (agente, Modo 1, tres líneas escritas), entonces abres el agente. Y ahora entras en Resolución de problemas con agentes generales con una tarea clasificada y clara, y aprendes los siete principios para resolverla de verdad.
Por qué esto importa. Las compuertas toman unos diez minutos. Los errores que evitan toman tardes enteras, y los de Modo 2 toman meses. Ese es todo el intercambio: un poco de reflexión antes de empezar, a cambio de las horas que de otro modo perderías por empezar en el lugar equivocado.
La primera decisión nunca fue cómo hablarle al agente. Fue si hacerlo, qué tipo de trabajo es y hacia qué. Acierta en eso, y la parte de hablar con el agente se vuelve fácil.
A dónde te envía cada respuesta (una tarjeta de referencia)
Las tres compuertas enrutaron tu trabajo sin nombrar nunca una herramienta, a propósito. La compuerta en la que aterrizas es la constante; la herramienta que usas es la variable, y las herramientas cambian cada pocos meses. Aquí está la variable tal como está en 2026. Léela empezando por la compuerta en la que aterrizaste, no al revés.
| A dónde te enviaron las compuertas | Qué significa | Herramientas para usar (2026) |
|---|---|---|
| Solo una respuesta (Compuerta 1 → chatbot) | Necesitabas conocimiento, un borrador o ideas. No se toca nada tuyo. | claude.ai, ChatGPT o Gemini. La habilidad para esto está en Cómo pensar en la era de la IA. |
| Resuélvelo una vez (Compuerta 1 → agente, luego Compuerta 2 → Modo 1) | Un agente que conduces dentro de una sesión: actúa, tú observas, entregas, te vas. | Claude Code u OpenCode (terminal o editor de código); Cowork u OpenWork (app de escritorio). Esto es lo que enseña Resolución de problemas con agentes generales. |
| Adueñarte del trabajador (una elección de propiedad, no un modo) | Quieres un trabajador duradero que tú mismo ejecutas y posees: uno que recuerda a lo largo de las semanas y puede responder mientras duermes. | Un harness personal (software que mantiene vivo y con memoria a un trabajador, por ti): OpenClaw, que te alcanza a través de muchas apps de chat, o Hermes, que recuerda tu trabajo en profundidad. Consulta Harnesses de agentes personales. |
| Fabrícalo (Compuerta 2 → Modo 2) | Un trabajador construido para una organización: un Digital FTE (un "empleado digital a tiempo completo") desplegado para ejecutarse de forma confiable y a escala. | El OpenAI Agents SDK, o una configuración gestionada de agente Claude. Este es todo el camino del Modo 2: Fabricación; Elección de arquitecturas agénticas te ayuda a elegir. |
El único punto donde esto se difumina. Las filas tres y cuatro son ambas "un trabajador duradero que se ejecuta sin ti". Lo que las distingue es para quién es el trabajador. Si es para ti (tu bandeja de entrada, tu código, tus mandados), eso es un harness personal, y no necesitas todo el camino del Modo 2 para construirlo. Si es para una organización (desplegado, gobernado, pensado para escalar), eso es Modo 2. La misma actividad, distinto dueño.
Y poseer un harness personal no es un tercer modo. Es una pregunta aparte de propiedad: puedes ejecutar ya sea el Modo 1 (resolver algo puntual) o el Modo 2 (construir para que dure) sobre un harness que posees. Dos preguntas separadas, y nunca chocan: la propiedad pregunta "¿lo conduzco, o lo poseo?"; el modo pregunta "¿lo resuelvo una vez, o lo construyo para que dure?"
¿Aún no sabes qué herramienta encaja? El libro mantiene una comparación actualizada en Qué empleados de IA en 2026.
Ayuda de estudio con flashcards
Comprobación de conocimientos
Una autocomprobación rápida y guiada sobre las ideas que acabas de recorrer.