Skip to main content

Equipos humano-agente: el modelo operativo para tu fuerza laboral

Este curso es el modelo operativo para un equipo de trabajadores de IA que trabaja junto a personas. La unidad sobre la que se apoya es un trabajador confiable, un Digital FTE: ejecuta el loop, trabaja desde una memoria consultable, inicia sesión con su propia identidad y escala en los bordes. Construyes ese trabajador a lo largo de este track; puedes escribir primero este modelo operativo, en papel, y después conectarlo a trabajadores reales a medida que entren en línea. Un trabajador confiable es la unidad. Gestionar un equipo de ellos es una habilidad distinta de construir uno, y de eso trata este curso: cómo convertir uno en muchos.

Un equipo de muchos no es una versión más grande de uno. Es otra cosa, y necesita otra habilidad: no construir un trabajador, sino gestionar un equipo de trabajadores junto a personas.

Este curso es ese modelo operativo. Los cuatro cursos que vienen después son la maquinaria: un agente líder que contrata una junta (Workforce with Paperclip), una fuerza laboral que crece por sí misma (Self-Expanding Workforce), aprobación delegada (Identic AI) y trabajadores que generan ingresos (Payment-Enabled Agents). Nada de esa maquinaria funciona sobre un equipo que aún no sabes gestionar. Por eso, antes de automatizar la fuerza laboral, defines cómo humanos y trabajadores comparten un roster, un espacio de trabajo y un objetivo.

Diagrama del cambio que enseña este curso. A la izquierda, "single-player": una persona en una ventana de chat, trabajando con un agente en una tarea. A la derecha, "multiplayer": un equipo con varios humanos y varios agentes que comparten un espacio de trabajo, un roster y un objetivo de estrella norte, con flechas desde cada miembro hacia el objetivo compartido. El pie dice: la unidad era un trabajador; el equipo son humanos y Digital FTEs tirando juntos.

Una nota sobre el tipo de curso que es este. Los otros cursos de fuerza laboral se construyen en paralelo. Este no. Aquí escribirás poco código. Escribirás documentos operativos (un roster, role cards, una estrella norte, una rúbrica de verificación) como los escribiría un manager, con una diferencia: tu agente redacta y tú decides. Los entregables son los acuerdos sobre los que opera un equipo. Son menos vistosos que el código y más decisivos: la mayoría de los equipos humano-agente fallan por las prácticas, no por la tecnología.

También es el curso más accesible de la sección. Roles, objetivos, confianza y quién es dueño de qué son cosas que ya entiendes por trabajar con personas. Los agentes no cambian esos fundamentos. Solo aumentan el costo de hacerlos mal.

De dónde vienen estas prácticas

Los patrones de este curso salen del relato de Anthropic sobre cómo gestiona internamente equipos humano-agente, mapeado sobre los marcos que este libro ya ha construido (los enlaces completos están en Fuentes, al final). Cuando Anthropic informa un resultado específico, ese resultado es suyo y se nombra como tal. Las funciones en las que se apoya (agentes que trabajan en herramientas compartidas del equipo, agentes con sus propias credenciales y memoria) son las mismas capacidades que construyes a lo largo de este track.

📚 Ayuda docente

Abre la presentación completa

Ver presentación completa — Equipos humano-agente

Qué vas a construir (el conjunto de artefactos)

No una app: un conjunto de documentos operativos sobre los que trabaja tu equipo. El starter te entrega cada uno como plantilla; tú los completas con ayuda de tu agente.

  • Un roster del equipo: cada miembro, humano y agente, con rol, owner, herramientas y nivel de autonomía.
  • Una role card por agente: qué posee, qué no posee, sus herramientas, cómo se revisa su trabajo y cuándo escala.
  • Un acuerdo de trabajo: qué es público por defecto, los pocos límites de seguridad y qué queda privado.
  • Un documento de estrella norte: el único objetivo ambicioso del equipo, y qué agentes pueden actuar sobre él sin que se les pida.
  • Una rúbrica de verificación: cómo se califica un producto de trabajo, para que se pueda confiar en él sin que un humano lea cada línea.
  • Una configuración doer-verifier: un segundo agente cuyo único trabajo es revisar al primero.
  • Un informe semanal: el registro de "lecciones y errores" que hace mejorar al equipo.
  • Un presupuesto de atención: qué revisas, qué se agrupa y cuál es el límite de lo que llega hasta ti.

Preparación

  1. Descarga el starter (human-agent-teams-starter.zip) y descomprímelo. Es una carpeta de plantillas, no de código. Ábrelas en cualquier editor.
  2. Lo ideal es tener un Digital FTE (Building a Digital FTE) alrededor del cual gestionar un equipo real. ¿Todavía no tienes trabajador? No pasa nada: haz este curso en modo planificación (la nota de abajo) y conecta tu manual a un trabajador real cuando exista.
  3. Ten un lugar donde el trabajo sea visible para el equipo: un canal compartido, una biblioteca de documentos o un repositorio. Los agentes leen lo que está escrito allí.
  4. Ten listo tu agente para redactar contigo (claude.ai, Cowork o tu trabajador). Todos los artefactos del starter se completan con el mismo ritmo: tú diriges, el agente redacta, tú decides.

A partir de aquí, cada parte enseña una práctica y luego te pide escribir el documento que la instala. No se te evaluará por teoría; saldrás con el manual operativo de un equipo.

Comprobación de preparación (hazla antes de la Parte 2)

Este curso supone que tu trabajador ya puede leer el registro escrito de tu equipo. Pruébalo ahora: pide a tu agente que encuentre una decisión o un documento de la semana pasada en un canal que no controla. Si puede, estás listo. Si vuelve vacío, todavía no has terminado el sistema de registro consultable de AI Searchable Context. Haz eso primero. Sin ello, ninguna práctica de este curso tiene algo que leer.

¿Todavía no estás ahí? Ejecútalo en modo planificación

Puedes hacer todo este curso antes de tener el stack técnico: usa claude.ai o Cowork como agente de redacción, escribe todos los documentos operativos y marca cada rol de agente como "planificado" en lugar de "activo". Saldrás con un manual operativo completo sobre papel. Vuelve cuando tus primeros trabajadores estén construidos y reemplaza los roles planificados por roles vivos.


Parte 1: De un trabajador a un equipo

Concepto 1: Se terminó el single-player

Trabajar con IA solía ser single-player: una persona, una ventana de chat, una tarea. Un Digital FTE ya hace más que eso. El cambio sobre el que se construye este curso es el paso a multiplayer: muchas personas y muchos agentes en un mismo espacio de trabajo, avanzando hacia objetivos compartidos. Los humanos fijan la estrategia; los agentes ejecutan.

Un agente multiplayer trabaja con muchos humanos a la vez. Como un Digital FTE, tiene su propia memoria y sus propias skills. A diferencia de una ventana de chat, tiene sus propias credenciales (no prestadas por una persona) y vive donde ocurre el trabajo: los canales y documentos del equipo, no una sesión privada.

La unidad es un Digital FTE. El equipo son humanos y Digital FTEs que comparten un roster. El equipo es el negocio.

Concepto 2: Las partes que necesita un trabajador

Un equipo no funciona hasta que cada agente tiene tres cosas, y este track construye las tres:

  • Memoria persistente: para sostener el objetivo durante días, no solo durante un prompt (AI Searchable Context).
  • Su propia identidad: credenciales no atadas a un humano, para actuar dentro de las salvaguardas que defines en lugar de tomar prestados los logins de alguien (AI Identity).
  • Acceso amplio y consultable: para aprender cómo funciona la organización desde lo que está escrito (tu sistema de registro en Postgres y RAG: retrieval, la memoria consultable que le diste).

Sin esto, "agregar un agente al equipo" significa que una persona comparte su contraseña con un script. Con esto, significa un trabajador que pertenece al roster. Puedes diseñar el modelo operativo ahora y conectarlo a trabajadores vivos a medida que esas tres piezas entren en línea; las prácticas humanas se apoyan encima en cualquier caso.

Checkpoint: conoces la unidad. Un trabajador con memoria, identidad y acceso es la pieza de la que se compone un equipo. Ahora harás que muchas piezas trabajen con personas.

Concepto 3: El recurso escaso es el juicio humano

Todo el modelo operativo protege una cosa: la atención y el juicio humanos. Los agentes son rápidos y muchos; las personas son el cuello de botella y la autoridad. Cada práctica de este curso existe para mantener a los humanos decidiendo lo que solo los humanos deben decidir, y fuera de todo lo demás.

Nombra primero el modo de fallo, porque es el común. Sin un modelo operativo, las personas ejecutan flotillas de IA personales en paralelo. El trabajo se duplica. El contexto del equipo se rompe en ventanas privadas que nadie más, humano o agente, puede ver. La métrica que todos necesitan se calcula de cinco formas distintas. La solución no es tener más agentes; es gestionar un solo equipo en abierto.

El resto del curso son cuatro prácticas que hacen exactamente eso.

El modelo operativo como cuatro prácticas, dibujadas como cuatro tarjetas. Tarjeta 1, "Work in the open": el contexto fluye a cada compañero dentro de unos pocos límites claros. Tarjeta 2, "One roster, clear roles": cada miembro, humano y agente, posee un trabajo nombrado con las herramientas correctas. Tarjeta 3, "A north star": un objetivo ambicioso fijado por humanos que dice a los agentes qué trabajo vale la pena hacer. Tarjeta 4, "Trust, earned": la autonomía crece con confiabilidad demostrada, y todo trabajo se puede verificar. Debajo, una banda dice: cada práctica protege una cosa: el juicio humano.

Checkpoint: conoces la forma. Cuatro prácticas, un propósito. Ahora viene la primera.


Parte 2: Trabajar en abierto

Concepto 4: Si no está escrito, no existe

Un agente construye su comprensión únicamente a partir de lo que el equipo vuelve consultable: canales, código, documentos, notas. Los mensajes privados, las conversaciones de pasillo y los archivos restringidos no le llegan. Para un agente, lo no escrito es invisible.

Por eso la primera práctica es cultural antes que técnica: trabaja en público. Las decisiones aterrizan en canales y documentos, no en mensajes directos ni reuniones sin notas. Escribe artefactos para que un agente pueda encontrarlos: el agente ahora es un lector primario de tu documentación, no una idea secundaria.

El beneficio es real, y Anthropic lo informa con claridad. Un agente que puede leer las decisiones de un equipo no propondrá trabajo que ya descartaste. Uno que puede leer las specs de otro equipo reutilizará un patrón que funcionó. Y como un agente lee mucho más rápido que cualquier humano, suele sacar a la superficie trabajo relevante que las personas habrían pasado por alto. La transparencia deja de ser una virtud y se convierte en palanca.

Concepto 5: Límites en el workspace, no en el documento

Hay una mala forma de decidir qué puede ver un agente: un documento y un canal a la vez. Eso produce fatiga de decisión, para humanos y agentes: ¿esto debe ser privado? ¿puedo compartir ese documento? ¿este agente puede estar en ese hilo? Las líneas suaves, por elemento, cansan y se equivocan con facilidad.

La forma correcta: unos pocos límites de seguridad claros trazados en el nivel del workspace: un límite de seguridad es simplemente una pared alrededor de un conjunto de información, con una regla sobre quién está dentro. Dentro de un límite, el contexto fluye hacia todos los compañeros, humanos o IA. Un número pequeño de líneas claras supera a un número grande de líneas blandas, y elimina el impuesto diario de "¿puedo compartir esto?".

Aquí es donde tu sistema de registro se gana su lugar. El límite es la pared; el almacén consultable de AI Searchable Context es lo que fluye libremente dentro. Dibuja la pared una vez; deja que retrieval haga el resto.

Di la excepción con claridad, porque público por defecto no significa todo público. Parte del trabajo es sensible y pertenece entre un humano y un agente. Eso es un mensaje directo al agente, o las apps privadas (claude.ai, Cowork) sobre tus conectores personales, donde la conversación se mantiene privada. Abierto por defecto; un carril claro y estrecho para lo que no debe serlo.

Redáctalo. Abre 01-working-agreement.md y pega esto en tu agente:

Draft a working agreement for my team. State what is public by default. List the few security boundaries we need (no more than a handful) and who is inside each. List what stays private (one human, one agent). For each boundary, write one sentence a new teammate could follow.

Revísalo. ¿Puedes decir cada límite en una sola frase? Si no puedes, tienes demasiados. Pocos y claros, o no se sostendrá.

Checkpoint: el contexto fluye. Tu equipo trabaja donde los agentes pueden leer, detrás de unas pocas paredes que cualquiera puede nombrar. Ahora pon nombres al trabajo.


Parte 3: Un roster, roles claros

Concepto 6: Un equipo tiene un roster

Un equipo humano-agente comparte un roster, un conjunto de artefactos y un espacio de trabajo. Así que escribe el roster: cada miembro, humano y agente, y qué posee cada uno.

Los agentes sostienen roles distintos. Uno posee el análisis de datos; otro sostiene y hace cumplir el estándar de diseño; otro ejecuta la síntesis de investigación. Cuando empieza un proyecto, los humanos conversan con los agentes para decidir qué roles asignar y cómo trabajarán juntos: el roster es el resultado de esa conversación, no una suposición hecha por adelantado.

Esta es tu taxonomía de roles y tu taxonomía de Digital FTE, hecha concreta para un equipo. El catálogo dice qué tipos de trabajadores pueden existir; el roster dice cuáles están en este equipo y quién posee qué.

Concepto 7: Un rol es una card y una skill file

Cada agente recibe una role card: qué posee, qué no posee, las herramientas y el acceso que necesita, cómo se revisa su trabajo y cuándo escala a un humano. El alcance trata tanto del "no posee" como del "posee": un agente con bordes borrosos se mete en el trabajo de otras personas.

Nombra las herramientas, porque un rol sin ellas es un título sin manos. El analista necesita la base de datos. El agente de QA necesita la herramienta de navegador. Enumera el acceso que requiere cada rol y concede solo eso (least privilege es la misma regla que volverás a encontrar con aprobación delegada).

Luego escribe el rol como una skill file. Este es el movimiento que hace encajar los marcos del libro: define el rol de un agente en una skill, y el rol se vuelve portátil: cualquier persona de la organización puede levantar otro agente del mismo tipo a partir de ella. Los roles dejan de ser cajas en un organigrama y se vuelven skills que puedes copiar. (Las skills son la palanca portátil de todo este libro; un rol es otra cosa que una skill puede transportar.)

Mantén explícitos los roles solo humanos. Los humanos trabajan en los mismos hilos que los agentes, pero sostienen los roles que solo los humanos pueden sostener: las decisiones de consecuencia, el juicio que tiene costo. El roster es la forma de mantener el juicio humano en las decisiones que lo necesitan y fuera de las que no.

Cuando un agente necesita otro agente

A veces un trabajo es demasiado grande para un solo trabajador, y un agente líder genera compañeros con el contexto correcto para una subtarea: un investigador aquí, un revisor allá. Ese instinto es correcto, y es lo que automatiza el siguiente curso: Workforce with Paperclip convierte "un líder contrata una junta" en una fuerza laboral gestionada con presupuestos y aprobaciones. Tu roster y tus role cards son sus entradas. Aquí escribes los roles a mano para entender lo que Paperclip hará después por ti.

Dos notas honestas sobre la función subyacente, a mediados de 2026: los agent teams de Claude Code son experimentales y están desactivados por defecto (los activas con una configuración), y solo el líder genera compañeros; los compañeros no pueden anidar los suyos. Así que "agentes creando agentes" en realidad significa "un líder crea un equipo plano". Trátalo como algo temprano y lee la documentación actual antes de apoyarte en ello en producción.

Redáctalo. Abre 02-roster.md y una copia de 03-role-cards/role-card.template.md y pega:

Draft a team roster for [team]. List every member, human and agent. For each: role, who owns it, the tools and access it needs, and its autonomy level. Mark the roles only a human should hold. Then write a full role card for [my worker]: owns, does NOT own, tools/access, how its work is verified, and what triggers an escalation to a human.

Revísalo. Cada miembro tiene owner y un "no posee". Cada agente tiene sus herramientas y un trigger de escalamiento claro. Si dos miembros podrían reclamar la misma tarea, los alcances aún no están lo bastante definidos.

Checkpoint: todos tienen un carril. Humanos y agentes en un roster, cada uno dueño de un trabajo nombrado con las herramientas para hacerlo. Ahora da dirección al equipo.


Parte 4: La estrella norte

Concepto 8: Un objetivo que vuelve proactivo al agente

El contexto y los roles hacen que un agente haga el trabajo que le asignas. Una estrella norte hace que proponga el trabajo correcto. Una estrella norte es un objetivo ambicioso y amplio que dice al equipo qué tareas y workstreams vale la pena hacer: la frase contra la que se mide todo lo demás. Los humanos siempre la fijan, anclada en la misión del negocio.

Una vez escrita, la compartes con los agentes del equipo. Luego, y esta es la parte que la gente salta, nombras qué agentes pueden actuar sobre ella sin que se les pida. No todo agente debe proponer trabajo. Solo los que tienen las skills y la confianza ganada para hacerlo bien.

El ejemplo de Anthropic es pequeño y exacto: un equipo cuya estrella norte era "hacer que el onboarding del producto sea más útil" tuvo un agente que recomendó proactivamente reescrituras de mensajes de error del onboarding, cambios que elevaron mediblemente el éxito de onboarding la semana siguiente. El agente no esperó a que se lo pidieran. La estrella norte le dijo que la reescritura estaba dentro de la misión.

Esta es tu misión de compañía AI-Native, empujada hacia un solo equipo. La compañía tiene una misión; el equipo tiene una estrella norte que la sirve; el agente tiene trabajo que sirve a la estrella norte. Una línea recta del objetivo a la tarea.

Concepto 9: La proactividad es un privilegio que concedes

El riesgo de un agente proactivo no es que proponga trabajo; es que proponga trabajo que no debería tocar. Por eso la proactividad se nombra, no se presupone. En tu roster, escribe qué agentes pueden sugerir nuevos workstreams y bajo qué guardrails. La estrella norte es la prueba que cada propuesta debe pasar.

Un agente sin esa concesión sigue haciendo su trabajo asignado. Simplemente no actúa por libre. Esa distinción mantiene la proactividad útil: no todos los agentes necesitan iniciar trabajo nuevo, y los que sí pueden deben demostrar que el trabajo sirve a la estrella.

Redáctalo. Abre 04-north-star.md y pega:

Draft a north-star document for my team. One sentence for the ambitious goal, grounded in the business mission. Name which agents on the roster may propose new work against it, and the guardrails on those proposals. Write it so an agent, given only this doc, could judge whether a new idea is on-mission.

Revísalo. Léelo como lo haría el agente nombrado. Con solo este documento, ¿podría distinguir una idea dentro de la misión de una idea fuera de la misión? Si no, la estrella es demasiado vaga para orientar.

Checkpoint: el equipo tiene dirección. Un objetivo, fijado por humanos, con unos pocos agentes nombrados que pueden perseguirlo. Ahora decide cuánto los dejas correr.


Parte 5: Confianza, ganada

Concepto 10: La autonomía crece con la confiabilidad

No entregas las llaves a un colega nuevo el primer día. Tampoco entregas a un agente 500 correcciones de bugs el primer día. Los ingenieros de Anthropic llegaron ahí (agentes despachados para manejar cientos de fixes por su cuenta), pero no empezaron así. Concede autonomía en proporción a la confiabilidad demostrada y luego amplíala deliberadamente, por tipo de tarea.

Hacen falta ciclos de feedback para externalizar el conocimiento tácito de cómo se hace bien una tarea: para un humano nuevo y para un agente. Y vuelve a probar cuando cambien los modelos: un guardrail que ayudó a un modelo más débil puede encadenar a uno más fuerte, y un prompt quizá necesite reformularse cuando el modelo mejora. La confianza no se fija una vez; se ajusta.

Una escalera de confianza, con cuatro peldaños ascendentes etiquetados por nivel de autonomía. L1 "Review everything": un humano revisa cada decisión que toma el agente. L2 "Verify the work": una rúbrica o un segundo agente revisa el output antes que el humano. L3 "Batch the escalations": el agente saca a la superficie solo las llamadas de consecuencia, agrupadas. L4 "Earned autonomy": el agente ejecuta un tipo de tarea por su cuenta, con alcance ampliado tras victorias repetidas. Debajo de los peldaños, L0 significa solo borrador: el humano hace el trabajo. Una flecha hacia arriba dice "demonstrated reliability"; una nota lateral dice "amplía por tipo de tarea, no todo de una vez".

Haz operativa la escalera dándole peldaños fijos. Define un nivel de autonomía por agente por tipo de tarea en el roster, no un nivel único para todo el agente:

NivelQué hace el agenteDónde está el humano
L0Solo redacta; el humano hace el trabajoel humano hace todo
L1Actúa, pero un humano revisa cada outputel humano revisa todo
L2Actúa; un verificador revisa; el humano solo ve excepcionesel humano revisa excepciones
L3Actúa dentro de límites; agrupa escalaciones al humanoel humano revisa escalaciones agrupadas
L4Ejecuta el tipo de tarea por su cuenta, dentro del alcance aprobadoel humano revisa el informe semanal

Un agente nuevo empieza en L1 para un tipo de tarea y sube tras victorias repetidas y verificadas. El mismo agente puede estar en L4 para un tipo de tarea y en L1 para otro: la autonomía se concede a un trabajador-en-un-trabajo, nunca a un trabajador en general.

Concepto 11: Haz que el trabajo sea verificable

Lo que permite que la autonomía crezca con seguridad es esto: el trabajo puede verificarse antes de que lo vea un humano. El código tiene tests, por supuesto. Pero la mayoría del trabajo también puede calificarse: un documento contra una rúbrica y una guía de estilo, un informe contra una checklist. Cuando fijas la barra y haces que cada encargo sea evaluable, la calidad se mantiene alta y no se desvía de lo que pretendías.

Esto es Eval-Driven Development en el nivel del equipo (Eval-Driven Development). Allí, el eval califica automáticamente al trabajador. Aquí, la rúbrica es ese eval aplicado al output de un trabajador: la misma idea, escrita como una checklist que podría ejecutar un compañero.

Luego viene el doer-verifier: un agente hace la tarea y el único trabajo de un segundo agente es revisarla. (Anthropic llama a esto el harness doer-verifier.) Es un seguro barato, y gasta tiempo de un agente para ahorrar tiempo humano: el verificador detecta drift antes de que gastes tu atención escasa en él.

Redáctalo. Abre 05-verification-rubric.md y 06-doer-verifier.md y pega:

Write a verification rubric for [my worker]'s main output: the concrete checks that decide whether the work is good enough to ship, in plain pass/fail terms. Then describe a doer-verifier setup: a second agent whose only job is to grade the first's output against this rubric and return pass/fail with reasons.

Revísalo. ¿Podría un segundo agente calificar el trabajo del primero usando solo esta rúbrica, y confiarías en el pass? Si un "pass" todavía te deja con ganas de leer cada línea, la rúbrica no es lo bastante específica.

Concepto 12: Gasta la atención humana como dinero

Cuando los agentes son independientes, aparece un nuevo modo de fallo: ahogar a los humanos en output. Así que trata la atención humana como el recurso escaso que es. Los mejores equipos hacen que sus agentes agrupen preguntas en una sola pasada, repitan el contexto clave para que un humano se ponga al día rápido y limiten cuántos elementos ve un humano de una vez.

Algunos equipos dan a un agente el único trabajo de decidir qué elevar a humanos. Algunos limitan cuánto hace un agente al día: no para frenarlo, sino para que los humanos todavía puedan involucrarse con sentido en el trabajo y conservar las habilidades que les importan.

Incorpora reflexión al ciclo. Pide al equipo un informe semanal de "lecciones y errores", para que los errores se registren y dejen de repetirse. Registra en qué tipos de tarea ha ganado autonomía cada agente y amplía el alcance solo tras victorias repetidas. El informe es la forma en que un equipo mejora a propósito en lugar de por suerte.

Redáctalo. Abre 07-weekly-report.md y 08-attention-budget.md y pega:

Draft a weekly team report template that captures, for each agent: what it shipped, its lessons and missteps this week, and which task types it has earned more autonomy on. Then propose an attention budget for me: what I will review, what gets batched, and the cap on how much reaches me at once.

Revísalo. En una semana ocupada, ¿esto mantiene a un humano decidiendo las cosas importantes y nada más? Si el humano todavía tiene que leerlo todo, el presupuesto no está protegiendo el recurso escaso.

Checkpoint: la confianza es un dial, no un interruptor. El trabajo es verificable, la autonomía se amplía con pruebas y la atención humana se gasta donde cuenta. Ya tienes todo el modelo operativo.


Parte 6: Pon en marcha tu equipo

Has aprendido cuatro prácticas y redactado un documento para cada una. Ahora ensámblalas en el manual operativo de un equipo.

El manual operativo: una carpeta, ocho archivos

El manual es una carpeta, numerada en el orden en que la completas. El starter trae exactamente esto:

human-agent-team/
01-working-agreement.md few clear boundaries · what's public · what's private
02-roster.md every member · owner · tools · autonomy level (L0–L4)
03-role-cards/ one card per agent (copy the template)
role-card.template.md
reconciler.md (filled example)
04-north-star.md the one goal · which agents may act on it unprompted
05-verification-rubric.md the pass/fail checks a verifier can apply
06-doer-verifier.md which agent checks which, and what happens on fail
07-weekly-report.md shipped · lessons & missteps · autonomy changes
08-attention-budget.md what you review · what's batched · the cap

Cada archivo tiene una checklist breve obligatoria (en la plantilla y repetida como "Revísalo" al final de cada parte). Un archivo no está terminado hasta que toda su checklist sea sí. El manual no está terminado hasta que lo estén los ocho.

Complétalo en orden

El orden es el orden de dependencia. Las cuatro prácticas se mapean a cinco pasos de llenado (la práctica de confianza se divide en verificación y atención), y esos pasos producen los ocho archivos: un manual visto en tres niveles de zoom.

  1. Acuerdo de trabajo: qué es público, los pocos límites, qué queda privado. (Contexto primero; nada más funciona sin eso.)
  2. Roster + role cards: cada miembro, qué posee, sus herramientas, sus triggers de escalamiento.
  3. Estrella norte: el objetivo y quién puede perseguirlo sin que se le pida.
  4. Rúbrica de verificación + doer-verifier: cómo se revisa el trabajo antes de que lo veas.
  5. Informe semanal + presupuesto de atención: cómo mejora el equipo y cómo protege tu tiempo.

Los cinco documentos operativos en orden de dependencia, cada uno alimenta al siguiente: acuerdo de trabajo, luego roster y role cards, luego estrella norte, luego rúbrica de verificación y doer-verifier, luego informe semanal y presupuesto de atención. Dos de ellos se conectan con el resto de la Fase 3: el roster alimenta Workforce with Paperclip (que contrata desde él), y el presupuesto de atención alimenta Identic AI (que lo automatiza). Un pie dice: completa cada uno con tu agente; decide cada uno tú; el starter entrega estos cinco como plantillas.

Ejecuta cada uno con el mismo ritmo: pega el prompt de la parte, lee lo que redacta el agente y decide: recorta, afila, aprueba. Tú eres la autoridad; el agente es el redactor.

Usa las cinco preguntas de Anthropic como prueba de finalización. El equipo está listo cuando cada respuesta es sí:

  1. ¿La información y el acceso que necesitan agentes y humanos son públicos y ampliamente consultables?
  2. ¿Puedes escribir el roster de tu equipo, humanos y agentes, y decir qué posee cada miembro?
  3. ¿Cada humano y agente tiene las herramientas correctas para hacer su trabajo?
  4. ¿Tienes rúbricas o tests para verificar los productos de trabajo clave?
  5. ¿El equipo tiene una estrella norte clara que todos puedan consultar?

Un ejemplo trabajado: un equipo de cierre financiero

Las plantillas son abstractas hasta que ves una completa. Aquí tienes un pequeño equipo financiero que ejecuta el cierre mensual (un controller humano y tres agentes) con las piezas importantes concretadas. (El starter lo incluye como examples/finance-close-team.md.)

Estrella norte: cada número que sale del edificio es correcto y rastreable hasta su fuente.

MiembroHumano/AgentePoseeHerramientas / accesoAutonomía
ControllerHumanoSign-off de todo lo que sale de la compañíaningunosolo humano
PullerAgenteExtraer cifras de los sistemas fuenteERP / GL solo lecturaL2 (verificado)
ReconcilerAgenteCruzar cifras entre fuentes, marcar variacionesel ledger, el sistema de registroL3 en conciliaciones rutinarias; L1 en cuentas nuevas
CheckerAgenteCalificar la conciliación contra la rúbricala rúbricasolo doer-verifier

El detalle que lo vuelve seguro es el trigger de escalamiento, escrito con claridad en la role card del Reconciler.

Ejemplo: el trigger de escalamiento del Reconciler

Escala al Controller cuando: cualquier variación supera 1% del saldo de la cuenta o $10,000, lo que sea menor (deliberadamente conservador, para que incluso cuentas pequeñas escalen con movimientos pequeños), o cualquier cifra no tiene fuente en el sistema de registro. En los demás casos, concíliala y regístrala.

Y la rúbrica de verificación que aplica el Checker. La conciliación solo pasa si:

Ejemplo: la rúbrica del Checker
  1. cada saldo concilia con su fuente dentro del umbral; 2. cada variación tiene un código de motivo; 3. cada documento fuente está enlazado en el sistema de registro; 4. cada excepción aparece en la cola de escalamiento.

Esa línea de escalamiento es todo el modelo operativo en miniatura. El Reconciler ejecuta conciliaciones rutinarias por su cuenta (L3), el Checker verifica contra la rúbrica antes de que nadie mire (doer-verifier), los números sin fuente o materiales se detienen y llegan a un humano (atención gastada solo donde cuenta), y el Controller sostiene el único rol que envía un número al mundo exterior. Observa que el Reconciler es L3 en conciliaciones rutinarias pero L1 en cuentas nuevas: autonomía por tipo de tarea, no por agente. Cambia los umbrales y las fuentes, y la misma forma ejecuta cuentas por pagar, nómina o reporting para la junta.

Checkpoint: puedes gestionar un equipo. Un acuerdo de trabajo, un roster con roles claros, una estrella norte, una forma de verificar el trabajo y un presupuesto para tu propia atención. Eso es un modelo operativo, y es lo que ejecutan los demás cursos de fuerza laboral.


Parte 7: El techo y dónde crece

El modelo operativo, por sí solo, no escala el equipo. Fija las reglas; los cuatro cursos siguientes son la maquinaria que se ejecuta sobre ellas, y cada uno toma como entrada un artefacto que acabas de escribir:

  • Workforce with Paperclip automatiza el roster: un agente líder contrata y gestiona una junta de trabajadores bajo presupuestos, aprobaciones y una traza de auditoría completa. Tu roster y tus role cards son la fuente de contratación.
  • Self-Expanding Workforce hace crecer el equipo a medida que crece el trabajo, en lugar de que tú agregues cada trabajador a mano.
  • Identic AI es tu presupuesto de atención automatizado: una identidad firmada que aprueba lo rutinario dentro de los límites que defines y saca a la superficie solo lo consecuente.
  • Payment-Enabled Agents permite que un trabajador haga transacciones: el paso desde un equipo que ahorra costo a uno que genera ingresos.

Construye primero el modelo operativo, y esa maquinaria tendrá algo sólido sobre lo que operar. Sáltalo, y estarás automatizando un equipo que nunca fue coherente.

Y el techo de las prácticas mismas: nada de esto es nuevo para humanos. Una estrella norte clara, roles definidos, trabajo en abierto, un estándar compartido de calidad y espacio para aprender de errores: son hábitos de equipo saludables que conocemos desde hace décadas. Los agentes no los introducen. Hacen que saltárselos sea fatal, porque un agente escala una mala práctica tan rápido como una buena. Los equipos que más sacan de sus agentes son los más disciplinados con los fundamentos.

Esta es la línea hacia la que venía caminando el libro: una fuerza laboral de Digital FTEs, gestionada con este modelo operativo, dentro de una compañía AI-native. Llegas a este modelo operativo pensando en un trabajador. Sales capaz de gestionar un equipo de ellos con personas, y de escalar, gobernar y vender lo que produce ese equipo.

El mismo manual, otros equipos

El conjunto de artefactos tiene una sola forma; cambia el equipo, no los documentos:

  • Un equipo de investigación: agentes analista, sintetizador y fact-checker bajo una estrella norte de "responder la pregunta, con fuentes".
  • Un equipo de delivery: un planner, un doer y un doer-verifier bajo una rúbrica de calidad, con un humano que sostiene la decisión de ship.
  • Un equipo financiero: un agente que extrae datos, un agente de conciliación y un humano que posee cada número que sale del edificio.

Los mismos cinco documentos. Distinto roster, distinta estrella norte, distinta rúbrica.

Capstone: pon en marcha un equipo real

Elige un objetivo real de tu organización y produce el conjunto completo de artefactos: acuerdo de trabajo, roster, role cards, estrella norte, rúbrica de verificación, doer-verifier, informe semanal y presupuesto de atención.

1Your Work
2Get Your Score

Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.

El starter incluye un ejemplo calificado (examples/finance-close-team-graded.md), un manual financiero completo con 15/16 contra estos ocho checks, con el check débil nombrado y el fix mostrado. Léelo antes de calificar el tuyo: muestra lo que detecta la rúbrica y cómo se ve un manual sólido.

Fuentes

Este curso enseña desde el relato de Anthropic sobre la gestión de equipos humano-agente, mapeado sobre los marcos que este libro ya ha construido. La fuente primaria y el material de Anthropic del que parte:

Ayuda de estudio con flashcards


Pon a prueba tu comprensión

Checking access...