Skip to main content

OpenClaw con agentes generales: curso acelerado de 90 minutos

6 escenarios, de cero a Empleado de IA personal

OpenClaw es tu Empleado de IA personal: un asistente open source que se ejecuta en tu propio portátil y responde mediante las apps de mensajería que ya usas (WhatsApp, Telegram, Discord, Slack, iMessage y más).

Es el proyecto que demostró que los Empleados de IA son reales, funcionan y la gente los quiere. OpenClaw se convirtió en el proyecto open source de crecimiento más rápido de 2026, con cientos de miles de estrellas en GitHub durante sus primeros meses. Jensen Huang lo llamó "el próximo ChatGPT" en GTC 2026; NVIDIA construyó NemoClaw encima.

Al final de estos noventa minutos tendrás uno: un Empleado de IA en tu teléfono que responde mensajes, usa herramientas y servicios externos, se personaliza para ti, se ejecuta según su propio calendario y permanece en tu portátil. No es un chatbot que visitas; es un trabajador al que delegas tareas.


Cómo funciona este curso acelerado. Descargas una carpeta pequeña, se la entregas a tu agente general (Claude Code, OpenCode, Cowork u OpenCowork funcionan; cada uno importa automáticamente AGENTS.md desde el contexto de la carpeta) y recorres seis escenarios. El agente lee la carpeta, instala y ejecuta OpenClaw, conecta tu teléfono, incorpora nuevas skills, personaliza su cerebro y programa una tarea que se ejecuta sin ti. Tú diriges; el agente trabaja; OpenClaw se convierte en tu Empleado de IA personal.

¿Qué agente debería usar?

Los seis escenarios de abajo son agnósticos al agente: cada prompt de "pega esto en tu agente" es idéntico entre herramientas. La única diferencia es el paso de lanzamiento: los agentes CLI (Claude Code, OpenCode) se lanzan desde una terminal en la carpeta descomprimida; los agentes de escritorio (Cowork, OpenCowork) se lanzan abriendo la carpeta en la app. Elige el que ya tengas instalado. El brief incluido en el zip funciona igual para los cuatro.

Ruta de lectura · prerrequisitos · la versión profunda (haz clic para expandir)

Ruta de lectura (seis escenarios + un hábito mensual):

  1. Instalar y chatear en el dashboard local. ~15 min.
  2. Vincular un canal desde tu teléfono (WhatsApp / Telegram / Discord). ~15 min.
  3. Delegar trabajo real y observar el bucle del agente. ~10 min.
  4. Hacer que suene como tú y te recuerde + respaldar la identidad en GitHub. ~15 min.
  5. Extenderlo con una skill + una herramienta externa. ~15 min.
  6. Hacer que actúe por su cuenta con una tarea cron (o heartbeat) que se ejecuta para ti. ~15 min.
  7. (Una vez al mes, no hoy) Ejecutar la auditoría. ~10 min cuando llegue el momento.

Cada escenario termina con un éxito ejecutable. Si noventa minutos en una sola sesión es demasiado, hazlos en sesiones separadas; el estado persiste entre ellas. Un apéndice opcional cubre Google Workspace; la voz, la seguridad multiagente y el cierre de desarrollo con ACP-spawn apuntan al Capítulo 56.

Prerrequisitos (tres cosas; la página los da por hechos):

  1. Claude Code u OpenCode instalado. Cualquiera de los dos sirve. Si no tienes ninguno, haz primero el curso acelerado de coding agéntico.
  2. Ya hiciste el curso acelerado de coding agéntico. Puedes aprobar llamadas a herramientas, leer la salida del agente y reconocer cuándo un agente está atascado. Nos apoyamos en esos movimientos; no los volvemos a explicar.
  3. Node.js 22.16 o posterior (se recomienda Node 24). Ejecuta node --version en una terminal. Si estás por debajo de v22.16, instala una versión actual desde nodejs.org/en/download (tu agente general te guiará si se lo pides).

¿Quieres la versión paciente? Capítulo 56: conoce a tu Empleado de IA personal contiene diecisiete lecciones sobre el mismo material, además de voz, multiagente, seguridad y despliegue. Si algo aquí se siente demasiado rápido, salta a la lección equivalente de Ch56 y vuelve.


El patrón de colaboración

Tres actores comparten esta página. El diagrama concreta la relación:

Tres actores comparten esta página: tú, tu agente general y OpenClaw (el Empleado de IA). Tú pegas prompts y apruebas acciones; tu agente general instala y configura OpenClaw; OpenClaw responde en tu teléfono y ejecuta tareas programadas.

Después, cada escenario usa el mismo ritmo de cinco pasos:

  1. Pegas una sola frase en tu agente general. Es un brief, no un script. Describes lo que quieres; no enumeras los pasos.
  2. Tu agente consulta AGENTS.md (ya está en su contexto: CLAUDE.md en la carpeta lo importa automáticamente al inicio de la sesión, así que no hay paso de descarga) y propone un plan. Nombrará los comandos que pretende ejecutar y marcará cualquier punto de decisión (qué canal, qué skill, qué recordar). Pregunta antes del primer comando destructivo.
  3. Apruebas y observas. El agente ejecuta comandos de instalación, establece la configuración, reinicia el servicio en segundo plano, observa la salida del log en vivo y te muestra lo que ve. Cuando encuentra un gotcha conocido, reconoce el patrón y aplica la corrección documentada.
  4. Tu agente se detiene en la frontera humana. Algunos movimientos solo puedes hacerlos tú: visitar aistudio.google.com para obtener una clave de Gemini, escanear un QR con tu teléfono, avanzar por las pantallas de OAuth de Google, escuchar una nota de voz. El agente nombra esa frontera y espera.
  5. Terminas cuando ocurre algo observable. Una respuesta real en el dashboard. Un mensaje de tu teléfono recibe respuesta. Aparece un archivo en disco. Cada escenario te dice qué observar.

Cada escenario usa el mismo ritmo de cinco pasos: pegas una frase; el agente propone un plan; apruebas; el agente ejecuta; verificas la condición de finalización. El agente se detiene en cualquier frontera que solo tú puedas cruzar.

Eso es todo. El agente hace lo que un agente hace bien: instalar, configurar, depurar, reiniciar, verificar, recuperarse. Tú haces lo que solo tú puedes hacer: decidir, aprobar y actuar sobre las cosas vinculadas a tu teléfono o tus cuentas. Este ritmo (describir el objetivo, recibir el plan, aprobar, ejecutar con verificación en cada paso) es el mismo patrón de prompting enseñado en el curso acelerado de Prompting de IA en 2026; cada escenario de abajo usa dos prompts breves para pegar en lugar de un bloque enorme de instrucciones, para que experimentes el ritmo en vez de leer sobre él.

Un único movimiento de recuperación para todo el curso acelerado

Si algo sale mal en cualquier punto, no necesitas conocer comandos CLI ni códigos de error. Pega esto en tu agente:

Algo no funcionó. Lee el log del gateway, dime en lenguaje sencillo qué ves y propón una corrección que pueda aprobar.

Tu agente lee el log, nombra lo que ve y propone la corrección. Tú apruebas. Ese es el bucle de recuperación para todos los escenarios de este curso acelerado.

Si un escenario tarda demasiado

Cada escenario tiene un tiempo presupuestado (se muestra en el H2). Si superas 2x ese presupuesto (por ejemplo, más de 30 minutos en un escenario de 15 minutos), vuelve a encauzar al agente y pega: "¿Qué nos bloquea, en una frase? Replanteemos desde ahí." Dar vueltas más allá del presupuesto suele significar que el agente está improvisando; volver a anclarlo en el plan lo corrige.

La carpeta que descargarás tiene exactamente dos archivos: AGENTS.md (una referencia operativa de ~600 líneas para cualquier agente general que trabaje con OpenClaw) y CLAUDE.md (una línea: @AGENTS.md, que le dice a Claude Code que importe el brief automáticamente). Ese es todo el entorno. Un archivo más un índice de una línea es toda la "skill" que entregas a tu agente.

Descargar openclaw-with-general-agents.zip

Descomprime en cualquier lugar. Abre una terminal en la carpeta descomprimida. Lanza tu agente general:

cd openclaw-with-general-agents
claude

Tu agente ya tiene cargado el brief. Recorremos seis escenarios uno por uno; cada uno termina con un éxito ejecutable antes de que empiece el siguiente. Este brief asume un agente general capaz (Claude Code u OpenCode ejecutando Claude Sonnet/Opus, GPT-5 o Gemini 2.5 Pro). Los modelos más antiguos o pequeños se desviarán en los escenarios largos; si el primer plan de tu agente en el Escenario 1 se ve vago o genérico en lugar de específico para tu equipo, esa es la señal para cambiar a uno más fuerte antes de avanzar.


Antes del escenario 1: confirma que tu agente cargó el brief (~30 s)

Un solo texto pegado te dice si CLAUDE.md hizo su trabajo y cargó AGENTS.md en el contexto del agente:

¿Qué puedes hacer por OpenClaw?

Si la respuesta nombra trabajo específico de OpenClaw (sondeos de instalación, canales, archivos de cerebro, skills, servidores MCP, programaciones, la auditoría mensual), ya está cargado y listo para el Escenario 1. Si suena como una charla genérica sobre capacidades de IA sin detalles específicos de OpenClaw, la importación no se activó: cierra el agente, confirma que estás dentro de la carpeta descomprimida openclaw-with-general-agents/ y vuelve a lanzarlo.

Qué hay realmente en AGENTS.md (el archivo que tu agente está leyendo ahora)

Nunca necesitarás leer este archivo tú mismo; ese es el punto. Pero conocer su forma te ayuda a hacer mejores preguntas ("guíame por la sección de gotchas" funciona porque la sección existe). El brief cubre, en orden:

PART 1 :: PRINCIPLES (apply everywhere)
Versions checked against
Source of truth, in order ← live docs > this file > the gateway log
Critical: discover before you act ← table of 17 doc-URL pointers
Working pattern (every task) ← read → propose → ask → execute → verify
Safety rails (non-negotiable)
Secrets discipline

PART 2 :: OPERATIONS (by task type)
Install & onboard ← the probe + onboard + paid-default gotcha
Configure ← config CLI + human-path vs agent-path table
Diagnose & recover ← the 5 most common failures and their fixes
Channels (WhatsApp / Telegram / Discord + the TTY constraint)
Memory & brain ← 3 layers, brain files, cross-channel proof
Skills (via ClawHub) · Plugins · MCP servers
The activation dance ← exists → disabled → enabled → configured
Automation (heartbeats + cron + 3 hook flavors)
Multi-agent · ACP · Safety & security
When you don't know what to do ← three-layer fallback
Tone ← how to talk to you

Si una sección concreta de AGENTS.md se vuelve relevante más tarde, puedes pedirle a tu agente que te la explique antes de actuar (por ejemplo, "guíame por la sección Channels de AGENTS.md antes de vincular WhatsApp"). El brief fue escrito para que el agente pueda autodirigirse a partir de él.


Escenario 1: instala el Empleado y hazlo chatear (~15 min)

El objetivo: OpenClaw ejecutándose en tu portátil, Gemini configurado en el nivel gratuito y una respuesta de vuelta cuando dices "hi" en el dashboard. Tres prompts breves para pegar: pedir el plan, aprobar y ejecutar, luego verificar.

1a. Instalar y configurar

Primer prompt: describe lo que quieres y pide el plan.

Quiero poner OpenClaw en ejecución en mi portátil y que me responda mediante el nivel gratuito de Gemini. Antes de tocar nada, explícame tu plan en lenguaje sencillo: qué revisarás primero, qué cambiarás y dónde necesitarás que yo intervenga.

Tu agente lee AGENTS.md, observa tu equipo y propone un plan. Marcará dos lugares donde te necesita: obtener una clave gratuita de Gemini API en aistudio.google.com/app/api-keys y confirmar antes de hacer cambios en tu sistema. Lee el plan. Si parece razonable, continúa. Si algo se siente raro, cuestiona. Pregunta "¿por qué haces eso?" y el agente explicará o ajustará.

Segundo prompt: aprueba y deja que se ejecute.

El plan se ve bien. Avanza paso a paso y dime qué ves en cada paso. Cuando necesites mi clave de Gemini, pausa y dime cómo dártela de forma segura.

El agente pausará y pedirá tu clave. Ve a aistudio.google.com/app/api-keys, crea una (gratis, sin tarjeta de crédito) y sigue la instrucción de manejo seguro que te dé el agente. Debería preferir una variable de entorno en tu terminal antes que pegar la clave en el chat.

1a termina cuando: el agente informa que OpenClaw está instalado, configurado y que la clave de Gemini está en su lugar.

1b. Verificar de extremo a extremo y abrir el dashboard

Tercer prompt: verifica de extremo a extremo y luego pasa al dashboard.

Ahora haz primero tu propia comprobación de extremo a extremo (un "hi" rápido por el gateway desde la línea de comandos, como describe tu brief) y luego abre el dashboard para que yo también pueda probarlo desde el navegador.

Terminas el Escenario 1 cuando: la propia comprobación CLI del agente devolvió una respuesta real, Y el dashboard que abrió para ti en el navegador también responde después de que escribes hi. El pie del dashboard debería mostrar google/gemini-2.5-flash como modelo activo. Si muestra cualquier otra cosa (sobre todo un modelo pro-preview), díselo a tu agente y te cambiará al nivel gratuito antes de que se te cobre.

Por debajo, OpenClaw ahora son tres piezas ejecutándose en tu portátil, todas coordinadas por un servicio en segundo plano que se inicia cuando inicias sesión:

Diagrama de arquitectura: los mensajes fluyen desde tu teléfono por los adaptadores de canal hacia el Gateway (el servicio de larga duración en el puerto 18789 que mantiene sesiones y despacha llamadas a herramientas), luego hacia el Agent (archivos de cerebro y estado en ~/.openclaw/workspace/). El Gateway es el sustrato siempre activo.

Conocerás cada pieza en los escenarios siguientes. Por ahora: está instalado y responde.


Escenario 2: vincula un canal desde tu teléfono (~15 min)

Objetivo: enviar "hi" desde tu teléfono a tu Empleado de IA y recibir una respuesta.

Pega esto en tu agente:

El modelo responde en el dashboard. Ahora quiero hablar con mi Empleado de IA desde mi teléfono. Guíame para vincular WhatsApp (preferido), o usar Telegram o Discord si WhatsApp genera demasiada fricción donde vivo. Explica tu plan y cualquier configuración que deba hacer de mi lado antes de empezar.

Tu agente te dirá qué ruta recomienda y por qué. Para WhatsApp debería sugerir un segundo número con WhatsApp Business en lugar de tu cuenta personal (la biblioteca subyacente no es oficial y Meta puede bloquear cuentas personales). Para Telegram te guiará hasta BotFather. Para Discord te guiará por el Developer Portal y los tres intents de privacidad que debes activar.

Lo único que tu agente no puede hacer por ti: el paso de inicio de sesión usa una pequeña UI basada en terminal para el código QR o el prompt de token, y esa UI no se renderiza bien cuando un agente la ejecuta mediante su herramienta shell. Así que, en algún punto, tu agente pausará y te pedirá que abras una ventana de terminal nueva en la misma carpeta y ejecutes tú mismo el comando de login. Escanea el QR desde tu teléfono (WhatsApp Business → Configuración → Dispositivos vinculados → Vincular un dispositivo) o pega el token del bot que obtuviste de BotFather o del Developer Portal. Dile "vinculado" al agente cuando termines.

Terminas este escenario cuando: envías hi desde tu teléfono al número vinculado y vuelve una respuesta real.

Si también quieres que el Empleado de IA funcione en chats grupales de WhatsApp (no solo uno a uno), dile a tu agente:

Abre el Empleado de IA también para chats grupales. Guíame por lo que cambia y por cómo lo agrego a un grupo de prueba.

Arrastre hacia el escenario 3

Tu teléfono ahora es una ruta autenticada hacia el servicio OpenClaw en tu portátil. Esa vinculación es confianza real que tu teléfono acaba de conceder. Trátala como una credencial: no compartas los archivos de vinculación, no los confirmes en un repositorio público y, si pierdes el portátil, revoca el dispositivo desde tu teléfono (WhatsApp Business → Dispositivos vinculados, o la configuración equivalente para Telegram o Discord).


Escenario 3: delega trabajo real y observa el bucle (~10 min)

El concepto. Lo que separa a un "Empleado de IA" de un chatbot es el bucle de agente: llega una tarea real, el agente decide qué herramientas necesita (web fetch, calendario, lectura de archivos, lo que sea), las llama, lee lo que vuelve y forma una respuesta. Hasta que hayas visto el bucle ejecutarse en una tarea real, "agente" suena a marketing. Después de verlo una vez, puedes nombrar lo que tu Empleado de IA hace realmente cada vez que responde.

Pega esto en tu agente:

El canal funciona. Demostremos que esto es más que un chatbot. Quiero enviar una tarea desde mi teléfono que exija que el agente vaya a hacer algo de verdad. Configura una vista en vivo del log del gateway para que pueda observar el bucle del agente en tiempo real, y dime cuándo estás listo para que envíe la tarea.

Tu agente abre (o te pide que abras) una terminal lateral que transmite el log del gateway en vivo. Cuando esté listo, envía una tarea real que sí delegarías desde tu teléfono. Elige algo de tu vida real, no una demo de tutorial. Algunas formas que funcionan bien para una primera tarea:

  • Búsqueda de investigación: "¿Cuánto cobra <un competidor o proveedor que me importe> por su plan inicial, y qué incluye? Dame un resumen de un párrafo más la URL de la fuente."
  • Web fetch y análisis: "Lee esta URL de artículo que pegaré y dime las tres afirmaciones que más afectan a <mi rol o mi industria>, con una frase sobre si cada una está bien respaldada."
  • Tarea estructurada: "Mira mis últimos cinco correos salientes en <una carpeta o etiqueta que nombre>; dime cuál necesita más un seguimiento y qué debería decir ese seguimiento."

El punto: es el tipo de tarea que ChatGPT rechazaría o haría mal. Necesita que el agente obtenga datos reales, razone sobre ellos y produzca algo estructurado. Tu Empleado de IA obtiene, razona y responde.

En el flujo del log verás pasar unas seis líneas:

  1. Un mensaje entrante que llega por tu canal.
  2. Una llamada al modelo: el bucle del agente envía el mensaje a Gemini y pregunta qué hacer.
  3. Una llamada a herramienta: el agente invoca la herramienta que necesita la tarea (web fetch, lectura de archivos, consulta de calendario).
  4. Un resultado de herramienta: lo que devolvió la herramienta, como un bloque de contenido.
  5. Una segunda llamada al modelo: el bucle envía el resultado de vuelta a Gemini con un prompt para resumir.
  6. Un mensaje saliente: la respuesta que vuelve a tu canal.

Terminas este escenario cuando: viste pasar esa forma de seis líneas y la respuesta llegó a tu teléfono. Esa forma es el bucle. Todo lo que agregas en escenarios posteriores (una nueva skill, una herramienta externa, una tarea programada) solo agrega más herramientas o más disparadores dentro del mismo bucle.


Escenario 4: haz que suene como tú y te recuerde (~15 min)

El comportamiento de tu Empleado de IA proviene de un conjunto de archivos Markdown en su workspace en ~/.openclaw/workspace/. Una instalación nueva trae varios; este escenario toca los tres que más probablemente personalizarás el primer día (SOUL.md, IDENTITY.md, USER.md), y luego te hace crear un cuarto (MEMORY.md, que no existe hasta que el agente escribe en él por primera vez). El resto (AGENTS.md para las propias reglas operativas del agente, separado del AGENTS.md complementario de tu zip; TOOLS.md para la política de herramientas; HEARTBEAT.md para la rutina ambiental) se cubren en Ch56 Lección 4: personaliza el cerebro de tu empleado.

¿Qué archivo edito? Una hoja de referencia para los siete archivos del workspace en ~/.openclaw/workspace/. Fila superior: SOUL.md (voz), AGENTS.md (operaciones), IDENTITY.md (nombre), USER.md (contexto). Fila inferior: TOOLS.md (capacidades), HEARTBEAT.md (rutinas), MEMORY.md (memoria). Cada tarjeta enumera &quot;edita cuando quieras cambiar X&quot; y &quot;no pongas X aquí&quot;. Todos los archivos se inyectan en el system prompt al inicio de la sesión.

  • SOUL.md: personalidad y tono (cómo habla)
  • IDENTITY.md: su propio nombre y rol (cómo se presenta)
  • USER.md: lo que sabe sobre ti (el contexto persistente)
  • MEMORY.md: hechos duraderos que confirma entre canales

Tocarás cada archivo una vez, enviarás un mensaje después de cada edición y sentirás la diferencia. Dos cosas conviene saber antes de empezar: mantén cada archivo ligero (cada línea tiene un costo de contexto que el agente paga en cada turno, incluida cada respuesta de canal y cada tarea programada, así que una o dos páginas por archivo bastan), y no los modifiques sin cuidado más adelante porque dan forma a cada respuesta que envía tu Empleado de IA.

Antes de iniciar los subescenarios, pega esto en tu agente general para una orientación rápida:

Orientación rápida antes de personalizar nada: abre mi workspace en ~/.openclaw/workspace/ y dime en una línea por archivo qué hay actualmente en SOUL.md, IDENTITY.md y USER.md. Solo los valores predeterminados; los cambiaremos después y luego crearemos MEMORY.md juntos.

Recibirás una instantánea por archivo de dónde empiezan las cosas. Las próximas ediciones se sentirán como cambios en archivos específicos que ya viste, no como ediciones a archivos abstractos que no conoces.

Las ediciones del cerebro necesitan /reset para cargarse (léelo una vez; aplica a 4a-4d)

Después de cualquier edición a un archivo del workspace (SOUL.md, IDENTITY.md, USER.md, MEMORY.md), el contenido nuevo queda en disco, pero la sesión de OpenClaw en ejecución sigue usando su instantánea en caché del system prompt. Envía /reset desde tu teléfono (el canal vinculado) para decirle a OpenClaw que reconstruya el system prompt desde disco. Si omitiste el Escenario 2 y no tienes un canal vinculado, envía /reset desde el chat del dashboard en http://127.0.0.1:18789. Cada subescenario de abajo asume este paso entre la edición y el mensaje de prueba.

4a. SOUL.md: cambia su voz

Pega esto en tu agente general:

Revisa SOUL.md y sugiere tres cambios pequeños que harían las respuestas más directas y menos vacilantes (o el estilo que veas que falta). Muéstrame primero el diff; aplica solo después de que apruebe.

Después de aplicar la edición, envía /reset desde tu teléfono y luego un mensaje casual como How are you today?

Termina cuando: el tono de la respuesta sea visiblemente distinto de la respuesta plana a "hi" que recibiste en el Escenario 1.

4b. IDENTITY.md: dale un nombre

Pega esto en tu agente general:

Dale un nombre y un rol. Quiero que se presente como "Atlas, mi asistente de investigación" (o elige el nombre y rol que te parezcan adecuados y consúltamelos). Muéstrame primero el diff.

Después de aplicar la edición, envía /reset y pregunta Who are you? desde tu teléfono.

Termina cuando: se presente con el nuevo nombre y rol, no con el valor predeterminado.

4c. USER.md: enséñale sobre ti

Pega esto en tu agente general:

Enséñale sobre mí. Agrega mi nombre completo, mi rol, mi zona horaria y los tres temas en los que necesito ayuda con más frecuencia. Pregúntame cualquier cosa que aún no sepas y muéstrame el diff antes de aplicar.

Te preguntará lo que falte. Después de aplicar la edición, envía /reset y pregunta What should I prioritize this afternoon, given what you know about me?

Termina cuando: la respuesta tenga en cuenta tu zona horaria y tus temas principales, no consejos genéricos.

4d. MEMORY.md: confirmar entre canales

Los tres primeros archivos moldean la voz. MEMORY.md es distinto: solo se carga en la sesión principal del agente, así que cualquier cosa que quieras que sepa entre canales debe confirmarse deliberadamente. La escalera de cuatro pasos de abajo demuestra tres capas (memoria de sesión, caché de canal, confirmación a largo plazo) una por una.

El hecho de prueba de abajo debe ser algo temporal y específico de tu semana, no un hecho estable de identidad: los hechos estables como tu nombre ya están en USER.md desde 4c, así que la pared no se activaría si usáramos esos. Elige algo real en curso: "Estoy intentando terminar [un proyecto real] antes del viernes" o "Estoy preparando un pitch para [un cliente real] el miércoles" funciona.

Diagrama de capas de memoria: tres capas horizontales apiladas. La memoria de sesión vive en RAM y solo sobrevive hasta reset. La memoria de canal vive en disco por canal y sobrevive a reinicios del gateway. La memoria a largo plazo (MEMORY.md en ~/.openclaw/workspace/) es la única capa que requiere una confirmación deliberada para cargarse entre canales.

Cuatro pasos. (Solo envías tres mensajes reales; el resto son consultas breves).

  1. Desde tu canal vinculado: Quick context: I'm trying to finish [your real in-flight thing] by Friday. Hold onto this. Luego, de inmediato: What am I trying to finish by Friday? Responde (memoria de sesión + memoria de canal, ambas automáticas).
  2. Desde el chat del dashboard (http://127.0.0.1:18789, una sesión distinta): What am I trying to finish by Friday? No lo sabe. Esa es la pared: la memoria de canal es por canal, no se comparte entre ellos.
  3. De vuelta en tu canal vinculado: Commit my Friday goal to your long-term memory. Tu agente crea MEMORY.md (no existía hasta esta primera confirmación) y confirma.
  4. Desde el chat del dashboard otra vez (envía primero /reset para cargar el MEMORY.md recién confirmado): What am I trying to finish by Friday? Ahora lo sabe. La confirmación deliberada cruzó la pared.

Para el modelo completo de memoria (casos límite, cómo interactúa /reset con cada capa, qué pasa durante reinicios del gateway), consulta Ch56 Lección 5: memoria y comandos.

La escalera de voz y memoria termina cuando: el paso 4 funciona. Tu Empleado de IA ahora suena como tú, se presenta como quieres, conoce contexto sobre ti y te recuerda entre canales porque algo se confirmó deliberadamente, no porque solo estuviera en caché. Falta un paso más (4e) antes de terminar por completo el Escenario 4.

4e. Respalda la identidad que acabas de construir

El workspace en ~/.openclaw/workspace/ ES tu Empleado de IA: los archivos de cerebro que acabas de personalizar, más los otros Markdown del workspace (reglas operativas, política de herramientas, rutina de heartbeat) y cualquier cosa que agregues después (programaciones del Escenario 6, skills instaladas, etc.). Si tu portátil muere esta noche, lo pierdes todo a menos que viva en otro lugar. Trata todo el workspace como dotfiles.

Pega esto en tu agente general:

Respalda el workspace de mi agente en ~/.openclaw/workspace/ en un repositorio privado de GitHub para que no lo pierda si mi portátil muere. Incluye todos los archivos del workspace (los archivos de cerebro SOUL/IDENTITY/USER/MEMORY más AGENTS.md, TOOLS.md, HEARTBEAT.md y cualquier agregado futuro como archivos de programación), y excluye secretos y cachés de sesión. Configúralo de la forma más sencilla según las herramientas Git que ya tenga, y cuando termines dame un one-liner que pueda guardar en un lugar seguro para volver a clonar esto en un portátil nuevo después de instalar OpenClaw allí.

Terminas el Escenario 4 cuando: el repositorio privado existe en GitHub, tu workspace está subido (los archivos de cerebro más los otros Markdown del workspace) y tienes guardado un one-liner de recuperación (pégalo en una app de notas o en un gestor de contraseñas que encuentres después). La identidad de tu Empleado de IA ahora sobrevive a una pérdida del portátil.


Escenario 5: extiéndelo con una skill y una herramienta (~15 min)

El concepto. Dos formas distintas de agregar capacidades a tu Empleado de IA, con formas distintas:

  • Una skill es una carpeta que contiene un archivo SKILL.md: expertise que el agente invoca automáticamente cuando una tarea coincide. Las skills siguen una especificación cross-runtime (agentskills.io), así que la misma carpeta funciona en OpenClaw, Claude Code, OpenCode y más de 50 runtimes. Dos registros distribuyen contra la especificación: skills.sh (amplio, cross-runtime) y ClawHub (curado para OpenClaw, más revisado).
  • Una herramienta MCP es capacidad que el agente puede llamar: un servicio externo que expone funciones mediante Model Context Protocol (obtener la hora actual en cualquier zona, consultar una base de datos, enviar una invitación de calendario, etc.). Configura, reinicia, verifica; el agente gana herramientas nuevas sin escribir código.

Las skills inyectan know-how; las herramientas agregan alcance. Ambas siguen la misma forma: instalar (o configurar), reiniciar el gateway para que OpenClaw las detecte, verificar que están cargadas y luego probar desde tu teléfono.

Cada prompt de abajo le entrega al agente una URL de lección de Ch56 más tu USER.md. La lección contiene los comandos exactos; tú te quedas en lenguaje natural mientras el agente lee, planifica, ejecuta y verifica.

5a. Agrega una skill que encaje con algo que realmente haces

Aviso: una skill instalada que no se activa casi siempre es un desajuste de descripción. La instalación funcionó; tu mensaje simplemente no coincidió con la descripción que dispara la skill. Eso es información sobre la descripción, no una instalación rota: el log del gateway muestra el evento de carga de la skill cuando sí se activa.

Primer prompt: lee la lección, obtiene la skill de descubrimiento, propone.

Lee https://agentfactory.panaversity.org/docs/Building-OpenClaw-Apps/meet-your-personal-ai-employee/install-skills-discover-ecosystem para entender cómo OpenClaw instala skills (especificación cross-runtime, scopes, reinicio del gateway). Luego revisa si la skill find-skills ya está instalada. Si no lo está, instala solo esa skill desde skills.sh con scope Global (para que llegue tanto a Claude Code como a OpenClaw) y reinicia el gateway. Cuando find-skills esté disponible, úsala para buscar en skills.sh contra mi USER.md y propone dos o tres skills reales que encajen con mi forma de trabajar. Para cada una, dime qué dispara su descripción (una descripción precisa se activa cuando debe; una vaga nunca se activa), cómo verificaría que realmente se activó frente a una respuesta vanilla, y cuál elegirías primero. No instales todavía la elegida; quiero escoger primero.

Recibes una lista breve basada en tu trabajo real, con URLs reales de instalación. Elige una.

Segundo prompt: instala en ambos runtimes y luego verifica.

Instala [tu elección] con scope Global para que llegue a la vez a los directorios de skills de Claude Code y OpenClaw, y luego reinicia el gateway. Dime en qué directorios escribió para que pueda verlo. Léeme la descripción de SKILL.md para saber exactamente qué enviar desde mi canal vinculado para activarla, y qué observar en la respuesta para probar que la skill se activó frente a una respuesta vanilla del modelo.

Desde tu canal vinculado, envía la entrada de prueba que sugirió tu agente (una transcripción de reunión, un borrador de correo, un fragmento de código, lo que corresponda a la skill).

5a termina cuando: tu agente confirmó que la skill está instalada (y te mostró dónde) Y la entrada de prueba produce una respuesta con el formato o encuadre específico de la skill (no una respuesta genérica). Si la skill no se activa, suele ser un desajuste de descripción (tu mensaje no dispara la descripción de la skill) o un reinicio omitido; pega el prompt universal de recuperación.

5b. Conecta una herramienta externa (sin credenciales)

El MCP hello-world canónico es mcp-server-time: sin clave de API, dos herramientas (get_current_time, convert_time). Es la prueba estándar de "conectaste una herramienta externa". Atención: MCP falla en silencio. Un servidor mal configurado no produce error en el chat; el agente simplemente no obtiene la herramienta. El log del gateway es el único diagnóstico.

Primer prompt: lee la lección, configura, verifica.

Lee https://agentfactory.panaversity.org/docs/Building-OpenClaw-Apps/meet-your-personal-ai-employee/connect-external-tools para entender la forma configurar-luego-reiniciar y el patrón Silent Failure. Luego configura el ejemplo mcp-server-time de la lección (no necesita clave de API). Muéstrame primero el plan y luego ejecuta. Después de reiniciar el gateway, prueba que time esté registrado con 2 herramientas. Si falta o muestra 0 herramientas, eso es Silent Failure: lee el log del gateway, dime en lenguaje sencillo qué ves y propón una corrección.

El agente recorre la lección, ejecuta los comandos y te muestra la lista de registro. La línea que quieres ver: time con 2 herramientas. Si no está, el agente diagnostica; tú apruebas la corrección.

Segundo prompt: dispara la herramienta desde tu teléfono y observa la insignia del dashboard.

El MCP de time está conectado. Haré una pregunta real de zona horaria desde mi canal vinculado. Sigue el log del gateway en vivo para que veamos get_current_time invocado en tiempo real, y dime qué observar en el dashboard en http://127.0.0.1:18789: debería haber una insignia de herramienta que muestre que el agente usó el MCP de time en lugar de adivinar desde datos de entrenamiento.

Desde tu teléfono, haz una pregunta real de hora que te importe. Ejemplos:

  • "Si envío esta propuesta a mi cliente en <su ciudad> ahora mismo, ¿qué hora local tiene? ¿Es una hora razonable para enviarle un correo?"
  • "Mi equipo en <otra zona horaria>, ¿en cuántas horas termina su jornada laboral? ¿Debería esperar hasta mañana por la mañana en mi hora?"
  • "¿Cuál es la fecha límite en <la zona horaria donde se define el plazo> si ahora son las 3pm en mi hora?"

5b termina cuando: tu agente te mostró que el servidor time está registrado con sus 2 herramientas, Y una pregunta real de hora desde tu teléfono produce una hora específica en vivo (no una regla genérica de zonas horarias), Y el dashboard muestra una insignia de herramienta get_current_time en la respuesta. La insignia es la prueba de que el agente llamó a la herramienta en lugar de alucinar.

Terminas el Escenario 5 cuando: se cumplen las condiciones de finalización de 5a y 5b.

En el camino, tu agente nombra explícitamente la danza de activación: cada extensión de OpenClaw (skills, plugins, servidores MCP, canales, hooks) pasa por los mismos cuatro pasos: existe → desactivada por defecto → habilitada → configurada (reinicio). Una vez que ves el patrón, cada nueva función se siente familiar en lugar de rota al primer intento.

Diagrama de la danza de activación: ciclo de cuatro pasos (Exists, Disabled by default, Enabled, Configured) con flechas que muestran el orden. Cada extensión de OpenClaw sigue estos cuatro pasos. Cuando una nueva función se sienta rota al primer intento, recorre los cuatro.

Arrastre hacia el escenario 6

Agrega las incorporaciones de este escenario a tu USER.md para que los trabajos programados (lo siguiente) sepan que existen. Pega esto en tu agente:

Agrega la skill y la herramienta MCP que acabamos de configurar a mi USER.md para que, cuando se ejecuten trabajos programados, sepan qué está disponible. Luego confirma y sube el USER.md actualizado a mi repo de respaldo de 4e.

Las capacidades de tu Empleado de IA, no solo su identidad, ahora sobreviven a una pérdida del portátil.


Escenario 6: haz que actúe por su cuenta (~15 min)

El concepto. Hasta ahora has enviado mensajes al Empleado de IA y ha respondido. Las programaciones invierten eso: el agente actúa según un reloj o intervalo, sin que le envíes un mensaje. OpenClaw tiene tres sabores de proactividad:

  • Cron para horas precisas ("cada mañana a las 7am", "cada lunes a las 9am", "al final del día"). Es lo que más usarás. Tu vida real tiene horas de reloj.
  • Heartbeat para revisiones ambientales a una cadencia fija ("cada 30 minutos escanea urgentes sin leer", "cada 4 horas mira el calendario para notas de preparación"). Úsalo cuando el disparador sea "revisar algo periódicamente" en lugar de "haz esto exactamente a X hora".
  • Hooks para disparadores de evento (se dispara un webhook, se reinicia una sesión). Fuera del alcance aquí; consulta Ch56 si los necesitas.

Este escenario tiene dos partes. La parte 6a es una demo rápida de heartbeat que prueba que el mecanismo proactivo está conectado. La parte 6b es la que conservarás: una programación real (normalmente una tarea cron) que de verdad te servirá mañana. No te detengas después de 6a; una demo que desactivas no es la dimensión proactiva. Una programación real que se ejecuta a diario sí lo es.

6a. Observa dispararse un heartbeat de demo (y luego apágalo)

Pega esto en tu agente:

Programa un heartbeat de demo de cinco minutos con una tarea de bajo costo: cada cinco minutos, revisa el log del gateway en busca de errores y publica un resumen de una línea. Cuando vea que uno se dispara en el log, desactiva solo esta demo para que no consuma mi cuota de Gemini. Después agregaremos una programación real.

Termina cuando: el log muestra una llamada a herramienta impulsada por heartbeat Y la demo queda desactivada. Una ventana de cinco minutos observando el log es razonable.

6b. Programa algo que realmente conservarás (cron o heartbeat)

Una demo que desactivas no prueba nada sobre si tu Empleado de IA será una herramienta que usarás mañana. Una programación real sí. Para la mayoría de las primeras programaciones que se conservan, cron es la opción correcta: tus días de trabajo reales se organizan alrededor de horas de reloj, no intervalos de revisión.

Primer prompt: sugiere opciones basadas en lo que sabes de mí.

Quiero agregar una programación real que me sirva de verdad, no una demo que olvidaré. Mira lo que sabes de mí desde USER.md y sugiere dos o tres opciones que podría conservar. Para cada una, dime qué haría, cuándo se dispararía y si cron (hora precisa) o heartbeat (intervalo ambiental) es el primitivo correcto. Elegiré una.

Tu agente ofrecerá opciones basadas en tu USER.md (un resumen de las 7am, una lista de prioridades de lunes por la mañana, una revisión de fin de día de compromisos pendientes, un escaneo de calendario por intervalos, etc.). Elige la que se sienta más útil mañana.

Segundo prompt: configúrala y respáldala.

Vamos con [nombra tu elección]. Configúrala, confirma cuándo se disparará la próxima vez y confirma el archivo de programación en mi repo de respaldo de 4e para que sobreviva a una pérdida del portátil.

Termina cuando: la programación que elegiste está en ejecución, confirmada en el repo de respaldo y tu agente te dijo cuándo se disparará la próxima vez. Déjala encendida. (Si mañana te arrepientes, puedes desactivar solo esa programación sin tocar nada más).


Escenario 7: tu auditoría mensual del Empleado de IA (~10 min/mes)

El concepto. Tu Empleado de IA acumula cosas con el tiempo: skills que instalaste, credenciales que capturó, herramientas MCP que conectaste, entradas de memoria que escribió, llamadas autónomas a herramientas en los logs. Cada incorporación es una pequeña decisión que aprobaste; la cadena se compone de forma opaca. La defensa no es la vigilancia en el momento de la instalación (nunca detectarías lo que todavía no existe); es una revisión de diez minutos con cadencia fija. Este escenario no forma parte de tus primeros noventa minutos; es el movimiento que haces una vez al mes durante el resto de la vida de tu Empleado de IA.

Pega esto en tu agente (cuando llegue el momento):

Ejecuta mi auditoría mensual de OpenClaw. Recorre todo lo que se instaló, almacenó, programó o escribió desde la última auditoría, y marca cualquier cosa que no aprobé explícitamente, cualquier elemento que parezca revelador en memoria y cualquier configuración de aprobación que esté más laxa de lo que debería. Resume todo en un único informe breve que pueda aprobar o recortar.

Tu agente recorre el inventario en ejecución (skills, entradas de memoria, aprobaciones, herramientas MCP, llamadas recientes a herramientas) más las credenciales almacenadas, y luego escribe un único informe que nombra qué cambió desde la última auditoría y dónde deberías endurecer o recortar.

Termina cuando: has dedicado diez minutos a revisar el informe y has tomado al menos una decisión (eliminar una credencial olvidada, revocar una aprobación demasiado amplia, podar una entrada de memoria obsoleta, desinstalar una skill sin uso). Marca tu calendario para el próximo mes.


Por qué esto funciona

Dos cosas se mantienen frescas; una cosa se mantiene duradera.

Fresca #1: Los escenarios de esta página viven en el sitio del libro. El agente obtiene la versión actual en cada sesión (le dices en qué escenario estás y lee la sección relevante).

Fresca #2: Los comandos actuales de OpenClaw viven en docs.openclaw.ai/llms.txt, un índice de toda la documentación preparado para LLM. Tu agente los lee frescos cada vez que está a punto de ejecutar un comando del que no está seguro. OpenClaw avanza rápido; así es como el brief se mantiene preciso incluso cuando se desvían flags individuales.

Duradera: AGENTS.md (la referencia operativa de tu zip de dos archivos) contiene qué es OpenClaw, cómo navegar su documentación, las salvaguardas (sin sudo sin preguntar, sin modelos pagados, sin escribir claves fuera de ~/.openclaw/), los patrones de recuperación y la danza de activación. Cubre toda la plataforma: instalación, depuración, canales, memoria, skills, plugins, MCP, automatización, multiagente, ACP y sandboxing. Es más largo que esta página porque cubre todo lo que se le podría pedir a un agente general que haga con OpenClaw, no solo los seis escenarios de arriba. Nada en la carpeta queda obsoleto, así que la descargas una vez y la reutilizas.

La inteligencia no está en los archivos; está en tu agente general leyéndolos y aplicándolos a lo que pidas después. No recorriste seis demos desconectadas; ensamblaste una herramienta que tocarás mañana.


Qué se está ejecutando realmente ahora

No son seis demos: es un sistema. Inventario de lo que persiste después del Escenario 6:

ArtefactoQué es realmentePor qué importa mañana
Servicio en segundo planoOpenClaw, que se inicia automáticamente con tu SOTu Empleado de IA sobrevive al cierre de la terminal y al reinicio
Vinculación de canalUn enlace confiable entre tu teléfono y tu portátilLa ruta que usa tu teléfono para llegar al servicio
Archivos del workspaceSiete archivos Markdown en ~/.openclaw/workspace/La identidad, el contexto, el comportamiento y la memoria de tu Empleado de IA
Respaldo en GitHubRepo privado del workspace más un one-liner de recuperaciónEl workspace sobrevive a la pérdida del portátil
Una skill instaladaUn paquete de expertise de ClawHubUna extensión real de know-how que tu agente autoinvoca
Una herramienta externaUn servidor MCP que el agente puede llamarUn servicio externo real disponible para el agente
Una tarea programadaUna tarea cron o heartbeat que se dispara sin tiUna cosa que se ejecuta para ti en un horario

Esa es la imagen. Ninguno de estos son demos que recorriste y desactivaste; todos son piezas de una herramienta que tocarás mañana.

Un día de trabajo con esto se ve así: tu teléfono vibra a las 7am con la programación que elegiste (una tarea cron, si ese resumen de las 7am es lo que conservas); a media mañana respondes con una pregunta rápida que dispara el MCP de time o la skill de S5; a media tarde le pides al agente que redacte respuestas a tres correos; al final del día confirmas un dato nuevo en memoria a largo plazo. Nunca abriste el portátil.

Si más adelante falta alguno de esos artefactos (pérdida del portátil, eliminación accidental, una actualización de versión que salió mal), el repo de GitHub de 4e más una instalación nueva de OpenClaw más el one-liner de recuperación te devuelven a esta imagen exacta.

Antes de conectar un canal orientado al público

El curso acelerado asume que el Empleado de IA solo lee mensajes de ti. Si alguna vez planeas conectar un canal orientado al público (una bandeja de soporte, un formulario de contacto, cualquier cosa donde puedan escribir desconocidos), detente aquí y lee primero Capítulo 56 Lección 14: controla las herramientas de tu agente y Lección 16: aísla con NemoClaw. El patrón de agente lector en sandbox es tu defensa estructural contra la inyección de prompts (la amenaza donde instrucciones adversarias ocultas en un correo podrían engañar a tu Empleado de IA para que tome acciones en tu nombre). La vinculación bloquea quién puede escribirle a tu bot; el sandboxing bloquea qué puede hacer tu bot con lo que lee. Ambas importan.


Adónde ir después

Después del Escenario 6, tienes un Empleado de IA funcional con su workspace personalizado (voz, identidad, lo que sabe sobre ti, memoria confirmada), el workspace respaldado en GitHub, una skill instalada, una herramienta externa y una tarea programada que se dispara para ti. Esa es la mayor parte de la superficie que la mayoría de la gente necesita.

Para el recorrido paciente de cualquier tema que tocó esta página (o cualquier cosa que omitió), Capítulo 56 tiene diecisiete lecciones que cubren toda la plataforma. Mapa rápido:

Quieres...Ve a
Respuestas de voz (audio en WhatsApp / Telegram / Discord)Ch56 L10: dale una voz
Patrón de agente lector (seguridad con correos no confiables, sandboxing)Ch56 L14: controla las herramientas de tu agente
Ejecutar un segundo agente especializado (routing, identidad separada)Ch56 L11: agrega un segundo agente
Que el Empleado de IA convoque agentes generales (el cierre de coreografía /acp spawn, para desarrolladores)Ch56 L13: orquesta otros agentes
Modos de sandboxing y endurecimiento de seguridadCh56 L14: controla las herramientas de tu agente, L16: aísla con NemoClaw
Más canales (Slack, Matrix, Signal, iMessage, Zalo)Pregunta a tu agente general: "Guíame por la configuración de <canal> usando tu brief."

Para todo lo demás, tu AGENTS.md ya cubre la mayor parte de la plataforma. Pregunta a tu agente general: "¿Qué dice AGENTS.md sobre sandboxing?" El brief es la referencia; la página es el recorrido.

La meta-lección: lo más valioso de tu carpeta descomprimida es AGENTS.md. Dedica una tarde a leerlo de principio a fin (no por los pasos de instalación, sino por la forma del documento: la tabla discover-before-act, la tabla human-path-vs-agent-path, el patrón de trabajo, el catálogo de gotchas, la danza de activación). Luego escribe uno para la próxima herramienta que pongas frente a un agente general. El patrón es portable: toda herramienta con una superficie aprendible tiene una "pequeña skill" que vale la pena escribir. OpenClaw fue el ejemplo temprano porque la instalación se beneficia activamente de una configuración impulsada por agentes; encontrarás otros. Escribe la próxima.


Apéndice: conecta Google Workspace

Marco inicial. Quince minutos o más de pantallas OAuth de Google Cloud Platform, en una cuenta real que deberías tratar como desechable. Los flujos de consentimiento de Google tienen tiempo limitado (algunos enlaces expiran en diez minutos) y muchos clics. Ese es el precio de integrar Google específicamente; no tiene nada que ver con OpenClaw y no hará más fácil ninguna otra integración.

Pega esto en tu agente:

Conecta Google Workspace (Gmail, Calendar, Drive) a mi Empleado de IA. Usa una cuenta de Google desechable; guíame por los pasos de GCP y OAuth con condiciones STOP explícitas si alguna pantalla de consentimiento pide scopes que no me dijiste que concediera.

Tu agente obtiene la documentación en vivo del plugin de Workspace, instala el plugin (normalmente llamado gog o similar; verifica antes de asumir), abre el flujo OAuth en tu navegador, captura el token de consentimiento mediante una referencia respaldada por variable de entorno y verifica con una pequeña sonda (por ejemplo, "list my next three calendar events").

Condiciones STOP. Cualquier error de cuota o permisos que se repita después de un intento de corrección. Cualquier señal de que se te pide conceder scopes que el agente no te dijo que concedieras. Cualquier indicio de que el propio proyecto de GCP está mal configurado (este apéndice asume una cuenta desechable limpia; depurar la auth de un proyecto GCP existente queda muy fuera del alcance del curso acelerado).

Puntero. El recorrido profundo está en Ch56 Lección 12: conecta Google Workspace.


Ayuda de estudio con flashcards