General Agents के साथ OpenClaw: 90-मिनट का त्वरित पाठ्यक्रम
6 परिदृश्य, शून्य से Personal AI Employee तक
OpenClaw आपका Personal AI Employee है: एक open-source सहायक जो आपके अपने लैपटॉप पर चलता है और उन्हीं messaging apps से जवाब देता है जिन्हें आप पहले से उपयोग करते हैं (WhatsApp, Telegram, Discord, Slack, iMessage, और भी बहुत कुछ)।
यह वही project है जिसने साबित किया कि AI Employees वास्तविक हैं, वे काम करते हैं, और लोग उन्हें चाहते हैं। OpenClaw 2026 की सबसे तेज़ी से बढ़ने वाली open-source परियोजना बना, और शुरुआती महीनों में इसे सैकड़ों हज़ार GitHub stars मिले। Jensen Huang ने GTC 2026 में इसे "the next ChatGPT" कहा; NVIDIA ने इसके ऊपर NemoClaw बनाया।
इन 90 मिनट के अंत तक आपके पास एक AI Employee होगा: आपके फ़ोन पर ऐसा Employee जो संदेशों का जवाब देता है, tools और बाहरी services का उपयोग करता है, खुद को आपके हिसाब से ढालता है, अपने schedule पर चलता है, और आपके लैपटॉप पर रहता है। यह ऐसा chatbot नहीं होगा जहाँ आप जाते हैं; यह ऐसा worker होगा जिसे आप काम सौंपते हैं।
यह त्वरित पाठ्यक्रम कैसे काम करता है। आप एक छोटा फ़ोल्डर डाउनलोड करते हैं, उसे अपने general agent (Claude Code, OpenCode, Cowork, या OpenCowork सभी काम करते हैं; हर एक फ़ोल्डर context से AGENTS.md को अपने आप import करता है) को देते हैं, और छह परिदृश्यों से गुजरते हैं। Agent फ़ोल्डर पढ़ता है, OpenClaw इंस्टॉल करके चलाता है, आपके फ़ोन को connect करता है, नई skills लेता है, अपना brain customize करता है, और एक ऐसा task schedule करता है जो आपके बिना चलता है। आप दिशा देते हैं; agent काम करता है; OpenClaw आपका Personal AI Employee बन जाता है।
नीचे दिए गए छह परिदृश्य agent-agnostic हैं: हर "इसे अपने agent में paste करें" prompt सभी tools में समान है। सिर्फ़ launch step अलग है: CLI agents (Claude Code, OpenCode) unzipped फ़ोल्डर में टर्मिनल से launch होते हैं; desktop agents (Cowork, OpenCowork) app में फ़ोल्डर खोलकर launch होते हैं। जो आपने पहले से इंस्टॉल किया है, वही चुनें। Zip में दिया गया brief चारों के लिए एक जैसा काम करता है।
पढ़ने का रास्ता · prerequisites · विस्तृत version (खोलने के लिए click करें)
पढ़ने का रास्ता (छह परिदृश्य + एक मासिक आदत):
- इंस्टॉल करके chat करें local डैशबोर्ड में। ~15 मिनट।
- Channel pair करें अपने फ़ोन से (WhatsApp / Telegram / Discord)। ~15 मिनट।
- वास्तविक काम सौंपें और agent loop देखें। ~10 मिनट।
- इसे आपकी तरह बोलना और आपको याद रखना सिखाएँ + identity को GitHub पर back up करें। ~15 मिनट।
- इसे extend करें एक skill + एक external tool से। ~15 मिनट।
- इसे अपने आप काम करने दें एक cron job (या heartbeat) से जो आपके लिए चलता है। ~15 मिनट।
- (महीने में एक बार, आज नहीं) Audit चलाएँ। समय आने पर ~10 मिनट।
हर परिदृश्य runnable success पर खत्म होता है। अगर 90 मिनट एक बैठक में बहुत ज़्यादा हैं, तो इन्हें अलग बैठकों की तरह करें; state इनके बीच बनी रहती है। एक optional appendix Google Workspace को cover करता है; voice, multi-agent safety, और ACP-spawn dev finale के लिए Chapter 56 देखें।
Prerequisites (तीन चीज़ें; यह पृष्ठ इन्हें assume करता है):
- Claude Code या OpenCode इंस्टॉल हो। कोई भी चलेगा। अगर दोनों में से कोई नहीं है, तो पहले Agentic Coding Crash Course करें।
- आपने the Agentic Coding Crash Course कर लिया है। आप tool calls मंज़ूर कर सकते हैं, agent output पढ़ सकते हैं, और पहचान सकते हैं कि agent कब अटक गया है। हम उन्हीं moves पर निर्भर करते हैं; उन्हें फिर से समझाते नहीं।
- Node.js 22.16 या बाद का version (Node 24 recommended)। टर्मिनल में
node --versionचलाएँ। अगरv22.16से नीचे है, तो nodejs.org/en/download से current release इंस्टॉल करें (अगर आप पूछेंगे तो आपका general agent आपको step-by-step guide करेगा)।
धीमा, विस्तार वाला version चाहिए? Chapter 56: Meet Your Personal AI Employee में यही material सत्रह lessons में है, साथ में voice, multi-agent, security, और deployment भी। अगर यहाँ कुछ बहुत तेज़ लगे, तो matching Ch56 lesson पर जाएँ और वापस आएँ।
Collaboration pattern
इस पृष्ठ पर तीन actors साथ काम करते हैं। Diagram relationship को ठोस बनाता है:
फिर हर परिदृश्य वही five-step rhythm उपयोग करता है:
- आप एक वाक्य paste करते हैं अपने general agent में। यह brief है, script नहीं। आप बताते हैं कि आप क्या चाहते हैं; steps गिनाते नहीं।
- आपका agent
AGENTS.mdconsult करता है (यह पहले से उसके context में है: फ़ोल्डर मेंCLAUDE.mdsession शुरू होने पर इसे अपने आप import करता है, इसलिए कोई fetch step नहीं) और plan propose करता है। वह उन commands के नाम बताएगा जिन्हें वह चलाना चाहता है और decision points flag करेगा (कौन सा channel, कौन सी skill, क्या याद रखना है)। पहले destructive command से पहले वह पूछता है। - आप मंज़ूर करते हैं और देखते हैं। Agent install commands चलाता है, configuration set करता है, background service restart करता है, live log output देखता है, और आपको दिखाता है कि उसे क्या दिख रहा है। जब वह किसी known gotcha से टकराता है, तो pattern पहचानता है और documented fix apply करता है।
- आपका agent seam पर रुकता है। कुछ moves सिर्फ़ आप कर सकते हैं: Gemini key लेने के लिए
aistudio.google.comपर जाना, फ़ोन से QR scan करना, Google की OAuth screens में click करना, आवाज़ी संदेश चलते हुए सुनना। Agent seam का नाम बताता है और इंतज़ार करता है। - आप तब पूरा करते हैं जब एक observable चीज़ होती है। डैशबोर्ड में वास्तविक जवाब। आपके फ़ोन से आया संदेश वापस जवाब पाता है। Disk पर एक फ़ाइल दिखाई देती है। हर परिदृश्य बताता है कि किस चीज़ का इंतज़ार करना है।
बस इतना ही। Agent वही करता है जो agent अच्छी तरह करता है: इंस्टॉल, configure, debug, restart, verify, recover। आप वही करते हैं जो सिर्फ़ आप कर सकते हैं: तय करना, मंज़ूरी देना, और उन चीज़ों पर काम करना जो आपके फ़ोन या accounts से जुड़ी हैं। यह rhythm (goal describe करना, plan लेना, मंज़ूरी देना, हर step पर verification के साथ execute करना) वही prompting pattern है जो AI Prompting in 2026 crash course में सिखाया गया है; नीचे हर परिदृश्य instructions की दीवार के बजाय दो छोटे paste prompts उपयोग करता है, ताकि आप rhythm का अनुभव करें, सिर्फ़ उसके बारे में पढ़ें नहीं।
अगर किसी भी बिंदु पर कुछ गड़बड़ हो जाए, तो आपको CLI commands या error codes जानने की ज़रूरत नहीं। इसे अपने agent में paste करें:
कुछ काम नहीं किया। Gateway log पढ़ें, मुझे सरल भाषा में बताएं कि आपको क्या दिख रहा है, और ऐसा fix propose करें जिसे मैं मंज़ूर कर सकूँ।
आपका agent log पढ़ता है, बताता है कि उसे क्या दिख रहा है, और fix propose करता है। आप मंज़ूर करते हैं। इस त्वरित पाठ्यक्रम में हर परिदृश्य के लिए यही recovery loop है।
हर परिदृश्य का budgeted time है (H2 में दिखाया गया है)। अगर आप उस budget के 2x से आगे निकल जाते हैं (उदाहरण के लिए 15-मिनट वाले परिदृश्य पर 30 मिनट से आगे), तो agent को वापस खींचें और paste करें: "हमें क्या block कर रहा है, एक वाक्य में? वहाँ से re-plan करते हैं।" Budget से बहुत आगे spin करना आम तौर पर मतलब है कि agent improvise कर रहा है; plan पर re-anchor करने से यह fix हो जाता है।
जिस फ़ोल्डर को आप डाउनलोड करेंगे उसमें ठीक दो फ़ाइलें हैं: AGENTS.md (OpenClaw से जुड़ा काम कर रहे किसी भी general agent के लिए ~600-line operational reference) और CLAUDE.md (एक line: @AGENTS.md, जो Claude Code को brief अपने आप import करने को कहती है)। यही पूरा environment है। एक फ़ाइल plus एक one-line index ही वह पूरी "skill" है जो आप अपने agent को देते हैं।
कहीं भी unzip करें। Unzipped फ़ोल्डर में टर्मिनल खोलें। अपना general agent launch करें:
cd openclaw-with-general-agents
claude
अब आपके agent के पास brief loaded है। हम छह परिदृश्य एक-एक करके चलेंगे; हर एक अगले के शुरू होने से पहले runnable success पर खत्म होगा। यह brief एक capable general agent assume करता है (Claude Code, या OpenCode जो Claude Sonnet/Opus, GPT-5, या Gemini 2.5 Pro चला रहा हो)। Older या smaller models लंबे परिदृश्यों में drift करेंगे; अगर Scenario 1 में आपके agent का पहला plan आपकी machine के हिसाब से specific होने के बजाय धुंधला या सामान्य लगे, तो आगे बढ़ने से पहले stronger one पर switch करने का यही signal है।
Scenario 1 से पहले: confirm करें कि आपके agent ने brief load किया है (~30 sec)
एक paste बताता है कि CLAUDE.md ने अपना काम किया या नहीं और AGENTS.md को आपके agent के context में pull किया या नहीं:
OpenClaw के लिए आप क्या कर सकते हैं?
अगर जवाब specific OpenClaw काम के नाम लेता है (install probes, channels, brain files, skills, MCP servers, schedules, monthly audit), तो आप loaded हैं और Scenario 1 के लिए ready हैं। अगर यह सामान्य AI capability talk जैसा लगे और OpenClaw-specific details न हों, तो import fire नहीं हुआ: agent बंद करें, confirm करें कि आप unzipped openclaw-with-general-agents/ फ़ोल्डर के अंदर हैं, और फिर launch करें।
AGENTS.md में असल में क्या है (वह फ़ाइल जिसे आपका agent अब पढ़ रहा है)आपको यह फ़ाइल खुद कभी पढ़नी नहीं पड़ेगी; यही बात है। लेकिन इसकी shape जानने से आप बेहतर सवाल पूछते हैं ("gotchas खंड walk me through करें" काम करता है क्योंकि वह खंड मौजूद है)। Brief इस order में cover करता है:
PART 1 :: PRINCIPLES (apply everywhere)
Versions checked against
Source of truth, in order ← live docs > this file > the gateway log
Critical: discover before you act ← table of 17 doc-URL pointers
Working pattern (every task) ← read → propose → ask → execute → verify
Safety rails (non-negotiable)
Secrets discipline
PART 2 :: OPERATIONS (by task type)
Install & onboard ← the probe + onboard + paid-default gotcha
Configure ← config CLI + human-path vs agent-path table
Diagnose & recover ← the 5 most common failures and their fixes
Channels (WhatsApp / Telegram / Discord + the TTY constraint)
Memory & brain ← 3 layers, brain files, cross-channel proof
Skills (via ClawHub) · Plugins · MCP servers
The activation dance ← exists → disabled → enabled → configured
Automation (heartbeats + cron + 3 hook flavors)
Multi-agent · ACP · Safety & security
When you don't know what to do ← three-layer fallback
Tone ← how to talk to you
अगर बाद में AGENTS.md का कोई खास खंड relevant लगे, तो कार्रवाई करने से पहले अपने agent से उसे walk through करने को कह सकते हैं (उदाहरण: "WhatsApp pair करने से पहले AGENTS.md का Channels खंड walk me through करें")। Brief इस तरह लिखा गया था कि agent इससे self-direct कर सके।
Scenario 1: Employee इंस्टॉल करके chatting शुरू करें (~15 min)
Goal: OpenClaw आपके लैपटॉप पर चले, Gemini free tier पर set up हो, और डैशबोर्ड में "hi" कहने पर जवाब वापस आए। तीन छोटे paste prompts: plan पूछें, मंज़ूरी देकर execute कराएँ, फिर verify करें।
1a. इंस्टॉल और configure
पहला prompt: बताएं कि आप क्या चाहते हैं और plan माँगें।
मैं अपने लैपटॉप पर OpenClaw चलाना चाहता हूँ और Gemini के free tier से chat जवाब पाना चाहता हूँ। कुछ भी छूने से पहले, मुझे सरल भाषा में अपना plan walk me through करें: आप पहले क्या check करेंगे, क्या बदलेंगे, और कहाँ मुझे step in करना होगा।
आपका agent AGENTS.md पढ़ता है, आपकी machine देखता है, और plan propose करता है। वह दो जगहें flag करेगा जहाँ उसे आपकी ज़रूरत है: aistudio.google.com/app/api-keys से मुफ़्त Gemini API key लेना, और आपके system में बदलाव करने से पहले confirmation लेना। Plan पढ़ें। अगर reasonable लगे, आगे बढ़ें। अगर कुछ गड़बड़ लगे, push back करें। पूछें "आप यह क्यों कर रहे हैं?" और agent समझाएगा या adjust करेगा।
दूसरा prompt: मंज़ूर करें और चलने दें।
Plan अच्छा लग रहा है। Step by step आगे बढ़ें, और हर step पर बताएं कि आपको क्या दिख रहा है। जब आपको मेरी Gemini key चाहिए हो, तो pause करें और बताएं कि मैं उसे सुरक्षित तरीके से आपको कैसे दूँ।
Agent pause करेगा और आपकी key माँगेगा। aistudio.google.com/app/api-keys पर जाएँ, एक key create करें (मुफ़्त, no credit card), और आपका agent जो safe-handling instruction देता है उसे follow करें। उसे chat में key paste करवाने के बजाय आपके टर्मिनल में environment variable prefer करना चाहिए।
1a पूरा तब है जब: agent report करे कि OpenClaw इंस्टॉल और configured है, और Gemini key अपनी जगह है।
1b. End-to-end verify करें और डैशबोर्ड खोलें
तीसरा prompt: end-to-end verify करें, फिर डैशबोर्ड hand off करें।
अब पहले अपना end-to-end check करें (gateway से command line के through एक छोटा "hi", जैसा आपका brief बताता है), फिर मेरे लिए डैशबोर्ड खोलें ताकि मैं इसे ब्राउज़र से भी आज़मा सकूँ।
आप Scenario 1 के साथ पूरा करते हैं जब: आपके agent का अपना CLI check वास्तविक जवाब लेकर आया हो, और उसने आपके ब्राउज़र में जो डैशबोर्ड खोला हो वह भी आपके hi type करने के बाद जवाब दे। डैशबोर्ड footer में active model के रूप में google/gemini-2.5-flash दिखना चाहिए। अगर वहाँ कुछ और दिखे (especially कोई pro-preview model), तो अपने agent को बताएं और वह charge लगने से पहले आपको free tier पर switch करेगा।
अंदर से देखें, तो OpenClaw अब आपके लैपटॉप पर चल रहे तीन pieces हैं, जिन्हें login के समय शुरू होने वाली background service coordinate करती है:
आगे के परिदृश्यों में आप हर piece से मिलेंगे। अभी के लिए: यह इंस्टॉल है, और बात कर रहा है।
Scenario 2: अपने फ़ोन से channel pair करें (~15 min)
Goal: अपने फ़ोन से अपने AI Employee को "hi" भेजें और जवाब वापस पाएँ।
इसे अपने agent में paste करें:
Model डैशबोर्ड में जवाब दे रहा है। अब मैं अपने फ़ोन से अपने AI Employee से बात करना चाहता हूँ। WhatsApp pair करने में मुझे walk through करें (preferred), या जहाँ मैं रहता हूँ वहाँ WhatsApp में बहुत friction हो तो Telegram या Discord पर fall back करें। शुरू करने से पहले अपना plan और मेरे end पर required setup समझाएँ।
आपका agent बताएगा कि वह कौन सा path recommend कर रहा है और क्यों। WhatsApp के लिए उसे आपके personal account के बजाय WhatsApp Business के साथ दूसरा number suggest करना चाहिए (underlying library unofficial है और Meta personal accounts ban कर सकता है)। Telegram के लिए वह आपको BotFather तक ले जाएगा। Discord के लिए वह Developer Portal और तीन privacy intents तक guide करेगा जिन्हें आपको on toggle करना होगा।
एक चीज़ जो आपका agent आपके लिए नहीं कर सकता: login step QR code या token prompt के लिए छोटा terminal-based UI उपयोग करता है, और जब agent इसे अपने shell tool से चलाता है तो वह UI ठीक से render नहीं होता। इसलिए किसी बिंदु पर आपका agent pause करेगा और आपसे उसी फ़ोल्डर में नया टर्मिनल window खोलकर login command खुद चलाने को कहेगा। अपने फ़ोन से QR scan करें (WhatsApp Business → Settings → Linked Devices → Link a Device) या BotFather या Developer Portal से मिला bot token paste करें। जब पूरा हो जाए, तो अपने agent को "linked" बताएं।
आप इस परिदृश्य के साथ पूरा करते हैं जब: आप अपने फ़ोन से bound number को hi भेजें और वास्तविक जवाब वापस आए।
अगर आप चाहते हैं कि AI Employee WhatsApp group chats में भी काम करे (सिर्फ़ one-on-one नहीं), तो अपने agent से कहें:
AI Employee को group chats के लिए भी open करें। मुझे walk through करें कि क्या बदलाव होंगे और मैं इसे test group में कैसे add करूँ।
अब आपका फ़ोन आपके लैपटॉप पर OpenClaw service तक authenticated path है। यह pairing वास्तविक trust है जो आपके फ़ोन ने अभी grant किया है। इसे credential की तरह treat करें: pairing files share न करें, public repo में commit न करें, और अगर लैपटॉप खो जाए तो अपने फ़ोन से device revoke करें (WhatsApp Business → Linked Devices, या Telegram/Discord की equivalent setting)।
Scenario 3: वास्तविक काम सौंपें और loop देखें (~10 min)
Concept। "AI Employee" को chatbot से अलग करने वाली चीज़ agent loop है: वास्तविक task आता है, agent तय करता है कि उसे कौन से tools चाहिए (web fetch, calendar, file पढ़ना, जो भी हो), उन्हें call करता है, वापस आया result पढ़ता है, और जवाब बनाता है। जब तक आपने वास्तविक task पर loop चलते नहीं देखा, "agent" marketing जैसा लगता है। एक बार देखने के बाद, आप हर जवाब पर अपने AI Employee की वास्तविक activity का नाम ले सकते हैं।
इसे अपने agent में paste करें:
Channel काम कर रहा है। चलिए साबित करते हैं कि यह chatbot से ज़्यादा है। मैं अपने फ़ोन से ऐसा task भेजना चाहता हूँ जिसमें agent को सच में कुछ करके आना पड़े। Gateway log का live view set up करें ताकि मैं agent loop उसी समय होते देख सकूँ, फिर बताएं कि मैं task भेजने के लिए कब ready हूँ।
आपका agent एक side टर्मिनल खोलता है (या आपको खोलने को कहता है) जो gateway log live stream करता है। Ready होने पर, ऐसा वास्तविक task भेजें जिसे आप सच में अपने फ़ोन से सौंपते। अपनी वास्तविक ज़िंदगी से कुछ चुनें, tutorial demo नहीं। पहले task के लिए ये shapes अच्छी तरह काम करती हैं:
- Research lookup: "मेरा ध्यान जिस <competitor या vendor> पर है, वह entry plan के लिए कितना charge करता है, और उसमें क्या included है? मुझे source URL के साथ एक paragraph की summary दें।"
- Web fetch and analyze: "मैं जो article URL paste करूँगा, उसे पढ़ें और मुझे तीन claims बताएं जो <मेरी role या industry> को सबसे ज़्यादा affect करते हैं, साथ में हर claim पर एक वाक्य कि वह well-supported है या नहीं।"
- Structured task: "<जिस फ़ोल्डर या label का मैं नाम दूँ> में मेरी last five outgoing emails देखें; बताएं कि किसे follow-up की सबसे ज़्यादा ज़रूरत है और follow-up क्या कहना चाहिए।"
बात यह है: यह वही task है जिसे ChatGPT refuse करेगा या poorly करेगा। इसमें agent को वास्तविक data fetch करना, उस पर reason करना, और कुछ structured produce करना चाहिए। आपका AI Employee fetch करता है, reason करता है, और जवाब देता है।
Log stream में आपको लगभग छह lines scroll होती दिखेंगी:
- आपके channel पर inbound संदेश आता है।
- Model call: agent loop संदेश को Gemini को भेजता है और पूछता है कि क्या करना है।
- Tool call: agent task के लिए required tool invoke करता है (web fetch, file पढ़ना, calendar lookup)।
- Tool result: tool ने जो लौटाया, content chunk के रूप में।
- Second model call: loop result को Gemini को वापस भेजता है, summarize करने वाले prompt के साथ।
- Outbound message: जवाब आपके channel पर वापस जाता है।
आप इस परिदृश्य के साथ पूरा करते हैं जब: आपने वह six-line shape scroll होते देखा हो और जवाब आपके फ़ोन पर पहुँच गया हो। वही shape loop है। बाद के परिदृश्यों में जो भी add करेंगे (नई skill, external tool, scheduled task), वह इसी loop में और tools या और triggers add करेगा।
Scenario 4: इसे आपकी तरह बोलना और आपको याद रखना सिखाएँ (~15 min)
आपके AI Employee का behavior उसके workspace में मौजूद markdown files के set से आता है: ~/.openclaw/workspace/। Fresh install में इनमें से कई files आती हैं; यह परिदृश्य उन तीन को touch करता है जिन्हें आप पहले दिन सबसे ज़्यादा customize करेंगे (SOUL.md, IDENTITY.md, USER.md), फिर आपसे चौथी file बनवाता है (MEMORY.md, जो तब तक exist नहीं करती जब तक agent पहली बार उसमें लिखता नहीं)। बाकी files (AGENTS.md, agent के अपने operating rules के लिए, आपके zip वाले companion AGENTS.md से अलग; TOOLS.md, tool policy के लिए; HEARTBEAT.md, ambient routine के लिए) Ch56 Lesson 4: Customize Your Employee's Brain में cover हैं।

- SOUL.md: personality और tone (यह कैसे बोलता है)
- IDENTITY.md: इसका अपना name और role (यह खुद को कैसे introduce करता है)
- USER.md: यह आपके बारे में क्या जानता है (persistent context)
- MEMORY.md: durable facts जिन्हें यह channels के across commit करता है
आप हर file को एक बार touch करेंगे, हर edit के बाद एक संदेश भेजेंगे, और फर्क महसूस करेंगे। शुरू करने से पहले दो बातें जानना ज़रूरी है: हर file lean रखें (हर line context cost है जो agent हर single turn पर pay करता है, जिसमें हर channel जवाब और हर scheduled job शामिल है, इसलिए हर file के लिए एक-दो पृष्ठ काफी हैं), और बाद में इन्हें unnecessarily churn न करें क्योंकि ये आपके AI Employee के हर जवाब को shape करती हैं।
Sub-scenarios शुरू होने से पहले, त्वरित orientation के लिए इसे अपने general agent में paste करें:
Customize करने से पहले त्वरित orientation: मेरा workspace
~/.openclaw/workspace/पर open करें और मुझे हर file के लिए एक line में बताएं कि अभीSOUL.md,IDENTITY.md, औरUSER.mdमें क्या है। सिर्फ़ defaults; हम इन्हें next बदलेंगे, फिर साथ मेंMEMORY.mdcreate करेंगे।
आपको per-file snapshot मिलेगा कि चीज़ें कहाँ से शुरू होती हैं। Upcoming edits ऐसी specific files में बदलाव लगेंगे जिन्हें आपने देखा है, न कि abstract files जिनसे आप unfamiliar हैं।
/reset चाहिए (एक बार पढ़ें, 4a-4d पर apply होता है)किसी workspace file (SOUL.md, IDENTITY.md, USER.md, MEMORY.md) को edit करने के बाद new content disk पर है, लेकिन running OpenClaw session अब भी system prompt का cached snapshot उपयोग कर रहा है। OpenClaw को disk से system prompt rebuild करने के लिए अपने फ़ोन (paired channel) से /reset भेजें। अगर आपने Scenario 2 skip किया है और paired channel नहीं है, तो /reset डैशबोर्ड chat http://127.0.0.1:18789 से भेजें। नीचे हर sub-scenario edit और test संदेश के बीच इसी step को assume करता है।
4a. SOUL.md: इसकी voice बदलें
इसे अपने general agent में paste करें:
SOUL.mdदेखें और तीन छोटे बदलाव suggest करें जो replies को more direct और less hedgy बनाएँ (या जो भी style आपको missing लगे)। पहले diff दिखाएँ; मेरी मंज़ूरी के बाद ही apply करें।
Edit land होने के बाद, अपने फ़ोन से /reset भेजें, फिर कोई casual संदेश भेजें जैसे How are you today?
पूरा तब माना जाएगा जब: जवाब का tone Scenario 1 में मिले bland "hi" जवाब से साफ़ अलग हो।
4b. IDENTITY.md: इसे name दें
इसे अपने general agent में paste करें:
इसे एक name और role दें। मैं चाहता हूँ कि यह खुद को "Atlas, my research assistant" के रूप में introduce करे (या जो name और role आपको सही लगें, उन्हें पहले मेरे सामने रखें)। पहले diff दिखाएँ।
Edit land होने के बाद, /reset करें और अपने फ़ोन से Who are you? पूछें।
पूरा तब माना जाएगा जब: यह default के बजाय new name और role के साथ खुद को introduce करे।
4c. USER.md: इसे आपके बारे में सिखाएँ
इसे अपने general agent में paste करें:
इसे मेरे बारे में सिखाएँ। मेरा full name, मेरा role, मेरी timezone, और वे तीन topics add करें जिन पर मुझे सबसे ज़्यादा मदद चाहिए होती है। जो कुछ आपको already नहीं पता, उसके लिए मुझसे पूछें, और apply करने से पहले diff दिखाएँ।
यह जो missing होगा उसके लिए पूछेगा। Edit land होने के बाद, /reset करें और पूछें What should I prioritize this afternoon, given what you know about me?
पूरा तब माना जाएगा जब: जवाब आपके timezone और top topics को factor करे, सामान्य advice न दे।
4d. MEMORY.md: channels के across commit करें
पहली तीन files voice shape करती हैं। MEMORY.md अलग है: यह सिर्फ़ agent के main session में load होती है, इसलिए channels के across आप जो भी इसे जानना चाहते हैं उसे deliberately commit करना पड़ता है। नीचे four-step ladder तीन layers (session memory, channel cache, long-term commit) को एक-एक करके साबित करती है।
नीचे का test fact आपके week से जुड़ी temporary और specific चीज़ है, stable identity fact नहीं: आपका name जैसे stable facts 4c से already USER.md में हैं, इसलिए अगर हम उन्हें उपयोग करते तो wall fire नहीं होती। कोई वास्तविक in-flight चीज़ चुनें: "मैं [एक वास्तविक project] Friday तक finish करने की कोशिश कर रहा हूँ" या "मैं Wednesday को [एक वास्तविक client] के लिए pitch prepare कर रहा हूँ" काम करता है।
चार steps। (आप सिर्फ़ तीन वास्तविक संदेश भेजते हैं; बाकी छोटी queries हैं।)
- अपने paired channel से:
Quick context: I'm trying to finish [your real in-flight thing] by Friday. Hold onto this.फिर तुरंत:What am I trying to finish by Friday?यह जवाब देगा (session + channel memory, दोनों automatic)। - डैशबोर्ड chat से (
http://127.0.0.1:18789, अलग session):What am I trying to finish by Friday?इसे पता नहीं होगा। यही wall है: channel memory per-channel है, इनके across shared नहीं। - अपने paired channel में वापस:
Commit my Friday goal to your long-term memory.आपका agentMEMORY.mdcreate करता है (यह first commit तक exist नहीं करती थी) और confirm करता है। - डैशबोर्ड chat से फिर (पहले
/resetभेजें ताकि newly committedMEMORY.mdload हो):What am I trying to finish by Friday?अब इसे पता है। Deliberate commit ने wall cross कर ली।
पूरे memory model के लिए (edge cases, /reset हर layer के साथ कैसे interact करता है, gateway restarts के दौरान क्या होता है), Ch56 Lesson 5: Memory and Commands देखें।
Voice and memory ladder पूरा तब माना जाएगा जब: Step 4 succeed करे। आपका AI Employee अब आपकी तरह सुनाई देता है, खुद को आपके चुने हुए तरीके से introduce करता है, आपके बारे में context जानता है, और channels के across आपको याद रखता है क्योंकि कुछ deliberately commit किया गया था, सिर्फ़ cache नहीं हुआ था। Scenario 4 पूरी तरह पूरा होने से पहले एक और step (4e) है।
4e. अभी बनाई identity back up करें
~/.openclaw/workspace/ वाला workspace ही आपका AI Employee है: अभी customize की गई brain files, plus बाकी workspace markdown (operating rules, tool policy, heartbeat routine) और वे चीज़ें जो आप बाद में add करेंगे (Scenario 6 में schedules, installed skills, etc.)। अगर आपका लैपटॉप आज रात मर जाए, तो जब तक यह कहीं और नहीं रहता, आप सब खो देंगे। पूरे workspace को dotfiles की तरह treat करें।
इसे अपने general agent में paste करें:
मेरे agent का workspace
~/.openclaw/workspace/से private GitHub repo में back up करें ताकि लैपटॉप मर जाए तो मैं इसे खो न दूँ। सभी workspace files include करें (SOUL/IDENTITY/USER/MEMORY brain files plusAGENTS.md,TOOLS.md,HEARTBEAT.md, और future additions जैसे schedule files), और secrets और session caches exclude करें। मेरे पास already मौजूद Git tools के basis पर जो easiest हो, उसी तरह set up करें, और पूरा होने पर मुझे एक one-liner दें जिसे मैं सुरक्षित जगह save कर सकूँ और नए लैपटॉप पर OpenClaw इंस्टॉल करने के बाद इससे workspace re-clone कर सकूँ।
आप Scenario 4 के साथ पूरा करते हैं जब: private repo GitHub पर exist करे, आपका workspace pushed हो (brain files plus बाकी workspace markdown), और आपके पास recovery one-liner saved हो (इसे किसी notes app या password manager में paste करें जिसे आप बाद में find कर पाएँ)। अब आपके AI Employee की identity laptop wipe survive करती है।
Scenario 5: इसे एक skill और एक tool से extend करें (~15 min)
Concept। आपके AI Employee में capabilities add करने के दो अलग तरीके हैं, और उनकी shapes अलग हैं:
- Skill एक फ़ोल्डर है जिसमें
SKILL.mdfile होती है: ऐसा expertise जिसे task match होने पर agent auto-invoke करता है। Skills cross-runtime spec (agentskills.io) follow करती हैं, इसलिए वही फ़ोल्डर OpenClaw, Claude Code, OpenCode, और 50+ others में काम करता है। दो registries spec के against distribute करती हैं: skills.sh (broad, cross-runtime) और ClawHub (OpenClaw-curated, more vetted)। - MCP tool ऐसी capability है जिसे agent call कर सकता है: external service जो Model Context Protocol के through functions expose करती है (किसी भी zone का current time लेना, database query करना, calendar invite भेजना, etc.)। Configure, restart, verify; agent को बिना code के नए tools मिल जाते हैं।
Skills know-how inject करती हैं; tools reach add करते हैं। दोनों वही shape follow करते हैं: इंस्टॉल (या configure), gateway restart ताकि OpenClaw उन्हें pick करे, verify कि वे loaded हैं, फिर फ़ोन से test करें।
नीचे हर prompt agent को Ch56 lesson URL plus आपका USER.md देता है। Lesson exact commands रखता है; आप natural language में रहते हैं जबकि agent पढ़ता है, plan करता है, execute करता है, और verify करता है।
5a. ऐसा एक skill add करें जो आपके वास्तविक काम में fit हो
Heads up: installed skill जो fire नहीं होती, वह लगभग हमेशा description mismatch है। इंस्टॉल काम कर गया; आपका संदेश skill के trigger description से match नहीं हुआ। यह description के बारे में data है, broken install नहीं: gateway log skill-load event दिखाता है जब वह fire करती है।
पहला prompt: lesson पढ़ें, discovery skill लें, propose करें।
https://agentfactory.panaversity.org/docs/Building-OpenClaw-Apps/meet-your-personal-ai-employee/install-skills-discover-ecosystem पढ़ें ताकि आपको पता हो कि OpenClaw skills कैसे इंस्टॉल करता है (cross-runtime spec, scopes, gateway restart)। फिर check करें कि
find-skillsskill already installed है या नहीं। अगर नहीं है, तो skills.sh से सिर्फ़ वही one skill Global scope के साथ इंस्टॉल करें (ताकि यह Claude Code और OpenClaw दोनों में land करे) और gateway restart करें। जबfind-skillsavailable हो जाए, तो इसे मेरेUSER.mdके against skills.sh search करने के लिए उपयोग करें और मेरे काम से fit होने वाली two or three वास्तविक skills propose करें। हर एक के लिए बताएं कि उसका description किस चीज़ पर trigger करता है (sharp description सही समय fire करता है; vague one कभी fire नहीं करता), मैं कैसे verify करूँगा कि वह vanilla जवाब के बजाय सच में fire हुई, और आप पहले किसे चुनेंगे। अभी chosen one इंस्टॉल न करें; मैं पहले चुनना चाहता हूँ।
आपको वास्तविक काम पर grounded, वास्तविक install URLs के साथ छोटी list मिलेगी। एक चुनें।
दूसरा prompt: दोनों runtimes में इंस्टॉल करें, फिर verify करें।
[आपकी पसंद] को Global scope के साथ इंस्टॉल करें ताकि यह Claude Code और OpenClaw दोनों की skills directories में एक साथ land करे, फिर gateway restart करें। मुझे बताएं कि इसने किन directories में लिखा ताकि मैं देख सकूँ। SKILL.md description मुझे वापस list करें ताकि मुझे exactly पता हो कि इसे trigger करने के लिए paired channel से क्या send करना है, और जवाब में किस चीज़ को देखना है जो साबित करे कि skill vanilla model response के बजाय fire हुई।
अपने paired channel से वह test input भेजें जो आपके agent ने suggest किया (meeting transcript, draft email, code snippet, या skill जिसके लिए हो)।
5a पूरा तब है जब: आपका agent confirm करे कि skill installed है (और आपको दिखाए कि कहाँ), AND test input skill के specific format या framing वाला जवाब produce करे (generic जवाब नहीं)। अगर skill fire नहीं करती, तो आम तौर पर description mismatch है (आपका संदेश skill के description को trigger नहीं कर रहा) या missed restart; universal recovery prompt paste करें।
5b. एक external tool connect करें (credentials की ज़रूरत नहीं)
Canonical hello-world MCP mcp-server-time है: no API key, दो tools (get_current_time, convert_time)। यह standard proof है कि "आपने external tool connect कर लिया"। Heads up: MCP चुपचाप असफल होता है। Misconfigured server chat में error produce नहीं करता; agent को बस tool नहीं मिलता। Gateway log ही diagnostic है।
पहला prompt: lesson पढ़ें, configure करें, verify करें।
https://agentfactory.panaversity.org/docs/Building-OpenClaw-Apps/meet-your-personal-ai-employee/connect-external-tools पढ़ें ताकि आपको configure-then-restart shape और Silent Failure pattern पता हो। फिर lesson से
mcp-server-timeexample set up करें (no API key needed)। पहले plan दिखाएँ, फिर execute करें। Gateway restart के बाद साबित करें किtime2 tools के साथ registered है। अगर यह missing है या 0 tools दिखाता है, तो वह Silent Failure है: gateway log पढ़ें, मुझे सरल भाषा में बताएं कि आपको क्या दिख रहा है, और fix propose करें।
Agent lesson walk करता है, commands चलाता है, और registration list दिखाता है। आपको जो line देखनी है: time with 2 tools। अगर यह वहाँ नहीं है, agent diagnose करता है; आप fix मंज़ूर करते हैं।
दूसरा prompt: अपने फ़ोन से tool trigger करें, डैशबोर्ड badge देखें।
Time MCP connected है। मैं अपने paired channel से वास्तविक timezone सवाल पूछूँगा। Gateway log live tail करें ताकि हम
get_current_timeको उसी समय invoke होते देखें, और बताएं कि डैशबोर्डhttp://127.0.0.1:18789में मुझे क्या देखना है: जवाब पर tool badge होना चाहिए जो दिखाए कि agent ने training data से guess करने के बजाय time MCP उपयोग किया।
अपने फ़ोन से ऐसा वास्तविक time सवाल पूछें जो आपके लिए मायने रखता है। उदाहरण:
- "अगर मैं अभी <उनके city> में अपने client को यह proposal भेजूँ, तो वहाँ local time क्या है? क्या यह email करने का reasonable hour है?"
- "<दूसरी timezone> में मेरी टीम का workday कितने hours में खत्म होता है? क्या मुझे अपने time के हिसाब से कल सुबह तक इंतज़ार करना चाहिए?"
- "अगर अभी मेरे time में 3pm है, तो <जिस timezone में deadline set है> में deadline क्या है?"
5b पूरा तब है जब: आपके agent ने आपको दिखा दिया हो कि time server अपने 2 tools के साथ registered है, AND आपके फ़ोन से आया वास्तविक time सवाल specific live time produce करे (generic timezone rule नहीं), AND डैशबोर्ड जवाब पर get_current_time tool badge दिखाए। Badge proof है कि agent ने hallucinate करने के बजाय tool call किया।
आप Scenario 5 के साथ पूरा करते हैं जब: 5a और 5b दोनों done conditions hold करें।
इस दौरान आपका agent activation dance का explicit नाम लेता है: हर OpenClaw extension (skills, plugins, MCP servers, channels, hooks) वही चार steps follow करता है: exists → disabled by default → enabled → configured (restart)। Pattern दिख जाए तो हर नया feature broken-on-first-try लगने के बजाय familiar लगता है।
इस परिदृश्य की additions को अपने USER.md में add करें ताकि scheduled jobs (next) को पता हो कि वे exist करती हैं। इसे अपने agent में paste करें:
अभी हमने जो skill और MCP tool set up किए हैं, उन्हें मेरे
USER.mdमें add करें ताकि scheduled jobs चलने पर उन्हें पता हो कि क्या available है। फिर updatedUSER.mdको 4e वाले मेरे backup repo में commit और push करें।
अब आपके AI Employee की capabilities, सिर्फ़ identity नहीं, laptop wipe survive करती हैं।
Scenario 6: इसे अपने आप काम करने दें (~15 min)
Concept। अब तक आपने AI Employee को संदेश भेजा है और उसने जवाब दिया है। Schedules इसे उलट देते हैं: agent clock या interval पर काम करता है, आपके संदेश भेजे बिना। OpenClaw में proactivity के तीन flavors हैं:
- Cron precise times के लिए ("every morning at 7am", "every Monday at 9am", "at end of day")। यही आप सबसे ज़्यादा उपयोग करेंगे। आपकी वास्तविक ज़िंदगी clock times के around organized होती है।
- Heartbeat fixed cadence पर ambient checks के लिए ("every 30 minutes urgent unread scan करें", "every 4 hours prep notes के लिए calendar देखें")। इसे तब उपयोग करें जब trigger "कुछ periodically check करें" हो, न कि "बिल्कुल X बजे यह करें"।
- Hooks event triggers के लिए (webhook fire करता है, session reset होता है)। यहाँ scope से बाहर; अगर आपको चाहिए तो Ch56 देखें।
इस परिदृश्य के दो parts हैं। Part 6a तेज़ heartbeat demo है जो साबित करता है कि proactive mechanism wired है। Part 6b keeper है: एक वास्तविक schedule (usually cron job) जो सच में कल आपकी मदद करेगा। 6a के बाद न रुकें; demo जिसे आप disable कर देते हैं वह proactive dimension नहीं है। रोज़ चलने वाला वास्तविक schedule है।
6a. एक demo heartbeat fire होते देखें (फिर इसे बंद करें)
इसे अपने agent में paste करें:
पाँच मिनट का demo heartbeat schedule करें low-cost task के साथ: हर पाँच मिनट gateway log को errors के लिए check करे और one-line summary post करे। जब मैं log में एक fire होते देख लूँ, तो सिर्फ़ इस demo को disable करें ताकि यह मेरा Gemini quota burn न करे। अगला step वास्तविक schedule होगा।
पूरा तब है जब: log में एक heartbeat-driven tool call दिखे AND demo disabled हो। Log देखते हुए five-minute window fair है।
6b. एक ऐसी चीज़ schedule करें जिसे आप सच में keep करेंगे (cron या heartbeat)
जो demo आप disable करते हैं, वह यह साबित नहीं करता कि आपका AI Employee ऐसा tool है जिसे आप कल उपयोग करेंगे। एक वास्तविक schedule करता है। Most first-time keepers के लिए cron right choice है: आपके वास्तविक workdays clock times के around organized हैं, check-intervals के around नहीं।
पहला prompt: मेरे बारे में जो जानते हैं उसके basis पर विकल्प suggest करें।
मैं एक वास्तविक schedule add करना चाहता हूँ जो सच में मेरी मदद करे, ऐसा demo नहीं जिसे मैं भूल जाऊँ।
USER.mdसे मेरे बारे में जो जानते हैं उसे देखें और two or three विकल्प suggest करें जिन्हें मैं keep कर सकता हूँ। हर विकल्प के लिए बताएं कि वह क्या करेगा, कब fire होगा, और cron (precise time) या heartbeat (ambient interval) में से सही primitive कौन सा है। मैं एक चुनूँगा।
आपका agent आपके USER.md पर grounded विकल्प देगा (7am summary, Monday morning priorities list, end-of-day outstanding commitments check, interval calendar scan, etc.)। जो कल सबसे उपयोगी लगे, उसे चुनें।
दूसरा prompt: इसे set up करें और back up करें।
[अपनी पसंद का नाम] के साथ चलें। इसे set up करें, confirm करें कि यह next कब fire होगा, और schedule file को 4e वाले मेरे backup repo में commit करें ताकि यह laptop wipe survive करे।
पूरा तब है जब: आपने जो schedule चुना है वह running हो, backup repo में committed हो, और आपका agent आपको बता चुका हो कि यह next कब fire होगा। इसे on रहने दें। (अगर कल आपको पछतावा हो, तो आप बाकी सब touch किए बिना सिर्फ़ उस one schedule को disable कर सकते हैं।)
Scenario 7: आपका मासिक AI Employee audit (~10 min/month)
Concept। आपका AI Employee time के साथ accumulate करता है: आपने जो skills इंस्टॉल कीं, उसने जो credentials capture किए, आपने जो MCP tools connect किए, memory entries जो उसने लिखीं, logs में autonomous tool calls। हर addition एक छोटा decision है जिसे आपने मंज़ूर किया; chain opaquely compound होती है। Defense install time की vigilance नहीं है (आप वह पकड़ ही नहीं पाएँगे जो अभी exist नहीं करता); defense fixed cadence पर ten-minute review है। यह परिदृश्य आपकी पहली 90 मिनट का part नहीं है; यह वह move है जो आप अपने AI Employee की पूरी life में महीने में एक बार करते हैं।
इसे अपने agent में paste करें (जब समय आए):
मेरा OpenClaw monthly audit चलाएँ। पिछले audit के बाद जो कुछ installed, stored, scheduled, या written हुआ है, सब walk through करें, और flag करें जो मैंने explicitly मंज़ूर नहीं किया, जो memory में revealing लगता है, और कोई approval setting जो जितनी tight होनी चाहिए उससे loose है। पूरी चीज़ को single short report में summarize करें जिसे मैं मंज़ूर या trim कर सकूँ।
आपका agent running inventory (skills, memory entries, approvals, MCP tools, recent tool calls) plus stored credentials से गुजरता है, फिर एक single report लिखता है जो बताता है कि last audit के बाद क्या बदलाव हुआ और कहाँ आपको tighten या trim करना चाहिए।
पूरा तब है जब: आपने report review करने में दस मिनट लगाए हों और कम से कम एक decision किया हो (forgotten credential delete करना, over-broad approval revoke करना, stale memory entry prune करना, unused skill uninstall करना)। Next month के लिए calendar mark करें।
यह क्यों काम करता है
दो चीज़ें fresh रहती हैं; एक चीज़ durable रहती है।
Fresh #1: इस पृष्ठ के परिदृश्य book site पर live रहते हैं। Agent हर session में current version fetch करता है (आप उसे बताते हैं कि आप कौन से परिदृश्य पर हैं, और वह relevant हिस्सा पढ़ता है)।
Fresh #2: Current OpenClaw commands docs.openclaw.ai/llms.txt पर रहते हैं, full docs का LLM-friendly index। आपका agent हर बार उन्हें fresh पढ़ता है जब उसे कोई command चलाने से पहले doubt हो। OpenClaw fast ship करता है; brief इस तरह accurate रहता है, even when individual flags drift।
Durable: AGENTS.md (आपके two-file zip से operational reference) बताता है कि OpenClaw क्या है, docs navigate कैसे करने हैं, safety rails (बिना पूछे sudo नहीं, paid models नहीं, keys को ~/.openclaw/ के बाहर नहीं लिखना), recovery patterns, और activation dance। यह full platform cover करता है: install, debugging, channels, memory, skills, plugins, MCP, automation, multi-agent, ACP, और sandboxing। यह इस पृष्ठ से longer है क्योंकि यह वह सब cover करता है जो किसी general agent से OpenClaw के साथ करने को कहा जा सकता है, सिर्फ़ ऊपर के छह परिदृश्य नहीं। फ़ोल्डर में कुछ भी stale नहीं होता, इसलिए आप इसे एक बार डाउनलोड करके reuse करते हैं।
Intelligence files में नहीं है; intelligence आपके general agent के उन्हें पढ़ने और आपके next ask पर apply करने में है। आपने छह disconnected demos नहीं किए; आपने ऐसा tool assemble किया जिसे आप कल touch करेंगे।
अभी असल में क्या चल रहा है
छह demos नहीं: एक system। Scenario 6 के बाद persist करने वाली चीज़ों की inventory:
| Artifact | यह असल में क्या है | कल यह क्यों मायने रखता है |
|---|---|---|
| Background service | OpenClaw, आपके OS के साथ अपने आप शुरू होता है | आपका AI Employee टर्मिनल close करने और reboot survive करता है |
| Channel pairing | आपके फ़ोन और लैपटॉप के बीच trusted link | आपका फ़ोन service तक इसी path से पहुँचता है |
| Workspace files | ~/.openclaw/workspace/ में सात markdown files | आपके AI Employee की identity, context, behavior, और memory |
| GitHub backup | Workspace का private repo plus recovery one-liner | Workspace laptop loss survive करता है |
| One installed skill | ClawHub से एक expertise pack | एक वास्तविक know-how extension जिसे आपका agent auto-invoke करता है |
| One external tool | एक MCP server जिसे agent call कर सकता है | Agent के लिए एक वास्तविक external service available है |
| One scheduled task | एक cron job या heartbeat जो आपके बिना fire होता है | एक चीज़ जो आपके लिए schedule पर चलती है |
Picture यही है। इनमें से कोई demo नहीं है जिसे आपने चलाकर disabled कर दिया; ये सभी उस tool के pieces हैं जिसे आप कल touch करेंगे।
इसके साथ working day ऐसा दिखता है: आपका फ़ोन 7am पर buzz करता है उस schedule के साथ जिसे आपने चुना (cron job, अगर वह 7am summary keeper है); mid-morning आप छोटे सवाल का जवाब देते हैं जो time MCP या S5 की skill trigger करता है; mid-afternoon आप agent से तीन emails के replies draft करवाते हैं; end of day आप long-term memory में one new fact commit करते हैं। आपने लैपटॉप खोला ही नहीं।
अगर बाद में इनमें से कोई artifact missing हो जाए (laptop wipe, accidental delete, version upgrade gone wrong), तो 4e वाला GitHub repo plus fresh OpenClaw install plus recovery one-liner आपको इसी exact picture पर वापस ले आता है।
त्वरित पाठ्यक्रम assume करता है कि AI Employee सिर्फ़ आपके संदेश पढ़ता है। अगर आप कभी public-facing channel connect करने की योजना बनाते हैं (support inbox, contact form, कुछ भी जहाँ strangers लिख सकते हैं), तो यहीं रुकें और पहले Chapter 56 Lesson 14: Gate Your Agent's Tools और Lesson 16: Isolate with NemoClaw पढ़ें। Sandboxed-reader pattern prompt injection के against आपकी structural defense है (वह threat जहाँ email में hidden adversarial instructions आपके AI Employee को आपकी ओर से actions लेने के लिए trick कर सकते हैं)। Pairing lock down करता है कि आपके bot को कौन लिख सकता है; sandboxing lock down करता है कि आपका bot जो पढ़ता है, उसके साथ क्या कर सकता है। दोनों मायने रखते हैं।
आगे कहाँ जाएँ
Scenario 6 के बाद, आपके पास working AI Employee है जिसका workspace customized है (voice, identity, वह आपके बारे में क्या जानता है, committed memory), workspace GitHub पर backed up है, एक installed skill है, एक external tool है, और एक scheduled task है जो आपके लिए fire करता है। Most people को जिस surface की ज़रूरत होती है, उसका बड़ा हिस्सा यही है।
इस पृष्ठ ने जिस भी topic को touch किया (या skip किया), उसके patient walkthrough के लिए Chapter 56 में full platform cover करने वाली सत्रह lessons हैं। छोटा map:
| आप चाहते हैं... | यहाँ जाएँ |
|---|---|
| Voice replies (WhatsApp / Telegram / Discord पर audio) | Ch56 L10: इसे voice दें |
| Reader-agent pattern (untrusted-email safety, sandboxing) | Ch56 L14: अपने Agent के Tools gate करें |
| दूसरा specialized agent चलाना (routing, separate identity) | Ch56 L11: दूसरा agent add करें |
AI Employee general agents summon करे (/acp spawn choreography finale, developers के लिए) | Ch56 L13: दूसरे agents orchestrate करें |
| Sandboxing modes और security hardening | Ch56 L14: अपने Agent के Tools gate करें, L16: NemoClaw से isolate करें |
| More channels (Slack, Matrix, Signal, iMessage, Zalo) | अपने general agent से पूछें: "अपने brief का उपयोग करके <channel> setup walk me through करें।" |
बाकी हर चीज़ के लिए, आपका AGENTS.md पहले से platform का ज़्यादातर हिस्सा cover करता है। अपने general agent से पूछें: "AGENTS.md sandboxing के बारे में क्या कहता है?" Brief reference है; पृष्ठ tour है।
Meta-lesson: आपके unzipped फ़ोल्डर में सबसे valuable चीज़ AGENTS.md है। एक शाम निकालकर इसे end to end पढ़ें (install steps के लिए नहीं, document की shape के लिए: discover-before-act table, human-path-vs-agent-path table, working pattern, gotcha catalog, activation dance)। फिर जिस next tool के सामने आप general agent रखेंगे, उसके लिए ऐसा ही एक लिखें। Pattern portable है: learnable surface वाले हर tool के लिए लिखने लायक एक "little skill" होती है। OpenClaw early example था क्योंकि install actively agent-driven setup से benefit करता है; आपको और भी मिलेंगे। Next one author करें।
Appendix: Google Workspace connect करें
Frame upfront। वास्तविक account पर Google Cloud Platform OAuth screens में पंद्रह से ज़्यादा मिनट लगते हैं, और उसे throwaway की तरह treat करना चाहिए। Google consent flows time-bound होते हैं (कुछ links दस मिनट में expire हो जाते हैं) और click-heavy होते हैं। यह specifically Google integrate करने की price है; इसका OpenClaw से कोई लेना-देना नहीं, और यह किसी दूसरे integration को आसान नहीं बनाएगा।
इसे अपने agent में paste करें:
Google Workspace (Gmail, Calendar, Drive) को मेरे AI Employee से connect करें। Throwaway Google account उपयोग करें; GCP और OAuth steps में explicit STOP conditions के साथ मुझे walk through करें अगर कोई consent screen उन scopes के लिए ask करे जिन्हें आपने grant करने को नहीं कहा।
आपका agent live Workspace plugin docs fetch करता है, plugin इंस्टॉल करता है (typically gog या similar named; assume करने से पहले verify करें), आपके ब्राउज़र में OAuth flow खोलता है, env-var-backed reference के through consent token capture करता है, और small probe से verify करता है (e.g., "list my next three calendar events")।
STOP conditions। कोई quota या permission error जो one fix attempt के बाद recur करे। कोई indication कि आपसे ऐसे scopes grant करने को कहा जा रहा है जिनके बारे में agent ने नहीं बताया। कोई sign कि GCP project खुद misconfigured है (यह appendix clean throwaway account assume करता है; existing GCP project की auth debugging crash-course scope से बहुत बाहर है)।
Pointer। Deep walkthrough Ch56 Lesson 12: Connect Google Workspace में है।