Skip to main content

OpenClaw کے ساتھ جنرل ایجنٹس: 90 منٹ کا مختصر عملی کورس

6 منظرنامے، صفر سے پرسنل AI ایمپلائی تک

یہ OpenClaw آپ کا پرسنل AI ایمپلائی ہے: ایک اوپن سورس اسسٹنٹ جو آپ کے اپنے لیپ ٹاپ پر چلتا ہے اور ان میسجنگ ایپس کے ذریعے جواب دیتا ہے جو آپ پہلے سے استعمال کرتے ہیں (WhatsApp، Telegram، Discord، Slack، iMessage، اور بہت کچھ)۔

یہ وہی پروجیکٹ ہے جس نے ثابت کیا کہ AI ایمپلائیز حقیقی ہیں، کام کرتے ہیں، اور لوگ انہیں چاہتے ہیں۔ OpenClaw 2026 کا سب سے تیزی سے بڑھنے والا اوپن سورس پروجیکٹ بن گیا، اپنے پہلے ہی مہینوں میں لاکھوں GitHub اسٹارز کے ساتھ۔ Jensen Huang نے GTC 2026 پر اسے "اگلا ChatGPT" کہا؛ NVIDIA نے اس کے اوپر NemoClaw بنایا۔

ان نوے منٹ کے اختتام تک، آپ کے پاس ایک ہوگا: آپ کے فون پر ایک AI ایمپلائی جو میسجز کا جواب دیتا ہے، ٹولز اور بیرونی سروسز استعمال کرتا ہے، خود کو آپ کے مطابق ڈھالتا ہے، اپنے شیڈول پر چلتا ہے، اور آپ کے لیپ ٹاپ پر رہتا ہے۔ کوئی چیٹ بوٹ نہیں جس کے پاس آپ جائیں؛ بلکہ ایک ورکر جسے آپ کام سونپیں۔


یہ مختصر کورس کیسے کام کرتا ہے۔ آپ ایک چھوٹا فولڈر ڈاؤن لوڈ کرتے ہیں، اسے اپنے جنرل ایجنٹ کو دیتے ہیں (Claude Code، OpenCode، Cowork، یا OpenCowork سب چلتے ہیں، ہر ایک فولڈر کے کانٹیکسٹ سے AGENTS.md خودبخود امپورٹ کرتا ہے)، اور چھ منظرناموں سے گزرتے ہیں۔ ایجنٹ فولڈر پڑھتا ہے، OpenClaw انسٹال اور چلاتا ہے، آپ کا فون کنیکٹ کرتا ہے، نئی اسکلز اٹھاتا ہے، اپنا دماغ کسٹمائز کرتا ہے، اور ایک ٹاسک شیڈول کرتا ہے جو آپ کے بغیر چلتا ہے۔ آپ سمت دیتے ہیں؛ ایجنٹ کام کرتا ہے؛ OpenClaw آپ کا پرسنل AI ایمپلائی بن جاتا ہے۔

مجھے کون سا ایجنٹ استعمال کرنا چاہیے؟

نیچے دیے چھ منظرنامے ایجنٹ سے غیر متعلق ہیں: ہر "یہ اپنے ایجنٹ کو پیسٹ کریں" والا پرامپٹ ہر ٹول میں بالکل ایک جیسا ہے۔ واحد فرق لانچ مرحلے کا ہے: CLI ایجنٹس (Claude Code، OpenCode) ان زپ کیے فولڈر کے ٹرمینل سے لانچ ہوتے ہیں؛ ڈیسک ٹاپ ایجنٹس (Cowork، OpenCowork) ایپ میں فولڈر کھول کر لانچ ہوتے ہیں۔ وہی منتخب کریں جو آپ کے پاس پہلے سے انسٹال ہے۔ زپ کا بریف چاروں کے لیے ایک جیسا کام کرتا ہے۔

پڑھنے کا راستہ · پیش شرائط · گہرا ورژن (پھیلانے کے لیے کلک کریں)

پڑھنے کا راستہ (چھ منظرنامے اور ایک ماہانہ عادت):

  1. لوکل ڈیش بورڈ میں انسٹال اور چیٹ کریں۔ ~15 منٹ۔
  2. اپنے فون سے ایک چینل پیئر کریں (WhatsApp / Telegram / Discord)۔ ~15 منٹ۔
  3. حقیقی کام سونپیں اور ایجنٹ لوپ دیکھیں۔ ~10 منٹ۔
  4. اسے اپنی طرح بلوائیں اور یاد رکھوائیں + شناخت کو GitHub پر بیک اپ کریں۔ ~15 منٹ۔
  5. ایک اسکل اور ایک بیرونی ٹول کے ساتھ اسے بڑھائیں۔ ~15 منٹ۔
  6. ایک cron جاب (یا heartbeat) کے ساتھ اسے خود کام کروائیں جو آپ کے لیے چلے۔ ~15 منٹ۔
  7. (مہینے میں ایک بار، آج نہیں) آڈٹ چلائیں۔ وقت آنے پر ~10 منٹ۔

ہر منظرنامہ ایک چلنے کے قابل کامیابی پر ختم ہوتا ہے۔ اگر نوے منٹ ایک ہی نشست میں زیادہ ہیں، تو انہیں الگ نشستوں میں لیں؛ اسٹیٹ ان کے درمیان رہتی ہے۔ ایک اختیاری اپینڈکس Google Workspace کو کور کرتا ہے؛ وائس، ملٹی ایجنٹ سیفٹی، اور ACP-spawn ڈویلپر فنالے باب 56 کی طرف اشارہ کرتے ہیں۔

پیش شرائط (تین چیزیں؛ صفحہ انہیں فرض کرتا ہے):

  1. Claude Code یا OpenCode انسٹال شدہ۔ دونوں میں سے کوئی بھی چلتا ہے۔ اگر کوئی بھی نہیں، تو پہلے ایجنٹک کوڈنگ مختصر کورس کریں۔
  2. آپ نے ایجنٹک کوڈنگ مختصر کورس کر لیا ہے۔ آپ ٹول کالز اپروو کر سکتے ہیں، ایجنٹ کی آؤٹ پٹ پڑھ سکتے ہیں، پہچان سکتے ہیں کہ ایجنٹ کب اٹک جائے۔ ہم ان حرکتوں پر بھروسا کرتے ہیں؛ انہیں دوبارہ نہیں سمجھاتے۔
  3. Node.js 24 یا اس سے نیا۔ ٹرمینل میں node --version چلائیں۔ v24 سے نیچے ← nodejs.org/en/download سے ایک موجودہ ریلیز انسٹال کریں (اگر آپ کہیں تو آپ کا جنرل ایجنٹ آپ کو قدم بہ قدم رہنمائی دے گا)۔

صبر والا ورژن چاہیے؟ باب 56: اپنے پرسنل AI ایمپلائی سے ملیں اسی مواد پر سترہ اسباق ہیں، ساتھ وائس، ملٹی ایجنٹ، سیکیورٹی، اور ڈیپلائمنٹ۔ اگر یہاں کچھ بھی بہت تیز لگے، تو ملتے جلتے Ch56 سبق پر چھلانگ لگائیں اور واپس آئیں۔


📚 تدریسی معاون

مکمل سلائیڈ شو کھولیں

مکمل پریزنٹیشن دیکھیں ، OpenClaw کے ساتھ جنرل ایجنٹس


تعاون کا طریقہ

تین کردار اس صفحے کو شیئر کرتے ہیں۔ ڈایاگرام اس رشتے کو ٹھوس بناتا ہے:

تین کردار اس صفحے کو شیئر کرتے ہیں: آپ، آپ کا جنرل ایجنٹ، اور OpenClaw (AI ایمپلائی)۔ آپ پرامپٹس پیسٹ کرتے ہیں اور ایکشنز اپروو کرتے ہیں؛ آپ کا جنرل ایجنٹ OpenClaw انسٹال اور کنفیگر کرتا ہے؛ OpenClaw آپ کے فون پر جواب دیتا ہے اور شیڈول شدہ ٹاسکس چلاتا ہے۔

پھر ہر منظرنامہ وہی پانچ قدمی تال استعمال کرتا ہے:

  1. آپ ایک جملہ پیسٹ کرتے ہیں اپنے جنرل ایجنٹ میں۔ یہ ایک بریف ہے، اسکرپٹ نہیں۔ آپ بیان کرتے ہیں کہ آپ کیا چاہتے ہیں؛ آپ قدم نہیں گنتے۔
  2. آپ کا ایجنٹ AGENTS.md سے مشورہ کرتا ہے (پہلے سے اس کے کانٹیکسٹ میں: فولڈر کا CLAUDE.md سیشن شروع ہوتے ہی اسے خودبخود امپورٹ کرتا ہے، اس لیے کوئی فیچ مرحلہ نہیں) اور ایک پلان تجویز کرتا ہے۔ یہ ان کمانڈز کا نام لے گا جو وہ چلانا چاہتا ہے اور کسی بھی فیصلہ نقطے کو نشان زد کرے گا (کون سا چینل، کون سی اسکل، کیا یاد رکھنا ہے)۔ پہلی تخریبی کمانڈ سے پہلے یہ پوچھتا ہے۔
  3. آپ اپروو کرتے ہیں اور دیکھتے ہیں۔ ایجنٹ انسٹال کمانڈز چلاتا ہے، کنفیگریشن سیٹ کرتا ہے، بیک گراؤنڈ سروس ری اسٹارٹ کرتا ہے، لائیو لاگ آؤٹ پٹ دیکھتا ہے، اور آپ کو دکھاتا ہے کہ وہ کیا دیکھ رہا ہے۔ جب وہ کسی معلوم رکاوٹ سے ٹکراتا ہے، تو وہ طریقہ پہچان کر دستاویز شدہ حل لگاتا ہے۔
  4. آپ کا ایجنٹ جوڑ پر رک جاتا ہے۔ کچھ حرکتیں صرف آپ کر سکتے ہیں: Gemini کی چابی لینے کے لیے aistudio.google.com پر جانا، اپنے فون سے QR اسکین کرنا، Google کی OAuth اسکرینز سے کلک کر کے گزرنا، ایک وائس نوٹ چلتا ہوا سننا۔ ایجنٹ جوڑ کا نام لیتا ہے اور انتظار کرتا ہے۔
  5. آپ تب ختم کرتے ہیں جب ایک قابل مشاہدہ چیز ہوتی ہے۔ ڈیش بورڈ میں ایک حقیقی جواب۔ آپ کے فون سے ایک میسج کا جواب واپس آتا ہے۔ ڈسک پر ایک فائل ظاہر ہوتی ہے۔ ہر منظرنامہ آپ کو بتاتا ہے کہ کس چیز کا انتظار کرنا ہے۔

ہر منظرنامہ وہی پانچ قدمی تال استعمال کرتا ہے: آپ ایک جملہ پیسٹ کرتے ہیں؛ ایجنٹ ایک پلان تجویز کرتا ہے؛ آپ اپروو کرتے ہیں؛ ایجنٹ ایگزیکیوٹ کرتا ہے؛ آپ "ختم جب" ویری فائی کرتے ہیں۔ ایجنٹ کسی بھی ایسے جوڑ پر رکتا ہے جسے صرف آپ پار کر سکتے ہیں۔

بس اتنا ہی۔ ایجنٹ وہی کرتا ہے جو ایجنٹ اچھی طرح کرتا ہے: انسٹال، کنفیگر، ڈیبگ، ری اسٹارٹ، ویری فائی، ریکور۔ آپ وہی کرتے ہیں جو صرف آپ کر سکتے ہیں: فیصلہ کرنا، اپروو کرنا، اور ان چیزوں پر عمل کرنا جو آپ کے فون یا آپ کے اکاؤنٹس سے بندھی ہیں۔ یہ تال (مقصد بیان کریں، پلان لیں، اپروو کریں، ہر قدم پر تصدیق کے ساتھ ایگزیکیوٹ کریں) وہی پرامپٹنگ طریقہ ہے جو AI Prompting in 2026 مختصر کورس سکھاتا ہے؛ نیچے ہر منظرنامہ ہدایات کی دیوار کے بجائے دو چھوٹے پیسٹ پرامپٹس استعمال کرتا ہے، تاکہ آپ اس تال کو پڑھنے کے بجائے محسوس کریں۔

پورے مختصر کورس کے لیے ایک ریکوری مووو

اگر کسی بھی موقع پر کچھ غلط ہو جائے، تو آپ کو CLI کمانڈز یا ایرر کوڈز جاننے کی ضرورت نہیں۔ یہ اپنے ایجنٹ کو پیسٹ کریں:

کچھ کام نہیں کیا۔ gateway لاگ پڑھو، مجھے سادہ زبان میں بتاؤ کہ تم کیا دیکھتے ہو، اور ایک fix تجویز کرو جو میں اپروو کر سکوں۔

آپ کا ایجنٹ لاگ پڑھتا ہے، جو دیکھتا ہے اس کا نام لیتا ہے، اور fix تجویز کرتا ہے۔ آپ اپروو کرتے ہیں۔ یہی اس مختصر کورس کے ہر منظرنامے کے لیے ریکوری لوپ ہے۔

اگر کسی منظرنامے میں بہت وقت لگے

ہر منظرنامے کا ایک بجٹ ٹائم ہے (H2 میں دکھایا گیا)۔ اگر آپ اس بجٹ کے دو گنا سے آگے نکل جائیں (مثلاً 15 منٹ کے منظرنامے پر 30 منٹ سے آگے)، تو اپنے ایجنٹ کو واپس کھینچیں اور پیسٹ کریں: "ایک جملے میں، ہمیں کیا روک رہا ہے؟ وہاں سے دوبارہ پلان کرتے ہیں۔" بجٹ سے آگے نکلنا اکثر مطلب ہے کہ ایجنٹ امپرووائز کر رہا ہے؛ پلان پر دوبارہ اینکر کرنا اسے ٹھیک کرتا ہے۔

جو فولڈر آپ ڈاؤن لوڈ کریں گے اس میں ٹھیک دو فائلیں ہیں: AGENTS.md (کسی بھی OpenClaw کام کرنے والے جنرل ایجنٹ کے لیے ~600 لائن کا آپریشنل ریفرنس) اور CLAUDE.md (ایک لائن: @AGENTS.md، جو Claude Code کو بریف خودبخود امپورٹ کرنے کو کہتی ہے)۔ بس یہی پورا انوائرنمنٹ ہے۔ ایک فائل اور ایک لائن کا انڈیکس ہی وہ پوری "اسکل" ہے جو آپ اپنے ایجنٹ کو دیتے ہیں۔

openclaw-with-general-agents.zip ڈاؤن لوڈ کریں

کہیں بھی ان زپ کریں۔ ان زپ کیے فولڈر میں ایک ٹرمینل کھولیں۔ اپنا جنرل ایجنٹ لانچ کریں:

cd openclaw-with-general-agents
claude
cd openclaw-with-general-agents
opencode

آپ کے ایجنٹ کے پاس اب بریف لوڈڈ ہے۔ ہم چھ منظرناموں سے ایک ایک کر کے گزرتے ہیں؛ ہر ایک اگلے کے شروع ہونے سے پہلے ایک چلنے کے قابل کامیابی پر ختم ہوتا ہے۔ یہ بریف ایک قابل جنرل ایجنٹ فرض کرتا ہے (Claude Code، یا Claude Sonnet/Opus، GPT-5، یا Gemini 2.5 Pro چلاتا OpenCode)۔ پرانے یا چھوٹے ماڈلز لمبے منظرناموں پر بہک جائیں گے؛ اگر منظرنامہ 1 میں آپ کے ایجنٹ کا پہلا پلان آپ کی مشین کے لیے مخصوص ہونے کے بجائے دھندلا یا عام لگے، تو یہ سگنل ہے کہ آگے بڑھنے سے پہلے ایک مضبوط پر switch کریں۔


منظرنامہ 1 سے پہلے: تصدیق کریں کہ آپ کے ایجنٹ نے بریف لوڈ کیا (~30 سیکنڈ)

ایک پیسٹ آپ کو بتاتا ہے کہ CLAUDE.md نے اپنا کام کیا اور AGENTS.md کو آپ کے ایجنٹ کے کانٹیکسٹ میں کھینچ لایا:

OpenClaw کے لیے تم میرے لیے کیا کر سکتے ہو؟

اگر جواب مخصوص OpenClaw کام کا نام لیتا ہے (انسٹال probes، چینلز، برین فائلیں، اسکلز، MCP سرورز، شیڈولز، ماہانہ آڈٹ)، تو آپ لوڈڈ اور منظرنامہ 1 کے لیے تیار ہیں۔ اگر یہ بغیر کسی OpenClaw-مخصوص تفصیل کے عام AI صلاحیت کی باتوں جیسا لگے، تو امپورٹ نہیں چلا: ایجنٹ بند کریں، تصدیق کریں کہ آپ ان زپ کیے openclaw-with-general-agents/ فولڈر کے اندر ہیں، اور دوبارہ لانچ کریں۔

AGENTS.md میں اصل میں کیا ہے (وہ فائل جو آپ کا ایجنٹ اب پڑھ رہا ہے)

آپ کو یہ فائل خود کبھی پڑھنے کی ضرورت نہیں ہوگی؛ بس یہی بات ہے۔ لیکن اس کی شکل جاننا آپ کو بہتر سوال پوچھنے میں مدد دیتا ہے ("مجھے رکاوٹوں والا سیکشن سمجھاؤ" اس لیے چلتا ہے کہ سیکشن موجود ہے)۔ بریف، ترتیب سے، یہ کور کرتا ہے:

PART 1 :: PRINCIPLES (apply everywhere)
Versions checked against
Source of truth, in order ← live docs > this file > the gateway log
Critical: discover before you act ← table of 17 doc-URL pointers
Working pattern (every task) ← read → propose → ask → execute → verify
Safety rails (non-negotiable)
Secrets discipline

PART 2 :: OPERATIONS (by task type)
Install & onboard ← the probe + onboard + paid-default gotcha
Configure ← config CLI + human-path vs agent-path table
Diagnose & recover ← the 5 most common failures and their fixes
Channels (WhatsApp / Telegram / Discord + the TTY constraint)
Memory & brain ← 3 layers, brain files, cross-channel proof
Skills (via ClawHub) · Plugins · MCP servers
The activation dance ← exists → disabled → enabled → configured
Automation (heartbeats + cron + 3 hook flavors)
Multi-agent · ACP · Safety & security
When you don't know what to do ← three-layer fallback
Tone ← how to talk to you

اگر AGENTS.md کا کوئی خاص سیکشن بعد میں متعلق لگے، تو آپ اپنے ایجنٹ سے کہہ سکتے ہیں کہ عمل کرنے سے پہلے وہ آپ کو اس سے گزارے (مثلاً: "WhatsApp پیئر کرنے سے پہلے مجھے AGENTS.md کا Channels سیکشن سمجھاؤ")۔ بریف اس طرح لکھا گیا ہے کہ ایجنٹ اس سے خود کی رہنمائی کر سکے۔


منظرنامہ 1: ایمپلائی کو انسٹال اور بات چیت کرتا ہوا بنائیں (~15 منٹ)

مقصد: OpenClaw آپ کے لیپ ٹاپ پر چل رہا ہو، Gemini فری ٹیئر پر سیٹ ہو، اور جب آپ ڈیش بورڈ میں "hi" کہیں تو ایک جواب واپس آئے۔ تین چھوٹے پیسٹ پرامپٹس: پلان مانگیں، اپروو اور ایگزیکیوٹ کریں، پھر ویری فائی کریں۔

1ا۔ انسٹال اور کنفیگر

پہلا پرامپٹ: بیان کریں کہ آپ کیا چاہتے ہیں اور پلان مانگیں۔

میں OpenClaw اپنے لیپ ٹاپ پر چلانا چاہتا ہوں اور Gemini کے فری ٹیئر کے ذریعے جواب دلوانا چاہتا ہوں۔ کسی چیز کو ہاتھ لگانے سے پہلے، مجھے سادہ زبان میں اپنا پلان سمجھاؤ: پہلے کیا چیک کرو گے، کیا بدلو گے، اور کہاں تمہیں میری مدد چاہیے ہوگی۔

آپ کا ایجنٹ AGENTS.md پڑھتا ہے، آپ کی مشین دیکھتا ہے، اور ایک پلان تجویز کرتا ہے۔ یہ دو جگہیں نشان زد کرے گا جہاں اسے آپ کی ضرورت ہے: aistudio.google.com/app/api-keys سے ایک مفت Gemini API چابی لینا، اور آپ کے سسٹم میں تبدیلی کرنے سے پہلے تصدیق۔ پلان پڑھیں۔ اگر مناسب لگے، تو آگے بڑھیں۔ اگر کچھ غلط لگے، تو اعتراض کریں۔ پوچھیں "تم یہ کیوں کر رہے ہو؟" اور ایجنٹ سمجھائے گا یا ایڈجسٹ کرے گا۔

دوسرا پرامپٹ: اپروو کریں اور اسے چلنے دیں۔

پلان اچھا لگتا ہے۔ قدم بہ قدم آگے بڑھو، اور ہر قدم پر مجھے بتاؤ کہ تم کیا دیکھتے ہو۔ جب تمہیں میری Gemini چابی چاہیے ہو، تو رک جاؤ اور بتاؤ کہ میں تمہیں اسے محفوظ طریقے سے کیسے دوں۔

ایجنٹ رک کر آپ کی چابی مانگے گا۔ aistudio.google.com/app/api-keys پر جائیں، ایک بنائیں (مفت، کوئی کریڈٹ کارڈ نہیں)، اور جو بھی محفوظ ہینڈلنگ ہدایت آپ کا ایجنٹ دے اس پر عمل کریں۔ اسے چاہیے کہ آپ کی چابی کو چیٹ میں پیسٹ کرنے کے بجائے آپ کے ٹرمینل کے ایک انوائرنمنٹ ویری ایبل کو ترجیح دے۔

1ا تب ختم جب: ایجنٹ رپورٹ کرے کہ OpenClaw انسٹال ہو گیا، کنفیگر ہو گیا، اور Gemini چابی اپنی جگہ ہے۔

1ب۔ اینڈ ٹو اینڈ ویری فائی کریں اور ڈیش بورڈ کھولیں

تیسرا پرامپٹ: پہلے اینڈ ٹو اینڈ ویری فائی کریں، پھر ڈیش بورڈ کے حوالے کریں۔

اب پہلے اپنا خود کا اینڈ ٹو اینڈ چیک کرو (کمانڈ لائن سے gateway کے ذریعے ایک تیز "hi"، جیسے تمہارا بریف بیان کرتا ہے)، پھر میرے لیے ڈیش بورڈ کھولو تاکہ میں براؤزر سے بھی اسے try کر سکوں۔

آپ منظرنامہ 1 سے تب فارغ ہوتے ہیں جب: آپ کے ایجنٹ کا اپنا CLI چیک ایک حقیقی جواب کے ساتھ واپس آیا، اور وہ ڈیش بورڈ جو اس نے آپ کے براؤزر میں آپ کے لیے کھولا وہ بھی hi ٹائپ کرنے کے بعد جواب دیتا ہے۔ ڈیش بورڈ فوٹر کو google/gemini-3.5-flash کو ایکٹیو ماڈل کے طور پر دکھانا چاہیے۔ اگر یہ کچھ اور دکھائے (خاص طور پر ایک pro-preview ماڈل)، تو اپنے ایجنٹ کو بتائیں اور وہ آپ کو چارج ہونے سے پہلے فری ٹیئر پر switch کر دے گا۔

اندرونی طور پر، OpenClaw اب آپ کے لیپ ٹاپ پر چلتے تین ٹکڑے ہے، سب ایک بیک گراؤنڈ سروس سے کوآرڈینیٹ ہوتے ہیں جو آپ کے لاگ اِن کرتے ہی شروع ہو جاتی ہے:

آرکیٹیکچر ڈایاگرام: میسجز آپ کے فون سے Channel اڈاپٹرز کے ذریعے Gateway (پورٹ 18789 پر لمبی مدت کی سروس جو سیشنز رکھتی ہے اور ٹول کالز ڈسپیچ کرتی ہے) میں بہتے ہیں، پھر Agent (برین فائلیں اور اسٹیٹ ~/.openclaw/workspace/ پر) تک۔ Gateway ہمیشہ آن سبسٹریٹ ہے۔

آپ ہر ٹکڑے سے آنے والے منظرناموں میں ملیں گے۔ فی الحال: یہ انسٹال ہو گیا، اور یہ جواب دے رہا ہے۔

اندر جھانک کر دیکھیں: آپ کے ایجنٹ نے اصل میں کیا چلایا (آپ یہ کبھی ٹائپ نہیں کرتے)

آپ کو ان کمانڈز کی ضرورت نہیں، کام ایجنٹ کے حوالے کرنے کی بس یہی پوری بات ہے۔ لیکن انہیں ایک بار دیکھنا مطلب ہے کہ اگر آپ کا ایجنٹ کسی بعد کے منظرنامے میں کبھی بہک جائے، تو آپ اس کے پلان پر نظر ڈال کر پہچان سکتے ہیں کہ وہ تقریباً ٹھیک چیز کر رہا ہے یا نہیں، بجائے اس کے کہ خالص جادو کو گھورتے رہیں۔ جو انسٹال آپ کے ایجنٹ نے ابھی چلایا، وہ اندر سے تقریباً پانچ کمانڈز ہے:

npm install -g openclaw@latest        # install the CLI globally
openclaw onboard --install-daemon # the setup wizard: picks model, takes your key,
# installs the always-on background service
openclaw gateway status # confirm the gateway is up on port 18789
openclaw dashboard # open the Control UI in your browser
openclaw doctor # health check: Node, key, gateway, workspace

سب کچھ ~/.openclaw/ کے نیچے رہتا ہے: آپ کا config openclaw.json میں، آپ کی Gemini چابی credentials/ میں، اور آپ کے AI ایمپلائی کا دماغ workspace/ میں (وہ فائلیں جو آپ منظرنامہ 4 میں کسٹمائز کریں گے)۔ یہی وہ بنیادی حقیقت ہے جسے اوپر والا آرکیٹیکچر ڈایاگرام بنا رہا ہے۔

آپ پھر بھی انہیں ہاتھ سے نہیں چلائیں گے، آپ کا ایجنٹ چلاتا ہے، اور وہ docs.openclaw.ai/llms.txt پر لائیو docs پڑھتا ہے تاکہ موجودہ flags ٹھیک کرے۔ لیکن اب "gateway" اور "workspace" الفاظ نہیں؛ بلکہ ایک سروس اور ایک فولڈر ہیں جن کی طرف آپ اشارہ کر سکتے ہیں۔ جب ریکوری پرامپٹ کہتا ہے "gateway لاگ پڑھو"، تو آپ جانتے ہیں کہ وہ کیا پڑھ رہا ہے۔


منظرنامہ 2: اپنے فون سے ایک چینل پیئر کریں (~15 منٹ)

مقصد: اپنے فون سے اپنے AI ایمپلائی کو "hi" بھیجیں اور ایک جواب واپس پائیں۔

یہ اپنے ایجنٹ کو پیسٹ کریں:

ماڈل ڈیش بورڈ میں جواب دیتا ہے۔ اب میں اپنے AI ایمپلائی سے اپنے فون سے بات کرنا چاہتا ہوں۔ مجھے WhatsApp پیئر کرنا سمجھاؤ (ترجیحی)، یا اگر جہاں میں رہتا ہوں وہاں WhatsApp بہت مشکل ہو تو Telegram یا Discord پر واپس چلے جاؤ۔ اپنا پلان سمجھاؤ اور کوئی بھی سیٹ اپ جو شروع کرنے سے پہلے مجھے اپنی طرف سے کرنا ہو۔

آپ کا ایجنٹ آپ کو بتائے گا کہ وہ کون سا راستہ تجویز کر رہا ہے اور کیوں۔ WhatsApp کے لیے اسے آپ کے ذاتی اکاؤنٹ کے بجائے WhatsApp Business کے ساتھ ایک دوسرا نمبر تجویز کرنا چاہیے (بنیادی لائبریری غیر رسمی ہے اور Meta ذاتی اکاؤنٹس بین کر سکتی ہے)۔ Telegram کے لیے یہ آپ کو BotFather تک لے جائے گا۔ Discord کے لیے یہ آپ کو Developer Portal اور ان تین پرائیویسی intents سے گزارے گا جنہیں آپ کو آن کرنا ہے۔

آپ کا ایجنٹ جو ایک چیز آپ کے لیے نہیں کر سکتا: لاگ اِن مرحلہ QR کوڈ یا ٹوکن پرامپٹ کے لیے ایک چھوٹا ٹرمینل-بیسڈ UI استعمال کرتا ہے، اور وہ UI ٹھیک سے رینڈر نہیں ہوتا جب کوئی ایجنٹ اسے اپنے shell ٹول کے ذریعے چلاتا ہے۔ تو کسی موقع پر آپ کا ایجنٹ رک کر آپ سے کہے گا کہ اسی فولڈر میں ایک نیا ٹرمینل ونڈو کھولیں اور لاگ اِن کمانڈ خود چلائیں۔ اپنے فون سے QR اسکین کریں (WhatsApp Business → Settings → Linked Devices → Link a Device) یا وہ بوٹ ٹوکن پیسٹ کریں جو آپ نے BotFather یا Developer Portal سے لیا۔ مکمل ہونے پر اپنے ایجنٹ کو "linked" بتائیں۔

آپ اس منظرنامے سے تب فارغ ہوتے ہیں جب: آپ اپنے فون سے بندھے نمبر کو hi بھیجیں اور ایک حقیقی جواب واپس آئے۔

اگر آپ چاہتے ہیں کہ AI ایمپلائی WhatsApp گروپ چیٹس میں بھی کام کرے (صرف ایک پر ایک نہیں)، تو اپنے ایجنٹ کو بتائیں:

AI ایمپلائی کو گروپ چیٹس کے لیے بھی کھول دو۔ مجھے سمجھاؤ کہ کیا بدلتا ہے اور میں اسے ایک ٹیسٹ گروپ میں کیسے add کروں۔

منظرنامہ 3 میں آگے لے جانے والی بات

آپ کا فون اب آپ کے لیپ ٹاپ پر OpenClaw سروس تک ایک authenticated راستہ ہے۔ وہ pairing حقیقی بھروسا ہے جو آپ کے فون نے ابھی دیا۔ اسے ایک credential کی طرح سمجھیں: pairing فائلیں شیئر نہ کریں، انہیں public ریپو میں commit نہ کریں، اور اگر آپ لیپ ٹاپ کھو دیں تو اپنے فون سے ڈیوائس revoke کریں (WhatsApp Business → Linked Devices، یا Telegram یا Discord کے لیے برابر والی سیٹنگ)۔


منظرنامہ 3: حقیقی کام سونپیں اور لوپ دیکھیں (~10 منٹ)

تصور۔ جو چیز ایک "AI ایمپلائی" کو چیٹ بوٹ سے الگ کرتی ہے وہ ہے ایجنٹ لوپ: ایک حقیقی ٹاسک آتا ہے، ایجنٹ فیصلہ کرتا ہے کہ اسے کون سے ٹولز چاہئیں (web fetch، calendar، file read، جو بھی)، انہیں call کرتا ہے، جو واپس آتا ہے اسے پڑھتا ہے، اور ایک جواب بناتا ہے۔ جب تک آپ نے لوپ کو کسی حقیقی ٹاسک پر چلتا نہ دیکھا ہو، "ایجنٹ" مارکیٹنگ جیسا لگتا ہے۔ ایک بار دیکھ لینے کے بعد، آپ اس کا نام لے سکتے ہیں جو آپ کا AI ایمپلائی ہر بار جواب دیتے وقت اصل میں کر رہا ہوتا ہے۔

یہ اپنے ایجنٹ کو پیسٹ کریں:

چینل کام کرتا ہے۔ آؤ ثابت کریں کہ یہ ایک چیٹ بوٹ سے زیادہ ہے۔ میں اپنے فون سے ایک ٹاسک بھیجنا چاہتا ہوں جس کے لیے ایجنٹ کو واقعی جا کر کچھ کرنا پڑے۔ gateway لاگ کا ایک live view سیٹ کرو تاکہ میں ایجنٹ لوپ کو real time میں ہوتا دیکھ سکوں، پھر مجھے بتاؤ جب تم تیار ہو کہ میں ٹاسک بھیجوں۔

آپ کا ایجنٹ ایک side ٹرمینل کھولتا ہے (یا آپ سے کھولنے کو کہتا ہے) جو gateway لاگ live stream کرتا ہے۔ جب وہ تیار ہو، ایک حقیقی ٹاسک بھیجیں جو آپ واقعی اپنے فون سے سونپیں گے۔ اپنی حقیقی زندگی سے کچھ منتخب کریں، کوئی tutorial demo نہیں۔ کچھ شکلیں جو پہلے ٹاسک کے لیے اچھی چلتی ہیں:

  • Research lookup: "<ایک competitor یا vendor جس کی میں پروا کرتا ہوں> اپنے entry plan کے لیے کیا charge کرتا ہے، اور کیا شامل ہے؟ مجھے ایک پیراگراف کا خلاصہ plus source URL دو۔"
  • Web fetch اور analyze: "یہ article URL پڑھو جو میں پیسٹ کروں گا اور مجھے وہ تین claims بتاؤ جو <میرے role یا میری industry> کو سب سے زیادہ متاثر کرتے ہیں، ہر ایک پر ایک جملہ کے ساتھ کہ وہ کتنا مضبوط ہے۔"
  • Structured task: "<ایک فولڈر یا label جسے میں نام دوں> میں میری آخری پانچ بھیجی گئی emails دیکھو؛ مجھے بتاؤ کس ایک کو سب سے زیادہ follow-up کی ضرورت ہے اور follow-up میں کیا کہنا چاہیے۔"

نکتہ: یہ اس قسم کا ٹاسک ہے جسے ChatGPT منع کر دے یا خراب کرے۔ اس کے لیے ایجنٹ کو حقیقی data fetch کرنا، اس پر سوچنا، اور کچھ structured بنانا پڑتا ہے۔ آپ کا AI ایمپلائی fetch کرتا ہے، سوچتا ہے، اور جواب دیتا ہے۔

لاگ stream میں آپ تقریباً چھ لائنیں گزرتی دیکھیں گے:

  1. ایک inbound میسج آپ کے چینل پر آتا ہے۔
  2. ایک model call: ایجنٹ لوپ میسج کو Gemini کو بھیجتا ہے اور پوچھتا ہے کہ کیا کرنا ہے۔
  3. ایک tool call: ایجنٹ وہ ٹول invoke کرتا ہے جو ٹاسک کو چاہیے (web fetch، file read، calendar lookup)۔
  4. ایک tool result: ٹول نے جو واپس کیا، content کے ایک ٹکڑے کے طور پر۔
  5. ایک دوسرا model call: لوپ نتیجہ summarize کرنے کے پرامپٹ کے ساتھ Gemini کو واپس بھیجتا ہے۔
  6. ایک outbound میسج: جواب آپ کے چینل کو واپس جاتا۔

آپ اس منظرنامے سے تب فارغ ہوتے ہیں جب: آپ نے وہ چھ لائن والی شکل گزرتی دیکھ لی اور جواب آپ کے فون پر آ گیا۔ وہ شکل لوپ ہے۔ جو کچھ آپ بعد کے منظرناموں میں add کرتے ہیں (ایک نئی اسکل، ایک بیرونی ٹول، ایک شیڈول شدہ ٹاسک) وہ صرف اسی لوپ کے اندر زیادہ ٹولز یا زیادہ triggers add کرتا ہے۔


منظرنامہ 4: اسے اپنی طرح بلوائیں اور یاد رکھوائیں (~15 منٹ)

آپ کے AI ایمپلائی کا رویہ اس کے workspace میں، ~/.openclaw/workspace/ پر، markdown فائلوں کے ایک سیٹ سے آتا ہے۔ ایک نیا انسٹال ان میں سے کئی بھیجتا ہے؛ یہ منظرنامہ ان تین کو چھوتا ہے جنہیں آپ پہلے دن سب سے زیادہ کسٹمائز کریں گے (SOUL.md، IDENTITY.md، USER.md)، پھر آپ سے ایک چوتھا بنواتا ہے (MEMORY.md، جو ایجنٹ کے پہلی بار لکھنے تک موجود نہیں ہوتا)۔ باقی (AGENTS.md ایجنٹ کے اپنے آپریٹنگ قواعد کے لیے، جو آپ کے زپ کے ساتھی AGENTS.md سے الگ ہے؛ TOOLS.md ٹول پالیسی کے لیے؛ HEARTBEAT.md ماحولیاتی روٹین کے لیے) Ch56 Lesson 4: اپنے ایمپلائی کا دماغ کسٹمائز کریں میں کور ہوتے ہیں۔

میں کون سی فائل ایڈٹ کروں؟ ~/.openclaw/workspace/ پر سات workspace فائلوں کے لیے ایک چیٹ شیٹ۔ اوپر والا row: SOUL.md (آواز)، AGENTS.md (operations)، IDENTITY.md (نام)، USER.md (context)۔ نیچے والا row: TOOLS.md (capabilities)، HEARTBEAT.md (routines)، MEMORY.md (memory)۔ ہر کارڈ &quot;جب آپ X بدلنا چاہیں تب ایڈٹ کریں&quot; اور &quot;X یہاں نہ رکھیں&quot; لکھتا ہے۔ سب فائلیں سیشن شروع ہوتے ہی system prompt میں inject ہوتی ہیں۔

  • SOUL.md: شخصیت اور لہجہ (یہ کیسے بات کرتا ہے)
  • IDENTITY.md: اس کا اپنا نام اور کردار (یہ خود کو کیسے پیش کرتا ہے)
  • USER.md: یہ آپ کے بارے میں کیا جانتا ہے (مستقل context)
  • MEMORY.md: پائیدار حقائق جو یہ چینلز کے آر پار commit کرتا ہے

آپ ہر فائل کو ایک بار چھوئیں گے، ہر ایڈٹ کے بعد ایک میسج بھیجیں گے، اور فرق محسوس کریں گے۔ شروع کرنے سے پہلے دو چیزیں جاننا قابل قدر ہیں: ہر فائل کو ہلکا رکھیں (ہر لائن context cost ہے جو ایجنٹ ہر turn پر ادا کرتا ہے، ہر چینل reply اور ہر شیڈول شدہ job سمیت، اس لیے ہر ایک کا ایک دو صفحے کافی ہیں)، اور انہیں بعد میں بار بار نہ بدلیں کیونکہ یہ آپ کے AI ایمپلائی کے بھیجے ہر reply کو شکل دیتی ہیں۔

سب منظرنامے شروع ہونے سے پہلے، ایک تیز orientation کے لیے یہ اپنے جنرل ایجنٹ کو پیسٹ کریں:

کچھ بھی کسٹمائز کرنے سے پہلے ایک تیز orientation: میرا workspace ~/.openclaw/workspace/ پر کھولو اور مجھے ہر ایک کے لیے ایک لائن میں بتاؤ کہ SOUL.md، IDENTITY.md، اور USER.md میں اس وقت کیا ہے۔ صرف defaults؛ ہم انہیں آگے بدلیں گے، پھر MEMORY.md ساتھ بنائیں گے۔

آپ کو ہر فائل کا ایک snapshot ملے گا کہ چیزیں کہاں سے شروع ہوتی ہیں۔ آنے والے ایڈٹس محسوس ہوں گے کہ وہ ان مخصوص فائلوں میں تبدیلیاں ہیں جو آپ نے دیکھی ہیں، نہ کہ ان abstract فائلوں میں ایڈٹس جو آپ نے نہیں دیکھیں۔

برین ایڈٹس کو لوڈ ہونے کے لیے /reset چاہیے (ایک بار پڑھیں، 4ا-4د پر لاگو)

کسی workspace فائل (SOUL.md، IDENTITY.md، USER.md، MEMORY.md) میں کسی بھی ایڈٹ کے بعد، نیا content ڈسک پر ہے لیکن چلتی ہوئی OpenClaw سیشن ابھی بھی system prompt کا اپنا cached snapshot استعمال کر رہی ہے۔ اپنے فون (paired چینل) سے /reset بھیجیں تاکہ OpenClaw کو ڈسک سے system prompt دوبارہ بنانے کو کہیں۔ اگر آپ نے منظرنامہ 2 چھوڑ دیا اور آپ کے پاس paired چینل نہیں، تو اس کے بجائے ڈیش بورڈ چیٹ سے /reset بھیجیں، جو http://127.0.0.1:18789 پر ہے۔ نیچے ہر سب منظرنامہ ایڈٹ اور ٹیسٹ میسج کے درمیان اس قدم کو فرض کرتا ہے۔

4ا۔ SOUL.md: اس کی آواز بدلیں

یہ اپنے جنرل ایجنٹ کو پیسٹ کریں:

SOUL.md پر ایک نظر ڈالو اور تین چھوٹی تبدیلیاں تجویز کرو جو replies کو زیادہ سیدھا اور کم ہچکچاہٹ والا بنائیں (یا جو بھی style مجھے کمی ہے)۔ پہلے مجھے diff دکھاؤ؛ صرف میری approval کے بعد لگاؤ۔

ایڈٹ اترنے کے بعد، اپنے فون سے /reset بھیجیں، پھر ایک عام میسج جیسے How are you today?

تب ختم جب: reply کا لہجہ اس پھیکے "hi" reply سے ظاہری طور پر مختلف ہو جو آپ کو منظرنامہ 1 میں ملا۔

4ب۔ IDENTITY.md: اسے ایک نام دیں

یہ اپنے جنرل ایجنٹ کو پیسٹ کریں:

اسے ایک نام اور ایک کردار دو۔ میں چاہتا ہوں کہ یہ خود کو "Atlas، میرا research assistant" کے طور پر پیش کرے (یا جو بھی نام اور کردار تمہیں ٹھیک لگیں چنو اور مجھے بتا دو)۔ پہلے مجھے diff دکھاؤ۔

ایڈٹ اترنے کے بعد، /reset اور اپنے فون سے Who are you? پوچھیں۔

تب ختم جب: یہ نئے نام اور کردار کے ساتھ خود کو پیش کرے، default کے ساتھ نہیں۔

4ج۔ USER.md: اسے اپنے بارے میں سکھائیں

یہ اپنے جنرل ایجنٹ کو پیسٹ کریں:

اسے میرے بارے میں سکھاؤ۔ میرا پورا نام، میرا role، میرا timezone، اور وہ تین موضوع add کرو جن میں مجھے سب سے زیادہ مدد چاہیے ہوتی ہے۔ جو بھی تم پہلے سے نہیں جانتے مجھ سے پوچھو، اور لگانے سے پہلے مجھے diff دکھاؤ۔

یہ جو بھی کمی ہو اس کے بارے میں پوچھے گا۔ ایڈٹ اترنے کے بعد، /reset اور پوچھیں What should I prioritize this afternoon, given what you know about me?

تب ختم جب: جواب آپ کے timezone اور آپ کے top موضوعات کو شامل کرے، عام مشورہ نہیں۔

4د۔ MEMORY.md: چینلز کے آر پار commit کریں

پہلی تین فائلیں آواز کو شکل دیتی ہیں۔ MEMORY.md مختلف ہے: یہ صرف ایجنٹ کے main سیشن میں لوڈ ہوتی ہے، اس لیے جو کچھ بھی آپ چاہتے ہیں کہ یہ چینلز کے آر پار جانے، اسے جان بوجھ کر commit کرنا پڑتا ہے۔ نیچے دی گئی چار قدمی سیڑھی تین layers (session memory، channel cache، long-term commit) کو ایک ایک کر کے ثابت کرتی ہے۔

نیچے والا ٹیسٹ fact آپ کے ہفتے سے مخصوص ایک عارضی اور خاص چیز ہے، کوئی مستحکم identity fact نہیں: آپ کے نام جیسے مستحکم حقائق 4ج سے پہلے ہی USER.md میں ہیں، اس لیے اگر ہم انہیں استعمال کریں تو دیوار نہیں چلے گی۔ کوئی حقیقی زیر عمل چیز منتخب کریں: "میں [ایک حقیقی project] Friday تک ختم کرنے کی کوشش کر رہا ہوں" یا "میں Wednesday کو [ایک حقیقی client] کے لیے ایک pitch تیار کر رہا ہوں" چلتا ہے۔

Memory layers ڈایاگرام: تین اوپر نیچے چپکی horizontal layers۔ Session memory RAM میں رہتی ہے اور صرف reset تک زندہ رہتی ہے۔ Channel memory ڈسک پر ہر چینل کے لیے رہتی ہے اور gateway restarts کے بعد زندہ رہتی ہے۔ Long-term memory (MEMORY.md ~/.openclaw/workspace/ پر) واحد layer ہے جسے چینلز کے آر پار لوڈ ہونے کے لیے ایک جان بوجھ کر commit کی ضرورت ہوتی ہے۔

چار قدم۔ (آپ صرف تین حقیقی میسجز بھیجتے ہیں؛ باقی چھوٹی queries ہیں۔)

  1. اپنے paired چینل سے: Quick context: I'm trying to finish [your real in-flight thing] by Friday. Hold onto this. پھر فوراً: What am I trying to finish by Friday? یہ جواب دیتا ہے (session + channel memory، دونوں خودکار)۔
  2. ڈیش بورڈ چیٹ سے (http://127.0.0.1:18789، ایک مختلف سیشن): What am I trying to finish by Friday? یہ نہیں جانتا۔ یہی دیوار ہے: channel memory ہر چینل کے لیے ہے، ان کے آر پار share نہیں ہوتی۔
  3. واپس اپنے paired چینل میں: Commit my Friday goal to your long-term memory. آپ کا ایجنٹ MEMORY.md بناتا ہے (اس پہلے commit تک یہ موجود نہیں تھا) اور تصدیق کرتا ہے۔
  4. دوبارہ ڈیش بورڈ چیٹ سے (پہلے /reset بھیجیں تاکہ نیا commit کیا MEMORY.md لوڈ ہو): What am I trying to finish by Friday? اب یہ جانتا ہے۔ جان بوجھ کر کیے commit نے دیوار پار کر لی۔

مکمل memory model کے لیے (edge cases، /reset ہر layer کے ساتھ کیسے interact کرتا ہے، gateway restarts کے دوران کیا ہوتا ہے)، دیکھیں Ch56 Lesson 5: Memory اور Commands۔

آواز اور memory سیڑھی تب ختم جب: قدم 4 کامیاب ہو۔ آپ کا AI ایمپلائی اب آپ کی طرح بولتا ہے، جیسے آپ چاہتے ہیں ویسے خود کو پیش کرتا ہے، آپ کے بارے میں context جانتا ہے، اور چینلز کے آر پار آپ کو یاد رکھتا ہے کیونکہ کچھ جان بوجھ کر commit کیا گیا، صرف cache نہیں ہوا۔ منظرنامہ 4 کے پوری طرح ختم ہونے سے پہلے ایک اور قدم (4ہ)۔

4ہ۔ جو شناخت آپ نے ابھی بنائی اسے بیک اپ کریں

یہی workspace ~/.openclaw/workspace/ پر آپ کا AI ایمپلائی ہے: وہ برین فائلیں جو آپ نے ابھی کسٹمائز کیں، plus باقی workspace markdown (operating rules، tool policy، heartbeat routine) اور جو کچھ آپ بعد میں add کریں گے (منظرنامہ 6 میں schedules، installed skills، وغیرہ)۔ اگر آپ کا لیپ ٹاپ آج رات مر جائے، تو آپ یہ سب کھو دیتے ہیں الا کہ یہ کہیں اور رہتا ہو۔ پورے workspace کو dotfiles کی طرح سمجھیں۔

یہ اپنے جنرل ایجنٹ کو پیسٹ کریں:

میرے ایجنٹ کا workspace ~/.openclaw/workspace/ پر ایک private GitHub ریپو میں backup کرو تاکہ اگر میرا لیپ ٹاپ مر جائے تو میں اسے نہ کھوؤں۔ سب workspace فائلیں شامل کرو (SOUL/IDENTITY/USER/MEMORY برین فائلیں plus AGENTS.md، TOOLS.md، HEARTBEAT.md، اور کوئی بھی مستقبل کی additions جیسے schedule فائلیں)، اور secrets اور session caches کو exclude کرو۔ جو Git ٹولز میرے پاس پہلے سے ہیں ان کی بنیاد پر جس طریقے سے سب سے آسان ہو اسے سیٹ کرو، اور جب تم ختم کرو تو مجھے ایک لائن دو جسے میں کسی محفوظ جگہ save کر سکوں جو OpenClaw وہاں install کرنے کے بعد اسے ایک نئی لیپ ٹاپ پر دوبارہ clone کر دے۔

آپ منظرنامہ 4 سے تب فارغ ہوتے ہیں جب: private ریپو GitHub پر موجود ہو، آپ کا workspace push ہو گیا ہو (برین فائلیں plus باقی workspace markdown)، اور آپ کے پاس ایک recovery one-liner saved ہو (اسے کسی notes app یا password manager میں پیسٹ کریں جو آپ بعد میں ڈھونڈ لیں گے)۔ آپ کے AI ایمپلائی کی شناخت اب ایک لیپ ٹاپ wipe سے بچ جاتی ہے۔


منظرنامہ 5: ایک اسکل اور ایک ٹول کے ساتھ اسے بڑھائیں (~15 منٹ)

تصور۔ آپ کے AI ایمپلائی میں capabilities add کرنے کے دو مختلف طریقے، مختلف شکلوں کے ساتھ:

  • ایک اسکل ایک فولڈر ہے جس میں ایک SKILL.md فائل ہوتی ہے: مہارت جسے ایجنٹ خودبخود invoke کرتا ہے جب کوئی ٹاسک match کرے۔ اسکلز ایک cross-runtime spec (agentskills.io) کی پیروی کرتی ہیں تاکہ وہی فولڈر OpenClaw، Claude Code، OpenCode، اور 50+ دوسروں میں چلے۔ دو registries spec کے خلاف distribute کرتے ہیں: skills.sh (وسیع، cross-runtime) اور ClawHub (OpenClaw-curated، زیادہ vetted)۔
  • ایک MCP ٹول قابلیت ہے جسے ایجنٹ call کر سکتا ہے: ایک بیرونی سروس جو Model Context Protocol کے ذریعے functions expose کرتی ہے (کسی بھی zone میں موجودہ وقت لیں، ایک database query کریں، ایک calendar invite بھیجیں، وغیرہ)۔ Configure، restart، verify؛ ایجنٹ بغیر کسی code کے نئے ٹولز حاصل کرتا ہے۔

اسکلز know-how inject کرتی ہیں؛ ٹولز پہنچ بڑھاتے ہیں۔ دونوں وہی شکل follow کرتے ہیں: install (یا configure) کریں، gateway restart کریں تاکہ OpenClaw انہیں اٹھا لے، verify کریں کہ یہ loaded ہیں، پھر اپنے فون سے test کریں۔

نیچے ہر پرامپٹ ایجنٹ کو ایک Ch56 lesson URL plus آپ کا USER.md دیتا ہے۔ Lesson میں ٹھیک commands ہیں؛ آپ natural language میں رہتے ہیں جبکہ ایجنٹ پڑھتا، plan بناتا، execute، اور verify کرتا ہے۔

5ا۔ ایک اسکل add کریں جو اس چیز سے میل کھائے جو آپ واقعی کرتے ہیں

خبردار: ایک installed اسکل جو fire نہیں کرتی وہ تقریباً ہمیشہ ایک description mismatch ہے۔ install نے کام کیا؛ آپ کے میسج نے بس اسکل کے trigger description سے match نہیں کیا۔ یہ description کے بارے میں data ہے، کوئی ٹوٹی install نہیں: gateway لاگ skill-load event تب دکھاتا ہے جب یہ fire کرتی ہے۔

پہلا پرامپٹ: lesson پڑھو، discovery اسکل لو، تجویز کرو۔

Read https://agentfactory.panaversity.org/docs/Building-OpenClaw-Apps/meet-your-personal-ai-employee/install-skills-discover-ecosystem so you know how OpenClaw installs skills (cross-runtime spec, scopes, gateway restart). Then check whether the find-skills skill is already installed. If it isn't, install just that one skill from skills.sh with Global scope (so it lands in both Claude Code and OpenClaw) and restart the gateway. Once find-skills is available, use it to search skills.sh against my USER.md and propose two or three real skills that fit how I work. For each, tell me what its description triggers on (a sharp description fires when it should; a vague one never fires), how I'd verify it actually fired versus a vanilla reply, and which one you'd pick first. Don't install the chosen one yet; I want to pick first.

آپ کو آپ کے حقیقی کام پر مبنی ایک چھوٹی list ملتی ہے، حقیقی install URLs کے ساتھ۔ ایک منتخب کریں۔

دوسرا پرامپٹ: دونوں runtimes میں install کرو، پھر verify کرو۔

Install [your pick] with Global scope so it lands in both Claude Code's and OpenClaw's skills directories at once, then restart the gateway. Tell me which directories it wrote to so I can see it. List the SKILL.md description back to me so I know exactly what to send from my paired channel to trigger it, and what to watch for in the reply that proves the skill fired versus a vanilla model response.

اپنے paired چینل سے، وہ test input بھیجیں جو آپ کے ایجنٹ نے تجویز کیا (ایک meeting transcript، ایک draft email، ایک code snippet، جو بھی اسکل کے لیے ہو)۔

5ا تب ختم جب: آپ کے ایجنٹ نے تصدیق کر دی کہ اسکل installed ہے (اور آپ کو دکھا دیا کہاں) اور test input ایک ایسا reply پیدا کرے جس میں اسکل کا مخصوص format یا framing ہو (کوئی عام جواب نہیں)۔ اگر اسکل fire نہ کرے، تو وہ اکثر ایک description mismatch ہے (آپ کا میسج اسکل کی description کو trigger نہیں کرتا) یا ایک چھوٹ گئی restart؛ universal recovery پرامپٹ پیسٹ کریں۔

5ب۔ ایک بیرونی ٹول connect کریں (کسی credentials کی ضرورت نہیں)

سب سے بنیادی hello-world MCP mcp-server-time ہے: کوئی API چابی نہیں، دو ٹولز (get_current_time، convert_time)۔ یہ "آپ نے ایک بیرونی ٹول connect کر لیا" کا standard ثبوت ہے۔ خبردار: MCP خاموشی سے fail ہوتا ہے۔ ایک غلط-configure سرور چیٹ میں کوئی error پیدا نہیں کرتا؛ ایجنٹ بس ٹول نہیں پاتا۔ gateway لاگ ہی واحد diagnostic ہے۔

پہلا پرامپٹ: lesson پڑھو، configure کرو، verify کرو۔

Read https://agentfactory.panaversity.org/docs/Building-OpenClaw-Apps/meet-your-personal-ai-employee/connect-external-tools so you know the configure-then-restart shape and the Silent Failure pattern. Then set up the mcp-server-time example from the lesson (no API key needed). Show me the plan first, then execute. After the gateway restart, prove time is registered with 2 tools. If it's missing or shows 0 tools, that's Silent Failure: read the gateway log, tell me in plain language what you see, and propose a fix.

ایجنٹ lesson سے گزرتا ہے، commands چلاتا ہے، اور آپ کو registration list دکھاتا ہے۔ جو لائن آپ دیکھنا چاہتے ہیں: time 2 ٹولز کے ساتھ۔ اگر یہ وہاں نہ ہو، تو ایجنٹ diagnose کرتا ہے؛ آپ fix اپروو کرتے ہیں۔

دوسرا پرامپٹ: اپنے فون سے ٹول trigger کرو، ڈیش بورڈ badge کا انتظار کرو۔

The time MCP is connected. I'll ask a real timezone question from my paired channel. Tail the gateway log live so we can see get_current_time invoked in real time, and tell me what to watch for in the dashboard at http://127.0.0.1:18789: there should be a tool badge showing the agent used the time MCP rather than guessing from training data.

اپنے فون سے، ایک حقیقی وقت کا سوال پوچھیں جو آپ کے لیے اہم ہو۔ مثالیں:

  • "اگر میں یہ proposal اپنے client کو <اس کے شہر> میں ابھی بھیجوں، تو وہاں کا local time کیا ہے؟ کیا یہ email کرنے کے لیے مناسب گھنٹہ ہے؟"
  • "میری team <ایک دوسرے timezone> میں اپنا workday کتنے گھنٹوں میں ختم کرتی ہے؟ کیا مجھے اپنے وقت کے مطابق کل صبح تک انتظار کرنا چاہیے؟"
  • "اگر ابھی میرے وقت کے مطابق 3 بجے ہیں، تو <اس timezone جس میں deadline سیٹ ہے> کے مطابق deadline کب ہے؟"

5ب تب ختم جب: آپ کے ایجنٹ نے آپ کو time سرور اپنے 2 ٹولز کے ساتھ registered دکھا دیا، اور آپ کے فون سے ایک حقیقی وقت کا سوال ایک مخصوص live time پیدا کرے (کوئی عام timezone قاعدہ نہیں)، اور ڈیش بورڈ reply پر ایک get_current_time ٹول badge دکھائے۔ یہ badge اس بات کا ثبوت ہے کہ ایجنٹ نے hallucinate کرنے کے بجائے ٹول call کیا۔

آپ منظرنامہ 5 سے تب فارغ ہوتے ہیں جب: 5ا اور 5ب دونوں کی ختم شرائط پوری ہوں۔

راستے میں، آپ کا ایجنٹ activation dance کا صاف نام لیتا ہے: ہر OpenClaw extension (skills، plugins، MCP servers، channels، hooks) وہی چار قدم سے گزرتا ہے: exists → default سے disabled → enabled → configured (restart)۔ ایک بار آپ pattern دیکھ لیں، تو ہر نئی feature ٹوٹی-پہلے-ہی-کوشش کے بجائے جانی-پہچانی لگتی ہے۔

Activation dance ڈایاگرام: چار قدمی cycle (Exists، Disabled by default، Enabled، Configured) ترتیب دکھاتے تیروں کے ساتھ۔ ہر OpenClaw extension ان چار قدموں کی پیروی کرتا ہے۔ جب کوئی نئی feature پہلی کوشش پر ٹوٹی لگے، تو چاروں سے گزریں۔

منظرنامہ 6 میں آگے لے جانے والی بات

اس منظرنامے کی additions کو اپنے USER.md میں add کریں تاکہ scheduled jobs (جو آگے آ رہے ہیں) جانیں کہ یہ موجود ہیں۔ یہ اپنے ایجنٹ کو پیسٹ کریں:

Add the skill and the MCP tool we just set up to my USER.md so when scheduled jobs run they know what's available. Then commit and push the updated USER.md to my backup repo from 4e.

آپ کے AI ایمپلائی کی capabilities، صرف اس کی شناخت نہیں، اب ایک لیپ ٹاپ wipe سے بچ جاتی ہیں۔


منظرنامہ 6: اسے خود کام کروائیں (~15 منٹ)

تصور۔ اب تک آپ نے AI ایمپلائی کو میسج کیا اور اس نے جواب دیا۔ Schedules اسے پلٹ دیتے ہیں: ایجنٹ ایک گھڑی یا interval پر عمل کرتا ہے، بغیر آپ کے اسے میسج کیے۔ OpenClaw کے پاس proactivity کے تین flavors ہیں:

  • Cron ٹھیک اوقات کے لیے ("ہر صبح 7 بجے"، "ہر Monday 9 بجے"، "دن کے آخر میں")۔ یہ وہ ہے جو آپ سب سے زیادہ استعمال کریں گے۔ آپ کی حقیقی زندگی میں گھڑی کے اوقات ہیں۔
  • Heartbeat ایک مقررہ رفتار پر ماحولیاتی checks کے لیے ("ہر 30 منٹ urgent unread scan کرو"، "ہر 4 گھنٹے prep notes کے لیے calendar دیکھو")۔ اسے تب استعمال کریں جب trigger "کسی چیز کو وقتاً فوقتاً check کرو" ہو، نہ کہ "یہ ٹھیک X بجے کرو"۔
  • Hooks event triggers کے لیے (ایک webhook fire ہوتا ہے، ایک session reset ہوتی ہے)۔ یہاں دائرے سے باہر؛ اگر آپ کو چاہیے تو Ch56 دیکھیں۔

اس منظرنامے کے دو حصے ہیں۔ حصہ 6ا ایک تیز heartbeat demo ہے جو ثابت کرتا ہے کہ proactive mechanism جڑا ہوا ہے۔ حصہ 6ب وہ ہے جو رکھا جاتا ہے: ایک حقیقی schedule (اکثر ایک cron job) جو کل واقعی آپ کی خدمت کرے گا۔ 6ا کے بعد نہ رکیں؛ ایک demo جسے آپ disable کرتے ہیں وہ proactive dimension نہیں۔ ایک حقیقی schedule جو روز چلتا ہے وہ ہے۔

6ا۔ ایک demo heartbeat کو fire ہوتا دیکھیں (پھر اسے بند کر دیں)

یہ اپنے ایجنٹ کو پیسٹ کریں:

Schedule a five-minute demo heartbeat with a low-cost task: every five minutes, check the gateway log for errors and post a one-line summary. Once I see one fire in the log, disable just this demo so it doesn't burn my Gemini quota. We'll add a real schedule next.

تب ختم جب: لاگ ایک heartbeat-driven ٹول call دکھائے اور demo disabled ہو۔ لاگ دیکھتے ہوئے پانچ منٹ کی کھڑکی منصفانہ ہے۔

6ب۔ ایک ایسی چیز schedule کریں جو آپ واقعی رکھیں گے (cron یا heartbeat)

ایک demo جسے آپ disable کرتے ہیں وہ اس بارے میں کچھ ثابت نہیں کرتا کہ آپ کا AI ایمپلائی ایک ایسا ٹول ہے جسے آپ کل استعمال کریں گے۔ ایک حقیقی schedule کرتا ہے۔ پہلی بار رکھنے والوں میں سے زیادہ تر کے لیے، cron صحیح انتخاب ہے: آپ کے حقیقی workdays گھڑی کے اوقات کے گرد ترتیب دیے جاتے ہیں، check-intervals کے گرد نہیں۔

پہلا پرامپٹ: جو آپ میرے بارے میں جانتے ہیں اس پر مبنی options تجویز کرو۔

I'd like to add one real schedule that actually serves me, not a demo I'll forget about. Look at what you know about me from USER.md and suggest two or three options I might keep. For each one, tell me what it'd do, when it'd fire, and whether cron (precise time) or heartbeat (ambient interval) is the right primitive. I'll pick one.

آپ کا ایجنٹ آپ کے USER.md پر مبنی options پیش کرے گا (ایک 7 بجے کا summary، ایک Monday صبح کی priorities list، باقی commitments پر ایک دن-کے-آخر کا check، ایک interval calendar scan، وغیرہ)۔ وہ منتخب کریں جو کل سب سے زیادہ مفید لگے۔

دوسرا پرامپٹ: اسے سیٹ کرو اور backup کرو۔

Go with the [name your choice]. Set it up, confirm when it'll next fire, and commit the schedule file to my backup repo from 4e so it survives a laptop wipe.

تب ختم جب: جو schedule آپ نے چنا وہ چل رہا ہو، backup ریپو میں commit ہو، اور آپ کے ایجنٹ نے آپ کو بتا دیا ہو کہ یہ اگلی بار کب fire ہوگا۔ اسے آن رہنے دیں۔ (اگر آپ کل پچھتائیں، تو آپ کسی اور چیز کو چھوئے بغیر صرف اس ایک schedule کو disable کر سکتے ہیں۔)


منظرنامہ 7: آپ کا ماہانہ AI ایمپلائی آڈٹ (~10 منٹ/مہینہ)

تصور۔ آپ کا AI ایمپلائی وقت کے ساتھ جمع ہوتا جاتا ہے: skills جو آپ نے install کیں، credentials جو اس نے capture کیں، MCP tools جو آپ نے connect کیے، memory entries جو اس نے لکھیں، logs میں خود مختار tool calls۔ ہر اضافہ ایک چھوٹا فیصلہ ہے جو آپ نے اپروو کیا؛ زنجیر دھندلے طریقے سے بڑھتی جاتی ہے۔ دفاع install کے وقت چوکسی نہیں (آپ کبھی وہ نہیں پکڑ پائیں گے جو ابھی موجود ہی نہیں)؛ بلکہ ایک مقررہ رفتار پر دس منٹ کی نظر ثانی ہے۔ یہ منظرنامہ آپ کے پہلے نوے منٹ کا حصہ نہیں؛ یہ وہ حرکت ہے جو آپ اپنے AI ایمپلائی کی باقی زندگی کے لیے مہینے میں ایک بار کرتے ہیں۔

یہ اپنے ایجنٹ کو پیسٹ کریں (جب وقت آئے):

Run my OpenClaw monthly audit. Walk through everything that's been installed, stored, scheduled, or written since the last audit, and flag anything I didn't explicitly approve, anything that looks revealing in memory, and any approval setting that's looser than it should be. Summarize the lot as a single short report I can either approve or trim.

آپ کا ایجنٹ چلتی ہوئی inventory (skills، memory entries، approvals، MCP tools، حالیہ tool calls) plus stored credentials سے گزرتا ہے، پھر ایک واحد report لکھتا ہے جو بیان کرتی ہے کہ پچھلے آڈٹ سے کیا بدلا اور آپ کو کہاں کسنا یا تراشنا چاہیے۔

تب ختم جب: آپ نے دس منٹ report کی نظر ثانی میں گزارے اور کم از کم ایک فیصلہ کیا (ایک بھولا ہوا credential delete کریں، ایک حد سے زیادہ وسیع approval revoke کریں، ایک باسی memory entry prune کریں، ایک بے استعمال skill uninstall کریں)۔ اگلے مہینے کے لیے اپنا calendar mark کریں۔


یہ کیوں چلتا ہے

دو چیزیں تازہ رہتی ہیں؛ ایک چیز پائیدار رہتی ہے۔

تازہ #1: اس صفحے کے منظرنامے کتاب کی سائٹ پر رہتے ہیں۔ ایجنٹ ہر session موجودہ ورژن fetch کرتا ہے (آپ اسے بتاتے ہیں کہ آپ کس منظرنامے پر ہیں، اور وہ متعلقہ سیکشن پڑھتا ہے)۔

تازہ #2: OpenClaw کے موجودہ commands docs.openclaw.ai/llms.txt پر رہتے ہیں، پورے docs کا ایک LLM-دوست index۔ آپ کا ایجنٹ انہیں ہر بار تازہ پڑھتا ہے جب وہ کوئی ایسا command چلانے والا ہوتا ہے جس کے بارے میں وہ یقینی نہیں۔ OpenClaw تیزی سے آگے بڑھتا ہے؛ بریف اس طرح درست رہتا ہے چاہے انفرادی flags بدل جائیں۔

پائیدار: AGENTS.md (آپ کے دو-فائل زپ سے operational reference) یہ اٹھاتا ہے کہ OpenClaw کیا ہے، اس کے docs میں کیسے navigate کرنا ہے، safety rails (بغیر پوچھے کوئی sudo نہیں، کوئی paid models نہیں، ~/.openclaw/ کے باہر کوئی keys نہیں لکھنا)، recovery patterns، اور activation dance۔ یہ پورے platform کو کور کرتا ہے: install، debugging، channels، memory، skills، plugins، MCP، automation، multi-agent، ACP، اور sandboxing۔ یہ اس صفحے سے لمبا ہے کیونکہ یہ ہر وہ چیز کور کرتا ہے جو ایک جنرل ایجنٹ سے OpenClaw کے ساتھ کرنے کو کہا جا سکتا ہے، صرف اوپر کے چھ منظرنامے نہیں۔ فولڈر میں کوئی چیز کبھی باسی نہیں ہوتی، اس لیے آپ اسے ایک بار download کرتے ہیں اور دوبارہ استعمال کرتے ہیں۔

ذہانت فائلوں میں نہیں؛ وہ آپ کے جنرل ایجنٹ میں ہے جو انہیں پڑھتا ہے اور جو بھی آپ آگے مانگیں اس پر لگاتا ہے۔ آپ چھ الگ تھلگ demos سے نہیں گزرے؛ آپ نے ایک ٹول جمع کیا جسے آپ کل چھوئیں گے۔


اب اصل میں کیا چل رہا ہے

چھ demos نہیں: ایک system۔ منظرنامہ 6 کے بعد جو برقرار رہتا ہے اس کی inventory:

Artifactیہ اصل میں کیا ہےیہ کل کیوں اہم ہے
Background serviceOpenClaw، آپ کے OS کے ساتھ خودبخود شروع ہوتیآپ کا AI ایمپلائی ٹرمینل بند کرنے اور reboot سے بچ جاتا ہے
Channel pairingآپ کے فون اور آپ کے لیپ ٹاپ کے درمیان ایک بھروسے والا linkوہ راستہ جو آپ کا فون سروس تک پہنچنے کو استعمال کرتا ہے
Workspace فائلیں~/.openclaw/workspace/ میں سات markdown فائلیںآپ کے AI ایمپلائی کی شناخت، context، رویہ، اور memory
GitHub backupWorkspace کا private ریپو plus ایک recovery one-linerWorkspace لیپ ٹاپ کے کھونے سے بچ جاتا ہے
ایک installed اسکلClawHub سے ایک مہارت packایک حقیقی know-how extension جسے آپ کا ایجنٹ خودبخود invoke کرتا ہے
ایک بیرونی ٹولایک MCP سرور جسے ایجنٹ call کر سکتا ہےایجنٹ کے لیے دستیاب ایک حقیقی بیرونی سروس
ایک scheduled taskایک cron job یا heartbeat جو آپ کے بغیر fire ہوتاایک چیز جو schedule پر آپ کے لیے چلتی ہے

یہ تصویر ہے۔ ان میں سے کوئی demos نہیں جن سے آپ گزرے اور disable کر دیے؛ یہ سب ایک ایسے ٹول کے ٹکڑے ہیں جسے آپ کل چھوئیں گے۔

اس کے ساتھ ایک workday ایسا لگتا ہے: آپ کا فون 7 بجے اس schedule کے ساتھ buzz کرتا ہے جو آپ نے چنا (ایک cron job، اگر وہ 7 بجے کا summary وہ ہے جو رکھا گیا)؛ صبح کے درمیان آپ ایک تیز سوال سے جواب دیتے ہیں جو time MCP یا S5 والی skill کو trigger کرتا ہے؛ دوپہر کے درمیان آپ ایجنٹ سے تین emails کے replies draft کرنے کو کہتے ہیں؛ دن کے آخر آپ ایک نیا حقیقت long-term memory میں commit کرتے ہیں۔ آپ نے کبھی اپنا لیپ ٹاپ کھولا ہی نہیں۔

اگر ان artifacts میں سے کوئی بعد میں گم ہو جائے (laptop wipe، غلطی سے delete، ایک version upgrade جو خراب گیا)، تو 4e والا GitHub ریپو plus ایک نئی OpenClaw install plus recovery one-liner آپ کو ٹھیک اسی تصویر پر واپس لے آتا ہے۔

Public-facing چینل connect کرنے سے پہلے

مختصر کورس فرض کرتا ہے کہ AI ایمپلائی صرف آپ کے میسجز پڑھتا ہے۔ اگر آپ کبھی ایک public-facing چینل connect کرنے کا plan بنائیں (ایک support inbox، ایک contact form، کوئی بھی چیز جسے اجنبی لکھ سکیں)، تو یہاں رکیں اور پہلے باب 56 Lesson 14: اپنے ایجنٹ کے ٹولز کو gate کریں اور Lesson 16: NemoClaw کے ساتھ isolate کریں پڑھیں۔ Sandboxed-reader pattern prompt injection کے خلاف آپ کا بنیادی دفاع ہے (وہ خطرہ جہاں ایک email میں چھپی مخالف ہدایات آپ کے AI ایمپلائی کو آپ کی طرف سے actions لینے پر دھوکا دے سکتی ہیں)۔ Pairing یہ بند کرتی ہے کہ کون آپ کے bot کو لکھ سکتا ہے؛ sandboxing یہ بند کرتی ہے کہ آپ کا bot جو پڑھتا ہے اس کے ساتھ کیا کر سکتا ہے۔ دونوں اہم ہیں۔


آگے کہاں جائیں

منظرنامہ 6 کے بعد، آپ کے پاس ایک چلتا ہوا AI ایمپلائی ہے جس کا workspace کسٹمائز ہو گیا (آواز، شناخت، یہ آپ کے بارے میں کیا جانتا ہے، commit کی گئی memory)، workspace GitHub پر backup ہو گیا، ایک installed skill، ایک بیرونی tool، اور ایک scheduled task جو آپ کے لیے fire ہوتا ہے۔ یہ اس سطح کا زیادہ حصہ ہے جو زیادہ تر لوگوں کو چاہیے۔

اس صفحے نے جو بھی موضوع چھوا (یا جو بھی اس نے چھوڑ دیا) اس کے صبر والے walkthrough کے لیے، باب 56 کے پاس پورے platform کو کور کرتے سترہ اسباق ہیں۔ تیز نقشہ:

آپ چاہتے ہیں...جائیں
Voice replies (WhatsApp / Telegram / Discord پر audio)Ch56 L10: اسے ایک آواز دیں
Reader-agent pattern (غیر-بھروسے والی email safety، sandboxing)Ch56 L14: اپنے ایجنٹ کے ٹولز کو gate کریں
ایک دوسرا مخصوص ایجنٹ چلانا (routing، الگ شناخت)Ch56 L11: ایک دوسرا ایجنٹ add کریں
AI ایمپلائی جنرل ایجنٹس کو بلاتا ہوا (/acp spawn choreography finale، developers کے لیے)Ch56 L13: دوسرے ایجنٹس کو orchestrate کریں
Sandboxing modes اور security hardeningCh56 L14: اپنے ایجنٹ کے ٹولز کو gate کریں، L16: NemoClaw کے ساتھ isolate کریں
زیادہ channels (Slack، Matrix، Signal، iMessage، Zalo)اپنے جنرل ایجنٹ سے پوچھیں: "اپنے بریف کا استعمال کرتے ہوئے مجھے <channel> کا setup سمجھاؤ۔"

باقی ہر چیز کے لیے، آپ کا AGENTS.md پہلے ہی platform کا زیادہ حصہ کور کرتا ہے۔ اپنے جنرل ایجنٹ سے پوچھیں: "AGENTS.md sandboxing کے بارے میں کیا کہتا ہے؟" بریف reference ہے؛ صفحہ tour ہے۔

میٹا-سبق: آپ کے ان زپ کیے فولڈر میں سب سے قیمتی چیز AGENTS.md ہے۔ ایک شام لیں اسے شروع سے آخر تک پڑھنے کے لیے (install steps کے لیے نہیں، بلکہ document کی شکل کے لیے: discover-before-act table، human-path-vs-agent-path table، working pattern، gotcha catalog، activation dance)۔ پھر کسی بھی ایسے tool کے لیے ایک لکھیں جس کے سامنے آپ آگے ایک جنرل ایجنٹ رکھیں گے۔ Pattern قابل نقل ہے: ہر وہ tool جس کی ایک سیکھنے کے قابل سطح ہو اس کے پاس ایک "چھوٹی skill" ہے جو لکھنے کے قابل ہے۔ OpenClaw ابتدائی مثال تھا کیونکہ install agent-driven setup سے واقعی فائدہ اٹھاتا ہے؛ آپ دوسرے پائیں گے۔ اگلا لکھیں۔


ضمیمہ: Google Workspace connect کریں

پہلے سے framing۔ پندرہ-plus منٹ Google Cloud Platform OAuth screens، ایک حقیقی account پر جسے آپ کو پھینکنے کے قابل سمجھنا چاہیے۔ Google کے consent flows وقت-بند ہیں (کچھ links دس منٹ میں ختم ہو جاتے ہیں) اور click-بھرے۔ یہ خاص طور پر Google کو integrate کرنے کی قیمت ہے؛ اس کا OpenClaw سے کوئی تعلق نہیں، اور یہ کسی دوسرے integration کو آسان نہیں بنائے گا۔

یہ اپنے ایجنٹ کو پیسٹ کریں:

Connect Google Workspace (Gmail, Calendar, Drive) to my AI Employee. Use a throwaway Google account; walk me through the GCP and OAuth steps with explicit STOP conditions if any consent screen asks for scopes you didn't tell me to grant.

آپ کا ایجنٹ live Workspace plugin docs fetch کرتا ہے، plugin install کرتا ہے (اکثر gog یا اس جیسا نام؛ فرض کرنے سے پہلے verify کریں)، آپ کے براؤزر میں OAuth flow کھولتا ہے، env-var-backed reference کے ذریعے consent token capture کرتا ہے، اور ایک چھوٹے probe سے verify کرتا ہے (مثلاً: "میرے اگلے تین calendar events list کرو")۔

STOP شرائط۔ کوئی بھی quota یا permission error جو ایک fix attempt کے بعد بھی دہرائے۔ کوئی بھی اشارہ کہ آپ سے وہ scopes grant کرنے کو کہا جا رہا ہے جو ایجنٹ نے آپ کو grant کرنے کو نہیں کہا۔ کوئی بھی نشانی کہ GCP project خود غلط-configure ہے (یہ ضمیمہ ایک صاف throwaway account فرض کرتا ہے؛ ایک موجودہ GCP project کی auth debug کرنا crash-course دائرے سے کافی باہر ہے)۔

اشارہ۔ گہرا walkthrough Ch56 Lesson 12: Google Workspace connect کریں ہے۔


Flashcards مطالعہ معاون

علم کی جانچ

ان خیالات پر ایک مختصر gated self-check جن سے آپ ابھی گزرے۔

Checking access...