جنرل ایجنٹس

یہ وہ ٹولز ہیں جو صرف بات نہیں کرتے: کام کرتے ہیں۔ ان میں سے ایک کو چلانا سیکھیں؛ کتاب میں آگے کی ہر چیز اسی پر بنتی ہے۔

Foundations نے آپ کو سکھایا کہ AI کیا ہے اور اسے استعمال کرتے ہوئے اپنی judgment کیسے قائم رکھنی ہے۔ یہ حصہ وہ جگہ ہے جہاں آپ وہ ٹول اٹھاتے ہیں جسے آپ باقی کتاب میں استعمال کریں گے: ایک جنرل ایجنٹ، یعنی ایسا AI جو صرف جواب نہیں دیتا، بلکہ عمل کرتا ہے۔ یہ آپ کی files کھولتا ہے، انہیں پڑھتا ہے، code لکھتا اور run کرتا ہے، اور task مکمل کرنے کے لیے دوسری apps بھی استعمال کرتا ہے۔

اس حصے میں آنے کے دو دروازے ہیں، اور کون سا دروازہ لینا ہے یہ صرف اس پر منحصر ہے کہ آپ کون ہیں:

Claude Code اور OpenCode: اُن لوگوں کے لیے جو code کے ساتھ کام کرتے ہیں۔
Cowork اور OpenWork: باقی سب کے لیے، وہی طاقت ایک desktop app میں، جو professional اور knowledge work کے لیے بنی ہے۔

خیال وہی ہے، audience مختلف ہے: ایسا AI جسے آپ حقیقی کام کروانے کے لیے direct کرتے ہیں، نہ کہ ایسا AI جس سے آپ صرف chat کرتے ہیں۔

یہ پوری کتاب کا مرکزی جوڑ ہے۔ اس کے بعد آنے والی تقریباً ہر چیز یہ فرض کرتی ہے کہ آپ جنرل ایجنٹ چلا سکتے ہیں۔ Mode 1 (مسئلہ ایک بار حل کرنا) اور Mode 2 (پائیدار worker بنانا)، دونوں اصل میں "آپ اور ایک جنرل ایجنٹ" ہیں۔ Optional Personal Agent Harnesses bridge بھی اپنا harness انہی tools میں سے کسی ایک کے ذریعے install اور run کرتا ہے۔ اس لیے یہ وہ skill ہے جسے آپ سب سے زیادہ reuse کریں گے۔ بعد میں، یہی جنرل ایجنٹ جسے آپ یہاں چلاتے ہیں، وہی tool بن جاتا ہے جس سے آپ workers بناتے ہیں۔ ٹول وہی، کام بڑا۔

یہ حصہ تین مرحلوں میں

چار کورسز آپ کو ایک ہی لائن پر آگے لے جاتے ہیں: tool کو ہر second پکڑ کر چلانے سے، اسے ٹھیک ٹھیک direct کرنے تک، اور پھر ایسا loop design کرنے تک جو اسے آپ کے لیے چلاتا ہے۔

مرحلہ 1: چلانا

جنرل ایجنٹ کو اچھی طرح operate کرنا سیکھیں۔ جو course آپ سے match کرتا ہے وہ کریں؛ دوسرا بعد میں اٹھا سکتے ہیں۔

Agentic Coding: Claude Code اور OpenCode: اُن لوگوں کے لیے جو code کے ساتھ کام کرتے ہیں۔ Plan mode، context management، rules file، skills، subagents، اور connectors (MCP): coding agent کو کیسے چلائیں تاکہ وہ آپ کی files پڑھے، plan propose کرے، edits کرے، اور آپ کو result check کرنے دے۔
Professionals کے لیے Cowork اور OpenWork: باقی سب کے لیے۔ اسی قسم کا agent، desktop app میں، جو professional work کے لیے بنی ہے (documents، spreadsheets، slides، research)، تاکہ اسے کام پر لگانے کے لیے آپ کو terminal نہ چھونا پڑے۔

مرحلہ 2: direct کرنا

چلانے سے result ملتا ہے؛ direct کرنے سے ہر بار درست result ملتا ہے۔

Spec-Driven Development: agent کو vague instructions دینا بند کریں اور اسے لکھی ہوئی spec دیں: exactly کیا کرنا ہے، کس چیز پر کرنا ہے، اور "done" کا مطلب کیا ہے۔ صاف spec وہ فرق ہے جو guessing agent اور target hit کرنے والے agent کے درمیان ہوتا ہے، اور Mode 2 میں cross کرتے وقت یہی پہلی چیز آپ ساتھ لے جاتے ہیں۔

مرحلہ 3: loop delegate کرنا

اس حصے کا آخری step autonomy کا پہلا taste ہے، ابھی بھی انہی tools کے اندر جنہیں آپ پہلے سے جانتے ہیں۔

Loop Engineering: tool کو ہاتھ میں پکڑے رکھنے سے ایسے system design کرنے تک کی چھلانگ جو agent کو آپ کے لیے prompt کرتا ہے۔ آپ ایک چھوٹا loop بناتے ہیں جو wake up کرتا ہے، دیکھتا ہے کیا بدلا، طے کرتا ہے کیا کرنے کے قابل ہے، ہر job agent کو دیتا ہے، result check کرتا ہے، اور صرف اُن decisions کے لیے آپ کو بلاتا ہے جنہیں واقعی انسان کی ضرورت ہے۔ Valuable skill آپ کے لکھے prompt سے ہٹ کر آپ کے design کیے ہوئے loop میں آ جاتی ہے۔ یہی آگے کی ہر چیز کا natural doorway ہے۔

پہلے آپ کو کیا چاہیے

پہلے Foundations والا حصہ کریں، خاص طور پر AI کے دور میں سوچنے کا طریقہ (اپنی judgment قائم رکھنا) اور Skills اور Connectors (وہ plugins جن سے general agent آپ کے tools اور data تک پہنچتا ہے)۔ آپ کو programmer ہونا ضروری نہیں: اگر آپ نہیں ہیں تو Cowork اور OpenWork والا دروازہ لیں اور آپ ٹھیک رہیں گے۔

یہ کہاں لے جاتا ہے

جب آپ جنرل ایجنٹ کو drive، direct، اور loop کر سکتے ہیں، تو باقی کتاب کھل جاتی ہے۔ Optional Personal Agent Harnesses والا حصہ بس آگے ہے، اگر آپ ایسا worker own کرنا چاہتے ہیں جو آپ کی اپنی infrastructure پر چلتا ہے۔ پھر وہ fork آتا ہے جس پر پوری کتاب گھومتی ہے: مسئلہ حل کرنا — Mode 1، جہاں آپ ایک مسئلہ ایک بار حل کرنے کے لیے general agent استعمال کرتے ہیں، اور مینوفیکچرنگ — Mode 2، جہاں آپ permanent worker بناتے ہیں جو اسے ہمیشہ solve کرتا ہے۔

کتاب کا arc ایک سطر میں: Foundations سے سمجھنا، جنرل ایجنٹس سے چلانا، اور دونوں modes سے AI کو کام میں لگانا۔

جو دروازہ آپ سے match کرتا ہے، اس سے شروع کریں: اگر آپ code کے ساتھ کام کرتے ہیں تو Claude Code اور OpenCode، اگر نہیں کرتے تو Cowork اور OpenWork۔

یہ حصہ تین مرحلوں میں​

مرحلہ 1: چلانا​

مرحلہ 2: direct کرنا​

مرحلہ 3: loop delegate کرنا​

پہلے آپ کو کیا چاہیے​

یہ کہاں لے جاتا ہے​