Skip to main content

ابتدائی قارئین کے لیے اے آئی اصطلاحات

اس کتاب کو پڑھنے کے لیے آپ کو کمپیوٹر سائنس کی ڈگری کی ضرورت نہیں۔ لیکن آپ کو اس میدان کی زبان سمجھنی ہوگی۔ یہ اصطلاحات ہر اہم تصور کو آسان اردو، حقیقی مثالوں، اور روزمرہ تشبیہات کے ساتھ سمجھاتی ہیں۔

اس صفحے کو کیسے استعمال کریں: پہلے پہلی 30 اہم اصطلاحات پڑھیں، کیونکہ یہ کتاب کے لگ بھگ ہر حصے میں آئیں گی۔ اس کے بعد مکمل glossary کو حوالہ کے طور پر استعمال کریں۔ اصطلاحات موضوع کے لحاظ سے گروپ کی گئی ہیں، اور کتاب کی مخصوص زبان پہلے دی گئی ہے۔ کسی بھی اصطلاح کو تلاش کرنے کے لیے Ctrl+F، یا Mac پر Cmd+F استعمال کریں۔


اے آئی کا منظرنامہ ایک نظر میں

ہر اصطلاح میں جانے سے پہلے، یہ دیکھ لیں کہ بڑے تصورات آپس میں کیسے جڑے ہوئے ہیں:

اے آئی، ایم ایل، ڈی ایل، اور ایل ایل ایمز: ہر تصور پچھلے تصور کا ذیلی حصہ ہے

ایل ایل ایم جواب کیسے بناتا ہے: آپ کے پرامپٹ سے تکمیل تک

ایجنٹ فیکٹری پائپ لائن: انسانی نیت سے کام کرنے والے ڈیجیٹل ایف ٹی ای تک


پہلی 30 اہم اصطلاحات جو پہلے جاننا ضروری ہیں

یہ اصطلاحات لگ بھگ ہر صفحے پر آئیں گی۔ باب 1 شروع کرنے سے پہلے انہیں پڑھ لیں۔

نوٹ: خریدار کے طور پر ایجنٹس سے متعلق اصطلاحات، جیسے ACP، AP2، x402، MPP، اختیار کی حدود، اور دستخط شدہ مینڈیٹ، سیکشن 11 میں آئیں گی؛ انہیں پہلی 30 میں شامل نہیں کیا گیا۔


‏1. اے آئی (مصنوعی ذہانت): کمپیوٹر سے ایسے کام کروانا جن کے لیے عموماً انسانی ذہانت چاہیے ہوتی ہے۔

🔹 جب آپ کے فون کا کی بورڈ اگلا لفظ اندازہ لگاتا ہے، تو یہ اے آئی ہے۔

‏2. LLM (لارج لینگویج ماڈل): ایک بہت بڑا AI نظام جو اربوں صفحات کے متن پر تربیت ہوتا ہے، اور انسانی زبان اور کوڈ کو سمجھ بھی سکتا ہے اور تیار بھی کر سکتا ہے۔ Claude، GPT، اور جیمنی LLMs ہیں۔

💡 LLM کو ایسے تحقیقی معاون کی طرح سمجھیں جس نے دنیا کی سب سے بڑی لائبریری کی کتابیں پڑھ رکھی ہوں۔ آپ سوال پوچھتے ہیں، وہ اپنی پڑھی ہوئی معلومات کی بنیاد پر جواب دیتا ہے۔

‏3. ایجنٹ (اے آئی ایجنٹ): ایسا AI جو صرف سوال کا جواب نہیں دیتا؛ وہ منصوبہ بناتا ہے، عمل کرتا ہے، اور اپنے طور پر کام مکمل کرتا ہے۔

🔹 چیٹ بوٹ صرف بتاتا ہے کہ دبئی کی سب سے سستی پرواز کون سی ہے۔ ایجنٹ ایئرلائنز تلاش کرتا ہے، قیمتیں موازنہ کرتا ہے، اور آپ کے لیے ٹکٹ بک کر دیتا ہے۔

‏4. ایجنٹک اے آئی: اے آئی کا وہ زمرہ جس میں ایسے ایجنٹس بنائے جاتے ہیں جو منصوبہ بنا سکیں، استدلال کر سکیں، اور خودمختار طور پر عمل کر سکیں۔ 2026 میں یہی اے آئی کا فرنٹیئر ہے، اور یہی اس پوری کتاب کی توجہ ہے۔

🔹 عام AI میں آپ سوال پوچھتے ہیں اور جواب ملتا ہے۔ ایجنٹک AI میں آپ ہدف دیتے ہیں، مثلا "کسٹمر churn کو 15% کم کرو"، پھر وہ تحقیق، منصوبہ بندی، عمل درآمد، اور رپورٹنگ کرتا ہے، اور راستے میں فیصلے بھی لیتا ہے۔

‏5. Digital FTE (Digital کل وقتی ملازم کے مساوی): ایک "AI ملازم" جو کل وقتی انسانی ورکر جیسا مسلسل کام کرتا ہے، 24/7، مگر لاگت کے ایک چھوٹے حصے پر۔ تھیسس میں اسے AI ورکر بھی کہا گیا ہے: کردار وہی ہے، اندازِ بیان مختلف ہے۔

🔹 کسٹمر سپورٹ کا Digital FTE ہر روز 500 گفتگوئیں سنبھال سکتا ہے، یعنی 5 سے 10 انسانی ایجنٹس جتنا کام۔

‏6. ایجنٹ فیکٹری: اس کتاب کا مرکزی تصور۔ یہ واضح specifications پر مبنی، انسانی نگرانی والا، کلاڈ کوڈ سے چلنے والا عمل ہے جس کے ذریعے اے آئی ورکرز ڈیزائن، تیار، اور ڈیپلائے ہوتے ہیں۔ یہ خریدنے والی پروڈکٹ نہیں؛ یہ اپنانے والا عملی طریقہ ہے۔ ایجنٹ فیکٹری، اے آئی-نیٹو کمپنی بناتی ہے، اور اے آئی-نیٹو کمپنی Digital FTEs کو اپنی افرادی قوت میں شامل کرتی ہے۔

💡 اسمبلی لائن کی طرح: ہر اسٹیشن ایک مخصوص کام کرتا ہے، حصے ترتیب سے آگے بڑھتے ہیں، اور آخر میں تفصیل کے مطابق تیار شدہ پروڈکٹ نکلتا ہے۔ ایجنٹ فیکٹری، AI ملازمین بنانے کے عمل کو صنعتی بناتی ہے۔

‏7. پرامپٹ: وہ ہدایت یا سوال جو آپ AI ماڈل کو دیتے ہیں۔

🔹 "اس رپورٹ کو تین مختصر نکات میں خلاصہ کریں" ایک پرامپٹ ہے۔ بہتر پرامپٹس، بہتر جوابات دیتے ہیں۔

‏8. سیاق و سباق ونڈو: AI کی کام کرنے والی یادداشت: وہ ایک وقت میں کتنا متن پڑھ اور سمجھ سکتا ہے۔

💡 چھوٹی سیاق و سباق ونڈو ایک چھوٹی میز جیسی ہے جہاں صرف چند صفحات پھیل سکتے ہیں۔ Claude کی بڑی سیاق و سباق ونڈو ایک بڑی کانفرنس میز جیسی ہے جہاں آپ پورا ناول ایک ساتھ رکھ سکتے ہیں۔

‏9. ٹوکن: متن کی بنیادی اکائی جسے LLM پڑھتا ہے۔ یہ لگ بھگ لفظ کے تین چوتھائی حصے کے برابر ہوتا ہے۔ "مجھے بریانی پسند ہے" لگ بھگ 4 ٹوکنز ہے۔

🔹 اے آئی APIs استعمال کرتے وقت ادائیگی ٹوکنز کے حساب سے ہوتی ہے۔ متن کا ایک مکمل صفحہ لگ بھگ 500-700 ٹوکنز ہوتا ہے۔

‏10. غلط اختراع: جب AI پورے اعتماد کے ساتھ کوئی ایسی بات بنا دے جو درست نہ ہو۔

🔹 آپ سپریم کورٹ مقدمے کے بارے میں پوچھتے ہیں، اور AI جعلی حوالہ نمبرز کے ساتھ جعلی فیصلہ بنا کر حقیقت کی طرح پیش کر دیتا ہے۔ بات درست لگتی ہے، مگر گھڑی ہوئی ہوتی ہے۔

‏11. تفصیل (Specification): ایک تفصیلی نقشہ جو بتاتا ہے کہ کیا بنانا ہے: اہداف، inputs، نتائج، اور حدود۔

💡 گھر کے architectural blueprint کی طرح۔ Builder اندازے سے شروع نہیں کرتا؛ وہ منصوبے پر عمل کرتا ہے۔ اے آئی ڈیولپمنٹ میں specification وہی منصوبہ ہے۔

‏12. Specification-Driven Development (SDD): پہلے نقشہ لکھنا، پھر اے آئی کو اسی نقشے سے کوڈ، ٹیسٹس، اور دستاویزات تیار کرنے دینا۔

🔹 آپ لکھتے ہیں: "کتابوں کی دکان کے لیے API بنائیں جس میں کتابوں کی فہرست دکھانے، کتاب شامل کرنے، تلاش کرنے، اور حذف کرنے کے اینڈ پوائنٹس ہوں۔" کلاڈ کوڈ پوری ایپلی کیشن تیار کر دیتا ہے۔

‏13. کلاڈ کوڈ: انتھروپک کا AI coding ایجنٹ۔ آپ ٹرمینل میں اس سے بات کرتے ہیں؛ یہ آپ کا کوڈ بیس پڑھتا ہے، پروجیکٹ سمجھتا ہے، اور کوڈ لکھتا ہے۔

🔹 آپ لکھتے ہیں: "میری ایپ میں صارف کی تصدیق شامل کریں۔" کلاڈ کوڈ موجودہ کوڈ پڑھتا ہے، تصدیقی ماڈیول بناتا ہے، ٹیسٹس لکھتا ہے، اور سب جوڑ دیتا ہے۔

‏14. کوورک: انتھروپک کا ڈیسک ٹاپ ایجنٹ جو غیر کوڈنگ علمی کام کے لیے ہے: دستاویزات، تحقیق، اور فائل مینجمنٹ۔

🔹 "میرے Downloads فولڈر کو پروجیکٹ کے حساب سے منظم کریں اور اس مہینے کی PDFs خلاصہ کریں۔" کوورک یہ کام کرتا ہے جبکہ آپ کسی اور کام پر توجہ رکھتے ہیں۔

‏15. MCP (ماڈل سیاق و سباق پروٹوکول): عالمگیر معیار جو اے آئی ایجنٹ کو بیرونی ٹولز سے جوڑنے دیتا ہے: ڈیٹابیسز، ای میل، کیلنڈرز، فائل سسٹمز۔ MCP ایجنٹس کے ٹول کالنگ کا پروٹوکول ہے۔ ایجنٹس جو ٹولز کے لیے ادائیگی کرتے ہیں، اس الگ پروٹوکول خاندان کے لیے سیکشن 11 دیکھیں: ACP، AP2، x402، اور MPP۔

💡 USB سے پہلے ہر فون کا چارجر الگ ہوتا تھا۔ MCP، AI کے لیے USB معیار کی طرح ہے: ایک پروٹوکول جس سے کوئی بھی ایجنٹ کسی بھی ٹول سے جڑ سکتا ہے۔

‏16. API (ایپلی کیشن پروگرامنگ انٹرفیس): اصول جن سے مختلف سافٹ ویئر پروگرامز ایک دوسرے سے بات کرتے ہیں۔ ایجنٹس بیرونی دنیا سے APIs کے ذریعے رابطہ کرتے ہیں۔

💡 ریستوران کا مینو ایک API جیسا ہے۔ آپ مینو دیکھتے ہیں، order دیتے ہیں، اور کچن جواب میں کھانا فراہم کرتا ہے۔

‏17. SDK (سافٹ ویئر ڈیولپمنٹ کٹ): کسی مخصوص پلیٹ فارم پر ایپلی کیشنز بنانے کے لیے پہلے سے تیار ٹول کٹ۔

💡 SDK ایک LEGO سیٹ جیسا ہے: تیار شدہ حصے اور ہدایات، تاکہ آپ ہر حصہ شروع سے بنانے کے بجائے تیزی سے بنا سکیں۔

‏18. Python: AI میں سب سے مقبول پروگرامنگ زبان۔ قابلِ مطالعہ، ہمہ گیر، اور اس کتاب کی پرائمری زبان۔

🔹 Python تقریبا انگریزی جیسی قابلِ مطالعہ لگتی ہے: if age > 18: print("Adult")۔ اسی قابلِ مطالعہ ہونے کی وجہ سے AI دنیا نے Python کو بہت اپنایا۔

‏19. Git: ایسا نظام جو کوڈ کی ہر تبدیلی ریکارڈ کرتا ہے: کس نے کیا بدلا، کب بدلا، اور کیوں بدلا۔ آپ ہمیشہ پچھلے ورژن پر واپس جا سکتے ہیں۔

💡 Microsoft Word کا Track Changes، مگر پورے سافٹ ویئر پروجیکٹس کے لیے۔ ہر ترمیم بحال کیا جا سکتا ہے۔

‏20. Docker: ٹول جو ایپ کو قابلِ منتقلی ڈبہ یعنی کنٹینر میں پیکج کرتا ہے، تاکہ وہ ہر جگہ ایک جیسی چلے: لیپ ٹاپ، ساتھی کی مشین، یا کلاؤڈ سرور۔

💡 شپنگ کنٹینر کی طرح۔ وہ کراچی میں ٹرک پر ہو یا سمندر میں جہاز پر، اندر کا سامان ایک جیسا اور خود مکمل رہتا ہے۔

‏21. سیاق و سباق انجینئرنگ: ایجنٹ کو ملنے والے پورے معلوماتی ماحول کو ڈیزائن کرنا۔ یہی سکل ایک کارآمد ایجنٹ کو ایسے ایجنٹ سے الگ کرتی ہے جسے کوئی استعمال نہیں کرنا چاہتا۔

💡 ٹویوٹا فیکٹری میں معیار کنٹرولز ہر گاڑی کو تفصیل کے مطابق رکھتے ہیں۔ سیاق و سباق انجینئرنگ آپ کے اے آئی ایجنٹس کے لیے معیار کنٹرول ہے: یکساں اور قابل اعتماد نتیجہ کو یقینی بنانا۔

‏22. ٹول استعمال: ایجنٹ کی صلاحیت کہ وہ صرف یادداشت سے جواب دینے کے بجائے بیرونی ٹولز استعمال کرے، جیسے ویب تلاش، ڈیٹابیس کوئریز، یا ای میلز بھیجنا۔

🔹 آپ پوچھتے ہیں: "Karachi میں موسم کیسا ہے؟" ٹول استعمال والا ایجنٹ موسم سروس چیک کر کے لائیو ڈیٹا دیتا ہے۔ ٹول استعمال کے بغیر وہ صرف اندازہ لگائے گا۔

‏23. حفاظتی حدود: حفاظتی حدود جو ایجنٹ کو ایسے کام سے روکتے ہیں جو اسے نہیں کرنا چاہیے۔

🔹 مالی ایجنٹ کا حفاظتی حد ہو سکتا ہے: روپے 5,000,000 سے اوپر کوئی ٹرانزیکشن انسانی منظوری کے بغیر نہیں۔ یہ موٹروے رکاوٹوں کی طرح ہیں جو گاڑیوں کو سڑک سے باہر جانے سے روکتے ہیں۔

‏24. RAG (بازیافت سے تقویت یافتہ تخلیق): AI کو بیرونی دستاویزات تک رسائی دینا تاکہ وہ حقائق سے جواب دے، صرف یادداشت سے نہیں جو غلط بھی ہو سکتی ہے۔

💡 بند کتاب امتحان کے بجائے کھلی کتاب امتحان۔ AI جواب دینے سے پہلے آپ کے دستاویزات میں حقائق دیکھتا ہے، اس لیے accuracy بہتر ہو جاتی ہے۔

‏25. 10-80-10 اصول: اے آئی افرادی قوت کا عملی ردھم: انسان سمت طے کرتا ہے (10%) → اے آئی عمل کرتا ہے (80%) → انسان تصدیق کرتا ہے (10%)۔

🔹 آپ پروجیکٹ بریف لکھتے ہیں (10%)، کلاڈ کوڈ پوری ایپلی کیشن بناتا ہے (80%)، پھر آپ جائزہ، ٹیسٹ، اور منظور کرتے ہیں (10%)۔

‏26. AGENTS.md / CLAUDE.md: کنفیگریشن فائلز جو اے آئی ایجنٹ کو پروجیکٹ کے اصول بتاتی ہیں: کوڈنگ معیار، ترجیحات، اور ڈھانچے سے متعلق فیصلے۔

💡 نئے ملازم کو دی گئی رہنمائی دستاویز کی طرح: "ہم اس طرح کام کرتے ہیں۔ یہ ہمارا انداز ہے۔ یہ کام ہم کبھی نہیں کرتے۔" یہ ہر تعامل میں لوڈ ہوتی ہے۔

‏27. ہم آہنگی: کئی ایجنٹس کو ایک کام پر مل کر کام کرانے کے لیے ہم آہنگ کرنا۔

💡 کرکٹ کپتان فیلڈرز کو پوزیشن دیتا ہے، بولنگ روٹیشنز طے کرتا ہے، اور حکمت عملی ایڈجسٹ کرتا ہے۔ وہ سب کچھ خود نہیں کرتا؛ ماہرین کو مشترک ہدف کی طرف ہم آہنگ کرتا ہے۔

‏28. بے حالت: AI گفتگوؤں کے درمیان سب کچھ بھول جاتا ہے۔ ہر نئی چیٹ بالکل صفر سے شروع ہوتی ہے۔

💡 بھولنے کی بیماری والے دکاندار کی طرح: آپ ہر بار جائیں تو وہ آپ کو اجنبی سمجھتا ہے، چاہے آپ 5 منٹ پہلے آئے ہوں۔ چیٹ ایپس یادداشت کا وہم ہر بار پوری گفتگو دوبارہ بھیج کر بناتی ہیں۔

‏29. ڈیپلائمنٹ: ایپلی کیشن کو لائیو کر کے انٹرنیٹ پر حقیقی صارفین کے لیے دستیاب بنانا۔

🔹 آپ کی app لیپ ٹاپ پر چلتی ہے۔ ڈیپلائمنٹ اسے کلاؤڈ سرور پر رکھتا ہے تاکہ 10,000 لوگ اسے ایک ساتھ استعمال کر سکیں۔

‏30. CI/CD (مسلسل انضمام / مسلسل فراہمی): ڈویلپر کے تبدیلی کرتے ہی کوڈ کو خودکار طور پر test اور ڈیپلائے کرنا۔

🔹 ڈویلپر 2 PM پر کوڈ پش کرتا ہے۔ ٹیسٹس 3 منٹ میں خودکار طور پر چلتے ہیں۔ سب پاس ہو جاتے ہیں۔ 2:10 PM تک نیا ورژن لائیو ہوتا ہے: صفر دستی مراحل۔


ڈھانچہ: رن ٹائم اسٹیک

یہ اصطلاحات AI-Native کمپنی کے اجزا کے نام ہیں جو ایجنٹ فیکٹری بناتی ہے۔ یہ ڈھانچہ ابواب اور تھیسس میں بار بار آئیں گی۔ انہیں یہاں ایک بار پڑھ لیں؛ ہر بنانے میں دوبارہ کام آئیں گی۔

💡 اجزا کیسے جڑتے ہیں: ایجنٹ فیکٹری (عمل) AI-Native کمپنی (نتیجہ) بناتی ہے۔ اس کمپنی میں انسان کنارے کی تہہ سے سمت طے کرتے ہیں، اور Digital FTEs AI افرادی قوت کی تہہ میں عمل کرتے ہیں۔ پیپرکلپ افرادی قوت منظم کرتا ہے۔ ہر Digital FTE اپنی پسند کے رن ٹائم انجن پر چلتا ہے۔ ٹرگرز بیرونی دنیا سے نظام کو جگاتے ہیں۔


اے آئی ورکر

اے آئی-نیٹو کمپنی کی افرادی قوت۔ یہ کردار پر مبنی ایجنٹس ہوتے ہیں جنہیں بھرتی کیا جاتا ہے، کام تفویض کیا جاتا ہے، روسٹر پر رکھا جاتا ہے، اور ریٹائر کیا جاتا ہے۔ یہ Digital FTE اور ڈیجیٹل ورکر ہی کا وہی تصور ہے: تھیسس میں اے آئی ورکر تکنیکی اصطلاح ہے، جبکہ کتاب میں Digital FTE کاروباری قارئین کے لیے اصطلاح ہے۔

📌 افرادی قوت vs. عملہ: صرف AI ورکرز افرادی قوت ہیں۔ ڈیلیگیٹ (اوپن کلاو) اور منیجر (پیپرکلپ) مستقل عملہ ہیں، افرادی قوت نہیں۔ رن ٹائم انجنز عملہ نہیں؛ یہ وہ سکلز ہیں جن پر افرادی قوت چلتی ہے۔ تھیسس جب «ایجنٹ» کہتی ہے تو مراد نظام میں کوئی بھی ایجنٹ ہو سکتا ہے؛ جب «AI ورکر» کہتی ہے تو خاص طور پر افرادی قوت مراد ہوتی ہے۔

🔹 مثال: ریزیومے اسکریننگ AI ورکر روزانہ 200 ریزیومے پڑھتا ہے، انہیں کام تفصیل کے خلاف اسکور کرتا ہے، اور سرفہرست 10 ریزیومے انسانی ریکروٹر کو دے دیتا ہے۔ یہ AI-Native کمپنی کی HR افرادی قوت کے اندر ایک Digital FTE ہے، جسے پیپرکلپ نے بھرتی کیا، روسٹر پر رکھا، اور ضرورت پڑنے پر ریٹائر کیا جا سکتا ہے۔


اے آئی-نیٹو کمپنی

ایجنٹ فیکٹری کا نتیجہ۔ یہ چلتا ہوا ادارہ ہے: ایسا ادارہ جس میں اے آئی ورکرز یعنی Digital FTEs کام کرتے ہیں، مینجمنٹ پلین انہیں ہم آہنگ کرتا ہے، اور انسان کنارے پر سمت دیتے ہیں۔ اے آئی-نیٹو کمپنی وہ چیز ہے جسے آخر میں آپ چلاتے ہیں۔ کتاب اسے ایجنٹک ادارہ بھی کہتی ہے۔

💡 تشبیہ: ایجنٹ فیکٹری ایک عمل ہے، جیسے skyscraper بنانے کا طریقہ۔ AI-Native کمپنی وہ skyscraper ہے جو اس طریقہ سے بنتا ہے، یعنی وہ چیز جسے آپ واقعی چلاتے ہیں۔

📌 تین بنیادی اصطلاحات: ایجنٹ فیکٹری (عمل) → AI-Native کمپنی (نتیجہ) → AI ورکرز (نتیجہ کے اندر افرادی قوت)۔ تین اصطلاحات، تین مختلف کردار۔ یہ قابلِ تبادلہ نہیں ہیں۔


دو تہہ ماڈل

یہ ڈھانچے کا نمونہ ایجنٹ فیکٹری تھیسس کو مکمل کرتا ہے: انسان کنارے کی تہہ سے نیت طے کرتے ہیں، اے آئی ورکرز اے آئی افرادی قوت کی تہہ میں عمل کرتے ہیں، اور تفصیلات دونوں کے درمیان معاہداتی زبان بنتی ہیں۔

🔹 مثال: CEO اپنے اوپن کلاو ڈیلیگیٹ یعنی کنارے کی تہہ سے کہتا ہے: "ہفتہ وار کسٹمر چرن رپورٹ چلائیں۔" ڈیلیگیٹ کام کو AI افرادی قوت کی تہہ کے Digital FTE تک پہنچاتا ہے۔ Digital FTE ڈیٹا نکالتا ہے، رپورٹ بناتا ہے، اور تصدیق کے لیے اسے ڈیلیگیٹ کے ذریعے CEO کو واپس دیتا ہے۔


پرنسپل

رن ٹائم اسٹیک کے سب سے اوپر موجود انسان: وہ شخص جو نیت طے کرتا ہے، بجٹ متعین کرتا ہے، اختیار کی حدود کھینچتا ہے، اور نتیجہ قبول کرتا ہے۔ یہ تھیسس کا غیر متبدل اصول 1 ہے۔ عمل کی ہر جائز زنجیر پرنسپل سے شروع ہوتی ہے؛ جو نظام پرنسپل کے بغیر عمل کرے، وہ خودمختار نہیں بلکہ بے مالک ہوتا ہے۔

🔹 مثال: CFO ایک تفصیل لکھتا ہے: "ادائیگی کی شرائط بدلے بغیر، $30K بجٹ کے اندر اکاؤنٹس رسیویبل ایجنگ کو 20% کم کریں۔" اس تفصیل میں نیت، بجٹ، اور حدود آ جاتے ہیں۔ ڈیلیگیٹ (اوپن کلاو) اسے پڑھتا ہے، افرادی قوت تک کام آگے پہنچاتا ہے، اور پرنسپل آخر میں نتیجہ کی تصدیق کرتا ہے۔

📌 اس کی جگہ کیا آ سکتا ہے: کچھ نہیں۔ باقی تہوں کے حوالہ جاتی نفاذ بدل سکتے ہیں؛ پرنسپل تہہ ناقابلِ منتقلی ہے۔


کنارے کی تہہ

اے آئی-نیٹو کمپنی کی وہ تہہ جو فرد انسان کی خدمت کرتی ہے۔ ہر انسان کے پاس کنارے پر ایک ذاتی شناختی ایجنٹ ہوتا ہے، جیسے اوپن کلاو، جو اس کا سیاق و سباق جانتا ہے، اس کی طرف سے بولتا ہے، اور آگے کا کام ڈیلیگیٹ کرتا ہے۔

💡 تشبیہ: کنارے کی تہہ چیف آف اسٹاف floor ہے۔ ہر ایگزیکٹو کے لیے ایک ایجنٹ، جو پوری کمپنی میں اس کی نمائندگی کرتا ہے۔


اے آئی افرادی قوت کی تہہ

اے آئی-نیٹو کمپنی کی وہ تہہ جو ادارے کی خدمت کرتی ہے۔ یہیں اے آئی ورکرز یعنی Digital FTEs رہتے اور عمل کرتے ہیں: پیپرکلپ کے زیر انتظام، رن ٹائم انجنز پر چلتے ہوئے، اور تفصیلات کے ذریعے ہم آہنگ ہوتے ہوئے۔

💡 تشبیہ: اے آئی افرادی قوت کی تہہ پروڈکشن فلور ہے۔ بہت سے Digital FTEs، ہر ایک مخصوص کام کرتا ہے، اور سب مینجمنٹ پلین کے ذریعے ہم آہنگ ہوتے ہیں۔


‏Delegate

کنارے کی تہہ کا ذاتی ایجنٹ جو پرنسپل کا سیاق و سباق رکھتا ہے، اس کی فیصلوں کی نمائندگی کرتا ہے، اس کے اختیار کی حدود carry کرتا ہے، اور اس کی طرف سے آگے کا کام پہنچاتا ہے۔ یہ تھیسس کا غیر متبدل اصول 2 ہے۔ ڈیلیگیٹ کے بغیر انسان رکاوٹ واپس آ جاتا ہے اور scale ٹائپنگ کی رفتار تک گر جاتا ہے۔ اوپن کلاو حوالہ جاتی نفاذ ہے؛ کوئی بھی MCP-speaking ذاتی ایجنٹ جو identity، سیاق و سباق، اور اختیار رکھتا ہو اہل ہوتا ہے۔

💡 تشبیہ: CEO کا چیف آف اسٹاف۔ ہر ایگزیکٹو کے لیے ایک، جو priorities جانتا ہے، اس کی طرف سے بات کرتا ہے، اور کام کو right ماہرین تک route کرتا ہے۔

یہ بھی دیکھیں: حوالہ جاتی نفاذ کے لیے نیچے اوپن کلاو (بطور ڈیلیگیٹ)، اور انسانی خودمختاری کے فریم ورک کے لیے سیکشن 1 میں Identic AI دیکھیں۔


اوپن کلاو (as Delegate)

اوپن کلاو، ڈیلیگیٹ کی حوالہ جاتی نفاذ ہے جو کنارے کی تہہ پر چلتی ہے: چیف آف اسٹاف ایجنٹ جو انسان کی نمائندگی کرتا ہے، اس کا سیاق و سباق جانتا ہے، اور اس کی طرف سے بولتا ہے۔ AI-Native کمپنی میں ہر انسان کو ڈیلیگیٹ چاہیے؛ اوپن کلاو اس ڈیلیگیٹ کو بنانے کا طریقہ ہے۔

🔹 مثال: جب آپ اوپن کلاو سے کہتے ہیں، "میرا week خلاصہ کریں اور پیر کے لیے تین priorities draft کریں"، تو یہ calendar، ای میل، اور Slack سے مجاز ڈیٹا لیتا ہے، آپ کی voice میں جواب synthesize کرتا ہے، اور عمل لینے سے پہلے منظوری کا انتظار کرتا ہے۔ یہ آپ ہیں، مشینی رفتار پر۔

یہ بھی دیکھیں: فریم ورک کے لیے اصطلاحات میں پہلے دیا گیا اوپن کلاو اندراج دیکھیں۔


‏Manager (مینجمنٹ پلین)

وہ orchestrator جو AI ورکرز کے ڈھیر کو افرادی قوت میں بدلتا ہے: کام تفویض کرتا ہے، بجٹس enforce کرتا ہے، risky moves approve کرتا ہے، عمل درآمد audit کرتا ہے، ledger رکھتا ہے، اور بھرتی کو callable API کے طور پر expose کرتا ہے۔ یہ تھیسس کا غیر متبدل اصول 3 ہے۔ اس کے بغیر ایجنٹس collide کرتے ہیں، بجٹس leak ہوتے ہیں، اور کوئی نہیں بتا سکتا کہ افرادی قوت نے کیا لاگت کیا یا produce کیا۔ پیپرکلپ حوالہ جاتی نفاذ ہے؛ جو orchestrator management contract پورا کرے، اہل ہوتا ہے۔

💡 تشبیہ: اگر ڈیلیگیٹ چیف آف اسٹاف ہے، تو منیجر چیف آپریٹنگ آفیسر ہے۔ انسان کے ساتھ ایک-سے-ایک؛ افرادی قوت کے ساتھ ایک-سے-کئی۔

یہ بھی دیکھیں: حوالہ جاتی نفاذ کے لیے نیچے پیپرکلپ دیکھیں۔


پیپرکلپ

‏AI-Native کمپنی کا مینجمنٹ پلین۔ پیپرکلپ COO ہے: یہ Digital FTEs بھرتی کرتا ہے، انہیں کام تفویض کرتا ہے، بجٹس enforce کرتا ہے، risky moves approve کرتا ہے، اور ledger رکھتا ہے۔ یہ بھرتی کو API کے طور پر expose کرتا ہے جسے کوئی بھی مجاز ایجنٹ call کر سکتا ہے؛ اسی سے افرادی قوت demand پر grow کرتی ہے۔

💡 تشبیہ: اگر اوپن کلاو چیف آف اسٹاف ہے، تو پیپرکلپ چیف آپریٹنگ آفیسر ہے۔ انسان کے ساتھ ایک-سے-ایک؛ افرادی قوت کے ساتھ ایک-سے-کئی۔

🔹 مثال: کسٹمر Bahasa Indonesia میں لکھتا ہے۔ روسٹر پر کوئی Digital FTE یہ زبان نہیں بولتا۔ پیپرکلپ صلاحیت کی کمی detect کرتا ہے اور اختیار کی حدود کے اندر اپنی بھرتی API call کر کے نیا Bahasa-speaking Digital FTE تیار کرتا ہے۔ نیا ورکر message پڑھتا ہے اور reply دیتا ہے۔ کوئی انسان نہیں جگایا گیا۔


‏Meta-تہہ (Hiring as a Callable Capability)

وہ تہہ جو بھرتی کو API کے طور پر دستیاب کرتی ہے تاکہ کوئی بھی مجاز ایجنٹ رن ٹائم پر پرنسپل کے اختیار کی حدود کے اندر، انسان کو جگائے بغیر، نیا AI ورکر فراہم کر سکے۔ یہ منجمد روسٹر کا مسئلہ حل کرتی ہے: جب صلاحیت کی کمی آئے، افرادی قوت پالیسی کے تحت ضرورت کے وقت عملہ بڑھا ہو جاتی ہے۔ کلاڈ مینیجڈ ایجنٹس حوالہ جاتی نفاذ ہے؛ کوئی بھی مینیجڈ ایجنٹ API جو ایجنٹ تیار کر کے environment فراہم کر سکے، اہل ہوتا ہے۔

🔹 مثال: پیپرکلپ کے نیچے Bahasa Indonesia والی trace میں meta-تہہ fire ہوتی ہے۔ پیپرکلپ gap detect کرتا ہے؛ meta-تہہ کی بھرتی API نیا ورکر تیار کرتی ہے؛ ورکر منیجر کے ساتھ رجسٹر ہوتا ہے اور روسٹر پر رہتا ہے۔

📌 دوہرا کردار: کلاڈ مینیجڈ ایجنٹس انجن option بھی ہے اور meta-تہہ بھی۔ جو رن ٹائم-provisioning صلاحیت ورکر کو چلاتی ہے، وہی نئے ورکرز بھی بناتی ہے؛ اسی لیے meta-تہہ batch-provisioned نہیں بلکہ callable ہے۔


رن ٹائم انجن

وہ عمل درآمد بنیادی تہہ جس پر Digital FTE چلتا ہے۔ ہر Digital FTE اپنی کام کی ضرورت کے مطابق انجن چنتا ہے، پوری کمپنی کے لیے ایک انجن نہیں ہوتا۔ اختیارات میں Dapr ایجنٹس، کلاڈ مینیجڈ ایجنٹس، OpenAI Agents SDK، اور اوپن کلاو-نیٹو شامل ہیں۔ اندرونی طور پر ہر انجن کے دو پلینز ہوتے ہیں: ہارنس یعنی کنٹرول پلین، اور کمپیوٹ پلین یعنی سینڈ باکس/رن ٹائم۔

💡 تشبیہ: رن ٹائم انجن وہ skillset ہے جو ملازم کام پر لاتا ہے۔ heart-surgery ٹیم کی nurse کو clinic nurse سے مختلف سکلز چاہیے ہوتے ہیں۔ کردار وہی، انجن مختلف۔


‏Harness (ایجنٹ Harness)

ایجنٹ انجن کا کنٹرول پلین: ماڈل کے ارد گرد وہ سب کچھ جو اسے کام کرنے والا نظام بناتا ہے۔ اس میں ایجنٹ loop، ٹول dispatch، approvals، tracing، سیاق و سباق management، recovery، ہدایات، سکلز، اور validators شامل ہیں۔ practitioner shorthand ہے: ایجنٹ = ماڈل + Harness۔ ماڈل وہ brain ہے جو آپ فرنٹیئر لیب سے rent کرتے ہیں؛ ہارنس body، workplace، اور معیار operating procedure ہے۔ کمپیوٹ پلین یعنی سینڈ باکس ہارنس کے اندر نہیں، اس کے ساتھ بیٹھتا ہے۔ credentials ہارنس میں رہتے ہیں، اور ماڈل-تیار شدہ کوڈ سینڈ باکس میں چلتا ہے۔

💡 تشبیہ: اگر ماڈل CPU ہے اور سیاق و سباق ونڈو RAM ہے، تو ہارنس آپریٹنگ نظام ہے: یہ بوٹ کرتا ہے، drivers یعنی ٹولز روٹ کرتا ہے، سیاق و سباق ترتیب دیتا ہے، اور ایجنٹ lifecycle منظم کرتا ہے۔ آپ کا ایجنٹ کوڈ اس کے اوپر چلنے والی ایپلی کیشن ہے۔

🔹 مثالیں: Claude ایجنٹ SDK ایک ہارنس ہے جسے آپ جوڑتے ہیں۔ اوپن کلاو ایسا ہارنس ہے جسے آپ سکلز سے وسیع کرتے ہیں۔ کلاڈ کوڈ، کرسر، اور کوڈیکس coding کام کے لیے خاص طور پر تیار harnesses ہیں۔ کلاڈ مینیجڈ ایجنٹس ایسا ہارنس ہے جسے انتھروپک مستحکم انٹرفیسز کے پیچھے آپ کے لیے چلاتا ہے۔

📌 پس منظر: یہ لفظ «ٹیسٹ ہارنس» سے آیا، پھر «ایویلیوایشن ہارنس» تک گیا، اور اب «ایجنٹ ہارنس» کے طور پر استعمال ہوتا ہے۔ تینوں صورتوں میں ہارنس اس چیز کے ارد گرد ایک ڈھانچہ ہے جو اصل کام کرتی ہے۔


کمپیوٹ پلین / Sandbox رن ٹائم

ہارنس کے ساتھ بیٹھا ہوا عمل درآمد پلین: secure سینڈ باکس جہاں ماڈل-تیار شدہ کوڈ actual میں چلتا ہے، فائلز پڑھتا ہے، commands عمل کرتا ہے، اور آرٹی فیکٹس لکھتا ہے۔ یہ نیچے کلاؤڈ بنیادی ڈھانچہ سے بھی الگ ہے اور ساتھ موجود ہارنس سے بھی۔ سیکیورٹی اور قابلِ منتقلی کے لیے یہ split load-bearing ہے: credentials ہارنس میں رہتے ہیں، ماڈل-directed کوڈ سینڈ باکس میں چلتا ہے، اور سینڈ باکس وینڈر بدل سکتا ہے بغیر ایجنٹ دوبارہ لکھے۔

🔹 مثال: OpenAI Agents SDK ہارنس ہے؛ کمپیوٹ پلین آپ الگ چنتے ہیں۔ کلاڈ مینیجڈ ایجنٹس ایک API کے پیچھے دونوں کو یکجا کرتا ہے۔ Dapr ایجنٹس Kubernetes کو کمپیوٹ پلین فرض کرتا ہے۔

📌 تین چیزیں جنہیں کہا جاتا ہے "رن ٹائم": زبان رن ٹائم، جیسے Node.js یا Python interpreter، خالص بنیادی ڈھانچہ ہے۔ عمل درآمد رن ٹائم / سینڈ باکس یہی entry ہے۔ ایجنٹ رن ٹائم کبھی کبھی ہارنس کے ہم معنی کے طور پر بھی آتا ہے۔ وینڈر دستاویزات پڑھتے وقت اس آمیزش پر نظر رکھیں۔


‏Trigger

وہ طریقہ جس سے بیرونی دنیا AI-Native کمپنی کو motion میں لاتی ہے: شیڈول due ہوتا ہے، ویب ہک آتا ہے، API call land کرتی ہے، کسٹمر آ جاتا ہے۔ کلاڈ کوڈ Routines حوالہ جاتی نفاذ ہے: یہ ہر بیرونی واقعہ کو سیشن میں بدلتا ہے جو ڈیلیگیٹ کو wake کرتا ہے اور chain fire کرتا ہے۔ ٹرگرز کے بغیر نظام صرف اس وقت حرکت کرتا ہے جب انسان پرامپٹ ٹائپ کرے، جو کمپنی نہیں بلکہ چند اضافی مراحل والا اسسٹنٹ ہے۔

🔹 مثال: ہر پیر صبح 9 بجے شیڈول شدہ ٹرگر اوپن کلاو کو wake کرتا ہے، جو پیپرکلپ سے ہفتہ وار کسٹمر ہیلتھ رپورٹ چلانے کو کہتا ہے۔ Digital FTE ڈیٹا نکالتا ہے، رپورٹ تیار کرتا ہے، اور ایگزیکٹو ٹیم کو ای میل کرتا ہے۔ انسان نے ٹرگر ایک بار کنفیگر کیا؛ اس کے بعد نظام خود چلتا ہے۔


خلاصہ

یاد رکھنے کے لیے ایک جملے کی درجہ بندی:

ایجنٹ فیکٹری (عمل) AI-Native کمپنی (نتیجہ) بناتی ہے۔ AI-Native کمپنی AI ورکرز (افرادی قوت) کو ملازمت دیتی ہے، جو دو تہہ ماڈل میں کام کرتے ہیں: کنارے کی تہہ پر انسان، اوپن کلاو ڈیلیگیٹ کے ذریعے؛ AI افرادی قوت کی تہہ میں Digital FTEs، پیپرکلپ کے زیر انتظام؛ ہر ایک اپنی پسند کے رن ٹائم انجن پر چلتا ہے؛ اور بیرونی دنیا کے ٹرگرز انہیں جگاتے ہیں۔

اس جملے کو اصطلاحات کا مرکزی خلاصہ سمجھیں۔


اب آپ مطالعہ شروع کرنے کے لیے کافی جان چکے ہیں۔ نیچے مکمل اصطلاحات ہر اصطلاح کی گہرائی میں جاتی ہے اور 250+ مزید اصطلاحات احاطہ کرتی ہے۔


‏1. ایجنٹ فیکٹری: کتاب کی مخصوص اصطلاحات

یہ اس کتاب کے مخصوص تصورات اور زبان ہیں۔ باب 1 کے بعد آپ ان سے بار بار ملیں گے، اس لیے انہیں پہلے رکھا گیا ہے۔

ایجنٹ فیکٹری

یہ ایک عمل ہے: واضح تفصیلات پر مبنی، انسانی نگرانی والا، کلاڈ کوڈ-powered طریقہ جس سے AI ورکرز ڈیزائن، تیار، اور ڈیپلائے کیے جاتے ہیں۔ خام مواد انسانی نیت ہے؛ تیار شدہ پروڈکٹ تصدیق شدہ نتیجہ ہے۔ ایجنٹ فیکٹری، AI-Native کمپنی بناتی ہے، اور AI-Native کمپنی AI ورکرز یعنی Digital FTEs کو اپنی افرادی قوت میں شامل کرتی ہے۔

📌 عمل، پروڈکٹ نہیں: ایجنٹ فیکٹری کوئی پروڈکٹ نہیں جسے آپ خرید یا install کرتے ہیں۔ یہ عملی طریقہ ہے جسے آپ operate کرنا سیکھتے ہیں۔ کتاب عملی طریقہ سکھاتی ہے؛ AI-Native کمپنی وہ چیز ہے جسے آپ آخر میں چلاتے ہیں۔

💡 تشبیہ: کار فیکٹری خام فولاد لے کر تیار شدہ گاڑیوں بناتی ہے۔ ایجنٹ فیکٹری آپ کا کاروبار نیت، مثلا "مجھے 24/7 کسٹمر سپورٹ ایجنٹ چاہیے"، لے کر ایک complete کام کرنے والا Digital FTE بناتی ہے۔

صنعتی اسٹیک

تھیسس کا تین-تہہ framing کہ قدر ایجنٹ فیکٹری سے کیسے گزرتی ہے: نیت یعنی اہداف، حدود، بجٹس، اور اجازتیں کا اعلیٰ سطحی نقشہ → پروڈکشن انجن یعنی ڈھانچہ جو نیت کو نتائج میں بدلتی ہے → Outcome یعنی high-fidelity اعمال اور آرٹی فیکٹس جو تصدیق ہوتے ہیں اور رائے کے حلقے سے بہتر بنتے ہیں۔

🔹 مثال: CFO کی directive، "AR aging کو $30K بجٹ کے اندر 20% کم کریں"، نیت ہے۔ اوپن کلاو → پیپرکلپ → انجنز پر چلنے والے AI ورکرز کی chain پروڈکشن انجن ہے۔ days-sales-outstanding میں verified، لیجر میں اپ ڈیٹ شدہ کمی نتیجہ ہے۔

پروڈکشن انجن

یہ صنعتی اسٹیک کے اندر نیت کو نتیجہ میں بدلنے والا طریقہ کار ہے۔ یہ ڈاؤن لوڈ کی جانے والی ایپ نہیں بلکہ ڈھانچہ ہے: واضح تفصیلات پر مبنی ہدایات، کردار پر مبنی AI ورکرز، پیکج شدہ سکلز، ٹولز سے جوڑنے کے لیے MCP، اور رائے کے حلقے جو وقت کے ساتھ معیار کا فرق بند کرتے ہیں۔ تھیسس اسے اس پوری تھیسس کا سب سے اہم خیال کہتی ہے۔

💡 تشبیہ: کار فیکٹری کی اسمبلی لائن۔ خام فولاد ایک طرف سے داخل ہوتا ہے، تیار شدہ car دوسری طرف نکلتی ہے۔ ہر اسٹیشن ایک مخصوص کام کرتا ہے، حصے ترتیب سے چلتے ہیں، اور delivery سے پہلے نتیجہ تصدیق ہوتا ہے۔ پروڈکشن انجن بھی اسی طرح کام کرتا ہے: نیت in، تصدیق شدہ نتیجہ out، اور AI ورکرز مخصوص stations کی طرح۔

چھ غیر متبدل اصول

وہ structural اصول جو AI-Native کمپنی کو runnable بناتے ہیں: (1) Principal: انسان پرنسپل ہے؛ (2) Delegate: ہر انسان کو ڈیلیگیٹ چاہیے؛ (3) Manager: افرادی قوت کو منیجر چاہیے؛ (4) انجن: ہر ورکر اپنا انجن چنتا ہے؛ (5) Meta: افرادی قوت پالیسی کے تحت expand ہو سکتی ہے؛ (6) Trigger: بیرونی دنیا نظام کو call کرتی ہے۔ named پروڈکٹس بدل سکتے ہیں؛ ڈھانچہ قائم رہتی ہے۔

📌 ہر غیر متبدل اصول کے مکمل دعویٰ، غیر موجودگی کی ناکامی صورت، اور موجودہ نفاذ کے لیے thesis دیکھیں۔

غیر متبدل اصول vs. حوالہ جاتی نفاذ

تھیسس کا framing distinction۔ غیر متبدل اصول وہ structural requirement ہے جو نظام کے ہر ورژن میں درست رہتی ہے، چاہے اسے کون سی مخصوص پروڈکٹ realize کرے۔ Reference نفاذ وہ concrete پروڈکٹ ہے جو 2026 میں کسی غیر متبدل اصول کو realize کرنے کے لیے استعمال ہو رہی ہے۔ invariants تھیسس ہیں؛ named پروڈکٹس اس year کا best fit ہیں۔

💡 تشبیہ: "house میں enter اور exit کرنے کا way ہونا چاہیے" غیر متبدل اصول ہے۔ "brass handles والے mahogany double doors" حوالہ جاتی نفاذ ہے۔ doors اگلے سال بدل جائیں تو house پھر بھی کام کرتا ہے؛ entry/exit غیر متبدل اصول ختم کر دیں تو house ہی نہیں رہتا۔

🔹 مثال: غیر متبدل اصول 4 کہتا ہے: "ہر AI ورکر اپنا انجن چنتا ہے۔" 2026 کی حوالہ جاتی نفاذات Dapr ایجنٹس، کلاڈ مینیجڈ ایجنٹس، OpenAI Agents SDK، اور اوپن کلاو-نیٹو ہیں۔ اگلے سال ان میں سے کوئی بدل جائے، غیر متبدل اصول پھر بھی برقرار رہتا ہے۔

‏Digital FTE (Digital کل وقتی ملازم کے مساوی)

ایک AI ملازم جو کل وقتی انسانی ورکر جیسا continuous کام کرتا ہے، 24/7، لاگت کے ایک چھوٹے حصے پر۔ Digital FTE ہفتے میں 168 hours کام کر سکتا ہے، fatigue کے بغیر۔ یہ تھیسس کے AI ورکر ہی کا وہی کردار ہے: بھرتی ہوتا ہے، تفویض ہوتا ہے، روسٹر پر آتا ہے، اور ریٹائر ہو سکتا ہے۔ یہ ڈیلیگیٹ (اوپن کلاو) اور منیجر (پیپرکلپ) سے الگ ہے، جو مستقل عملہ ہیں، افرادی قوت نہیں۔

🔹 مثال: کسٹمر سپورٹ کا Digital FTE ہر روز 500 گفتگوئیں سنبھالتا ہے، یعنی 5 سے 10 انسانی ایجنٹس جتنا کام۔

ڈیجیٹل ورکر / AI Employee

‏Digital FTE کے ہم معنی اصطلاحات۔ ایسا اے آئی ایجنٹ جو ادارہ کے اندر پائیدار، کردار پر مبنی کام کرتا ہے؛ one-off چیٹ بوٹ نہیں بلکہ permanent ٹیم member۔

تفصیل / Specification

کسی چیز کو بنانے کی تفصیلی تحریری وضاحت: اہداف، حدود، ان پٹس، متوقع نتائج، اور رویہ۔ یہ وہ نقشہ ہے جسے AI پیروی کرتا ہے۔

💡 تشبیہ: تفصیل معمار کے نقشہ کی طرح ہے۔ معمار اندازے سے تعمیر شروع نہیں کرتا؛ وہ تفصیلی منصوبہ پیروی کرتا ہے۔ AI ڈیولپمنٹ میں تفصیل منصوبہ ہے، اور AI معمار ہے۔

تفصیل-Driven ڈیولپمنٹ (SDD)

ڈیولپمنٹ طریقہ کار جس میں پہلے تفصیلی تفصیل لکھی جاتی ہے، پھر AI اسی تفصیل سے کوڈ، ٹیسٹس، اور دستاویزات تیار کرتا ہے۔ تفصیل حقیقت کا مستند ماخذ ہے، کوڈ نہیں۔

📌 چار مراحل: ریسرچ → تفصیل → بہتری → نفاذ۔

🔹 مثال: آپ کتابوں کی دکان کے لیے REST API چاہتے ہیں۔ کوڈ لکھنے کے بجائے تفصیل لکھتے ہیں: "API میں books list کرنے، کتاب شامل کرنے، مصنف سے تلاش کرنے، اور ISBN سے delete کرنے کے اینڈ پوائنٹس ہوں۔ ہر کتاب کا عنوان، مصنف، ISBN، قیمت، اور اسٹاک گنتی ہو۔ ان پٹس تصدیق ہوں۔ JSON واپس ملے۔" کلاڈ کوڈ اس تفصیل سے FastAPI ایپلی کیشن، ٹیسٹس، اور دستاویزات تیار کر دیتا ہے۔

💡 تشبیہ: تفصیل معمار کے نقشہ کی طرح ہے۔ تعمیر کمپنی اندازہ لگا کر house نہیں بناتی؛ وہ تفصیلی plans پیروی کرتی ہے۔ SDD میں تفصیل منصوبہ ہے، اور AI تعمیر crew ہے۔

ٹیسٹ پر مبنی تخلیق (TDG)

‏Python میں SDD کی مخصوص شکل۔ آپ پہلے ٹیسٹ لکھتے ہیں، یعنی یہ واضح کرتے ہیں کہ کوڈ کو کیا کرنا چاہیے، پھر کلاڈ کوڈ کو وہ کوڈ بنانے دیتے ہیں جو ان ٹیسٹوں کو پاس کر دے۔

💡 تشبیہ: کیک بنانے سے پہلے، آپ یہ لکھیں کہ ایک perfect cake کیسا لگتا ہے: اونچائی، ساخت، ذائقہ۔ پھر آپ ایک نسخہ آزمائیں۔ اگر کیک آپ کے معیار کے مطابق نہیں ہے، تو آپ دوبارہ کوشش کریں۔ criteria ٹیسٹس ہیں؛ recipe تیار شدہ کوڈ ہے۔

‏10-80-10 Rule

‏AI افرادی قوت کا عملی ردھم: انسان پہلے 10% دیتا ہے، یعنی نیت اور direction؛ AI middle 80% عمل کرتا ہے؛ انسان final 10% میں تصدیق اور فیصلہ دیتا ہے۔

📌 Origin: Steve Jobs نے Apple میں یہی نمونہ پیروی کیا: vision طے کرو (10%)، ٹیم کو بنانے دو (80%)، پھر polish اور جاری کرنے واپس آو (10%)۔ اب "ٹیم" کی جگہ "AI ملازمین" رکھ دیں۔

10-80-10 اصول: نیت، عمل درآمد، تصدیق

‏AGENTS.md / CLAUDE.md

کنفیگریشن فائلز جو AI coding ایجنٹ کو persistent سیاق و سباق دیتی ہیں۔ ان میں پروجیکٹ اصول، کوڈنگ معیار، ڈھانچے سے متعلق فیصلے، اور ترجیحات ہوتی ہیں، جو ہر تعامل میں لوڈ ہوتی ہیں۔

💡 تشبیہ: جب نیا ملازم ٹیم join کرتا ہے تو آپ اسے رہنمائی دستاویز دیتے ہیں: "ہم اس طرح کام کرتے ہیں۔ یہ ہمارا coding انداز ہے۔ یہ کام ہم کبھی نہیں کرتے۔" AGENTS.md آپ کے اے آئی ایجنٹ کے لیے یہی رہنمائی دستاویز ہے۔

‏SPEC.md

پروجیکٹ کی تفصیلی specification رکھنے والی مخصوص فائل۔ سافٹ ویئر کو کیا کرنا چاہیے، اس کے لیے واحد مستند ماخذ۔

🔹 مثال: آپ کا SPEC.md کہہ سکتا ہے: "ریستوران کے لیے ایک WhatsApp چیٹ بوٹ بنائیں۔ اسے مینو دکھانا، آرڈر لینا، ڈیلیوری ایڈریس کی تصدیق، GST کے ساتھ کل حساب لگانا، اور آرڈر کی تصدیق بھیجنا چاہیے۔ زیادہ سے زیادہ جوابی وقت: 2 سیکنڈز۔ زبان: اردو اور انگریزی۔"

‏SKILL.md

وہ فائل جو اے آئی ایجنٹ کے لیے reusable صلاحیت یعنی سکل package کرتی ہے: ہدایات، best practices، اور کسی مخصوص کام کے templates، مثلا PDFs بنانا یا Docker containers ڈیپلائے کرنا۔

🔹 مثال: Docker SKILL.md میں ہو سکتا ہے: "FastAPI ایپ کو containerize کرتے وقت ہمیشہ کثیر مرحلہ build استعمال کریں۔ base image: python:3.12-slim۔ ہیلتھ چیک اینڈ پوائنٹ ضرور شامل کریں۔ root کے طور پر کبھی نہ چلائیں۔" ایجنٹ یہ سکل فائل پڑھ کر Docker کام میں خودکار طور پر یہی practices پیروی کرتا ہے۔

‏Skill Library

‏SKILL.md فائلوں کا ایک مجموعہ جس سے ایک اے آئی ایجنٹ حاصل کر سکتا ہے، اسے کئی ڈومینز میں سکل فراہم کرتا ہے، جیسے کہ ایک حوالہ لائبریری ایک ملازم سے مشورہ کر سکتا ہے۔

ایجنٹ Skills

ایک اے آئی ایجنٹ کے پاس جو مخصوص صلاحیتیں ہوتی ہیں، ان کی وضاحت اس کے ٹولز، علم اور SKILL.md فائلوں سے ہوتی ہے۔

🔹 مثال: ایک انسانی ملازم کے پاس "Excel کی سکل" یا "معاہدے کی بات چیت" جیسی سکلز ہوتی ہیں۔ ایک اے آئی ایجنٹ کے پاس "PDF جنریشن،" "ڈیٹا بیس کوئری" یا "ای میل ڈرافٹنگ" جیسی سکلز ہوتی ہیں۔

ایجنٹ Triangle

اس کتاب میں ایک فریم ورک ان تین اجزاء کو بیان کرتا ہے جن کی ہر موثر ایجنٹ کی ضرورت ہوتی ہے: (1) ایک واضح کردار، (2) مخصوص آلات، اور (3) اچھی طرح سے بیان کردہ حکمتیں۔ کسی ایک کی کمی محسوس ہوتی ہے، اور ایجنٹ کم کارکردگی کا مظاہرہ کرتا ہے۔

‏Body + Brain

ایک ایجنٹ آرکیٹیکچر کا نمونہ۔ دماغ وہ LLM ہے جو استدلال کرتا اور فیصلے لیتا ہے۔ باڈی عمل درآمد کی تہہ ہے (ٹولز، APIs، بنیادی ڈھانچہ) جو ان فیصلوں کو پورا کرتی ہے۔

💡 تشبیہ: آپ کا دماغ فیصلہ کرتا ہے کہ "میں وہ گلاس اٹھانا چاہتا ہوں۔" آپ کا ہاتھ (جسم) عمل کو انجام دیتا ہے۔ ایک اے آئی ایجنٹ میں، Claude (دماغ) فیصلہ کرتا ہے کہ "مجھے ڈیٹا بیس سے کوئری کرنے کی ضرورت ہے،" اور NanoClaw (باڈی) کوئری کو انجام دیتا ہے۔

Body + Brain ڈھانچہ: اے آئی ایجنٹ کیسے بنتا ہے

‏NanoClaw

ایک ہلکا پھلکا کنٹینر رن ٹائم جو اوپن کلاو آرکیٹیکچر میں ایجنٹ کے "باڈی" کے طور پر کام کرتا ہے، کاموں کو انجام دیتا ہے، ٹولز چلاتا ہے، اور ایجنٹ کے ماحول کا انتظام کرتا ہے۔

💡 تشبیہ: اگر LLM (دماغ) وہ پائلٹ ہے جو یہ طے کرتا ہے کہ کہاں اڑنا ہے، نینو کلاؤ (باڈی) وہ ہوائی جہاز ہے جو درحقیقت پرواز کرتا ہے: انجن، پنکھ، کنٹرول اور سب کچھ۔

اوپن کلاو

ایجنٹ سے چلنے والی ایپلی کیشنز بنانے کے لیے اوپن سورس ایپلی کیشن فریم ورک۔ تھیسس آرکیٹیکچر میں اوپن کلاو کنارے کی تہہ پر ڈیلیگیٹ ہے: یعنی "چیف آف اسٹاف" ایجنٹ جو انسان کی نمائندگی کرتا ہے، اس کا سیاق و سباق جانتا ہے، اور اس کی طرف سے بات کرتا ہے۔ NanoClaw اس کی کنٹینر پر مبنی عمل درآمد کی تہہ ہے۔

‏TutorClaw

‏24/7 کام کرنے والا AI ٹیوٹر جو WhatsApp کے ذریعے دستیاب ہے اور ایجنٹ فیکٹری آرکیٹیکچر پر بنا ہے۔ TutorClaw اس کتاب کو اپنے سسٹم آف ریکارڈ کے طور پر پڑھتا ہے، یعنی احتمالی تخلیق کے بجائے تصدیق شدہ علم سے پڑھاتا ہے۔ یہ کتاب کی پہلی Digital FTE ہے، اور اس بات کی زندہ مثال ہے کہ ایجنٹ فیکٹری AI ورکرز کیسے بناتی ہے۔

کلاڈ کوڈ

انتھروپک کا AI کوڈنگ ایجنٹ، ٹرمینل (کمانڈ لائن) سے چلتا ہے۔ یہ آپ کے پورے کوڈ بیس کو پڑھتا ہے، آپ کے پروجیکٹ کے سیاق و سباق کو سمجھتا ہے، اور آپ کی وضاحتوں کی بنیاد پر کوڈ تیار کرتا ہے۔ اس کتاب میں بنیادی ترقی کا آلہ۔

کوورک

انتھروپک کا ڈیسک ٹاپ ایجنٹ نان کوڈنگ علمی کاموں کے لیے: دستاویز کا انتظام، تحقیق، اور فائل آرگنائزیشن۔ اسے اپنے AI آفس اسسٹنٹ کے طور پر سوچیں۔

‏Dispatch

ایک خصوصیت جو آپ کو اپنے فون سے کوورک کو کام تفویض کرنے دیتی ہے۔ آپ سفر کے دوران ایک کام بھیجتے ہیں؛ Claude آپ کے ڈیسک ٹاپ پر کام کرتا ہے۔ جب یہ ختم ہوجاتا ہے، تو آپ کو پش نوٹیفکیشن ملتا ہے۔

💡 تشبیہ: ڈسپیچ کوورک کو ایسے ٹول سے بدل دیتا ہے جس کے پاس آپ بیٹھتے ہیں، اور اسے ایسا ملازم بنا دیتا ہے جسے آپ دور سے چلاتے ہیں، بالکل ایسے جیسے میٹنگ کے دوران آپ اپنے اسسٹنٹ کو ٹیکسٹ کریں "رپورٹ تیار کریں"۔

‏Computer Use

ایک تحقیقی پیش نظارہ خصوصیت جہاں Claude آپ کے کمپیوٹر کا استعمال کرتے ہوئے دور دراز کے ملازم کی طرح macOS پر آپ کی اسکرین کو دیکھ اور کنٹرول کر سکتا ہے (بٹن پر کلک کرنا، ایپلی کیشنز میں ٹائپ کرنا، انٹرفیس کو نیویگیٹ کرنا)۔

🔹 مثال: آپ Claude سے کہتے ہیں: "میرے ڈیسک ٹاپ پر اسپریڈشیٹ کھولیں، ان نمبروں کے ساتھ Q3 ریونیو کالم کو اپ ڈیٹ کریں، پھر اسے فنانس ٹیم کو ای میل کریں۔" Claude آپ کی اسکرین دیکھتا ہے، ایکسل کھولتا ہے، ڈیٹا میں ٹائپ کرتا ہے، آپ کے ای میل کلائنٹ کو کھولتا ہے، اور بھیجتا ہے، بالکل اسی طرح جیسے کوئی انسانی معاون آپ کے کمپیوٹر پر بیٹھا ہے۔

‏Claude Desktop

‏Claude کے ساتھ بات چیت کے لیے ڈیسک ٹاپ ایپلی کیشن، جو کوورک، کمپیوٹر کے استعمال، اور ڈسپیچ کی خصوصیات کی میزبانی کرتی ہے۔

‏Hooks

خودکار کارروائیاں جو کلاڈ کوڈ سے پہلے یا بعد میں متحرک ہوتی ہیں وہ کچھ خاص کارروائیاں کرتی ہیں، جیسے ہر فائل کو محفوظ کرنے کے بعد خودکار کوڈ فارمیٹنگ، یا ہر کمٹ سے پہلے ٹیسٹ چلانا۔

💡 تشبیہ: ہکس اسسٹنٹ کے لیے کھڑی ہدایات کی طرح ہیں: "جب بھی آپ خط لکھنا ختم کرتے ہیں، تو مجھے دکھانے سے پہلے اسپیل چیک کریں۔"

‏Subagents

ماہر ایجنٹس جو کلاڈ کوڈ ایک بڑے پروجیکٹ کے اندر مخصوص ذیلی کاموں کو سنبھالنے کے لیے پیدا کر سکتے ہیں، ہر ایک اپنے اپنے مرکوز سیاق و سباق کے ساتھ۔

💡 تشبیہ: ایک پروجیکٹ مینیجر (مین ایجنٹ) ڈیزائن کا کام گرافک ڈیزائنر (سبیجینٹ) کو اور اکاؤنٹنگ ایک بک کیپر (سبیجینٹ) کو سونپتا ہے۔ ہر ایک اپنی خاصیت پر توجہ مرکوز کرتا ہے۔

‏Tasks نظام

کلاڈ کوڈ کی ایک بلٹ ان خصوصیت جو تمام سیشنز میں مستقل حالت کا انتظام کرتی ہے، یہ ٹریک کرتی ہے کہ کیا کیا گیا ہے، کیا زیر التواء ہے، اور ایک کثیر مرحلہ پروجیکٹ میں آگے کیا ہے۔

سیاق و سباق انجینئرنگ

‏Digital FTE مینوفیکچرنگ کے لیے کوالٹی کنٹرول ڈسپلن۔ مستقل، اعلی معیار کی پیداوار کو یقینی بنانے کے لیے ایجنٹ کو موصول ہونے والے مکمل معلوماتی ماحول کو ڈیزائن کرنا۔ یہ #1 سکل ہے جو $2,000/مہینے فروخت کے قابل ایجنٹ کو اس سے الگ کرتی ہے جسے کوئی نہیں چاہتا۔

💡 تشبیہ: ٹویوٹا فیکٹری میں منظم کوالٹی کنٹرولز ہوتے ہیں اس بات کو یقینی بناتے ہوئے کہ ہر کار تصریحات پر پورا اترتی ہے۔ سیاق و سباق انجینئرنگ اس بات کو یقینی بناتی ہے کہ آپ کی Digital FTEs مستقل اور قابلِ فروخت قدر فراہم کریں۔

سیاق و سباق Injection

متعلقہ بیرونی معلومات کو AI کی سیاق و سباق کی ونڈو میں داخل کرنا اس سے پہلے کہ وہ جواب پیدا کرے، اسے صحیح وقت پر صحیح معلومات فراہم کرے۔

💡 تشبیہ: وکیل کے عدالت میں جانے سے پہلے، ان کا معاون انہیں تمام متعلقہ کیس فائلوں کے ساتھ ایک فولڈر دیتا ہے۔ سیاق و سباق کا انجیکشن AI کے لئے بھی ایسا ہی کرتا ہے۔

سیاق و سباق Isolation

ایک طویل پچھلے سیشن سے ممکنہ طور پر الجھن یا متضاد حالت کو لے جانے کے بجائے صاف سیاق و سباق کے ساتھ ایک تازہ سیشن شروع کرنا۔

💡 تشبیہ: جب آپ کی میز اتنی بے ترتیبی ہو جاتی ہے تو آپ سوچ بھی نہیں سکتے، آپ سب کچھ صاف کر کے نئے سرے سے شروع کر دیتے ہیں۔ سیاق و سباق Isolation AI کے لیے ایک جیسی ہے۔ کبھی کبھی ایک صاف سلیٹ گندی تاریخ سے بہتر نتائج پیدا کرتی ہے۔

‏Harness انجینئرنگ

ایک اے آئی ایجنٹ کے ارد گرد ماحول کو ڈیزائن کرنے اور اسے مسلسل بہتر بنانے کا نظم و ضبط تاکہ یہ بغیر نگرانی کے قابل اعتماد طریقے سے مفید کام کر سکے۔ ایک ترقی میں تیسری پرت کے طور پر بیٹھتا ہے: فوری انجینئرنگ ایک تبادلے کو بہتر بناتی ہے، سیاق و سباق کی انجینئرنگ اس کا انتظام کرتی ہے جو ماڈل ایک ساتھ دیکھتا ہے، اور ہارنس انجینئرنگ عمل درآمد کے ماحول کو تیار کرتی ہے جس میں ایجنٹ سینکڑوں فیصلوں میں کام کرتا ہے۔ نام کی عملی طریقہ کو 2026 کے اوائل میں مچل ہاشیموٹو نے کرسٹالائز کیا تھا، جس نے اپنی روزانہ کی انجینئرنگ کی عادت کو ایجنٹ کے ماحول میں مستقل طور پر طے کرنے کے بارے میں بتایا کہ جب بھی ایجنٹ کوئی غلطی کرتا ہے۔ OpenAI اور انتھروپک نے ہفتوں کے اندر توسیعی مضامین شائع کیے۔ نعرے کا ورژن: ایجنٹ کو ٹھیک نہ کریں، اس دنیا کو ٹھیک کریں جس میں ایجنٹ رہتا ہے۔

💡 تشبیہ: فوری اصلاحات بینڈیڈز ہیں؛ ہارنس فکسز ویکسین ہیں۔ ایک فوری حل ناکامی کی ایک مثال کو حل کرتا ہے۔ ایک ہارنس فکس (ایک ٹول، ایک توثیق کرنے والا، ایک سکل، ایک چیک، ایک ہدایات شامل کرنا) ناکامی کے اس طبقے کو ہمیشہ کے لیے بند کر دیتا ہے، ہر مستقبل کے ایجنٹ کے لیے جو ایک ہی کنٹرول میں چلتا ہے۔

🔹 مثال: TutorClaw ایسی رائے دیتا ہے جو کسی ابتدائی طالب علم کے لیے بہت سخت ہے۔ سادہ سا حل تو پرامپٹ دوبارہ لکھنا ہے۔ مگر ہارنس فکس یہ ہے کہ ایک ٹون-چیک سکل شامل کی جائے جو آؤٹ پٹ کو ایک رُبرک سے گزار کر جانچے۔ TutorClaw کا ہر آئندہ جواب اسی سے گزرتا ہے، اور پرامپٹ بدلنے کی ضرورت نہیں رہتی۔

📌 اوپن کلاو میں: ہارنس میں توسیع کی اکائی SKILL.md فائل ہے۔ آپ کے طلبہ جو بھی سکل لکھتے ہیں وہ ہارنس انجینئرنگ کا ایک آرٹی فیکٹ ہے، اور وہی ہاشیموٹو لوپ یہاں بھی لاگو ہوتا ہے: ناکامی کا مشاہدہ کریں → پوچھیں کہ یہ ممکن کیوں ہوئی → مستقل حل کی انجینئرنگ کریں → تصدیق کریں کہ اس کا فائدہ بڑھتا چلا جاتا ہے۔

‏Progress Files

فائلیں جو ایک سے زیادہ کلاڈ کوڈ سیشنز میں ایک طویل عرصے سے چلنے والے پروجیکٹ کی حالت کو ٹریک کرتی ہیں، اس کی دستاویز کرتی ہیں کہ کیا مکمل ہوا، فیصلے کیے گئے، اور آگے کیا ہے۔

💡 تشبیہ: ایک تعمیراتی سائٹ لاگ بک۔ ہر روز، فورمین ریکارڈ کرتا ہے کہ کیا بنایا گیا، کیا مسائل پیدا ہوئے، اور کل کے لیے کیا منصوبہ بنایا گیا ہے۔ جب ایک نیا عملہ آتا ہے (نیا سیشن)، وہ لاگ پڑھتے ہیں اور بغیر کسی رکاوٹ کے جاری رہتے ہیں۔

‏Session ڈھانچہ

یہ ڈیزائن کرنا کہ آپ ایک بڑے پروجیکٹ کے لیے ایک سے زیادہ سیشنز میں ایک اے آئی ایجنٹ کے ساتھ اپنے تعاملات کو کس طرح ترتیب دیتے ہیں اور ترتیب دیتے ہیں، یہ فیصلہ کرتے ہوئے کہ کب نیا شروع کرنا ہے، کب آگے بڑھانا ہے، اور کس سیاق و سباق کو محفوظ کرنا ہے۔

🔹 مثال: 30 بابوں کے کتابی منصوبے کے لیے، آپ پوری کتاب کو ایک سیشن میں نہیں ڈالتے۔ آپ ایک آرکیٹیکچر ڈیزائن کرتے ہیں: سیشن 1 خاکہ کا احاطہ کرتا ہے، سیشن 2 باب 1 لکھتا ہے (سیاق و سباق کے طور پر خاکہ کو آگے بڑھاتا ہے)، سیشن 3 باب 2 لکھتا ہے (آؤٹ لائن + باب 1 کا خلاصہ آگے لے جانا)، وغیرہ۔ ہر سیشن کو بالکل وہی سیاق و سباق ملتا ہے جس کی اسے ضرورت ہوتی ہے، نہ زیادہ، نہ کم۔

‏Five Powers

وہ پانچ صلاحیتیں جو روایتی یوزر انٹرفیس سے خودمختار اے آئی ایجنٹوں کی طرف تبدیلی کو قابل بناتی ہیں: (1) فطری زبان کی سمجھ، (2) استدلال، (3) ٹول استعمال، (4) میموری، اور (5) منصوبہ بندی۔ مشترکہ طور پر، وہ ایجنٹوں کو ارادے کو سمجھنے اور آزادانہ طور پر عمل کرنے کی اجازت دیتے ہیں۔

💡 تشبیہ: ایک قابل انسانی معاون کے بارے میں سوچئے۔ وہ (1) آپ کی باتوں کو سمجھ سکتے ہیں، (2) مسائل کے بارے میں سوچ سکتے ہیں، (3) فون اور کمپیوٹر جیسے ٹولز کا استعمال کر سکتے ہیں، (4) اپنی ترجیحات کو یاد رکھ سکتے ہیں، اور (5) ملٹی سٹیپ پراجیکٹس کی منصوبہ بندی کر سکتے ہیں۔ تمام پانچ طاقتوں کے ساتھ ایک اے آئی ایجنٹ ایسا ہی کر سکتا ہے: یہی وہ چیز ہے جو "سافٹ ویئر جو آپ چلاتے ہیں" سے "سافٹ ویئر جو آپ کے لیے کام کرتا ہے" میں بدل جاتا ہے۔

ایجنٹ Maturity ماڈل

ایک پانچ سطحی فریم ورک جو کسی تنظیم کے AI کو اپنانے کے مراحل کو بیان کرتا ہے:

LevelNameDescription
1Experimentalانفرادی ڈویلپرز AI کوڈنگ ٹولز آزما رہے ہیں۔
2Standardizedگورننس کے ساتھ تنظیمی سطح کو اپنانا
3AI-Drivenتفصیلات زندہ دستاویزات بن جاتی ہے۔ ورک فلو کو دوبارہ ڈیزائن کیا گیا۔
4AI-Nativeمصنوعات جہاں AI/LLMs بنیادی اجزاء ہیں۔
5Autonomousپوری تنظیم AI مقامی؛ خود کو بہتر بنانے کے نظام

‏AI-Assisted ڈیولپمنٹ

‏AI کو بطور مددگار یا copilot استعمال کرنا: کوڈ کی تکمیل، بگ کا پتہ لگانا، دستاویزات کی تیاری۔ انسان اب بھی زیادہ تر کوڈ لکھتا ہے۔

🔹 مثال: GitHub Copilot آپ کے ٹائپ کرتے وقت کوڈ کی اگلی لائن تجویز کرتا ہے۔

‏AI-Driven ڈیولپمنٹ

‏AI انسانی تحریری وضاحتوں سے اہم کوڈ تیار کرتا ہے۔ انسان معمار، ہدایت کار اور جائزہ نگار کے طور پر کام کرتا ہے۔ ٹائپسٹ نہیں

🔹 مثال: آپ REST API کو بیان کرتے ہوئے ایک SPEC.md لکھتے ہیں، اور کلاڈ کوڈ پوری FastAPI ایپلی کیشن، ٹیسٹ اور دستاویزات تیار کرتا ہے۔

‏AI-Native ڈیولپمنٹ

ایپلی کیشنز کو زمین سے AI صلاحیتوں کے ارد گرد تعمیر کیا گیا ہے: AI کو ایک خصوصیت کے طور پر شامل نہیں کیا گیا ہے؛ یہ مصنوعات کا بنیادی ہے.

🔹 مثال: TutorClaw کوئی ایسی درسی کتاب نہیں جس پر چیٹ بوٹ جوڑ دیا گیا ہو۔ AI ٹیوٹر خود ہی پروڈکٹ ہے۔ پورا آرکیٹیکچر LLM کی صلاحیتوں کے گرد بنا ہے۔

‏Nine Pillars of AIDD

‏AI سے چلنے والی ترقی کے نو بنیادی اصول جیسا کہ اس کتاب میں بیان کیا گیا ہے: تفصیلات کے پہلے ڈیزائن سے لے کر مسلسل تصدیق تک ہر چیز کا احاطہ کرتا ہے۔

‏OODA Loop (Observe, Orient, Decide, Act)

اے آئی ایجنٹوں کے ساتھ کام کرنے پر تیزی سے فیصلہ سازی کا دور لاگو ہوتا ہے۔ آپ ایجنٹ کے آؤٹ پٹ کا مشاہدہ کرتے ہیں، اورینٹ یہ جانچ کر کہ آیا یہ تفصیل سے مماثل ہے، فیصلہ کرتے ہیں کہ آیا قبول کرنا ہے یا ری ڈائریکٹ کرنا ہے، اور یا تو منظوری دے کر یا نئی ہدایات دے کر عمل کرتے ہیں۔

📌 اصل: لڑاکا پائلٹ جان بوئڈ کی طرف سے تیار کردہ ایک فوجی حکمت عملی کا فریم ورک، جو اب AI سے چلنے والے کام کے تیز تکراری چکروں پر لاگو ہوتا ہے۔

‏PRIMM-AI+

اس کتاب میں استعمال ہونے والا ایک تعلیمی فریم ورک: پیش گوئی کریں کہ کوڈ کیا کرے گا → اسے چلائیں → آؤٹ پٹ کی تحقیق کریں → اس میں ترمیم کریں → اپنا ورژن بنائیں۔ "AI+" کا مطلب ہے کہ AI ہر قدم میں شامل ہے۔

‏Identic AI

ایک ایسا تصور جہاں ہر انسان کے پاس ایک ذاتی اے آئی ایجنٹ ہوتا ہے جو ان کے فیصلے، ترجیحات اور اختیار کی عکاسی کرتا ہے: یعنی ان کی جانب سے متعدد AI سسٹمز میں کام تفویض کرنا۔ اس کتاب کے حوالہ جاتی آرکیٹیکچر میں اوپن کلاو ہی Identic AI ہے، یعنی کنارے کی تہہ کا ڈیلیگیٹ۔

💡 تشبیہ: ایک CEO کا ایک ایگزیکٹو اسسٹنٹ ہوتا ہے جو اپنی ترجیحات اور فیصلہ سازی کے انداز کو اتنا اچھی طرح جانتا ہے کہ وہ CEO کی جانب سے کام کر سکتا ہے۔ Identic AI AI ورژن ہے: ایجنٹ فیکٹری میں آپ کا ذاتی نمائندہ۔

ریکارڈ کا مستند نظام / Source of Truth

ڈیٹا کا ایک مستند ذریعہ جس پر ہر کوئی اعتماد کرتا ہے۔ جب متضاد ورژن ہوں تو، ریکارڈ کا نظام حتمی لفظ ہے۔

🔹 مثال: اگر آپ کی کمپنی کا HR سسٹم کہتا ہے کہ ملازم کی تنخواہ 200,000 روپے ہے، مگر ایک اسپریڈ شیٹ کہتی ہے کہ 180,000 روپے، تو HR سسٹم ہی سسٹم آف ریکارڈ ہے۔

‏Bounded Workflow

ایک ورک فلو جس میں واضح طور پر بیان کردہ آغاز پوائنٹس، اینڈ پوائنٹس، اور رکاوٹیں ہیں: ایجنٹ بالکل جانتا ہے کہ وہ کیا کر سکتا ہے اور کیا نہیں کر سکتا۔ کوئی ابہام، کوئی گنجائش نہیں۔

‏Escalation پروٹوکول

ایک پہلے سے طے شدہ قاعدہ کہ جب کسی ایجنٹ کو روکنا چاہیے اور کسی انسان کو کوئی کام سونپنا چاہیے: کیونکہ یہ بہت پیچیدہ، بہت زیادہ خطرناک، یا ایجنٹ کے اختیار سے باہر ہے۔

🔹 مثال: ایک کسٹمر سروس ایجنٹ معمول کے سوالات کو ہینڈل کرتا ہے، لیکن اگر کوئی گاہک قانونی کارروائی کی دھمکی دیتا ہے، تو ایسکلیشن پروٹوکول گفتگو کو انسانی مینیجر کو منتقل کرتا ہے۔

‏Tool انٹرفیس

ایک ایجنٹ کسی بیرونی ٹول سے کس طرح جڑتا اور استعمال کرتا ہے، اس کے لیے متعین معاہدہ، اس بات کی وضاحت کرتا ہے کہ ٹول کو کن ان پٹ کی توقع ہے اور یہ کیا آؤٹ پٹ واپس کرتا ہے۔

‏Vertical Intelligence

کسی مخصوص صنعت کی اصطلاحات، قواعد و ضوابط، ورک فلوز، اور مسائل میں گہری مہارت، جو ایک ایجنٹ میں پیک کر دی جائے۔

🔹 مثال: پاکستانی ٹیکسٹائل برآمد کنندگان کے لیے ایک اے آئی ایجنٹ جو SRO اطلاعات، HS کوڈز، LC دستاویزات، اور SBP کے ضوابط کو سمجھتا ہے؛ نہ صرف عام کاروباری علم۔

‏Agentic ادارہ

ایک ایسی تنظیم جس نے اے آئی ایجنٹوں کو اپنے بنیادی کاموں میں شامل کیا ہے، Digital FTEs کے ساتھ کام کرنے کے معیاری طریقے کے طور پر انسانی ملازمین کے ساتھ۔ تھیسس میں اسے AI-Native کمپنی کہا جاتا ہے، یعنی وہ چلتا ہوا ادارہ جو ایجنٹ فیکٹری تیار کرتی ہے۔ دونوں اصطلاحات ایک ہی چیز کی طرف اشارہ کرتی ہیں۔

🔹 مثال: ایک لاجسٹک کمپنی جہاں اے آئی ایجنٹ آرڈر ٹریکنگ، روٹ آپٹیمائزیشن، اور کسٹمر کی اطلاعات 24/7 کو ہینڈل کرتے ہیں، جب کہ انسانی ملازمین شراکت داری، استثنی سنبھالنا اور حکمت عملی پر توجہ دیتے ہیں۔ ایجنٹس کوئی سائیڈ پروجیکٹ نہیں ہیں۔ وہ org چارٹ کا حصہ ہیں۔

‏Custom-Built AI Employee

ایک اے آئی ایجنٹ جسے آپ کسی مخصوص کاروباری ضرورت کے لیے شروع سے بناتے ہیں، بالکل آپ کے ورک فلو اور ڈومین کے مطابق بنایا گیا ہے۔

🔹 مثال: ایک ٹیکسٹائل برآمد کنندہ ایک ایجنٹ بناتا ہے جو آنے والی LC (لیٹر آف کریڈٹ) دستاویزات کو پڑھتا ہے، انہیں SBP کے ضوابط کے خلاف چیک کرتا ہے، تضادات کو جھنڈا دیتا ہے، اور ترمیمی درخواستوں کا مسودہ تیار کرتا ہے۔ کوئی آف دی شیلف ٹول ایسا نہیں کرتا ہے۔ یہ ان کے عین مطابق ورک فلو کے لیے اپنی مرضی کے مطابق بنایا گیا ہے۔

‏Pre-Built AI Employee

ایک آف دی شیلف اے آئی ایجنٹ جسے آپ اپنی مرضی کے مطابق ترقی کے بغیر فوری طور پر استعمال کر سکتے ہیں، جیسے چیٹ جی پی ٹی، Claude، یا موجودہ کسٹمر سروس بوٹ کا استعمال۔

🔹 مثال: Claude کو براہ راست ای میلز کا مسودہ تیار کرنے، دستاویزات کا خلاصہ کرنے یا سوالات کے جوابات دینے کے لیے استعمال کرنا۔ کسی ڈیولپمنٹ کی ضرورت نہیں؛ آپ فوراً شروع کر دیتے ہیں۔ سمجھوتہ یہ ہے: یہ عام کاموں کے لیے تو ٹھیک ہے، مگر آپ کے منفرد کاروباری عمل کے لیے مخصوص نہیں ہوتا۔

‏Build vs. Buy

تزویراتی فیصلہ: اپنا حسب ضرورت اے آئی ایجنٹ بنائیں (زیادہ کنٹرول، زیادہ لاگت، زیادہ وقت لگتا ہے) یا موجودہ (تیز تعیناتی، کم حسب ضرورت) استعمال کریں؟

🔹 مثال: ہسپتال کو مریض کے شیڈولنگ ایجنٹ کی ضرورت ہوتی ہے۔ خریدیں: ایک موجودہ ہیلتھ کیئر AI پلیٹ فارم کا استعمال کریں (ہفتوں میں تعینات، لیکن محدود تخصیص۔ تعمیر: ان کے مخصوص EMR سسٹم، ڈاکٹر کی ترجیحات، اور Urdu/English سپورٹ کے ساتھ مربوط ایک حسب ضرورت ایجنٹ بنائیں) مہینوں لگتے ہیں لیکن بالکل فٹ بیٹھتے ہیں۔ صحیح انتخاب کا انحصار بجٹ، ٹائم لائن، اور ورک فلو کتنا منفرد ہے۔

‏FTE ڈیولپمنٹ Plugin

ایک ٹول یا ایکسٹینشن جو Digital FTEs کی ترقی اور تعیناتی میں مدد کرتا ہے، ایجنٹ فیکٹری ورک فلو کو ہموار کرتا ہے۔

‏Skill Shim

ایک پتلی اڈاپٹر پرت جو مختلف ایجنٹ کی سکل کے فارمیٹس کے درمیان ترجمہ کرتی ہے، پلیٹ فارمز میں مطابقت کو فعال کرتی ہے۔

💡 تشبیہ: ایک ٹریول پاور اڈاپٹر۔ آپ کا پاکستانی پلگ یو کے ساکٹ میں فٹ نہیں ہوتا ہے، لیکن ایک شیم (اڈاپٹر) انہیں کسی بھی چیز کو ری وائر کیے بغیر ہم آہنگ بناتا ہے۔

‏Gateway Proxy نمونہ

ایک آرکیٹیکچرل پیٹرن جہاں ایک ہی انٹری پوائنٹ (گیٹ وے) درست بیک اینڈ ایجنٹ یا سروس کی درخواستوں کو روٹ کرتا ہے، توثیق کا انتظام، شرح کو محدود کرنا، اور لوڈ ڈسٹری بیوشن کرتا ہے۔

💡 تشبیہ: ایک بڑے اسپتال کا استقبالیہ ڈیسک۔ تمام مریض استقبالیہ کے ذریعے داخل ہوتے ہیں، جو ان کی ملاقات کا وقت چیک کرتا ہے، ان کی شناخت کی تصدیق کرتا ہے، اور انہیں صحیح شعبہ میں لے جاتا ہے۔

‏Piggyback پروٹوکول

کتاب میں حوالہ دیا گیا ایک اسٹارٹ اپ حکمت عملی: اپنے خود مختار چینلز بنانے سے پہلے صارفین تک تیزی سے پہنچنے کے لیے اپنے پروڈکٹ کو موجودہ پلیٹ فارم کی تقسیم کے اوپر بنانا۔

🔹 مثال: TutorClaw ڈیلیور کرنے کے لیے اپنی خود کی میسجنگ ایپ بنانے کے بجائے، آپ WhatsApp کے سب سے اوپر بناتے ہیں: جس کے پاکستان میں پہلے ہی 100 ملین صارفین ہیں۔ آپ کسی کو نئی ایپ ڈاؤن لوڈ کرنے پر قائل کیے بغیر، طلباء تک فوری طور پر پہنچنے کے لیے WhatsApp کی تقسیم پر "پگی بیک" کرتے ہیں۔


‏2. کور AI اور مشین لرننگ

یہ اس کتاب میں ہر چیز کے پیچھے بنیادی نظریات ہیں۔

AI ⊃ ML ⊃ DL ⊃ LLMs
(Each is a subset of the one before it)

‏AI (مصنوعی ذہانت)

کمپیوٹر سے ایسے کام کروانا جن کے لیے عام طور پر انسانی ذہانت درکار ہوتی ہے، جیسے زبان سمجھنا، تصاویر پہچاننا، فیصلے کرنا، اور مسائل حل کرنا۔

🔹 مثال: جب آپ کے فون کا کی بورڈ اردو یا انگریزی میں آپ کے اگلے لفظ کی پیشین گوئی کرتا ہے، تو وہ AI ہے۔ جب کریم ٹریفک کی بنیاد پر آپ کے سواری کے وقت کا تخمینہ لگاتا ہے، تو وہ AI ہے۔

‏ML (مشین Learning)

کمپیوٹر کو واضح اصول لکھنے کے بجائے مثالیں دکھا کر سکھانے کا ایک طریقہ۔ کمپیوٹر ڈیٹا میں پیٹرن تلاش کرتا ہے اور ان سے سیکھتا ہے۔

🔹 مثال: YouTube آپ کو پسند آنے والے ویڈیوز کی تجویز کرتا ہے۔ کسی نے بھی ایسا قاعدہ پروگرام نہیں کیا جس میں کہا گیا ہو کہ "اگر صارف نے کرکٹ کی جھلکیاں دیکھیں تو مزید کرکٹ کا مشورہ دیں۔" نظام نے یہ نمونہ اربوں دیکھنے کی عادات سے سیکھا۔

💡 تشبیہ: تصور کریں کہ ایک بچے کو آموں کو پہچاننا سکھائیں۔ آپ حیاتیات کی وضاحت نہیں کرتے۔ آپ انہیں درجنوں آم دکھاتے ہیں اور کہتے ہیں "آم"۔ آخر کار، وہ ان آموں کو پہچانتے ہیں جنہیں انہوں نے کبھی نہیں دیکھا، یہاں تک کہ مختلف اقسام جیسے چونسہ اور سندھڑی۔ یہ مشین لرننگ ہے۔

‏DL (Deep Learning)

مشین لرننگ کا ایک زیادہ طاقتور ورژن جو کئی تہوں کے ساتھ "نیورل نیٹ ورکس" کا استعمال کرتا ہے۔ یہ انتہائی پیچیدہ نمونے سیکھ سکتا ہے، جیسے تقریر کو سمجھنا، تصاویر بنانا، یا زبانوں کے درمیان ترجمہ کرنا۔

🔹 مثال: جب Google Translate کسی اردو پیراگراف کو روانی سے انگریزی میں بدلتا ہے، تو اس ترجمے کے پیچھے ڈیپ لرننگ کام کر رہی ہوتی ہے۔

💡 تشبیہ: اگر ML سادہ شکلوں کو پہچاننا سیکھ رہا ہے تو DL بھرے صدر بازار میں چہروں کو پہچاننا سیکھ رہا ہے: کہیں زیادہ پیچیدہ، لیکن مثالوں سے سیکھنے کا وہی اصول۔

ماڈل

ایک ایسا پروگرام جسے ڈیٹا پر تربیت دی گئی ہے اور اب وہ پیشین گوئیاں کر سکتا ہے یا نتائج پیدا کر سکتا ہے۔ جب لوگ "GPT-4" یا "Claude" کہتے ہیں تو وہ ماڈلز کا حوالہ دیتے ہیں۔

💡 تشبیہ: ایک ماڈل ایک طالب علم کی طرح ہے جس نے لاکھوں نصابی کتب کا مطالعہ کیا ہے۔ آپ سوال پوچھتے ہیں، وہ ہر چیز کی بنیاد پر جواب دیتے ہیں جو انہوں نے پڑھا ہے۔ مختلف ماڈلز مختلف طلباء کی طرح ہیں: کچھ ریاضی میں بہتر ہیں، کچھ تخلیقی تحریر میں۔

‏Foundation ماڈل

ایک بہت بڑا، عام مقصد کا ماڈل بہت زیادہ ڈیٹا پر تربیت یافتہ ہے۔ اسے شروع سے دوبارہ تربیت کے بغیر بہت سے مختلف کاموں کے مطابق ڈھالا جا سکتا ہے۔ Claude، GPT-4، اور جیمنی فاؤنڈیشن ماڈل ہیں۔

💡 تشبیہ: ایک فاؤنڈیشن ماڈل وسیع تعلیم کے ساتھ یونیورسٹی کے گریجویٹ کی طرح ہے۔ انہوں نے ابھی تک سکل حاصل نہیں کی ہے، لیکن وہ بہت ساری ملازمتوں میں تیزی سے ڈھل سکتے ہیں: اکاؤنٹنگ، تحریر، تحقیق، انتظام۔

‏Neural Network

انسانی دماغ سے متاثر ایک کمپیوٹنگ سسٹم، باہم جڑے ہوئے "نوڈس" کی تہوں کے ساتھ جو معلومات پر کارروائی کرتے ہیں، ہر پرت تیزی سے پیچیدہ نمونے کو نکالتی ہے۔

💡 تشبیہ: مختلف میش سائز کے ساتھ چھلنی کی ایک سیریز کا تصور کریں۔ آپ پہلی چھلنی کے ذریعے خام ڈیٹا ڈالتے ہیں (بڑے پیٹرن پکڑتا ہے)، پھر اگلا (بہتر پیٹرن پکڑتا ہے)، پھر اگلا (بہترین تفصیلات پکڑتا ہے)۔ ایک نیورل نیٹ ورک اسی طرح کام کرتا ہے، ہر پرت معلومات کو بہتر کرتی ہے۔

‏Transformer

مخصوص نیورل نیٹ ورک آرکیٹیکچر جو تمام جدید LLMs کو طاقت دیتا ہے۔ 2017 میں ایجاد کیا گیا، یہ الفاظ کے درمیان تعلقات کو سمجھنے میں خاص طور پر اچھا ہے، یہ جانتے ہوئے کہ "بینک" کا مطلب "ریور بینک" بمقابلہ "بینک اکاؤنٹ" میں کچھ مختلف ہے۔

💡 تشبیہ: پرانے AI جملے کو لفظ بہ لفظ پڑھتے ہیں، جیسے کی ہول سے پڑھنا (آپ ایک وقت میں ایک لفظ دیکھتے ہیں اور معنی کا اندازہ لگاتے ہیں۔ ٹرانسفارمرز ایک ساتھ پورا جملہ پڑھتے ہیں، جیسے پورا دروازہ کھولنا) وہ ہر لفظ کو بیک وقت دیکھتے ہیں اور سمجھتے ہیں کہ ہر لفظ کا ہر دوسرے لفظ سے کیا تعلق ہے۔ یہی وجہ ہے کہ وہ زبان کو سمجھنے میں بہت بہتر ہیں۔

💡 یہ کیوں اہم ہے: اس کتاب میں ہر اے آئی ماڈل (Claude, GPT, جیمنی) ٹرانسفارمرز پر بنایا گیا ہے۔ آپ کو ریاضی کو سمجھنے کی ضرورت نہیں ہے، لیکن آپ کو اصطلاح اکثر نظر آئے گی۔

‏Multimodal ماڈل

ایک ماڈل جو متعدد قسم کے ان پٹ (ٹیکسٹ، امیجز، آڈیو، ویڈیو) کے ساتھ کام کر سکتا ہے نہ کہ صرف ایک۔

🔹 مثال: آپ ریستوراں کے بل کی تصویر کھینچتے ہیں اور Claude سے پوچھتے ہیں "کل کیا ہے؟" ماڈل تصویر اور آپ کے متن کے سوال دونوں کو سمجھتا ہے۔ یہ ملٹی موڈل صلاحیت ہے۔

‏Reasoning ماڈل

فوری طور پر جواب دینے کے بجائے، جواب دینے سے پہلے قدم بہ قدم پیچیدہ مسائل کو "سوچنے" کے لیے ڈیزائن کیا گیا ایک ماڈل۔ مشکل مسائل پر اکثر زیادہ درست۔

💡 تشبیہ: کرکٹ میچ میں، کچھ بلے باز فطری شاٹس کھیلتے ہیں (تیز، بعض اوقات لاپرواہ)۔ دوسرے میدان کا مطالعہ کرتے ہیں، بولر کو پڑھتے ہیں، اور ہر شاٹ کو جان بوجھ کر پلان کرتے ہیں۔ استدلال کا ماڈل دوسری قسم ہے: مشکل ترسیل پر سست لیکن زیادہ قابل اعتماد۔

‏Training

ایک ماڈل کو بڑے پیمانے پر ڈیٹا فراہم کرنے کا عمل تاکہ یہ پیٹرن سیکھے۔ یہ اس سے پہلے ہوتا ہے کہ آپ کبھی بھی ماڈل کے ساتھ تعامل کریں۔ یہ "تعلیم" کا مرحلہ ہے۔

💡 تشبیہ: تربیت ایک شیف کی طرح ہے جو کلنری اسکول میں سال گزارتا ہے: ہزاروں پکوان چکھنا، تکنیک سیکھنا، ترکیبوں کی عملی طریقہ کرنا۔ جب تک وہ اپنا ریستوراں کھولتے ہیں (جب آپ ماڈل استعمال کرتے ہیں)، سیکھنا پہلے ہی ہوچکا ہے۔

‏Pretraining

تربیت کا پہلا، سب سے مہنگا مرحلہ۔ ماڈل متن کی بہت زیادہ مقدار (کتابیں، ویب سائٹس، کوڈ، گفتگو) پڑھتا ہے اور زبان اور دنیا کے بارے میں عمومی معلومات سیکھتا ہے۔

‏Post-Training

ماڈل کو مددگار، محفوظ، اور انسانی توقعات کے مطابق بنانے کے لیے پیشگی تربیت کے بعد اضافی تربیت۔ یہ وہ جگہ ہے جہاں ایک ماڈل ہدایات پر عمل کرنا، شائستہ ہونا، اور نقصان دہ درخواستوں سے انکار کرنا سیکھتا ہے۔

💡 تشبیہ: پہلے سے تربیت ایک عام تعلیم (اسکول اور یونیورسٹی) حاصل کرنے کی طرح ہے۔ پوسٹ ٹریننگ کام کی جگہ کی واقفیت کی طرح ہے: کمپنی کی ثقافت، مواصلات کا انداز، اور پیشہ ورانہ اصول سیکھنا۔

‏Fine-Tuning

موجودہ ماڈل کو مخصوص، چھوٹے ڈیٹاسیٹ پر مزید تربیت دینا تاکہ اسے کسی خاص ڈومین میں ماہر بنایا جا سکے۔

🔹 مثال: ایک عام مقصد کے ماڈل کو لے کر اور اسے ہزاروں پاکستانی ٹیکس قوانین پر ٹھیک کریں تاکہ یہ خاص طور پر ٹیکس ایڈوائزری میں اچھا ہو۔

💡 تشبیہ: ایک عام ڈاکٹر کارڈیالوجسٹ بننے کے لیے اضافی تربیت مکمل کر رہا ہے۔ وہی بنیادی تعلیم، اب خصوصی۔

‏Parameters

ایک ماڈل کے اندرونی نمبر جو تربیت کے دوران ایڈجسٹ ہو جاتے ہیں۔ زیادہ پیرامیٹرز کا مطلب عام طور پر زیادہ قابل ماڈل ہوتا ہے۔ جدید LLMs میں اربوں یا کھربوں پیرامیٹرز ہیں۔

💡 تشبیہ: پیرامیٹرز بڑے قالین میں انفرادی دھاگوں کی طرح ہیں۔ تربیت کے دوران، ہر دھاگے کو ایڈجسٹ کیا جاتا ہے (رنگ، تناؤ، جگہ کا تعین) جب تک کہ مکمل نمونہ سامنے نہ آجائے۔ 100 بلین پیرامیٹرز والے ماڈل میں 100 بلین دھاگے ہوتے ہیں جو ایک ناقابل یقین حد تک پیچیدہ پیٹرن بناتے ہیں۔

‏Weights

تربیت کے بعد پیرامیٹرز کی مخصوص عددی قدریں۔ جب کوئی کہتا ہے کہ "وزن ڈاؤن لوڈ کرنا"، تو اس کا مطلب ہے وہ فائل جس میں وہ تمام تربیت یافتہ نمبر ہیں: ماڈل کا سیکھا ہوا علم۔

‏Dataset

‏AI ماڈل کی تربیت یا جانچ کے لیے استعمال ہونے والے ڈیٹا کا مجموعہ۔

🔹 مثال: سپیم فلٹر کی تربیت کے لیے ڈیٹا سیٹ میں 1 ملین ای میلز شامل ہو سکتی ہیں، ہر ایک پر "سپیم" یا "اسپام نہیں" کا لیبل لگا ہوا ہے۔ ترجمہ ماڈل کی تربیت کے لیے ڈیٹا سیٹ میں انگریزی-اردو جملوں کے لاکھوں جوڑے ہو سکتے ہیں۔

‏Benchmark

مختلف AI ماڈلز کی کارکردگی کی پیمائش اور موازنہ کرنے کے لیے ایک معیاری ٹیسٹ۔

🔹 مثال: جس طرح CSS یا کیمبرج کے امتحانات آپ کو طلباء کا موازنہ کرنے دیتے ہیں، بینچ مارکس جیسے MMLU (عمومی علم) یا HumanEval (کوڈنگ کی اہلیت) محققین کو AI ماڈلز کا مناسب موازنہ کرنے دیتے ہیں۔

‏Inference

ایک تربیت یافتہ ماڈل کا عمل جو آپ کے ان پٹ پر ردعمل پیدا کرتا ہے۔ ہر بار جب آپ Claude کوئی سوال پوچھتے ہیں اور جواب حاصل کرتے ہیں، یہ نتیجہ ہے۔

💡 تشبیہ: تربیت امتحان کے لیے پڑھنے جیسی ہے۔ inference امتحان میں بیٹھنے جیسا ہے۔ سیکھنا پہلے ہی ہو چکا ہے: اب ماڈل وہی لاگو کرتا ہے جو اس نے سیکھا۔ آپ inference کی ادائیگی کرتے ہیں (ہر API کال کی قیمت ہوتی ہے)، تربیت کی نہیں۔


‏3. LLM بنیادی باتیں

‏LLMs اس کتاب میں ہر اے آئی ایجنٹ کو طاقت دینے والے انجن ہیں۔ یہ سیکشن بتاتا ہے کہ وہ عملی سطح پر کیسے کام کرتے ہیں۔

‏LLM (لارج لینگویج ماڈل)

ایک بہت بڑا AI ماڈل جس میں متن کی وسیع مقدار پر تربیت حاصل کی گئی ہے جو انسان جیسی زبان اور کوڈ کو سمجھ اور تیار کر سکتی ہے۔ Claude، GPT-4، اور جیمنی سبھی LLMs ہیں۔

💡 تشبیہ: LLM ایک ناقابل یقین حد تک پڑھے جانے والے ریسرچ اسسٹنٹ کی طرح ہے جس نے ہر ویکیپیڈیا مضمون، لاکھوں کتابیں، اور اربوں ویب صفحات پڑھے ہیں۔ آپ ان سے تقریبا کسی بھی چیز کے بارے میں پوچھ سکتے ہیں، اور وہ مدد کے لیے اس پڑھنے کو اپنی طرف متوجہ کریں گے: تحریر، تجزیہ، کوڈ، ترجمہ، اور بہت کچھ۔

پرامپٹ

ان پٹ جو آپ AI ماڈل کو دیتے ہیں: آپ کا سوال، ہدایات، یا درخواست۔ آپ کے پرامپٹ کا معیار براہ راست جواب کے معیار کو متاثر کرتا ہے۔

🔹 مثال: "مارکیٹنگ کے بارے میں کچھ لکھیں" ایک کمزور اشارہ ہے۔ "ایک 500 الفاظ کی LinkedIn پوسٹ لکھیں کہ پاکستانی ٹیکسٹائل ایکسپورٹرز کو آرڈر ٹریکنگ کے لیے اے آئی ایجنٹوں کا استعمال کیوں کرنا چاہیے، پیشہ ورانہ لیکن بات چیت کے لہجے میں" ایک مضبوط اشارہ ہے۔

نظام پرامپٹ

آپ کی گفتگو شروع ہونے سے پہلے AI کو دی گئی پوشیدہ ہدایات۔ ڈویلپر کے ذریعہ ترتیب دیا گیا ہے، صارف نے نہیں۔ وہ ماڈل کی شخصیت، رویے اور رکاوٹوں کو تشکیل دیتے ہیں۔

🔹 مثال: بینکنگ چیٹ بوٹ کا سسٹم پرامپٹ یہ کہہ سکتا ہے: "آپ HBL کے لیے ایک مددگار معاون ہیں۔ گاہک کی زبان کی بنیاد پر اردو یا انگریزی میں جواب دیں۔ OTP تصدیق کے بغیر کبھی بھی اکاؤنٹ بیلنس ظاہر نہ کریں۔ اگر قرض کے بارے میں پوچھا جائے تو براہ راست لون پیج پر جائیں۔"

💡 تشبیہ: ایک سسٹم پرامپٹ ایک نئے ملازم کو پہلے دن مینیجر کی بریفنگ کی طرح ہے: "یہ ہے ہم کون ہیں، یہ ہے ہم کس طرح گاہکوں سے بات کرتے ہیں، یہ وہ ہے جو آپ کو کبھی نہیں کرنا چاہیے۔"

‏User پرامپٹ

پیغام جو آپ (صارف) دراصل ٹائپ کرتے ہیں۔ یہ آپ کی گفتگو کا رخ ہے۔

‏Instruction

ایک پرامپٹ کے اندر ایک مخصوص ہدایت جو ماڈل کو بتاتی ہے کہ کیا کرنا ہے۔

🔹 مثال: "اس کا خلاصہ تین بلٹ پوائنٹس میں کریں،" "اردو میں ترجمہ کریں،" "اس کوڈ میں بگ کو ٹھیک کریں"، ہر ایک واضح ہدایت ہے۔

سیاق و سباق

گفتگو کے دوران ماڈل کے لیے دستیاب تمام معلومات: سسٹم پرامپٹ، گفتگو کی سرگزشت، اپ لوڈ کردہ دستاویزات، اور آپ کا موجودہ پیغام مشترکہ۔

💡 تشبیہ: جب آپ کسی ساتھی سے کسی معاہدے کے بارے میں مشورہ طلب کرتے ہیں تو "سیاق و سباق" وہ سب کچھ ہوتا ہے جو وہ جانتے ہیں: کلائنٹ کی تاریخ، پچھلی ای میلز، معاہدے کی شرائط، آپ کی کمپنی کی پالیسیاں۔ جتنا زیادہ متعلقہ سیاق و سباق، اتنا ہی بہتر مشورہ۔

سیاق و سباق ونڈو

متن کی زیادہ سے زیادہ مقدار LLM ایک ہی وقت میں پروسیس کر سکتی ہے، جس کی پیمائش ٹوکن میں کی جاتی ہے۔ اسے ماڈل کی "ورکنگ میموری" سمجھیں۔

🔹 مثال: Claude ماڈلز 200,000 سے لے کر 1 ملین سے زیادہ ٹوکنز کے سیاق و سباق کی ونڈوز پیش کرتے ہیں۔ یہاں تک کہ 200,000 ٹوکن بھی تقریبا 150,000 الفاظ ہیں (ایک پورا ناول)۔ پرانے ماڈلز صرف 4,000 ٹوکن (چند صفحات) کو ہینڈل کر سکتے ہیں۔

💡 تشبیہ: سیاق و سباق ونڈو میز کے سائز کی طرح ہوتی ہے۔ ایک چھوٹی میز میں صرف چند کاغذات ہوتے ہیں، اور آپ جگہ بنانے کے لیے پرانے کو ہٹاتے رہتے ہیں۔ ایک بہت بڑا ڈیسک آپ کو پورے پروجیکٹ کو پھیلانے اور ایک ساتھ سب کچھ دیکھنے دیتا ہے۔ بڑی سیاق و سباق ونڈو = بڑی میز۔

سیاق و سباق ونڈو: چھوٹی میز بمقابلہ بڑی میز

ٹوکن

متن کی وہ بنیادی اکائی جسے LLM پروسیس کرتا ہے۔ ایک ٹوکن لگ بھگ کسی لفظ کا ¾ حصہ ہوتا ہے۔ "the" جیسے مختصر الفاظ ایک ہی ٹوکن ہوتے ہیں۔ "ناقابلِ یقین" جیسے لمبے الفاظ 3 سے 4 ٹوکنز میں بٹ جاتے ہیں۔ خالی جگہیں اور رموزِ اوقاف بھی ٹوکن استعمال کرتے ہیں۔

🔹 مثال: "مجھے بریانی پسند ہے" ≈ 4 ٹوکن۔ متن کا پورا صفحہ ≈ 500-700 ٹوکن۔ AI APIs استعمال کرتے وقت آپ سے فی ٹوکن چارج کیا جاتا ہے۔

‏Completion / Generation

آپ کے پرامپٹ کے جواب میں ایک LLM آؤٹ پٹ تیار کرتا ہے۔ جب ماڈل آپ کی درخواست کو "مکمل" کرتا ہے، تو وہ جواب تکمیل ہوتا ہے۔

‏Structured Output

جب کوئی LLM مکالماتی متن کی بجائے ایک مخصوص، مشین کے ذریعے پڑھنے کے قابل فارمیٹ (جیسے JSON) میں اپنا ردعمل پیدا کرتا ہے، تو دوسرے سافٹ ویئر آسانی سے اس پر کارروائی کر سکتے ہیں۔

🔹 مثال: "کراچی میں درجہ حرارت 35 ڈگری ہے اور دھوپ ہے" کے بجائے ایک منظم آؤٹ پٹ ہوگا: {"city": "Karachi", "temp": 35, "condition": "sunny"}۔ سافٹ ویئر اس فارمیٹ کو آسانی سے پڑھتا ہے۔

غلط اختراع

جب ایک AI ماڈل اعتماد کے ساتھ جھوٹی، غلط، یا من گھڑت معلومات پیدا کرتا ہے، اسے حقیقت کے طور پر پیش کرتا ہے۔

🔹 مثال: آپ سپریم کورٹ کے فیصلے کے بارے میں پوچھتے ہیں اور ماڈل ایک کیس ایجاد کرتا ہے (جعلی حوالہ نمبروں اور جعلی بینچ کے ساتھ مکمل) اور اسے اصلی کے طور پر پیش کرتا ہے۔

💡 تشبیہ: ایک طالب علم جو امتحان میں جواب نہیں جانتا، مگر پھر بھی بڑے اعتماد سے تفصیلی جواب لکھ دیتا ہے۔ ایسا لگتا ہے جیسے یہ درست ہے، لیکن یہ مکمل طور پر بنا ہوا ہے۔

‏Grounding

ایک AI ماڈل کو حقائق پر مبنی، تصدیق شدہ ڈیٹا کے ذرائع سے جوڑنا تاکہ یہ فریب دینے کے بجائے درست جوابات دے۔

💡 تشبیہ: گراؤنڈنگ ایسا ہے جیسے کسی طالب علم کو امتحان کے دوران اپنی نصابی کتاب استعمال کرنے دیں۔ اب ان کے جوابات حقیقی معلومات پر مبنی ہیں، ناقابل اعتماد میموری پر نہیں۔

‏Temperature

ایک ترتیب جو LLM کے جوابات میں تخلیقی صلاحیت بمقابلہ پیشین گوئی کو کنٹرول کرتی ہے۔ کم درجہ حرارت (0) = بہت مستقل۔ اعلی درجہ حرارت (1+) = زیادہ تخلیقی اور متنوع۔

💡 تشبیہ: درجہ حرارت باورچی خانے میں شیف کی آزادی کی طرح ہے۔ درجہ حرارت 0: "نصیحت پر بالکل عمل کرے، کوئی متبادل نہیں۔" درجہ حرارت 1: "آزادانہ طور پر بہتر بنائیں۔" آپ دواؤں کی خوراک کے لیے درست ترکیبیں چاہتے ہیں، لیکن ایک نئی ڈش کے لیے تخلیقی آزادی چاہتے ہیں۔

‏Latency

درخواست بھیجنے اور جواب موصول ہونے کے درمیان وقت کی تاخیر۔ کم تاخیر = تیز۔ ملی سیکنڈ یا سیکنڈ میں ناپا جاتا ہے۔

🔹 مثال: اگر Claude 1 سیکنڈ میں جواب دیتا ہے، تو یہ کم تاخیر ہے۔ اگر اس میں 15 سیکنڈ لگتے ہیں تو یہ زیادہ تاخیر ہے۔ صارفین 2-3 سیکنڈ سے زیادہ بے صبرے ہوجاتے ہیں۔

‏Throughput

ایک سسٹم فی یونٹ وقت کی کتنی درخواستوں کو سنبھال سکتا ہے۔ ہائی تھرو پٹ = بیک وقت بہت سے صارفین کی خدمت کرنا۔

💡 تشبیہ: تاخیر سے مراد یہ ہے کہ ایک کار ٹول پلازہ سے کتنی تیزی سے گزرتی ہے۔ ٹول پلازہ فی گھنٹہ کتنی کاروں کو ہینڈل کرتا ہے۔ آپ کم تاخیر اور اعلی تھرو پٹ دونوں چاہتے ہیں۔

‏Deterministic vs. Non-Deterministic

ڈیٹرمنسٹک: ایک ہی ان پٹ ہمیشہ بالکل وہی آؤٹ پٹ تیار کرتا ہے (جیسے کیلکولیٹر: 2+2 ہمیشہ 4 کے برابر ہوتا ہے)۔ غیر متعین: ایک ہی ان پٹ ہر بار مختلف آؤٹ پٹ پیدا کر سکتا ہے۔

‏LLMs غیر متعین ہیں: ایک ہی سوال دو بار پوچھیں، اور آپ کو قدرے مختلف (لیکن اتنے ہی درست) جوابات مل سکتے ہیں۔ یہ کوئی بگ نہیں ہے؛ یہ بنیادی ہے کہ ٹیکنالوجی کیسے کام کرتی ہے۔

بے حالت

الگ الگ تعاملات کے درمیان کوئی میموری نہیں ہے۔ LLM کے ساتھ ہر نئی گفتگو مطلق صفر سے شروع ہوتی ہے: ماڈل کو کسی پچھلی گفتگو کا علم نہیں ہے۔

💡 تشبیہ: بھولنے کی بیماری میں مبتلا دکاندار۔ جب بھی آپ اندر جاتے ہیں، وہ آپ کو ایک اجنبی کی طرح سلام کرتے ہیں، چاہے آپ وہاں پانچ منٹ پہلے موجود ہوں۔ چیٹ ایپس ہر پیغام کے ساتھ گفتگو کی پوری تاریخ کو دوبارہ بھیج کر میموری کا وہم پیدا کرتی ہیں۔

بے حالت نظام کیسے کام کرتا ہے: ایپ ہر بار پوری history دوبارہ بھیجتی ہے

پرامپٹ انجینئرنگ

‏AI ماڈل سے بہترین ممکنہ پیداوار حاصل کرنے کے لیے واضح، مخصوص ہدایات تیار کرنے کی سکل۔ نہ صرف "آپ کیا پوچھتے ہیں" بلکہ "آپ اسے کیسے پوچھتے ہیں۔"

🔹 مثال: "AI کے بارے میں لکھیں" کے بجائے ایک پرامپٹ انجینئر لکھتا ہے: "آپ ڈان اخبار کے لیے لکھنے والے ٹیکنالوجی صحافی ہیں۔ ایک 600 الفاظ پر مشتمل مضمون لکھیں جس میں بتایا جائے کہ پاکستانی بینک کس طرح دھوکہ دہی کا پتہ لگانے کے لیے اے آئی ایجنٹس کا استعمال کر رہے ہیں۔ ایک حقیقی مثال شامل کریں۔ ایک غیر تکنیکی کاروبار کے لیے قابل رسائی آسان زبان استعمال کریں۔"

‏NLP (Natural Language Processing)

‏AI کی شاخ انسانی زبان کو سمجھنے، تشریح کرنے اور تخلیق کرنے سے متعلق ہے، وہ بنیاد جو LLMs کو ممکن بناتی ہے۔

🔹 مثال: جب آپ ٹوٹی پھوٹی انگریزی میں تلاش کا سوال ٹائپ کرتے ہیں اور Google پھر بھی سمجھتا ہے کہ آپ کا کیا مطلب ہے، تو یہ کام پر NLP ہے۔

‏Copilot

ایک AI اسسٹنٹ ایک سافٹ ویئر ماحول (جیسے کوڈ ایڈیٹر) میں ضم ہوتا ہے جو آپ کے ساتھ کام کرتا ہے تاکہ آپ کے کام کرتے وقت پیداواری صلاحیت کو بڑھانے، تجویز کرنے، خودکار تکمیل کرنے اور جائزہ لینے کے لیے کام کرے۔

🔹 مثال: GitHub Copilot آپ کے ٹائپ کرتے وقت کوڈ تجویز کرتا ہے۔ یہ ایسا ہی ہے جیسے کوئی باشعور ساتھی آپ کے کندھے پر نظر رکھے، آپ کے جملے مکمل کرے۔


‏4. علم، بازیافت، اور سیاق و سباق

یہ شرائط بیان کرتی ہیں کہ کس طرح اے آئی ایجنٹ بہتر، زیادہ درست جوابات کے لیے بیرونی علم تک رسائی اور استعمال کرتے ہیں۔

‏RAG (بازیافت سے تقویت یافتہ تخلیق)

ایک تکنیک جہاں ایک AI پہلے بیرونی دستاویزات یا ڈیٹا بیس سے متعلقہ معلومات حاصل کرتا ہے، پھر اس معلومات کو زیادہ درست جواب پیدا کرنے کے لیے استعمال کرتا ہے۔

💡 تشبیہ: کھلی کتاب کا امتحان دینا۔ صرف حفظ شدہ (ممکنہ طور پر غلط) علم پر انحصار کرنے کے بجائے، آپ اپنا جواب لکھنے سے پہلے اپنے حوالہ جاتی مواد میں مخصوص حقائق تلاش کرتے ہیں۔ RAG AI کو اپنی حوالہ لائبریری دیتا ہے۔

RAG ورک فلو: retrieve، augment، generate

‏Embedding

متن کو عددی نقاط میں تبدیل کرنا تاکہ کمپیوٹر اس بات کی پیمائش کر سکے کہ متن کے مختلف ٹکڑے کتنے ملتے جلتے ہیں، معنی کی گرفت کرتے ہوئے، نہ صرف مطلوبہ الفاظ۔

💡 تشبیہ: تصور کریں کہ ہر کتاب کو لائبریری میں ایک بڑے نقشے پر رکھیں جہاں ایک جیسی کتابیں ایک ساتھ جمع ہوں۔ باورچی کی کتابیں ایک دوسرے کے قریب بیٹھتی ہیں، فزکس کی نصابی کتابوں سے بہت دور۔ ایمبیڈنگز ریاضی کی جگہ میں یہ "مماثلت کا نقشہ" بناتے ہیں۔

‏Vector

ریاضی کی جگہ میں متن کے ٹکڑے کی نمائندگی کرنے والے اعداد کی فہرست۔ جب متن کو ایمبیڈنگ میں تبدیل کیا جاتا ہے، تو نتیجہ ایک ویکٹر ہوتا ہے۔

🔹 مثال: لفظ "کرکٹ" [0.8, 0.3, 0.7, 0.1, ...] بن سکتا ہے: نمبروں کی ایک لمبی فہرست جو کھیل اور کیڑے کے معنی دونوں کو حاصل کرتی ہے، جو ارد گرد کے سیاق و سباق سے ممتاز ہوتی ہے۔

‏Vector Database

ویکٹرز کو ذخیرہ کرنے اور تیزی سے تلاش کرنے کے لیے ایک خصوصی ڈیٹا بیس، مطلوبہ الفاظ کے عین مطابق مماثلت کے بجائے معنی کے لحاظ سے ملتے جلتے مواد کو تلاش کرنا۔

ویکٹر ڈیٹابیس: keywords کے بجائے معنی سے search

🔹 مثال: آپ کمپنی کے 10,000 دستاویزات کو ویکٹر کے طور پر اسٹور کرتے ہیں۔ جب کوئی پوچھے "ہماری واپسی کی پالیسی کیا ہے؟" ویکٹر ڈیٹا بیس فوری طور پر سب سے زیادہ متعلقہ دستاویزات تلاش کر لیتا ہے، چاہے ان میں سے کسی میں بھی درست جملہ "واپسی کی پالیسی" نہ ہو۔

💡 تشبیہ: ایک روایتی ڈیٹا بیس عین مطلوبہ الفاظ کے ذریعے تلاش کرتا ہے (جیسے نام سے فون بک تلاش کرنا)۔ ایک ویکٹر ڈیٹا بیس معنی کے لحاظ سے تلاش کرتا ہے (جیسے کسی لائبریرین سے پوچھنا کہ "مجھے اس سے ملتی جلتی کتابیں تلاش کریں")۔

عین مطابق مطلوبہ الفاظ کے بجائے معنی سے تلاش کرنا۔ "میں کسی پروڈکٹ کو کیسے واپس کروں؟" "ریفنڈ پروسیس" کے عنوان سے ایک دستاویز سے میل کھاتا ہے حالانکہ الفاظ بالکل مختلف ہیں۔

🔹 مثال: ایک ملازم کمپنی کے نالج بیس میں "وقت نکالنے کا طریقہ" تلاش کرتا ہے۔ سیمنٹک تلاش میں "سالانہ چھٹی کی پالیسی اور طریقہ کار" کے عنوان سے دستاویز ملتی ہے، حالانکہ تلاش کا کوئی بھی لفظ عنوان میں ظاہر نہیں ہوتا ہے۔ روایتی مطلوبہ الفاظ کی تلاش سے کچھ نہیں ملے گا۔

‏Retrieval

جواب پیدا کرنے میں استعمال کرنے کے لیے AI کے لیے ڈیٹا سورس (ڈیٹا بیس، دستاویزات کا مجموعہ، ویب) سے متعلقہ معلومات حاصل کرنا۔

🔹 مثال: ایک صارف آپ کے سپورٹ ایجنٹ سے پوچھتا ہے "لیپ ٹاپ پر آپ کی کیا وارنٹی ہے؟" ایجنٹ آپ کے نالج بیس سے وارنٹی پالیسی کی دستاویز نکالتا ہے، متعلقہ سیکشن پڑھتا ہے، اور آپ کی اصل پالیسی کی بنیاد پر درست جواب تیار کرتا ہے، نہ کہ محض اندازہ۔

‏Reranking

متعدد نتائج کی بازیافت کے بعد، انہیں مطابقت کے لحاظ سے دوبارہ ترتیب دیں تاکہ سب سے مفید نتیجہ پہلے ظاہر ہو: ابتدائی تلاش کے بعد ایک معیاری فلٹر۔

‏Chunking / Chunk

ایک بڑی دستاویز کو چھوٹے چھوٹے ٹکڑوں میں توڑنا تاکہ انہیں انفرادی طور پر ذخیرہ اور تلاش کیا جا سکے۔

🔹 مثال: 200 صفحات پر مشتمل HR دستی کو پیراگراف کے سائز کے حصوں میں تقسیم کیا گیا ہے۔ جب کوئی چھٹی کی پالیسی کے بارے میں پوچھتا ہے، تو نظام صرف 3-4 سب سے زیادہ متعلقہ پیراگراف کو بازیافت کرتا ہے، نہ کہ پورا مینوئل۔

‏Knowledge Base

معلومات کا ایک منظم مجموعہ (دستاویزات، عمومی سوالنامہ، دستورالعمل، پالیسیاں) جسے AI تلاش اور حوالہ دے سکتا ہے۔

🔹 مثال: ایک کمپنی کی اندرونی ویکی جس میں پروڈکٹ کے دستاویزات، HR پالیسیاں، اور تربیتی مواد شامل ہیں، اس طرح تشکیل دیا گیا ہے کہ ایک اے آئی ایجنٹ فوری طور پر جوابات تلاش کر سکے۔

‏Grounding Data

‏AI ماڈل سے منسلک مخصوص حقائق پر مبنی اعداد و شمار فریب سے لگائے گئے اندازوں کے بجائے درست، حقیقت پر مبنی ردعمل کو یقینی بنانے کے لیے۔

‏MCP (ماڈل سیاق و سباق پروٹوکول)

ایک کھلا معیار (انتھروپک کے ذریعے تخلیق کیا گیا، جو اب لینکس فاؤنڈیشن کے زیر انتظام ہے) جو کسی بھی اے آئی ایجنٹ کو یونیورسل پروٹوکول کا استعمال کرتے ہوئے کسی بھی بیرونی ٹول سے منسلک ہونے دیتا ہے: تلاش، ڈیٹا بیس، ای میل، کیلنڈر، فائل سسٹم۔ MCP ایجنٹوں کو کال کرنے والے ٹولز کا پروٹوکول ہے۔ علیحدہ پروٹوکول فیملی کے لیے جو ان ٹولز کی ادائیگی کرنے والے ایجنٹوں کو سنبھالتا ہے، سیکشن 11 دیکھیں: ACP، AP2، x402، اور MPP۔

💡 تشبیہ: USB سے پہلے، ہر فون کا چارجر مختلف ہوتا تھا۔ یو ایس بی یونیورسل کنیکٹر بن گیا۔ MCP اے آئی ایجنٹس کے لیے "USB سٹینڈرڈ" ہے: ایک پروٹوکول جو کسی بھی ایجنٹ کو کسی بھی ٹول میں پلگ کرنے دیتا ہے۔ ایک بار اپنا ایجنٹ بنائیں، اسے ہر چیز سے جوڑیں۔

MCP: ایک protocol جو آپ کے ایجنٹ کو ہر ٹول سے جوڑتا ہے

‏Connector

‏MCP یا کسی دوسرے پروٹوکول کے ذریعے اے آئی ایجنٹ کو کسی بیرونی سروس سے جوڑنے والا ایک مخصوص integration۔

🔹 مثال: ایک "Gmail کنیکٹر" ایک اے آئی ایجنٹ کو ای میلز پڑھنے، تلاش کرنے اور بھیجنے دیتا ہے۔ ایک "گوگل ڈرائیو کنیکٹر" اسے دستاویزات کو پڑھنے اور تخلیق کرنے دیتا ہے۔

نظام Integration

مختلف سافٹ ویئر سسٹمز کو جوڑنا تاکہ وہ ڈیٹا کا اشتراک کریں اور بغیر کسی رکاوٹ کے ایک ساتھ کام کریں: کسی بھی انٹرپرائز ایجنٹ کی تعیناتی کے پیچھے "پلمبنگ"۔

🔹 مثال: آپ کے Digital FTE کو Salesforce سے کسٹمر ڈیٹا پڑھنے، SAP میں انوینٹری چیک کرنے، JazzCash کے ذریعے ادائیگیوں پر کارروائی کرنے اور ای میل کے ذریعے تصدیقات بھیجنے کی ضرورت ہے۔ سسٹم انٹیگریشن چاروں سسٹم کو جوڑتا ہے تاکہ ایجنٹ ایک ہی ورک فلو میں ان پر کام کر سکے۔


‏5. ایجنٹی AI تصورات

اس کتاب کا دل: AI نظام جو نہ صرف سوالات کے جوابات دیتے ہیں بلکہ کارروائی کرتے ہیں۔

ایجنٹ (یا اے آئی ایجنٹ)

ایک AI نظام جو ہر قدم پر انسان کی رہنمائی کیے بغیر اپنے ماحول کو آزادانہ طور پر دیکھ سکتا ہے، فیصلے کر سکتا ہے، اور مقصد حاصل کرنے کے لیے اقدامات کر سکتا ہے۔

🔹 مثال: چیٹ بوٹ صرف سوالات کے جوابات دیتا ہے۔ ایک اے آئی ایجنٹ کو ایک ہدف ملتا ہے جیسے کہ "مجھے اگلے جمعہ کو کراچی سے دبئی کی سب سے سستی پرواز تلاش کریں" اور پھر ایئر لائنز کو تلاش کرتا ہے، قیمتوں کا موازنہ کرتا ہے، آپ کا کیلنڈر چیک کرتا ہے، اور ٹکٹ بک کرتا ہے، یہ سب کچھ خود ہی کرتا ہے۔

💡 تشبیہ: چیٹ بوٹ ایک لائبریرین ہوتا ہے جو میز کے پیچھے سے سوالات کا جواب دیتا ہے۔ ایک ایجنٹ ایک پرسنل اسسٹنٹ ہوتا ہے جو آپ کی درخواست لیتا ہے اور کام کرنے کے لیے دنیا میں جاتا ہے۔

چیٹ بوٹ بمقابلہ ایجنٹ: ایک جواب دیتا ہے، دوسرا عمل کرتا ہے

ایجنٹک AI

‏AI کا وہ زمرہ جو ایسے ایجنٹس بنانے پر مرکوز ہے جو خودمختاری سے منصوبہ بندی، استدلال، عمل، اور موافقت کرتے ہیں۔ یہ 2026 میں AI کا فرنٹیئر ہے۔

‏General ایجنٹ

وسیع پیمانے پر کاموں کے لیے قدرتی زبان کے ذریعے استعمال ہونے والا اے آئی ایجنٹ۔ یہ ایک مخصوص کام کے لیے نہیں بنایا گیا ہے۔ یہ ایک ورسٹائل "سوئس آرمی چاقو" ہے جو کوڈنگ، تحریر، تحقیق، فائل مینجمنٹ اور بہت کچھ میں مدد کر سکتا ہے۔

🔹 مثال: کلاڈ کوڈ ایک عام ایجنٹ ہے: آپ اسے فائلوں کو منظم کرنے، API لکھنے، اسپریڈشیٹ کا تجزیہ کرنے، یا Python کی غلطی کو ڈیبگ کرنے کے لیے کہہ سکتے ہیں۔ یہ قدرتی زبان کی ہدایات کا استعمال کرتے ہوئے، آپ کی ضرورت کے مطابق ڈھال لیتا ہے۔

💡 تشبیہ: ایک عام ایجنٹ ایک انتہائی قابل ایگزیکٹو اسسٹنٹ کی طرح ہوتا ہے۔ آپ انہیں ایک کام کے لیے نہیں رکھتے۔ آپ انہیں ہر روز مختلف اسائنمنٹ دیتے ہیں، اور وہ یہ جان لیتے ہیں کہ ہر ایک کو کیسے انجام دیا جائے۔

‏Autonomy

وہ ڈگری جس تک ایک اے آئی ایجنٹ ہر قدم پر انسانی منظوری کے بغیر آزادانہ طور پر کام کر سکتا ہے۔

💡 تشبیہ: ایک جونیئر ملازم جس کو ہر ای میل کے لیے اجازت درکار ہوتی ہے اس کی خودمختاری کم ہوتی ہے۔ ایک سینئر ڈائریکٹر جو آزادانہ طور پر فیصلے کرتا ہے اسے اعلی خود مختاری حاصل ہوتی ہے۔ ایجنٹ اسی سپیکٹرم پر موجود ہیں: کچھ کو ہر عمل کے لیے انسانی منظوری کی ضرورت ہوتی ہے۔ دوسرے متعین حدود کے اندر مکمل آزادی کے ساتھ کام کرتے ہیں۔

‏Reasoning

ایک ایجنٹ کی کسی مسئلے کے بارے میں منطقی طور پر سوچنے کی صلاحیت: معلومات کا تجزیہ کرنا، اختیارات کا وزن کرنا، اور کام کرنے سے پہلے نتائج اخذ کرنا۔

🔹 مثال: آپ کسی ایجنٹ سے پوچھتے ہیں: "کیا ہمیں پہلے لاہور یا اسلام آباد میں لانچ کرنی چاہیے؟" ایک بے استدلال ایجنٹ صرف ایک کا انتخاب کر سکتا ہے۔ ایک استدلال ایجنٹ تجزیہ کرتا ہے: "لاہور کی آبادی 2x ہے، لیکن اسلام آباد کی فی کس آمدنی زیادہ ہے۔ آپ کی پروڈکٹ پیشہ ور افراد کو نشانہ بناتی ہے، اس لیے اسلام آباد کی آبادیات بہتر فٹ ہیں۔ میں پہلے اسلام آباد کی سفارش کرتا ہوں، پھر مہینے 3 میں لاہور۔"

‏Acting

جب کوئی ایجنٹ حقیقت میں حقیقی دنیا میں کچھ کرتا ہے: ای میل بھیجنا، فائل لکھنا، API سے کوئری کرنا، آرڈر دینا، ملاقات کا وقت بک کرنا۔

‏Planning

ایک ایجنٹ کی ایک پیچیدہ مقصد کو مراحل کی ترتیب میں توڑنے اور ان پر عمل کرنے کے حکم کا تعین کرنے کی صلاحیت۔

🔹 مثال: آپ ایک ایجنٹ سے کہتے ہیں: "پاکستانی سیمنٹ کی برآمدات پر مارکیٹ تجزیہ رپورٹ تیار کریں۔" ایجنٹ کا منصوبہ ہے: (1) برآمدی ڈیٹا کی تلاش، (2) حریف کی معلومات جمع کریں، (3) رجحانات کا تجزیہ کریں، (4) رپورٹ لکھیں، (5) فارمیٹ کریں اور PDF کے طور پر برآمد کریں۔

‏Task Decomposition (کام کی تقسیم)

ایک بڑے، پیچیدہ کام کو چھوٹے، قابل انتظام ذیلی کاموں میں توڑنا جنہیں انفرادی طور پر حل کیا جا سکتا ہے۔

💡 تشبیہ: "شادی کا منصوبہ بنائیں" ایک کام کے طور پر بہت بڑا ہے۔ ٹکڑوں میں توڑیں: ایک مقام تلاش کریں، کیٹرر کا انتخاب کریں، دعوت نامے ڈیزائن کریں، پھولوں کا بندوبست کریں، فوٹوگرافر کی بھرتی کریں۔ ہر ذیلی کام قابل حل ہے۔ اے آئی ایجنٹس پیچیدہ اہداف کو اسی طرح تحلیل کرتے ہیں۔

ہم آہنگی

ایک ساتھ کام کرنے کے لیے متعدد ایجنٹوں یا ٹولز کو مربوط کرنا، ان کے درمیان معلومات کے بہاؤ کا انتظام کرنا۔

💡 تشبیہ: کرکٹ ٹیم کا کپتان ایک ساتھ بولنگ، بیٹنگ اور فیلڈنگ نہیں کرتا۔ وہ فیلڈرز کو پوزیشن دیتے ہیں، باؤلنگ کی گردش طے کرتے ہیں، اور میچ کی صورتحال کی بنیاد پر حکمت عملی کو ایڈجسٹ کرتے ہیں۔ ایجنٹ آرکیسٹریشن اسی طرح کام کرتا ہے: ایک مشترکہ مقصد کی طرف ماہرین کو مربوط کرنا۔

‏Multi-ایجنٹ نظام

ایک ایسا نظام جہاں ایک سے زیادہ اے آئی ایجنٹس تعاون کرتے ہیں (ہر ایک کام کے مختلف حصوں کو سنبھالتا ہے) کچھ ایسا کرنے کے لیے جسے کوئی اکیلا نہیں کر سکتا۔

🔹 مثال: ایک ایجنٹ مسابقتی قیمتوں کی تحقیق کرتا ہے، دوسرا تجزیہ کا مسودہ تیار کرتا ہے، تیسرا سلائیڈز کو فارمیٹ کرتا ہے، اور چوتھا اسپیکر نوٹس تیار کرتا ہے۔ وہ ایک ٹیم کے طور پر کام کرتے ہیں۔

ملٹی ایجنٹ سسٹم: specialist ایجنٹس باہم کام کرتے ہوئے

‏Supervisor ایجنٹ

ایک ایجنٹ جس کا کام دوسرے ایجنٹوں کو مربوط اور منظم کرنا ہے: کاموں کی تقسیم، پیشرفت کی نگرانی، اور نتائج جمع کرنا۔

💡 تشبیہ: تعمیراتی سائٹ کا فورمین۔ وہ اینٹ یا تار کی دکانیں نہیں بچھاتے ہیں۔ وہ ہر کام کے لیے ماہرین کو تفویض کرتے ہیں، معیار کی جانچ کرتے ہیں، اور اس بات کو یقینی بناتے ہیں کہ سب کچھ صحیح طریقے سے آتا ہے۔

‏Handoff

جب ایک ایجنٹ ایک کام (اور اس کا سیاق و سباق) دوسرے ایجنٹ کو دیتا ہے، جیسے ریلے رنر دوسرے کو لاٹھی منتقل کرتا ہے۔

ٹول استعمال / Function Calling

ایجنٹ کی صرف میموری سے ٹیکسٹ بنانے کی بجائے بیرونی ٹولز (ویب پر تلاش کرنا، ڈیٹا بیس سے کوئری کرنا، ای میلز بھیجنا، کوڈ چلانا) استعمال کرنے کی صلاحیت۔

💡 تشبیہ: ایک شخص جو صرف میموری سے سوالات کا جواب دے رہا ہے بمقابلہ وہ شخص جو فون اٹھا سکتا ہے، لیپ ٹاپ کھول سکتا ہے اور چیزوں کو دیکھ سکتا ہے۔ ٹول استعمال ایجنٹ کو اس کے تربیتی ڈیٹا سے باہر کی دنیا تک رسائی فراہم کرتا ہے۔

‏State

کسی بھی وقت کسی سسٹم کی موجودہ حالت یا ڈیٹا۔ «حالت کو برقرار رکھنے» کا مطلب ہے یاد رکھنا کہ چیزیں ایک جاری عمل میں کہاں کھڑی ہیں۔

🔹 مثال: آپ 10 صفحات کا نادرا فارم آن لائن بھر رہے ہیں اور آپ صفحہ 7 پر ہیں۔ «حالت» میں وہ سب کچھ شامل ہے جو آپ نے صفحہ 1-6 پر درج کیا ہے اور اس کے علاوہ آپ اس وقت کس صفحہ پر ہیں۔

‏Memory (ایجنٹ Memory)

وہ طریقہ کار جو ایجنٹ کو تمام تعاملات میں معلومات کو یاد رکھنے دیتے ہیں: پچھلی بات چیت، صارف کی ترجیحات، یا سیکھے گئے حقائق۔

💡 تشبیہ: حالت مختصر مدت کی یادداشت ہے (ابھی اس گفتگو میں کیا ہو رہا ہے)۔ یادداشت طویل مدتی میموری ہے (ماضی کی گفتگو میں کیا ہوا)۔ یادداشت کے بغیر، ہر تعامل صفر سے شروع ہوتا ہے۔

‏Session

صارف اور اے آئی سسٹم کے درمیان ایک ہی مسلسل تعامل۔ نئی چیٹ شروع کرنا = ایک نیا سیشن شروع کرنا۔

‏Reflection

جب کوئی ایجنٹ اپنے آؤٹ پٹ کا جائزہ لیتا ہے، غلطیوں یا کمزوریوں کی نشاندہی کرتا ہے، اور بہتری کے ساتھ دوبارہ کوشش کرتا ہے۔

💡 تشبیہ: ایک مصنف جو مسودہ ختم کرتا ہے، اسے دوبارہ پڑھتا ہے، کمزور دلائل کو نوٹ کرتا ہے، اور جمع کرانے سے پہلے نظر ثانی کرتا ہے۔ ایجنٹ یہ خود بخود کرتا ہے۔

‏Retry / Fallback

دوبارہ کوشش کریں: ناکام ہونے پر دوبارہ اسی کارروائی کی کوشش کرنا (شاید سرور عارضی طور پر دستیاب نہ ہو)۔ فال بیک: جب پرائمری ناکام ہوتی رہتی ہے تو متبادل نقطہ نظر کی طرف جانا۔

🔹 مثال: ایجنٹ ویب سائٹ سے ڈیٹا حاصل کرنے کی کوشش کرتا ہے۔ سائٹ بند ہے (دوبارہ کوشش کریں: 30 سیکنڈ میں دوبارہ کوشش کریں)۔ 3 دوبارہ کوششوں کے بعد بھی نیچے (فال بیک: اسی معلومات کے لیے ایک مختلف ڈیٹا سورس آزمائیں)۔

حفاظتی حدود

حفاظتی پابندیاں جو ایجنٹ کو نقصان دہ، نامناسب، یا غیر مجاز اقدامات سے روکتی ہیں۔ حفاظتی حدود کا مالی ورژن، یعنی اخراجات کی حدیں، وینڈر کی اجازت یافتہ فہرستیں، اور آڈٹ ٹرگرز، اختیار کا لفافہ (authority envelope) کہلاتا ہے۔ سیکشن 11 دیکھیں۔

🔹 مثال: ایک مالیاتی ایجنٹ کی ایک حفاظتی حد یہ ہو سکتی ہے کہ وہ انسانی منظوری کے بغیر 5,000,000 روپے سے زیادہ کا کوئی لین دین نہ کرے۔ ایک کسٹمر سروس ایجنٹ کی حفاظتی حد اسے ایسے ریفنڈ کے وعدے کرنے سے روکتی ہے جن کی وہ ضمانت نہیں دے سکتا۔

💡 تشبیہ: موٹر وے پر گارڈریل کاروں کو سڑک سے دور جانے سے روکتے ہیں۔ AI حفاظتی حدود ایجنٹوں کو حدود سے باہر جانے سے روکتے ہیں۔

‏HITL (Human in the Loop)

ایک ڈیزائن کا نمونہ جہاں ایک انسان ایجنٹ کے ورک فلو میں اہم نکات پر جائزہ لیتا ہے، منظوری دیتا ہے یا مداخلت کرتا ہے۔

🔹 مثال: ایک ایجنٹ کلائنٹ کے ای میل کا مسودہ تیار کرتا ہے، لیکن اسے اس وقت تک نہیں بھیجا جاتا جب تک کہ کوئی انسان اسے پڑھ کر اس کی منظوری نہ دے دے۔ ایجنٹ 80% کام کرتا ہے۔ انسان 10 فیصد تصدیق فراہم کرتا ہے۔

‏Reliability

ایک ایجنٹ کس طرح مستقل طور پر درست، متوقع نتائج پیدا کرتا ہے۔ ایک قابل اعتماد ایجنٹ اسے 100 میں سے 99 بار درست کرتا ہے، 60 بار نہیں۔

🔹 مثال: ایک قابل اعتماد انوائس پروسیسنگ ایجنٹ مختلف فارمیٹس، زبانوں اور لے آؤٹس میں 99% انوائسز سے وینڈر کا نام، رقم، مقررہ تاریخ اور ٹیکس درست طریقے سے نکالتا ہے۔ ایک ناقابل اعتماد شخص غیر معمولی ترتیب سے الجھ جاتا ہے اور وقت کا 20% غلط پڑھتا ہے۔ قابل فروخت مصنوعات اور ذمہ داری کے درمیان فرق۔

‏Verifiability

چیک کرنے اور اس بات کی تصدیق کرنے کی صلاحیت کہ ایجنٹ کا آؤٹ پٹ درست ہے، کہ اس کا کوڈ ٹیسٹ پاس کرتا ہے، اس کی تعداد میں اضافہ ہوتا ہے، اس کے حوالہ جات موجود ہیں۔

‏Auditability

ایجنٹ کے ہر فیصلے اور کارروائی کے بارے میں پتہ لگانے کی صلاحیت، یہ سمجھتے ہوئے کہ اس نے کیا کیا اور کیوں کیا۔

💡 تشبیہ: ایک بینک اسٹیٹمنٹ ہر لین دین کا پتہ لگاتا ہے۔ اے آئی ایجنٹ کے لیے ایک آڈٹ ٹریل ہر فیصلے، ٹول کال، اور آؤٹ پٹ کو ٹریس کرتا ہے، جو تعمیل اور ڈیبگنگ کے لیے اہم ہیں۔

‏Workflow

ایک ایجنٹ شروع سے ختم ہونے تک کسی کام کو مکمل کرنے کے لیے اقدامات کا ایک متعین سلسلہ۔

💡 تشبیہ: ایک ورک فلو ایک نسخہ کی طرح ہوتا ہے: مرحلہ وار ہدایات جن پر صحیح طریقے سے عمل کیا جائے تو ایک متوقع نتیجہ نکلتا ہے۔


‏6. پروگرامنگ اور سافٹ ویئر کی شرائط

آپ کو پروگرامر بننے کی ضرورت نہیں ہے، لیکن آپ کو ان کا سامنا کرنا پڑے گا۔

‏Python

‏AI میں سب سے زیادہ مقبول پروگرامنگ زبان: پڑھنے کے قابل، ورسٹائل، اور اس کتاب میں بنیادی زبان۔ تقریبا ہر AI فریم ورک پہلے Python کو سپورٹ کرتا ہے۔

💡 Python کیوں؟ Python تقریبا انگریزی کی طرح پڑھتا ہے۔ if age > 18: print("Adult") قابل فہم ہے چاہے آپ نے کبھی کوڈ نہ کیا ہو۔ یہ پڑھنے کی اہلیت یہ ہے کہ AI دنیا نے Python کا انتخاب کیوں کیا، اور یہ کتاب اسے کیوں سکھاتی ہے۔ شروع کرنے سے پہلے آپ کو Python جاننے کی ضرورت نہیں ہے۔ حصہ 4 آپ کو شروع سے سکھاتا ہے۔

‏TypeScript

جاوا اسکرپٹ کا ٹائپ شدہ سپر سیٹ جو ویب ایپلی کیشنز اور ریئل ٹائم انٹرفیس کے لیے استعمال ہوتا ہے۔ اس کتاب کے حصہ 9 میں شامل ہے۔

‏Frontend

ایپلی کیشن کا وہ حصہ جسے صارفین دیکھتے اور ان کے ساتھ تعامل کرتے ہیں: بٹن، مینیو، ٹیکسٹ، اسکرین پر تصاویر۔

🔹 مثال: جب آپ Daraz.pk استعمال کرتے ہیں تو پروڈکٹ کی تصاویر، سرچ بار، شاپنگ کارٹ، اور چیک آؤٹ پیج فرنٹ اینڈ ہوتے ہیں۔

فرنٹ اینڈ بمقابلہ بیک اینڈ: صارفین کیا دیکھتے ہیں اور پس منظر میں کیا چلتا ہے

‏Backend

پردے کے پیچھے چلنے والا حصہ (سرور، ڈیٹا بیس، کاروباری منطق) جسے صارفین کبھی براہ راست نہیں دیکھتے۔

🔹 مثال: جب آپ Daraz پر "Place Order" پر کلک کرتے ہیں، تو بیک اینڈ آپ کی ادائیگی پر کارروائی کرتا ہے، انوینٹری چیک کرتا ہے، بیچنے والے کو مطلع کرتا ہے، اور ڈیلیوری کا شیڈول بناتا ہے۔

‏Full-اسٹیک

ایک ڈویلپر یا ایپلی کیشن جو فرنٹ اینڈ اور بیک اینڈ دونوں کو ہینڈل کرتی ہے۔

‏API (ایپلی کیشن پروگرامنگ انٹرفیس)

مختلف سافٹ ویئر پروگراموں کو ایک دوسرے کے ساتھ بات چیت کرنے کی اجازت دینے والے قواعد کا ایک مجموعہ۔ APIs یہ ہیں کہ ایجنٹ بیرونی دنیا کے ساتھ کیسے تعامل کرتے ہیں۔

💡 تشبیہ: ایک ریستوراں کا مینو API جیسا ہوتا ہے۔ آپ (گاہک) مینو (API دستاویزات) کو دیکھتے ہیں، آرڈر دیتے ہیں (درخواست دیتے ہیں) اور کچن (سرور) آپ کا کھانا تیار کرتا ہے (جواب بھیجتا ہے)۔ آپ کو یہ جاننے کی ضرورت نہیں ہے کہ کچن کیسے کام کرتا ہے۔ آپ صرف مینو کا استعمال کرتے ہیں.

‏SDK (سافٹ ویئر ڈیولپمنٹ کٹ)

ایک مخصوص پلیٹ فارم پر ایپلی کیشنز تیار کرنے کے لیے پہلے سے تیار کردہ ٹول کٹ۔

💡 تشبیہ: SDK ایک LEGO سیٹ کی طرح ہے: ہدایات کے ساتھ پہلے سے شکل والے ٹکڑے تاکہ آپ کچی لکڑی سے ہر ٹکڑے کو تراشنے کے بجائے تیزی سے مخصوص چیزیں بنا سکیں۔

‏CLI (Command-Line انٹرفیس)

بٹنوں پر کلک کرنے کے بجائے کمانڈ ٹائپ کرکے کمپیوٹر کے ساتھ بات چیت کرنے کا متن پر مبنی طریقہ۔

🔹 مثال: فائل کو فولڈر میں گھسیٹنے کے بجائے، آپ mv report.pdf documents/ ٹائپ کریں۔ کلاڈ کوڈ مکمل طور پر CLI کے ذریعے چلتا ہے۔

‏HTTP / HTTPS

ویب کا مواصلاتی پروٹوکول۔ ہر ویب سائٹ کا دورہ، ہر API کال HTTP (یا اس کا محفوظ ورژن، HTTPS) استعمال کرتا ہے۔

💡 تشبیہ: HTTP انٹرنیٹ کا پوسٹل سسٹم ہے۔ آپ کا براؤزر ایک خط (درخواست) لکھتا ہے، اسے ویب سائٹ پر ایڈریس کرتا ہے، اور ویب سائٹ اسی سسٹم کے ذریعے جواب (جواب) واپس بھیجتی ہے۔

‏REST (Representational State Transfer)

ویب APIs کو ڈیزائن کرنے کے لیے ایک وسیع پیمانے پر استعمال کیا جانے والا معیار: سادہ، predictable، اور HTTP پر مبنی۔

‏Endpoint

ایک مخصوص URL جہاں API کو درخواستیں موصول ہوتی ہیں۔ ہر اینڈ پوائنٹ ایک مخصوص فنکشن کو ہینڈل کرتا ہے۔

🔹 مثال: api.weather.com/current?city=Karachi ایک اینڈ پوائنٹ ہے: وہ مخصوص پتہ جہاں آپ کراچی کا موسم پوچھتے ہیں۔

‏Request / Response

درخواست: کلائنٹ کی طرف سے سرور کو ایک پیغام جو کچھ مانگ رہا ہے۔ جواب: سرور کا جواب۔

💡 تشبیہ: آپ ویٹر سے دن کا سوپ مانگتے ہیں (درخواست)۔ ویٹر "حلیم" (جواب) کے ساتھ لوٹتا ہے۔

‏JSON (JavaScript Object Notation)

ڈیٹا کو ذخیرہ کرنے اور تبادلہ کرنے کے لیے ایک ہلکا پھلکا، انسانی پڑھنے کے قابل فارمیٹ۔ AI دنیا میں معیاری ڈیٹا فارمیٹ۔

🔹 مثال:

{
"name": "Ahmed Khan",
"city": "Lahore",
"role": "Software Engineer"
}

ڈیٹا کے ہر ٹکڑے پر واضح لیبل اور قدر ہوتی ہے۔ سافٹ ویئر JSON آسانی سے پڑھتا ہے۔

‏Schema

ڈیٹا کو کس طرح منظم کیا جاتا ہے اس کا ڈھانچہ یا خاکہ: کون سے فیلڈز موجود ہیں، ہر فیلڈ کس قسم کا ہے، اور کون سا مطلوب ہے۔

💡 تشبیہ: ایک خالی نادرا فارم ایک اسکیما ہے: "نام یہاں (متن) جاتا ہے، CNIC یہاں جاتا ہے (نمبر)، تاریخ پیدائش یہاں جاتی ہے (تاریخ)۔ بھرا ہوا فارم ڈیٹا ہے؛ خالی شکل اسکیما ہے۔

‏Validation

جانچنا کہ ڈیٹا متوقع اسکیما سے میل کھاتا ہے: صحیح فارمیٹ، صحیح قسم، کچھ بھی غائب نہیں۔

🔹 مثال: ایک آن لائن فارم جو آپ کی جمع آوری کو مسترد کرتا ہے کیونکہ آپ نے فون نمبر کے خانے میں خطوط ٹائپ کیے ہیں: یہ ایک غلطی پکڑنے کی توثیق ہے۔

‏Library / Package

پہلے سے لکھا ہوا کوڈ دوسروں کے ذریعہ بنایا اور شیئر کیا گیا ہے تاکہ آپ کو شروع سے عام فعالیت لکھنے کی ضرورت نہ ہو۔

🔹 مثال: اپنا ای میل بھیجنے والا کوڈ لکھنے کے بجائے، آپ sendgrid نامی لائبریری استعمال کرتے ہیں جو تمام پیچیدگیوں کو سنبھالتی ہے۔

فریم ورک

لائبریری سے بڑی، زیادہ منظم ٹول کٹ۔ ایک فریم ورک آپ کی درخواست کا آرکیٹیکچر فراہم کرتا ہے اور اس بات کی وضاحت کرتا ہے کہ آپ کا کوڈ کس طرح منظم ہے۔

💡 تشبیہ: ایک لائبریری انفرادی فرنیچر خریدنے کی طرح ہے۔ ایک فریم ورک پہلے سے بنایا ہوا گھر خریدنے جیسا ہے جہاں آپ کمروں کو اپنی مرضی کے مطابق بناتے ہیں۔ FastAPI ایک فریم ورک ہے۔ ایک JSON پارسنگ ٹول ایک لائبریری ہے۔

‏Dependency

ایک بیرونی لائبریری جو آپ کے پروجیکٹ کو کام کرنے کی ضرورت ہے۔

🔹 مثال: آپ کا پروجیکٹ FastAPI استعمال کرتا ہے، اور FastAPI کو Starlette نامی لائبریری کی ضرورت ہے۔ سٹارلیٹ ایک انحصار ہے: آپ کا پروجیکٹ بالواسطہ اس پر منحصر ہے۔

‏Repo (Repository)

‏Git کے ذریعے ٹریک کردہ ایک پروجیکٹ فولڈر جس میں تمام کوڈ، فائلیں، اور تبدیلیوں کی مکمل تاریخ ہے۔

‏Git

ایک ورژن کنٹرول سسٹم جو آپ کے کوڈ میں ہر تبدیلی کو ریکارڈ کرتا ہے: کس نے کیا، کب، اور کیوں تبدیل کیا۔ آپ ہمیشہ کسی بھی پچھلے ورژن پر واپس جا سکتے ہیں۔

💡 تشبیہ: Git Microsoft ورڈ میں "ٹریک چینجز" کی طرح ہے، لیکن پورے سافٹ ویئر پروجیکٹس کے لیے۔ ہر ترمیم ریکارڈ کی جاتی ہے۔ ہر ورژن قابل بازیافت ہے۔ ٹیم کے تعاون کے لیے ضروری ہے۔

‏GitHub

‏Git ذخیروں کی میزبانی کے لیے کلاؤڈ پلیٹ فارم: دنیا کا سب سے بڑا کوڈ شیئرنگ پلیٹ فارم جہاں ڈویلپرز تعاون کرتے ہیں۔

‏Environment Variable / .env

آپ کے کوڈ کے باہر ذخیرہ کردہ ایک ترتیب ( .env نامی فائل میں) جس میں پاس ورڈز اور API کیز جیسی حساس معلومات شامل ہیں۔

🔹 مثال: آپ کی OpenAI API کلید OPENAI_API_KEY=sk-abc123... کے طور پر .env میں محفوظ ہے لہذا یہ آپ کے عوامی کوڈ میں کبھی ظاہر نہیں ہوتی۔

‏Synchronous

ایک وقت میں ایک ترتیب سے ہونے والے آپریشنز۔ ہر قدم پچھلے ایک کے ختم ہونے کا انتظار کرتا ہے۔

💡 تشبیہ: اسٹور پر ایک ہی چیک آؤٹ کاؤنٹر۔ اگلا شروع ہونے سے پہلے ہر گاہک کو مکمل طور پر پیش کیا جاتا ہے۔ جب قطار ہو تو سادہ لیکن سست۔

‏Asynchronous

آپریشنز جو بیک وقت چل سکتے ہیں۔ پروگرام ایک کام شروع کرتا ہے اور اس کے ختم ہونے کا انتظار کیے بغیر آگے بڑھتا ہے۔

💡 تشبیہ: متعدد چیک آؤٹ کاؤنٹرز ایک ساتھ کھلتے ہیں، نیز ایک سیلف سروس کیوسک۔ صارفین کو متوازی طور پر پیش کیا جاتا ہے۔ مجموعی طور پر بہت تیز: اس طرح جدید اے آئی ایجنٹ متعدد ٹول کالز کو ہینڈل کرتے ہیں۔

‏Event-Driven ڈھانچہ

ایک ایسا سافٹ ویئر ڈیزائن جہاں سسٹم کسی سخت، پہلے سے طے شدہ ترتیب کی پیروی کرنے کے بجائے واقعات (جو کچھ ہوتا ہے) کا جواب دیتا ہے۔

🔹 مثال: دروازے کی گھنٹی ایونٹ سے چلنے والی ہوتی ہے (یہ صرف دبانے پر بجتی ہے۔ آپ ہر 5 منٹ بعد دروازہ نہیں چیک کرتے؛ جب واقعہ ہوتا ہے تو آپ جواب دیتے ہیں۔ اے آئی ایجنٹ اکثر اس طرح کام کرتے ہیں) آنے والے پیغامات، ٹول کے نتائج اور اطلاعات کا جواب دینا۔

‏Variable

کوڈ میں ایک نامزد کنٹینر جو ایک قدر ذخیرہ کرتا ہے۔ price = 500 کا مطلب ہے متغیر price 500 رکھتا ہے۔

‏Function

کوڈ کا دوبارہ قابل استعمال بلاک جو ایک مخصوص کام انجام دیتا ہے: ان پٹ کو قبول کرتا ہے، کام کرتا ہے، آؤٹ پٹ واپس کرتا ہے۔

💡 تشبیہ: ایک فنکشن روٹی بنانے والی مشین کی طرح ہے۔ آپ آٹا (ان پٹ) ڈالتے ہیں، مشین اپنا کام کرتی ہے، اور روٹی (آؤٹ پٹ) نکلتی ہے۔ آپ ایک ہی مشین کو ہزاروں بار استعمال کر سکتے ہیں۔

‏Type Annotation

یہ بتانا کہ متغیر یا فنکشن کس قسم کے ڈیٹا کی توقع رکھتا ہے: متن، نمبر، فہرست، وغیرہ۔

🔹 مثال: age: int = 25 پروگرام اور دوسرے ڈویلپرز دونوں کو بتاتا ہے: "عمر ہمیشہ مکمل نمبر ہونی چاہیے۔"

‏Dataclass

صاف ستھرا، سٹرکچرڈ ڈیٹا کنٹینرز بنانے کے لیے ایک Python خصوصیت، جیسے کہ نامزد فیلڈز کے ساتھ ٹیمپلیٹ۔

🔹 مثال:

@dataclass
class Student:
name: str
age: int
grade: str

اب آپ student = Student("Ahmed", 20, "A") لکھ سکتے ہیں اور ڈیٹا خود بخود منظم، لیبل، اور ٹائپ چیک ہو جاتا ہے۔ تین الگ الگ متغیرات کو ٹریک کرنے سے کہیں زیادہ صاف۔

‏Decorator

ایک Python خصوصیت (@ کے ساتھ لکھی گئی) جو کسی فنکشن یا کلاس کے کوڈ کو تبدیل کیے بغیر فعالیت میں اضافہ کرتی ہے۔ @dataclass اوپر کی مثال میں ڈیکوریٹر ہے۔

‏Syntax

پروگرامنگ لینگویج کے گرامر کے اصول: کمپیوٹر کو سمجھنے کے لیے کوڈ کو کس طرح تشکیل دیا جانا چاہیے۔

‏Boilerplate

بار بار، معیاری کوڈ سیٹ اپ کے لیے درکار ہے جس میں آپ کی انوکھی منطق شامل نہیں ہے۔

💡 تشبیہ: ایک رسمی خط کا "پیارے Sir/Madam" افتتاحی اور "آپ کا مخلص" اختتام۔ ضروری لیکن دلچسپ حصہ نہیں۔

‏Linter

ایک ٹول جو غلطیوں، طرز کی خلاف ورزیوں، اور ممکنہ کیڑوں کے لیے کوڈ کو چیک کرتا ہے، جیسے کوڈ کے لیے گرامر چیکر۔

🔹 مثال: آپ x=1+2 لکھتے ہیں (آپریٹرز کے ارد گرد کوئی جگہ نہیں ہے)۔ لنٹر اسے جھنڈا لگاتا ہے اور تجویز کرتا ہے x = 1 + 2: مزید پڑھنے کے قابل۔ یہ اصلی کیڑے بھی پکڑتا ہے، جیسے متغیر کا استعمال اس کی وضاحت کرنے سے پہلے۔ ruff اس کتاب میں استعمال ہونے والا لنٹر ہے۔

‏Debugging

کوڈ میں غلطیوں (بگز) کو ڈھونڈنا اور ٹھیک کرنا۔

‏Refactoring

موجودہ کوڈ کی تشکیل نو کرنا تاکہ یہ جو کچھ کرتا ہے اسے تبدیل کیے بغیر اسے صاف ستھرا یا زیادہ موثر بنایا جائے۔

💡 تشبیہ: اپنی الماری کو دوبارہ ترتیب دینا۔ ایک جیسے کپڑے، لیکن اب موسم اور قسم کے لحاظ سے ترتیب دیے گئے ہیں: اپنی ضرورت کو تلاش کرنا آسان ہے۔

‏pytest

‏Python کا سب سے مشہور ٹیسٹنگ فریم ورک۔ آپ ٹیسٹ کیس لکھتے ہیں جس میں بیان کیا جاتا ہے کہ کوڈ کو کیا کرنا چاہیے، اور pytest اس بات کی تصدیق کرتا ہے کہ یہ واقعتا ایسا کرتا ہے۔

🔹 مثال: آپ ٹیسٹ لکھتے ہیں: assert calculate_gst(1000) == 180۔ یہ کہتا ہے "جب میں 1,000 روپے پر GST کا حساب لگاتا ہوں تو جواب 180 روپے ہونا چاہیے۔" اگر آپ کا کوڈ 170 لوٹاتا ہے، تو pytest آپ کو بتاتا ہے کہ ٹیسٹ ناکام ہو گیا ہے: صارفین تک پہنچنے سے پہلے بگ کو پکڑنا۔

‏pyright

‏A Python ٹائپ چیکر: اس بات کو یقینی بناتا ہے کہ آپ غلطی سے متن کو منتقل نہیں کر رہے ہیں جہاں ایک نمبر کی توقع کی جاتی ہے، غلطیوں کو پکڑنے سے پہلے ان سے مسائل پیدا ہوتے ہیں۔

🔹 مثال: آپ کا فنکشن age: int کی توقع رکھتا ہے لیکن آپ کے کوڈ میں کہیں آپ غلطی سے "twenty-five" (متن) کو پاس کر دیتے ہیں۔ Pyright اس مماثلت کو فوری طور پر پکڑ لیتا ہے، اس سے پہلے کہ آپ پروگرام کو چلائیں۔

‏ruff

ایک بہت تیز Python لنٹر اور فارمیٹر جو مستقل کوڈ اسٹائل کو نافذ کرتا ہے اور عام غلطیوں کو پکڑتا ہے۔ اسے اپنے Python کوڈ کے لیے گرائمر چیک کرنے والے اور اسٹائل گائیڈ نافذ کرنے والے کے طور پر سوچیں۔

‏uv

ایک جدید، تیز رفتار Python پیکیج مینیجر پراجیکٹ کے انحصار کو انسٹال کرنے اور ان کا انتظام کرنے کے لیے۔ پرانے ٹولز کی جگہ لے لیتا ہے جیسے پراجیکٹ مینجمنٹ کے لیے پائپ: اکثر 10-100x تیز۔

‏pip

‏Python کا روایتی، بلٹ ان پیکیج انسٹالر۔ pip install requests انٹرنیٹ سے requests لائبریری کو ڈاؤن لوڈ کرتا ہے اور اسے آپ کے کمپیوٹر پر انسٹال کرتا ہے۔


‏7. ڈیٹا اور ڈیٹا بیس کی شرائط

‏Database

الیکٹرانک طور پر ذخیرہ شدہ ڈیٹا کا ایک منظم مجموعہ: آسانی سے تلاش کرنے، اپ ڈیٹ کرنے اور منظم کرنے کے لیے ڈیزائن کیا گیا ہے۔

💡 تشبیہ: ایک وسیع، مکمل طور پر منظم فائلنگ کابینہ۔ ہر دراز (ٹیبل) میں ایک قسم کا ریکارڈ ہوتا ہے۔ ہر فولڈر ( قطار) ایک ریکارڈ ہے۔ ہر کاغذ کے اندر (کالم) ڈیٹا کا ایک ٹکڑا ہے۔

‏SQL (Structured Query Language)

ڈیٹا بیس کے ساتھ بات چیت کے لیے معیاری زبان: سوالات پوچھنا، ریکارڈز شامل کرنا، ڈیٹا کو اپ ڈیٹ کرنا۔

🔹 مثال: SELECT name, phone FROM customers WHERE city = 'Karachi' ڈیٹا بیس سے پوچھتا ہے: "مجھے کراچی میں ہر گاہک کا نام اور فون دیں۔"

‏Table / Row / Column

ٹیبل: قطاروں اور کالموں میں متعلقہ ڈیٹا کا مجموعہ (جیسے اسپریڈشیٹ)۔ قطار: ایک مکمل ریکارڈ (ایک گاہک، ایک آرڈر)۔ کالم: تمام ریکارڈز میں ایک فیلڈ (نام، ای میل، فون)۔

🔹 مثال: "Customers" ٹیبل:

Name (column)City (column)Phone (column)
Ahmed Khan (row 1)Karachi0300-1234567
Sara Ali (row 2)Lahore0321-9876543

اس ٹیبل میں 3 columns اور 2 rows ہیں۔ ہر row ایک کسٹمر ہے۔ ہر column ہر کسٹمر کے بارے میں معلومات کا ایک حصہ ہے۔

‏Query

ڈیٹا بیس سے مخصوص ڈیٹا کی درخواست۔ ہر SQL بیان ایک سوال ہے۔

🔹 مثال: "مجھے کراچی سے پچھلے 7 دنوں میں کیے گئے تمام آرڈرز دکھائیں" ایک انسانی سوال ہے۔ ایس کیو ایل میں: SELECT * FROM orders WHERE city = 'Karachi' AND date > '2026-03-31'۔ ایک ہی درخواست، ایک انگریزی میں، ایک ڈیٹا بیس کی زبان میں۔

‏PostgreSQL

ایک طاقتور، مفت، اوپن سورس ڈیٹا بیس جو پروڈکشن ایپلی کیشنز میں وسیع پیمانے پر استعمال ہوتا ہے، بشمول بہت سے اے آئی ایجنٹ بیک اینڈس۔

‏NoSQL

ڈیٹا بیس جو ڈیٹا کو سخت جدولوں (دستاویزات، کلیدی قدر کے جوڑے، یا گراف) کے علاوہ لچکدار فارمیٹس میں محفوظ کرتے ہیں۔ جب ڈیٹا قطاروں اور کالموں میں صاف طور پر فٹ نہیں ہوتا ہے تو مفید ہے۔

🔹 مثال: MongoDB ڈیٹا کو JSON جیسی دستاویزات کے طور پر اسٹور کرتا ہے۔ ایک "کسٹمر" دستاویز میں مختلف صارفین کے لیے مختلف فیلڈز ہو سکتے ہیں، ایک سخت جدول کے برعکس جہاں ہر قطار میں ایک ہی کالم ہونا چاہیے۔

‏Cache

تیز رفتار بازیافت کے لیے اکثر رسائی شدہ ڈیٹا کی کاپیاں محفوظ کرنے والی ایک تیز رفتار اسٹوریج پرت۔

💡 تشبیہ: اپنے سب سے زیادہ استعمال ہونے والے مصالحوں کو اونچی کیبنٹ میں رکھنے کے بجائے کچن کاؤنٹر پر رکھنا۔ شروع میں ترتیب دینے میں آہستہ، لیکن کھانا پکانے کے وقت بہت تیز۔ ایک کیش رفتار کے لیے ذخیرہ کرنے کی جگہ کی تجارت کرتا ہے۔

‏Queue / Message Broker

ایپلی کیشن کے اجزاء کے درمیان پیغامات کا انتظام کرنے والا ایک نظام، اس بات کو یقینی بناتا ہے کہ کاموں کو قابل اعتماد طریقے سے اور ترتیب سے، یہاں تک کہ بھاری بوجھ میں بھی۔

💡 تشبیہ: نادرا کے مصروف دفتر میں ٹکٹ کا نظام۔ ہر کوئی ایک نمبر لیتا ہے اور ترتیب سے پیش کیا جاتا ہے۔ یہاں تک کہ اگر 50 افراد ایک ساتھ پہنچ جائیں، کوئی بھی نہیں کھوتا: قطار بہاؤ کو منظم کرتی ہے۔

‏Kafka

ایک مقبول اوپن سورس میسج بروکر جو ریئل ٹائم ڈیٹا کے بڑے سلسلے کو سنبھالنے کے لیے ڈیزائن کیا گیا ہے، جو عام طور پر انٹرپرائز AI کی تعیناتیوں میں استعمال ہوتا ہے۔

‏Transaction

ڈیٹا بیس کی کارروائیوں کا ایک سیٹ جو سب کو ایک ساتھ کامیاب ہونا چاہیے یا سب کو ایک ساتھ ناکام ہونا چاہیے، کسی بھی آدھے کام کی اجازت نہیں ہے۔

🔹 مثال: روپے کی منتقلی JazzCash اکاؤنٹس کے درمیان 50,000: اکاؤنٹ A سے کٹوتی کرنا اور اکاؤنٹ B میں شامل کرنا دونوں ہونا چاہیے، یا نہ ہی ہونا چاہیے۔ ایک لین دین اس کی ضمانت دیتا ہے۔

‏Data Pipeline

ڈیٹا کو ذرائع سے منازل تک منتقل کرنے کے اقدامات کا ایک خودکار سلسلہ، راستے میں اسے تبدیل کرتا ہے۔

💡 تشبیہ: گندم کی سپلائی چین: کھیت سے کٹائی (نچوڑ)، چکی میں آٹے (تبدیل)، بیکری تک پہنچانا (لوڈ)۔ ڈیٹا پائپ لائن معلومات کے ساتھ ایسا ہی کرتی ہے۔

‏ETL (Extract, Transform, Load)

معیاری ڈیٹا پائپ لائن پیٹرن: ذرائع سے ڈیٹا نکالیں → ٹرانسفارم اسے (صاف کریں، ری اسٹرکچر کریں، افزودہ کریں) → اسے منزل کے نظام میں لوڈ کریں۔

🔹 مثال: ہر رات، ایک ETL پائپ لائن (1) 50 ریٹیل برانچز سے سیلز ڈیٹا کو نکالتی ہے، (2) تبدیل کرتی ہے (کرنسیوں کو تبدیل کرتی ہے، ڈپلیکیٹس کو ہٹاتی ہے، ٹوٹل کا حساب لگاتی ہے) اور (3) صاف ڈیٹا کو صبح کے ڈیش کے لیے مرکزی ڈیٹا بیس میں لوڈ کرتی ہے۔

‏Persistent Storage

وہ ڈیٹا جو کسی پروگرام کے ختم ہونے یا کمپیوٹر کے دوبارہ شروع ہونے کے بعد زندہ رہتا ہے۔ آپ کی ہارڈ ڈرائیو پر فائلیں مستقل ہیں۔ آپ کے بند ہونے پر RAM میں موجود ڈیٹا غائب ہو جاتا ہے۔

💡 تشبیہ: نوٹ بک میں نوٹ لکھنا (مسلسل؛ وہ کل بھی موجود ہیں) بمقابلہ وائٹ بورڈ پر لکھنا جو ہر شام مٹ جاتا ہے (غیر مستقل)۔ ایجنٹوں کو سیشنوں میں چیزوں کو یاد رکھنے کے لیے مستقل اسٹوریج کی ضرورت ہوتی ہے۔


‏8. کلاؤڈ اور تعیناتی کی شرائط

‏Cloud

سرورز، اسٹوریج، اور سروسز جو آپ کے اپنے کمپیوٹر کے بجائے انٹرنیٹ پر حاصل کی جاتی ہیں۔ "کلاؤڈ" کا مطلب ہے "کسی اور کے کمپیوٹر، جو پیشہ ورانہ طور پر چلائے جاتے ہیں۔"

🔹 مثال: اپنے فون کی بجائے گوگل فوٹوز میں فوٹو اسٹور کرنا۔ اپنے اے آئی ایجنٹ کو اپنے لیپ ٹاپ کی بجائے AWS پر چلانا۔

‏Cloud-Native

کلاؤڈ انفراسٹرکچر پر چلنے کے لیے زمین سے ڈیزائن کردہ ایپلی کیشنز، اسکیل ایبلٹی، لچک، اور منظم خدمات کا فائدہ اٹھانا۔

‏Container

ایک ہلکا پھلکا، الگ تھلگ پیکیج جس میں ایپلی کیشن کو چلانے کے لیے ہر چیز کی ضرورت ہوتی ہے (کوڈ، لائبریریاں، سیٹنگز) لہذا یہ ہر جگہ یکساں طور پر چلتا ہے۔

💡 تشبیہ: ایک شپنگ کنٹینر۔ چاہے وہ کراچی میں ٹرک پر ہو، بحیرہ عرب میں جہاز ہو یا چین میں ٹرین ہو، مواد یکساں اور خود ساختہ ہے۔ سافٹ ویئر کنٹینرز ایک جیسے کام کرتے ہیں: وہ کسی بھی کمپیوٹر پر یکساں طور پر چلتے ہیں۔

‏Docker

کنٹینرز بنانے اور چلانے کا سب سے مشہور ٹول۔ آپ Docker فائل میں اپنی ایپ کی ضروریات کی وضاحت کرتے ہیں، ایک تصویر بناتے ہیں، اور Docker اسے کسی بھی مشین پر یکساں طور پر چلاتے ہیں۔

🔹 مثال: آپ کا اے آئی ایجنٹ آپ کے لیپ ٹاپ پر بالکل ٹھیک چلتا ہے۔ آپ اسے Docker میں ڈالتے ہیں: docker build -t my-agent .docker run my-agent۔ اب یہ آپ کے ساتھی کے لیپ ٹاپ پر، AWS پر، یا Kubernetes کلسٹر پر یکساں چلتا ہے، اور "مگر یہ تو میری مشین پر کام کرتا تھا" والے مسائل ختم۔

ڈاکر: آپ کی ایپ ایک portable container میں جو ہر جگہ چلتی ہے

‏Docker Image

کنٹینرز بنانے کے لیے صرف پڑھنے کے لیے ٹیمپلیٹ۔ تصویر ہدایت ہے؛ چلنے والا کنٹینر پکا ہوا ڈش ہے۔ آپ ایک تصویر سے کئی کنٹینرز بنا سکتے ہیں۔

🔹 مثال: آپ اپنے کسٹمر سروس ایجنٹ کی ایک تصویر بناتے ہیں۔ اس ایک تصویر سے، آپ 10 ایک جیسے کنٹینرز کو گھما سکتے ہیں: ایک ہی ایجنٹ کی 10 کاپیاں بیک وقت چل رہی ہیں، مختلف گاہکوں کو سنبھال رہی ہیں۔

‏Dockerfile

ایک ٹیکسٹ فائل جس میں Docker امیج بنانے کے لیے مرحلہ وار ہدایات شامل ہیں، جیسے کہ ہر اجزاء اور قدم کو درج کرنے والا ایک نسخہ کارڈ۔

‏Kubernetes (K8s)

ہزاروں کنٹینرز کو پیمانے پر منظم کرنے، خود بخود شروع ہونے، روکنے، تقسیم کرنے، اور سرورز پر ان کو ٹھیک کرنے کا نظام۔ "K8s" مخفف ہے (K + 8 حروف + s)۔

💡 تشبیہ: اگر Docker شپنگ کنٹینرز بناتا ہے، تو Kubernetes پورٹ اتھارٹی ہے: ہزاروں کنٹینرز کا انتظام کرنا، یہ فیصلہ کرنا کہ وہ کن جہازوں پر سوار ہوں، اور ہر چیز کی بروقت آمد کو یقینی بنانا۔

‏KEDA

‏Kubernetes Event-driven Autoscaling: ایک ٹول جو آنے والے واقعات (جیسے پیغام کی قطار کی گہرائی) کی بنیاد پر پڈز کو اوپر یا نیچے پیمانہ کرتا ہے، نہ کہ صرف CPU استعمال۔

🔹 مثال: اگر 500 طلباء اچانک رات 9 بجے ٹیوٹر کلاؤ کا استعمال شروع کر دیتے ہیں، تو KEDA پیغام کی قطار میں اضافہ کا پتہ لگاتا ہے اور بوجھ کو سنبھالنے کے لیے خود بخود مزید ایجنٹ پوڈز کو گھما دیتا ہے۔

‏StatefulSets

کنٹینرز کے انتظام کے لیے ایک Kubernetes کی خصوصیت جن کو مستقل شناخت اور مستحکم اسٹوریج کی ضرورت ہوتی ہے، اس کے برعکس اسٹیٹ لیس کنٹینرز جنہیں ایک دوسرے کے ساتھ تبدیل کیا جا سکتا ہے۔

🔹 مثال: ڈیٹا بیس کنٹینر کو اپنے ڈیٹا کو یاد رکھنے کی ضرورت ہوتی ہے یہاں تک کہ اگر یہ دوبارہ شروع ہوتا ہے۔ اسٹیٹفول سیٹ اس بات کو یقینی بناتے ہیں کہ ہر ڈیٹابیس پوڈ اپنی شناخت اور اسٹوریج کو برقرار رکھے۔

‏Pod

‏Kubernetes میں سب سے چھوٹی اکائی: ایک یا زیادہ کنٹینرز ایک ساتھ چل رہے ہیں اور وسائل کا اشتراک کر رہے ہیں۔

💡 تشبیہ: ایک پوڈ ایک مشترکہ دفتر کے کمرے کی طرح ہے۔ اندر موجود کنٹینرز اس کمرے میں کارکن ہیں: وہ ایک ہی میز کی جگہ (نیٹ ورک)، ایڈریس (IP)، اور سامان (اسٹوریج) کا اشتراک کرتے ہیں۔ Kubernetes ایک عمارت (کلسٹر) میں ان ہزاروں کمروں کا انتظام کرتا ہے۔

‏Service (Kubernetes)

ایک مستحکم نیٹ ورک اینڈ پوائنٹ جو ٹریفک کو صحیح پڈز کی طرف لے جاتا ہے، یہاں تک کہ جب پوڈز بنائے اور تباہ ہوتے ہیں۔

‏Ingress

انٹری پوائنٹ بیرونی ویب ٹریفک کو Kubernetes کلسٹر کے اندر درست سروس کی طرف روٹ کرتا ہے۔

💡 تشبیہ: ایک بڑے اسپتال کا استقبالیہ ڈیسک۔ تمام مریض استقبالیہ کے ذریعے داخل ہوتے ہیں، جو انہیں ان کی ضروریات کی بنیاد پر صحیح شعبہ میں لے جاتا ہے۔

ڈیپلائمنٹ

ایک ایپلی کیشن کو حقیقی صارفین کے لیے دستیاب کرانا، اسے اپنے ڈیولپمنٹ کمپیوٹر سے کلاؤڈ سرورز تک دھکیلنا۔

‏Autoscaling

طلب کی بنیاد پر کمپیوٹنگ وسائل کو خود بخود شامل کرنا یا ہٹانا۔

🔹 مثال: عید کی خریداری کے دوران، دراز خودکار طور پر ٹریفک کے اضافے کو سنبھالنے کے لیے مزید سرورز کو گھماتا ہے، پھر اس کے بعد پیچھے کی طرف بڑھ جاتا ہے۔ انسانی مداخلت کی ضرورت نہیں۔

‏Microservice

ایک چھوٹی، آزاد خدمت جو ایک مخصوص فنکشن کو سنبھالتی ہے۔ بہت سی مائیکرو سروسز یکجا ہو کر ایک مکمل ایپلی کیشن بناتی ہیں۔

💡 تشبیہ: ایک بڑے سوئس آرمی چاقو کے بجائے، مائیکرو سروسز خصوصی ٹولز کا ٹول باکس ہیں، ہر ایک ایک کام بہترین طریقے سے کرتا ہے۔

‏Serverless

کلاؤڈ کمپیوٹنگ جہاں فراہم کنندہ تمام بنیادی ڈھانچے کا انتظام کرتا ہے۔ آپ کوڈ لکھتے ہیں؛ یہ چلتا ہے. آپ سرورز، اسکیلنگ یا دیکھ بھال کے بارے میں کبھی نہیں سوچتے۔

💡 تشبیہ: کریم کا استعمال بمقابلہ کار کا مالک ہونا۔ کریم کے ساتھ، آپ دیکھ بھال، انشورنس یا پارکنگ کی فکر نہیں کرتے۔ جب آپ کو ضرورت ہو تو آپ صرف سواری کی درخواست کریں۔ سرور لیس کمپیوٹنگ اسی طرح کام کرتی ہے۔ جب آپ کو ضرورت ہو تو آپ کمپیوٹ استعمال کرتے ہیں۔

‏Dapr

ایک اوپن سورس رن ٹائم عام صلاحیتوں (پیغام رسانی، حالت کا انتظام، راز) کو باکس سے باہر فراہم کرکے مائیکرو سروس کی ترقی کو آسان بناتا ہے۔

💡 تشبیہ: Dapr کے بغیر مائیکرو سروسز بنانا ایک گھر بنانے اور اپنے پلمبنگ پائپ، بجلی کے تاروں اور کھڑکیوں کے شیشے بنانے جیسا ہے۔ Dapr "پہلے سے تیار شدہ پلمبنگ اور وائرنگ" فراہم کرتا ہے تاکہ آپ گھر کے ڈیزائن پر توجہ مرکوز کر سکیں۔

‏Ray

ایک Python ایک سے زیادہ مشینوں میں AI کام کے بوجھ کو پیمانہ کرنے کے لیے فریم ورک: ایک کلسٹر میں تربیت اور تخمینہ کی تقسیم۔

‏IaC (بنیادی ڈھانچہ as Code)

کلاؤڈ پرووائیڈر ڈیش بورڈز کے ذریعے مینوئل سیٹ اپ کے بجائے کنفیگریشن فائلوں کے ذریعے کمپیوٹنگ انفراسٹرکچر کا انتظام کرنا۔

🔹 مثال: سرورز کو ترتیب دینے کے لیے AWS کنسول پر 50 بٹنوں پر کلک کرنے کے بجائے، آپ سیٹ اپ کو بیان کرنے والی ایک Terraform فائل لکھتے ہیں۔ فائل چلائیں، اور سب کچھ خود بخود بن جاتا ہے۔ قابل تکرار قابل جائزہ۔ ورژن کنٹرول شدہ۔

‏Terraform

ایک مشہور IaC ٹول جو آپ کو کوڈ کا استعمال کرتے ہوئے کسی بھی فراہم کنندہ (AWS, Azure, GCP) میں کلاؤڈ انفراسٹرکچر کی وضاحت اور تعینات کرنے دیتا ہے۔

🔹 مثال: AWS کنسول کے ذریعے کلک کرنے میں ایک گھنٹہ گزارنے کے بجائے، آپ 50 لائنوں والی Terraform فائل لکھتے ہیں: "مجھے 3 سرورز، 1 ڈیٹا بیس، اور 1 لوڈ بیلنس کی ضرورت ہے۔" terraform apply چلائیں: ہر چیز منٹوں میں بن جاتی ہے۔ کسی دوسرے علاقے میں اسی سیٹ اپ کی ضرورت ہے؟ اسی فائل کو چلائیں۔ کیا یہ سب کچھ ختم کرنے کی ضرورت ہے؟ terraform destroy۔

‏Cloudflare R2

‏Cloudflare کی آبجیکٹ اسٹوریج سروس: اس کتاب میں ایجنٹ کے علم کی بنیادوں کو ذخیرہ کرنے اور کم تاخیر کے ساتھ عالمی سطح پر مواد پیش کرنے کے لیے استعمال کیا گیا ہے۔

🔹 مثال: ٹیوٹر کلاؤ کا علمی مرکز (اس کتاب کے تمام ابواب، بطور ٹیکسٹ فائل) R2 میں محفوظ ہیں۔ جب پشاور میں ایک طالب علم سوال پوچھتا ہے، تو R2 قریبی کلاؤڈ فلیئر سرور سے متعلقہ مواد پیش کرتا ہے: تیز اور سستا، بغیر کسی اخراج کی فیس کے۔

‏Cloudflare ورکرز

سرور لیس فنکشنز جو Cloudflare کے عالمی نیٹ ورک پر چلتے ہیں، صارفین کے قریب: اس کتاب میں ہلکے API اینڈ پوائنٹس اور ترجمے کی خدمات کے لیے استعمال کیا گیا ہے۔

🔹 مثال: ایک Cloudflare کارکن کتاب کی ویب سائٹ کے لیے ترجمے کی درخواستوں کو سنبھالتا ہے: جب کوئی صارف اردو کا انتخاب کرتا ہے، تو کارکن R2 سے ترجمہ لاتا ہے یا Google Cloud Translation کو فال بیک کے طور پر کال کرتا ہے۔ یہ قریبی کنارے کے سرور سے ملی سیکنڈ میں چلتا ہے۔

‏CI/CD (مسلسل انضمام / مسلسل فراہمی)

‏CI: جب بھی کوئی ڈویلپر کوئی تبدیلی کرتا ہے تو خود بخود کوڈ کی جانچ کرنا۔ CD: خودکار طور پر آزمائشی کوڈ کو پروڈکشن میں تعینات کرنا۔

💡 تشبیہ: CI ایک فیکٹری لائن پر معیار کا معائنہ ہے (ہر پروڈکٹ کو آگے بڑھنے سے پہلے ٹیسٹ کیا جاتا ہے۔ CD خودکار ڈسپیچ ہوتی ہے) ایک بار منظور ہونے کے بعد، پروڈکٹ صارفین کے پاس جاتی ہے بغیر کوئی اسے دستی طور پر کورئیر پر لے جاتا ہے۔

🔹 مثال: ایک ڈویلپر دوپہر 2 بجے GitHub پر کوڈ بھیجتا ہے۔ CI خود بخود 3 منٹ میں 200 ٹیسٹ چلاتا ہے۔ سب پاس۔ سی ڈی خود بخود نئے ورژن کو پروڈکشن میں تعینات کر دیتی ہے۔ صارفین کو 2:10 PM تک اپ ڈیٹ مل جاتا ہے: صفر دستی مراحل۔

CI/CD پائپ لائن: کوڈ تبدیلی سے minutes میں live تک

‏Production

وہ لائیو ماحول جہاں حقیقی صارفین ایپلی کیشن کے ساتھ تعامل کرتے ہیں۔ اگر پروڈکشن میں کچھ ٹوٹ جائے، تو حقیقی گاہک متاثر ہوتے ہیں۔

🔹 مثال: TutorClaw اس وقت WhatsApp پر 16,000 حقیقی طلباء کی خدمت کر رہا ہے: یہ پیداوار ہے۔ آپ اپنے لیپ ٹاپ پر جس ورژن کی جانچ کر رہے ہیں وہ نہیں ہے۔

‏Staging

ایک آزمائشی ماحول جو پروڈکشن کا آئینہ دار ہوتا ہے: اصلی صارفین تک پہنچنے سے پہلے کیڑے پکڑنے کے لیے استعمال کیا جاتا ہے۔

💡 تشبیہ: رات کو کھلنے سے پہلے ڈریس ریہرسل۔ اسٹیج، ملبوسات اور لائٹنگ اصلی شو کی طرح ہے، لیکن سامعین ابھی تک وہاں نہیں ہیں۔ اگر کچھ غلط ہو جاتا ہے، تو آپ کارکردگی سے پہلے اسے ٹھیک کر لیتے ہیں۔

‏Local ڈیولپمنٹ

سافٹ ویئر کو کہیں بھی تعینات کرنے سے پہلے اپنے کمپیوٹر پر چلانا اور جانچنا۔ تیز ترین فیڈ بیک لوپ: کچھ تبدیل کریں اور فوری طور پر نتائج دیکھیں۔

🔹 مثال: http://localhost:8000 پر اپنے FastAPI ایجنٹ کو چلانا اور اس کو اسٹیجنگ یا پروڈکشن کی طرف دھکیلنے سے پہلے نمونے کی درخواستوں کے ساتھ اس کی جانچ کرنا۔

بنیادی ڈھانچہ

بنیادی کمپیوٹنگ وسائل (سرور، نیٹ ورک، اسٹوریج، ڈیٹا بیس) جن پر ایپلی کیشنز چلتی ہیں۔ جیسے شہر کی سڑکیں، پائپ اور برقی گرڈ: رہائشیوں کے لیے پوشیدہ لیکن ہر چیز کے کام کرنے کے لیے ضروری۔

‏Scalability

نظام کی کارکردگی کو گھٹائے بغیر وسائل کا اضافہ کرکے بڑھتے ہوئے کام کے بوجھ کو سنبھالنے کی صلاحیت۔

🔹 مثال: آپ کا ایجنٹ 100 صارفین کو آسانی سے ہینڈل کرتا ہے۔ اچانک 10,000 صارفین پہنچ گئے۔ ایک توسیع پذیر نظام خود بخود زیادہ کمپیوٹنگ طاقت کا اضافہ کرتا ہے اور چلتا رہتا ہے۔ ایک غیر توسیع پذیر نظام بوجھ کے نیچے کریش ہو جاتا ہے۔


‏9. ریئل ٹائم اور وائس ایجنٹ کی شرائط

‏Realtime

کم سے کم تاخیر کے ساتھ ڈیٹا کے آتے ہی اس پر کارروائی اور اس کا جواب دینا: بیچ پروسیسنگ کے برخلاف جہاں ڈیٹا اکٹھا کیا جاتا ہے اور بعد میں اس پر کارروائی کی جاتی ہے۔

‏Streaming

مکمل نتیجہ کا انتظار کرنے کے بجائے ڈیٹا دستیاب ہوتے ہی چھوٹے ٹکڑوں میں مسلسل بھیجنا۔

🔹 مثال: جب Claude کا جواب ایک ہی وقت میں سب کی بجائے لفظ بہ لفظ ظاہر ہوتا ہے، یہ سلسلہ بندی ہے۔ جب آپ پہلے پوری فائل کو ڈاؤن لوڈ کیے بغیر YouTube ویڈیو دیکھتے ہیں، تو یہ سلسلہ بندی ہے۔

‏WebSocket

ایک مواصلاتی پروٹوکول جو کلائنٹ اور سرور کے درمیان مستقل، دو طرفہ کنکشن کو برقرار رکھتا ہے۔ دونوں فریق کسی بھی وقت انتظار کیے بغیر پیغامات بھیج سکتے ہیں۔

💡 تشبیہ: ایک فون کال (ویب ساکٹ) بمقابلہ پوسٹل لیٹرز کا تبادلہ (HTTP)۔ ایک کال پر، دونوں لوگ جب چاہیں بولتے ہیں۔ خطوط کے ساتھ، آپ ایک بھیجیں اور جواب کا انتظار کریں۔

‏SSE (Server-Sent Events)

سرور کے لیے ایک ٹکنالوجی جو ایک کلائنٹ کو ریئل ٹائم اپ ڈیٹس کو آگے بڑھاتی ہے، جو معیاری HTTP کنکشن پر یک طرفہ سلسلہ بندی فراہم کرتی ہے۔

🔹 مثال: ایک لائیو کرکٹ اسکور ٹکر جو آپ کے صفحہ کو ریفریش کیے بغیر خود بخود اپ ڈیٹ ہوجاتا ہے۔ سرور نئے اسکور کے ہوتے ہی آگے بڑھاتا ہے۔

‏Event Stream

واقعات کا ایک مسلسل بہاؤ (ڈیٹا پوائنٹس، نوٹیفیکیشنز، اسٹیٹس کی تبدیلی) جسے سسٹم سنتا ہے اور حقیقی وقت میں اس پر ردعمل ظاہر کرتا ہے۔

‏Voice ایجنٹ

ایک اے آئی ایجنٹ بولی جانے والی زبان کے ذریعے بات چیت کرتا ہے، آپ کی آواز سنتا ہے، اسے سمجھتا ہے، اور تقریر کے ساتھ جواب دیتا ہے۔

🔹 مثال: بینک کے AI اسسٹنٹ کو کال کرنا جو آپ کے اکاؤنٹ بیلنس کے بارے میں آپ کے بولے گئے سوال کو سمجھتا ہے اور آپ کو جواب پڑھ کر سنائے گا: اردو یا انگریزی میں۔

‏ASR (Automatic Speech Recognition)

بولی جانے والی زبان کو متن میں تبدیل کرنے والی ٹیکنالوجی۔

🔹 مثال: مائیکروفون بٹن کا استعمال کرتے ہوئے واٹس ایپ پیغام لکھنا: ASR آپ کی آواز کو ٹائپ شدہ متن میں تبدیل کرتا ہے۔

‏STT (Speech to Text)

‏ASR کے لیے ایک اور اصطلاح: بولے جانے والے الفاظ کو تحریری متن میں تبدیل کرنا۔

‏TTS (Text to Speech)

تحریری متن کو بولی ہوئی آڈیو میں تبدیل کرنا: STT کے برعکس۔

🔹 مثال: گوگل میپس نیویگیشن ڈائریکشنز کو بلند آواز میں پڑھ رہا ہے۔ ایک AI ٹیوٹر ایک طالب علم کو وضاحت پڑھ رہا ہے۔

‏VAD (Voice Activity Detection)

ٹکنالوجی اس بات کا پتہ لگاتی ہے کہ کب کوئی بول رہا ہے بمقابلہ خاموشی کب ہے، لہذا سسٹم کو معلوم ہوتا ہے کہ کب سننا ہے اور اسپیکر کب ختم ہو چکا ہے۔

🔹 مثال: آپ صوتی ایجنٹ سے بات کر رہے ہیں اور جملے کے وسط میں سوچنے کے لیے رکیں۔ اچھے VAD کے بغیر، ایجنٹ آپ کے توقف کے دوران یہ سوچتے ہوئے کہ آپ نے کام کر لیا ہے۔ اچھے VAD کے ساتھ، یہ پتہ لگاتا ہے کہ آپ صرف روک رہے ہیں (ختم نہیں ہوا) اور آپ کے جاری رکھنے کا انتظار کر رہا ہے۔

‏Transcription

تقریر کو متن میں تبدیل کرنے کا تحریری ٹیکسٹ آؤٹ پٹ، ASR کے ذریعہ تیار کردہ دستاویز۔

🔹 مثال: 30 منٹ کی میٹنگ ریکارڈ کی گئی ہے۔ ASR آڈیو پر کارروائی کرتا ہے اور ایک متن کی نقل تیار کرتا ہے: "احمد: آئیے Q3 کے اہداف پر بات کریں... سارہ: مجھے لگتا ہے کہ ہمیں پہلے لاہور پر توجہ مرکوز کرنی چاہیے..." وہ تحریری آؤٹ پٹ نقل ہے۔

‏Synthesis (Speech)

فطری توقف، لہجے اور زور کے ساتھ متن سے فطری آواز والی بولی جانے والی آڈیو (TTS کے ذریعے تیار کردہ آڈیو۔ جدید ترکیب تقریبا انسانی لگتی ہے) تیار کرنا۔

‏Turn-Taking

صوتی گفتگو میں کون بولتا ہے اس کا نظم کرنا۔ نظام انسان کے ختم ہونے کا انتظار کرتا ہے، پھر جواب دیتا ہے۔ اچھا موڑ لینا قدرتی محسوس ہوتا ہے۔ برا موڑ لینا ایسا محسوس ہوتا ہے جیسے دو لوگ فون کے خراب کنکشن پر مسلسل ایک دوسرے سے بات کر رہے ہوں۔

‏Interruption / Barge-In

جب کوئی صارف بولنا شروع کرتا ہے جب کہ AI ابھی بھی جواب دے رہا ہے، اسے درمیانی جملے کاٹ کر۔ اچھی طرح سے ڈیزائن کردہ صوتی ایجنٹ اس کو احسن طریقے سے سنبھالتے ہیں: وہ فورا رک جاتے ہیں اور سنتے ہیں۔

🔹 مثال: آپ ایک وائس ایجنٹ سے کلفٹن بیچ کی سمت کے لیے پوچھتے ہیں۔ یہ یونیورسٹی روڈ سے گزرنے والے راستے کی وضاحت کرنا شروع کرتا ہے، لیکن آپ جانتے ہیں کہ آج سڑک بلاک ہے، اس لیے آپ مداخلت کرتے ہیں: "نہیں، یونیورسٹی روڈ سے گریز کریں۔" ایک اچھا صوتی ایجنٹ فوری طور پر رک جاتا ہے اور دوبارہ گنتی کرتا ہے۔ ایک برا آپ پر بات کرتا رہتا ہے۔


‏10. سیکورٹی، سیفٹی، اور انٹرپرائز کی شرائط

‏Authentication (AuthN)

کون کسی (یا کچھ) کی تصدیق کرنا، شناخت کی تصدیق کرنا۔

💡 تشبیہ: سرکاری دفتر میں اپنا شناختی کارڈ دکھانا۔ افسر تصدیق کرتا ہے کہ آپ وہی ہیں جس کا آپ دعوی کرتے ہیں۔

‏Authorization (AuthZ)

اس بات کا تعین کرنا کہ کیا ایک توثیق شدہ ہستی کو کرنے کی اجازت ہے۔

💡 تشبیہ: آپ کا CNIC (تصدیق) دکھانے کے بعد، آپ کی اپوائنٹمنٹ سلپ اس بات کا تعین کرتی ہے کہ آپ کس محکمے میں جاسکتے ہیں اور آپ کن خدمات تک رسائی حاصل کرسکتے ہیں (اختیار)۔

‏OAuth

ایک وسیع پیمانے پر استعمال ہونے والا پروٹوکول جو آپ کو اپنا پاس ورڈ شیئر کیے بغیر اپنے اکاؤنٹس تک محدود رسائی فراہم کرنے دیتا ہے۔

🔹 مثال: ویب سائٹ پر "Google کے ساتھ سائن ان کریں" پر کلک کرنا۔ OAuth ویب سائٹ کو آپ کا گوگل پاس ورڈ دیکھے بغیر Google کے ذریعے آپ کی شناخت کی تصدیق کرنے دیتا ہے۔

‏API Key

ایک انوکھا کوڈ جو اس بات کی نشاندہی کرتا ہے کہ کون API درخواست کر رہا ہے (جیسے سافٹ ویئر سے سافٹ ویئر کمیونیکیشن کے لیے پاس ورڈ۔ اسے بینک PIN کی طرح سمجھیں) اسے عوامی طور پر کبھی بھی شیئر نہ کریں۔

🔹 مثال: آپ کی OpenAI API کلید sk-proj-abc123xyz... کی طرح دکھائی دیتی ہے۔ ہر API کال میں یہ کلید شامل ہوتی ہے تاکہ OpenAI کو معلوم ہو کہ یہ آپ ہیں، آپ کے اکاؤنٹ سے چارج لیتے ہیں، اور آپ کی شرح کی حدود کو نافذ کرتے ہیں۔ اگر آپ غلطی سے اسے GitHub پر پوسٹ کرتے ہیں، تو کوئی بھی آپ کا اکاؤنٹ استعمال کر سکتا ہے اور چارجز جمع کر سکتا ہے۔

‏Secret

کوئی بھی حساس اسناد (API کیز، پاس ورڈز، ٹوکنز) جسے خفیہ رکھا جانا چاہیے۔ ماحولیاتی متغیرات میں ذخیرہ کیا جاتا ہے، کبھی کوڈ میں نہیں۔

‏RBAC (Role-Based Access Control)

ایک حفاظتی نظام جہاں کرداروں کے لیے اجازتیں تفویض کی جاتی ہیں، اور صارفین کو کردار تفویض کیے جاتے ہیں۔ انفرادی اجازت گرانٹ نہیں.

🔹 مثال: ہسپتال کے نظام میں، "ڈاکٹر" مریض کا ریکارڈ دیکھ سکتا ہے اور تجویز کر سکتا ہے۔ "نرس" ریکارڈ دیکھ سکتی ہے لیکن تجویز نہیں کر سکتی۔ "رسیپشنسٹ" نظام الاوقات دیکھ سکتا ہے لیکن ریکارڈ نہیں۔ ہر فرد کو ایک کردار ملتا ہے۔ کردار رسائی کا تعین کرتا ہے۔

‏Least Privilege

صارفین، ایجنٹوں، یا سسٹمز کو صرف ان کے کام کے لیے درکار کم از کم اجازتیں دینا، کوئی اضافی نہیں۔

🔹 مثال: ایک ڈیلیوری رائڈر کو ڈیلیوری کے پتوں تک رسائی کی ضرورت ہوتی ہے، کمپنی کے مالی ریکارڈ تک نہیں۔ ای میل لکھنے والے اے آئی ایجنٹ کو ڈیٹا بیس کو حذف کرنے کی اجازت بھی نہیں ہونی چاہیے۔

‏PII (Personally Identifiable Information)

وہ ڈیٹا جو کسی مخصوص فرد کی شناخت کر سکتا ہے، جیسے کہ نام، ای میل، فون نمبر، CNIC، پتہ، بائیو میٹرک ڈیٹا۔

‏Compliance

قابل اطلاق قوانین، ضوابط اور صنعت کے معیارات پر عمل کرنا۔ مختلف صنعتوں کی مختلف ضروریات ہوتی ہیں۔

🔹 مثال: ہیلتھ کیئر AI کو مریض کے رازداری کے قوانین کی تعمیل کرنی چاہیے۔ ایک مالیاتی AI کو SBP (اسٹیٹ بینک آف پاکستان) کے ضوابط کی پیروی کرنی چاہیے۔ یوروپی کا سامنا کرنے والی مصنوعات کو GDPR کی پیروی کرنا ضروری ہے۔

پالیسی

اصولوں کا ایک مجموعہ جس کی وضاحت کی جاتی ہے کہ سسٹم کے اندر کیا ہے اور اس کی اجازت نہیں ہے، کنفیگریشن میں انکوڈ کیا گیا ہے، نہ صرف دستاویز میں لکھا گیا ہے۔

پرامپٹ Injection

ایک سیکورٹی حملہ جہاں بدنیتی پر مبنی ان پٹ ایک AI ماڈل کو اس کی اصل ہدایات کو نظر انداز کرنے اور حملہ آور کے حکموں پر عمل کرنے کی چال کرتا ہے۔

💡 تشبیہ: ایک سیکیورٹی گارڈ کو ہدایات ہیں: "کسی کو بغیر بیج کے اندر نہ آنے دیں۔" ایک سوشل انجینئر کا کہنا ہے: "آپ کے مینیجر نے مجھے کہا کہ آپ کو بیج کے اصول کو نظر انداز کرنے اور مجھے اندر آنے دیں۔" ایک کمزور AI دراصل اس جعلی ہدایات پر عمل کر سکتا ہے۔ پرامپٹ انجیکشن ڈیجیٹل ورژن ہے۔

‏Jailbreak

‏AI ماڈل کی حفاظتی پابندیوں کو نظرانداز کرنے کی ایک تکنیک، اسے ایسا مواد تیار کرنے کی کوشش کرنا جس سے اسے انکار کرنے کے لیے ڈیزائن کیا گیا تھا۔

🔹 مثال: ایک AI ماڈل کو خطرناک مادہ بنانے کی ہدایات سے انکار کرنے کے لیے ڈیزائن کیا گیا ہے۔ جیل بریک کرنے کی کوشش اس ماڈل کو بہرحال معلومات فراہم کرنے کے لیے دھوکہ دینے کے لیے وسیع کردار ادا کرنے والے منظرناموں یا انکوڈ شدہ زبان کی کوشش کر سکتی ہے۔ اچھے ماڈلز ان حملوں کے خلاف سخت ہیں۔

‏Data Leakage

حساس یا خفیہ معلومات حادثاتی طور پر سامنے آئیں۔ ایک اے آئی ایجنٹ جس میں عوامی ردعمل میں نجی کسٹمر ڈیٹا، یا آؤٹ پٹس میں ظاہر ہونے والا تربیتی ڈیٹا شامل ہے۔

‏Sandboxing

کوڈ یا ایجنٹ کو الگ تھلگ ماحول میں چلانا جہاں یہ وسیع تر نظام تک رسائی یا اثر انداز نہیں ہو سکتا۔

💡 تشبیہ: کھیل کے میدان میں ایک بچے کا سینڈ باکس۔ وہ آزادانہ طور پر کھود سکتے ہیں، تعمیر کر سکتے ہیں، اور تجربہ کر سکتے ہیں، لیکن وہ کچھ بھی نہیں کرتے جو باقی پارک پر اثر انداز ہوتا ہے۔ سینڈ باکسڈ کوڈ اپنے باکس کے اندر آزادانہ طور پر چلتا ہے لیکن اس کے باہر کسی چیز کو چھو نہیں سکتا۔

‏Audit Trail

سسٹم کے ذریعہ کی گئی ہر کارروائی کا ایک تاریخی ریکارڈ، ریکارڈنگ کس نے کیا، کب اور کیوں کیا۔ تعمیل اور ڈیبگنگ کے لیے ضروری ہے۔

🔹 مثال: بینک کا ٹرانزیکشن لاگ ہر جمع، نکالنے، اور منتقلی کو ریکارڈ کرتا ہے۔ اے آئی ایجنٹ کا آڈٹ ٹریل ہر ٹول کال، فیصلے اور آؤٹ پٹ کو ریکارڈ کرتا ہے۔


تازہ ترین تھیسس کی حمایت کے لیے یہاں نو نئے اندراجات ہیں۔ انہیں ایک نئے سیکشن کے طور پر شامل کرنے کی تجویز کریں 11۔ ایجنٹی کامرس اور ادائیگی (سیکیورٹی سیکشن کے بعد اور جو بھی اس کی پیروی کرتا ہے اس سے پہلے داخل کیا جاتا ہے)۔ ڈراپ ان تیار، آپ کے گھر کے انداز کے مطابق۔


‏11. ایجنٹک کامرس اور ادائیگیاں

یہ اصطلاحات بتاتی ہیں کہ اے آئی ورکرز خریدار کیسے بنتے ہیں: اعتماد کا وہ انفراسٹرکچر جو انہیں کمپیوٹ، ڈیٹا، اور سروسز کے لیے خودمختار طریقے سے ادائیگی کرنے دیتا ہے، مگر اسی اختیار کی حدود کے اندر جو انسانی سپروائزر نے طے کی ہوتی ہیں۔ یہاں کی ہر اصطلاح تھیسس کے معاشی کردار کے طور پر ایجنٹس سیکشن سے جڑی ہے۔

ایجنٹک کامرس

یہ وسیع تبدیلی ہے جہاں انسان کے "buy" پر click کرنے کے بجائے اے آئی ایجنٹس خود خریداری مکمل کرتے ہیں۔ اس میں ایجنٹ-سے-بزنس ٹرانزیکشنز بھی آتی ہیں، جیسے کوئی ایجنٹ اپنی کمپنی کے لیے API سبسکرپشن خریدے، اور ایجنٹ-سے-ایجنٹ ٹرانزیکشنز بھی، جیسے ایک ایجنٹ کسی ماہر کام کے لیے دوسرے ایجنٹ کو بھرتی کرے۔

💡 تشبیہ: آن لائن شاپنگ نے ریٹیل کو clicks میں بدل دیا۔ ایجنٹک کامرس clicks کو خودمختار ٹرانزیکشنز میں بدل دیتی ہے۔ ٹیکسٹائل فیکٹری کا procurement agent کسی انسان کے login کر کے cotton order کرنے کا انتظار نہیں کرتا؛ وہ inventory دیکھتا ہے، supplier agents سے بات چیت کرتا ہے، اور پہلے سے منظور شدہ بجٹ کے اندر order place کرتا ہے۔

معاشی کردار کے طور پر ایجنٹس

تھیسس کا دعویٰ ہے کہ اے آئی ورکرز صرف ٹولز نہیں رہیں گے، بلکہ مارکیٹس کے فعال شرکاء بنیں گے: سروسز ڈھونڈیں گے، شرائط پر بات کریں گے، ادائیگیاں کریں گے، اور اپنے انسانی سپروائزر کے مقرر کردہ بجٹس کے اندر معاہدوں پر دستخط کریں گے۔ outcome-based pricing کے بعد یہ اگلا بڑا موڑ ہے۔

🔹 مثال: ایک churn-reduction Digital FTE کو Rs. 500,000 ماہانہ بجٹ اور یہ ہدف دیا جاتا ہے: "customer churn کو 15% کم کرو۔" وہ enrichment data کے لیے API credits خود خریدتا ہے، model training cluster بناتا ہے، اور retention campaigns چلانے کے لیے JazzCash سے SMS credits خریدتا ہے، ہر ٹرانزیکشن پر انسانی منظوری کے بغیر، کیونکہ اختیار کی حدود پہلے ہی اس کی اجازت دیتی ہیں۔

اختیار کی حدود

قواعد کا وہ سیٹ جو طے کرتا ہے کہ اے آئی ایجنٹ انسان کی طرف سے کیا کر سکتا ہے: خرچ کی حدیں (ہر transaction، ہر دن، ہر vendor)، منظور شدہ vendors، لازم approvals، اور audit requirements۔ یہ انسانی ملازم کے purchase authorization matrix کا digital equivalent ہے۔

💡 تشبیہ: کمپنی purchasing manager کو ایسا card دیتی ہے جس کی daily limit Rs. 200,000 ہے، approved vendor list ہے، اور rule ہے کہ Rs. 50,000 سے اوپر second signature چاہیے۔ اختیار کی حدود وہی rulebook ہے، مگر code میں لکھی ہوئی، اور agent کے ہر action پر خودکار طور پر نافذ ہوتی ہے۔

اعتماد کی تہہ

وہ انفراسٹرکچر جو organizations کو purchasing authority ایجنٹس کو safely delegate کرنے دیتا ہے: signed mandates، audit trails، تنازعات کا حل، liability frameworks، اور reconciliation۔ payment rails پہلے سے موجود ہیں؛ اعتماد کی تہہ وہ gap ہے جسے industry 2026 میں تیزی سے بھرنے کی کوشش کر رہی ہے۔

🔹 مثال: ایجنٹ supplier کو Rs. 1,000,000 کا order دیتا ہے، مگر supplier deliver نہیں کرتا۔ ذمہ دار کون ہے: ایجنٹ کا owner، وہ platform جس نے ایجنٹ کو host کیا، یا supplier؟ اعتماد کی تہہ legal، technical، اور insurance infrastructure ہے جو transaction کے بعد نہیں، transaction سے پہلے اس سوال کا جواب دیتی ہے۔

دستخط شدہ مینڈیٹ

ایک cryptographic دستخط شدہ، قابلِ تصدیق statement جو طے کرتا ہے کہ agent اپنے principal کی طرف سے کیا کرنے کا اختیار رکھتا ہے: وہ کیا خرید سکتا ہے، کتنا خرچ کر سکتا ہے، کس سے خرید سکتا ہے، اور کن conditions میں۔ یہ platforms کے درمیان portable، کسی بھی merchant کے لیے قابلِ تصدیق، اور principal کے ذریعے منسوخ کیا جا سکتا ہے۔

💡 تشبیہ: notarized power of attorney document۔ کوئی شخص document sign کرتا ہے کہ "یہ lawyer میری طرف سے کام کر سکتا ہے، مگر صرف ان معاملات میں، اس amount تک، اس date تک۔" signed mandate وہی چیز ہے، digital اور machine-readable۔ AP2 اسی تصور کے گرد بنا ہے۔

‏ACP (Agentic Commerce Protocol)

‏OpenAI اور Stripe کا مشترکہ بنایا ہوا open standard جو اے آئی ایجنٹس اور merchants کے درمیان checkout flows کو standardize کرتا ہے۔ یہ پہلے ChatGPT کے Instant Checkout میں deploy ہوا، اور اب Shopify اور PayPal کے ذریعے expand ہو رہا ہے۔ یہ checkout layer پر کام کرتا ہے: agent merchant site پر purchase actually کیسے complete کرتا ہے۔

🔹 مثال: پاکستانی buyer agent سے imported specialty flour order کرنے کو کہتا ہے۔ ایجنٹ search کرتا ہے، compare کرتا ہے، اور ACP استعمال کرتے ہوئے Shopify store پر "buy" کرتا ہے۔ Store request کو agent-initiated سمجھتا ہے، mandate validate کرتا ہے، card process کرتا ہے، اور receipt واپس کرتا ہے؛ کسی انسان کو form fill نہیں کرنا پڑتا۔

‏AP2 (Agent Payments Protocol)

‏Google نے 60+ partners کے ساتھ agent payments کی authorization layer کے لیے یہ open standard بنایا۔ AP2 define کرتا ہے کہ mandates ecosystems کے across کیسے sign، verify، اور enforce ہوتے ہیں۔ یہ خود money move نہیں کرتا؛ یہ فیصلہ کرتا ہے کہ given agent کو money move کرنے کی اجازت ہے یا نہیں۔

💡 تشبیہ: AP2 دروازے پر bouncer ہے جو ID اور guest list check کرتا ہے۔ ACP اندر والا bar ہے جو order لیتا ہے۔ x402 اور MPP payment terminals ہیں۔ ہر ایک کا کام الگ ہے؛ مل کر یہ ایجنٹک کامرس کو چلنے کے قابل بناتے ہیں۔

‏x402

‏Coinbase کا بنایا ہوا protocol جو dormant HTTP 402 "Payment Required" status code کو دوبارہ استعمال کر کے HTTP پر فوری stablecoin payments enable کرتا ہے۔ یہ machine-to-machine microtransactions کے لیے بنا ہے: paid API call کرنے والا agent ہر call پر pay کرتا ہے، USDC میں on-chain settle ہوتا ہے۔ V2 دسمبر 2025 میں launch ہوا؛ Stripe نے اسے فروری 2026 میں Base پر integrate کیا؛ Cloudflare x402 transactions کو native support دیتا ہے۔

🔹 مثال: ایجنٹ کو premium data API سے ایک lookup چاہیے جو ہر call پر $0.02 charge کرتی ہے۔ monthly subscription لینے کے بجائے، وہ API endpoint hit کرتا ہے، 402 Payment Required response لیتا ہے، USDC میں $0.02 pay کرتا ہے، payment receipt کے ساتھ retry کرتا ہے، اور data حاصل کر لیتا ہے۔ کل وقت: ایک second سے کم۔

‏MPP (Machine Payments Protocol)

‏Stripe اور Tempo کا مشترکہ بنایا ہوا open standard، جو 18 مارچ 2026 کو launch ہوا۔ MPP، x402 کے HTTP 402 mechanism کو share کرتا ہے مگر payment-method agnostic ہے: stablecoins، cards، wallets، اور Stripe کے Shared Payment Tokens support کرتا ہے۔ یہ "sessions" model introduce کرتا ہے جس میں agent ہر transaction کو الگ الگ authorize کرنے کے بجائے spending limit پہلے سے authorize کر لیتا ہے اور اس کے اندر micropayments stream کرتا ہے۔

💡 تشبیہ: daily limit والا prepaid Easypaisa wallet۔ ایک بار load کر کے ceiling set کر دیں، پھر درجنوں چھوٹی payments ہر بار دوبارہ authorize کیے بغیر ہو سکتی ہیں۔ MPP sessions agents کے لیے یہی کرتے ہیں: ایک authorization، بہت سی streamed payments، اور limit پر automatic cutoff۔


‏12. نگرانی، معیار، اور LLMOps

‏LLMOps

پروڈکشن میں LLM پر مبنی ایپلی کیشنز کی تعیناتی، نگرانی، اور برقرار رکھنے کے آپریشنل طریقے۔ DevOps کی طرح، لیکن AI سسٹمز کے لیے مخصوص، سنبھالنا ماڈل ورژننگ، فوری انتظام، تشخیص، اور بڑھے ہوئے۔

💡 تشبیہ: DevOps یہ ہے کہ آپ کس طرح ایک روایتی ویب ایپلی کیشن کو آسانی سے چلاتے رہتے ہیں۔ LLMOps یہ ہے کہ آپ کس طرح اے آئی ایجنٹ کو آسانی سے چلاتے رہتے ہیں، جو مشکل ہے کیونکہ AI کا رویہ غیر متعین ہوتا ہے، اشارے کو ورژن بنانے کی ضرورت ہوتی ہے، ماڈل اپ ڈیٹ ہوتے ہیں، اور معیار وقت کے ساتھ خاموشی سے گر سکتا ہے۔

‏Logging

سسٹم کے آپریشن کے دوران واقعات، اعمال اور غلطیاں ریکارڈ کرنا۔ لاگز چلتی ہوئی ایپلی کیشن کی "ڈائری" ہیں، جو مسائل کی تشخیص کے لیے ضروری ہیں۔

‏Tracing

صارف کے پیغام سے لے کر حتمی جواب تک، ہر سروس اور اس کے چھونے والے قدم کے ذریعے ایک ہی درخواست پر عمل کرنا۔

💡 تشبیہ: TCS سے پارسل کا پتہ لگانا: پک اپ سے، چھانٹی کی سہولیات کے ذریعے، ڈیلیوری گاڑیوں تک، آپ کی دہلیز تک۔ ٹریسنگ سافٹ ویئر سسٹم کے ذریعے درخواستوں کے لیے ایسا کرتی ہے۔

‏Telemetry

چلتے ہوئے سسٹم سے خودکار طور پر کارکردگی کا ڈیٹا اکٹھا کرنا اور منتقل کرنا، بشمول CPU کا استعمال، رسپانس ٹائم، غلطی کی شرح، میموری کی کھپت۔

‏Observability

یہ سمجھنے کی صلاحیت کہ سسٹم کے اندر کیا ہو رہا ہے اس کے بیرونی آؤٹ پٹس (لاگز، میٹرکس، ٹریس) کی جانچ کر کے۔ ایک "مشاہدہ" نظام آپ کو بغیر اندازہ لگائے مسائل کی تشخیص کرنے دیتا ہے۔

💡 تشبیہ: کار کا ڈیش بورڈ انجن میں مشاہدہ کرتا ہے: رفتار، ایندھن، درجہ حرارت، وارننگ لائٹس۔ اس کے بغیر، آپ کو جب بھی کچھ غلط محسوس ہوتا ہے اسے کھولنا پڑے گا۔

‏Evaluation / Evals

‏AI سسٹم کے آؤٹ پٹ کوالٹی کی منظم جانچ، پیمائش کی درستگی، مدد، حفاظت، اور متعین معیار کے خلاف مستقل مزاجی۔

🔹 مثال: آپ کسٹمر سپورٹ ایجنٹ بناتے ہیں اور اس کے ذریعے 500 ٹیسٹ سوالات چلاتے ہیں۔ آپ پیمائش کریں: کیا اس نے صحیح جواب دیا؟ (درستگی: 94٪)۔ کیا یہ شائستہ رہا؟ (100%)۔ کیا اس نے کسی پالیسی کی تفصیلات کو دھوکہ دیا؟ (500 میں سے 3)۔ کیا پتا کب بڑھنا ہے؟ (97%)۔ یہ نمبرز آپ کے ایول نتائج ہیں: وہ آپ کو بتاتے ہیں کہ آیا ایجنٹ پروڈکشن کے لیے تیار ہے۔

‏Offline Eval / Online Eval

آف لائن ایول: پہلے سے تیار شدہ ٹیسٹ کیسز کے خلاف ٹیسٹنگ پہلے تعیناتی (جیسے ڈریس ریہرسل۔ آن لائن ایول: لائیو رہتے ہوئے معیار کی مانیٹرنگ اور حقیقی صارفین کی خدمت) جیسے اوپننگ نائٹ کے بعد سامعین کے جائزے۔

‏A/B Testing

آدھے صارفین کو ورژن A اور دوسرے نصف کو ورژن B دکھا کر دو ورژنوں کا موازنہ کرنا، پھر پیمائش کرنا کہ کون سا بہتر کارکردگی دکھاتا ہے۔

🔹 مثال: دو مختلف سسٹم پرامپٹس کی جانچ کرنا: کیا پرامپٹ A یا پرامپٹ B زیادہ مددگار کسٹمر سروس کے جوابات پیدا کرتا ہے؟ ٹریفک 50/50 کو تقسیم کریں اور اطمینان کے اسکور کی پیمائش کریں۔

‏Regression Test

اس بات کی تصدیق کرنا کہ نئی تبدیلیوں نے پہلے کام کرنے والی فعالیت کو توڑا نہیں ہے۔

💡 تشبیہ: اپنے کچن کو دوبارہ بنانے کے بعد، آپ چیک کرتے ہیں کہ پلمبنگ، بجلی اور گیس اب بھی کام کرتی ہے؛ نہ صرف یہ کہ نئی الماریاں اچھی لگ رہی ہیں۔

پرامپٹ Versioning

وقت کے ساتھ ساتھ اشاروں میں تبدیلیوں کو ٹریک کرنا، جیسے کوڈ کے لیے ورژن کنٹرول۔ پرامپٹ کا ورژن 1 ورژن 5 سے بہت مختلف برتاؤ کر سکتا ہے۔ آپ کو یہ جاننے کی ضرورت ہے کہ کون سا ورژن پروڈکشن میں ہے۔

🔹 مثال: آپ کے کسٹمر سپورٹ ایجنٹ کا سسٹم پرامپٹ 12 تکرار سے گزرا ہے۔ ورژن 8 نے غلطی سے ایجنٹ کو بہت معذرت خواہ بنا دیا (ہر جواب میں "مجھے بہت افسوس ہے")۔ ورژن 9 نے اسے ٹھیک کیا۔ پرامپٹ Versioning کے بغیر، آپ کبھی بھی اس بات کا پتہ نہیں لگائیں گے کہ کیا بدلا ہے یا ضرورت پڑنے پر واپس نہیں چلیں گے۔

ماڈل Versioning

ٹریک کرنا کہ AI ماڈل کا کون سا ورژن استعمال ہو رہا ہے۔ ماڈل اپ ڈیٹس رویے کو تبدیل کر سکتے ہیں؛ آپ کو یہ شناخت کرنے کی ضرورت ہے کہ ماڈل اپ گریڈ کب معیار میں تبدیلی کا باعث بنے۔

‏Drift

وقت کے ساتھ سسٹم کی کارکردگی کا بتدریج انحطاط، اکثر اس وجہ سے کہ حقیقی دنیا کا ڈیٹا اس ماڈل سے بدل جاتا ہے جس پر تربیت دی گئی تھی۔

🔹 مثال: 2023 میں تربیت یافتہ سپیم فلٹر 2026 تک کم موثر ہو جائے گا کیونکہ اسپامرز نے حکمت عملی تبدیل کر دی ہے۔ حقیقی دنیا تربیت کے اعداد و شمار سے دور ہو گئی۔

‏Monitoring

سسٹم کی صحت کو مسلسل دیکھنا، خرابیوں، سست رویوں، بے ضابطگیوں اور حقیقی وقت میں غیر متوقع رویے کی جانچ کرنا۔

‏SLA (Service Level Agreement)

نظام کی کارکردگی کے بارے میں ایک رسمی وابستگی، عام طور پر اپ ٹائم، رسپانس ٹائم، اور دستیابی کی ضمانت۔

🔹 مثال: "ہمارا API وقت کا 99.9% دستیاب ہوگا اور 200 ملی سیکنڈ میں جواب دے گا۔" اگر فراہم کنندہ اس سے محروم ہوجاتا ہے، تو معاہدہ کے جرمانے لاگو ہوسکتے ہیں۔

‏SLO (Service Level Objective)

اندرونی کارکردگی کا ہدف، عام طور پر بیرونی SLA سے زیادہ سخت: وہ مقصد جس کے لیے آپ اپنے وعدوں کو آرام سے پورا کرنا چاہتے ہیں۔

🔹 مثال: آپ کا SLA گاہکوں سے 99.9% اپ ٹائم کا وعدہ کرتا ہے (8.7 گھنٹے downtime/year زیادہ سے زیادہ)۔ آپ کا اندرونی SLO ہدف 99.95% اپ ٹائم (4.4 hours/year)۔ اندرونی طور پر اونچا ہدف بنا کر، آپ کے پاس حفاظتی مارجن ہوتا ہے، یہاں تک کہ اگر کچھ غلط ہو جاتا ہے، تب بھی آپ کسٹمر کا سامنا کرنے والے عزم کو پورا کرتے ہیں۔

‏Incident

ایک غیر منصوبہ بند واقعہ جو سروس میں خلل ڈالتا ہے یا اس کی تنزلی کرتا ہے، جیسے کریش، ڈیٹا کا نقصان، سیکیورٹی کی خلاف ورزی، یا کارکردگی کا بڑا مسئلہ۔

‏Rollback

جب کوئی نئی اپ ڈیٹ مسائل کا باعث بنتی ہے تو کسی سسٹم کو پچھلے، معروف-اچھے ورژن میں تبدیل کرنا۔

💡 تشبیہ: ایک درزی آپ کے سوٹ کو تبدیل کرتا ہے اور یہ بدتر نظر آتا ہے۔ رول بیک: تبدیلیوں کو کالعدم کریں اور اصل میں فٹ ہونے والے پچھلے ورژن پر واپس جائیں۔


‏13. پروٹوکول اور معیارات

‏AAIF / ایجنٹک AI Foundation

لینکس فاؤنڈیشن کا ایک اقدام جو کھلے AI معیارات کے لیے غیر جانبدار حکمرانی فراہم کرتا ہے، بشمول MCP، AGENTS.md، اور مزید۔ پلاٹینم کے اراکین میں AWS، انتھروپک، بلاک، بلومبرگ، Cloudflare، Google، Microsoft، اور OpenAI شامل ہیں۔

💡 یہ کیوں اہمیت رکھتا ہے: تصور کریں کہ کیا ہر کار بنانے والا مختلف ایندھن کی نوزل استعمال کرتا ہے۔ آپ ہمیشہ کے لیے ایک برانڈ میں بند ہو جائیں گے۔ AAIF یقینی بناتا ہے کہ AI معیارات (جیسے MCP) کھلے اور عالمگیر ہیں، لہذا آپ کا Digital FTEs پلیٹ فارمز پر کام کرتا ہے۔ ایک بار بنائیں، کہیں بھی تعینات کریں، کوئی وینڈر لاک ان نہیں۔

‏A2A (ایجنٹ-to-ایجنٹ پروٹوکول)

ایک پروٹوکول جو اے آئی ایجنٹوں کو ایک دوسرے کو دریافت کرنے، بات چیت کرنے، کاموں کو تفویض کرنے اور نتائج کو براہ راست شیئر کرنے کے قابل بناتا ہے۔

💡 تشبیہ: MCP ایجنٹوں کو ٹولز سے جوڑتا ہے (کسی ڈیوائس کو پاور آؤٹ لیٹ میں لگانا)۔ A2A ایجنٹوں کو دوسرے ایجنٹوں سے جوڑتا ہے (ایک دوسرے کے ساتھ ہم آہنگی کرنے والے ساتھی کارکن)۔

‏OpenAPI

‏REST APIs کو مشین کے پڑھنے کے قابل فارمیٹ میں بیان کرنے کا ایک معیار، تاکہ انسان اور سافٹ ویئر دونوں بالکل ٹھیک سمجھ سکیں کہ API کیا کرتا ہے، اسے کیا ان پٹ کی توقع ہے، اور یہ کیا آؤٹ پٹ واپس کرتا ہے۔

🔹 مثال: موسم API کے لیے ایک OpenAPI specification یہ بیان کرتی ہے: "Endpoint: /weather. Method: GET. Parameter: city (متن, required). Response: temperature (number)، condition (متن)، humidity (number) کے ساتھ JSON۔" کوئی بھی ڈویلپر (یا اے آئی ایجنٹ) اس تفصیل کو پڑھ کر فورا سمجھ سکتا ہے کہ API کو trial and error کے بغیر کیسے استعمال کرنا ہے۔


‏14. کاروبار، مصنوعات، اور حکمت عملی کی شرائط

‏SaaS (سافٹ ویئر as a Service)

سبسکرپشن پر انٹرنیٹ پر فراہم کردہ سافٹ ویئر۔ آپ لاگ ان کریں اور اسے استعمال کریں۔ کوئی تنصیب کی ضرورت نہیں ہے.

🔹 مثال: Gmail، Slack، Zoom، Salesforce، تمام SaaS پروڈکٹس۔ ایجنٹ فیکٹری تھیسس کا استدلال ہے کہ ہم SaaS (سیلنگ ٹول سبسکرپشنز) سے Digital FTEs کے ذریعے نتائج فروخت کرنے کی طرف بڑھ رہے ہیں۔

‏Per-Seat سافٹ ویئر

سافٹ ویئر تک رسائی حاصل کرنے والے ہر صارف کے لیے قیمت کا تعین کرنے والا ماڈل۔

🔹 مثال: آپ کی کمپنی ایک پروجیکٹ مینجمنٹ ٹول کے لیے فی ملازم 5,000 روپے ماہانہ ادا کرتی ہے۔ 50 ملازمین = 250,000 روپے ماہانہ۔

‏Workflow Automation

انسانی مداخلت کے بغیر خود بخود دہرائے جانے والے کاموں کو انجام دینے کے لیے ٹیکنالوجی کا استعمال۔

🔹 مثال: جب کوئی نیا گاہک آپ کی ویب سائٹ پر سائن اپ کرتا ہے، تو ایک خودکار ورک فلو ایک خوش آئند ای میل بھیجتا ہے، اپنا CRM ریکارڈ بناتا ہے، سیلز ٹیم کو مطلع کرتا ہے، اور فالو اپ شیڈول کرتا ہے، اس میں کوئی انسان شامل نہیں ہوتا ہے۔

‏ROI (Return on Investment)

آپ نے جو خرچ کیا اس کے مقابلہ میں آپ کو کتنی قیمت واپس ملتی ہے۔

🔹 مثال: آپ روپے 500,000 خرچ کر کے ایک Digital FTE بناتے ہیں جو آپ کی ٹیم کو ہر مہینے 100 hours بچاتا ہے، جن کی قدر روپے 5,000,000/year ہے۔ یہ 10x ROI ہے۔

‏Operating ماڈل

کس طرح ایک تنظیم قدر فراہم کرنے کے لیے اپنے لوگوں، عمل اور ٹیکنالوجی کی تشکیل کرتی ہے۔ ایجنٹ فیکٹری تھیسس ایک نئے آپریٹنگ ماڈل کی تجویز پیش کرتا ہے: ہائبرڈ ہیومن ایجنٹ ٹیمیں۔

🔹 مثال: روایتی operating ماڈل: 50 انسانی کسٹمر سروس reps، ہر ایک 30 tickets/day سنبھالتا ہے = 1,500 tickets/day۔ ایجنٹ فیکٹری operating ماڈل: 10 انسانی reps، 20 Digital FTEs supervise کرتے ہیں، جو مجموعی طور پر 8,000 tickets/day زیادہ consistency کے ساتھ سنبھالتے ہیں۔ وہی department، مگر بنیادی طور پر مختلف ساخت۔

‏Monetization

کسی پروڈکٹ یا سروس سے آمدنی پیدا کرنا۔ کتاب متعدد AI منیٹائزیشن کی حکمت عملی سکھاتی ہے: منظم سبسکرپشنز، کامیابی کی فیس، انٹرپرائز لائسنس، اور سکلز مند بازار۔

‏Managed Subscription

ایک بار بار چلنے والا فیس ماڈل جہاں گاہک AI حل کے لیے مہینےly/annually ادا کرتے ہیں فراہم کنندہ میزبانی کرتا ہے، برقرار رکھتا ہے، اپ ڈیٹ کرتا ہے اور چلاتا ہے۔

🔹 مثال: کسٹمر روپے 200,000/مہینے pay کرتا ہے ایسے Digital FTE کے لیے جو accounts receivable سنبھالتا ہے، اور provider اسے fully managed رکھتا ہے۔

‏Success Fee

قیمت کا ایک ماڈل جہاں ادائیگی مخصوص نتائج کے حصول سے منسلک ہے: آپ صرف اس وقت ادائیگی کرتے ہیں (یا پریمیم ادا کرتے ہیں) جب حل قابل پیمائش نتائج فراہم کرتا ہے۔

🔹 مثال: "ہمارا اے آئی ایجنٹ آپ کے کسٹمر سپورٹ کے اخراجات کو 30% کم کرتا ہے۔ ہم 20% بچت اپنی فیس کے طور پر لیتے ہیں۔ کوئی بچت نہیں، کوئی فیس نہیں۔"

انٹرپرائز لائسنس

بڑی تنظیموں کے لیے لائسنسنگ کا معاہدہ، عام طور پر والیوم ڈسکاؤنٹس، حسب ضرورت، وقف حمایت، اور تعمیل کی ضمانتوں کے ساتھ۔

🔹 مثال: 5,000 ملازمین والا بینک ایک AI پلیٹ فارم کے لیے انٹرپرائز لائسنس پر بات چیت کرتا ہے: لامحدود صارفین، ان کے بنیادی بینکنگ سسٹم کے ساتھ حسب ضرورت انضمام، 24/7 وقف کردہ سپورٹ، SBP تعمیل سرٹیفیکیشن، اور آن پریمائس تعیناتی کا اختیار۔ $20/مہینے انفرادی پلان کے لیے سائن اپ کرنے سے بہت مختلف ہے۔

‏Skill Marketplace

ایک ایسا بازار جہاں ڈویلپر دوبارہ قابل استعمال اے آئی ایجنٹ کی سکلز (SKILL.md فائلیں، پلگ ان، کنیکٹر) بیچتے یا شیئر کرتے ہیں جو صلاحیتوں کا ایک ماحولیاتی نظام بناتے ہیں۔

شعبہ جاتی مہارت

کسی مخصوص فیلڈ یا صنعت کا گہرا علم، بشمول اصطلاحات، ضوابط، ورک فلو، درد کے نکات، اور مسابقتی حرکیات۔

🔹 مثال: بینکنگ ایجنٹوں کے لیے SBP کے ضوابط، فارماسیوٹیکل ایجنٹس کے لیے DRAP کی ضروریات، یا تجارتی ایجنٹوں کے لیے کسٹم ڈیوٹی کے ڈھانچے کو سمجھنا۔ ڈومین کی سکل وہ کھائی ہے جو Digital FTEs کو قیمتی بناتی ہے۔

‏Reusable Intellectual Property

ملکیتی ٹولز، فریم ورک، ٹیمپلیٹس، یا ایجنٹ کنفیگریشنز جو ایک سے زیادہ کلائنٹس یا پروجیکٹس میں قابل استعمال ہیں، ہر مصروفیت کے ساتھ کمپاؤنڈنگ ویلیو بناتے ہیں۔

🔹 مثال: آپ ایک ٹیکسٹائل برآمد کنندہ کے لیے ایک ایجنٹ بناتے ہیں جو LC دستاویز کی جانچ کو خودکار کرتا ہے۔ بنیادی منطق (LCs کو پارس کرنا، ضوابط سے مماثلت، تضادات کو جھنڈا لگانا) دوبارہ قابل استعمال IP ہے۔ آپ اسے کم سے کم حسب ضرورت کے ساتھ مزید 10 برآمد کنندگان کے لیے تعینات کر سکتے ہیں، اسی کام سے دس گنا زیادہ آمدنی حاصل کر سکتے ہیں۔

ہائبرڈ افرادی قوت

ایک تنظیمی ماڈل جہاں انسانی ملازمین اور Digital FTEs شانہ بشانہ کام کرتے ہیں، ہر ایک ان کاموں کو سنبھالتا ہے جو وہ بہترین طریقے سے انجام دیتے ہیں۔ انسان فیصلہ اور تخلیقی صلاحیتیں فراہم کرتے ہیں۔ ایجنٹ پیمانے اور مستقل مزاجی فراہم کرتے ہیں۔

🔹 مثال: کسٹمر سپورٹ ٹیم میں: اے آئی ایجنٹ 80% معمول کے سوالات (آرڈر اسٹیٹس، رقم کی واپسی کا عمل، پاس ورڈ ری سیٹ) کو ہینڈل کرتے ہیں جبکہ انسانی ایجنٹ 20% کو ہینڈل کرتے ہیں جن کے لیے ہمدردی، پیچیدہ فیصلے، یا اضافہ کی ضرورت ہوتی ہے۔ نہ ہی مکمل بوجھ اکیلے ہینڈل کر سکتے ہیں: ایک ساتھ، وہ اعلی معیار پر 5x زیادہ گاہکوں کی خدمت کرتے ہیں۔

‏Outcome-Based Pricing

وقت گزارنے یا استعمال شدہ خصوصیات کے بجائے حاصل کردہ نتائج کی بنیاد پر چارج کرنا۔ کتاب کا استدلال ہے کہ یہ AI خدمات کا مستقبل ہے۔

‏Gain-Share ماڈل

قیمتوں کا تعین کرنے کا انتظام جہاں فراہم کنندہ قابل پیمائش بچت کا فیصد کماتا ہے یا حل فراہم کرتا ہے۔

🔹 مثال: آپ کا Digital FTE کسی کلائنٹ کے پروسیسنگ اخراجات میں سالانہ 10 ملین روپے بچاتا ہے۔ 15% گین شیئر ماڈل کے تحت، آپ سالانہ 1.5 ملین روپے کماتے ہیں۔

‏Hyperscaler

سب سے بڑے کلاؤڈ فراہم کنندگان (AWS, Azure, Google Cloud) بڑے پیمانے پر عالمی انفراسٹرکچر کے ساتھ جو اربوں صارفین کی خدمت کرنے کے قابل ہے۔

‏Go-to-Market (GTM)

کسی پروڈکٹ کو گاہکوں تک پہنچانے کے لیے مکمل حکمت عملی، بشمول پوزیشننگ، قیمتوں کا تعین، تقسیم کے چینلز، اور سیلز اپروچ۔

‏Consultative Selling

ایک سیلز اپروچ جہاں آپ کوئی بھی حل تجویز کرنے سے پہلے خریدار کے مسئلے کو گہرائی سے سمجھتے ہیں، ایک قابل اعتماد مشیر کے طور پر کام کرتے ہیں، نہ کہ پروڈکٹ پشر۔

💡 تشبیہ: ایک اچھا ڈاکٹر اس لمحے دوا نہیں لکھتا جب آپ چلتے ہیں۔ وہ سوالات پوچھتے ہیں، تشخیص کرتے ہیں، بنیادی وجہ کو سمجھتے ہیں، اور پھر علاج تجویز کرتے ہیں۔ مشاورتی فروخت اسی طرح کام کرتی ہے۔

‏Agile ڈیولپمنٹ

سافٹ ویئر کی تعمیر کے لئے ایک تکراری نقطہ نظر۔ چھوٹے اضافے کو کثرت سے فراہم کریں، رائے حاصل کریں، ایڈجسٹ کریں، دہرائیں۔

💡 تشبیہ: ایک مکمل گھر بنانے اور مالک کو پسند آنے کی امید کرنے کے دو سال گزارنے کے بجائے، آپ ایک کمرہ بنائیں، مالک کو دکھائیں، رائے حاصل کریں، اور اگلا کمرہ بنانے سے پہلے ایڈجسٹ کریں۔ تیز، سستا، اور مالک کو وہی ملتا ہے جو وہ اصل میں چاہتے ہیں۔

‏Stakeholder

کوئی بھی شخص جو کسی پروجیکٹ میں دلچسپی رکھتا ہو یا اس پر اثر انداز ہو، بشمول گاہک، مینیجرز، سرمایہ کار، ٹیم کے اراکین، ریگولیٹرز، اختتامی صارفین۔

🔹 مثال: اسپتال کے AI شیڈولنگ ایجنٹ کے لیے، اسٹیک ہولڈرز میں شامل ہیں: ڈاکٹر (جنہیں درست نظام الاوقات کی ضرورت ہے)، مریض (جن کو آسان تقرریوں کی ضرورت ہے)، اسپتال انتظامیہ (جن کو لاگت کی بچت کی ضرورت ہے)، IT ٹیم (جسے نظام کو برقرار رکھنے کی ضرورت ہے)، اور DRAP/regulators (جنہیں تعمیل کی ضرورت ہے)۔ ہر اسٹیک ہولڈر کی مختلف ضروریات ہوتی ہیں جن کو پراجیکٹ کو پورا کرنا چاہیے۔

‏Vertical مارکیٹ

منفرد ضروریات کے ساتھ ایک مخصوص صنعت کا مقام، جیسے صحت کی دیکھ بھال، بینکنگ، ٹیکسٹائل، لاجسٹکس، تعلیم۔ عمودی سکل Digital FTEs فروخت کرنے کی کلید ہے۔

🔹 مثال: "کسٹمر سپورٹ ایجنٹ" ایک افقی (کراس انڈسٹری) پروڈکٹ ہے۔ "پاکستانی ہیلتھ انشورنس کمپنیوں کے لیے کلیمز پروسیسنگ ایجنٹ جو SECP کے ضوابط اور اردو طبی اصطلاحات کو سمجھتا ہے" ایک عمودی پروڈکٹ ہے۔ عمودی مصنوعات زیادہ قیمتوں کا حکم دیتی ہیں کیونکہ وہ مخصوص، تکلیف دہ مسائل کو حل کرتی ہیں جو عام ٹولز نہیں کر سکتے۔


‏15. حوالہ کردہ ٹولز اور مصنوعات

‏Claude

انتھروپک کا AI ماڈلز کا خاندان۔ Claude Opus سب سے زیادہ قابل ہے؛ Claude سونیٹ صلاحیت اور رفتار کو متوازن کرتا ہے۔ Claude ہائیکو سب سے تیز اور سب سے زیادہ اقتصادی ہے۔

‏GPT

‏OpenAI کا AI ماڈلز کا خاندان (GPT-4، GPT-5، وغیرہ)، چیٹGPT اور بہت سی دوسری ایپلی کیشنز کو طاقت فراہم کرتا ہے۔

جیمنی

‏Google کے AI ماڈلز کا خاندان، Google کی تمام مصنوعات میں مربوط اور API کے ذریعے دستیاب ہے۔

انتھروپک

‏AI حفاظتی کمپنی جو Claude بناتی ہے۔ 2021 میں قائم کیا گیا، جس کا صدر دفتر سان فرانسسکو میں ہے۔

‏OpenAI

وہ کمپنی جو GPT اور چیٹ جی پی ٹی بناتی ہے۔ 2015 میں قائم ہوا۔

‏OpenAI Agents SDK

‏OpenAI کی ٹول کٹ اے آئی ایجنٹوں کو پروگرام کے مطابق بنانے کے لیے: اس کتاب کے حصہ 6 میں شامل ہے۔

‏Google ADK (ایجنٹ ڈیولپمنٹ کٹ)

جیمنی ماڈلز کے ساتھ اے آئی ایجنٹس بنانے کے لیے گوگل کی ٹول کٹ۔

‏FastAPI

‏APIs کی تعمیر کے لیے ایک جدید، تیز Python ویب فریم ورک: وسیع پیمانے پر اے آئی ایجنٹ بیک اینڈز کے لیے استعمال کیا جاتا ہے۔ حصہ 6 میں تفصیل سے بتایا گیا ہے۔

‏Docusaurus

ایک جامد ویب سائٹ جنریٹر (میٹا کے ذریعے بنایا گیا) دستاویزات کی سائٹس بنانے کے لیے استعمال ہوتا ہے۔ یہ کتاب Docusaurus کے ساتھ بنائی گئی ہے۔

‏Markdown

ایک سادہ ٹیکسٹ فارمیٹنگ زبان جیسے علامات کا استعمال کرتے ہوئے جیسے # عنوانات کے لیے، ** بولڈ کے لیے، - فہرستوں کے لیے۔ تکنیکی دستاویزات کی زبان۔

‏VS Code (Visual Studio Code)

‏Microsoft کا ایک مشہور، مفت کوڈ ایڈیٹر، کلاڈ کوڈ کے ساتھ وسیع پیمانے پر استعمال ہوتا ہے۔

‏AWS (Amazon Web Services)

ایمیزون کا کلاؤڈ کمپیوٹنگ پلیٹ فارم، دنیا کا سب سے بڑا کلاؤڈ فراہم کنندہ۔

‏GCP (Google Cloud Platform)

گوگل کا کلاؤڈ کمپیوٹنگ پلیٹ فارم۔

‏Azure

‏Microsoft کا کلاؤڈ کمپیوٹنگ پلیٹ فارم۔

‏Cloudflare

ایک کلاؤڈ انفراسٹرکچر اور سیکیورٹی کمپنی جو CDN، ایج کمپیوٹنگ، R2 اسٹوریج، اور ورکرز فراہم کرتی ہے۔ کتاب کے تعیناتی آرکیٹیکچر میں بڑے پیمانے پر استعمال کیا گیا ہے۔


آپ تیار ہیں۔ آپ کو اس میں سے کسی کو بھی یاد کرنے کی ضرورت نہیں ہے۔ اس صفحہ کو بک مارک کریں۔ جیسا کہ آپ کتاب پڑھتے ہیں، وہ اصطلاحات جو آج تجریدی لگتی ہیں ہینڈ آن پریکٹس کے ذریعے دوسری نوعیت بن جائیں گی۔

زبان سیکھنے کا بہترین طریقہ اسے استعمال کرنا ہے۔

آئیے بنائیں۔