AI یگ میں کیسے سوچیں: Crash Course

6 Disciplines · 6 AI Failure Modes · 1 نیم

پیر صبح 2 لوگ وہی AI tool کھولتے ہیں۔ Task بھی وہی ہے: کیا وے اپنا budget ایک experienced person hire کرنے پر لگائیں, یا وہی پیسا ایسے AI tools خریدنے میں لگائیں جو team کے ہر شخص کو تیز کام کرنے میں مدد دیں? دونوں کے پاس Claude, ChatGPT اور Gemini access ہے۔ دونوں کے پاس فیصلہ کرنے کے لئے 1 week ہے۔

Person A جمعہ کو ایسی clear recommendation کے ساتھ finish کرتی ہے جسے وہ explain کر سکتی ہے۔ اس نے لکھا ک AI کی کون سی claims سے وہ agree ہوئی, کن پر اس نے push back کیا, اور کیا چیز اسکا mind change کریگی۔ Person B جمعہ کو ایک polished document کے ساتھ finish کرتی ہے جو زیادہ تر وہی repeat کرتا ہے جو AI نے پیر کو کہا تھا۔ جب اسکا boss پوچھتا ہے "آپنے یہ recommend کیوں کیا?", تو وہ اپنی ہی reasoning explain نہیں کر پاتی۔ اس نے بس وہ forward کر دیا جو اچھا سنائی دیا۔

Same tools. Same problem. الگ outcomes.

فرق thinking ہے۔ Person A نے AI سے پوچھنے سے پہلے اپنی رائے بنائی۔ Person B نے AI کے پہلے answer کو اپنی رائے بننے دیا۔

یہی gap یہ crash course بند کرتا ہے۔ 6 thinking habits, 3 چھوٹے parts, no code. ہر habit اس specific طریقے کو address کرتی ہے جسسے AI آپکو mislead کرتا ہے جب آپ اسے اپنی جگہ سوچنے دیتے ہیں۔ ساتھ ملکر یہ AI کو ایک magic answer machine (آپ پوچھتے ہیں, وہ answer دیتا ہے, آپ accept کر لیتے ہیں) سے ایک thinking partner میں بدل دیتی ہیں (آپ پہلے predict کرتے ہیں, وہ answer دیتا ہے, آپ compare کرتے ہیں, آپ decide کرتے ہیں)۔

یہ worry صرف ہماری نہیں ہے۔ June 2026 میں, Madrid کے IE School of Science & Technology کے ایک dean نے universities کے بارے میں یہی بات کہی: school میں AI کا اصل کھترا یہ نہیں ک وہ ایک worse summary لکھتا ہے, بلکہ یہ ک students وہ mental muscle بنانا بند کر دیتے ہیں جسے بنانے کے لئے summaries لکھنا ہمیشا سے تھا۔ انکی مشورہ simple تھی: hard thinking کرتے رہیں, اور AI اسکے اوپر add کریں۔ یہ اس page کے rule کا school version ہے۔ (BusinessWorld, June 2026)

وہ force جس کے خلاف یہ course train کرتا ہے

Person B lazy نہیں ہے۔ وہ careless بھی نہیں۔ اسے ایک ایسی force کھینچ رہی ہے جس کا اب نام ہے۔

MIT Sloan کے professor Eric So اسے AI gravity کہتے ہیں: وہ constant pull جو آپ کو اپنی thinking کا زیادہ حصہ AI کو دینے پر مجبور کرتا ہے۔ سیدھی بات: ہر دن AI سے سوچوانا تھوڑا easy ہوتا جا رہا ہے، اور اپنی سوچ چھوڑنا بھی تھوڑا easy۔

اسے gravity کیوں؟ کیونکہ یہ real gravity کی طرح کام کرتی ہے۔ آپ اسے دیکھ نہیں سکتے۔ یہ کبھی off نہیں ہوتی۔ اور یہ سب کو، ہر وقت، تین directions سے ایک ساتھ کھینچتی ہے:

آپ کا دماغ energy بچانا چاہتا ہے۔ دماغ hard work سے بچنے کے لیے بنا ہے۔ یہ normal ہے۔ مگر AI جتنی smarter ہوتی ہے، اسے ایک اور task دینا اتنا easy لگتا ہے، اور اپنا answer پہلے لکھنا extra کام لگتا ہے۔
آپ چاہتے ہیں کام expert-level لگے۔ AI seconds میں ایسی چیز لکھ دیتی ہے جو expert کی لگتی ہے۔ اس کے بغیر کام کرنا ایک جوتے کے ساتھ race کرنے جیسا لگنے لگتا ہے۔
آپ دیکھ نہیں سکتے کہ دوسرے AI کتنا use کر رہے ہیں۔ Classmates اور coworkers announce نہیں کرتے۔ تو ہر کوئی assume کرتا ہے کہ باقی لوگ زیادہ AI use کر رہے ہیں، اور race خود تیز ہو جاتی ہے۔

اب Monday morning والی Person B کو پھر دیکھیں۔ تینوں forces نے اسے ایک ہی easy move کی طرف دھکیلا: AI کھولو، پوچھو، accept کرو۔ اسے محسوس ہی نہیں ہوا کہ وہ decision لے رہی ہے۔ Gravity well اندر سے ایسا ہی لگتا ہے۔

تین forces، ایک pull۔ Person A کو بھی وہی gravity لگتی ہے۔ فرق counterweight کا ہے۔

اس pull کی cost۔ MIT Media Lab کے researchers نے اس پر early study کی۔ لوگوں نے ChatGPT کی مدد سے essays لکھے۔ Submit کرنے کے فوراً بعد 100 میں سے 83 اپنے essay کی ایک بھی sentence repeat نہیں کر سکے۔ الفاظ screen سے homework تک گئے، writer کے دماغ سے گزرے ہی نہیں۔ Study preliminary ہے، مگر warning clear ہے۔

Professor So اس loss کو cognitive capital کہتے ہیں۔ اسے اپنی thinking muscle سمجھیں: problem پر کام کرنے، wrong answer پکڑنے، اور confident answer نے کیا چھوڑا ہے یہ notice کرنے کی ability۔ اس page کی ہر discipline اسی muscle پر چلتی ہے۔

Pull کی cost۔ Left پر card "AI's answer on the screen." Right پر card "the submitted essay." بیچ میں writer کھڑا ہے۔ ایک موٹا arrow "copy, polish, forward" writer کے سر کے اوپر سے jump کرتا ہے۔ Writer کی طرف dotted path cross out ہے اور label "never enters." Badge: MIT Media Lab finding, 83% could not quote a single sentence. الفاظ screen سے submission تک گئے، writer کے دماغ سے نہیں۔

Teachers بھی desk کے دوسری طرف سے وہی pull feel کر رہے ہیں۔ June 2026 میں Madrid کے IE School of Science & Technology کی dean نے کہا کہ school میں AI کا اصل danger یہ نہیں کہ وہ worse summary لکھتی ہے؛ danger یہ ہے کہ students وہ mental muscle بنانا چھوڑ دیتے ہیں جو summaries لکھنے سے بنتا تھا۔ Advice simple تھی: hard thinking کرتے رہو، اور AI اس کے اوپر add کرو۔ (BusinessWorld, June 2026)

Professor So push back کے چار طریقے بھی دیتے ہیں۔ آپ انہیں پہچان لیں گے، کیونکہ یہ page یہی سکھاتا ہے:

Push back کا طریقہ	یہاں کہاں practice ہوتا ہے
Hard thinking خود کرتے رہیں	Exercises اور نیچے caution box
جانیں کہ AI کے بغیر آپ کیا کر سکتے ہیں	Prediction Lock اور Discipline 6 کا Solo path
AI سے بچا وقت harder thinking پر لگائیں	Part 3, Origination
AI کو coach بنائیں، answer machine نہیں	ہر AICheck exercise

یہ section یہ نہیں کہہ رہا کہ AI کم use کریں۔ Six disciplines diet نہیں ہیں۔ یہ counterweight ہیں۔ Gravity صرف ان چیزوں پر جیتتی ہے جو اپنا weight رکھنا چھوڑ دیتی ہیں۔ باقی page یہ بتاتا ہے کہ آپ heavy کیسے رہتے ہیں۔

Prerequisites. یہ page مانتا ہے ک آپنے پہلے والے Foundations courses پورے کر لئے ہیں, کھاسکر mental model کے لئے What AI Actually Is اور AI Prompting in 2026۔ اس course نے mechanics سکھائے تھے: AI کو context کیسے دیں, web search اور deep research کیسے use کریں, images اور audio کے ساتھ کیسے کام کریں, اور AI desktop apps کیسے use کریں۔ یہ course وہ thinking discipline سکھاتا ہے جسسے ان mechanics کا payoff ملتا ہے۔ ابھی کسی دوسرے tab میں Claude, ChatGPT, یا Gemini کا ایک free account کھولیں۔ Practice sections میں آپ اسکا use کریں گے۔

AI models پر ایک note. Practice exercises میں AI-graded feedback ہے۔ یہ ایک strong, current AI model کے ساتھ best کام کرتے ہیں (Claude, ChatGPT, یا Gemini اپنے best reasoning level پر)۔ Older یا weaker models vague یا overly positive feedback دیتے ہیں, چاہے آپنے کچھ بھی submit کیا ہو۔ آپ کے پاس جو best model ہو اسے use کریں۔ Specific brand matter نہیں کرتا; matter یہ کرتا ہے ک model carefully reason کر سکے۔

📚 Teaching Aid

پورا Slideshow کھولیں

پورا Presentation دیکھیں : Thinking with AI

ایک line میں rule

Deliverable کبھی answer نہیں ہوتا۔ Deliverable سوچ کا documented evidence ہوتا ہے۔

اسے 2 claims کی طرح پڑھیں۔ پہلا, deliverable, یانی جو چیز آپ اپنے boss, professor, یا client کو دیتے ہیں, اب صرف answer نہیں رہا۔ AI seconds میں ایک polished answer produce کر سکتا ہے; ایک answer بنانا اب hard part نہیں رہا۔ دوسرا, اب ایک deliverable کو trustworthy بناتی ہے آپنے کیسے سوچا اسکا written record: AI سے پوچھنے سے پہلے lock کی ہوئی prediction, وہ row جہاں آپنے AI کی کسی claim کو REJECT mark کرکے reason بتایا, اور وہ cascade map جو آپنے side effects trace کرنے کے لئے بنائی (ایک one-page diagram جس میں آپ کے decision سے affected ہر group کے لئے ایک چھوٹی column ہوتی ہے, جیسے students, professors, parents, sponsors, اور ہر ایک کے نیچے 3 arrows دکھاتے ہیں ک پہلے کیا ہوتا ہے, اسسے آگے کیا ہوتا ہے, اور اسکے باد کیا ہوتا ہے; Discipline 4 اسے پورا explain کرتا ہے)۔ اگر کوئی پوچھے "آپنے یہ decide کیوں کیا?", تو آپ evidence پر point کرتے ہیں۔

Practice میں, evidence آم تور پر deliverable کے اندر رہتا ہے: ایک footnote, ایک "considered and rejected" paragraph, ایک figure کے روپ میں cascade map, انت کے پاس ایک "what would change my mind" sentence۔ کبھی یہ deliverable کے پاس ایک working doc میں رہتا ہے۔ دونوں cases میں, جب کوئی پوچھے کیوں, آپ اس پر point کر سکتے ہیں۔ اگر آپ کسی بھی چیز پر point نہیں کر سکتے, تو آپ کے پاس ایسا answer ہے جسے آپ defend نہیں کر سکتے, اور 2026 میں وہ deliverable نہیں ہے۔

کیا chat link کھد ہی evidence ہے?

کبھی-کبھی۔ ایک chat session AI نے جو کہا اور آپنے جو پوچھا, سب capture کرتا ہے, جو کسی بھی reasoning receipt سے زیادا complete ہے۔ Low-stakes work کے لئے, جیسے code debug کرنا, quick research, exploratory brainstorm, chat link اکیلا اکسر کاپھی ہے۔ لیکن serious deliverables کے لئے chat link کی 3 limits ہیں: وہ دکھاتا ہے AI نے کیا کہا پر یہ نہیں ک آپنے ہر claim پر کیا decide کیا, وہ ایک busy reader کے scan کرنے کے لئے بہت لنبا ہے, اور وہ نہیں دکھاتا ک AI کہاں غلط تھا (catches آپ کے head میں رہتے ہیں, transcript میں نہیں)۔ Chat link کو raw material کی طرح treat کریں, جیسے ایک academic paper raw data کو treat کرتا ہے۔ Reasoning receipt یا memo وہ deliverable ہے جو آپ audience کو دیتے ہیں; chat link appendix یا footnote میں جاتا ہے, ان لوگوں کے لئے جو verify کرنا چاہیں۔

Practice میں یہ کیسا دکھتا ہے۔ Opening والے Person A اور Person B یاد کریں: same problem, same AI, different outcomes۔ Friday morning, انکا boss دونوں سے پوچھتا ہے: "آپنے یہ recommend کیوں کیا?" Person B کے پاس point کرنے کو کچھ نہیں۔ وہ AI کی مدد سے بنا document forward کرتی ہے اور کہتی ہے ک یہ سہی لگا۔ Boss اسے پڑھتا ہے, 2 claims سے disagree کرتا ہے, اور اب جاننے کا کوئی تریکا نہیں ک Person B نے ان claims کو examine کیا تھا یا بس accept کر لیا تھا۔ Person A اپنا working doc کھولتی ہے اور کہتی ہے: "Monday کو میں نے predict کیا تھا ک experienced hire better choice ہوگا۔ AI کی analysis نے وہ prediction flip کر دی, اور یہاں ہے ک میں نے اپنا mind کیوں بدلا: 3 claims جو میں نے check کیں, 1 جسے میں نے reject کیا, اور وہ assumption جو میری recommendation واپس بدل دیگی۔" Same problem۔ دو بلکہل الگ conversations۔

Evidence آپکو ابھی, اسی deliverable میں, کیا دیتا ہے? 2 چیزیں۔ ایک: لکھنے کا act thinking کو force کرتا ہے۔ آپ ایک specific prediction تب تک نہیں لکھ سکتے جب تک پہلے یہ decide ن کر لیں ک آپ سچ میں کیا believe کرتے ہیں, اور آپ کسی claim کو REJECT تب تک mark نہیں کر سکتے جب تک پہلے explain ن کریں ک کیوں۔ لکھے بنا, thinking skip کرنا بہت آسان ہے: آپ AI کا polished answer پڑھتے ہیں, وہ سہی لگتا ہے, اور آپ اسے اپنا بنا لیتے ہیں بنا کبھی ایک position بنائے جسسے اسکی تلنا ہو۔ لکھنا وہ part ہے جسے fake نہیں کیا جا سکتا۔ دو: written record ایک working tool ہے, صرف audit trail نہیں۔ جس bank manager نے لکھا "my recommendation is to close the branches, because I think most of these customers are app-only" اور پھر دیکھا ک AI ایسا data لیکر آیا جس میں صرف 45% app-only تھے, اس نے صرف ایک disagreement document نہیں کیا: اسکی position اور data کے بیچ کا gap اسکی report کی opening line اور اسکی recommendation کی spine بن گیا۔ Record وہ surface ہے جس پر thinking کا second pass ہوتا ہے, اور second pass ہی وہ جگہ ہے جہاں deliverable اسل میں improve ہوتا ہے۔

بدلا یہ نہیں ک چیزیں لکھ لینے کی habit ہے۔ بدلی ہے اسے skip کرنے کی cost۔ جب polished output expensive تھا, hard part چیز بنانا تھا۔ AI نے polished output free کر دیا۔ Bottleneck کام produce کرنے سے اسے evaluate کرنے پر shift ہو گیا, اور written evidence ہی وہ تریکا ہے جسسے آپ evaluation کرتے ہیں۔ Tools ہر 6 months میں بدلتے ہیں; یہ نہیں بدلتا۔

مکھی باتیں (5 bullets)

آپنے ابھی rule سیکھا۔ باکی page جن 6 habits کو سکھائیگا, انمیں سے 5 یہاں ہیں, پہلے short version, full version نیچے کے sections میں۔ Bullets بتاتی ہیں ک کیا کرنا ہے; sections دکھاتے ہیں ک کیسے۔ (چھٹھی habit, یانی common advice کہاں ٹوٹتی ہے, ایک bullet سے زیادا setup چاہتی ہے اور اپنا section رکھتی ہے۔)

AI سے پوچھنے سے پہلے سوچیں۔ کوئی بھی AI tool کھولنے سے پہلے لکھیں ک آپکو answer کیا لگتا ہے۔ کیوں? کیونک AI کا answer پڑھتے ہی وہ آپکی thinking پر کبزا کر لیتا ہے۔ اگر AI کچھ reasonable لگنے والا کہتا ہے, تو آپ بنا realize کئے اسے اپنا بنا لینگے۔ پہلے اپنا answer لکھنا آپ کے independent judgment کو protect کرتا ہے۔
جو آپنے accept کیا اور جو reject کیا اسکا ایک written record رکھیں۔ جب AI آپکو claims یا recommendations دے, ہر ایک پر جائیں اور لکھیں: کیا میں اسسے agree کرتا ہوں? کیا disagree کرتا ہوں? کیا AI کچھ important miss کر گیا? ہر ایک کے لئے why explain کرتا ایک sentence لکھیں۔ اگر آپ AI کی ہر بات سے بنا کہیں push back کئے agree کرتے ہیں, تو شاید آپنے hard enough think نہیں کیا۔
Polished writing اور correct writing ایک چیز نہیں ہے۔ AI ہمیشا confident اور professional لگتا ہے, even when it is wrong. 6 specific طرح کے errors smooth-sounding AI output کے اندر چھپتے ہیں (آپ نیچے چھہوں سیکھینگے)۔ AI نے جو لکھا اسے send, publish, یا اس پر act کرنے سے پہلے ہر type کو name سے check کریں۔
Obvious answer کبھی complete answer نہیں ہوتا۔ جب AI ایک decision analyze کرتا ہے, تو وہ آپکی پوچھی ہوئی چیز پر focus کرتا ہے اور side effects ignore کر دیتا ہے۔ کسی بھی important decision سے پہلے, الگ-الگ affected people اور groups میں آگے کیا ہوتا ہے trace کریں۔ ایسی جگہیں کھوجیں جہاں side effects واپس آکر original decision کو undo کرتے ہیں۔
Best results AI کے ساتھ کام کرنے سے آتے ہیں, اسے wheel سونپنے سے نہیں۔ اکیلے کام کرنا slow ہے۔ AI کو سب کچھ کرنے دینا generic output دیتا ہے۔ Winning approach: thinking اور deciding آپ کرتے ہیں, research اور drafting AI کرتا ہے۔ اگر آپ اسے الٹ دیتے ہیں (AI thinks, آپ بس edit کرتے ہیں), تو آپ unnecessary ہو جاتے ہیں۔ جو لوگ بس AI کے answers pass along کرتے ہیں, انہیں eventually AI ہی replace کر دیگا۔

پورا framework: 6 disciplines

اوپر کی 5 bullets working summary ہیں۔ یہاں پورا architecture ہے: 6 disciplines, جنہیں وے جن AI failure modes کا answer دیتی ہیں انکے ساتھ one-to-one pair کیا گیا ہے, اور 3 parts میں grouped۔

Figure 1: 6 disciplines, 6 AI failure modes سے map ہوتی ہیں, 3 parts میں arranged۔

یہ 3 parts order میں چلتے ہیں۔ Part 1, Foundations, AI سے پوچھنے سے پہلے سوچنے کے بارے میں ہے: پہلے اپنی position لیں, پھر ہر answer پر آپ جو decide کرتے ہیں اسے track کریں۔ Part 2, Detection, AI جو غلط کرتا ہے اسے spot کرنے کے بارے میں ہے: confident prose میں دبی غلطیاں, اور وے side effects جنہیں وہ کبھی trace نہیں کرتا۔ Part 3, Origination, اس thinking کے بارے میں ہے جو AI آپ کے لئے نہیں کر سکتا: common advice کہاں ٹوٹتی ہے یہ کھوجنا, اور جب AI کبزا کرنے کی کوشش کرے تب اپنا judgment in charge رکھنا۔ ہر part اسسے پہلے والے پر depend کرتا ہے۔

اس page پر 4 terms بار-بار آتے ہیں۔ ایک discipline وہ thinking habit ہے جسے آپ practice کرتے ہیں, یانی کچھ جو آپ کرتے ہیں۔ ایک failure mode وہ specific تریکا ہے جسسے AI آپکو mislead کرتا ہے, یانی کچھ جو AI کرتا ہے۔ ہر discipline اس failure mode کے ساتھ one-to-one paired ہے جسکا وہ answer دیتی ہے (figure میں ہر discipline name کے نیچے italic line میں دکھایا گیا)۔ Course کا ایک part ایسے disciplines کو group کرتا ہے جنکا job ایک ہی ہے; 3 parts ہیں (Foundations, Detection, Origination), ہر ایک میں 2 disciplines, اور ہر part اگلے کو enable کرتا ہے۔ ایک deliverable وہ چیز ہے جو آپ اپنے boss, professor, یا client کو دیتے ہیں; 2026 میں یہ answer plus وہ documented evidence of thinking ہے جسنے اسے produce کیا (figure کے نیچے کا banner)۔

Figure میں ہر numbered box ایک discipline ہے۔ نیچے کی small caps line action line ہے: وہ ایک specific action جو وہ discipline آپسے مانگتی ہے, ایک sticky note پر fit ہونے جتنا لکھا ہءآ۔ Discipline name بتاتا ہے ک habit کو کیا کہتے ہیں; action line بتاتی ہے ک actually کرنا کیا ہے۔

یہاں سے شرو کریں۔ Part 1 کی 2 disciplines وہی ہیں جو AI کو آپکی جگہ سوچنے سے روکتی ہیں۔ انہیں skip کریں اور باکی 4 اپنا کام نہیں کر پائینگی۔

اس page کو کیسے پڑھیں

آپ کے پاس وقت	کیا پڑھیں	کیا skip کریں
45 minutes	Habits 1, 2, 3, اور 6 (صرف پڑھیں, exercises نہیں)	Habits 4 اور 5 (باد میں لوٹیں)
90 minutes	سبھی 6 habits + worked examples, صرف پڑھیں	AICheck submissions
ایک working day (recommended)	سب کچھ, اور ہر exercise اپنے week کے ایک real decision پر چلائیں	کچھ نہیں

یہ habits تب stick کرتی ہیں جب آپ انہیں اپنے week کی real problems پر try کرتے ہیں۔ 90 minutes میں page پڑھنا آپکو moves دکھاتا ہے۔ Real decisions پر exercises کرنا ہی انہیں آپکا بناتا ہے۔

یہ page مانتا ہے ک آپ پہلے سے سوچ سکتے ہیں۔ یہ آپکو سوچنا سکھاتا نہیں۔

یہاں کی ہر habit کو کام کرنے کے لئے کچھ چاہئے۔ Prediction Lock آپسے پہلے اپنا answer لکھنے کو کہتا ہے, پر آپ وہ تبھی کر سکتے ہیں جب آپ پہلے سے اتنا جانتے ہوں ک آپ کے پاس ایک answer ہو۔ Error Taxonomy آپسے ایک fake number spot کرنے کو کہتا ہے, پر آپ اسے تبھی spot کر سکتے ہیں جب آپ جانتے ہوں ک ایک real number کیسا دکھتا ہے۔ یہ habits آپ کے judgment کو use کرتی ہیں۔ وے اسے build نہیں کرتیں۔

تو اگر آپ ابھی بھی ایک student ہیں, تو hard work skip ن کریں۔ Summary کھد لکھیں۔ Problem set بنا AI کے solve کریں۔ ہاں, AI اسے faster کر سکتا ہے۔ پر اسے کھد کرنا ہی وہ تریکا ہے جسسے آپکا brain اتنا strong ہوتا ہے ک باد میں AI کے غلط ہونے پر اسے پکڑ سکے۔ اگر آپ کبھی hard work نہیں کرتے, تو آپکا Prediction Lock بس ایک guess ہے: AI ایک answer دیتا ہے, اور آپ کے پاس compare کرنے کو اپنا کچھ نہیں۔ Habit کام کرتی دکھتی ہے, پر وہ کھوکھلی ہے۔

Simple rule: AI کو ایک ایسی skill stretch کرنے کے لئے use کریں جو آپ کے پاس پہلے سے ہے, اسے سیکھنا skip کرنے کے لئے نہیں۔ بیس سال کے experience والا ایک accountant AI پر بہت بھروسا کر سکتا ہے, کیونک وہ پہلے سے جانتا ہے ک ایک good answer کیسا دکھتا ہے۔ ایک first-year student جسنے کبھی hand سے کام نہیں کیا, ابھی نہیں کر سکتا۔

Part 1: Foundations (posture, یانی شرو کرنے سے پہلے آپکی stance)

اگر آپ باکی سب skip کرتے ہیں, تو بھی یہ 2 habits skip ن کریں۔ یہ AI کے ساتھ لوگوں کی 2 سبسے بڑی mistakes fix کرتی ہیں:

Mistake 1: AI آپ کے لئے سوچتا ہے۔ آپ ایک question پوچھتے ہیں, AI ایک smooth answer دیتا ہے, اور اپنی رائے بنانے سے پہلے آپ اسے accept کر لیتے ہیں۔ Habit 1 (Prediction Lock) اسے fix کرتا ہے: آپ AI کھولنے سے BEFORE لکھتے ہیں ک آپکو کیا لگتا ہے۔
Mistake 2: AI کا first draft finished دکھتا ہے۔ Writing اتنی polished ہوتی ہے ک آپ اسے check کئے بنا send کر دیتے ہیں ک وہ actually correct ہے یا نہیں۔ Habit 2 (Reasoning Receipt) اسے fix کرتا ہے: آپ ہر claim پر جاتے ہیں اور لکھتے ہیں ک آپ agree کرتے ہیں, disagree کرتے ہیں, یا verify کرنا ہے۔

ساتھ میں, یہ 2 habits thinking آپ کے پاس اور typing AI کے پاس رکھتی ہیں۔ Parts 2 اور 3 کی ہر چیز انہیں پر build ہوتی ہے۔

Discipline 1: Prediction Lock

Goal ایک ہی ہے: AI کا answer آنے سے پہلے آپ کے پاس اپنی ایک written position ہو۔ نیچے جو کچھ بھی ہے, یانی 4 lines, sticky note, confidence percentage, سب اسیلئے ہیں ک وہ ایک چیز سچ میں ہو جائے۔ اگر آپ چاروں lines لکھ دیتے ہیں اور پھر بھی نہیں بتا پاتے ک AI کھولنے سے پہلے آپکی position کیا تھی, تو discipline نے کام نہیں کیا۔ اگر آپکی position clear ہے اور آپ 4 کے بجای 2 lines میں وہاں پہنچ گئے, تو discipline نے پھر بھی کام کیا۔ 4 lines ایک recipe ہیں, dish نہیں۔

Lock کے بنا آم تور پر یہ ہوتا ہے۔ آپ AI سے کوئی important question پوچھتے ہیں۔ AI ایک confident, well-written answer دیتا ہے۔ آپ سوچتے ہیں "یہ سہی لگتا ہے" اور اسی کے ساتھ چل پڑتے ہیں۔ 2 دن باد کوئی پوچھتا ہے "آپنے یہ decide کیوں کیا?" اور آپکو realize ہوتا ہے: وہ AI کا answer تھا, آپکا نہیں۔ آپنے کبھی اپنی رائے بنائی ہی نہیں۔

Fix میں 3 minutes لگتے ہیں۔ AI کھولنے سے پہلے ایک کاگز پر 4 lines لکھیں۔ پہلے کسی اور کے decision پر ساتھ ملکر try کرتے ہیں۔

Maya 13 سال کی ہے۔ اسکے school نے email کیا: ایک summer activity چنیں۔ Option 1: debate camp (2 weeks, اسکے سارے friends جا رہے ہیں)۔ Option 2: coding bootcamp (1 week, وہ curious ہے لیکن nervous بھی)۔ اسکے dad کہتے ہیں "بس ChatGPT سے پوچھ لو, اسے پتا ہوگا۔"

AI سے پوچھنے سے پہلے, Maya 4 lines لکھتی ہے:

Figure: Prediction Lock کی 4 lines, ایک worked example کے روپ میں Maya کے answers کے ساتھ۔

Line 1: یہ decision اسل میں کس بارے میں ہے?

"Debate یا coding" نہیں۔ وہ صرف surface ہے۔ نیچے کا real question شاید یہ ہے: "کیا میں وہی کرونگی جو میرے friends کرتے ہیں, یا وہ جو میں تب چنتی جب کوئی دیکھ ن رہا ہو?" یا: "کیا مجھے coding miss کرنے کا regret debate miss کرنے سے زیادا ہوگا?" Real question 1 sentence میں لکھیں۔

Line 2: وہ 1 fact کون سا ہے جو سبسے زیادا help کریگا?

"کون سا better ہے?" نہیں۔ وہ بہت vague ہے۔ کچھ specific جو آپ check کر سکیں: "کیا coding bootcamp Python سکھاتا ہے?" یہ اسلئے matter کرتا ہے کیونک اسکا school 9th grade میں already Python پڑھاتا ہے۔ اگر bootcamp وہی چیز سکھاتا ہے, تو coding کے 2 weeks زیادہ تر وہی repeat کرتے ہیں جو وہ ویسے بھی سیکھیگی۔ اگر وہ کچھ ایسا سکھاتا ہے جو اسکا school cover نہیں کرتا, تو bootcamp ایسی skill offer کر رہا ہے جو اسے کہیں اور نہیں ملتی۔

Line 3: AI کے weigh in کرنے سے پہلے آپکا decision کیا ہے?

ایک position لیں۔ "It depends" نہیں۔ "دیکھتی ہوں AI کیا کہتا ہے" نہیں۔ Debate چنیں یا coding, اور why لکھیں۔ Maya کی reasoning: وہ جانتی ہے ک school 9th grade میں Python cover کرتا ہے, bootcamp بھی سبسے زیادا سنبھاونا Python ہی cover کر رہا ہے, اور friends کے ساتھ 2 weeks کچھ ایسا سیکھنا جو اسے ایک school course سے نہیں ملتا, next year کے curriculum کے ایک repeat سے زیادا value رکھتا ہے۔ تو اسکا decision ہے debate۔

یہی وہ part ہے جسے ہر کوئی skip کرنا چاہتا ہے۔ "میں AI سے پہلے پوچھے بنا decide کیسے کروں?" آپ کر سکتے ہیں۔ آپ پہلے سے چیزیں جانتے ہیں: آپکا school کیا پڑھاتا ہے, کیا miss کرنے کا regret ہوگا, آپ کے friends کیا کر رہے ہیں۔ جو آپ جانتے ہیں اسسے ایک position بنائیں۔ ایک minute میں AI کا کام اس position کو confirm یا overturn کرنا ہے, اسے آپ کے لئے بنانا نہیں۔

Line 4: آپ کتنے confident ہیں, اور کون سا specific AI answer آپکا decision flip کر دیگا?

ایک percentage چنیں: 60%, 75%, کچھ بھی۔ Exact number matter نہیں کرتا۔ Matter یہ کرتا ہے ک آپنے commit کیا۔ پھر وہ 1 AI answer لکھیں جو آپکا mind بدل دے۔ Maya: "70% sure ک debate سہی call ہے۔ اگر bootcamp کچھ ایسا سکھاتا ہے جو میرا school نہیں سکھاتا (Rust, embedded programming, game development), تو coding جیتتی ہے کیونک وہ ایسی skill ہے جو مجھے کہیں اور نہیں ملتی۔"

اگر آپ وہ specific AI answer name نہیں کر سکتے جو آپکا decision flip کرے, تو آپنے ابھی ایک real position پر commit نہیں کیا۔ "It depends" ایک position نہیں ہے۔ "میں X کرونگا جب تک AI مجھے Y ن بتائے" ایک position ہے۔

آپکو کیسے پتا چلیگا ک lock نے کام کیا?

ایک test ہے, اور وہ lines count کرنے کے بارے میں نہیں ہے:

کیا آپ زور سے بول سکتے ہیں ک AI کھولنے سے پہلے آپکی position کیا تھی, اور کون سی چیز آپکا mind change کرتی?

اگر ہاں, lock نے کام کیا۔ Line count matter نہیں کرتا۔

اگر نہیں, یانی آپ کھد کو یہ کہتے پاتے ہیں ک "well, AI نے X کہا اسلئے میں X کے ساتھ چلا گیا" یا "میں نے سوچا اور جو AI suggest کریگا وہی decide کیا", تو lock نے کام نہیں کیا۔ Line count پھر بھی matter نہیں کرتا۔

4 lines training wheels ہیں۔ یہ goal کو skip کرنا مشکل بناتی ہیں۔ کچھ weeks کی practice کے باد آپ چاروں کو 1 paragraph یا کچھ mental notes میں compress کر سکتے ہیں, اور lock پھر بھی کام کریگا۔ لیکن پہلی 10 بار یہ 4 lines explicitly لکھیں۔ یہی جاننے کا ایکماتر تریکا ہے ک آپنے سچ میں ایک position commit کی, بجای یہ سوچنے کے ک آپنے کی۔

4 lines اسل میں کیا کر رہی ہیں

Maya کے لئے 4 lines اسلئے کام کرتی ہیں کیونک اسکا decision simple ہے: 1 binary choice, 1 fact جو اسے settle کر دیگا۔ ہر decision ایسا نہیں دکھتا۔ اسلئے 4-line template copy کرنے سے پہلے دیکھیں ک ہر line اندر سے کیا کر رہی ہے۔ Maya کی lines ایک ایسے process کی 1 instance ہیں جو decisions بدلنے پر بھی, form بدلنے کے باوجود, same رہتا ہے۔

Prediction Lock کے 4 parts ہیں۔ کسی بھی decision کے لئے یہی 4 parts ہوتے ہیں:

Real decision surface کریں۔ Label ہٹائیں۔ Maya کا surface decision "debate یا coding" تھا۔ اسکا real decision تھا "friends کو follow کروں یا اپنی choice کروں"۔ Bank manager کا surface decision "2 branches close کرنا" تھا۔ اسکا real decision تھا "ایسے customer base کے ساتھ کیا کرنا جو app پر shift ہو چکا ہے"۔ Label ہمیشا actual question چھپاتا ہے۔ Actual question name کریں۔
وہ چیز identify کریں جو اسے settle کریگی۔ کون سی information مل جائے تو decision obvious ہو جائیگا? Maya کے لئے, 1 fact (کیا bootcamp Python پڑھاتا ہے?)۔ 3 candidates والے ایک hiring decision کے لئے, شاید 3 facts (کیا ہر candidate کے پاس وہ specific skill ہے جو ہمیں سبسے زیادا چاہئے?)۔ 5 categories میں budget allocation کے لئے, شاید ایک comparison (marginal dollar پر کس category کا return سبسے کم ہے?)۔ Facts اتنے specific name کریں ک آپ ہر ایک verify کر سکیں۔ Number decision پر depend کرتا ہے; یہ requirement ک وے checkable ہوں, نہیں بدلتی۔
ایک position commit کریں۔ جو آپ پہلے سے جانتے ہیں اسکے آدھار پر, AI سے کچھ بھی check کرنے سے پہلے, آپ کیا کریں گے? اسے support کرتی reasoning کے ساتھ لکھیں۔ Maya کے لئے: debate, کیونک school already Python cover کرتا ہے۔ ایک hiring decision کے لئے: ایک specific candidate name کریں, reason کے ساتھ۔ ایک budget cut کے لئے: line items name کریں, reason کے ساتھ۔ ایک position ایک what plus a why ہے, صرف ایک what نہیں۔
Reversal condition name کریں۔ کون سی specific finding position بدل دیگی? Maya: اگر bootcamp کچھ ایسا سکھاتا ہے جو school cover نہیں کرتا, coding جیتتی ہے۔ ایک hire کے لئے: اگر second candidate کا reference check top candidate کے مقابلے significantly stronger آئے, تو switch کریں۔ ایک budget cut کے لئے: اگر Category X کا projected revenue 30% سے زیادا off ہو, تو کسی اور category کو cut کریں۔ اگر آپ یہ name نہیں کر سکتے ک کیا آپکو flip کریگا, تو آپنے commit نہیں کیا: آپ کے پاس ایک preference ہے۔

Maya کی sticky note 4 lines میں fit ہو جاتی ہے کیونک اسکا decision اتنا چھوٹا ہے ک ہر part 1 line میں fit ہو جاتا ہے۔ ایک بڑا decision, جیسے ایک hiring round, ایک strategic pivot, ایک major purchase, ہر part کے لئے ایک paragraph لے سکتا ہے اور ایک A4 page بھر سکتا ہے۔ ایک چھوٹا decision, جیسے lunch کے لئے کیا order کریں جب آپ سچ میں care کرتے ہوں, ایک single index card پر fit ہو سکتا ہے۔

Different shape والا ایک worked example: مان لیں آپ 3 software engineers میں سے 1 hire کر رہے ہیں اور decide کرنے کے لئے 1 week ہے۔

Real decision: "paper پر کون best ہے" نہیں, بلکہ "ان تینوں میں سے کون 12 months باد بھی productive رہے گا جب codebase 2 بار بدل چکا ہوگا۔"
What would settle it: 3 چیزیں, 1 نہیں۔ ہر candidate کا long projects پر track record, unfamiliar tools سیکھنے کی انکی willingness, اور ایک previous manager کا reference جسنے ایک tough quarter میں انہیں دیکھا۔
Your position: Candidate B, کیونک previous job میں اسکا 2-year stint durability suggest کرتا ہے, اور اسکا side project دکھاتا ہے ک وہ بنا کہے new tools pick کر لیتی ہے۔
What flips you: اگر Candidate A کا reference کہے ک اس نے past year کا hardest project ship کیا, تو A پر switch کریں۔ اگر Candidate C کا reference کوئی communication issue flag کرے, تو B stays۔

یہ Maya والا ہی Prediction Lock ہے۔ الگ decision, ہر part کے نیچے لکھی الگ amount, same 4 parts۔

4 lines کیوں? صرف 1 کیوں نہیں?

یہ وہ question ہے جو لگبھگ ہر reader پوچھتا ہے, آم تور پر Line 3 پر ("کیا میں بس decision نہیں لکھ سکتا?")۔ Answer no ہے, اور یہ سمجھنا worth ہے ک کیوں۔

ہر line ایک failure mode پکڑتی ہے جسے باکی نہیں پکڑ سکتیں۔ انہیں 1 line میں compress کریں اور آپ specific چیزیں کھو دیتے ہیں:

Line 1 skip کریں, اور آپ غلط question کا answer دیتے ہیں۔ Maya کا surface decision "debate یا coding" ہے۔ اسکا real decision "friends کو follow کروں یا اپنی choice کروں" ہے۔ انکے answers الگ ہیں۔ Bank manager کا surface decision "2 branches close کرنا" تھا۔ اسکا real decision "ایسے customer base کے ساتھ کیا کرنا جو app پر shift ہو چکا ہے" تھا۔ Label ہمیشا actual question چھپاتا ہے۔ Line 1 اسے surface کرتی ہے۔
Line 2 skip کریں, اور آپکا AI prompt lock کو collapse کر دیتا ہے۔ پوچھنے کے لئے ایک specific question کے بنا, reader default روپ سے "مجھے کون سا pick کرنا چاہئے?" پر آ جاتا ہے, جو AI کو decision بنانے کا ایک open-ended invitation ہے۔ Line 2 ایک closed, verifiable question force کرتی ہے جسے AI یا تو confirm یا contradict کر سکے۔ "کیا bootcamp Python پڑھاتا ہے?" checkable ہے۔ "کون سا camp better ہے?" نہیں۔
Line 3 skip کریں, اور AI کے answer سے compare کرنے کو کچھ نہیں بچتا۔ یہ کھد lock ہے۔ Lines 1 اور 2 اسے set up کرتی ہیں; Line 4 اسے specific بناتی ہے۔ پر Line 3 وہ line ہے جو آپکو ایک position دیتی ہے جسے AI کا confident answer آنے پر آپ defend کر سکیں۔
Line 4 skip کریں, اور آپ کے پاس ایک hope ہے, commitment نہیں۔ "میں debate pick کرتا ہوں" ایک decision لگتا ہے۔ پر جب تک آپ وہ specific AI answer name نہیں کرتے جو اسے flip کریگا, آپ نہیں بتا سکتے ک آپنے سچ میں commit کیا یا آپ اس moment position چھوڑ دینگے جب AI کچھ اور suggest کرے۔ Line 4 commitment کو specific ہونے پر force کرتی ہے۔ یہ وہ line بھی ہے جو آپکو, months later, check کرنے دیتی ہے ک آپکا gut calibrated تھا یا نہیں, "میں نے 70% کہا تھا اور opposite نکلا", اور یہی ایکماتر تریکا ہے جسسے judgment وقت کے ساتھ improve ہوتا ہے۔

One-line version try کریں اور کھد دیکھیں۔ "مجھے لگتا ہے Maya کو debate pick کرنا چاہئے" ایک casual preference ہے, prediction lock نہیں۔ یہ نہیں کہتا ک اسل میں stake پر کیا ہے, یہ نہیں کہتا ک کون سا AI question اسے settle کریگا, اور یہ نہیں کہتا ک کیا آپکا mind بدلیگا۔ جو reader صرف وہ single line لکھتا ہے, وہ AI کا two-paragraph response پڑھیگا اور بنا resistance کے اسے adopt کر لیگا, کیونک line میں resist کرنے کے لئے کچھ ہے ہی نہیں۔

4 lines surface پر similar دکھتی ہیں (وے سب "آپکی position" کے بارے میں ہیں) پر الگ چیزیں پکڑتی ہیں۔ Discipline 4 اسلئے مانگتی ہے کیونک experience دکھاتا ہے ک جو کوئی ایک skip کرنے کی کوشش کرتا ہے, وہ اسی specific failure mode میں گر جاتا ہے جسے وہ line پکڑتی ہے۔

ایک pedagogical reason بھی ہے۔ 4 lines اتنی short ہیں ک ایک reader سچ میں کر سکے (3 minutes, ایک sticky note پر fit), پر اتنی long ک لکھنے کا act thinking کو force کرے۔ 1 line بہت short ہے: آپ اسے بنا سوچے لکھ سکتے ہیں۔ 10 lines بہت long ہیں: آپ exercise پوری طرح skip کر دینگے۔ 4 وہ floor ہے جہاں thinking کو سچ میں ہونا پڑتا ہے, اور وہ ceiling ہے جہاں ایک busy reader ایک meeting سے پہلے Tuesday morning کو بھی اسے کریگا۔

تو: 1 line اگر آپکو ایک prediction lock کی appearance چاہئے۔ 4 lines اگر آپکو چیز کھد چاہئے۔

Maya کی sticky اب یہ کہتی ہے:

کیا چل رہا ہے: کیا وہ وہی کریگی جو اسکے friends کر رہے ہیں, یا وہ جو اکیلے ہوتی تو چنتی۔

وہ question جو help کریگا: کیا bootcamp Python use کریگا (جو اسکا school 9th grade میں already پڑھاتا ہے)?

Decision: Debate۔ 2 weeks friends کے ساتھ, کچھ ایسا سیکھنا جو school offer نہیں کرتا, next year کے curriculum کے ایک 1-week repeat سے بیہتر ہے۔

Confidence + کیا flip کریگا: 70%. اگر bootcamp Rust, embedded systems, یا کچھ بھی ایسا سکھاتا ہے جو اسکا school cover نہیں کرتا, تو coding جیتتی ہے۔

اب وہ اپنا question ChatGPT میں type کرتی ہے۔ یہ actual prompt ہے جو وہ paste کرتی ہے:

My school's summer program runs a one-week coding bootcamp. I'm trying
to figure out one thing: will it teach Python? My school already teaches
Python in 9th grade, so I want to know if there's overlap. Just answer
the question. Don't recommend which camp I should pick.

Lock نے question بدل دیا۔ Sticky note پر 4 lines کے بنا, Maya نے AI سے پوچھا ہوتا "مجھے debate pick کرنا چاہئے یا coding?", ایک open question جو decision AI کو سونپ دیتا ہے۔ Lock کے ساتھ, اسکے پاس already ایک decision ہے; اسے اسے confirm یا overturn کرنے کے لئے صرف 1 fact چاہئے۔ تو وہ بجای ایک closed question پوچھتی ہے۔ AI کا role decision-maker سے fact-checker میں shift ہو جاتا ہے۔ وہی shift ہے جو discipline produce کرتی ہے۔ 4 lines نے صرف Maya کی thinking clarify نہیں کی: انہوننے reassign کیا ک اس conversation میں کون کیا کرتا ہے۔

ChatGPT لوٹاتا ہے: "Most one-week coding bootcamps for middle schoolers cover Python basics in the first two to three days." Maya اسے اپنی sticky note کے بگل میں رکھتی ہے۔ AI کا answer (Python) اس answer سے match کرتا ہے جسکے لئے وہ تییار تھی۔ اسکا decision (debate) hold کرتا ہے, اس reason کے لئے جو اس نے لکھ رکھا تھا, اسلئے نہیں ک AI نے اسے بتایا۔

Dinner پر اسکے dad پوچھتے ہیں کیوں, اور Maya کے پاس ایک real answer ہے: "Bootcamp Python cover کرتا ہے اور میرا school next year ویسے بھی وہی پڑھا رہا ہے۔ میں اپنے friends کے ساتھ 2 weeks debate سیکھنا پسند کرونگی, جو school بلکہل offer ہی نہیں کرتا۔" وہ اسکی reasoning ہے۔ AI نے اسکے اندر کا 1 fact confirm کیا۔

اسکی تلنا lock کے بنا والے version سے کریں۔ Maya ChatGPT کھولتی ہے, پوچھتی ہے "مجھے debate camp pick کرنا چاہئے یا ایک 1-week coding bootcamp?" ChatGPT ایک balanced two-paragraph answer لکھتا ہے جو "دونوں valuable ہیں; دیکھیں ک آپکو سبسے زیادا کیا energize کرتا ہے" پر کھتم ہوتا ہے۔ Maya اسے پڑھتی ہے, debate pick کرتی ہے کیونک وہیں اسکے friends جا رہے ہیں, اور dinner پر کہتی ہے "ChatGPT نے کہا دونوں اچھے ہیں, تو میں debate کے ساتھ چلی گئی۔" Decision وہی ہے۔ Reasoning گایب ہے۔ 2 دن باد وہ explain نہیں کر پاتی ک اس نے جو چنا وہ کیوں چنا۔

ایک بار آپ AI کا answer پڑھ لیتے ہیں, آپ اسے un-read نہیں کر سکتے۔ آپ یہ بھی نہیں بتا سکتے ک اسکے بنا آپنے کیا سوچا ہوتا۔ آپ بس 2 دن باد notice کرتے ہیں ک آپ ٹھیک سے explain نہیں کر پا رہے ک آپنے جو decide کیا وہ کیوں کیا۔ آپنے AI کا answer absorb کر لیا۔ آپنے اپنا answer earn نہیں کیا۔

2 flows compare کئے گئے ہیں۔ Lock کے بنا: problem سے AI's answer, پھر "Makes sense" agreement, پھر inherited position۔ Lock کے ساتھ: problem سے sealed prediction, پھر AI's answer, پھر compare, پھر decide۔ Answer آنے سے پہلے sealed, ورنا یہ prediction ہے ہی نہیں۔

یہی discipline بڑے decisions پر بھی کام کرتی ہے۔ ایک bank manager کو decide کرنا تھا ک پیسے گنوا رہی 2 branches close کریں یا نہیں۔ AI سے پوچھنے سے پہلے, اس نے اپنی 4 lines لکھیں:

Line 1 (یہ اسل میں کس بارے میں ہے): Branches پیسے اسلئے گنوا رہی ہیں کیونک اب زیادہ تر customers in-person آنے کے بجای app use کرتے ہیں۔ Real question یہ ہے ک کیا اتنے customers ابھی بھی walk in کرتے ہیں ک branches کھلی رکھنا justify ہو۔

Line 2 (وہ 1 fact جو اسے settle کرے): ان branches کے کتنے percent customers app-only ہیں (کبھی branch نہیں آتے)?

Line 3 (AI کے weigh in کرنے سے پہلے میرا decision): Branches close کریں۔ Customer-service team کے ساتھ کام کرنے کا میرا experience بتاتا ہے ک انمیں سے زیادہ تر customers سالوں پہلے walk in کرنا بند کر چکے۔ 2 سال پہلے میں یہ predict نہیں کرتی, لیکن app launch کے باد سے pattern clear ہے۔

Line 4 (confidence + کیا flip کریگا): 60% sure۔ اگر آدھے سے کم customers app-only ہیں, تو اسکا متلب ایک real walk-in base ابھی بھی موجود ہے, اور branches close کرنے سے وے customers پوری طرح کھو جائیں گے۔ اس case میں branches کھلی رکھیں۔

پھر اس نے اپنے bank کا customer data نکالا اور Claude سے پوچھا:

I have transaction data for two branches we're considering closing.
For each customer who used these branches in the last 12 months,
I need to know what percentage NEVER walked into a branch and
only used the mobile app. Just give me the percentage. Don't
recommend whether to close the branches.

Claude نے 45% لوٹایا۔ یہ اسکے 50% threshold سے کم ہے, یانی اسکی Line 4 flip ہو گئی: branches close کرنا اب سہی call نہیں تھا۔

لیکن زیادا interesting چیز تھی اسکی expectation (زیادہ تر customers app-only) اور data (صرف 45%) کے بیچ کا gap۔ اس gap نے اسے بتایا ک اس نے overestimate کیا تھا ک customer base کتنی دور شپھٹ ہو چکا ہے۔ اس نے دونوں findings اپنی report میں use کیں: data نے اسکی recommendation "close" سے "keep open" میں flip کی, اور gap اسکی opening line بن گیا: "مجھے امید تھی ک انمیں سے زیادہ تر customers app-only ہونگے; data دکھاتا ہے صرف 45% ہیں, جو recommendation بدل دیتا ہے۔" آخر میں اس نے ایک middle path propose کیا: branches reduced staff hours کے ساتھ کھلی رکھیں, کیونک 55% customers ابھی بھی walk in کر رہے تھے, پر full-day levels پر نہیں۔

Prediction Lock کے بنا, وہ جو بھی AI کہتا اسے accept کر لیتی اور کبھی notice نہیں کرتی ک اسکی اپنی assumption off تھی, اور middle path (reduced hours) surface نہیں ہوتا, کیونک اسکے پاس notice کرنے کو کوئی gap ہی نہیں ہوتا۔

Maya کی 4 lines اور bank manager کی 4 lines surface پر الگ دکھتی ہیں۔ وے same Prediction Lock ہیں: same 4 parts, الگ size کے decisions پر apply۔

اب آپکی باری

آپنے Maya کے لئے already 4 lines لکھ دیں۔ آپ وہی lines نیچے کے boxes میں paste کر سکتے ہیں۔ یا, اگر آپ کے پاس اپنا کوئی decision ہے, تو اس پر 4 lines try کریں۔ For example: کچھ جو آپ کھریدنا چاہتے ہیں, 2 plans جنمیں سے آپ چن رہے ہیں, ایک conversation جسے آپ ٹالتے رہتے ہیں, یا ایک class جسکے بارے میں آپ sure نہیں ہیں۔

پہلے اپنی 4 lines لکھیں۔ پھر اس prompt سے AI سے اپنا Line 2 question پوچھیں:

I'm trying to decide [describe your situation in 1-2 sentences].

My question is: [paste your Line 2 question here].

Just answer that one question. Don't make the decision for me.

یہ same prompt کا Maya والا version ہے, اسکی sticky note سے filled in:

I'm trying to decide between two summer camps. One is a one-week
coding bootcamp; the other is a two-week debate camp where all my
friends are going.

My question is: does the bootcamp teach Python? My school already
teaches Python in 9th grade, so I want to know if there's overlap.

Just answer that one question. Don't make the decision for me.

ChatGPT کا response:

Most one-week coding bootcamps for middle schoolers cover Python
basics in the first two to three days, then move on to a small
project using those basics. Some bootcamps add light JavaScript or
web concepts later in the week, but Python is almost always the
core language.

Maya اسے اپنی Line 4 کے ساتھ رکھتی ہے۔ اسکی Line 4 کہتی تھی ک coding صرف تبھی جیتیگی جب bootcamp کچھ ایسا سکھائے جو اسکا school cover نہیں کرتا۔ AI نے confirm کیا ک Python core ہے, یانی وہی جو اسکا school already 9th grade میں پڑھاتا ہے۔ یہ اسکی flipping condition نہیں ہے۔ اسکا decision رہتا ہے: debate۔

Prompt میں صرف Lines 1 اور 2 جائیں۔ Line 3 (آپکا decision) اور Line 4 (کیا آپکا mind بدلیگا) AI کے دیکھنے والے page سے باہر رکھیں۔ اگر AI کو پتا ہو ک آپنے کیا commit کیا ہے, تو وہ اکسر آپسے agree کرتا ہے, اور آپ وہ comparison کھو دیتے ہیں جسکے لئے lock بنا تھا۔

پھر AI کے answer کو اپنی Line 4 سے compare کریں۔ آپنے ایک specific finding لکھی تھی جو آپکا mind بدل دیتی۔ کیا AI نے وہ finding بتائی یا نہیں?

اگر AI کا answer وہ نہیں ہے جو آپکو flip کرتا, آپکا Line 3 decision hold کرتا ہے۔ آپ اسے اپنی لکھی reason سے defend کر سکتے ہیں۔ Maya کا case (جو اسل میں ہءآ): اسکی Line 4 کہتی تھی ک coding صرف تبھی جیتیگی جب bootcamp Rust یا کچھ ایسا سکھائے جو اسکا school cover نہیں کرتا۔ AI نے کہا bootcamp Python سکھاتا ہے, یانی وہی جو اسکا school already پڑھاتا ہے۔ یہ flipping condition نہیں ہے۔ اسکا decision رہتا ہے: debate۔
اگر AI کا answer exactly وہی ہے جو آپکو flip کرتا, آپکا decision بدلتا ہے, اس reason کے لئے جو آپنے advance میں set کیا تھا, اسلئے نہیں ک AI confident لگا۔ Maya کا case اگر AI کچھ اور کہتا: مان لیں AI نے لوٹایا ہوتا "bootcamp embedded systems سکھاتا ہے, Python نہیں۔" وہ Maya کی Line 4 پر exactly hit کرتا (school embedded systems نہیں سکھاتا)۔ وہ coding پر switch کر جاتی, اس reason کے لئے جس پر اس نے Monday کو commit کیا تھا, اسلئے نہیں ک AI نے اسے sell کیا۔
اگر AI کا answer بیچ میں کہیں ہے, اپنی Line 3 reasoning پر واپس جائیں۔ کیا new information اسے سچ میں weak کرتی ہے? اگر ہاں, اپنا decision بدلیں اور why لکھیں۔ اگر نہیں, آپکا decision پھر بھی hold کرتا ہے۔ Maya کا case اگر AI ambiguous ہوتا: مان لیں AI نے کہا ہوتا "bootcamp پہلے 3 days Python cover کرتا ہے پھر React introduce کرتا ہے۔" React ایسی چیز ہے جو اسکا school نہیں سکھاتا, پر وہ bootcamp کے صرف 2 days ہیں۔ Maya اپنی Line 3 پھر پڑھتی ہے: case تھا "friends کے ساتھ 2 weeks debate سیکھنا, 1 week زیادہ تر Python repeat کرنے سے بیہتر ہے۔" 2 days React اسے نہیں بدلتے: bootcamp ابھی بھی زیادہ تر repeat material ہے۔ اسکا decision رہتا ہے۔

اگر AI answer دینے کے بجای hedge کرے, 1 اور sentence کے ساتھ پھر پوچھیں: "Just give me the specific information; don't qualify it." اگر AI ایک clarifying question پوچھے, اسکا answer دیں پر add کریں: "Then answer the original question." Goal ایک concrete answer ہے جسے آپ اپنی Line 4 کے بگل میں رکھ سکیں, "it depends on several factors" کا ایک paragraph نہیں۔ اگر آپکا دوسرا attempt بھی ایک usable answer نہیں دیتا, تو آپکا Line 2 question شاید بہت broad ہے۔ اسے زیادا specific ہونے کے لئے rewrite کریں, پھر دوبارا try کریں۔

Lock revise کرنے پر ایک note. اگر AI کا answer آپکو realize کرائے ک آپکی Line 4 غلط تھی, یانی آپنے غلط flipping condition name کی, تو یہ honor کرنے لایک ایک real signal ہے, پر دھیان رکھیں ک آپ کب revise کرتے ہیں۔ AI کے answer پر react کرنے کا decide کرنے سے پہلے Line 4 revise کرنا ٹھیک ہے; آپنے کچھ miss کیا تھا جو آپکو دکھا, اور آپ اپنی thinking update کر رہے ہیں۔ AI کا answer آ جانے کے باد Line 4 revise کرنا تاک answer ایک flip ن گنے, lock کو defeat کرتا ہے۔ Test یہ ہے: کیا آپ نئی Line 4 AI کا answer دیکھے بنا بھی لکھتے? اگر ہاں, revise کریں۔ اگر نہیں, آپکی پرانی Line 4 کایم رہتی ہے۔

Check کریں ک lock نے کام کیا۔ زور سے یہ sentence پورا کرنے کی کوشش کریں: "میں نے یہ اسلئے decide کیا کیونک..." اگر آپ اسے "AI نے کہا" شبدوں کے بنا کر سکتے ہیں, تو lock نے کام کیا۔ اگر نہیں کر سکتے, تو وہ line کھوجیں جو آپنے skip کی۔

وہ sentence, جسے آپ زور سے پورا کر سکتے ہیں, documented evidence of thinking کا سبسے چھوٹا ٹکڑا ہے جو آپ produce کر سکتے ہیں۔ یہ وہی چیز ہے جسکے بارے میں اس page کے top کا rule ہے: ایک polished answer نہیں جو AI نے آپکو دیا, بلکہ ایک reason جس پر آپ point کر سکیں۔ نیچے کی ہر discipline اسی ایک evidence کے ٹکڑے پر build ہوتی ہے۔ اسے کام کرا لیں, اور باکی آسان ہو جاتی ہیں۔

نیچے کی exercise یہ check نہیں کرتی ک آپکا decision "سہی" ہے یا نہیں۔ یہ صرف یہ check کرتی ہے ک آپکی 4 lines clear ہیں یا نہیں: کیا آپنے real decision name کیا? کیا آپکا question specific ہے? کیا آپکی position committed ہے ("it depends" نہیں)? کیا آپنے وہ specific AI answer name کیا جو آپکو flip کریگا? آپکی پہلی try messy ہو تو ٹھیک ہے۔

1Your Work

آپ کے پاس boxes میں ڈالنے کے لئے 2 options ہیں۔ Option 1: Maya کے لئے 4 lines لکھیں, یانی اسکا decision (debate camp vs. coding bootcamp) use کریں اور ہر line کیا کہنی چاہئے اسکا اپنا version لکھیں۔ Grader check کریگا ک آپکی lines clear ہیں یا نہیں۔ Option 2: اپنے week کے کسی real decision کے لئے 4 lines لکھیں, یانی کچھ جسے آپکو سچ میں figure out کرنا ہے۔ Grader وہی چیز check کریگا۔ دونوں option چلتے ہیں; discipline same ہے۔

اگر آپ Option 1 چن رہے ہیں, تو reference کے لئے Maya کی lines یہ ہیں:

Line 1 (کیا چل رہا ہے): کیا وہ وہی کریگی جو اسکے friends کر رہے ہیں, یا وہ جو اکیلے ہوتی تو چنتی۔

Line 2 (وہ question جو help کریگا): کیا bootcamp Python use کریگا (جو اسکا school 9th grade میں already پڑھاتا ہے)?

Line 3 (decision): Debate۔ 2 weeks friends کے ساتھ, کچھ ایسا سیکھنا جو school offer نہیں کرتا, next year کے curriculum کے ایک 1-week repeat سے بیہتر ہے۔

Line 4 (confidence + کیا flip کریگا): 70%. اگر bootcamp Rust, embedded systems, یا کچھ بھی ایسا سکھاتا ہے جو اسکا school cover نہیں کرتا, تو coding جیتتی ہے۔

چاروں boxes بھریں اور submit click کریں۔ Grader ہر line کو score کرتا ہے اور بتاتا ہے ک کیا improve کریں, ٹھیک ویسے جیسے ایک teacher آپکی homework فوراً check کر رہا ہو۔

Prediction Lock: Four Lines

Line 1: یہ decision اسل میں کس بارے میں ہے? (Label کے نیچے کا real decision name کریں۔)

Line 2: وہ 1 question جسکا answer آپکو decide کرنے میں help کرے۔ (Closed اور verifiable, open-ended نہیں۔)

Line 3: آپکا decision اور آپنے وہ کیوں لیا۔ (Reasoning کے ساتھ ایک committed position, guess نہیں۔)

Line 4: آپ کتنے sure ہیں, اور کون سا specific AI answer آپکا decision flip کریگا?

2Get Your Score

Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.

پہلی بار اوقتں لگبھگ 8 minutes لگتے ہیں۔ Score ملنے کے باد, کوئی 1 جگہ کھوجیں جہاں آپکو لگتا ہے AI grader غلط ہے۔ وہی اس exercise کا سبسے useful ہسا ہے۔

یہ Discipline 1 کا آدھا ہسا cover کرتا ہے۔ دوسرا آدھا (AI جو کہتا ہے اسکا track رکھنا اور decide کرنا ک کن parts سے آپ agree کرتے ہیں, disagree کرتے ہیں, یا انہیں change کرنا چاہتے ہیں) Discipline 2 ہے۔

یہ کام کیوں کرتا ہے (اسکے پیچھے کی research)

Prediction Lock کوئی نیا idea نہیں ہے۔ یہ 3 پرانی techniques کا AI-era version ہے, جنمیں سے ہر ایک decades سے study کی گئی ہے۔

Premortem (Gary Klein, 2007). ایک project شرو ہونے سے پہلے, team کلپنا کرتی ہے ک وہ already fail ہو چکا ہے اور سارے reasons لکھ لیتی ہے ک کیوں۔ Failure reasons کو پہلے لکھنے کا act, project کے optimism کے ہاوی ہونے سے پہلے, ایسے risks surface کر دیتا ہے جو ورنا دبے رہ جاتے۔ Deborah J. Mitchell, Jay Russo, اور Nancy Pennington کی research نے پایا ک "prospective hindsight", یانی یہ imagine کرنا ک ایک event already ہو چکی ہے, future outcomes کے reasons سہی پہچاننے کی ability 30% بڑھا دیتا ہے۔ آپنے ابھی جو discipline سیکھی, وہ چھوٹے پیمانے پر یہی کرتی ہے: AI کے weigh in کرنے سے پہلے, آپ اپنا decision اور وہ specific finding لکھتے ہیں جو آپکا mind بدل دے۔ "پہلے لکھنا" ہی load-bearing ہسا ہے۔

Klein کا original article پڑھیں: Performing a Project Premortem, Harvard Business Review, September 2007۔

Forecasting calibration (Philip Tetlock, Good Judgment Project, 2011-2015). Tetlock اور انکے colleagues نے ایک multi-year tournament چلایا جہاں ہزاروں forecasters نے world events پر probabilistic predictions کیں۔ Best forecasters, جنہیں Tetlock "superforecasters" کہتے تھے, ایک specific habit رکھتے تھے: وے اپنی predictions confidence percentages کے ساتھ answer آنے سے پہلے record کرتے تھے, پھر باد میں prediction کو outcome کے against compare کرتے تھے۔ ایک لکھی ہوئی prediction کے بنا آپ نہیں بتا سکتے ک آپکا gut calibrated تھا یا off, کیونک آپ اپنی "prior beliefs" کو جو بھی ہءآ اسسے match کرنے کے لئے reconstruct کر لیتے ہیں۔ Prediction Lock کی Line 4 (confidence percentage) اس practice کا سبسے چھوٹا سنبھو version ہے۔ Months اور years تک, اپنی locked-in confidence کو actual outcomes سے compare کرنا ہی judgment improve کرنے کا ایکماتر تریکا ہے۔

Project کے بارے میں پڑھیں: The Good Judgment Project (Wikipedia)۔ Book-length treatment کے لئے: Tetlock and Gardner, Superforecasting: The Art and Science of Prediction (2015)۔

Anchoring (Amos Tversky اور Daniel Kahneman, 1974). جب ایک confident answer آپ کے head میں وہ جگہ گھیر لیتا ہے جہاں آپکا اپنا answer ہوتا, تو وہ confident answer آپکا reference point بن جاتا ہے, اور آپ اب نہیں بتا سکتے ک اسکے بنا آپ کیا سوچتے۔ Tversky اور Kahneman کے original work نے numerical examples use کئے (لوگوں سے ایک arbitrary number دکھانے کے باد ایک percentage estimate کرنے کو کہا گیا, تو انکے estimates اس number سے anchored نکلے), پر principle general ہے: کوئی بھی confident answer جو آپ کے اپنا answer بنانے سے پہلے آپ کے head میں land کر جائے, وہ anchor بن جاتا ہے جسسے آپکی آگے کی thinking adjust ہوتی ہے۔ AI کے answers by default confident ہوتے ہیں۔ یہی انہیں powerful anchors بناتا ہے۔ Prediction Lock وہ move ہے جو anchor کو بننے سے روکتی ہے: آپ اپنا anchor پہلے, لکھکر, AI کے land کرنے سے پہلے رکھ دیتے ہیں۔

Original paper پڑھیں: Judgment under Uncertainty: Heuristics and Biases, Science, Vol. 185, No. 4157, September 27, 1974, pp. 1124-1131۔ (اگر Science journal کا access نہیں ہے, تو اس mirror پر open-access اپلبدھ ہے۔)

Prediction Lock تینوں کو combine کرتی ہے۔ اپنا decision اور flipping condition پہلے لکھیں (premortem)۔ اپنی confidence record کریں تاک باد میں calibration check کر سکیں (Tetlock)۔ اور دونوں AI کا answer پڑھنے سے پہلے کریں, تاک AI کی confidence وہ anchor ن بنے جسسے آپ adjust کرتے ہیں (Tversky اور Kahneman)۔ ایک sticky note پر 4 lines, research کے 3 decades کو ایک 3-minute habit میں compress کر دیتی ہیں۔

اس exercise کا full version (10 ranked questions plus Reasoning Receipt template; 45-60 minutes) Part 0 Chapter 1, Lesson 1 میں ہے۔ یہ page discipline سکھاتا ہے۔ وہ page اسے ایک system بناتا ہے۔

Discipline 2: Reasoning Receipt

آپنے صبح Claude کے ساتھ ایک report پر کام کرتے ہئے بتائی۔ Result اچھا دکھتا ہے۔ آپ اسے بھیج دیتے ہیں اور آگے بڑھ جاتے ہیں۔ 2 weeks باد کوئی پوچھتا ہے: "اسکے کون سے parts آپنے سچ میں check کئے? کون سے parts آپنے change کئے?" آپ کے پاس کوئی answer نہیں۔ آپنے پڑھا ک AI نے کیا لکھا, وہ ٹھیک لگا, اسلئے use کر لیا۔ کام ہو گیا, لیکن آپنے اس پر کبھی سچ میں سوچا ہی نہیں۔

یہ AI سے اپنی جگہ سوچنے دینے (Discipline 1) کے باد دوسری سبسے common AI failure mode ہے۔ تب بھی جب آپکی اپنی position locked ہو, AI کے drafts بڑے polished blocks میں آتے ہیں (5 suggestions, ایک 6-paragraph memo, ایک 10-row plan), اور باد میں آپ انمیں سے کسی کو defend نہیں کر سکتے کیونک آپنے کبھی track نہیں کیا ک ہر piece پر آپنے کیا decide کیا۔

اسے fix ایسے کریں۔ ہر بار جب AI آپکو کوئی claim, recommendation, یا writing کا ایک chunk دیتا ہے جو آپ کے final work میں جاتا ہے, آپ ایک one-line note بناتے ہیں ک آپنے اسکے ساتھ کیا کیا اور کیوں۔ پوری چیز نہیں, بس ہر piece پر ایک note۔ ساتھ میں ان notes کو ایک Reasoning Receipt کہتے ہیں۔

ایک row کیسی دکھتی ہے۔ مان لیں آپنے Claude سے ایک group presentation plan کرنے میں help مانگی, اور اس نے suggest کیا: "Start the presentation with a short video clip to grab attention." آپ اس پر سوچتے ہیں۔ آپکی teacher نے اسی semester پہلے کہا تھا ک visual openings کو better grades ملتے ہیں, تو یہ suggestion اسسے match کرتا ہے جو آپ پہلے سے جانتے ہیں ک اس class میں کیا کام کرتا ہے۔ آپ اسے رکھنے کا decide کرتے ہیں۔

وہ decision آپکی receipt میں ایک row بن جاتا ہے:

AI نے کیا کہا	آپنے کیا کیا	Why
Start with a short video clip to grab attention.	ACCEPT	ہماری teacher نے کہا ک visual openings کو better grades ملتے ہیں۔ یہ fit ہوتا ہے۔

3 columns۔ AI نے کیا کہا (تاک future آپ یاد رکھیں ک کس بات پر decide ہو رہا تھا), آپنے کیا کیا (ایک one-word label), اور why (ایک sentence تاک row باد میں defensible ہو)۔

اب مان لیں Claude کا اگلا suggestion تھا "Give each person 5 minutes to speak." آپ کے group میں 4 members ہیں اور کل 15 minutes ہیں۔ Math نہیں بیٹھتا۔ تو آپ اسے reject کرتے ہیں:

AI نے کیا کہا	آپنے کیا کیا	Why
Give each person 5 minutes to speak.	REJECT	ہمارے پاس 4 لوگوں کے لئے 15 minutes ہیں۔ Math نہیں بیٹھتا۔

یہی discipline ہے۔ ہر AI suggestion پر ایک row, ہر ایک میں 3 columns۔

5 labels۔ آپنے کیا کیا ہمیشا 5 categories میں سے کسی ایک میں آتا ہے۔ زیادہ تر بار آپ ACCEPT, REJECT, یا MODIFY use کریں گے۔ باکی دو (SURFACED اور MISSED) ایسے cases پکڑتے ہیں جنہیں ورنا skip کرنا آسان ہے۔

Label	آپنے کیا کیا	Why پر ایک sentence لکھیں
ACCEPT	AI نے جو کہا وہ بنا change رکھا۔	آپنے اس پر trust کیوں کیا۔
REJECT	آپنے decide کیا ک AI غلط تھا اور اسے ہٹا دیا۔	کس چیز نے آپکو disagree کرائےا۔
MODIFY	Idea رکھا پر اسکا ایک ہسا بدلا۔	آپنے کیا بدلا اور کیوں۔
SURFACED	AI نے کچھ ایسا اٹھایا جس پر آپنے سوچا نہیں تھا۔ آپنے رکھا۔	یہ کیوں matter کرتا ہے۔
MISSED	آپنے کچھ ایسا notice کیا جو AI بتانا بھول گیا۔ آپنے add کیا۔	کیا missing تھا اور وہ کیوں matter کرتا ہے۔

ACCEPT, REJECT, اور MODIFY basic moves ہیں۔ SURFACED ان moments کے لئے ہے جب AI نے آپکو کچھ سکھایا: وے track کرنے لایک ہیں کیونک انہیں cases میں AI نے سچ میں ایسی thinking add کی جو آپ اکیلے ن کرتے۔ MISSED اسکے لئے ہے جو AI نے نہیں کہا پر کہنا چاہئے تھا: وے cases ہیں جہاں آپ کے اپنے judgment نے وہ پکڑا جسے AI کی drafting نے gloss کر دیا۔

ایک اچھی receipt میں وقت کے ساتھ پانچوں کا ایک mix ہوتا ہے۔ اگر ہر row ACCEPT کہتی ہے, تو آپ سچ میں سوچ نہیں رہے: آپ بس AI نے جو لکھا اس پر sign off کر رہے ہیں۔

"لیکن کوئی میرے کام کا audit نہیں کرتا, تو bother کیوں?"

یہ اس discipline پر سبسے reasonable objection ہے, اور اسکا ایک real answer بنتا ہے۔ زیادہ تر readers, زیادہ تر بار, audit نہیں ہونگے۔ آپکا boss نہیں پوچھتا۔ آپکا professor آگے بڑھ جاتا ہے۔ آپکا client sign off کر دیتا ہے۔ اگر ایک Reasoning Receipt کا ایکماتر payoff "کسی نے پوچھ لیا تو" ہوتا, تو receipt کی میہنت worth نہیں ہوتی۔

ایک receipt رکھنا 3 چیزیں کرتا ہے, تب بھی جب کوئی کبھی ن پوچھے۔

پہلا, لکھنے کا act بدل دیتا ہے ک آپ کیا decide کرتے ہیں۔ جب آپ کسی AI suggestion کو چپچاپ accept کرتے ہیں, آپکا brain اسے "سہی لگتا ہے, آگے بڑھو" کی طرح process کرتا ہے۔ جب آپکو ایک one-word label اور ایک one-sentence reason لکھنا پڑتا ہے, آپ کے brain کو suggestion کو سچ میں examine کرنا پڑتا ہے۔ زیادہ تر readers, جب پہلی بار یہ try کرتے ہیں, ہر session میں کم سے کم ایک row پاتے ہیں جہاں وے "why" sentence پورا نہیں کر پاتے۔ وہ row کچھ ایسا تھا جسے وے بنا سوچے use کرنے والے تھے۔ Receipt اسے ship ہونے سے پہلے پکڑ لیتی ہے۔

دوسرا, receipt آپ کے کام کا ہسا بن جاتی ہے, صرف اسکا record نہیں۔ Discipline 1 کی bank manager نے اپنی position اور data کے بیچ کے gap کو اپنی report کی opening line بنا دیا۔ نیچے کے اگلے example کی student نے اپنی receipt کو اپنے group کے ساتھ ایک working document کی طرح use کیا, audit trail کی طرح نہیں۔ REJECT label والی ایک row اکسر final document میں ایک "considered alternatives" paragraph بن جاتی ہے۔ SURFACED label والی ایک row اکسر وہ سبسے interesting insight بن جاتی ہے جو آپ meeting میں لاتے ہیں۔ Receipt ایک working tool ہے, filing cabinet نہیں۔

تیسرا, future آپ ہی سبسے common auditor ہیں۔ آج سے 3 months باد, آپ اس کام کو دیکھینگے اور یاد نہیں رہے گا ک کون سے parts آپ کے تھے, کون سے AI کے, یا آپنے کیا کیوں decide کیا۔ Receipt future آپ کے لئے ایک note ہے۔ زیادہ تر بار جب receipt کام آتی ہے, سوال کھد آپسے آتا ہے, کسی boss سے نہیں۔

Audit scenario سبسے visible payoff ہے, پر سبسے rare۔ پہلے 3 payoffs ہر بار ہوتے ہیں جب آپ ایک receipt رکھتے ہیں, تب بھی جب کوئی اسے کبھی ن پڑھے۔ Page کا central rule practice میں یہی متلب رکھتا ہے: deliverable سوچ کا documented evidence ہے۔ Receipt آپ کے کام سے الگ نہیں ہے: یہ کام produce کرتے وقت اسے shape کرتی ہے, اور وقت کے ساتھ یہی وہ چیز ہے جو project کی memory fade ہو جانے پر بھی آپ کے پاس رہتی ہے۔

ایک reasoning receipt کی anatomy: ہر decisive call کو annotate کرنے والے 3 columns۔ AI نے کیا کہا, آپنے کیا کیا (ACCEPT, REJECT, MODIFY, SURFACED, MISSED میں سے ایک), اور Why۔ ہر row AI output کے 1 piece پر human دوارا لیا گیا 1 decision document کرتی ہے۔ ایک receipt میں ہر row ایک decision ہے۔ Label بتاتا ہے آپنے کیا کیا۔ "Why" future آپ کو (یا کسی بھی پڑھنے والے کو) بتاتا ہے ک row کیوں trust کی جا سکتی ہے۔

Real life میں یہ کیسا دکھتا ہے۔

ایک student نے Claude سے class کے لئے ایک group presentation plan کرنے میں help مانگی۔ Claude نے ایک پورا plan دیا۔ اسے بس use کرنے کے بجای, student نے ہر suggestion پر جاکر لکھا ک اس نے کیا سوچا:

AI نے کیا کہا	Label	Why
"Start the presentation with a short video clip to grab attention."	ACCEPT	اچھا idea۔ ہماری teacher نے کہا ک visual openings کو better grades ملتے ہیں۔
"Give each person 5 minutes to speak."	REJECT	ہمارے پاس کل صرف 15 minutes ہیں اور ہم 4 لوگ ہیں۔ Math نہیں بیٹھتا۔
"End with a Q&A session."	MODIFY	Q&A ہاں, پر اگر کوئی کچھ ن پوچھے تو ہم 3 backup questions تییار رکھینگے۔
"Add a live demo of the app you built."	SURFACED	میں نے یہ سوچا نہیں تھا۔ ایک live demo ہماری presentation کو الگ دکھائیگی۔
(AI نے یہ نہیں بتایا ک projector کے لئے laptop اور adapter کون لائیگا۔)	MISSED	میں نے یہ add کیا۔ پچھلی بار ہمارا group adapter بھول گیا تھا اور 5 minutes برباد ہئے۔

اس نے receipt اپنے group کے ساتھ share کی۔ Presentation کے باد, teacher نے پوچھا ک انہوننے ہر person کو 5 minutes کیوں نہیں دئے۔ اس نے row 2 کی اور point کیا: "ہمارے پاس 4 لوگوں کے لئے صرف 15 minutes تھے۔ Math نہیں بیٹھا۔" وہی ایک sentence کاپھی تھا۔ Receipt کے بنا, اسے سب کچھ scratch سے یاد کرکے explain کرنا پڑتا۔

Receipt کے بنا کیا ہوتا ہے:

AI نے کیا کہا	Label	Why
"Start with a short video clip."	ACCEPT	سہی لگتا ہے۔
"Give each person 5 minutes."	ACCEPT	سہی لگتا ہے۔
"End with a Q&A session."	ACCEPT	سہی لگتا ہے۔
"Add a live demo."	ACCEPT	سہی لگتا ہے۔
(کچھ نہیں لکھا۔)

All-ACCEPT ایک warning sign ہے

اگر ہر row reason کے روپ میں "سہی لگتا ہے" کے ساتھ ACCEPT کہتی ہے, تو آپنے اس پر سچ میں سوچا نہیں۔ آپنے بس AI نے جو کہا وہ copy کر لیا۔ ایک اچھی receipt میں labels کا mix ہوتا ہے۔ اگر آپ explain نہیں کر سکتے ک آپنے کچھ accept کیوں کیا, تو آپنے اسے رکھنے کا decide نہیں کیا۔ آپ بس اسکے ساتھ چل پڑے۔

کھد try کریں

آپ اپنی university کا annual tech fest organize کر رہے ہیں۔ آپکی team میں 10 members ہیں۔ Event 3 weeks میں ہے۔ آپنے ابھی marketing شرو نہیں کی۔ ایک دوسری university نے اسی weekend ایک similar event announce کر دیا۔ آپنے AI سے پوچھا: "کیا ہمیں event ایک week پہلے move کرنا چاہئے, یا original date رکھنی چاہئے?" AI نے آپکو 5 suggestions دئے۔ ہر ایک کے لئے ایک label (ACCEPT, REJECT, MODIFY, SURFACED, یا MISSED) چنیں اور ایک sentence میں why لکھیں۔

AI نے کیا suggest کیا

"Move it earlier. Being first matters when two events compete for the same audience."
"If you keep the original date, students will compare the two events and may pick the other one."
"Your social media posts get the most engagement on Thursdays, so start marketing this Thursday."
"Moving one week earlier means your team has only 2 weeks to prepare instead of 3."
"Most students decide which events to attend based on what their friends are going to."

1Your Work

AI grader 2 چیزیں check کریگا:

کیا آپنے اپنی reasoning explain کی, یا بس "سہی لگتا ہے" لکھا? 1-10 rate کریں۔ میری weakest explanation quote کریں۔
کیا آپنے 1 سے زیادا label use کئے? اگر ہر row ACCEPT کہتی ہے, تو آپنے اس پر سچ میں سوچا نہیں۔ 1-10 rate کریں۔

میرے کام کو rewrite ن کریں۔ اگر box empty یا vague ہے, تو بس ساف کہیں۔

Claim 1: "Move it earlier. Being first matters."

Label (ACCEPT/REJECT/MODIFY/SURFACED/MISSED) + ایک sentence میں why

Claim 2: "Students will compare the two events and may pick the other one."

Label + ایک sentence میں why

Claim 3: "Start marketing this Thursday because that is when posts get the most engagement."

Label + ایک sentence میں why

Claim 4: "Moving earlier means only 2 weeks to prepare instead of 3."

Label + ایک sentence میں why

Claim 5: "Students decide based on what their friends are going to."

Label + ایک sentence میں why

2Get Your Score

Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.

پہلی بار 10-15 minutes لگتے ہیں۔ Score ملنے کے باد, کوئی بھی ایسی row کھوجیں جہاں آپنے بنا کسی real reason کے "سہی لگتا ہے" لکھا۔ وہی وہ row ہے جہاں آپنے اپنی thinking کئے بنا AI کی thinking accept کر لی۔ واپس جاکر اس ایک row کے لئے ایک real explanation لکھیں۔

جو آپنے ابھی کیا, وہ ہر suggestion کو ایک بار میں ایک check کرنے میں help کرتا ہے۔ لیکن یہ ہر suggestion کے اندر کی غلطیاں نہیں پکڑتا, جیسے made-up facts, outdated information, یا AI کا کسی ایسی چیز پر confident ہونا جو اس نے غلط بتائی۔ وہ Discipline 3 کا کام ہے۔

ایک good example دیکھنا ہے? (اپنا submit کرنے کے باد کھولیں۔)

ایک اور student نے یہی tech fest exercise کیا۔ یہ اکیلا سہی answer نہیں ہے, پر دکھاتا ہے ک ایک اچھی receipt کیسی دکھتی ہے۔

Claim	Label	Why
1	REJECT	یہاں پہلے ہونا matter نہیں کرتا۔ Students event اس آدھار پر چنتے ہیں ک کیا fun لگتا ہے, یہ نہیں ک کسے پہلے announce کیا گیا۔
2	MODIFY	Students compare کر سکتے ہیں, پر تبھی جب انہیں دونوں کے بارے میں پتا چلے۔ اگر ہم better market کریں, تو دوسرا event matter نہیں کرتا۔
3	ACCEPT	پچھلے semester کا ہمارا Instagram data دکھاتا ہے ک Thursday posts کو 2x زیادا likes ملتی ہیں۔ یہ سہی بیٹھتا ہے۔
4	SURFACED	میں نے یہ سوچا نہیں تھا۔ ایک week کی prep time کھونا ایک real problem ہے کیونک ہمنے ابھی venue book نہیں کیا۔
5	ACCEPT	یہ سچ ہے۔ پچھلے سال ہمنے registration form میں "bring your friend" option جوڑنے کے باد sign-ups میں ایک بڑا jump دیکھا۔
6	MISSED	AI نے یہ mention نہیں کیا ک ہمارے سبسے بڑے sponsor کو 3 weeks notice چاہئے۔ پہلے move کرنے کا متلب ہم sponsorship کھو سکتے ہیں۔

یہ اچھا کیوں ہے: صرف 2 ACCEPTs ہیں, اور دونوں کے پیچھے real reasons ہیں (پچھلے semester اور پچھلے سال کا actual data, صرف "سہی لگتا ہے" نہیں)۔ MISSED row (row 6) کچھ ایسا پکڑتی ہے جو AI جان ہی نہیں سکتا تھا (sponsor کا 3-week notice rule)۔ Student نے آخر میں original date رکھنے کا decide کیا, پر ایک ایسے reason سے جو AI نے کبھی mention نہیں کیا: sponsorship۔

یہ کیا کرنے کی کوشش نہیں کرتا: clever ہونا۔ زیادہ تر rows ایک sentence ہیں۔ Point real reasons لکھنا ہے, لنبے نہیں۔

یہ کام کیوں کرتا ہے (اسکے پیچھے کی research)

Reasoning Receipt بھی کوئی نیا idea نہیں ہے۔ آپنے کیا decide کیا اور کیوں, یہ لکھ لینا ان سبسے زیادا study کی گئی habits میں سے ایک ہے ک experts اسل میں کیسے سوچتے ہیں۔ 3 bodies of work بتاتی ہیں ک یہ کیوں کام کرتا ہے۔

Reflection-in-action (Donald Schön, 1983). یہ study کرتے ہئے ک doctors, architects, engineers, اور teachers اسل میں کیسے کام کرتے ہیں, Schön نے پایا ک skilled professionals صرف act کرکے آگے نہیں بڑھتے: وے ایک running internal commentary رکھتے ہیں, surprises notice کرتے ہیں اور کام چلتے-چلتے decide کرتے ہیں ک انکے بارے میں کیا کرنا ہے, باد کے کسی review میں نہیں۔ جو professionals سبسے تیز improve ہئے, وے وہی تھے جنہوننے اس commentary کو tacit چھوڑنے کے بجای explicit بنایا۔ Reasoning Receipt وہی commentary لکھی ہوئی ہے: چپچاپ یہ سوچنے کے بجای ک "یہ AI suggestion کچھ off لگتا ہے," آپ label اور reason تب لکھتے ہیں جب آپ ابھی بھی کام میں ہیں, جہاں یہ بدل سکتا ہے ک آپ آگے کیا کرتے ہیں۔

اور پڑھیں: Reflective practice (Wikipedia), جو Schön کی The Reflective Practitioner (Basic Books, 1983) کا summary دیتا ہے۔

Single-loop vs. double-loop learning (Chris Argyris, 1977). Argyris نے 2 طرح کے correction کے بیچ ایک line کھینچی۔ Single-loop learning فوراً کی غلطی fix کرتا ہے: answer غلط تھا, تو آپ answer بدل دیتے ہیں۔ Double-loop learning پیچھے ہٹکر پوچھتا ہے ک کیا پورا approach یا assumption ہی غلط تھا۔ انکی finding یہ تھی ک smart, capable لوگ by default single-loop mode میں پھنس جاتے ہیں; وے output tune کرتے ہیں اور frame پر کبھی سوال نہیں اٹھاتے۔ ایک ایسی receipt جہاں ہر row ACCEPT کہتی ہے, single-loop thinking کو visible بنا دیتی ہے: آپ outputs approve کر رہے ہیں بنا یہ پوچھے ک approach سہی ہے یا نہیں۔ ہر row پر ایک real "why" force کرنا, اور یہ notice کرنا ک کب آپ ایک نہیں لکھ پاتے, وہی آپکو double loop میں دھکیلتا ہے۔

Argyris کا original article پڑھیں: Double Loop Learning in Organizations, Harvard Business Review, September 1977۔

Elaboration اور generation effect (Brown, Roediger & McDaniel, 2014). Decades کی memory research ایک simple finding پر پہنچتی ہے: آپ کسی چیز کو تب کہیں بیہتر یاد رکھتے ہیں جب آپ اسے اپنے شبدوں میں ڈالتے ہیں اور جو آپ پہلے سے جانتے ہیں اسسے جوڑتے ہیں, بجای اسکے ک بس دوبارا پڑھ لیں۔ Explanation generate کرنے کا act, ایک single sentence بھی, وہی ہے جو durable memory بناتا ہے۔ آپکی receipt کا ہر "why" بلکہل یہی move ہے۔ 3 months باد, جس row کے لئے آپنے ایک real reason لکھا, وہی آپ اب بھی سمجھینگے; جس row پر "سہی لگتا ہے" کا rubber-stamp لگایا, وہ ایک blank ہوگی۔

اور پڑھیں: Make It Stick: The Science of Successful Learning (Belknap Press of Harvard University Press, 2014), book کے central findings کا ایک summary۔

Reasoning Receipt تینوں کو combine کرتی ہے۔ آپ ہر AI claim پر اپنا decision تب لکھتے ہیں جب آپ ابھی بھی کام میں ہیں (Schön), forced "why" آپکو outputs پر rubber-stamp لگانے سے approach پر سوال اٹھانے کی اور دھکیلتی ہے (Argyris), اور reason کو اپنے شبدوں میں ڈالنا وہی ہے جو آپکو باد میں یاد دلاتا ہے (Brown, Roediger & McDaniel)۔ کسی نے Reasoning Receipt کو AI کے against specifically test نہیں کیا, پر اسکے نیچے کی habit, یانی اپنے choices لکھنا اور انہیں explain کرنا, یہ کیسے لوگ سوچتے اور سیکھتے ہیں اسکے سبسے established results میں سے ایک ہے۔ اسے AI output پر use کرنا natural next step ہے۔

Go deeper: Part 0 Chapter 1: Asking Better Questions. Full version (ایک real AI conversation کے against ایک 10-row receipt, plus Contradiction Challenge جہاں ایک الگ AI آپ کے reasoning پر attack کرتا ہے, 45-60 min) وہاں foundational sequence کے ہسے کے روپ میں ہے۔ یہ page discipline سکھاتا ہے۔ وہ chapter اسے ایک habit بناتا ہے جسے آپ ہر high-stakes AI conversation پر run کر سکتے ہیں۔

Part 2: Detection (AI جو miss کرتا ہے اسے پکڑنا)

Part 1 نے آپکو AI use کرنے سے پہلے سوچنا سکھایا۔ Part 2 آپکو سکھاتا ہے ک AI جو واپس دیتا ہے اوقتں mistakes کیسے spot کریں۔

Problem یہ ہے: AI سہی ہو یا غلط, ایک جیسا confident لگتا ہے۔ اسکی سبسے بری mistakes اکسر انہیں sentences میں چھپتی ہیں جو سبسے polished لگتے ہیں۔ AI یہ بھی کرتا ہے ک آپنے جو ایک چیز پوچھی اسی پر focus کرتا ہے اور side effects ignore کر دیتا ہے۔

Discipline 3 (Error Taxonomy) آپکو 6 common AI mistakes کی ایک checklist دیتی ہے تاک آپ output پر trust کرنے سے پہلے انہیں scan کر سکیں۔ Discipline 4 (Thinking in Systems) آپکو پوچھنا سکھاتی ہے "اگر میں یہ کروں, تو اور کیا بدلتا ہے?" تاک آپ وے side effects پکڑیں جنہیں AI نے miss کیا۔

Discipline 3: Error Taxonomy

یہ discipline What AI Actually Is, Idea 3 کا practical answer ہے: machine کے اندر کوئی built-in truth-checker نہیں, اسلئے checker آپ ہیں۔ نیچے کے 6 error types دکھاتے ہیں ک practice میں 'checker ہونا' کیسا دکھتا ہے۔

آپنے شاید یہ انبھو کیا ہے۔ آپ AI سے ایک question پوچھتے ہیں, answer smooth اور professional لگتا ہءآ آتا ہے, آپ اسے پڑھتے ہیں, سب ٹھیک لگتا ہے, آپ اسے use کر لیتے ہیں۔ 3 days باد آپکو پتا چلتا ہے ک ایک number غلط تھا, یا AI نے جو ایک source mention کیا وہ اسل میں exist ہی نہیں کرتا۔ Mistake وہیں بیٹھی تھی, پر آپنے اسے miss کر دیا کیونک writing اتنی اچھی لگ رہی تھی۔

اب جو part matter کرتا ہے: اس missed mistake کی قیمت آم تور پر آپ چکاتے ہیں, کوئی باد میں پکڑنے والا auditor نہیں۔ اگر AI نے آپکو بتایا ک ایک used car میں 32,000 miles ہیں جبک اسل میں 58,000 تھے, تو آپ کسی meeting میں embarrass نہیں ہوتے: آپ غلط car کھرید لیتے ہیں۔ اگر AI نے آپکی report کے لئے ایک statistic بنا دی, تو آپ صرف تب برے نہیں دکھتے جب کوئی check کرے; آپنے ایک ایسے number پر decision لے لیا جو کبھی real تھا ہی نہیں۔ AI کی mistakes سبسے پہلے اسی انسان کو hurt کرتی ہیں جو ان پر act کرتا ہے۔ وہ انسان آپ ہیں۔

"Taxonomy" کیوں? ایک taxonomy بس ایک naming system ہے: labeled categories کا ایک fixed set جنمیں آپ چیزیں sort کرتے ہیں, ٹھیک ویسے جیسے biologists living things کو species میں sort کرتے ہیں۔ تاقت naming میں ہے۔ "Check کرو ک یہ کوئی اچھی ہے کیا" act کرنے کے لئے بہت vague ہے; آپکی آنکھیں page پر پھسل جاتی ہیں اور کچھ انہیں روکتا نہیں۔ پر "check کرو ک کوئی fabricated source ہے کیا" ایک specific target کے ساتھ ایک specific hunt ہے, تو آپ سچ میں ہر citation پر رککر دیکھتے ہیں۔ Error Taxonomy, AI mistake کی 6 named categories ہیں۔ انہیں name دینا ہی ایک vague worry ("شاید کچھ غلط ہے") کو 6 concrete searches میں بدل دیتا ہے جنہیں آپ سچ میں run کر سکتے ہیں۔

انہیں ایسے پکڑیں۔ AI کے output کو پڑھکر کھد سے "کیا یہ سہی لگتا ہے?" پوچھنے کے بجای, اوقتں ایک بار میں ایک specific type کی mistake کھوجتے ہئے جائیں۔ 6 types ہیں:

Mistake type	یہ کیسی دکھتی ہے	پہلے کہاں دیکھیں
Factual error	ایک غلط fact: غلط number, غلط date, غلط name۔	Specific number والی کوئی بھی sentence۔ Exact دکھنے والے numbers چیزوں کو researched feel کراتے ہیں۔ Example: "73.6% لوگ AI کے numbers check نہیں کرتے۔" یہ real لگتا ہے۔ میں نے اسے ابھی بنا دیا۔
Logical gap	Conclusion evidence سے سچ میں follow نہیں کرتا۔	"therefore" یا "so" جیسے شبد کھوجیں۔ پھر پوچھیں: کیا evidence سچ میں یہ prove کرتا ہے, یا ایک step missing ہے?
False confidence	AI کسی uncertain چیز کو ایسے کہتا ہے جیسے وہ ایک fact ہو۔	سبسے smooth لگنے والے paragraphs۔ اگر AI "may" یا "could" use کرتا ہے, تو وہ جانتا ہے ک unsure ہے۔ اگر AI کسی debatable چیز کو بنا "may" یا "could" کے کہتا ہے, وہی warning sign ہے۔
Missing context	AI نے کوئی important detail چھوڑ دی جو answer بدل دیتی۔	سوچیں ک ایک expert سبسے پہلے کیا پوچھیگا۔ اگر آپ پوچھینگے "پر X کا کیا?", تو AI نے شاید اسکے بارے میں سوچا ہی نہیں۔
Fabricated source	AI کسی book, article, study, یا tool کا زکر کرتا ہے جو اسل میں exist ہی نہیں کرتا۔	AI جو بھی source name کرے, ہر ایک check کریں۔ Title کو Google کریں۔ اگر نہیں ملتا, تو AI نے شاید اسے بنا دیا۔
Stale fact	کچھ جو پہلے true تھا پر اب true نہیں۔	جو بھی وقت کے ساتھ بدلتا ہے: prices, rules, laws, software versions, کوئی company کون چلاتا ہے۔

ایک scan کیسا feel ہوتا ہے۔ بس پہلا type لیں, Factual error۔ Instruction کہتی ہے: specific number والی کوئی بھی sentence دیکھیں۔ تو آپ AI کا output پڑھتے ہیں اور ہر number پر رکتے ہیں, باکی سب ignore کرتے ہئے۔ مان لیں AI نے لکھا "this car has 32,000 miles on the odometer." یہ ایک number ہے, تو آپ رکتے ہیں۔ آپ "کیا یہ سہی لگتا ہے?" نہیں پوچھتے: ایک غلط mileage بلکہل اتنا ہی reasonable لگتا ہے جتنا ایک سہی۔ بجای اسکے آپ اسے source کے against check کرتے ہیں: آپ dashboard کی photo دیکھتے ہیں۔ اس پر 58,000 لکھا ہے۔ پکڑا گیا۔ آپنے اسے دھیان سے پڑھکر نہیں پکڑا; آپنے اسلئے پکڑا کیونک آپ specifically ایک type کی mistake کھوج رہے تھے, یانی ایک غلط number, اور ایک number ہی وہ جگہ تھی جہاں آپ رکے۔

یہی پوری technique ہے, 6 بار دوہرائی گئی۔ ہر pass ایک type کھوجتا ہے۔ آپ output کو 6 بار نہیں پڑھ رہے; آپ اسے ایک بار پڑھ رہے ہیں پر 6 الگ questions دماگ میں رکھکر, ہر question جس جگہ point کرتا ہے وہاں رکتے ہئے۔ نیچے کی exercise میں آپ 2 passes practice کریں گے (Factual error اور Fabricated source) تاک rhythm سیکھ سکیں۔ اگلا worked example چھہوں دکھاتا ہے۔

ایک confident-sounding AI paragraph جس پر 6 error types annotations کی طرح overlay ہیں۔ Factual (wrong fact), Logical Gap (skipped step), False Confidence (overstated certainty), Missing Context (relevant constraint dropped), Fabricated Source (invented citation), Stale Fact (true once, no longer)۔ 6 error types کھد announce نہیں کرتے۔ وے ان paragraphs میں چھپتے ہیں جو سبسے professional پڑھتے ہیں, اور اسیلئے name سے scan کرنا feel سے پڑھنے کو beat کرتا ہے۔

چھہوں real life میں کیسے دکھتے ہیں۔

ایک parent ایک reliable used car ڈھونڈھ رہے تھے۔ انہیں ایک listing پسند آئی: ایک 2021 Honda CR-V۔ اسے دیکھنے کے لئے 1 hour drive کرنے سے پہلے, انہوننے Claude سے اسے review کرنے کو کہا۔ انہوننے listing, photos اور اپنے mechanic کا ایک note paste کیا۔ Claude نے ایک clean, confident summary لکھی: low miles, clean history, strong engine, grab کرنے لایک ایک rebate۔ یہ اچھا پڑھا۔ وے لگبھگ اسے partner کو "let's buy this one" کے ساتھ forward کر دیتے۔ Instead, انہوننے six-row scan run کیا۔

Error type	Write-up میں انہیں کیا ملا	Verdict
Factual error	Write-up نے کہا: "32,000 miles on the odometer." Dashboard کی listing photo ساف 58,000 دکھاتی تھی۔ 26,000 miles off۔	Caught. Photo سے correct کیا۔
Logical gap	Write-up نے کہا: "It has a clean accident history, therefore it has no mechanical problems." ایک clean accident record, engine کے بارے میں کچھ نہیں کہتا۔ "therefore" hold نہیں کرتا تھا۔	Caught. ایک clean history ایک clean engine نہیں ہے۔
False confidence	Write-up نے کہا: "You will get at least 200,000 trouble-free miles out of this engine." No "should," no "likely," no basis۔ Flat promise ہی سارا کام کر رہا تھا۔	Caught. Rewrite کیا: "many CR-Vs last a long time, if serviced."
Missing context	Write-up نے timing belt mention نہیں کیا, جو کریب 60,000 miles پر replacement کے لئے due ہوتی ہے۔ Parent کے mechanic نے اسے flag کیا تھا۔ Model نے وہ note کبھی نہیں دیکھا۔	Caught. Belt کو check کرنے کی first چیز بنایا۔
Fabricated source	Write-up نے کہا: "As Consumer Reports wrote in their March 2026 reliability issue, this is the most dependable small SUV on the market." Parent نے Consumer Reports check کیا۔ ایسا کوئی note نہیں تھا۔	Caught. Quote remove کیا۔
Stale fact	Write-up نے کہا: "It still qualifies for the dealer's $1,000 loyalty rebate." Parent نے dealer کو call کیا۔ وہ rebate last month end ہو چکا تھا۔	Caught. Rebate کو math سے drop کیا۔

ایک short summary میں 6 میں سے 5 mistake types دکھے۔ سبسے مشکل پکڑ fake Consumer Reports quote تھی, کیونک وہ بلکہل ویسی لگتی تھی جیسا کچھ ایک real magazine لکھتا۔ کیونک parent نے ہر mistake type کو name سے check کیا, وے car دیکھنے گئے تو real mileage, زروری repair, اور actual price جانتے تھے۔ Notice کریں یہ کسے protect کرتا ہے: parent کی کسی auditor کے سامنے reputation نہیں, بلکہ parent کا اپنا wallet۔ اگر انہوننے summary پر trust کیا ہوتا, تو وے 1 hour drive کرکے ایسی car کھریدتے جو انہیں 32,000 miles کی لگتی, ایک ایسی price دیتے جو ایک ایسے rebate کو مانکر چلتی جو اب تھا ہی نہیں, اور ایک ایسی repair skip کر دیتے جو آنے والی تھی اور جسکا انہیں پتا نہیں تھا۔ Scan نے انہیں برا دکھنے سے نہیں بچایا۔ اس نے انہیں اپنے ہی decision کے بارے میں غلط ہونے سے بچایا۔

اگر آپ type سے check کئے بنا بس پڑھتے ہیں تو کیا ہوتا ہے:

آپ کیسے پڑھتے ہیں	کیا miss ہوتا ہے	کیوں
آپ پوری چیز "کیا یہ اچھا لگتا ہے?" پوچھتے ہئے پڑھتے ہیں	غلط numbers۔ جب سب کچھ smooth لگتا ہے تو آپکی آنکھیں numbers سے آگے پھسل جاتی ہیں۔	غلط mileage (32,000 کے بجای 58,000) miss کرنا آسان ہے۔ "Factual Error" کے لئے check کرنا آپکو ہر number پر رکنے پر force کرتا ہے۔
آپ ایک quote پر trust کرتے ہیں کیونک وہ ایک جانی brand name کرتا ہے	Fake Consumer Reports quote۔ Magazine name real, پر quote بنا ہءآ تھا۔	یہ real لگتا ہے, اور وہی trap ہے۔ "Fabricated Source" کے لئے check کرنا آپکو ہر quote look up کرنے پر force کرتا ہے۔
آپ "therefore" کو بس ایک connecting word کی طرح پڑھتے ہیں	Logical gap۔ "Clean history, therefore no problems" سہی لگتا ہے پر ایک step skip کرتا ہے۔	جب آپ "Logical Gap" کے لئے check کرتے ہیں, تو آپ ہر "therefore" پر رکتے ہیں اور پوچھتے ہیں: کیا یہ سچ میں وہ prove کرتا ہے جو claim کرتا ہے?
آپ missing info تبھی notice کرتے ہیں جب کچھ off لگے	60,000 miles پر due timing belt replacement۔ AI نے اسے کبھی mention نہیں کیا, تو page پر کوئی warning نہیں۔	Missing information کبھی کھد jump out نہیں کرتا۔ آپکو کھد سے پوچھنا پڑتا ہے: cars کے بارے میں جاننے والا کوئی کیا پوچھتا جو AI نے نہیں پوچھا?

جس parent نے type سے check کیا اور جسنے بس casually پڑھا, وے ایک ہی person ہو سکتے ہیں۔ فرق صرف اتنا ہے ک انہوننے AI کا output کیسے پڑھا: ایک نے ہر mistake type کو name سے check کیا, دوسرے نے بس پڑھا اور امید کی ک کچھ غلط نہیں ہے۔

بھری ہوئی scan grid بھی صرف چلانے لایک نہیں, رکھنے لایک بھی ہے۔ یہ اسی طرح کا evidence ہے جسکے بارے میں page کا rule ہے: deliverable سوچ کا documented evidence ہے۔ جب آپ کسی کو ایک report دیتے ہیں اور وے پوچھتے ہیں "کیا آپنے AI کے numbers check کئے?", تو grid آپکا answer ہے۔ زیادہ تر بار, یہ future آپ کے لئے ایک note ہے: 6 months باد, جب آپ سوچتے ہیں ک آپنے وہ statistic verify کی تھی یا بس trust کر لیا تھا, grid بتاتی ہے ک کون سا۔

کھد try کریں

آپ اس weekend ایک used car کھرید رہے ہیں۔ Seller کہتا ہے ک ایک اور buyer پہلے سے interested ہے, تو آپکو جلدی decide کرنا ہے۔ آپنے AI سے 2 cars compare کرکے بتانے کو کہا ک کون سی کھریدیں۔ AI نے یہ واپس لکھا۔ اسے پڑھیں, پھر اسے اوپر listed 6 mistake types میں سے ہر ایک کے لئے check کریں۔ Factual Error اور Fabricated Source سے start کریں (یہ دونوں miss کرنے پر آپکو سبسے زیادا پیسے کی قیمت دیتے ہیں)۔ نیچے کے boxes fill کریں۔

Which car should you buy?

Go with the 2020 Toyota Corolla. The Corolla gets 47 mpg combined, so you will spend far less at the pump than with most cars its size. According to the CarReliability Index 2026 rankings, the Corolla scores 9.4 out of 10, the top spot in its class. The 2019 Honda Civic is also a fine car. The Civic has lower mileage, therefore it is the more reliable choice if you want fewer surprises down the road.

Either car will run for another decade without a major repair, so you can pick on price and color and feel good about it. Both still qualify for the $2,000 state clean-vehicle rebate, which brings your real cost down nicely. Either way, you are getting a dependable car.

(اگر آپ چاہیں, تو car example چھوڑکر بجای اپنی life کا کوئی بھی real AI output use کر سکتے ہیں: ایک homework answer, ایک college application draft, ایک research summary۔ 6 mistake types کسی بھی topic پر کام کرتے ہیں۔)

1Your Work

AI grader 2 چیزیں check کریگا:

کیا آپنے سچ میں ہر type check کیا, یا بس پڑھکر guess کیا? 1-10 rate کریں۔ ایک اچھے answer میں ہر row کے لئے کچھ لکھا ہوتا ہے۔ اگر آپنے ایک type check کیا اور کچھ غلط نہیں ملا, تو کھالی چھوڑنے کے بجای "checked, nothing found" لکھیں۔
کیا آپنے important mistakes پکڑیں, یا صرف آسان والی? 1-10 rate کریں۔ اگر میں نے اسی write-up میں کوئی بڑی mistake miss کی, تو مجھے بتائیں ک کون سی sentence مجھے پکڑنی چاہئے تھی۔

میرے کام کو rewrite ن کریں۔ اگر ایک row بنا explanation کے blank ہے, تو بس ساف کہیں۔

6 mistake types میں سے ہر ایک کے لئے, AI کے write-up سے وہ exact sentence copy کریں جس میں mistake ہے, اور explain کریں ک کیا غلط ہے۔ اگر آپنے ایک type check کیا اور کوئی mistake نہیں ملی, تو "checked, nothing found" لکھیں۔

Factual error: [sentence paste کریں] - [کیا غلط ہے] Logical gap: [sentence paste کریں] - [کیا غلط ہے] False confidence: [sentence paste کریں] - [کیا غلط ہے] Missing context: [AI کیا چھوڑ گیا] Fabricated source: [sentence paste کریں] - [کیا غلط ہے] Stale fact: [sentence paste کریں] - [کیا غلط ہے]

آپ ہر ایک کے بارے میں کتنے sure ہیں? (1-10 rate کریں اور ایک sentence میں why کہیں۔)

Example: 'Factual error: 9, میں نے real mpg look up کیا۔ Fabricated source: 6, مجھے یہ index online نہیں ملا پر میں 100% sure نہیں ہوں۔'

2Get Your Score

Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.

پہلی بار اوقتں لگبھگ 8-15 minutes لگتے ہیں۔ Practice کے ساتھ یہ faster ہو جاتا ہے۔ Score ملنے کے باد, ایک جگہ کھوجیں جہاں AI grader آپسے disagree کرتا ہے۔ وہ disagreement ہی وہ جگہ ہے جہاں آپ سبسے زیادا سیکھتے ہیں۔

جو آپنے ابھی کیا, وہ AI کے answer کے اندر کی mistakes ڈھونڈھنے میں help کرتا ہے۔ پر ایک اور طرح کی problem ہے جسے یہ نہیں پکڑتا: AI کی advice پر act کرنے کے باد کیا ہوتا ہے? اگر آپ غلط car کھریدتے ہیں, تو آپ repairs پر پیسے گنواتے ہیں۔ اگر ایک company بری AI advice follow کرتی ہے, تو customers چلے جاتے ہیں۔ ایک decision دوسری problem پیدا کرتا ہے, جو ایک اور پیدا کرتی ہے۔ Discipline 4 آپکو وے chain reactions ہونے سے پہلے trace کرنا سکھاتی ہے۔

تلنا کے لئے ایک strong sample چاہئے? (اپنا submit کرنے کے باد کھولیں۔)

ایک اور reader نے یہی used-car exercise کیا۔ یہ اکیلا سہی answer نہیں ہے, پر دکھاتا ہے ک ایک اچھا کیسا دکھتا ہے۔

Mistake type	AI کے write-up سے sentence	کیا غلط ہے
Factual error	"The Corolla gets 47 mpg combined."	غلط number۔ Real rating لگبھگ 33 mpg ہے۔ یہ بدلتا ہے ک آپ gas پر کتنا کھرچ کرتے۔
Logical gap	"The Civic has lower mileage, therefore it is the more reliable choice."	Lower mileage help کرتی ہے, پر یہ prove نہیں کرتی ک ایک car reliable ہے۔ "therefore" شبد اسے prove کیا ہءآ دکھاتا ہے جبک وہ نہیں ہے۔
False confidence	"Either car will run for another decade without a major repair."	ایک used car کے بارے میں کوئی یہ promise نہیں کر سکتا۔ AI نے اسے بنا "probably" یا "likely" کے ایک fact کی طرح کہا۔ یہ ایک fact ہونے کا دکھاوا کرتا ایک guess ہے۔
Missing context	(Write-up میں نہیں۔) 2019 Civic پر ایک open airbag safety recall ہے۔	AI نے اسے کبھی mention نہیں کیا۔ ایک safety recall بلکہل ویسی چیز ہے جو خریدنے سے پہلے آپکو جاننی چاہئے, اور AI اسے چھوڑ گیا۔
Fabricated source	"According to the CarReliability Index 2026 rankings, the Corolla scores 9.4 out of 10."	یہ index exist نہیں کرتا۔ AI نے ایک ایسا source بنا دیا جو real لگتا ہے۔ اگر آپ "CarReliability Index" search کریں, آپکو کچھ نہیں ملیگا۔
Stale fact	"Both still qualify for the $2,000 state clean-vehicle rebate."	وہ rebate 2025 میں end ہو گیا۔ یہ پہلے true تھا پر اب نہیں۔ یہ وہ price بدلتا ہے جو آپ اسل میں چکاتے ہیں۔

یہ اچھا کیوں ہے: ہر row کا ایک answer ہے, اور ہر quoted sentence وہ ہے جو سچ میں بدلیگا ک آپ کون سی car کھریدتے ہیں۔ Missing Context row ایک specific safety recall name کرتی ہے۔ Fabricated Source row ایک ایسے index کی اور point کرتی ہے جو exist نہیں کرتا۔

یہ کیا کرنے کی کوشش نہیں کرتا: سب کچھ پکڑنا۔ آپ ایک full report نہیں لکھ رہے۔ 15 minutes میں 6 rows goal ہے۔ 3 real catches, 30 weak catches سے بیہتر ہیں۔

یہ کام کیوں کرتا ہے (اسکے پیچھے کی research)

Error Taxonomy اسلئے کام کرتا ہے کیونک human judgment smooth writing کو handle کرنے میں ایک quirk رکھتا ہے۔ جب text پڑھنے میں آسان ہوتا ہے, ہم اس پر زیادا trust کرتے ہیں, چاہے وہ true ہو یا نہیں۔ AI بہت smoothly لکھتا ہے, جو اسے اس bias کے لئے ایک near-perfect trigger بناتا ہے۔ 4 findings بتاتی ہیں ک named type سے scan کرنا feel سے پڑھنے کو کیوں beat کرتا ہے۔

Processing fluency (Adam Alter & Daniel Oppenheimer, 2009). Decades کے experiments review کرتے ہئے, Alter اور Oppenheimer نے دکھایا ک کسی چیز کو process کرنے کی ease, یانی clear type, simple words, smooth phrasing, brain دوارا ایک signal کی طرح غلط پڑھی جاتی ہے ک content true ہے۔ "یہ اچھا پڑھتا ہے" کا feeling "یہ correct ہے" کے judgment میں رستا ہے, جبک دونوں کا ایک-دوسرے سے کوئی لینا-دینا نہیں۔ AI output کو maximally fluent ہونے کے لئے engineer کیا گیا ہے, تو یہ اس lever کو زور سے کھینچتا ہے۔ ایک specific error type کے لئے scan کرنا spell توڑ دیتا ہے: آپ یہ evaluate کرنا بند کر دیتے ہیں ک text کیسا feel ہوتا ہے اور یہ check کرنا شرو کرتے ہیں ک ایک particular طرح کی claim hold کرتی ہے یا نہیں۔

Paper پڑھیں (open access): Uniting the Tribes of Fluency to Form a Metacognitive Nation, Personality and Social Psychology Review, 13(3), 2009۔

Cognitive ease (Daniel Kahneman, 2011). Kahneman کا framework اس mechanism کو ایک name دیتا ہے: جب information effortlessly آتی ہے, تو mind کا fast, automatic part (System 1) اسے accept کر لیتا ہے اور slow, checking part (System 2) کبھی جاگتا ہی نہیں۔ Smooth AI prose System 2 کو سویا ہءآ رکھتا ہے۔ Six-type scan System 2 کو واپس on کرنے کا ایک deliberate تریکا ہے: ہر named check ایک ایسا task ہے جو automatic mind autopilot پر نہیں کر سکتا, جو اس effortful look کو force کرتا ہے جسسے fluent text آپکو دور lull کر رہا تھا۔

اور پڑھیں: Thinking, Fast and Slow (Wikipedia); relevant material cognitive ease پر chapter ہے۔

Confidence accuracy نہیں ہے (Nate Silver, 2012). politics, finance, اور sports میں forecasters کو study کرتے ہئے, Silver نے ایک consistent gap document کیا: جو لوگ سبسے زیادا certain لگتے ہیں, وے اکسر سبسے کم accurate ہوتے ہیں, کیونک confidence اور calibration الگ skills ہیں۔ AI اسکا سبسے برا ہسا inherit کرتا ہے: یہ لگبھگ ہر چیز کو same assured tone میں کہتا ہے, چاہے وہ سہی ہو یا invent کر رہا ہو۔ Scan میں "False confidence" row exactly اسلئے ہے ک tone کو truth سے الگ کیا جا سکے: آپ اس flat, unhedged claim کو ایک warning sign کے روپ میں flag کرتے ہیں, بجای اسکی certainty کو evidence کی طرح پڑھنے کے۔

اور پڑھیں: The Signal and the Noise (Wikipedia)۔

ایک overall judgment کے بجای 6 الگ checks کیوں۔ Gerd Gigerenzer کا risk پر کام دکھاتا ہے ک ایک problem کیسے represent کی جاتی ہے یہ تی کرتا ہے ک لوگ اسکے بارے میں اچھی طرح reason کرتے ہیں یا نہیں: ایک murky judgment کو clear, concrete pieces میں توڑیں اور accuracy jump کرتی ہے, جبک underlying facts نہیں بدلے۔ "کیا یہ AI output کوئی اچھا ہے?" بلکہل اسی طرح کا murky, all-at-once judgment ہے جس میں لوگ برے ہیں۔ Scan اسے 6 concrete questions میں decompose کر دیتا ہے جنہیں آپ ایک بار میں ایک answer کر سکتے ہیں, اور اسیلئے یہ وے mistakes پکڑتا ہے جنسے ایک single holistic read آگے نکل جاتا ہے۔

اور پڑھیں: Gerd Gigerenzer (Wikipedia), جو Calculated Risks (2002) کے argument کا summary دیتا ہے۔

Error Taxonomy چاروں کو combine کرتا ہے۔ Fluent text true feel ہوتا ہے (Alter & Oppenheimer) اور checking mind کو سویا رکھتا ہے (Kahneman), AI کی uniform confidence چھپاتی ہے ک کون سی claims اسل میں shaky ہیں (Silver), اور ایک vague "کیا یہ سہی لگتا ہے?" mistakes پکڑنے کے لئے غلط representation ہے (Gigerenzer)۔ 6 error types کو name دینا اور ہر ایک کو check کرنا چاروں کو ایک ساتھ fix کرتا ہے۔ کسی نے یہ exact checklist AI کے against specifically test نہیں کیا, پر mechanism کا ہر piece well established ہے۔ اسے AI output پر apply کرنا natural next step ہے۔

Go deeper: Part 0 Chapter 2: Detecting Broken Reasoning. Full version (8 mistake types, ایک دوسرے AI کے ساتھ cross-checking, اور وقت کے ساتھ اپنی accuracy track کرنا; 60-75 min) اسے ایک complete system بنا دیتا ہے۔

کیا ہوگا اگر آپ check کرنے جتنا نہیں جانتے?

Six-type scan تب best کام کرتا ہے جب آپ topic جانتے ہیں۔ پر ان topics کا کیا جنمیں آپ نئے ہیں? 3 tricks help کرتی ہیں:

AI سے exact source مانگیں۔ "studies show" accept ن کریں۔ پوچھیں: "مجھے author name, title, year, اور یہ کہاں publish ہءآ بتاؤ۔" اگر AI آپکو ایک real source نہیں دے سکتا, تو اس claim پر trust ن کریں۔
بنا source والے exact-دکھنے والے numbers سے suspicious رہیں۔ "Sales 47.3% بڑھی" بہت precise لگتا ہے۔ پر اگر AI یہ نہیں بتاتا ک وہ number کہاں سے آیا, تو precision ایک warning sign ہے, proof نہیں۔
جب آپ sure ن ہوں, اسے MODIFY label کریں۔ اگر آپ ایک claim 2 minutes میں check نہیں کر سکتے, اسے ACCEPT ن کریں۔ MODIFY لکھیں اور "not yet checked" add کریں۔ آپ اسے use کرنے سے پہلے باد میں look up کر سکتے ہیں۔

Discipline 4: Thinking in Systems

ایک university نے کچھ in-person tutoring کو ایک AI chatbot سے replace کرکے پیسے بچانے کا decide کیا۔ انہوننے AI سے پوچھا, اور AI نے کہا: "This saves 30% on tutoring costs." یہ great لگا, تو وے آگے بڑھ گئے۔

6 months باد: جو students سبسے زیادا struggle کرتے تھے, انہوننے help کے لئے آنا بند کر دیا, کیونک chatbot انکے questions سمجھ نہیں پاتا تھا۔ انکے grades گر گئے۔ Parents نے complain کیا۔ University کو damage fix کرنے کے لئے اور tutors hire کرنے پڑے, اور آخر میں یہ original budget سے زیادا کھرچیلا نکلا۔ Answer "saves 30%" کاگز پر correct تھا۔ پر chain reaction نے savings کو مٹا دیا۔

یہ Discipline 4 کی failure mode ہے۔ جب آپ AI سے کسی decision کے بارے میں پوچھتے ہیں, تو وہ آپکی پوچھی ہوئی question کا answer دیتا ہے, یانی "یہ کتنا بچائیگا?", اور وہیں رک جاتا ہے۔ یہ لگبھگ کبھی chain reactions trace نہیں کرتا: Effect A, Effect B پیدا کرتا ہے, جو Effect C پیدا کرتا ہے, اور کبھی-کبھی Effect C واپس آکر آپ کے original decision کو undo کر دیتا ہے۔ ایک Cascade Map وہ تریکا ہے جسسے آپ ان chain reactions کو کھد trace کرتے ہیں, commit کرنے سے پہلے, تاک surprise ایک ایسے budget کے 6 مہینے اندر کے بجای کاگز پر ہو جسے آپ واپس نہیں لے سکتے۔

Notice کریں یہ کسے protect کرتا ہے: ایک auditor کے سامنے آپکی reputation نہیں, بلکہ آپکا اپنا decision۔ ایک برے chatbot rollout کے لئے university کا کسی نے audit نہیں کیا۔ University نے بس پیسا کھرچ کیا, consequences کے ساتھ جیا, اور اسے fix کرنے میں اور پیسا کھرچ کیا۔ Cascade map کوئی defense نہیں جو آپ باد میں دکھاتے ہیں: یہ وہ thinking ہے جو آپکو پہلی جگہ میں expensive move کرنے سے روکتی ہے۔

"thinking in systems" کیوں? ایک system parts کا کوئی بھی ایسا set ہے جو ایک-دوسرے کو affect کرتے ہیں: students, tutors, budgets, اور grades الگ facts نہیں ہیں, وے ایک-دوسرے پر push کرتے ہیں۔ ہم میں سے زیادہ تر سیدھی lines میں reason کرتے ہیں: یہ وہ پیدا کرتا ہے, end of story۔ پر ایک system کے parts loops میں connected ہوتے ہیں, تو ایک effect گھومکر واپس آ سکتا ہے اور اس چیز کو بدل سکتا ہے جسنے اسے شرو کیا۔ "Thinking in systems" کا بس متلب ہے پہلے effect پر رکنے سے انکار کرنا: آپ پوچھتے رہتے ہیں "اور پھر کیا?" جب تک آپ وہ جگہ ن پا لیں جہاں line مڑکر ایک circle بن جاتی ہے۔ Cascade Map اس habit کا کاگزی version ہے: یہ parts بچھاتا ہے, انکے بیچ lines trace کرتا ہے, اور وہ جگہ کھوجتا ہے جہاں ایک line loop کرکے واپس آتی ہے۔

ایک کیسے بنائیں۔ پہلی بار اوقتں لگبھگ 20 minutes لگتے ہیں, اور ایک بار آدت ہو جانے پر 10 minutes۔

اپنا decision ایک clear sentence میں لکھیں۔ Specific رہیں۔ "شاید tutoring بدلیں" نہیں بلکہ "next semester سے in-person tutoring hours کا آدھا ایک AI chatbot سے replace کریں"۔
5 groups of people list کریں جنہیں یہ decision affect کرتا ہے۔ ہر بڑا decision الگ-الگ لوگوں کو چھوتا ہے۔ ایک اچھی starting list: کام کرنے والے لوگ (e.g., tutors), service use کرنے والے لوگ (e.g., students), جو آپسے compete کرتے ہیں (e.g., other universities), جو rules apply ہوتے ہیں (e.g., university policies), اور جو آپکی team جانتی یا نہیں جانتی (e.g., chatbot اسل میں کتنا اچھا ہے?)۔
ہر group کے لئے "اور پھر کیا?" 3 بار پوچھیں۔ پہلی چیز سے شرو کریں جو ہوتی ہے۔ پھر پوچھیں ک وہ کس اور لے جاتی ہے۔ پھر پوچھیں ک اسکے باد کیا آتا ہے۔ 3 layers deep۔
کم سے کم ایک loop کھوجیں۔ ایک ایسی جگہ کھوجیں جہاں ایک باد کا effect گھومکر واپس آتا ہے اور آپ کے original decision کو worse (یا better) بناتا ہے۔ Specific رہیں ک یہ کیسے ہوتا ہے۔
اگر آپکا map clean اور simple دکھتا ہے, تو آپ بہت جلدی رک گئے۔ Real risks second اور third layers میں چھپتے ہیں۔ تب تک deeper push کریں جب تک یہ messy ن دکھے۔

ایک chain بنانا کیسا feel ہوتا ہے۔ Tutoring decision لیں اور بس "students who struggle most" group۔ پہلی چیز سے شرو کریں جو ہوتی ہے, پھر "اور پھر کیا?" 2 بار اور پوچھیں۔

First layer: Struggling students chatbot try کرتے ہیں۔ یہ انکے half-formed questions نہیں سمجھ پاتا, تو وے ہار مان لیتے ہیں اور help مانگنا بند کر دیتے ہیں۔
اور پھر کیا? (Second layer۔) Help کے بنا, انکے grades گر جاتے ہیں۔ یہ وہی students ہیں جنہیں support کی سبسے زیادا زرورت تھی, اور انہیں سبسے کم ملا۔
اور پھر کیا? (Third layer۔) انمیں سے کچھ ایک ایسی university میں transfer ہو جاتے ہیں جسکے پاس ابھی بھی human tutors ہیں۔ University انکی tuition کھو دیتی ہے۔

وہ آخری link وہ جگہ ہے جہاں surprise رہتی ہے۔ Decision تھا "tutoring پر 30% بچائیں"۔ پر 3 layers نیچے, یہ بدلکر "ان students سے tuition revenue کھونا جنہیں ہماری سبسے زیادا زرورت تھی" بن جاتا ہے۔ آپ یہ AI سے "یہ کتنا بچائیگا?" پوچھکر کبھی نہیں دیکھتے, آپ اسے صرف "اور پھر کیا?" لگاتار 3 بار پوچھکر دیکھتے ہیں۔

اب loop کھوجیں: کھوئی ہوئی tuition کا متلب ایک اور tighter budget, جسکا متلب tutoring کے لئے اور بھی کم پیسا, جسکا متلب chatbot کو اور بھی زیادا cover کرنا پڑتا ہے, جسکا متلب اور بھی زیادا struggling students ہار مان لیتے ہیں۔ Original decision کھد کو کھلاتا ہے۔ یہی loop ہے, اور یہی وہ چیز ہے جو ایک one-time 30% saving کو ایک ongoing decline میں بدل دیتی ہے۔

Cascade Map Steps

اس drawing کو ایک Cascade Map کہتے ہیں۔ Goal future کو perfectly predict کرنا نہیں ہے۔ Goal commit کرنے سے پہلے loops کھوجنا ہے, جب decision بدلنا ابھی بھی free ہے۔

Mess کیوں matter کرتی ہے

اگر آپکا map neat اور tidy دکھتا ہے, تو آپنے شاید صرف obvious effects لکھے۔ Real risks deeper layers میں ہیں۔ چلتے رہیں۔

یہاں آپ کے اور AI کے opposite blind spots ہیں, اور اسیلئے یہ discipline ایک partnership ہے۔ AI آپکی پوچھی ہوئی specific question کا answer دینے میں اچھا ہے اور آپ کے decision سے پیدا ہونے والے side effects notice کرنے میں برا۔ آپ ان لوگوں کے بارے میں سوچنے میں بیہتر ہیں جنہیں AI بھول گیا اور ان chain reactions کے بارے میں جو مہینوں میں unfold ہوتی ہیں۔ تو آپ map پہلے draw کرتے ہیں, یانی وہ part جو صرف آپ کر سکتے ہیں, اور پھر آپ AI سے آپکی draw کی ہوئی ہر branch کو stress-test کرنے میں help مانگ سکتے ہیں۔

ایک real decision کے لئے, map میں 20-30 minutes لگ سکتے ہیں۔ نیچے کی exercise ایک shorter example use کرتی ہے تاک آپ technique practice کر سکیں۔

Map دکھاتا ہے ک کہاں دیکھیں; loop دکھاتا ہے ک decision کو کیا undermine کرتا ہے۔ Mess ایک feature ہے, bug نہیں۔

Diagram کو 2 passes میں پڑھیں۔ Top half breadth pass ہے: بیچ میں ایک decision ("replace loan officers with AI"), اسکے چاروں اور 5 domains, اور ہر ایک کے ساتھ پہلی چیز جو ہوتی ہے۔ انمیں سے زیادہ تر وے effects ہیں جو کوئی بھی list کریگا: employees کی jobs جاتی ہیں, customers کو worse service ملتی ہے, competitors آپکو copy کرنے کا pressure مہسوس کرتے ہیں۔ جسے miss کرنا آسان ہے وہ ہے Internal knowledge: tacit local lore lost۔ Loan officers ایسا knowledge carry کرتے ہیں جو کبھی کسی system میں لکھا ہی نہیں گیا: کون سے local businesses thin credit file کے باوجود reliable ہیں, کسکی income seasonal ہے تو March میں ایک late payment normal ہے, کب ایک applicant straight نہیں ہے۔ Officers کو replace کریں اور وہ knowledge دروازے سے باہر چلا جاتا ہے, کیونک وہ کبھی اس software میں تھا ہی نہیں جسسے AI نے سیکھا۔

Bottom half depth pass ہے, اور یہی وجہ ہے ک decision backfire کرتا ہے۔ Customers domain کو آگے follow کریں: cost cut officers کو ہٹاتا ہے, تو service گرتی ہے (AI وے cues miss کرتا ہے جو humans پکڑا کرتے تھے, یانی بلکہل وہی lore جو کھو گیا), تو customers چلے جاتے ہیں, تو revenue جو بچا تھا اسسے نیچے گرتی ہے, تو savings مٹ جاتی ہیں۔ Dashed arrow ہی پورا point ہے: chain start پر واپس loop کرتی ہے, یانی cost-cutting move اپنی ہی justification مٹا دیتا ہے۔ وہی circling-back وہ چیز ہے جسے ڈھونڈھنے کے لئے آپ ایک cascade map بناتے ہیں, اور یہ invisible ہے اگر آپ صرف AI سے "یہ کتنا بچائیگا?" پوچھتے ہیں۔

یہاں ایک الگ decision پر وہی discipline ہے۔

ایک student council president اپنے annual sports day کو ایک rented stadium سے university کے اپنے ground پر move کرکے پیسے بچانا چاہتی تھی۔ AI نے کہا: "This saves 40% of the event budget." Benefits obvious تھے: کوئی rental fee نہیں, campus کے پاس, set up کرنا آسان۔ AI نے سارے positives list کئے اور آگے بڑھنے کی recommend کیا۔

Idea present کرنے سے پہلے, اس نے ایک cascade map draw کیا۔ اسکا decision: sports day کو rented stadium سے university ground پر move کریں تاک budget کا 40% بچے۔ اس نے 5 groups list کئے اور ہر ایک کے لئے 3 layers trace کئے۔ Obvious effects expected تھے (پیسے بچتے ہیں, students کے لئے کم travel, چھوٹا venue)۔ پر third layer نے ایک problem reveal کی جسکے بارے میں اس نے سوچا نہیں تھا: university ground بہت کم spectators رکھتا ہے, تو کم families attend کرینگی, تو event چھوٹا مہسوس ہوگا, تو جو sponsors visibility کے لئے pay کرتے تھے وے next year کم pay کریں گے, تو budget سکڑیگا, تو event کو پھر چھوٹا ہونا پڑیگا۔ ایک loop, جہاں cost-saving move چپچاپ event کو سال در سال سکوڑتی ہے۔

Cascade Map Example: Sports Day

اوپر کی image اسکا پورا cascade map دکھاتی ہے: ہر group (students, sports teams, food vendors, admin, sponsors) کے ساتھ کیا ہوتا ہے, وہ loop جو event کو سال در سال سکوڑ دیتا, اور وے protections جو اس نے اسے روکنے کے لئے add کیں: ایک guaranteed minimum sponsor package اور commit کرنے سے پہلے ایک spectator-capacity check۔ AI کے original answer ("بس اسے move کرو, آپ پیسے بچاتے ہیں") میں انمیں سے کوئی protection نہیں تھی۔ اس نے پھر بھی پیسے بچائے, پر اس نے انہیں loop trigger کئے بنا بچایا۔

جو cascade map اس نے draw کیا وہ کھد documented evidence of thinking کا ایک piece ہے, یانی وہی چیز جسکے بارے میں اس page کے top کا rule ہے۔ جب اس نے council کو present کیا اور کسی نے پوچھا "کیا اسسے event نہیں سکڑیگا?", تو اسے موکے پر سوچنا نہیں پڑا۔ اس نے اس loop کی اور point کیا جو وہ already map کر چکی تھی اور اس protection کی جو وہ already build کر چکی تھی۔ Map thinking بھی تھا اور اسکا evidence بھی۔

کھد try کریں

آپکی exercise: آپکی university نے ابھی announce کیا ک next semester سارے exams AI proctoring (ایک AI exam کے دوران آپ کے webcam سے آپکو دیکھتا ہے) use کریں گے اور online-only ہونگے۔ اب کوئی in-person exams نہیں۔

5 groups کے ساتھ ایک cascade map draw کریں: students, professors, IT staff, parents, اور administration۔ ہر group کے لئے 3 layers deep جائیں۔ ایک loop کھوجیں جہاں ایک باد کا effect گھومکر واپس آتا ہے اور original decision کو worse بناتا ہے۔

(یا اس week اپنی life کے کسی real decision کو use کریں۔ وہی اسے stick کراتا ہے۔)

1Your Work

AI grader 2 چیزیں check کریگا:

کیا آپنے سبھی 5 groups کو 3 layers each کے ساتھ cover کیا, اور کیا آپنے explain کیا ک ہر effect کیسے ہوتا ہے (صرف name نہیں کیا)? 1-10 rate کریں۔ مجھے بتائیں ک کون سا group سبسے weak ہے اور میں نے کیا miss کیا۔
کیا آپکا loop cause اور effect کی ایک real chain ہے, یا صرف ایک label? 1-10 rate کریں۔ "Students react" ایک label ہے۔ "Bad internet والے students exams میں fail ہوتے ہیں, جو university کی pass rate گراتا ہے, جو administration کو policy rethink کراتا ہے" ایک real chain ہے۔ اگر میرا صرف ایک label ہے, تو مجھے دکھائیں ک اسے ایک chain میں کیسے بدلیں۔

میرے map کو redraw ن کریں۔ اگر ایک box empty یا vague ہے, تو بس ساف کہیں۔

آپکا cascade map (decision لکھیں, پھر ہر group کو 3 layers of effects کے ساتھ list کریں۔ اسے neat ہونا زروری نہیں):

Decision: سارے exams AI-proctored اور online-only ہونگے۔ Students: 1st → 2nd → 3rd Professors: 1st → 2nd → 3rd IT staff: 1st → 2nd → 3rd Parents: 1st → 2nd → 3rd Administration: 1st → 2nd → 3rd

آپکا loop (اسے cause اور effect کی ایک chain کے روپ میں لکھیں):

Example: 'Slow internet والے students کو AI proctor cheating کے لئے flag کرتا ہے۔ وے complaints file کرتے ہیں۔ بہت ساری complaints administration کو manual reviews add کرنے پر force کرتی ہیں, جو پرانے in-person exams سے زیادا کھرچیلا ہے۔'

2Get Your Score

Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.

پہلی بار اوقتں لگبھگ 15-20 minutes لگتے ہیں۔ پہلے کچھ "اور پھر کیا?" questions awkward لگتے ہیں۔ یہ normal ہے۔ Real insights آم تور پر third layer پر دکھتے ہیں, first پر نہیں۔ Practice کے ساتھ, آپ ایک full map 8-12 minutes میں کر سکتے ہیں۔

Score ملنے کے باد, ایک ایسا group کھوجیں جسکا AI grader نے زکر کیا پر آپ بھول گئے۔ وہیں آپکا blind spot ہے۔ اگر AI نے ایک loop کھوجا جو آپ miss کر گئے, اس پر extra دھیان دیں۔ Loops سبسے important چیز ہیں کیونک وے آپکو دکھاتے ہیں ک ایک decision وقت کے ساتھ کب backfire کریگا۔

جو آپنے ابھی کیا, وہ یہ trace کرنے میں help کرتا ہے ک ایک decision کے باد کیا ہوتا ہے۔ پر یہ check نہیں کرتا ک decision پہلی جگہ میں سہی information پر based ہے یا نہیں۔

ایک perfectly mapped plan جو ایک غلط assumption پر بنا ہے, پھر بھی fail ہوتا ہے۔ یہ بس باد میں fail ہوتا ہے, better notes کے ساتھ۔ وہ Discipline 5 کا کام ہے۔

ایک good example دیکھنا ہے? (اپنا submit کرنے کے باد کھولیں۔)

ایک اور student نے یہی AI-proctored exam exercise کیا۔ یہ اکیلا سہی answer نہیں ہے, پر دکھاتا ہے ک ایک اچھا cascade map کیسا دکھتا ہے۔

Decision: Next semester سارے exams AI-proctored اور online-only ہونگے۔

Group	پہلے کیا ہوتا ہے	وہ کیا پیدا کرتا ہے	وہ پھر کیا پیدا کرتا ہے
Students	Slow internet یا پرانے laptops والے students struggle کرتے ہیں	کچھ کو AI proctor "cheating" کے لئے غلط flag کرتا ہے	وے students appeals file کرتے ہیں; exam system میں trust گرتا ہے
Professors	Professors exam کے دوران students کو نہیں دیکھ سکتے	وے نہیں بتا پاتے ک کوئی student confused ہے یا اٹکا ہءآ	Professors exams کو shorter اور simpler redesign کرتے ہیں, جو standard گراتا ہے
IT staff	IT کو proctoring software set up اور support کرنی پڑتی ہے	Exam week میں students tech problems کے ساتھ لگاتار IT کو call کرتے ہیں	IT overwhelmed ہو جاتا ہے; campus پر سبکے لئے response times worse ہو جاتے ہیں
Parents	Parents privacy کو لیکر worry کرتے ہیں (webcam recording)	کچھ parents complain کرنے administration سے contact کرتے ہیں	University کو نئی privacy policies لکھنی پڑتی ہیں, جس میں مہینوں لگتے ہیں
Administration	Administration exam halls پر پیسے بچاتا ہے	پر وے proctoring software licenses پر پیسے کھرچ کرتے ہیں	Cost savings expected سے چھوٹی نکلتی ہیں

Loop: Bad internet والے students cheating کے لئے flag ہوتے ہیں → وے complaints file کرتے ہیں → administration کو ہر complaint manually review کرنے کے لئے لوگ hire کرنے پڑتے ہیں → یہ exam halls book کرنے سے زیادا کھرچیلا ہے → administration in-person exams پر واپس جانے پر وچار کرتا ہے → original decision reverse ہو جاتا ہے۔

یہ اچھا کیوں ہے: سبھی 5 groups 3 layers each کے ساتھ covered ہیں۔ ہر effect explain کرتا ہے ک یہ کیسے ہوتا ہے, صرف کیا ہوتا ہے نہیں۔ Loop ایک real chain ہے: یہ ایک student problem سے شرو ہوتا ہے اور original decision کو undo کرکے کھتم ہوتا ہے۔

یہ کیا کرنے کی کوشش نہیں کرتا: ہر سنبھو effect list کرنا۔ اس scenario میں اور بھی loops ہیں (professors quit کرنا, students transfer کرنا)۔ Point اپنی پہلی try میں cause اور effect کی ایک clear chain کے ساتھ ایک real loop کھوجنا ہے, ان سبکو کھوجنا نہیں۔

اگر آپکا map اسسے tidier دکھتا ہے, تو وہی signal ہے: اپنے 2 weakest domains میں ایک اور "اور پھر کیا?" deeper جائیں اور ایک loop کے لئے پھر دیکھیں۔

یہ کام کیوں کرتا ہے (اسکے پیچھے کی research)

Cascade Map کوئی نیا idea نہیں ہے: یہ system dynamics کا ایک stripped-down version ہے, ایک ایسا field جسنے ستر سال ایک stubborn fact document کرنے میں بتائے: لوگ سیدھی lines میں reason کرتے ہیں, پر دنیا loops پر چلتی ہے۔ 3 bodies of work بتاتی ہیں ک map draw کرنا اسے اپنے head میں سوچنے سے کیوں beat کرتا ہے۔

Demand amplification (Jay Forrester, 1958). Forrester, جنہوننے MIT میں system dynamics کی نینو رکھی, نے دکھایا ک ایک chain میں ایک point پر لیا گیا decision باہر کی اور ripple کرتا ہے اور distorted واپس آتا ہے۔ انکا سبسے famous demonstration وہ ہے جسے اب bullwhip effect کہتے ہیں: retail end پر customer demand میں ایک small, steady change upstream factory orders میں wild swings پیدا کرتا ہے, کیونک ہر link پورے loop کو دیکھے بنا اپنے بگل والے link پر react کرتا ہے۔ یہ lesson supply chains سے کہیں آگے generalize ہوتا ہے: جب آپ straight-line terms میں decide کرتے ہیں ("یہ 30% بچاتا ہے"), تو آپ وہ تریکا miss کر دیتے ہیں جسسے effect system سے ہوکر travel کرتا ہے اور بدلا ہءآ واپس آتا ہے۔ Cascade Map وہ tool ہے جو return trip کو commit کرنے سے پہلے visible بنا دیتا ہے۔

اور پڑھیں: Bullwhip effect (Wikipedia), جو idea کو Forrester کے "Industrial Dynamics: A Major Breakthrough for Decision Makers," Harvard Business Review, 36(4), 1958 تک trace کرتا ہے۔

Misperception of feedback (John Sterman, the Beer Game). Sterman نے ایک اب-classic experiment چلایا, beer distribution game, جس میں players ایک simple supply chain کے ایک link کو manage کرتے ہیں۔ Smart, motivated participants بھی, یانی MBA students, executives, reliably بڑے, costly oscillations پیدا کرتے ہیں, کیونک وے جو انکے سامنے ہے اس پر react کرتے ہیں اور جو delays اور feedback loops وے نہیں دیکھ سکتے انہیں ignore کر دیتے ہیں۔ Failure effort یا intelligence کی کمی نہیں ہے; یہ ہے ک loops invisible رہتے ہیں جب تک کچھ آپکو انہیں بچھانے پر force ن کرے۔ وہ "کچھ" exactly وہی ہے جو Cascade Map provide کرتا ہے: اس forced drawing کا ایک five-minute, low-stakes version جو loop کو آپکو کچھ بھی کھرچ ہونے سے پہلے visible بنا دیتا ہے۔

اور پڑھیں: Beer distribution game (Wikipedia)۔ Full treatment Sterman کی Business Dynamics: Systems Thinking and Modeling for a Complex World (McGraw-Hill, 2000) میں ہے۔

Leverage points (Donella Meadows, 2008). Meadows, جنہوننے اسی MIT tradition میں کام کیا, نے اپنا career یہ argue کرنے میں بتایا ک ایک system کو بدلنے کی سبسے powerful جگہیں لگبھگ کبھی obvious والی نہیں ہوتیں۔ سبسے بڑا leverage آم تور پر feedback loops میں بیٹھتا ہے, یانی بلکہل وے structures جنہیں straight-line analysis کبھی name نہیں کرتا۔ انکا blunt corollary: آپ ایک ایسے loop کو adjust, weaken, یا اسسے protect نہیں کر سکتے جسے آپنے draw ہی نہیں کیا۔ Cascade Map کا پورا کام کم سے کم ایک loop surface کرنا ہے, کیونک وہ loop hidden risk بھی ہے اور intervene کرنے کی highest-leverage جگہ بھی۔

اور پڑھیں: Meadows کا essay Leverage Points: Places to Intervene in a System, جو انکی book Thinking in Systems (Chelsea Green, 2008) کا آدھار بنا۔

Cascade Map تینوں کو combine کرتا ہے۔ Decisions ایک system سے ہوکر ripple کرتے ہیں اور distorted واپس آتے ہیں (Forrester), لوگ reliably ان return trips کو miss کر دیتے ہیں جب تک انہیں draw کرنے پر force ن کیا جائے (Sterman), اور جو loops وے miss کرتے ہیں وے exactly act کرنے کی highest-leverage جگہیں ہیں (Meadows)۔ Map وہ forced drawing ہے جو loop کو تب پکڑتا ہے جب decision بدلنا ابھی بھی free ہے۔ کسی نے Cascade Map کو AI کے against specifically test نہیں کیا, پر underlying finding, ک humans feedback loops miss کرتے ہیں اور انہیں externalize کرنا اسے fix کرتا ہے, اس field کے سبسے زیادا replicated results میں سے ایک ہے۔ AI-era twist بس یہ ہے ک اب آپ کے پاس opposite blind spot والا ایک partner ہے: AI اس breadth پر strong ہے جو آپ بھول جاتے اور ان loops پر weak جنہیں آپ sense کرنے کے لئے بنے ہیں, تو map کو ساتھ draw کرنا دونوں gaps ایک ساتھ بند کر دیتا ہے۔

Go deeper: Part 0 Chapter 3: Thinking in Systems. Full version (peer review plus AI counter-analysis plus assessment rubric; 60 minutes) اسے ایک system بنا دیتا ہے۔

Part 3: Origination (وہ کرنا جو AI نہیں کر سکتا)

Part 1 نے آپکو AI سے پوچھنے سے پہلے سوچنا سکھایا۔ Part 2 نے AI کے answers میں mistakes پہچاننا سکھایا۔ Part 3 کچھ الگ ہے: وہ thinking کرنا جو AI آپ کے لئے نہیں کر سکتا۔

یہاں AI کے 2 بڑے blind spots ہیں۔ پہلا, وہ آپکو سبسے common answer دیتا ہے, زروری نہیں ک آپکی situation کے لئے best answer دے۔ اگر 1000 لوگوں نے وہی question پوچھا ہو, تو AI انکے لئے کام کرنے والی چیز کا average دیتا ہے۔ لیکن آپکی situation الگ ہو سکتی ہے۔ دوسرا, جتنا زیادا آپ AI use کرتے ہیں, اتنا آسان ہوتا ہے کھد سوچنا بند کر دینا اور اسکی ہر بات accept کر لینا۔

Disciplines 5 اور 6 دونوں problems fix کرتی ہیں۔

شرو کرنے سے پہلے ایک important phrase سیکھیں: named threshold۔ Named threshold ایک specific condition ہے جو بتاتی ہے ک کوئی advice کب کام کرنا بند کرتی ہے۔ Example: "یہ advice تب کام کرتی ہے جب آپکی class میں 30 سے کم students ہوں" ایک named threshold ہے۔ "یہ کبھی-کبھی کام کرتی ہے" named threshold نہیں ہے, کیونک "کبھی-کبھی" یہ نہیں بتاتا ک کب۔ آپ ایک minute میں اس phrase کا use کریں گے۔

Discipline 5: First Principles

آپ اپنی university کے coding club کے president ہیں۔ Campus کے ہر دوسرے club نے membership fee لینا شرو کر دیا ہے۔ آپ کے vice president, faculty advisor, اور 2 senior members سبھی ایک ہی بات کہتے ہیں: "ہمیں بھی fee لینی چاہئے, باکی سبھی ایسا کر رہے ہیں۔" آپ AI سے پوچھتے ہیں۔ AI بھی agree کرتا ہے۔ ہر کوئی ایک ہی direction میں point کر رہا ہے۔

یہی agreement danger ہے۔ جب AI وقتت سبھی ایک ہی answer کے پیچھے کھڑے ہو جاتے ہیں, تو بات settled لگتی ہے اور سوچنا بند کرکے ساتھ چلنا آسان ہو جاتا ہے۔ لیکن common answer اس پر بنا ہے ک زیادہ تر clubs کے لئے کیا کام کرتا ہے۔ آپکا club exception ہو سکتا ہے, اور room میں کوئی check نہیں کر رہا ک ایسا ہے یا نہیں۔ یہ discipline وہی check کرنے کا تریکا ہے۔

Check کی ایک specific shape ہے: common advice لیں اور وہ exact condition کھوجیں جہاں وہ کام کرنا بند کر دیتی ہے۔ زیادہ تر لوگ advice پر doubt کرتے وقت ایک vague complaint دیتے ہیں: "Fee لینا ہمیشا good idea نہیں ہوتا۔" یہ useless ہے, کیونک "ہمیشا نہیں" کبھی نہیں بتاتا ک کب۔ Skill ہے اس vague complaint کو ایک named threshold میں بدلنا, یانی ایک specific, numbered condition جہاں advice ٹوٹتی ہے۔

"First principles" کیوں? First principles سے reason کرنے کا متلب ہے کسی answer کو صرف اسلئے accept ن کرنا کیونک ہر کوئی اسے repeat کر رہا ہے۔ اسکے بجای, پتا لگائیں ک آپکی situation میں سچ کیا ہے۔ آم تور پر لوگ اسے scratch سے answer build کرنے کی طرح دیکھتے ہیں۔ یہ discipline اسکا lighter, faster version کرتی ہے: advice کو پھر سے build کرنے کے بجای اسے test کریں۔ وہ exact condition کھوجیں جہاں common answer آپ کے لئے true رہنا بند کر دیتا ہے۔ Root move وہی ہے, یانی consensus کو authority مانکر accept ن کریں, اپنے case کے against check کریں, لیکن blank page کے بجای boundary پر focus کریں۔

Move کو 1 بار دیکھیں۔ Same situation, advice پر doubt کرنے کے 2 طریقے:

Vague complaint: "Fee لینا ہمیشا good idea نہیں ہوتا۔"
Named threshold: "جب آپ کے club کا main goal ایسے first-year students کو attract کرنا ہو جنہوننے پہلے کبھی code نہیں کیا, اور انمیں سے زیادہ تر fee afford ن کر سکیں, تو پیسے مانگنا انہیں لوگوں کو ڈرا دیگا جن تک آپ پہنچنا چاہتے ہیں۔"

پہلا بس ایک shrug ہے۔ دوسرا exact بتاتا ہے ک advice کب fail ہوتی ہے (first-years جو fee afford نہیں کر سکتے) اور کیوں (fee ان لوگوں کو روکتی ہے جن تک club پہنچنا چاہتا ہے)۔ پہلا کچھ نہیں بدلتا۔ دوسرا آپکا decision بدلتا ہے۔ Shrug اور named condition کے بیچ یہی gap پوری discipline ہے۔

اسے practice ایسے کریں۔ Common advice کا کوئی ایک piece چنیں جسے آپ کے آسپاس ہر کوئی, اور AI, follow کرنے کو کہتا ہے۔ پھر 3 rows لکھیں۔ ہر row میں ایک specific situation describe کریں جہاں وہ advice کام نہیں کریگی۔ صرف "کبھی-کبھی" نہیں, ایک real number یا real condition use کریں۔

Common advice	یہ کب کام کرنا بند کرتی ہے? (ایک specific number یا condition use کریں۔)

اگر آپ 3 rows specific conditions کے ساتھ نہیں بھر سکتے, تو آپ advice کو سچ میں سمجھے بنا follow کر رہے تھے۔

کیسے بتائیں ک آپکی row اچھی ہے: "جب آپ کے club کے 80% سے زیادا members first-year ہوں اور انکی income ن ہو, تو fee لینے سے membership آدھی رہ جائیگی" useful ہے۔ یہ exact بتاتی ہے ک advice کہاں ٹوٹتی ہے۔ "Fee لینا ہمیشا کام نہیں کرتا" decision لینے میں help کرنے کے لئے بہت vague ہے۔

دھیان دیں ک یہ کسے protect کرتا ہے۔ Club president سے fee لینے کے decision کا کوئی audit نہیں کرنے والا تھا۔ پورا room اور AI agree کر رہے تھے ک وہی سہی move ہے۔ اگر وہ consensus follow کرتی, تو بس ایک worse decision لیتی, membership گرتی دیکھتی, اور کبھی نہیں جانتی ک named threshold reason تھا۔ Threshold باد میں کھد کو defend کرنے کے لئے بنائی گئی چیز نہیں ہے۔ وہ bad decision کو تب پکڑتی ہے جب آسپاس سب ابھی بھی ہاں میں سر ہلا رہے ہوں۔

Boundary Conditions: Vague Complaints سے Named Thresholds تک

ایک good result ایسا دکھتا ہے۔

اوپر والی coding club president نے پہلی try میں 3 perfect rows نہیں لکھیں۔ سوچنے کے باد, اسکے پاس یہ تھا:

Common advice: "ہر club کو membership fee لینی چاہئے۔"
Boundary 1. جب آپ کے 80% سے زیادا members ایسے first-year students ہوں جنکی کوئی income نہیں, تو fee انہیں لوگوں کو ڈرا دیگی جن تک آپ پہنچنا چاہتے ہیں۔ Threshold: 80% first-year, no-income members۔
Boundary 2. جب آپ کے club کی main value free workshops ہوں جنہیں کوئی بھی join کر سکے, تو fee ایک ایسی barrier بناتی ہے جو walk-in attendance کھتم کر دیتی ہے۔ یہ تب سبسے زیادا matter کرتا ہے جب آپ کے campus میں 3 یا زیادا competing clubs ابھی بھی free ہوں۔ Threshold: same campus پر 3+ free competing clubs۔
Boundary 3. جب آپ کے club کا زیادہ تر budget university grant سے آتا ہو جسکی requirement سبھی students کے لئے open رہنا ہے, تو fee لینے سے grant جا سکتی ہے۔ Threshold: "open access" requirement والی grant جو آپ کے آدھے سے زیادا budget کو cover کرتی ہو۔

اس نے 3 boundaries اپنے faculty advisor کے سامنے رکھیں۔ انہوننے club free رکھنے اور sponsored hackathons سے پیسے جٹانے کا فیصلہ کیا۔ Semester کے end تک membership 40% بڑھی, جبک fee شرو کرنے والے دوسرے clubs کی attendance گھٹی۔ 3 boundaries میں سے کوئی common advice میں نہیں تھی۔ AI کے first answer میں بھی کوئی نہیں تھی۔

یہ 3 boundaries documented evidence of thinking کا بھی ایک piece ہیں, وہی چیز جسکے بارے میں page کے top والا rule ہے۔ جب president اپنے advisor کے ساتھ بیٹھی, اس نے یہ نہیں کہا "مجھے fee کے بارے میں bad feeling ہے۔" اس نے table پر 3 named conditions رکھیں۔ Feeling اور 3 named thresholds کے بیچ کا فرق overrule ہونے اور سنے جانے کے بیچ کا فرق ہے۔ Rows اسکی thinking بھی تھیں اور اس بات کا proof بھی ک اس نے thinking کی تھی۔

Named thresholds کے بنا اس نے شاید ایسا کچھ لکھا ہوتا:

Common advice: "ہر club کو fee لینی چاہئے۔"	یہ help کیوں نہیں کرتا
کبھی-کبھی fee لینا good idea نہیں ہوتا۔	بہت vague۔ "کبھی-کبھی" نہیں بتاتا کب۔ اسکا متلب 5% members چھوڑیں یا 90%, کچھ بھی ہو سکتا ہے۔ اسسے decision نہیں ہوتا۔
دوسرے clubs ہمیشا نہیں جانتے ک وے کیا کر رہے ہیں۔	یہ دوسرے clubs کی complaint ہے, آپ کے decision کا reason نہیں۔ اسسے کچھ نہیں بدلتا۔
یہ situation پر depend کرتا ہے۔	کس چیز پر depend کرتا ہے یہ بتائے بنا "it depends" کہنا help نہیں کرتا۔ سبھی پہلے سے جانتے ہیں ک depend کرتا ہے۔

کھد try کریں

آپکی exercise: کوئی common advice چنیں جو لوگ آپکو بار-بار بتاتے ہیں۔ Examples: "اپنے passion کو follow کریں," "ہمیشا group میں study کریں," "ہر paycheck کا 20% save کریں," "lectures skip ن کریں۔" 3 rows لکھیں۔ ہر row میں ایک specific situation, number یا condition کے ساتھ, name کریں جہاں وہ advice کام کرنا بند کر دیتی ہے۔

(آپ کوئی بھی advice چنیں, یہ اسی طرح کام کرتا ہے۔)

شرو کرنے سے پہلے یاد رکھیں: Threshold ایک specific number یا condition use کرتی ہے ("جب آپکی class میں 200 سے زیادا students ہوں")۔ "کبھی-کبھی," "اکسر," اور "it depends" جیسے words thresholds نہیں ہیں۔

اگر third row نہیں بن رہی, تو اسکا متلب ہے ک آپ advice کو سچ میں سمجھے بنا follow کر رہے تھے۔ Weak third row force کرنے کے بجای الگ advice چنیں۔ یہ کھد ایک useful discovery ہے۔

1Your Work

AI grader 2 چیزیں check کریگا:

کیا ہر row میں ایک specific threshold ہے (number, condition, clear situation)? 1-10 rate کریں۔ میری weakest row quote کریں۔
کیا ہر row explain کرتی ہے ک advice اس situation میں کیوں fail ہوتی ہے, یا صرف کہتی ہے "یہ کام نہیں کرتی"? 1-10 rate کریں۔ کوئی row vague complaint ہے, real explanation نہیں, تو point out کریں۔

میری rows rewrite ن کریں۔ کوئی row empty یا vague ہو تو بس کہیں۔

وہ common advice جسے میں examine کر رہا ہوں:

Example: 'ہمیشا group میں study کریں۔'

Row 1: یہ advice کب کام کرنا بند کرتی ہے? (ایک specific condition name کریں اور explain کریں ک کیوں۔)

جب [number یا condition والی specific situation], یہ advice fail ہوتی ہے کیونک [reason]۔

Row 2:

جب [number یا condition والی specific situation], یہ advice fail ہوتی ہے کیونک [reason]۔

Row 3:

جب [number یا condition والی specific situation], یہ advice fail ہوتی ہے کیونک [reason]۔

2Get Your Score

Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.

پہلی بار اوقتں لگبھگ 15-25 minutes لگتے ہیں۔ Thresholds لکھنا آپکی expectation سے hard ہے۔ Score ملنے کے باد کوئی row کھوجیں جہاں آپنے "کبھی-کبھی" یا "it depends" لکھا اور اسے real number یا condition کے ساتھ rewrite کریں۔ اگر rewrite نہیں کر سکتے, تو وہ row شاید real boundary نہیں ہے۔ اسے drop کرکے الگ one try کریں۔

آپنے ابھی یہ پتا لگانا سیکھا ک advice کا ایک piece کہاں کام کرنا بند کرتا ہے۔ لیکن یہ ان problems پر AI کے ساتھ کام کرنے میں help نہیں کرتا جہاں challenge کرنے کے لئے کوئی obvious advice نہیں ہے۔ Discipline 6 وہی کرتی ہے۔

ایک good example دیکھنا ہے? (اپنا submit کرنے کے باد کھولیں۔)

ایک دوسری student نے "ہمیشا group میں study کریں" advice چنی۔ اسکی 3 rows یہ تھیں:

Common advice: "ہمیشا group میں study کریں۔"
Row 1. 5 سے بڑے groups اچھے سے کام نہیں کرتے۔ زیادہ تر لوگ بس بیٹھکر سنتے ہیں جبک 2-3 لوگ real work کرتے ہیں۔ جب یہ ٹوٹتی ہے: 5 سے زیادا لوگ۔
Row 2. کچھ subjects میں quiet focus چاہئے, جیسے math problems solve کرنا یا essays لکھنا۔ Group میں کوئی ہر کچھ minutes میں interrupt کرتا ہے۔ جب یہ ٹوٹتی ہے: ایسے tasks جنمیں 30 minutes سے زیادا quiet thinking چاہئے۔
Row 3. جب 1 person باکی سب سے بہت زیادا جانتا ہے, تو وہ study کرنے کے بجای پورا time explain کرنے میں لگاتا ہے۔ وہ اپنے work میں پیچھے رہ جاتا ہے۔ جب یہ ٹوٹتی ہے: جب best اور weakest student میں 2 grade levels سے زیادا gap ہو۔

یہ اچھا کیوں ہے: ہر row ایک specific number use کرتی ہے (5 people, 30 minutes, 2 grade levels)۔ ہر row explain کرتی ہے ک advice کیوں fail ہوتی ہے, صرف یہ نہیں ک fail ہوتی ہے۔

3 clear rows کافی ہیں۔ ہر possible situation list کرنے کی زرورت نہیں۔

یہ کام کیوں کرتا ہے (اسکے پیچھے کی research)

First Principles move, یانی وہ exact condition کھوجنا جہاں common advice آپ کے لئے true رہنا بند کرتی ہے, 3 پرانے ideas پر بنی ہے جو بتاتے ہیں ک advice کیوں fail ہوتی ہے اور اسے کیسے test کریں۔

Ecological rationality (Gerd Gigerenzer, Peter Todd & ABC Research Group, 1999). انکی core finding ایک چھوٹی equation میں آتی ہے: heuristic + environment = outcome۔ Rule of thumb اپنے آپ good یا bad نہیں ہوتی۔ وہ ان environments میں good ہے جہاں fit ہوتی ہے اور ان environments میں bad جہاں fit نہیں ہوتی۔ پوری skill یہ جاننا ہے ک آپ کس environment میں ہیں۔ "Membership fee لیں" ایسے clubs کے لئے tuned heuristic ہے جنکے members pay کر سکتے ہیں۔ اسے no-income first-years والے club میں ڈالیں اور وہی rule backfire کرتی ہے۔ Named threshold صرف exact بتاتی ہے ک environment کہاں advice کے fit ہونا بند کرتا ہے, اور اسی judgment کو یہ work good اور bad decisions کے بیچ کا فرق کہتی ہے۔

اور پڑھیں: Ecological rationality (Wikipedia), جو Gigerenzer, Todd & ABC Research Group کی Simple Heuristics That Make Us Smart (Oxford University Press, 1999) summarize کرتی ہے۔

Recognition-primed decisions (Gary Klein, 1998). Firefighters, nurses, اور pressure میں کام کرنے والے دوسرے experts کو study کرکے Klein نے پایا ک وے rarely options weigh کرتے ہیں۔ وے situation کو familiar pattern کی طرح recognize کرتے ہیں اور پہلا fit ہونے والا pattern run کرتے ہیں, اکسر یہ notice کئے بنا ک انہوننے ایسا کیا۔ یہ fast ہے اور اکسر right, لیکن consensus advice بھی اسی طرح بنا examine ہئے نکل جاتی ہے: وہ ایک recognized, settled answer جیسی feel ہوتی ہے۔ Pattern کب fail ہوگا یہ لکھنے کے لئے کھد کو force کرنا وہ deliberate pause ہے جو automatic match interrupt کرتا ہے۔ آپ pattern-matching کو اتنا روکتے ہیں ک check کر سکیں آپکا case exception تو نہیں۔

اور پڑھیں: Recognition-primed decision (Wikipedia); full account Klein کی Sources of Power: How People Make Decisions (MIT Press, 1998) میں ہے۔

Falsifiability (Karl Popper, 1959). Popper نے argue کیا ک کوئی claim دنیا کے بارے میں تبھی کچھ بتاتی ہے جب آپ بتا سکیں ک اسے غلط کیا prove کریگا۔ ہر possible outcome میں survive کرنے والا belief کچھ explain نہیں کرتا۔ Named threshold advice پر applied falsifiability test ہے: "یہ تب تک کام کرتی ہے جب تک 80% سے زیادا members fee afford ن کر سکیں" وہ exact condition name کرتی ہے جہاں آپ advice چھوڑ دینگے۔ Vague complaint, "یہ ہمیشا کام نہیں کرتی," کوئی condition name نہیں کرتی, کبھی check نہیں ہو سکتی, اور اسلئے کچھ نہیں بدلتی۔ Threshold اور shrug میں یہی فرق ہے۔

اور پڑھیں: Falsifiability (Wikipedia), وہ idea جسے Popper نے The Logic of Scientific Discovery (1959) میں introduce کیا۔

First Principles تینوں کو combine کرتی ہے۔ Advice صرف اس environment کے لئے right ہوتی ہے جہاں وہ fit کرتی ہے (Gigerenzer & Todd), consensus بنا check نکلا جاتا ہے کیونک "settled" answer recognize کرنا automatic ہے (Klein), اور cure ہے وہ exact condition name کرنا جو آپ کے لئے advice کو wrong prove کریگی (Popper)۔ Named threshold تینوں ایک ساتھ کرتی ہے: environment state کرتی ہے, automatic match interrupt کرتی ہے, اور check کرنے لایک specific ہوتی ہے۔ اس exact exercise کو AI کے against کسی نے test نہیں کیا, لیکن underlying ideas decades سے hold کر رہے ہیں۔ AI کے confident consensus answers کو pressure-test کرنے کے لئے انہیں use کرنا natural next step ہے۔

Go deeper: Part 0 Chapter 4: Reasoning from First Principles. Full version (Blank Page Sprint: جس practice کو آپ follow کر رہے ہیں اسکے against 500 words لکھیں, پھر structured AI counter-analysis اور peer review run کریں; 60 minutes) Part 0 میں ہے۔ یہ page row shape سکھاتا ہے۔ وہ page longform argument سکھاتا ہے۔

Discipline 6: Working WITH AI

آپنے صبح AI کے ساتھ ایک important essay پر کام کیا۔ Result شاندار دکھتا ہے۔ Arguments clear ہیں اور writing polished ہے۔ پھر professor پوچھتے ہیں: "اسکے کون سے parts آپ کے ideas ہیں اور کون سے AI سے آئے?" آپ بولنے کے لئے منہ کھولتے ہیں اور realize کرتے ہیں ک بتا نہیں سکتے۔ کچھ sentences آپ کے ہیں۔ کچھ AI کے۔ زیادہ تر mix ہیں۔ Essay اچھا ہے۔ بس آپ نہیں جانتے ک کون سے parts آپ سچ میں explain اور defend کر سکتے ہیں۔

اسے fix کرنے کے لئے same task کو 3 الگ تریکوں سے کریں, پھر results side by side compare کریں۔

Solo. 15 minutes, no AI۔ صرف آپ اور problem۔
AI-only. 5 minutes۔ AI سے پوچھیں, پہلا answer accept کریں, کچھ change ن کریں۔
Collaborative. 10 minutes۔ AI سے پوچھیں, critically پڑھیں, جہاں زرورت ہو disagree کریں, follow-up questions پوچھیں, اور کچھ parts کھد rewrite کریں۔

پھر تینوں versions compare کریں۔ کھد سے پوچھیں: کون سا version best ہے? "Together" version کے کون سے parts اسلئے better ہیں کیونک آپنے کسی چیز پر push back کیا? "Together" version آم تور پر جیتتا ہے, لیکن real lesson یہ exact دیکھنا ہے ک آپکی thinking نے اسے کہاں better بنایا۔ یہی discipline ہے۔

Comparison ایسا feel ہوتا ہے۔ مان لیں آپکا task professor کو email کی closing line لکھنا ہے۔ تینوں versions ساتھ رکھکر صرف وہی 1 line پڑھیں:

Solo: "Thanks, and sorry again for the trouble." (Apologetic, تھوڑی weak۔)
AI-only: "Thank you for your time and consideration." (Polished, لیکن یہ کسی کی بھی email ہو سکتی ہے۔)
Collaborative: "اگر اسسے help ہو, تو میرے پاس ابھی تک جو ہے وہ میں آپکو دکھا سکتا ہوں۔" (آپکی, یہ prove کرتی ہے ک آپنے work شرو کر دیا ہے۔)

انہیں side by side پڑھنا ہی پورا move ہے۔ Solo line دکھاتی ہے ک آپ اکیلے کیا لکھتے۔ AI-only line دکھاتی ہے ک AI کا default کیا ہے۔ Collaborative line وہ ہے جسے آپ defend کر سکتے ہیں, کیونک آپ جانتے ہیں ک وہ باکی 2 سے کیوں better ہے: وہ ایسا کام کرتی ہے جو باکی دونوں نہیں کرتیں۔ آپنے صرف feel نہیں کیا ک collaborative version better ہے۔ آپ line پر point کرکے بتا سکتے ہیں ک وہ کیا کرتی ہے۔ یہی pointing skill ہے۔

Real project میں full comparison لگبھگ 30 minutes لیتا ہے۔ نیچے کی exercise quick 10-minute version ہے تاک آج ہی difference feel کر سکیں۔

Three-Path Comparison

پورے task میں یہ ایسا دکھتا ہے۔

ایک student کو major assignment کی deadline extension مانگنے کے لئے professor کو email لکھنی تھی۔ اسکے پاس real reason تھا, family emergency, لیکن email honest ہونی تھی اور excuse جیسی نہیں لگنی تھی۔ اس نے تینوں paths try کئے۔

Solo, 15 minutes۔ اس نے بنا AI help کے email کھد لکھی۔ وہ honest اور personal تھی۔ اس نے situation clearly explain کی۔ لیکن وہ بہت لنبی ہو گئی, اور actual request ("کیا مجھے 5 days اور مل سکتے ہیں?") bottom میں دب گئی۔ Email اتنی لنبی تھی ک professor شاید end تک ن پڑھتے۔

AI-only, 5 minutes۔ اس نے AI کو situation دی اور first draft بنا change accept کیا۔ Email polished اور well-structured تھی۔ لیکن وہ generic لگتی تھی, جیسے کوئی بھی template بھیج سکتا تھا۔ اوقتں اسکی situation کی کوئی specific details نہیں تھیں۔ وہ اسکی آواز نہیں لگتی تھی۔ Professor شاید سوچتے ک اس نے AI email copy کر دی۔

Collaborative, 10 minutes۔ اس نے opening کھد لکھی, اپنی specific situation اپنے words میں explain کی, پھر AI سے email restructure کرنے میں help مانگی تاک request first آئے۔ AI نے tone soften کرنے کو کہا۔ اس نے disagree کرکے direct wording رکھی کیونک وہ جانتی تھی ک یہ professor politeness سے زیادا honesty پسند کرتے ہیں۔ اس نے AI سے closing line بھی مانگی۔ AI کا version بہت formal تھا, اسلئے اس نے اسے اپنے بولنے کے طریقے سے match کرنے کے لئے rewrite کیا۔ Final email clear, personal, اور well-structured تھی۔ Professor نے 1 hour میں reply کرکے extension دے دی۔

Collaborative version 2 specific چیزوں کے کارن جیتا جو اس نے کیں: اس نے اپنی direct wording رکھی, جسے AI soften کرنا چاہتا تھا, اور request کو top پر رکھا, جو اسے اکیلے نہیں سوجھتا۔ وہ exact point کر سکتی ہے ک اسکے judgment نے email کہاں better بنائی۔

Last sentence top والے rule سے connection ہے۔ 3 versions side by side documented evidence of thinking ہیں۔ Win یہ نہیں ک "email اچھی تھی۔" بہت سی AI-only emails اچھی ہوتی ہیں۔ Win یہ ہے ک وہ line by line دکھا سکتی ہے ک اسکے judgment نے result کہاں change کیا, اور professor کا question, "کون سے parts آپ کے ہیں?", اسل میں یہی پوچھ رہا تھا۔ یہ بھی دھیان دیں ک payoff professor کے کبھی پوچھنے پر depend نہیں تھا۔ اگر کسی نے question ن بھی کیا ہوتا, comparison نے email کو genuinely ان دونوں paths سے better بنایا جو اکیلے بنتے۔ Audit بس اس value کو visible کرتا ہے جو دونوں cases میں تھی۔

صرف Collaborative نہیں, تینوں versions کیوں چاہئے:

Solo version کے بنا, آپ نہیں جانتے ک اکیلے کیا لکھتے۔ اسلئے final email میں کون سے ideas آپ کے ہیں اور کون سے AI کے, آپ نہیں بتا سکتے۔
تینوں compare کئے بنا, آپ prove نہیں کر سکتے ک Collaborative version سچ میں better ہے۔ اگر کوئی پوچھے کیوں, تو "better feel ہوتی ہے" real answer نہیں۔
AI-only version کے بنا, آپ نہیں بتا سکتے ک آپنے AI کی ہر بات بس accept کر لی۔ اگر Collaborative اور AI-only لگبھگ same دکھتے ہیں, تو آپنے collaborate نہیں کیا۔ بس copy کیا۔

اسے کب use کریں اور کب skip کریں

اسے ایسے work کے لئے use کریں جہاں آپکا personal experience matter کرتا ہے: emails جنہیں آپکی آواز جیسا لگنا ہے, decisions جہاں AI آپکی situation نہیں جانتا, creative work جسے آپ کے ideas چاہئے۔ ایسے simple tasks جہاں AI اکیلا اچھا کرتا ہے, جیسے table format کرنا یا notes summarize کرنا, AI کو کرنے دیں۔ ایسے tasks پر یہ exercise waste ن کریں جنہیں آپ کے judgment کی زرورت نہیں۔

کھد try کریں

یہاں سے شرو کریں: Landlord کو rent reduction مانگنے کا message لکھیں, یا professor کو deadline extension مانگنے کا message۔ کچھ ایسا جہاں آپ کے پاس وہ context ہے جو AI کے پاس نہیں, جیسے payment history, سامنے والے کے ساتھ آپکا relationship, یا specific situation۔

Workplace version: Boss آپسے 1-page memo مانگتے ہیں ک company کو ایک smaller competitor کھریدنا چاہئے یا نہیں۔ Competitor میں 90 people ہیں اور وہ last quarter تک fast grow کر رہا تھا, جب اس نے اپنا biggest customer کھو دیا جو revenue کا 22% دیتا تھا۔ وے $40-55M میں buyout کے لئے open ہیں۔ آپکی recommendation اگلے 3 years تک quote کی جائیگی۔

دونوں options میں تینوں versions کریں: Solo (5 min), AI-only (3 min), Collaborative (5 min)۔ تینوں side by side رکھیں۔ Point memo نہیں ہے۔ Point 3 paths کے بیچ کا felt difference ہے۔

(یا اس week اپنے desk کا کوئی real decision چنیں۔ جتنا real ہوگا, comparison اتنا sharp ہوگا۔)

AI-only draft skip ن کریں۔ یہی وہ draft ہے جسے drop کرنا سبسے tempting ہے ("مجھے already پتا ہے AI کیا کہیگا") اور رکھنا سبسے diagnostic ہے۔ اگر Collaborative uncomfortable روپ سے AI-only کے کریب نکلتا ہے, آپنے over-accept کیا۔ یہ صرف دونوں لکھکر پتا چلتا ہے۔

1Your Work

AI grader 2 چیزیں check کریگا:

کیا آپ کے 3 versions سچ میں الگ ہیں, یا سب same بات کہتے ہیں? 1-10 rate کریں۔ اگر Solo اور Collaborative لگبھگ identical لگیں, تو کہیں۔
کیا آپ کے 3 overrides specific ہیں? 1-10 rate کریں۔ ہر override ایسی چیز ہونی چاہئے جس پر آپ point کرکے کہ سکیں "اسکے بنا email worse ہوتی۔" کوئی override vague ہو, جیسے "میں نے اسے better بنایا," تو کہیں۔

میرے work کو rewrite ن کریں۔ کوئی box empty یا vague ہو تو بس کہیں۔

اپنے تینوں versions describe کریں (آپنے کیا لکھا, کس بات نے surprise کیا, اور کہاں وہ short رہا):

Solo (15 min, no AI): میں نے لکھا... | AI-only (5 min): AI نے لکھا... | Collaborative (10 min): میں نے AI use کیا لیکن change کیا...

Collaborative version میں change یا add کی ہوئی 3 specific چیزیں name کریں جنہوننے اسے better بنایا:

1. میں نے change کیا... کیونک... | 2. میں نے add کیا... کیونک... | 3. میں نے AI سے disagree کیا... کیونک...

آپ کون سا version سچ میں send کریں گے, اور کیوں?

Solo / AI-only / Collaborative۔ Why explain کرتا 1 sentence۔

2Get Your Score

Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.

Thinking time سہت اوقتں total لگبھگ 15 minutes لگتے ہیں۔ Score ملنے کے باد وہ جگہ کھوجیں جہاں AI grader کہتا ہے ک آپکا Solo version کسی چیز میں better تھا۔ وہ بتاتا ہے ک Collaborative version میں آپنے اپنی thinking کے بجای AI پر زیادا بھروسا کہاں کیا۔

آپنے ابھی 1 exercise میں پورا crash course کیا۔ AI سے پوچھنے سے پہلے اپنی رائے بنائی (Discipline 1)۔ کس بات سے agree اور disagree کیا اسکا track رکھا (Discipline 2)۔ Mistakes check کیں (Discipline 3)۔ آگے کیا ہوتا ہے سوچا (Discipline 4)۔ Common advice کہاں کام کرنا بند کرتی ہے test کیا (Discipline 5)۔ اور AI کے takeover کرنے کی کوشش کے دوران اپنا judgment اپنے پاس رکھا (Discipline 6)۔ Point کبھی answer کھد نہیں تھا۔ Point یہ دکھا پانا ہے ک وہاں پہنچنے کے لئے آپنے کیسے سوچا۔

ایک good example دیکھنا ہے? (اپنا submit کرنے کے باد کھولیں۔)

ایک دوسری student نے deadline extension مانگتے ہئے professor کو email لکھی۔ ہر version ایسا دکھا:

Version	اس نے کیا لکھا
Solo (15 min)	Honest اور personal۔ Family situation clearly explain کی۔ لیکن بہت لنبی تھی, اور actual request ("کیا مجھے 5 days اور مل سکتے ہیں?") bottom میں دب گئی۔ اسے پتا تھا restructure چاہئے لیکن time کھتم ہو گیا۔
AI-only (5 min)	Short اور well-organized۔ لیکن template جیسی لگی۔ "I would greatly appreciate your consideration" جیسے phrases use ہئے جو وہ real life میں کبھی نہیں کہتی۔ Course یا professor کی کوئی specific detail نہیں تھی۔
Collaborative (10 min)	Opening اپنے words میں لکھی, پھر AI سے request top پر رکھنے میں help مانگی۔ AI نے tone softer کرنے کو کہا; اس نے direct wording رکھی کیونک وہ جانتی تھی professor honesty پسند کرتے ہیں۔ AI کا structure use کیا لیکن closing اپنے sentence سے replace کی۔

Collaborative version میں اس نے 3 چیزیں change کیں:

اپنا direct tone رکھا۔ AI نے اسے زیادا formal بنانے کی کوشش کی ("I would be grateful for your understanding")۔ اس نے original wording ("مجھے 5 days اور چاہئے") رکھی کیونک professor نے کہا تھا ک انہیں point پر آنے والے students پسند ہیں۔ اسکے بنا email ہر AI-written extension request جیسی لگتی۔
Request کو first line میں move کیا۔ اسے اکیلے یہ نہیں سوجھتا۔ AI نے suggest کیا۔ Solo version پر یہی single biggest improvement تھا۔
AI کی closing line replace کی۔ AI نے لکھا "Thank you for your time and consideration." اس نے اسے "اگر اسسے help ہو, تو میرے پاس ابھی تک جو ہے وہ میں آپکو دکھا سکتی ہوں" سے replace کیا۔ اسسے پتا چلا ک اس نے work شرو کر دیا تھا۔ اسکے بنا email generic line پر end ہوتی جسکا کوئی کام نہیں تھا۔

یہ اچھا کیوں ہے: ہر override ایسی چیز پر point کرتی ہے جسے وہ جانتی تھی اور AI نہیں, جیسے professor کو directness پسند ہے اور اس نے work شرو کر دیا ہے۔ وہ exact بتا سکتی ہے ک اسکے judgment نے email کہاں better بنائی۔ یہی test ہے۔

یہ کام کیوں کرتا ہے (اسکے پیچھے کی research)

یہ exercise جس pattern پر بنی ہے, human + AI دونوں اکیلے سے better ہوتے ہیں لیکن تبھی جب human decisions اپنے پاس رکھے, AI productivity research کی سبسے consistent findings میں سے ایک ہے۔ 3 pieces of work اسے 3 angles سے explain کرتے ہیں۔

Human + machine teaming (Garry Kasparov, "centaur" chess پر)۔ 1997 میں IBM Deep Blue سے ہارنے کے باد Kasparov نے conclusion نہیں نکالا ک machines بس جیت گئیں۔ انہوننے advanced chess popularize کرنے میں help کی, جہاں human computer کے ساتھ کھیلتا ہے۔ باد کے freestyle tournaments میں strongest competitors اکسر grandmasters یا best engines نہیں, بلکہ ordinary players تھے جو machine کو manage کرنا جانتے تھے, یانی اسکی calculation پر کب trust کرنا اور strategy پر human judgment سے کب override کرنا۔ Durable lesson chess کے بارے میں نہیں ہے (آج کے engines اتنے strong ہیں ک human pure play کم ہی improve کرتا ہے)۔ Lesson ہے ک teaming تب جیتتی ہے جب human وہ چیز لاتا ہے جو machine میں نہیں۔ Writing اور decision-making میں وہ چیز آپکا private context ہے: آپکی situation, reader, اور آپ سچ میں کیا کہنا چاہتے ہیں۔ Collaborative path یہی add کرنے پر force کرتی ہے۔

اور پڑھیں: Advanced chess (Wikipedia); Kasparov یہ argument Deep Thinking (PublicAffairs, 2017) میں develop کرتے ہیں۔

AI ان لوگوں کو سبسے زیادا اٹھاتا ہے جو سبسے کم جانتے ہیں (Brynjolfsson, Li & Raymond, 2023). Generative AI at work کی پہلی large field study میں researchers نے AI assistant use کرنے والے 5,179 customer-support agents track کئے۔ Productivity average 14% بڑھی, لیکن gain لگبھگ پوری طرح novices میں concentrated تھا (لگبھگ 34% jump), جبک most experienced agents پر little effect تھا۔ Reason revealing ہے: AI نئے workers کو وہی knowledge دے رہا تھا جو expert workers کے پاس پہلے سے تھی۔ اس exercise کے لئے implication direct ہے: collaboration تبھی value add کرتی ہے جب آپ وہ چیز لاتے ہیں جو AI میں نہیں۔ جہاں AI answer پہلے سے جانتا ہے, آپ کے لئے judgment add کرنے کو کچھ نہیں; جہاں context آپ کے پاس ہے, overrides ہی پورا point ہیں۔

اور پڑھیں: Generative AI at Work (NBER), Quarterly Journal of Economics (2025) میں published۔

AI سبکو same middle کی اور compress کرتا ہے (Noy & Zhang, 2023). Controlled experiment میں 444 professionals نے writing tasks کئے, half نے ChatGPT کے ساتھ۔ Tool نے time گھٹایا اور average quality بڑھائی, لیکن distribution compress کرکے: weaker writers بہت improve ہئے, stronger writers مشکل سے بدلے, اور outputs آپس میں زیادا similar ہو گئے۔ یہ compression exercise میں built warning ہے۔ اگر آپ AI draft as-is لیتے ہیں, تو same competent, generic middle پر land کرتے ہیں جہاں باکی سب۔ Collaborative path اس middle سے واپس اوپر چڑھنے کا تریکا ہے۔ آپ کے overrides result کو shared default کے بجای آپکا بناتے ہیں۔

Paper پڑھیں: Experimental evidence on the productivity effects of generative artificial intelligence, Science, 381, 2023۔

Three-path comparison تینوں combine کرتی ہے۔ Teaming solo work کو تبھی beat کرتی ہے جب human machine کو manage کرے, defer نہیں (Kasparov); AI وہاں سبسے زیادا add کرتا ہے جہاں آپ سبسے کم جانتے ہیں, یانی آپکی value وہ ہے جو AI کے پاس پہلے سے نہیں (Brynjolfsson, Li & Raymond); اور unmanaged AI ہر output کو same generic middle کی اور کھینچتا ہے (Noy & Zhang)۔ Task کو Solo, AI-only, Collaborative تین تریکوں سے لکھنا تینوں کو ایک ساتھ visible کرتا ہے: AI-only draft generic middle دکھاتی ہے, Solo draft دکھاتی ہے uniquely آپکا کیا ہے, اور Collaborative draft وہ جگہ ہے جہاں آپکا judgment پہلے کو دوسرے میں بدلتا ہے۔ اس exact exercise کو کسی نے test نہیں کیا, لیکن underlying finding اس field کی سبسے established results میں سے ہے۔

اس exercise کا full version (95-minute three-path comparison, peer review, XP tracking, اور full collaboration-style diagnosis کے ساتھ) Part 0 Chapter 6: Working WITH AI, Not For AI میں ہے۔ یہ page discipline سکھاتا ہے۔ وہ page اسکے آسپاس working week build کرتا ہے۔

Capstone: 1 Decision, 6 Disciplines

آپ اپنی university کے student council کے president ہیں۔ University نے council کو اچانک $10,000 budget دیا ہے جسے semester end ہونے سے پہلے spend کرنا ہے۔ آپکو 2 options دکھتے ہیں۔ Option A: ایک professional event planner hire کرکے ایک بڑا end-of-year farewell party organize کریں۔ Option B: پیسے سے ایسے AI tools اور equipment کھریدیں جو council کے ہر member کو پورے year better events plan کرنے میں help کریں۔ آدھی council farewell party چاہتی ہے۔ آدھی AI tools۔ Friday کی council meeting میں آپکو recommendation present کرنی ہے۔ ہر discipline decide کرنے میں ایسے help کرتی ہے۔

Discipline 1, Prediction Lock. AI سے کچھ پوچھنے سے پہلے 4 lines لکھیں۔ Real decision: "farewell party vs. tools" نہیں, بلکہ "ایک بڑا event vs. ہر future event کو better بنانا۔" Question جو settle کریگا: کیا AI tools کو اتنے council members سچ میں use کریں گے ک investment justify ہو? آپکی position: Option B, AI tools چنیں, کیونک آپنے پورے year council کو event planning میں struggle کرتے دیکھا ہے اور جانتے ہیں ک right tools صرف 1 نہیں, اگلے 4 events بدلینگے۔ Confidence + کیا flip کریگا: 55% sure۔ اگر 8 میں سے 6 سے کم council members tools سچ میں use کریں گے, تو Option A پر switch کریں۔

پھر پوچھیں۔ دھیان دیں, Line 2 question council members کے بارے میں تھا, اسلئے answer AI سے نہیں, انسے آتا ہے: آپ 8 لوگوں سے directly poll کرتے ہیں۔ 6 کہتے ہیں ک وے tools use کریں گے اور training finish کریں گے; 2 unsure ہیں۔ یہ 6 والا bar clear کرتا ہے۔ آپکی position Option B hold کرتی ہے, اسی reason پر جو آپنے لکھا, اور اب hunch کے بجای اسکے پیچھے number ہے۔ (ہر settling question AI question نہیں ہوتا۔ Prediction Lock بس بتاتا ہے ک کون سا question answer کرنا ہے; کبھی آپ model کے بجای لوگوں سے پوچھکر answer کرتے ہیں۔)

Discipline 2, Reasoning Receipt. اب AI سے پوچھیں ک پیسے کیسے spend کریں۔ AI کہتا ہے farewell party "500+ students کے لئے lasting memories بنائیگی۔" اسے MODIFY label کریں: venue میں صرف 300 آ سکتے ہیں۔ AI کہتا ہے AI tools event quality 35% بڑھاتے ہیں۔ REJECT کریں: کوئی source نہیں, اور council نے یہ tools پہلے use نہیں کئے۔ AI mention کرتا ہے ک دوسری universities نے event planning میں AI use کرکے پیسے بچائے۔ SURFACED کریں: آپنے دوسری universities کے بارے میں نہیں سوچا تھا۔ آپ یہ بھی notice کرتے ہیں ک AI نے $10,000 farewell party کے event insurance اور security کا زکر نہیں کیا۔ اسے MISSED label کرکے کھد add کریں۔ AI suggestions کے باد آپ کے پاس 8 labeled rows ہیں۔ آپ exact جانتے ہیں کن claims پر trust ہے اور کن پر نہیں۔

Discipline 3, Error Taxonomy. Receipt ان claims کو سنبھالتی ہے جہاں آپ رکے; error scan ان claims کے لئے ہے جنہیں نکلنے دے سکتے تھے۔ AI output کو 6 mistake types سے scan کریں اور receipt سے miss ہوئی 3 catches پائیں: ایک fabricated source (AI نے "2025 National Student Events Report" cite کی جو کہیں نہیں ملتی), ایک stale fact (AI-tools کی quoted price last year کی ہے; current price لگبھگ 15% higher ہے), اور false confidence (AI نے بنا evidence flat claim کیا ک tools "1 semester میں اپنی cost recover کر لینگے")۔ Stale price budget math بدلتی ہے; باکی دونوں یاد دلاتے ہیں ک AI کے confident tone کا کتنا ہسا unearned تھا۔

Discipline 4, Cascade Map. دونوں options کا 5 groups پر آگے کا effect trace کریں:

Council members: Option A کا متلب 1 بڑا event اور پھر کچھ نہیں۔ Option B کا متلب سبھی کے لئے new skills۔
Students: Option A میں 300 students کو 1 great night۔ Option B سبھی students کے ہر event کو improve کرتا ہے۔
University admin: Option A safe اور familiar ہے۔ Option B دکھاتا ہے ک council forward-thinking ہے۔
Next year's council: Option A کچھ پیچھے نہیں چھوڑتا۔ Option B tools اور training چھوڑتا ہے جنہیں next team use کر سکتی ہے۔
Sponsors: Option A ان sponsors کو attract کرتا ہے جنہیں 1 event میں visibility چاہئے۔ Option B sponsors کو pitch کرنا harder ہے۔

آپ 1 loop کھوجتے ہیں: اگر Option B چنیں لیکن 8 میں سے صرف 4 members tools use کریں, تو events improve نہیں ہونگے, next year's council کوئی benefit نہیں دیکھیگی, اور AI tools cancel کر دیگی۔ Investment waste ہو جائیگی۔ یہ وہی reversal condition ہے جو Prediction Lock کی Line 4 میں name کی تھی, اور اتنی real ہے ک اسکے against safeguard build کریں۔

Discipline 5, First Principles. سبھی کہتے ہیں "ایک بڑا event school spirit بناتا ہے۔" Test کریں ک advice کہاں ٹوٹتی ہے۔ Boundary: جب 20% سے کم students attend کر سکیں (2,000 میں سے 300), تو farewell party ایک small group کے لئے spirit بناتی ہے اور باکی left out feel کرتے ہیں۔ وہ boundary picture بدلتی ہے۔

Discipline 6, Working WITH AI. Recommendation 3 تریکوں سے لکھیں۔ Solo: Option B کا solid case, لیکن farewell party چاہنے والے council members کو address کرنا بھول گئے۔ AI-only: polished recommendation جو difference split کرتی ہے ("دونوں کریں!") لیکن explain نہیں کرتی ک budget میں دونوں کیسے fit ہونگے۔ Collaborative: core argument کھد لکھیں, AI سے farewell party supporters کی concerns address کرنے میں help لیں, اور specific rule add کریں: اگر 8 میں سے 6 سے کم members 3 months میں AI training complete کریں, تو remaining money farewell party میں جائیگا۔

Council safeguard rule کے ساتھ Option B کے لئے vote کرتی ہے۔ Recommendation کا ہر part آپ explain کر سکتے ہیں کیونک اسے AI کی help کے ساتھ کھد build کیا۔

6 disciplines نے کیا کیا: انہوننے answer نہیں دیا۔ انہوننے trail دیا: Monday کو commit کی گئی position اور وہ specific finding جو اسے flip کرتی, receipt جو دکھاتی ہے کون سی AI claims پر trust کیا اور کون سی reject, numbers fix کرنے والا error scan, risk کھوجنے والی cascade map, obvious choice challenge کرنے والی boundary, اور safeguard کھوجنے والا three-version comparison۔ 6 disciplines کے بنا meeting میں آپ کہتے "مجھے لگتا ہے Option B better ہے۔" انکے ساتھ evidence اور backup plan لیکر جاتے ہیں۔

ہر decision پر سبھی 6 disciplines use ن کریں

Lunch کہاں کرنا ہے decide کرنے کے لئے Cascade Map نہیں چاہئے۔ ہر text message کے لئے Reasoning Receipt نہیں چاہئے۔ 6 disciplines ان decisions کے لئے use کریں جو سچ میں matter کرتے ہیں۔ باکی کے لئے بس decide کرکے آگے بڑھیں۔

کس decision کے لئے کون سی disciplines?

Decision کتنا important ہے?	Example	کون سی disciplines use کریں	Time
بلکہل important نہیں	کہاں کھانا ہے, routine message کا reply	None	0-1 min
کچھ ہد تک important	Next semester course چننا, laptop کھریدنا	Top AI recommendation پر Prediction Lock + Error Taxonomy	10-15 min
Important, deadline کے ساتھ	Career choice, big purchase, group project proposal	Prediction Lock + Reasoning Receipt + Error Taxonomy + fit ہونے والی 1-2 others	30-60 min
بہت important, لوگ آپکی reasoning judge کریں گے	Thesis defense, job interview presentation, council recommendation	سبھی 6 disciplines	90+ min

🚀 Projects

اوپر والا capstone کسی اور کا decision تھا۔ یہ 4 projects آپ کے ہیں۔ آپ URL ship یا app build نہیں کرتے۔ اپنے week کا real decision لیں, disciplines سے تب تک run کریں جب تک کوئی ایسی چیز catch ن ہو جو آپ miss کرتے, اور trail رکھیں۔

Disciplines catch کرنے کے لئے بنی ہیں۔ Premortem plan fail ہونے کا تریکا catch کرتا ہے۔ Receipt وہ claim catch کرتی ہے جس پر سچ میں trust نہیں۔ Error scan AI کا بنایا ہءآ source catch کرتا ہے۔ یہاں win چھوٹی اور real ہے: ایک sentence جسے آپ زور سے بول سکیں اور جو verb پر end ہو۔ "میں لگبھگ X decide کر چکا تھا, لیکن fail ہونے کا تریکا catch کیا, اسلئے plan change کیا۔" "یہ certain لگا, لیکن made-up source catch کیا, اسلئے بس accept نہیں کیا۔" اور جو چیز آپ رکھتے ہیں وہ Decision Dossier ہے: ایک short file, صرف آپ کے لئے, جو "آپنے یہ decide کیوں کیا?" کا answer دیتی ہے بنا کچھ یاد رکھنے کی زرورت کے۔ یہ file top کے rule کو concrete بناتی ہے, یانی آپکی thinking کا documented evidence۔

یہ made-up case کی exercises نہیں ہیں۔ Catch تبھی count کرتی ہے جب decision real اور آپکا ہو۔ 4 projects capstone کی اور build کرتے ہیں: پہلا plan fail ہونے کا 1 تریکا پکڑتا ہے, دوسرا confident answer audit کرتا ہے, تیسرا question کو reframe کرتا ہے, اور چوتھا ایک decision پر سبھی 6 disciplines run کرکے result رکھتا ہے۔

Project 1~15 minہونے سے پہلے call کریںDecision lock کریں, پھر commit کرنے سے پہلے اسکے fail ہونے کا تریکا پکڑنے کے لئے premortem run کریں۔

اس week لینے والا 1 real decision چنیں۔ Offer لیں یا stay کریں۔ چیز کھریدیں یا wait کریں۔ Conversation کریں یا جانے دیں۔ Plan switch کریں یا hold کریں۔

AI سے کچھ بھی پوچھنے سے پہلے اپنا Prediction Lock لکھیں۔ Discipline 1 کی 4 short lines: label کے نیچے کا real decision, اسے settle کرنے والا 1 fact, reason کے ساتھ آپکی position, اور confidence plus کیا flip کریگا۔

اب premortem run کریں۔ Prediction Lock کے نیچے کا یہی move Discipline 1 کے research box نے name کیا تھا: imagine کریں decision already fail ہو چکا ہے اور پوچھیں کیوں۔ دھیان دیں, یہی وہ 1 وقت ہے جب آپ جانبوجھکر AI کو اپنا decision بتاتے ہیں۔ Discipline 1 میں position off-page رکھی تھی تاک AI بس agree ن کرے۔ یہاں attack چاہئے, اسلئے exact بتائیں آپنے کیا چنا:

میں نے [آپکا decision] decide کیا ہے۔ Imagine کریں 6 months باد یہ mistake نکلا۔ مجھے reassure ن کریں۔ اسکے fail ہونے کے 3 سبسے likely reasons list کریں, most likely پہلے, اور انہیں میری situation کے لئے specific رکھیں۔

3 reasons کو Line 4 کے against پڑھیں۔ انمیں سے 1 آم تور پر ایسا failure mode ہوتا ہے جو آپنے نہیں دیکھا۔ وہی catch ہے۔ اسکے against safeguard کا 1 sentence لکھیں, کوئی rule, check, یا tripwire, جیسے student council president نے add کیا "اگر 8 میں سے 6 members training finish ن کریں, تو money party میں جائیگا۔"

Win جسے زور سے کہ سکتے ہیں: "Commit کرنے سے پہلے میں نے اسکے fail ہونے کا تریکا catch کیا اور safeguard build کیا۔"

Done when: Premortem سے surfaced ایسا 1 failure mode name کیا ہو جو آپنے نہیں دیکھا تھا, اور اسکے against safeguard کی 1 line لکھی ہو۔ دونوں lines رکھیں; یہ dossier کا first page ہیں۔

Project 2~20 minConfident answer audit کریںAI سے اسکی own claims list کرائیں, پھر وہ 1 claim catch کریں جسے وہ back up نہیں کر سکتا۔

اس week AI سے سچ میں پوچھنے والا کوئی real question لیں اور اسے full, confident recommendation دینے دیں۔ کون سا laptop۔ کون سا loan۔ Client سے کیا charge کریں۔ Supplement worth ہے یا نہیں۔ Tenant کو کیسے handle کریں۔

زیادہ تر readers recommendation پڑھکر polished پاتے ہیں اور use کر لیتے ہیں۔ آپ 2 disciplines ساتھ use کرکے audit کریں گے۔ پہلے Reasoning Receipt (Discipline 2): ہر claim پر 1 row, ACCEPT, REJECT, MODIFY, SURFACED, یا MISSED label اور 1-sentence why۔ پھر Error Taxonomy (Discipline 3): same answer کو 6 error types کے لئے scan کریں, کھاسکر fabricated source, stale number, اور false confidence۔

انہیں surface کرنے کا fastest تریکا AI سے اپنا answer کھد grade کرانا ہے۔ Recommendation کے ٹھیک باد یہ paste کریں:

ابھی دی recommendation پر واپس جائیں۔ ہر factual claim numbered list میں لکھیں۔ ہر ایک کے لئے honestly بتائیں ک آپ سچ میں جانتے ہیں یا estimate کر رہے ہیں, اور اسے KNOW یا GUESS mark کریں۔ Source والی ہر چیز کا exact title اور year دیں تاک میں اسے look up کر سکوں۔

اب catching کریں۔ Named sources میں 1 کھوجیں: real source search survive کرتا ہے, fabricated نہیں۔ 1 number آج کی actual price یا figure سے check کریں۔ جو claim hold نہیں کرتی وہی catch ہے۔ اسے reason اور error type کے ساتھ receipt میں رکھیں۔

Win جسے زور سے کہ سکتے ہیں: "یہ sure لگا, لیکن میں نے made-up source catch کیا, اسلئے بس accept نہیں کیا۔"

Done when: ایک labeled row ہو جو real catch ہے, جیسے source جو نہیں ملا, stale number, یا بنا basis confidence, اور آپ 6 error types میں اسکا name بتا سکیں۔ Receipt dossier میں add کریں۔

Project 3~20 minوہ question جسنے unlock کیاAI سے answer مانگنا بند کریں; problem کو dissolve کرنے والا question کھوجنے کے لئے اسکے ساتھ کام کریں۔

پورا page argue کرتا ہے ک leverage answer میں نہیں, question میں ہے۔ یہاں اسے اس چیز پر prove کریں جس پر سچ میں stuck ہیں۔ Week کی کوئی real problem چنیں جسے normally "مجھے کیا کرنا چاہئے?" کہکر AI پر dump کرتے: decision جو settle نہیں ہوتا, conflict جسے replay کرتے رہتے ہیں, goal جو بار-بار miss ہوتا ہے۔

پہلے وہ question 1 line میں لکھیں جو normally پوچھتے۔ پھر اسے ن پوچھیں۔ Problem دیں اور answer کے بجای better questions مانگیں:

میں [آپکی problem] پر stuck ہوں۔ ابھی solve ن کریں۔ اسکے بجای وے 5 questions پوچھیں جنکا answer مجھے solve کرنے کی کوشش سے پہلے دینا چاہئے, اس question سے order کرکے جو میری پوری approach بدلنے کی سبسے زیادا سنبھاونا رکھتا ہے, پھر least تک۔ پھر بتائیں میں شاید کون سا question avoid کر رہا ہوں۔

List کو پہلے لکھے question کے against پڑھیں۔ آم تور پر انمیں سے 1, اکسر وہی جسے AI کہتا ہے ک آپ avoid کر رہے ہیں, پوری problem reframe کرتا ہے: پتا چلتا ہے آپ wrong thing solve کر رہے تھے۔ اس 1 question کا answer کھد 1-2 sentences میں دیں اور original problem کو shrink یا shape change کرتے دیکھیں۔ وہی reframed question catch ہے۔

Win جسے زور سے کہ سکتے ہیں: "میں نے wrong question کا answer دینا بند کیا, اور real question نے problem چھوٹی کر دی۔"

Done when: Reframed question name کر سکیں جسنے problem دیکھنے کا تریکا بدلا, اور 1 sentence میں بتا سکیں ک starting question wrong کیوں تھا۔ دونوں dossier میں add کریں۔

Project 430-45 minDecision Dossierایک real decision پر سبھی 6 disciplines run کریں اور پورا trail 1 file میں رکھیں۔

یہ capstone ہے۔ اس week matter کرنے والا 1 decision چنیں, ایسا جہاں باد میں کوئی justification مانگ سکتا ہے: hire, big purchase, project direction, career move, hard conversation۔ سبھی 6 disciplines run کرکے result کو Decision Dossier کی طرح رکھیں: صرف آپ کے لئے 1 file, جو بنا کچھ یاد رکھے "آپنے یہ decide کیوں کیا?" کا answer دے۔ یہ polished memo نہیں اور کہیں post نہیں ہوتی۔ یہ آپکی thinking کا documented evidence ایک جگہ ہے۔

Blank doc کھولیں۔ نیچے کا ہر step 1 short section add کرتا ہے۔

Prediction Lock (2 minutes)۔ 2-line lock لکھیں: label کے نیچے کا real decision name کرتا 1 sentence, اور specific flipping finding کے ساتھ position commit کرتا 1 sentence۔
Reasoning Receipt (5 minutes)۔ AI سے real question پر recommendation مانگیں, پھر 3 claims کو ACCEPT, REJECT, یا MODIFY اور 1-sentence why کے ساتھ receipt کریں۔ (Project 2 کا self-audit prompt claims دیکھنا easy بناتا ہے۔)
Error Taxonomy (3 minutes)۔ AI output میں 6 types میں سے 1 named error scan کریں۔ Exact sentence quote کرکے type name کریں۔
Cascade Map (5 minutes)۔ Decision سے affected 3 groups چنیں۔ ہر ایک کے نیچے "اور پھر کیا?" کی 1 layer لکھیں۔ 1 loop name کریں جہاں effect واپس decision پر circle کرتا ہے۔
First Principles (3 minutes)۔ 1 boundary row لکھیں: وہ threshold جہاں ہر کوئی جو advice repeat کرتا ہے آپ کے case میں کام کرنا بند کرتی ہے۔
Three-Path Comparison (5 minutes)۔ Recommendation کا 1 short paragraph solo, پھر 1 AI کی help سے لکھیں۔ Compare کریں۔ Override رکھیں: AI version میں missing وہ line جو آپنے کھد لکھی۔

یہ polished نہیں ہوگا۔ یہ آپکا اور complete ہوگا: locked position, trusted اور rejected claims, caught error, cascade کا risk, tested boundary, اور رکھا override۔ یہی catch ہے, پورے decision کے scale پر۔

Win جسے زور سے کہ سکتے ہیں: "کسی نے پوچھا میں نے یہ کیوں decide کیا, اور میرے پاس answer ہی نہیں, دکھانے کو پورا trail تھا۔"

Done when: 1 real decision کے لئے سبھی 6 sections بھری 1 file ہو, اور "آپنے یہ decide کیوں کیا?" پوچھنے والے کسی شخص کو وہ file دیکر answer مل سکے۔

یہاں سے آگے کہاں جائیں

6 disciplines میں سے کسی پر deeper practice کے لئے, اس کتاب کا Part 0 long-form treatment ہے:

Part 0 Ch 1: Asking Better Questions. Prediction Lock اور Position Lock, 4 exercises اور Question Quality Portfolio میں expanded۔
Part 0 Ch 2: Detecting Broken Reasoning. Error Taxonomy, confidence calibration اور domain-expertise stress test کے ساتھ extended۔
Part 0 Ch 3: Thinking in Systems. 4 real decisions پر cascade maps, plus human-vs-AI systems-analysis exercise۔
Part 0 Ch 4: Reasoning from First Principles. Blank Page Sprint, Assumption Autopsy, اور constraint-rebuild exercise۔
Part 0 Ch 6: Working With AI, Not For AI. Working week میں Three-Path Comparison, collaboration logs, اور override tests۔

یہ crash course جن 5 thinking skills کو cover نہیں کرتا, انکا full treatment Part 0 میں ہے:

Ch 5: Communicating What Matters. Audience prediction, live adaptation, hard conversations۔
Ch 7: Reasoning Through Dilemmas. Ethical position locks, adversarial defences, stakeholder swaps۔
Ch 8: Building Something From Nothing. Blank page sprints, creation logs, three-draft evolutions۔
Ch 9: Deciding Under Uncertainty. Sealed decisions, reversal triggers, decision audits۔
Ch 10: Learning How to Learn. Meta-learning, 72-hour sprints, Personal Learning Framework۔

اس کتاب میں next step کے لئے, ایک mode چنیں:

اگر code لکھتے ہیں, Claude Code & OpenCode پر جائیں۔ Mode 1 کا engineering surface, یانی already کئے جانے والے work کو AI سے improve کرنا۔
اگر knowledge work کرتے ہیں (legal, finance, marketing, operations, healthcare, education, leadership), Cowork پر جائیں۔ Mode 1 کا domain-expert surface۔
اگر independently run کرنے والے AI Workers build کرنے کے لئے ready ہیں, Build AI Agents پر جائیں۔ یہ Mode 2 ہے, independently کام کرنے والے AI systems build کرنا۔

Disciplines ہر tool, mode, اور domain میں transfer ہوتی ہیں۔ یہاں سے کہیں بھی جاتے وقت انہیں کو ساتھ لے جاتے ہیں۔

Glossary

اگر page کے بیچ پہنچکر کسی word کا meaning بھول گئے, تو load-bearing terms ایک جگہ یہاں ہیں۔

4 key ideas (rule section اور diagram سے)۔

Discipline: ایک thinking habit جسے آپ practice کرتے ہیں۔ کچھ جو آپ کرتے ہیں۔
Failure mode: ایک specific تریکا جسسے AI آپکو mislead کرتا ہے۔ کچھ جو AI کرتا ہے۔ ہر discipline اپنے answer کئے failure mode کے ساتھ one-to-one paired ہے۔
Part: common job share کرنے والی disciplines کا group۔ Course کے 3 parts (Foundations, Detection, Origination) ہیں, ہر ایک میں 2 disciplines۔
Deliverable: وہ چیز جو boss, professor, یا client کو دیتے ہیں۔ 2026 میں deliverable صرف answer نہیں; answer plus وہ documented evidence of thinking ہے جسنے اسے produce کیا (لکھی prediction, AI claims accept یا reject کرنے والی receipt rows, cascade map, named threshold)۔ Evidence پر point نہیں کر سکتے, تو deliverable نہیں ہے۔

6 disciplines۔

#	Discipline	Action line	یہ کیا کرتی ہے
1	Prediction Lock (Part 1: Foundations)	PREDICT BEFORE YOU PROMPT	AI سے پوچھنے سے پہلے committed position لکھیں, اس specific AI answer سہت جو اسے flip کریگا۔
2	Reasoning Receipt (Part 1: Foundations)	DOCUMENT EVERY DECISION	AI کی ہر بات کے لئے ACCEPT / REJECT / MODIFY / SURFACED / MISSED mark کریں, ساتھ میں 1-sentence why۔
3	Error Taxonomy (Part 2: Detection)	PREDICT WHERE ERRORS HIDE	AI output کو 6 specific mistake types کے لئے scan کریں: Factual error, Logical gap, False confidence, Missing context, Fabricated source, Stale fact۔
4	Thinking in Systems (Part 2: Detection)	CASCADE MAPS & LOOPS	Decision کے باد affected groups میں 3 layers deep کیا ہوتا ہے trace کریں, اور وے loops کھوجیں جہاں effects واپس circle کرتے ہیں۔
5	First Principles (Part 3: Origination)	FIND THE BOUNDARY	Named threshold name کریں, یانی وہ specific number یا condition جہاں common advice کام کرنا بند کرتی ہے۔
6	Working WITH AI (Part 3: Origination)	OVERRIDE & ITERATE	Solo میں آپ کیا لکھتے ہیں, AI اکیلا کیا لکھتا ہے, اور Collaboratively کیا لکھتے ہیں compare کریں۔ Collaborative تبھی جیتتا ہے جب exact overrides دکھا سکیں جہاں judgment نے اسے better بنایا۔

Page پر use ہئے کچھ اور terms۔

Named threshold: specific number یا condition جو بتاتی ہے advice کب کام کرنا بند کرتی ہے۔ "یہ تب کام کرتی ہے جب آپکی class میں 30 سے کم students ہوں" named threshold ہے۔ "یہ کبھی-کبھی کام کرتی ہے" نہیں۔
Cascade map: 1-page diagram جس میں decision سے affected ہر group (students, professors, parents, sponsors, etc.) کی short column اور اسکے نیچے 3 arrows ہوتے ہیں: پہلے کیا ہوتا ہے, اسسے next کیا ہوتا ہے, اور اسکے باد کیا ہوتا ہے۔
Reasoning receipt: ہر important AI claim کی 1 row والی list۔ ہر row کے 3 parts ہیں: AI نے کیا کہا, آپنے کیا کیا (ACCEPT, REJECT, MODIFY, SURFACED, یا MISSED), اور 1-sentence why۔
Loop: cause اور effect کی chain جہاں later effect واپس circle کرکے original decision بدلتا ہے, آم تور پر worse بناتا ہے۔

Flashcards Study Aid

اپنی understanding test کریں

Checking access...

Disciplines deliverable نہیں ہیں۔ وے جو evidence produce کرتی ہیں وہ deliverable ہے۔ Disciplines evidence produce کرنے کا تریکا ہیں۔

کیا اسسے AI آپ کے hands میں more powerful tool بنتا ہے, یا آپ tool کا slower version بن جاتے ہیں?

وہ force جس کے خلاف یہ course train کرتا ہے​

📚 Teaching Aid​

ایک line میں rule​

مکھی باتیں (5 bullets)​

پورا framework: 6 disciplines​

اس page کو کیسے پڑھیں​

Part 1: Foundations (posture, یانی شرو کرنے سے پہلے آپکی stance)​

Discipline 1: Prediction Lock​

آپکو کیسے پتا چلیگا ک lock نے کام کیا?​

4 lines اسل میں کیا کر رہی ہیں​

4 lines کیوں? صرف 1 کیوں نہیں?​

اب آپکی باری​

Discipline 2: Reasoning Receipt​

"لیکن کوئی میرے کام کا audit نہیں کرتا, تو bother کیوں?"​

کھد try کریں​

Part 2: Detection (AI جو miss کرتا ہے اسے پکڑنا)​

Discipline 3: Error Taxonomy​

کھد try کریں​

Discipline 4: Thinking in Systems​

کھد try کریں​

Part 3: Origination (وہ کرنا جو AI نہیں کر سکتا)​

Discipline 5: First Principles​

کھد try کریں​

Discipline 6: Working WITH AI​

کھد try کریں​

Capstone: 1 Decision, 6 Disciplines​

🚀 Projects​

یہاں سے آگے کہاں جائیں​

Glossary​

Flashcards Study Aid​

اپنی understanding test کریں​

وہ force جس کے خلاف یہ course train کرتا ہے

📚 Teaching Aid

ایک line میں rule

مکھی باتیں (5 bullets)

پورا framework: 6 disciplines

اس page کو کیسے پڑھیں

Part 1: Foundations (posture, یانی شرو کرنے سے پہلے آپکی stance)

Discipline 1: Prediction Lock

آپکو کیسے پتا چلیگا ک lock نے کام کیا?

4 lines اسل میں کیا کر رہی ہیں

4 lines کیوں? صرف 1 کیوں نہیں?

اب آپکی باری

Discipline 2: Reasoning Receipt

"لیکن کوئی میرے کام کا audit نہیں کرتا, تو bother کیوں?"

کھد try کریں

Part 2: Detection (AI جو miss کرتا ہے اسے پکڑنا)

Discipline 3: Error Taxonomy

کھد try کریں

Discipline 4: Thinking in Systems

کھد try کریں

Part 3: Origination (وہ کرنا جو AI نہیں کر سکتا)

Discipline 5: First Principles

کھد try کریں

Discipline 6: Working WITH AI

کھد try کریں

Capstone: 1 Decision, 6 Disciplines

🚀 Projects

یہاں سے آگے کہاں جائیں

Glossary

Flashcards Study Aid

اپنی understanding test کریں