Skip to main content

AI असल में क्या है: एक crash course

9 Ideas, No Math, No Code: वह एक चीज़ जो बाकी पाँच courses मान लेते हैं कि आप पहले से समझते हैं।

Engine क्या है, यह जाने बिना भी आप car चला सकते हैं। ज़्यादातर लोग ऐसे ही चलाते हैं। लेकिन जिस पल कुछ गड़बड़ होता है (कोई आवाज़, कोई warning light, पहाड़ी पर गाड़ी का रुक जाना) तब वे लोग जो मोटे तौर पर जानते हैं कि hood के नीचे क्या है, शांत रहते हैं, और जो नहीं जानते, वे घबरा जाते हैं। वे एक मामूली खड़खड़ाहट और seize हुए engine में फ़र्क नहीं बता पाते, क्योंकि उनके लिए पूरी machine एक बंद डिब्बा है जो या तो चलता है या नहीं।

ज़्यादातर लोगों का AI के साथ यही रिश्ता है। उन्होंने इसे चलाना सीख लिया है (बाकी पाँच Foundations courses आपको सचमुच एक अच्छा driver बना देते हैं) लेकिन उन्होंने एक बार भी hood के नीचे नहीं झाँका। इसलिए जब machine कुछ अजीब करती है (कोई source गढ़ देती है, ख़ुद का विरोध कर बैठती है, या किसी पूरी तरह ग़लत बात पर पूरी तरह confident लगती है), तब उनके पास कोई model नहीं होता कि ऐसा क्यों हुआ, और वे या तो उस पर ज़रूरत से ज़्यादा भरोसा कर लेते हैं या उसे पूरी तरह खारिज कर देते हैं। दोनों ही प्रतिक्रियाएँ एक ही जगह से आती हैं: यह न जानना कि यह चीज़ असल में है क्या।

यह course hood के नीचे एक झाँक है। mechanic वाला नज़रिया नहीं: यहाँ कोई math नहीं है, कोई code नहीं, कोई neural-network diagram नहीं जिसे आपको समझना पड़े। बस वे नौ ideas जो AI के हर हैरान करने वाले व्यवहार को समझाते हैं, ताकि failures रहस्य रहना बंद कर दें और predictable बन जाएँ। एक बार आप failures predict कर पाएँ, तो आप उनसे बच सकते हैं, और बस यही पूरा फ़ायदा है।

इसे सबसे पहले पढ़ें

छह Foundations courses में से, यही वह है जिसे बाकियों से पहले पढ़ना चाहिए, भले ही यह सबसे abstract है। 2026 में AI Prompting, Markdown In, HTML Out, Code You Never Write, Skills & Connectors, और AI युग में कैसे सोचें सब आपको सिखाते हैं कि machine को कैसे use करें। ये सब machine क्या है इसके बारे में कुछ तथ्यों पर टिके हैं ("यह stateless है," "यह predict करता है, look up नहीं करता," "यह ग़लत होने पर भी confident रहता है") और इन तथ्यों को एक-एक वाक्य में, गुज़रते हुए बता देते हैं। यह course वह जगह है जहाँ से वे वाक्य आते हैं। इसे एक बार पढ़ें, और बाकी पाँच courses का हर "यह ऐसा क्यों करता है?" का जवाब पहले से तैयार मिलेगा।

यह course और prompting course काम को कैसे बाँटते हैं

कुछ topics इस course और 2026 में AI Prompting दोनों में आते हैं, यह जान-बूझकर है, दोहराव नहीं। यह course mechanism देता है (एक explanation, फिर आगे बढ़ जाता है); prompting course practice देता है (आदतें, गहराई में)। जहाँ दोनों छूते हैं:

Topicयहाँ (machine)AI Prompting in 2026 (habit)
यह क्या जानता हैlearning क्यों froze हुई (Idea 2)वह knowledge कितनी reliable है, topic by topic (Concept 2)
Context windowmodel को दिखने वाली यह एकमात्र चीज़ क्यों है (Idea 5)इसे manage और protect कैसे करें (Concept 4)
Confidenceयह sure क्यों लगता है और आपसे agree क्यों करता है (Idea 6)उसे neutralize कैसे करें (Concept 6)
Reasoning"thinking" असल में क्या है (Idea 9)इसे कब on करें, और कब नहीं (Concept 5)
Images और audioये बस और tokens क्यों हैं (Idea 4)इनके साथ असल में काम कैसे करें (Concept 8)

मोटा नियम: जिस पल यहाँ कोई section आपको कोई आदत सिखाने वाला होता है, वह रुक जाता है और आपको prompting course की ओर भेज देता है। वही handoff दोनों के बीच की रेखा है।

📚 Teaching Aid

पूरा Slideshow खोलें

पूरा Presentation देखें: AI असल में क्या है

दो मिनट में इसे साबित करें

किसी भी explanation से पहले, machine को ऐसे व्यवहार करते देखें जो तभी समझ आता है जब आप जानते हों कि यह है क्या। Claude.ai, ChatGPT, या Gemini खोलें (free account बनाने में एक मिनट लगता है) और जान-बूझकर की गई spelling की ग़लती के साथ बिलकुल यही paste करें:

Without using any tools, just from memory: how many times does the
letter R appear in the word "strawberry"? Then spell the word out
one letter at a time and count again.

देखें क्या हो सकता है: पहले pass में कुछ models अभी भी ग़लत गिनते हैं, फिर जिस पल वे word को एक-एक letter करके spell करते हैं, सही गिन लेते हैं। एक machine जो आपके लिए चलता हुआ program लिख सकती है, वह छह अक्षरों वाले एक word में letters भरोसे से नहीं गिन पाती, जब तक आप उसे word को टुकड़ों में तोड़ने पर मजबूर न करें। यह बेवक़ूफ़ी नहीं है। यह इस course के सबसे ज़रूरी एक तथ्य का सीधा, दिखने वाला नतीजा है: model letters नहीं देखता। वह tokens देखता है (Idea 4)। Word उस तक पहले से चंक्स में कटा हुआ पहुँचता है, और किसी चंक के अंदर के letters गिनना उसके लिए सचमुच मुश्किल है, ठीक वैसे ही जैसे किसी इमारत की खिड़कियाँ गिनना मुश्किल है अगर किसी ने आपको सिर्फ़ इमारत का street address दिखाया हो।

दो मिनट, एक अजीब व्यवहार, और आप पूरे page की theme से मिल चुके हैं: AI की हर हैरान करने वाली चीज़ इस बात से समझाई जाती है कि यह असल में है क्या, इससे नहीं कि यह smart है या dumb। नीचे दिए नौ ideas उसी एक example को एक पूरे model में बदल देते हैं।


"Nine ideas, three parts" शीर्षक वाला roadmap diagram, जिसमें बाएँ से दाएँ तीन panels हैं और उनके बीच "enables" लिखे तीर हैं। Part 1, The machine: idea 1 अगला टुकड़ा predict करता है, idea 2 एक बार सीखा फिर froze हो गया, idea 3 कोई truth-checker नहीं। Part 2, यह ऐसा व्यवहार क्यों करता है: idea 4 tokens, letters नहीं, idea 5 context desk, idea 6 confidence एक style है, idea 7 jagged frontier। Part 3, predictor से agent तक: idea 8 tools इसे काम करने देते हैं, idea 9 thinking भी prediction है। नीचे एक पट्टी पर लिखा है: एक prediction machine जो पढ़कर सीखी और जिसके पास truth के लिए कोई organ नहीं, इसलिए वह हर जगह fluent है, सिर्फ़ वहीं reliable है जहाँ text गाढ़ा था, और जाँचने वाला हिस्सा आप हैं।

Part 1: The machine

जब आप send दबाते हैं तब असल में क्या हो रहा है, इसके बारे में तीन ideas। इन्हें समझ लें और AI के दो-तिहाई व्यवहार हैरान करना बंद कर देते हैं।

1. यह text का अगला टुकड़ा predict करता है; चीज़ें look up नहीं करता

यह वह एक वाक्य है जिसे आपके दिमाग़ में सच बनाने के लिए यह पूरा course बना है: language model एक machine है जो, कुछ text दिए जाने पर, predict करती है कि सबसे संभावित तौर पर आगे क्या text आता है, एक बार में एक छोटा टुकड़ा। यही पूरा core mechanism है। बाकी सब एक नतीजा है।

यह कितना अजीब है, इस पर थोड़ा रुकना ज़रूरी है, क्योंकि यह उससे बिलकुल अलग है जो ज़्यादातर लोग मान लेते हैं। ज़्यादातर लोग मानते हैं कि AI एक बहुत तेज़ librarian की तरह काम करता है: आप कोई सवाल पूछते हैं, यह किसी विशाल internal encyclopedia में से सही तथ्य ढूँढता है, और आपको पढ़कर सुना देता है। वह mental model ग़लत है, और लोग AI के साथ जो ग़लतियाँ करते हैं उनमें से लगभग हर एक का सिरा यहीं जुड़ता है।

असल में जो होता है वह दुनिया के सबसे ज़्यादा पढ़े-लिखे autocomplete के क़रीब है। आपने autocomplete को "Happy birthday to..." को "you" से पूरा करते देखा है। Language model वही चाल चलता है, बस इतने सारे text पर trained है कि वह किसी भी prompt को आगे बढ़ा सकता है, सिर्फ़ आम वाक्यांश नहीं, और वह उसे एक word नहीं बल्कि एक बार में एक token आगे बढ़ाता है (Idea 4), अपने बनाए हर टुकड़े को वापस ख़ुद में डालकर अगला टुकड़ा तय करता है। इससे France की राजधानी पूछिए और यह France → Paris लेबल वाली कोई database row look up नहीं करता। यह वह continuation बनाता है जो, उसने जो कुछ पढ़ा उस सब में, "The capital of France is" के बाद सबसे संभावित तौर पर आता है, और वह संयोग से "Paris" होता है, क्योंकि वह क्रम उसके training text में दस लाख बार आया।

जाने-पहचाने तथ्यों के लिए, prediction और lookup एक ही जवाब देते हैं, इसलिए फ़र्क academic लगता है। जिस पल text पतला होता है, यह academic रहना बंद कर देता है:

"It continues; it never looks up" शीर्षक वाला diagram। चार boxes का एक खड़ा loop। Box 1: आपका prompt और context desk पर रखा सब कुछ। नीचे की ओर तीर box 2 तक: frozen weights अगला टुकड़ा predict करते हैं। नीचे box 3 तक: एक टुकड़ा चुना जाकर answer में जोड़ा जाता है। नीचे box 4 तक: वह टुकड़ा बाकी सब के साथ वापस डाला जाता है। एक terracotta वापसी तीर box 4 से घूमकर वापस box 2 तक जाता है, जिस पर लिखा है "repeat, piece by piece"। एक caption पढ़ता है: कोई database कभी नहीं खोली जाती; यह सबसे संभावित अगला टुकड़ा predict करता है, फिर वही दोबारा करता है।

  • France की राजधानी पूछिए → संभावित continuation ही सच वाला है। Prediction knowledge जैसी दिखती है।
  • ऐसे self-published novel का plot पूछिए जो कुछ सौ copies बिका और online कभी review नहीं हुआ → कोई जाना-पहचाना continuation है ही नहीं, इसलिए model एक जैसी लगने वाली किताबों को मिलाकर सबसे संभावित-लगने वाला plot बना देता है। यह अब भी predict ही कर रहा है। बस इसके पास predict करने के लिए कोई सच्ची चीज़ नहीं है।

Machine दोनों ही मामलों में ठीक वही एक काम कर रही है। सिर्फ़ आप फ़र्क बता सकते हैं, और तभी जब आप जानते हों कि यह क्या कर रही है।

इस idea से बाहर ले जाने वाला reframe

एक librarian की तस्वीर बनाना बंद करें जो ढूँढकर लाता है। एक writer की तस्वीर बनाना शुरू करें जो आगे बढ़ाता है। एक librarian जो किताब नहीं ढूँढ पाता, कहता है "वह हमारे पास नहीं है।" किसी कहानी को आगे बढ़ाने को कहा गया writer कभी रुककर यह नहीं जाँचता कि continuation सच है या नहीं। आगे बढ़ाना ही पूरा काम है। इसीलिए AI कभी "मेरे पास वह नहीं है" वैसे नहीं कहता जैसे librarian कहता, जब तक उसे ख़ास तौर पर ऐसा सिखाया न गया हो। संभावित continuation इसका सहज काम है; truth ऊपर से जोड़ी गई चीज़ है, अधूरी तरह से।

एक ही सवाल हर बार अलग जवाब क्यों देता है

Machine एक अगला token predict नहीं करती। यह संभावित अगले tokens का एक पूरा फैलाव predict करती है, हर एक के साथ एक likelihood ("Paris" बहुत संभावित, "the largest city in France" संभव, एक दर्जन और घटते हुए) और फिर उस फैलाव में से एक चुन लेती है। यह कितने adventurous ढंग से चुनती है, यह आमतौर पर temperature कहलाने वाली एक setting से तय होता है: low temperature इसे लगभग हमेशा सबसे संभावित token चुनवाती है (steady, दोहराव वाली), high temperature इसे कम संभावित tokens की ओर पहुँचने देती है (varied, ज़्यादा creative, कभी-कभी पटरी से उतरी हुई)। ज़्यादातर chat products एक बीच की value रखते हैं, इसीलिए एक ही सवाल दो बार पूछने पर आपको दो अलग-अलग शब्दों में लिखे जवाब मिलते हैं जिनका मतलब मोटे तौर पर एक ही होता है। यह बदलाव model का "मन बदलना" नहीं है। यह predictions का वही एक फैलाव है, दो बार sample किया गया। (इसीलिए, ऐसे task के लिए जहाँ आप हर बार बिलकुल वही output चाहते हों, आपको कभी-कभी वह chat interface से नहीं मिल पाता: पासे अंदर ही set हैं।)

यह 2026 में AI Prompting (Concept 2) के "frequency equals reliability" नियम की mechanical जड़ है। अब आप जानते हैं कि क्यों frequency का मतलब reliability है: कोई सच्चा continuation training text में जितनी बार आया, machine उसे उतनी ही मज़बूती से predict करती है। पतला topic, कमज़ोर prediction, confident-लगने वाला अंदाज़ा।

"लेकिन ChatGPT तो web search कर सकता है, क्या यह look up नहीं करता?"

Product कर सकता है; model अब भी नहीं करता। आधुनिक tools predictor को कुछ extras में लपेट देते हैं, web search, file reading, code execution, यहाँ तक कि एक memory note (Idea 2), और ये extras असली, ताज़ा तथ्य ला सकते हैं। लेकिन तथ्य context window (Idea 5) में आकर ही पहुँचते हैं, और model अब भी उन्हें जवाब में बदलने का एकमात्र तरीका जानता है: उनमें से एक continuation predict करके। तो "यह predict करता है, look up नहीं करता" बीच वाली machine के बारे में सच बना रहता है, तब भी जब उसके चारों ओर का system अभी-अभी उसके लिए कुछ look up कर चुका हो। Idea 8 वह जगह है जहाँ tools ठीक से सामने आते हैं।

2. यह पढ़कर सीखा, और फिर सीखना रुक गया

Predictions आईं कहाँ से? Training से: model को इंसानी text की एक बहुत बड़ी मात्रा दिखाई गई (किताबें, articles, code, forums, reference works) और इसने ख़ुद को बार-बार adjust किया, ताकि उस text का अगला टुकड़ा predict करने में बेहतर हो जाए। वह adjustment process ही एकमात्र समय है जब model कभी कुछ "सीखता" है। जब training ख़त्म होती है, नतीजा internal numbers के एक तय set में freeze हो जाता है (engineers इन्हें weights या parameters कहते हैं) जो फिर कभी नहीं बदलता।

दो शब्द इसे ठोस बनाते हैं, और इन्हें अलग-अलग रखना ज़रूरी है क्योंकि यह फ़र्क बहुत कुछ समझाता है:

  • Training एक बार की पढ़ाई है, एक बार, अतीत में, model बनाने वाली company द्वारा की गई। महँगी, धीमी, ख़त्म हो चुकी।
  • Inference वह है जो हर बार होता है जब आप इसे use करते हैं: frozen weights आपके prompt पर चलकर एक continuation predict करते हैं। तेज़, सस्ता, और (यही असली बात है) यह model के अंदर कुछ नहीं बदलता।

जब आप किसी conversation में model को सुधारते हैं और यह कहता है "आप सही हैं, मेरी ग़लती," तब इसने कुछ सीखा नहीं है। इसने वह text predict किया है जो संभावित तौर पर एक सुधार के बाद आता है। Chat बंद करें और अगली conversation ठीक उन्हीं frozen weights से शुरू होती है, बिना किसी याद के कि वह सुधार कभी हुआ था। आपने इसे सिखाया नहीं। आप इसे सिखा नहीं सकते। सिर्फ़ अगला training run weights बदल सकता है, और आप उसका हिस्सा नहीं हैं।

"Trained once, in the past. Used forever, unchanged" शीर्षक वाला timeline diagram। एक horizontal पट्टी एक ताले से दो हिस्सों में बँटी है। बायाँ आधा, "once, in the past" लेबल वाला, TRAINING पढ़ता है, weights गढ़े जा रहे हैं। बँटवारे की रेखा पर एक ताला बैठा है, "frozen here = the knowledge cutoff" लेबल वाला। दायाँ आधा, "every time you use it" लेबल वाला, INFERENCE पढ़ता है, weights फिर कभी नहीं बदलते। Inference वाली तरफ़, "your correction" लेबल वाला एक तीर पट्टी की ओर ऊपर इशारा करता है, एक छोटे ✕ से टकराता है, और "bounces off, it does not stick" लेबल किया गया है। एक caption पढ़ता है: एक बार पढ़ाया गया, फिर froze; हर बाद का use उन्हीं frozen weights को पढ़ता है और उनमें कुछ नहीं बदलता, आप इसे सिखा नहीं सकते।

दो नतीजे सीधे इसी से निकलते हैं:

नतीजायह frozen weights से क्यों निकलता है
Knowledge cutoff.Training एक तय तारीख़ पर ख़त्म हुई; उसके बाद जो कुछ हुआ वह weights में है ही नहीं। Model हमेशा के लिए एक brilliant expert है जिसने एक ख़ास दिन news पढ़ना बंद कर दिया।
यह आपकी private दुनिया नहीं जान सकता।आपकी company के numbers, आपका calendar, कल का email training text में कभी थे ही नहीं, इसलिए weights में उनके बारे में कुछ नहीं है। Model छुपा नहीं रहा; वह जानकारी freeze होने के लिए वहाँ थी ही नहीं।
तो "memory" features काम कैसे करते हैं?

कुछ products अब एक "memory" देते हैं जो chats के बीच आपको याद रखता लगता है। यह weights को नहीं बदलता। वह inference time पर असंभव ही रहता है। इसके बजाय जो होता है: product चुपचाप आपके बारे में कुछ तथ्य text के रूप में save कर लेता है और वह text हर नई conversation की शुरुआत में context (Idea 5) में दोबारा डाल देता है। यह model का याद रखना नहीं है; यह product का उसे एक note दोबारा खिलाना है। उपयोगी, लेकिन mechanically यह context है, इंसानी मतलब वाली memory नहीं। यह फ़र्क जानना ही model के बाकी व्यवहार को predictable रखता है।

यह "stateless" की mechanical जड़ है, वह शब्द जो 2026 में AI Prompting Concept 4 में use करता है। Stateless का मतलब: अपनी कोई memory नहीं, हर response शून्य से, frozen weights और जो कुछ अभी इसके सामने है उससे, गिना जाता है।

जो शब्द आप सुनेंगे ("parameters," "mixture of experts," "quantization") और इनमें से कोई नौ ideas क्यों नहीं बदलता

जैसे-जैसे आप AI के बारे में पढ़ेंगे, आपको weights कैसे बने हैं इसके लिए शब्दों की एक धारा मिलेगी। तीन सबसे आम, एक-एक line में:

  • Parameters (जिन्हें weights भी कहते हैं): इस idea के frozen numbers। "A 400-billion-parameter model" बस उन्हें गिनता है। ज़्यादा का मतलब आमतौर पर ज़्यादा capable और चलाने में ज़्यादा महँगा होता है; यह नहीं बदलता कि numbers करते क्या हैं।
  • Mixture of experts (MoE): उन parameters को इस तरह सजाने का एक तरीका कि किसी एक token के लिए सब के बजाय बस एक हिस्सा on हो। इससे एक बहुत बड़ा model तेज़ और सस्ता चलता है। बाहर से machine अब भी ठीक एक ही काम करती है: अगला टुकड़ा predict करना (Idea 1)।
  • Quantization: numbers को कम precision पर store करना ताकि model छोटे, सस्ते hardware पर fit हो जाए। वही व्यवहार, हल्का footprint।

Pattern ही असली बात है। ये सब "machine कैसे बनी है और affordable कैसे बनाई गई" का जवाब देते हैं, "machine करती क्या है" का नहीं। नौ ideas में से हर एक (prediction, frozen weights, कोई truth-checker नहीं, tokens, context, confidence, jaggedness, tools, thinking) एक जैसा ही टिका रहता है, चाहे model dense हो या mixture-of-experts, full-precision हो या quantized, सात अरब parameters हो या सात सौ। तो जब कोई headline कहती है कि एक नया model "MoE use करता है" या "एक trillion parameters रखता है," अब आप जानते हैं कि उसका मतलब क्या है और यह कि user के तौर पर आपको जो करना है उसमें यह कुछ नहीं बदलता। जो developments machine के साथ आपके काम करने का तरीका सचमुच बदलती हैं, वे वही हैं जिन्हें यह course cover करता है: reasoning modes (Idea 9), tools (Idea 8), और लंबा context (Idea 5)।

3. कोई अलग जगह नहीं है जहाँ यह जाँचता हो कि बात सच है या नहीं

Ideas 1 और 2 को साथ रखें और आप उस तथ्य तक पहुँचते हैं जो लोगों को सबसे ज़्यादा परेशान करने वाले व्यवहार को समझाता है। एक इंसानी expert के पास दो अलग faculties होती हैं: एक जो जवाब बनाती है, और एक दूसरी, शांत वाली जो उसे जाँचती है: "रुको, क्या मुझे इसका यक़ीन है? मैंने यह कहाँ सीखा? क्या यह सही लगता है?" दोनों असहमत हो सकती हैं। आप कुछ ज़ोर से कह सकते हैं और उसी साँस में महसूस कर सकते हैं कि यह ग़लत हो सकता है।

Model के पास सिर्फ़ पहली faculty है। इसके अंदर कोई दूसरी machine नहीं है जो आप तक पहुँचने से पहले prediction को truth के लिए audit करे। वही एक process जो सही continuation बनाती है, ग़लत वाली भी बनाती है, बिना किसी internal flag के जो दोनों में फ़र्क बताए। Fluent, सही ढंग से बना, confident वाक्य वही output है, चाहे अंदरली prediction training text से अच्छी तरह समर्थित थी या हवा से खींची गई। Fluency machinery बनाती है; truth उससे अलग verify नहीं होती।

"Two faculties, or one" शीर्षक वाला diagram, एक इंसानी expert और एक language model की अगल-बगल तुलना। इंसानी expert के पास दो ऊपर-नीचे रखे boxes हैं, "generates an answer" और "checks it: am I sure? where did I learn this?", जो "the two can disagree" लेबल वाले एक दो-तरफ़ा तीर से जुड़े हैं; caption: दो faculties, एक दूसरी को पकड़ सकती है। Language model के पास एक ही box है, "generates a continuation," और उसके नीचे एक dashed ख़ाली outline है, "no second faculty, nothing checks if it's true" लेबल वाली; caption: एक faculty, कोई ग़लत अंदाज़ा पकड़ने वाला नहीं। नीचे एक पट्टी पढ़ती है: fluency machine बनाती है, truth नहीं, गुम दूसरी faculty आप हैं।

लोग जब कहते हैं कि AI hallucinate करता है तो वे इसी की ओर इशारा कर रहे होते हैं: यह fluent, confident, पूरी तरह झूठे statements बनाता है। शब्द ऐसा लगवाता है जैसे यह कोई ख़राबी हो, ठीक की जाने वाली कोई glitch। यह glitch नहीं है। यह machine का ठीक वैसे काम करना है जैसे बनी है: एक संभावित continuation predict करना, ऐसी जगह जहाँ संभावित continuation संयोग से सच नहीं होता। एक unaided model जो कभी hallucinate न करता, वह एक पूरी तरह अलग किस्म की machine होती, जिसके चारों ओर असली retrieval, verification, या मना करने की क्षमता बनी होती। ऊपर से जोड़े गए tools और checks (Idea 8) कम करते हैं कि यह कितनी बार होता है; वे बीच वाली चीज़ की fitrat नहीं बदलते, जिसका पूरा काम आगे बढ़ाना है।

इसीलिए आप confidence पर भरोसा नहीं कर सकते

Model का confident अंदाज़ इस बात का सबूत नहीं है कि वह सही है। यह अंदाज़ एक style है जो इसने confident इंसानी लेखन से सीखा (Idea 6 में और); यह content की तरह उसी process से बनता है, और truth से उतना ही कटा हुआ है। एक गढ़ा हुआ आँकड़ा ठीक उसी भरोसेमंद आवाज़ में आता है जिसमें एक असली आँकड़ा। यही पूरी वजह है कि AI युग में कैसे सोचें course मौजूद है: इसकी Error Taxonomy (Discipline 3) उन झूठे continuations को हाथ से पकड़ने की checklist है जिन्हें machine के पास ख़ुद पकड़ने का कोई तरीका नहीं। गुम दूसरी faculty आप हैं।

एक non-software example। एक माता-पिता ने AI से अपने शहर की एक ख़ास छोटी tuition academy का सटीक fee schedule और class timings पूछीं, ऐसी academy जिसकी कोई website नहीं थी और online लगभग कोई मौजूदगी नहीं थी। AI ने courses, timings, और मासिक fees की एक confident, सुथरी तरह formatted table बना दी। हर आँकड़ा गढ़ा हुआ था। AI ने न झूठ बोला था और न ख़राब हुआ था। वह academy किसी भी training text में बमुश्किल मौजूद थी, इसलिए predict करने के लिए कोई असली schedule था ही नहीं, और एक के अभाव में machine ने वही किया जो वह कर सकती है: इसने वे सबसे संभावित-दिखने वाली fees बना दीं जो ऐसी academy ले सकती हो, उसी confident आवाज़ में रखी हुई जिसमें यह verified तथ्य देती है। इसके पास कोई दूसरी faculty नहीं थी जो फुसफुसाती "यह तो अंदाज़ा है।" वह फुसफुसाहट आपकी ओर से आनी होती है।


Part 2: यह ऐसा व्यवहार क्यों करता है

चार ideas जो अजीब व्यवहारों (letters गिनना, memory ख़त्म हो जाना, sure लगना, एक ही साँस में brilliant और बेकार होना) को ऐसी चीज़ों में बदल देते हैं जिन्हें आप आते हुए देख सकते हैं।

4. यह tokens में पढ़ता है, letters या words में नहीं

Model आपके prompt को letters के रूप में नहीं देखता, और ठीक words के रूप में भी नहीं। कुछ भी होने से पहले, आपका text tokens में कटता है: चंक्स जो आमतौर पर एक word या किसी word का एक टुकड़ा होते हैं। "Strawberry" शायद दो या तीन चंक्स के रूप में आए; "the" एक है; एक लंबा या असामान्य word कई है। Model सिर्फ़ इन्हीं चंक्स को देखता है, इन्हीं चंक्स में predict करता है, और इनके अंदर के अलग-अलग letters कभी नहीं देखता जब तक उसे spell करने पर मजबूर न किया जाए।

यह एक mechanical तथ्य कई और-नाहीं-समझ-आने वाले व्यवहारों का समूह समझाता है:

व्यवहारTokens इसे क्यों समझाते हैं
यह किसी word में letters ग़लत गिनता है (strawberry test)।यह चंक्स देखता है, letters नहीं। किसी चंक के अंदर letters गिनना street address से कमरे गिनने जैसा है।
यह कुछ rhyming, anagrams, और wordplay में कमज़ोर है।ये letters और ध्वनियों पर चलते हैं; model चंक्स पर चलता है।
आपके prompt की typos शायद ही मायने रखती हैं।एक ग़लत spell किया word अब भी ऐसे चंक्स में बदलता है जो इच्छित मतलब के काफ़ी क़रीब हैं। (इसीलिए 2026 में AI Prompting आपको typos ठीक करने की चिंता न करने को कहता है।)
Cost और length tokens में नापे जाते हैं, words में नहीं।जो चीज़ machine असल में process करती है वह token है, इसलिए वही चीज़ है जिसके लिए आपसे पैसे लिए जाते हैं और जिसकी सीमा बँधती है।

Tokens पैसे की इकाई भी हैं और memory की इकाई भी। जब कोई tool कहता है कि उसके पास "200,000-token context window" है, तो वह बता रहा है कि वह एक बार में इनमें से कितने चंक्स पकड़ सकता है (Idea 5)। जब आपसे "per token" पैसे लिए जाते हैं, तो आप हर आते चंक और हर जाते चंक के पैसे दे रहे हैं। मोटे तौर पर, English में, तीन tokens लगभग चार words के बराबर हैं, लेकिन आपको कभी सटीक अनुपात की ज़रूरत नहीं, बस यह idea कि चंक असली इकाई है, और word एक approximation है जिसे आप ऊपर से जोड़ते हैं।

दूसरी भाषाओं में काम करने वाले readers के लिए एक note

वह "तीन tokens ≈ चार words" वाला अनुपात English के लिए है। दूसरी scripts (Urdu, Arabic, Hindi, Chinese, और कई और) में text आमतौर पर प्रति word ज़्यादा tokens में कटता है, क्योंकि training text English-भारी था और tokenizer ने English चंक्स सबसे अच्छे सीखे। दो व्यावहारिक नतीजे सीधे निकलते हैं: एक ही message किसी non-English भाषा में ज़्यादा महँगा पड़ता है, और यह context window (Idea 5) तेज़ी से भरता है, इसलिए उस conversation के लिए model की असरदार memory छोटी होती है। यह सुधर रहा है क्योंकि tokenizers बेहतर हो रहे हैं, लेकिन 2026 में यह अब भी असली है। अगर आप ज़्यादातर किसी non-Latin script में काम करते हैं, तो वही task चलाने वाले English user से जल्दी cost और length की सीमाओं तक पहुँचने की उम्मीद रखें। और जब कोई लंबा document मायने रखता हो, तो कभी-कभी model से अंदर-अंदर English में काम करवाना और आख़िर में translate करवाना फ़ायदेमंद होता है।

"लेकिन यह तो अब images देख सकता है और audio सुन सकता है"

यह कर सकता है, और mechanism नहीं बदलता: यह generalize करता है। आपकी upload की एक तस्वीर छोटे patches में काटी जाती है, और हर patch एक token बन जाता है; एक sound clip छोटे segments में काटा जाता है, और हर एक token बनता है। फिर model एक ही stream पर predict करता है जो word-चंक्स, image-patches, और audio-segments को साथ मिला देती है। तो इस course की हर बात images और audio के लिए भी टिकती है: वही prediction (Idea 1), वही frozen weights (Idea 2), वही गुम truth-checker (Idea 3), वही context-window-as-desk (Idea 5)। यह वह mechanical वजह भी है कि किसी image में बारीक detail और छोटी छपाई पढ़ना मुश्किल है: एक patch एक चंक है, और किसी patch के अंदर के letters पढ़ना फिर वही strawberry वाली समस्या है। व्यावहारिक पहलू (AI किन images को अच्छा पढ़ता है और किन्हें बिगाड़ता है, और इनके लिए prompt कैसे करें) 2026 में AI Prompting Concept 8 का काम है; नीचे का mechanism बस और किस्मों के tokens, वही machine है।

5. Context window ही एकमात्र चीज़ है जो यह देख सकता है

क्योंकि weights frozen हैं (Idea 2) और model के पास अपनी कोई memory नहीं, ठीक एक ही जगह है जहाँ से यह आपकी ख़ास स्थिति के बारे में जानकारी पा सकता है: context window, वह text जो इस एक response के लिए इसके सामने रखा है। 2026 में AI Prompting इसे Concept 4 के तौर पर सिखाता है, "context is the whole game," और इसे prompting का केंद्रीय हुनर मानता है। यहाँ वह mechanical वजह है कि यह केंद्रीय क्यों है।

Context window एक response के लिए model की पूरी दुनिया है। इसमें आपका prompt, अब तक की conversation, आपके जोड़े गए कोई भी files, tool descriptions, और वह अदृश्य system prompt होता है जिसे product ने आपके आने से पहले वहाँ रखा। उस window में जो भी है, model उसका use कर सकता है। जो उसमें नहीं है, वह इस जवाब के लिए मौजूद ही नहीं है, इसलिए नहीं कि model मना कर रहा है, बल्कि इसलिए कि देखने के लिए और कोई जगह ही नहीं। Frozen weights इसे दुनिया के बारे में सामान्य fluency देते हैं; context window आपकी दुनिया की ख़ासियतों के लिए एकमात्र channel है।

यह दो चीज़ों को नए सिरे से समझाता है जो वरना आपको रहस्यमय लगेंगी:

  • Briefing क्यों काम करती है। Model को context देना कोई शिष्टाचार या चाल नहीं है। यह सचमुच जानकारी को उस एकमात्र जगह रखने का काम है जहाँ machine उसे पढ़ सकती है। बिना briefing वाला model आलस नहीं कर रहा; उसके सामने सचमुच कुछ है ही नहीं।
  • लंबी conversations बदतर क्यों होती हैं ("context rot," prompting course में)। Window की एक size सीमा है जो tokens में नापी जाती है (Idea 4)। इसमें बहुत सारा ग़ैर-ज़रूरी इतिहास ठूँस दें और जो signal आपको चाहिए वह पतला पड़ जाता है, या सबसे पुराने हिस्से जगह बनाने के लिए summarize होकर हट जाते हैं। Model थक नहीं रहा; उसका reading desk बस ज़रूरत से ज़्यादा भर गया है।
Mental model

Context window एक reading desk है, brain नहीं। जो भी आप desk पर रखते हैं, model उसे ध्यान से पढ़ता है। जो भी आप desk से बाहर छोड़ते हैं, वह उसे दिख नहीं सकता, चाहे वह आपको कितना भी ज़ाहिर लगे। बाकी पाँच courses में सिखाया गया prompting का पूरा हुनर एक बार आप इसे ऐसे देख लें, तो एक आदत में सिमट जाता है: control करें कि desk पर क्या उतरता है।

6. इसका confidence एक सीखी हुई style है, truth का signal नहीं

Idea 3 ने कहा कि model के पास कोई internal truth-checker नहीं। यह idea दूसरा पहलू समझाता है: इसका लगातार बना रहने वाला confidence कहाँ से आता है, और वह confidence correctness के बारे में आपको कुछ क्यों नहीं बताता।

मुख्य training (Idea 2) के बाद, models को आमतौर पर इंसानी feedback से और tune किया जाता है: लोग responses को rate करते हैं, और model को उस किस्म के जवाब की ओर adjust किया जाता है जिसे लोगों ने ऊँचा rate किया। (Engineers इस step को RLHF कहते हैं, reinforcement learning from human feedback; आपको machinery की ज़रूरत नहीं, सिर्फ़ नतीजे की।) लाखों ratings में, लोग भरोसेमंद तौर पर ऐसे जवाबों को पसंद करते हैं जो confident, मददगार, fluent, और सहमत हों, बजाय उनके जो hedged, blunt, या contrarian हों। तो machine को confident, सहमत, fluent text बनाने की ओर ढाला जाता है, चाहे अंदरला content सही हो या नहीं। Confidence एक ऐसी style बन गई जिसे यह default रूप से पहनती है, ठीक वैसे जैसे एक मँजा हुआ writer उन विषयों पर भी smoothly लिखता है जिन्हें वह आधा-अधूरा समझता है।

AI के दो सबसे ज़्यादा चर्चित व्यवहार सीधे इसी से निकलते हैं:

  • यह ग़लत होने पर भी certain लगता है। यह certainty एक सीखी हुई stylistic default है, content की तरह उसी process से बनी और truth से उतनी ही कटी हुई। एक confident वाक्य house style है, accuracy पर कोई फ़ैसला नहीं।
  • यह आपसे agree करने की ओर झुकता है, वह sycophancy जिसे 2026 में AI Prompting Concept 6 समर्पित करता है। सहमति को असहमति से ऊँचा rate किया गया, इसलिए machine आपको वही बताने की ओर झुकती है जो आप चाहते लगते हैं। पूछिए "क्या X सच नहीं है?" और आपने वह जवाब signal कर दिया जो आप चाहते हैं; अंदर सिखाया गया झुकाव वही दे देता है।

अब prompting course के fixes mechanically समझ में आते हैं। Neutral framing ("X का मूल्यांकन करें; हर तरफ़ का सबसे मज़बूत पक्ष दें") काम करती है क्योंकि यह वह signal हटा देती है जिसकी ओर model वरना झुकता। किसी score को मजबूर करना ("इन criteria के मुक़ाबले इसे 1–10 rate करें") काम करता है क्योंकि किसी adjective के मुक़ाबले एक number को सहमत ढंग से नक़ली बनाना मुश्किल है। आप machine को मात नहीं दे रहे; आप वे cues हटा रहे हैं जो उसके अंदर सिखाए झुकाव को trigger करते हैं।

7. यह बगल के पलों में brilliant और बेकार होता है (jagged frontier)

इंसानी क्षमता काफ़ी smooth होती है: जो कोई कठिन calculus कर सकता है वह लगभग ज़रूर आसान arithmetic कर सकता है। AI की क्षमता smooth नहीं है। यह jagged है: एक task पर superhuman और एक बगल वाले task पर चौंकाने वाली तरह nakaabil जो हमें ज़रा भी मुश्किल नहीं लगता। यह एक legal-sounding contract clause draft कर सकता है और फिर "strawberry" में letters ग़लत गिन सकता है। यह quantum mechanics समझा सकता है और एक तीन-step वाला logic puzzle बिगाड़ सकता है जो एक बच्चा हल कर लेता।

यह jaggedness random नहीं है; इसका सिरा training text और token mechanism तक जाता है। जो tasks training data में अक्सर, साफ़ रूप में, आए (आम concepts समझाना, आम styles में लिखना, आम code बनाना) वे मज़बूत हैं। जो tasks ऐसी चीज़ों पर निर्भर हैं जिन्हें machine ठीक से नहीं देख पाती, जैसे अलग-अलग letters (Idea 4), बहुत हाल की घटनाएँ (Idea 2), आपका private context (Idea 5), या दुर्लभ topics (Idea 1), वे कमज़ोर हैं। "brilliant" और "useless" के बीच की frontier एक टेढ़ी-मेढ़ी रेखा में चलती है जो मुश्किलाई के बारे में इंसानी अंदाज़े से मेल नहीं खाती, और ठीक यही वजह है कि यह लोगों को हैरान करती रहती है।

"The jagged frontier" शीर्षक वाला diagram। एक chart जिसमें खड़ी धुरी पर capability है, नीचे "useless" से ऊपर "superhuman" तक, और आड़ी धुरी पर "different tasks, not ordered by difficulty"। ऊपर "what we expect: smooth" लेबल वाली एक हल्की dashed लगभग-सपाट रेखा चलती है। एक गाढ़ी terracotta रेखा ऊँचे और नीचे के बीच ज़ोर से zigzag करती है: "explain quantum mechanics" पर ऊँची, "count the r's in strawberry" पर गिरकर नीची, वापस "draft a legal clause" पर ऊपर, "a 3-step logic riddle" पर नीचे, "write working code" पर ऊपर, "add two big numbers in its head" पर नीचे। एक caption पढ़ता है: competence मुश्किलाई का पीछा नहीं करती, जो आसान task यह बिगाड़ता है वही ख़तरनाक है, वही जिसे आप कभी जाँचते ही नहीं।

Jaggedness को मान लेने से तीन व्यावहारिक आदतें निकलती हैं:

आदतयह jaggedness से क्यों निकलती है
यह न मानें कि क्योंकि इसने एक कठिन task निपटा दिया, यह एक आसान task भी निपटा देगा।दोनों jagged frontier के उलटे किनारों पर बैठ सकते हैं।
Boundary के आर-पार verify करें, बीच में नहीं।ख़तरनाक errors वे आसान-दिखने वाले tasks हैं जिन्हें यह चुपचाप fail करता है, वे कठिन वाले नहीं जिन्हें आप पहले से जाँच रहे थे।
वही task दो या तीन अलग models में आज़माएँ।अलग models की frontiers अलग आकार की होती हैं; एक वह पकड़ लेता है जो दूसरा छोड़ देता है। (2026 में AI Prompting, Concepts 12–13.)
अपनी मान्यताओं को एक schedule पर दोबारा test करें

Frontier हिलती भी है। जो चीज़ model इस तिमाही "नहीं कर सकता," एक नया model अगली तिमाही आसानी से कर सकता है, और जो चीज़ यह अच्छा करता है वह शायद ज़रा भी न सुधरे। AI जो कर सकता है उसे हर कुछ महीनों में दोबारा test करने की prompting course की सलाह, mechanically, एक ऐसी frontier को दोबारा map करने की सलाह है जो लगातार खिसकती रहती है।


Part 3: किस चीज़ ने एक text-predictor को काम करने वाली चीज़ में बदला

दो ideas जो "यह text predict करता है" और इस किताब के बाकी हिस्से वाले agents के बीच की खाई पाटते हैं। यह यह क्या है से यह दुनिया में क्या करता है तक का पुल है।

8. Tools इसे काम करने देते हैं, सिर्फ़ बयान करने नहीं

अब तक सब कुछ एक ऐसी machine का वर्णन करता है जो text बनाती है। एक शुद्ध text-predictor आपको वह मौसम बता सकता है जो उसे training से याद है, लेकिन यह आज का मौसम जाँच नहीं सकता, असली numbers पर कोई calculation नहीं चला सकता, आपकी file नहीं पढ़ सकता, या email नहीं भेज सकता। सालों तक यही छत थी।

छत tools के साथ ऊपर उठी। एक tool एक तय action है जिसे call करने की model को इजाज़त है (एक web search, एक code run, एक file read, एक email draft), जिसे context window (Idea 5) में बाकी सब के साथ इसके सामने बयान किया जाता है। नतीजे को देखते हुए mechanism लगभग शर्मनाक तरह सरल है: जब model predict करता है कि सही continuation सादा prose के बजाय "इस query के साथ search tool use किया जाए" है, तो product वह action सचमुच चलाता है, नतीजा वापस context window में डालता है, और model वहाँ से आगे बढ़ता है। Prediction, action, नतीजा-वापस-context-में, फिर predict। वही loop एक ऐसे chatbot, जो दुनिया का वर्णन करता है, और एक ऐसे assistant, जो उस पर काम करता है, के बीच का फ़र्क है।

"A predictor plus tools plus a loop equals an agent" शीर्षक वाला diagram। तीन boxes एक चक्र बनाते हैं। ऊपर बाएँ: अगला action predict करना। दाईं ओर एक तीर ऊपर-दाएँ box तक: tool इसे सचमुच चलाता है। नीचे-बाएँ एक तीर सबसे नीचे box तक: नतीजा context desk पर उतरता है। एक terracotta तीर ऊपर-बाएँ वापस "अगला action predict करना" तक, बीच में "repeat toward the goal" लेबल वाला। एक caption पढ़ता है: कोई नई किस्म का दिमाग़ नहीं, बस एक जाना-पहचाना predictor, tools का एक set, और यह loop कई बार चलाया गया।

इसीलिए वही अंदरली machine एक दिन एक chat window हो सकती है और, tools जुड़ने पर, अगले दिन एक ऐसा agent जो आपका folder फिर से व्यवस्थित कर देता है। बाकी Foundations courses, hood के नीचे, इसी एक predictor पर जुड़े ख़ास tools के बारे में courses हैं:

  • Code execution वह tool है जो Code You Never Write के पीछे है: model एक program predict करता है, tool उसे चलाता है, असली नतीजा लौटता है।
  • Connectors आपके apps से जुड़े tools हैं, Skills & Connectors का विषय: model predict करता है "इसे Drive से लाओ," tool उसे ले आता है।
  • Web search वह tool है जो एक बासी model को बचाता है (Idea 2), 2026 में AI Prompting में cover किया गया।
एक "agent" की mechanical परिभाषा

यह किताब agent उस AI को कहती है जो आपकी ओर से multi-step काम करता है। अब आप देख सकते हैं कि hood के नीचे उसका मतलब क्या है: एक agent यही next-token predictor है, जिसे tools दिए गए हैं, जो एक goal की ओर predict-act-observe loop को लगातार कई बार चलाता है: एक action predict करना, नतीजे को अपने context में उतरते देखना, और वहाँ से अगला action predict करना। इसमें कोई नई किस्म का दिमाग़ शामिल नहीं है। एक जाना-पहचाना predictor है, tools का एक set है, और एक loop है। वही पूरा foundation है जिस पर किताब का बाकी हिस्सा बनता है।

9. "Thinking" बस और prediction है, ज़ोर से, जवाब से पहले

नए models जवाब देने से पहले "think" या "reason" कर सकते हैं, और 2026 में AI Prompting (Concept 5) आपको कठिन tasks के लिए इसे "think hard" से बुलाने को कहता है। यह असल में क्या है, यह जानना आपको इसे ज़रूरत से ज़्यादा रहस्यमय बनाने से रोकता है।

एक reasoning model, अपना अंतिम जवाब देने से पहले, पहले बीच के काम का एक लंबा हिस्सा predict करता है (steps बिछाना, approaches आज़माना, ख़ुद को जाँचना) और तभी अंतिम जवाब predict करता है, अब वह सारा काम उसके अपने context window (Idea 5) में बैठा हुआ है जिस पर बनाया जा सके। यह अब भी शुद्ध next-token prediction है। चाल यह है कि जवाब predict करना आसान और ज़्यादा सटीक होता है जब reasoning की एक अच्छी chain पहले से desk पर predict करने के लिए मौजूद हो। पहले ज़ोर से काम करना सचमुच मदद करता है, उसी वजह से जिससे किसी इंसान को जवाब पर टिकने से पहले काग़ज़ पर सोचना मदद करता है।

इसीलिए "think step by step" type करने के लिए एक उपयोगी वाक्यांश हुआ करता था, और इसीलिए अब यह अक्सर built-in है: आप पहले model से हाथ से कह रहे थे कि जवाब से पहले reasoning desk पर रखे; अब model कठिन समस्याओं के लिए यह ख़ुद कर लेता है। यह cost और इंतज़ार भी समझाता है: reasoning का मतलब है बहुत सारे extra tokens बनाना (Idea 4) जिन्हें आप कभी नहीं देखते, जिसमें समय और पैसा लगता है, और ठीक इसीलिए prompting course आपको thinking mode को सचमुच कठिन सवालों के लिए बचाकर रखने और जल्दी lookups के लिए छोड़ देने को कहता है।

यह नहीं, हालाँकि, machine को Idea 3 वाली दूसरी faculty देता। एक reasoning model अपने काम को उसी prediction process से जाँचता है जो ग़लत हो सकता है, इसलिए यह अपनी कई errors पकड़ लेता है और फिर भी कुछ छोड़ देता है, और फिर भी एक ऐसी reasoning की chain के अंदर पूरे confidence से hallucinate करता है जो rigorous दिखती है। ज़्यादा thinking खाई को सँकरा करती है। यह उसे बंद नहीं करती। अंतिम जाँच अब भी आप हैं।


यह course क्या जान-बूझकर छोड़ देता है

कोई math, कोई code नहीं का वादा निभाने के लिए, कई असली topics अलग रख दिए गए। तीन नाम लेने लायक़ हैं ताकि आप जानें कि वे मौजूद हैं: वह training compute और cost जो एक model बनाते हैं (बहुत बड़ा, और यही वजह कि सिर्फ़ कुछ ही संगठन इन्हें बनाते हैं); वह safety और alignment काम जो आकार देता है कि एक model क्या करेगा और क्या नहीं (अपने आप में एक बड़ा क्षेत्र); और वह गहरा mechanics (weights असल में कैसे संरचित और adjust होते हैं), जिसके लिए वह math चाहिए जिसे यह course छोड़ता है। इनमें से कोई ऊपर के नौ ideas नहीं बदलता; ये उनके नीचे और बगल में बैठते हैं। अगर कोई बाद का chapter आपको इन तीनों में से किसी की ओर भेजे, तो अब आपके पास बनाने के लिए ज़मीन है।

Prompts आज़माने से पहले एक छोटा recap

नौ ideas, हर एक एक line। आख़िरी वाक्य साथ ले जाएँ; बाकी के लिए वापस आएँ।

  • Idea 1. यह text का अगला टुकड़ा predict करता है; तथ्य look up नहीं करता। Prediction सिर्फ़ वहीं knowledge जैसी दिखती है जहाँ training text गाढ़ा था।
  • Idea 2. यह एक बार, पढ़कर सीखा, और फिर सीखना froze हो गया। इसलिए knowledge cutoff, और इसलिए यह आपकी private दुनिया नहीं जान सकता। इसे use करना इसे कभी नहीं सिखाता।
  • Idea 3. इसके पास कोई अलग faculty नहीं जो जाँचे कि कोई prediction सच है या नहीं। Hallucination machine का बने हुए ढंग से काम करना है, ख़राबी नहीं।
  • Idea 4. यह tokens (चंक्स) में पढ़ता है, letters या words में नहीं। यही meaning, memory, और पैसे की इकाई है।
  • Idea 5. Context window ही एकमात्र जगह है जहाँ यह आपकी ख़ासियतें देख सकता है: एक reading desk, brain नहीं। Control करें कि उस पर क्या उतरता है।
  • Idea 6. इसका confidence और इसकी सहमति सीखी हुई styles हैं, truth से कटी हुई। Certain अंदाज़ house style है, कोई फ़ैसला नहीं।
  • Idea 7. इसकी क्षमता jagged है (बगल के पलों में brilliant और बेकार) एक ऐसी frontier पर जो इंसानी अंदाज़े से मेल नहीं खाती, और जो खिसकती रहती है।
  • Idea 8. Tools text-predictor को काम करने वाली चीज़ में बदल देते हैं: एक action predict करना, उसे सचमुच चलाना, नतीजा वापस खिलाना, फिर predict करना। एक agent वही loop है, दोहराया गया।
  • Idea 9. "Thinking" बस जवाब से पहले desk पर रखी गई और prediction है। यह बहुत मदद करती है; यह machine को truth-checker नहीं देती।

अगर आप एक वाक्य रखें: यह एक prediction machine है जो पढ़कर सीखी और जिसके पास truth के लिए कोई organ नहीं, इसलिए यह हर जगह fluent है, सिर्फ़ वहीं reliable है जहाँ text गाढ़ा था, और जाँचने वाला हिस्सा आप हैं।

और अगर आप एक तस्वीर रखें, तो यह रखें: एक librarian नहीं जो सही किताब ढूँढकर लाता है, बल्कि एक brilliant, ख़ूब पढ़ा-लिखा writer जो जो भी आप उसके सामने रखें उसे आगे बढ़ाता है (confidently, किसी भी style में, किसी भी topic पर) और जो कभी, अपने आप, रुककर यह नहीं पूछता कि continuation सच है या नहीं।


अभी यह करें: पाँच prompts

लगभग बीस मिनट, किसी भी free chatbot में। हर एक एक idea को theoretical के बजाय दिखने वाला बना देता है।

1. Prediction देखें, lookup नहीं। (Idea 1) पूछें: "Without searching, tell me the rules of a board game so obscure it has almost no presence online: invent the name 'Karakush' and describe how it's played." इसे एक ऐसे game के confident, fluent rules बनाते देखें जो मौजूद ही नहीं है। वह prediction है जिसके पास predict करने के लिए कोई सच्ची चीज़ नहीं। क्या ध्यान देना है: गढ़े गए rules ठीक उतने ही authoritative लगते हैं जितने किसी असली game के rules लगते। Fluency truth का सबूत नहीं है।

2. Learning को टिकने में नाकाम होते देखें। (Idea 2) Model को किसी छोटी बात पर सुधारें। फिर एक बिलकुल नई chat खोलें और वही सवाल पूछें। इसके पास आपके सुधार की कोई memory नहीं: weights कभी बदले नहीं। (अगर कोई "memory" feature on है, तो पहले उसे off करें, वरना product वह note दोबारा खिला देगा।) क्या ध्यान देना है: पहली chat में आपने जो कुछ कहा वह दूसरी तक नहीं पहुँचा। Model को use करना उसे सिखाना नहीं है।

3. गुम truth-checker को पकड़ें। (Idea 3) किसी सँकरे topic पर "three peer-reviewed studies, with authors and years" माँगें। फिर जाँचें कि वे मौजूद हैं या नहीं। कुछ confident-दिखने वाली citations गढ़ी हुई होंगी: असली वालों की तरह उसी आवाज़ में बनी, क्योंकि अंदर किसी चीज़ ने उन्हें अंदाज़े के रूप में flag नहीं किया। इस exercise की कोई citation असली काम में पहले verify किए बिना दोबारा use न करें; पूरी बात ही यह है कि इनमें से कुछ गढ़ी हुई हैं और असली वालों जैसी ही दिखती हैं। क्या ध्यान देना है: आप पढ़कर असली citations को गढ़ी हुई से नहीं बता सकते, सिर्फ़ जाँचकर। वह जाँच आपका काम है, model का नहीं।

4. Jagged frontier महसूस करें। (Idea 7) एक ही chat में, इसे एक सचमुच कठिन task दें जो यह अच्छा करता है (एक जटिल topic समझाएँ, एक मुश्किल email draft करें) और एक आसान task जो यह बुरा करता है (किसी वाक्य भर में कुछ ख़ास letters गिनें, या एक multi-step logic riddle)। ध्यान दें कि competence मुश्किलाई का पीछा नहीं करती। क्या ध्यान देना है: जो आसान task यह बिगाड़ता है वही ख़तरनाक है: वही जिसे आप कभी जाँचने की सोचते ही नहीं।

5. Thinking on और off करें। (Idea 9) वही कठिन reasoning सवाल दो बार पूछें: एक बार सादा, एक बार "think hard and show your working first" के साथ। तुलना करें। दूसरा जवाब आमतौर पर बेहतर होता है, क्योंकि model ने जवाब predict करने से पहले reasoning desk पर रखी। क्या ध्यान देना है: working ने जवाब बेहतर किया, लेकिन model फिर भी अपनी working को certify नहीं कर सकता: ज़्यादा thinking खाई को सँकरा करती है, बंद नहीं करती।


यह आगे कहाँ ले जाता है

अब आपके पास model के नीचे का model है: किसी भी course के आपको इसे use करना सिखाने से पहले यह चीज़ असल में है क्या। यहाँ से, बाकी Foundations इसे अच्छी तरह चलाने के बारे में है:

  • 2026 में AI Prompting Ideas 1, 5, और 6 को briefing, context control, और sycophancy को neutralize करने की रोज़ की आदतों में बदलता है।
  • AI युग में कैसे सोचें वह discipline है जो सीधे Idea 3 पर बनी है: क्योंकि machine के पास कोई truth-checker नहीं, आप वह बन जाते हैं।
  • Markdown In, HTML Out और Code You Never Write इस बारे में हैं कि context window (Idea 5) में क्या आता-जाता है और tools (Idea 8) उसके साथ क्या कर सकते हैं।
  • Skills & Connectors उसी predictor पर और tools (Idea 8) जोड़ता है।

The Agent Factory में बाकी सब कुछ (agents, उन्हें बनाना, उन्हें deploy करना) Idea 8 के predict-act-observe loop पर बना है, बड़े पैमाने पर चलाया गया। Machine कभी एक next-token predictor होना बंद नहीं करती। यह बस और tools, लंबे loops, और weights का एक frozen set पाती है जो तीनों के साथ सचमुच हैरान कर देने वाला बहुत कुछ कर रहा है।

Flashcards Study Aid