Skip to main content

2026 में AI Prompting: 45-minute crash course

13 concepts, real use का 80%

ज़्यादातर लोग AI को Google search की तरह use करते हैं। वे छोटा सा question type करते हैं, answer को जल्दी से skim करते हैं, और आगे बढ़ जाते हैं। Trivia के लिए यह चलता है। आपकी life और work में जो सचमुच matter करता है, वहाँ यह fail होता है।

Power users अलग काम करते हैं। वे AI को उसी तरह brief करते हैं जैसे किसी smart लेकिन नए colleague को brief करते: files, context, constraints और clear ask के साथ। वे एक option के बजाय तीन options expect करते हैं। वे argue करते हैं। वे iterate करते हैं। वे काम check करते हैं। Novice prompt और power-user prompt के बीच gap cleverness नहीं है; यह कुछ habits का set है जिसे कोई भी एक afternoon में सीख सकता है।

यह page वही afternoon है। Thirteen concepts, चार छोटे parts में grouped. No code, no setup, no jargon जिसे आप context से guess न कर सकें।

इस page की हर बात के नीचे एक fact है: model की अपनी memory नहीं होती। हर बार जब आप send press करते हैं, वह scratch से answer देता है, सिर्फ़ उस moment की context window में मौजूद चीज़ों का use करके: आपका prompt, अभी तक की conversation, attached files, और tool जो invisible scaffolding add करता है। यह yesterday की chat को today में carry नहीं करता। Sessions के बीच यह आपको नहीं जानता। Engineers इसे stateless कहते हैं। (कुछ products ऊपर से "memory" feature जोड़ देते हैं जो हर turn पर आपके बारे में कुछ facts quietly context में re-inject करता है, लेकिन वे facts भी context हैं, human sense वाली memory नहीं।)

इसीलिए नीचे के हर section में एक insight बार-बार आती है: इस page की लगभग हर "advanced technique" दो moves में से एक है: सही context अंदर लाना, या गलत context बाहर रखना। Model इस response के लिए सिर्फ़ अपनी context window में मौजूद चीज़ें देखता है। आपका काम control करना है कि अंदर क्या जाता है। हर section इसी lens से पढ़ें।

Tools पर note: examples में ChatGPT, Claude और Gemini reference किए गए हैं क्योंकि ज़्यादातर readers इनमें से किसी एक को use करते हैं। Skills किसी भी modern chat AI पर transfer हो जाती हैं। जहाँ कोई feature सिर्फ़ एक product में है, उसे explicitly name किया गया है।

इसे कैसे पढ़ें

आगे पढ़ने से पहले अभी किसी दूसरे browser tab में Claude, ChatGPT, या Gemini में से किसी एक का free account open करें। हर tool में free tier है और sign up में लगभग एक minute लगता है। अभी उसमें कुछ करना ज़रूरी नहीं; बस उसे open रखें। फिर shape समझने के लिए एक बार straight through पढ़ें, और closing block में prompts try करने के लिए वापस आएँ। बिना try किए पढ़ना आपको words देता है; try करना skill देता है। (Closing exercises में से एक आपसे दो tools को side by side compare करवाता है, इसलिए वहाँ पहुँचते-पहुँचते दूसरा free account भी open रखना useful हो सकता है।)

पिछली बार देखने के बाद क्या बदला, इसका छोटा note

अगर आपने 2022 या 2023 में ChatGPT use किया था और decide कर लिया था कि यह clever toy है, तो जो tool आपको याद है वह आज वाला tool नहीं है। कुछ changes quietly हुए:

  • Context windows लगभग 1000x बढ़ गईं। 2022 model कुछ thousand words hold करता था। 2026 model hundreds of thousands, कभी-कभी million तक hold करता है। इससे prompt में आप क्या डाल सकते हैं, वह बदल जाता है: पूरी book, कई दिनों की speech, contracts का folder.

  • Reasoning real हो गई। "Think step by step" कभी magic phrase था। अब models में explicit thinking modes हैं जो answer देने से पहले seconds, कभी-कभी minutes तक चलते हैं और multiple approaches explore करते हैं। इसे size करने का एक तरीका: एक साल पहले AI reliably जो hardest task finish कर सकता था, वह ऐसा task था जिसमें किसी person को कुछ minutes लगते। Today यह ऐसा task है जिसमें किसी person को एक hour या उससे ज़्यादा लगता। Concept 5 में measured numbers हैं।

  • Web search built-in tool बन गई। Model decide करता है कि question को fresh information चाहिए या नहीं, search fire करता है, कुछ pages पढ़ता है, और जो मिलता है उसे answer में use करता है। 2022 model सिर्फ़ training time पर memorized चीज़ों से answer दे सकता था; 2026 model response के बीच में जाकर कुछ look up कर सकता है। यह सबसे ज़्यादा उन चीज़ों में matter करता है जो बदलती हैं: news, prices, recent regulations, इस week के sports scores.

  • Code execution भी built-in tool बन गई। Model छोटा program लिख सकता है, उसे run कर सकता है, result देख सकता है, और उस result को answer में use कर सकता है। यह उन चीज़ों में सबसे useful है जिन्हें वह otherwise अपने head में estimate करता: real numbers पर arithmetic, spreadsheet parse करना, quick simulation run करना। Search और code execution tools दोनों mostly invisible होते हैं: ज़्यादातर users notice नहीं करते कि कोई tool fire हुआ, इसलिए वे नहीं बता पाते कि answer memory से आया, fresh web page से, या calculation से। जब आप notice करना शुरू करते हैं, prompts sharper हो जाते हैं: आप पूछ सकते हैं "क्या आपने सच में इसके लिए search किया?" या model से कह सकते हैं "numbers run करें, estimate न करें।"

  • Multimodal sidebar नहीं रहा। आप photo, PDF, spreadsheet, voice memo, या files का folder prompt में drop कर सकते हैं और उनके बारे में questions पूछ सकते हैं। Model इन सबको एक stream में handle करता है।

  • Desktop apps आ गए। Products की नई category (Cowork, OpenWork) आपकी files find कर सकती है, emails draft कर सकती है, और permission के साथ spreadsheets update कर सकती है। यह अब chat नहीं है; यह छोटे task को coworker को delegate करने के ज़्यादा करीब है।

  • Developers के लिए command-line agents आ गए। Claude Code और OpenCode जैसे tools terminal में रहते हैं, पूरे codebase में read करते हैं, कई files एक साथ edit करते हैं, tests run करते हैं, और report back करते हैं। Desktop apps वाला ही shift: AI real artifacts पर act कर रहा है, सिर्फ़ उन्हें describe नहीं कर रहा। लेकिन यह उन लोगों के लिए aimed है जो code लिखते हैं।

अगर इन tools का आपका mental model even eighteen months outdated है, तो आप शायद आज की capability का सिर्फ़ 20% use कर रहे हैं। यह page वही gap close करता है।


Part 1: AI चीज़ें कैसे जानता है

जब आप समझ जाते हैं कि AI से question पूछते समय असल में क्या हो रहा है, तो failures surprise करना बंद कर देते हैं।

1. Novice vs power user

दो prompts के बीच क्या बदलता है, देखिए। Question वही है; briefing अलग है।

Side-by-side comparison: novice पूछता है 'मुझे कौन सी car खरीदनी चाहिए?' और generic three-model list पाता है। Power user insurance quotes, dealer quotes, और cost-of-ownership spreadsheet attach करता है, साथ में 30-minute commute और car seats में दो बच्चों वाला specific brief देता है, और उसे structured five-year cost comparison, safety analysis, और Honda CR-V recommendation मिलती है जिसकी conditions flip हो सकती हैं। Same AI, different briefing, different answers.

Field से कुछ और real contrasts:

  • Car खरीदना। Novice: "which car is best?" Power user: spec sheets, dealer quotes, और insurance plans upload करता है, फिर पूछता है "trade-offs क्या हैं? सब पढ़ें और think hard करें।"
  • Work पर self-review। Novice: "मेरे boss के लिए self-review लिखें।" Power user: अपने project tracker का screenshot, recent project docs, और notes का voice memo upload करता है, फिर draft माँगता है।
  • Business idea critique करना। Novice: "मेरे पास great business idea है, mobile tie-dyeing, critique करें।" यह sycophancy bait है, AI mostly applaud करेगा। Power user: "Objectively analyze करें। यह rubric use करें: क्या कोई problem worth solving है, क्या market है, क्या competitive advantage है?" AI ने उस idea को 100 में से 8 score दिया और explain किया कि क्यों।
  • Blog post लिखना। Novice: "BlackBerry पर blog post लिखें।" Result: AI slop. Slop AI output के लिए term of art है जो surface पर fluent और नीचे से empty होता है: grammatically clean, हल्का Wikipedian, "in today's fast-paced world" जैसे phrases से भरा, और ऐसा कुछ नहीं कहता जिसे reader एक hour बाद remember करे। जब आप context और constraints नहीं देते, AI default रूप से यही produce करता है। Power user: पहले outline, outline critique, हर heading को bullets में expand, bullets critique, और उसके बाद ही prose।

इन सबको जोड़ने वाला mental model: AI बहुत smart fresh college grad जैसा है। Highly motivated. अभी आपके बारे में ज़्यादा नहीं जानता। उसे वैसे brief करें। क्या नए colleague के पास यह job अच्छे से करने के लिए enough information होगी? अगर नहीं, तो उन्हें ज़्यादा दें।

2. Pretrained knowledge

AI ने दुनिया को पढ़कर नहीं सीखा। उसने दुनिया के बारे में text पढ़कर सीखा। Specifically: internet text की massive amounts. Reddit और Quora threads, Wikipedia, books, news articles, research papers, blogs, forums.

Training data में frequency roughly answer की reliability के बराबर होती है। इसलिए:

  • Strong: cooking, celebrity gossip, common medical advice, top-1000 movies, popular programming languages, Voyager 1 record पर क्या है (1970s में launch हुआ NASA spacecraft, Earth से लगभग 25 billion miles दूर, 55 languages में greetings लेकर), cats walls को क्यों stare करते हैं (वे subtle sounds और movements detect करते हैं जिन्हें humans miss करते हैं)।
  • Sparse: quasars (sky में extremely bright objects जो black holes से powered होते हैं), Cantonese (internet text का 0.1% से कम), regional history, niche professional knowledge.
  • Absent: आपकी company का secret data, आपका private calendar, model की knowledge cutoff date के बाद published anything, और anything जिसे किसी ने public internet पर कभी put नहीं किया।

दो practical consequences:

Typos fix करने में time waste न करें। AI को internet text पर train किया गया था, जो typos से भरा है। यह misspelled prompts gracefully handle करता है। "definately" misspell करने से answer नहीं बदलेगा।

Absorbed errors पर ध्यान रखें। AI ने उन्हीं sources से misconceptions और outdated information भी absorb की। Confidently wrong forum post model में confidently wrong बन जाता है। Important चीज़ों को primary source against check करें।

Thinking के लिए यह क्यों matter करता है

How to Think in the AI Era Crash Course आपको broken reasoning detect करना सिखाएगा। देखने की पहली जगह confident-sounding pretrained answers हैं, especially उन topics पर जहाँ training data thin या contested था। Confidence correctness का signal नहीं है।

Pretrained answer trust करने से पहले quick mental test:

Question typeTraining data में representation कैसा है?Trust level
"How do I make a roux?"Cooking internet पर सबसे discussed topics में से एक है।High.
"Plot of a top-1000 movie."Thousands of times review और re-review हुआ।High.
"History of an obscure village."शायद सिर्फ़ एक Wikipedia paragraph, या कुछ भी नहीं।Low; primary source against verify करें।
"Recent regulatory change in my industry."Almost certainly knowledge cutoff के बाद।Web search के बिना कुछ trust न करें।
"What did our company decide last quarter?"Training data में बिल्कुल नहीं।कुछ trust न करें; model guess कर रहा है।

यह कोई rule नहीं जिसे memorize करना है। यह वही instinct है जो आप किसी भी other source पर apply करेंगे: "इस person को यह कैसे पता होगा?" इसे AI पर भी apply करें।

Non-software example. एक reader ने AI से अपनी grandmother के village में खेले जाने वाले regional folk game के rules का summary पूछा। AI ने confidently तीन paragraphs rules produce किए। Grandmother से पूछा गया, तो उन्होंने कहा rules लगभग पूरी तरह wrong थे: AI ने similar games की descriptions को other regions से blend कर दिया था क्योंकि specific game internet पर barely मौजूद था। AI ने lie नहीं किया; उसने sparse data से generalize किया। Reader की mistake पूछना नहीं थी, confidence को accuracy मान लेना थी।

Curious हैं कि AI completely confident sound करके भी wrong कैसे हो सकता है? इसके पीछे deeper reason है। Elan Barenholtz का article "LLMs show language does not describe reality" (IAI, 2026) plain English में बताता है कि ये models असल में कैसे work करते हैं। Article human language पर कुछ बड़े philosophical claims भी करता है; जो part useful लगे उसे लें और बाकी ignore करें।

3. तीन retrieval modes: pretrained, web search, deep research

जब आप question पूछते हैं, modern AI tools quietly choose करते हैं कि answer कैसे देना है। या तो वे pretrained knowledge alone से answer देते हैं, या web search fire करके कुछ pages पढ़ते हैं, या deep research run करते हैं, जहाँ वे dozens of sources scan करने और structured report लिखने में several minutes लगाते हैं।

आपको पता होना चाहिए कि कौन सा mode fire हो रहा है, क्योंकि हर mode की strengths और failure modes अलग हैं।

तीन retrieval modes cost और depth की left-to-right ladder के रूप में। Mode 1 (Pretrained) fastest है, seconds लेता है, सिर्फ़ training data से draw करता है, definitions और common facts के लिए best है, stale या local info पर weak है। Mode 2 (Web search) medium-speed है, handful of live pages पर tens of seconds लेता है, current events और quick research के लिए best है, लेकिन popular sources पहले cite करने पर weak है। Mode 3 (Deep research) deepest है, dozens of live pages पर minutes लेता है, multi-dimensional structured reports के लिए best है, simple questions के लिए slow और overkill है। Left पर fast और shallow, right पर slow और deep. AI usually आपके लिए pick करता है। आपके prompt की wording steering wheel है।

इसे concrete बनाने के लिए कुछ examples:

  • Pretrained answers fine: "why do cats stare at walls," "what's on the Voyager 1 record," "summarize the plot of Hamlet." ये week to week change नहीं होते।
  • Web search stale model को rescue करती है: हर model की knowledge cutoff date होती है, और उस date के बाद viral हुआ anything उसके लिए invisible है। Meme, regulation, product launch: web search के बिना AI को पता नहीं कि आप किस बारे में बात कर रहे हैं। Web search के साथ, वह recent article pull करता है और correctly answer देता है।
  • Web search गलत जा सकती है: एक friend ने पूछा "Henderson, Nevada में कहाँ run करूँ।" AI ने 20-year-old web page cite किया और एक ऐसा school recommend किया जो अब public के लिए open नहीं था। Web search यह check नहीं करती कि sources current हैं या नहीं।
  • Deep research wait worth है: "हमारे neighborhood में Halloween haunted house plan करें, permits, fire safety, और noise ordinances सहित।" AI research plan propose करता है, many parallel searches run करता है, summarize करता है, decide करता है कि आगे कहाँ dig करना है, और checklists वाला multi-section report produce करता है। यह chatbot answer नहीं है; यह work को junior researcher को एक hour के लिए देने जैसा है।
Web search असल में कैसे work करती है (और कभी pages गलत क्यों पढ़ती है)

Under the hood, exact mechanics tool के हिसाब से vary करते हैं, लेकिन shape consistent है। एक search-and-retrieval layer searches issue करती है, result list scan करती है, सबसे relevant pages pull करती है, और हर page को short passage या summary में reduce करती है। अक्सर वह layer अलग, छोटा model होती है। सिर्फ़ reduced version user-facing model तक flow करता है जो आपसे बात करता है।

आपसे बात करने वाला model अक्सर original page directly नहीं पढ़ता। वह उसका condensed version पढ़ता है। इसलिए वह कभी-कभी page ने जो सच में कहा था उसे misrepresent करता है: information model तक पहुँचने से पहले translation layer से गुज़री, और translation layers nuance खो देती हैं।

Practical fix: AI को बताएँ कि कौन से sources use करने हैं। "are vaccines safe" के बजाय try करें: "World Health Organization, FDA, European Medicines Agency, और peer-reviewed studies use करें। Forums या personal blogs use न करें।" Source quality एक knob है जिसे आप turn कर सकते हैं। Default settings popular sources पहले cite करती हैं (Reddit, Wikipedia, YouTube, Google itself, Yelp), जो अक्सर reliable होते हैं लेकिन high-stakes questions के लिए हमेशा trustworthy नहीं।

दूसरा fix: AI से source quote करने को कहें। "हर claim के लिए, source page की exact sentence quote करें जो उसे support करती है।" यह retrieval layer को original wording surface करने पर force करता है, जिससे summary-layer drift का बड़ा हिस्सा पकड़ा जाता है।

Non-software example. एक neighborhood-association volunteer ने local water quality पर town meeting के लिए prepare करने में deep research use किया। उनका prompt: "Research current water quality issues in [her city] over the last 24 months. Use the EPA, the city's public utility reports, and peer-reviewed studies. Avoid news editorials and forums. Produce a structured report with: (1) the three most-cited issues, (2) data tables showing trends, (3) three concrete questions residents should put to the utility." Eight minutes बाद उनके पास current local data में grounded briefing थी। Pretrained mode यह नहीं कर सकता था; web search alone shallow answer देता; deep research सही tool था क्योंकि question multi-dimensional और current था।

अपने head में mode choose करना। Usually आप button click करके mode pick नहीं करते; AI आपके prompt based pick करता है। लेकिन आप steer कर सकते हैं:

Phrasing patternUsually क्या trigger होता है
"What is X" / "Summarize Y"Pretrained only.
"What's the latest on X" / "Today" / "This week" / specific cityWeb search.
"Research X thoroughly," "produce a report with citations," "use these source types"Deep research (जिन tools में है; otherwise extended web search).
Attaching filesFiles के लिए pretrained रहता है; prompt current info माँगे तो context के लिए web search कर सकता है।

AI vs Google. ये same tool नहीं हैं। Google use करें quick scans के लिए, किसी specific known site पर navigate करने के लिए, या कोई चीज़ खरीदने के लिए (2013 Honda Civic का air filter)। AI use करें जब आपको synthesis चाहिए: pros and cons, multi-source comparison, written-out analysis. Choice इस पर depend करती है कि आपको link चाहिए या answer.

Side-by-side rule of thumb:

TaskGoogle से betterAI से better
"Find the official IRS page for form 1040."Yes. आपको specific known site पर land करना है।No.
"Compare three diabetes medications and what the recent evidence says."Slow. आप 8 tabs पढ़ेंगे।Faster. AI evidence को एक जगह synthesize करता है।
"Buy a replacement charger for a 2018 ThinkPad."Yes. आपको product link चाहिए।No.
"Plan a 4-day Lisbon trip with a 6-year-old, no museums."Slow. आप blogs और reviews juggle करेंगे।Fast. AI constraints integrate करता है।
"What's the weather tomorrow?"Either.Either.
"Why are my tomato plant leaves yellowing?"OK. Multiple gardening sites.Photo attached हो तो better.

अगर आपका question "X कहाँ है" है, Google reach करें। अगर question "given all this, मुझे क्या सोचना चाहिए" है, AI reach करें।

ज़्यादा reliable web-search results कैसे पाएँ

जब आप web search चाहते हैं, तीन छोटी habits quality raise करती हैं:

  1. Trusted sources name करें। "WHO, FDA, और peer-reviewed studies use करें, forums नहीं।"
  2. Inline citations माँगें। "हर claim के बाद source cite करें।"
  3. AI से कहें कि जो verify नहीं हो पाया उसे flag करे। "अगर claim cited sources से support नहीं हो सकता, उसे 'unverified' mark करें।"

इन तीन lines को किसी भी web-search prompt में paste करने से सबसे common failure mode कम होता है: AI sources के across quietly synthesize करके confident sentence produce करता है जिसे कोई single source support नहीं करता।


Part 2: AI से अच्छे से बात करना

4. Context ही पूरा game है

Humans active working memory में सिर्फ़ कुछ चीज़ें hold करते हैं: classic estimates करीब seven कहते हैं, newer ones four के करीब। Modern AI models एक साथ hundreds of thousands words hold कर सकते हैं, कभी-कभी million. Proportion समझने के लिए: लगभग 750,000 words पहली 4 से 5 Harry Potter books के बराबर हैं, या continuous speech के कई दिन। Model answer देने से पहले यह सब read कर सकता है।

लेकिन वह सिर्फ़ वही read कर सकता है जो आप उसे देते हैं। Context वह सब है जो किसी given response के लिए model की window में end up होता है: product ने जो system prompt set किया, किसी भी callable tools की descriptions (web search, code, file access), आपका prompt, इस conversation की chat history, और uploaded files.

Context stack: पाँच layers vertically stacked हैं जो मिलकर वह सब बनाते हैं जो model किसी given response के लिए जानता है। Top से: uploaded files (PDFs, spreadsheets, images, voice memos), chat history (हर prior turn), आपका prompt (वह layer जिसे आप हर बार edit करते हैं, highlighted), tool descriptions (web search, code execution, file access), और bottom में AI tool का invisible system prompt. Model सिर्फ़ वही जानता है जो इस stack में है; capacity roughly 750,000 words या 4-5 Harry Potter books है; जो आप इस stack में नहीं डालते वह इस answer के लिए exist नहीं करता।

Model सिर्फ़ यही देखता है। क्योंकि उसकी अपनी memory नहीं होती, इस stack के बाहर कुछ भी इस answer के लिए exist नहीं करता: आपकी last chat नहीं, वह file नहीं जिसे आप attach करना चाहते थे, वह constraint नहीं जिसे आपने assume किया कि model याद रखेगा। Stack ही इस response की world है।

Concrete contrast:

  • Bare prompt: "physics versus zoology study करने के pros and cons." आपको generic high-school-counselor advice मिलेगी।
  • Context-rich prompt: वही question, plus career assessment results as PDF और high-school schedule का screenshot. अब AI आपकी specific aptitude profile, specific course history, और कौन सी choice किस fit से जुड़ी है, इस पर बात कर सकता है।

Same model. Same question. Different answer. Difference context है, prompt की cleverness नहीं।

आप जो discipline सीख रहे हैं: send press करने से पहले खुद से पूछें कि smart new colleague को यह answer अच्छे से देने के लिए सामने क्या चाहिए होगा। फिर वे चीज़ें attach करें। Colleague आपके सामने रखी हर चीज़ carefully पढ़ेगा; जो आपने नहीं बताया उसे guess नहीं करेगा, filing cabinet search नहीं करेगा, आपका industry, team history, या yesterday की email thread infer नहीं करेगा। अगर job के लिए उन्हें document या constraint चाहिए होता, तो आपको उसे include करना होगा।

Non-software example. 7th-grade teacher ने AI से "water cycle पर lesson plan draft करें" पूछा। Output generic plan था जो वह किसी भी textbook में पा सकती थीं: definitions, diagram, तीन discussion questions. Next day उन्होंने फिर try किया, तीन चीज़ें attach करके: course syllabus (ताकि AI जान सके कि इस lesson से पहले और बाद क्या आता है), last week के student worksheets with grades visible (ताकि AI जान सके कौन से concepts landed और कौन से नहीं), और school का standardized test format. नया lesson plan उन दो concepts के five-minute review से open हुआ जिन्हें last week के worksheets ने weak दिखाया था, नए material को May में दिखने वाले test format के through thread किया, और syllabus के next topic से matched check-for-understanding question से close किया। Same model, same teacher, same subject. Difference सिर्फ़ इतना था कि second prompt ने AI को वह बताया जो smart new colleague को जानना चाहिए था।

किसी भी non-trivial prompt से पहले habit को checklist के रूप में:

Questionअगर yes, attach या describe करें
क्या answer किसी document के consistent होना चाहिए?Yes: attach करें।
क्या कोई constraint है जिसे AI infer नहीं कर सकता (budget, time, team में कौन है)?Yes: state करें।
क्या prior context है (previous decision, existing process)?Yes: एक paragraph में summarize करें।
क्या कोई output format चाहिए (table, email, bullet list)?Yes: name करें।
क्या audience है (boss, child, stranger)?Yes: उन्हें name करें।

सही चुनी हुई context की पाँच lines, cleverness के पाँच paragraphs से बेहतर हैं।

Context rot

Modern context windows बड़ी हैं, लेकिन infinite नहीं, और उनमें recall degrade होता है। लोग सबसे बड़ी practical mistake करते हैं: वे एक बहुत लंबी conversation को many unrelated topics के across चलाते रहते हैं। AI ने अभी workout plan में help की, अब आप उससे spreadsheet debug करने को कहते हैं, फिर aunt को thank-you note लिखवाते हैं। Workout context अभी भी वहाँ है, model को distract कर रहा है।

Rule of thumb: जब topic बदलता है, new conversation start करें। करना cheap है, free है, और answers visibly better हो जाते हैं।

Conversation stale होने के symptoms:

  • AI chat के earlier parts reference करना शुरू करता है जिनका अभी पूछे गए question से कोई लेना-देना नहीं।
  • उसके answers time के साथ longer और vaguer हो जाते हैं, ज़्यादा hedging के साथ।
  • वह पाँच turns पहले stated constraint contradict करता है।
  • वह progress किए बिना repeatedly apologize करना शुरू करता है।

जब यह दिखे, instinct होता है एक और clarifying prompt से fix करना। Resist करें: इससे tangled context में और tangled context add होता है। ऊपर वाला rule apply करें। New chat start करें, एक या दो facts paste करें जो actual में matter करते हैं, और वहाँ से continue करें। Reset लगभग हमेशा rescue से faster है।

अगर dead chat ने कुछ worth keeping produce किया (plan, draft, decision), reset से पहले उसे file में save करें। इससे work lose नहीं होगा, लेकिन noise next task में drag भी नहीं होगा।

Projects: context हर बार नहीं, एक बार front-load करें

ऊपर Concept 4 की checklist एक obvious सवाल उठाती है: अगर AI को colleague की तरह हर बार brief करना है, तो typing बहुत repeat होगी। Modern tools में इसका जवाब अब अक्सर projects नाम का feature है: ऐसा workspace जिसे आप एक बार set up करते हैं, जहाँ files, instructions, और audience पहले से मौजूद रहते हैं, ताकि उसके अंदर शुरू की गई हर chat वही setup automatically inherit करे।

Project कब बनाना है। जैसे ही आपको लगे कि आप same topic पर दो या ज़्यादा chats में वही files, वही audience description, या वही constraints paste कर रहे हैं। वही signal है: context prompt में नहीं, project में belong करता है।

Project आपको क्या देता है, कुछ examples:

  • "Tax filing" project जिसमें पिछले साल का return, आपके W-2s और 1099s, और ऐसी instruction हो: "Assume I am a US filer with one dependent. Always show your math." वहाँ पूछा गया हर question उसी base से start होगा।
  • "Kids' school" project जिसमें syllabus और school calendar हो, और ऐसी instruction हो: "Always check the date against the calendar before answering." जब "Monday को school है?" साल में चार बार आता है, तब useful।
  • "Writing voice" project जिसमें आपकी writing के तीन samples और ऐसी instruction हो: "Match the cadence and word choice of the samples. Do not add hedging or qualifiers I did not use." अब हर draft generic-AI-voice के बजाय आपकी voice से start होता है।

ऊपर वाले context rot rule से connection। Project के अंदर "new chat start करें" का मतलब अब यह नहीं कि AI आपकी situation के बारे में सब खो देता है। इसका मतलब सिर्फ़ पिछली conversation का noise खोना है। Standing files और instructions साथ चलते हैं। इसलिए reset rule follow करना cheaper हो जाता है: आप chat reset करते हैं, context नहीं।

तीन tools, तीन names, एक idea। Claude इसे Projects कहता है, ChatGPT इसे Projects कहता है, और Gemini इसे Notebooks कहता है (जो NotebookLM, Google के standalone research tool, से sync करते हैं: एक में कुछ add करें तो दूसरे में दिखता है)। तीनों आपको files upload करने, instructions save करने, और same persistent context पर grounded कई chats run करने देते हैं। फर्क emphasis में है:

  • Claude और ChatGPT Projects instructions और behavior की तरफ़ tilt करते हैं। आप voice, role, rules, audience set करते हैं, और model उस persona को project की हर chat में reliably hold करता है। Best तब, जब AI कैसे respond करता है उतना ही matter करता है जितना वह क्या जानता है: specific voice में writing, codebase पर काम, brand tone maintain करना, या कोई भी जगह जहाँ style consistency point है।
  • Gemini Notebooks (और NotebookLM) source side पर आगे जाते हैं। PDFs, Google Docs, web URLs, YouTube videos, even audio files drop करें, और हर answer उन sources में grounded होकर clickable inline citations के साथ आता है। Unusual part यह है: workspace दोनों directions में flow करता है। NotebookLM में जो डालते हैं वह Gemini app के same notebook में दिखता है, और Gemini notebook के अंदर की गई कोई भी chat NotebookLM में वापस source बन जाती है। इसलिए workspace समय के साथ आपकी अपनी reasoning accumulate करता है: last week की chat, this week की chat cite कर सकती है। यह "learning को practicing से connect" करता है, जिस तरह बाकी tools नहीं करते। NotebookLM आपके sources से Audio Overviews, Mind Maps, Flashcards, और Slide Decks भी automatically generate करता है। Best तब, जब आप study, research, या कई sessions में material पर काम कर रहे हों और हर session next one को smarter बनाना चाहिए।

Quick rule of thumb। Gemini Notebooks / NotebookLM तब reach करें जब workspace समय के साथ grow करेगा: study notes, ongoing research, या कुछ भी जहाँ आप चाहते हैं कि हर session next को feed करे। Claude या ChatGPT Projects तब reach करें जब workspace किसी persona या instructions के set के around built हो जिसे AI को chats के across consistently hold करना है।

Mid-2026 तक कहाँ क्या available है:

Toolइसे क्या कहते हैंFree tier?
ClaudeProjectsYes: free plan पर up to 5 projects
ChatGPTProjectsPaid plans only (Plus and up)
GoogleNotebooks (in Gemini) and NotebookLMYes: दोनों free हैं; paid tiers (NotebookLM Plus, Gemini AI Pro/Ultra) source limits बढ़ाते हैं

5. Reasoning, या "think hard"

लगभग 2023 तक hard prompts के लिए standard advice थी "think step by step." वह advice अब mostly obsolete है। Modern models में built-in reasoning modes हैं जिन्हें आप directly invoke कर सकते हैं।

इसे invoke कैसे करें:

  • Plain language में माँगें। Prompt में "Think hard" या "think carefully before answering" लिखें। यह portable move है: हर modern chat tool में काम करता है, किसी special syntax को remember करने की ज़रूरत नहीं।
  • Interface में thinking-mode toggle use करें, जहाँ offer किया गया हो।
  • कुछ products पर आपको पूछना भी नहीं पड़ता: tool खुद decide करता है कि question extended thinking warrant करने के लिए hard enough है या नहीं, और आपके लिए turn on कर देता है।

जब extended thinking on होता है, model कई seconds तक think कर सकता है। Hard problems पर कभी-कभी ten minutes से ज़्यादा। यह सिर्फ़ slower typing नहीं है; यह internally multiple approaches explore कर रहा होता है, अपना work check करता है, और उसके बाद वह answer लिखता है जो आप देखते हैं।

2025 METR study ने longest task track किया जिसे frontier model reliably complete कर सकता था। Mid-2024 में leading model ऐसे tasks handle करता था जिनमें humans को around seven minutes लगते। Early 2025 तक यह roughly एक hour तक पहुँच गया, और study ने पाया कि जो length यह measure करता है वह roughly हर seven months double हो रही है। आपके लिए implication: AI को real, hard tasks दें, सिर्फ़ easy वाले नहीं। यह आपकी 2023 instincts से ज़्यादा handle कर सकता है।

Power-user pattern जो इसे अच्छे से use करता है:

I'm choosing between two cars. Attached: spec sheets for both,
my insurance quote for each, and a spreadsheet of my driving
patterns over the last six months.

Read everything. Think hard. Then tell me:
1. The three trade-offs that actually matter for my driving pattern.
2. Which car you'd choose and why.
3. Under what conditions your recommendation flips.

यह prompt तीन चीज़ें करता है: relevant context load करता है, thinking explicitly invoke करता है, और wall of prose के बजाय structured output माँगता है। तीनों habits हैं।

Thinking mode कब use न करें

Quick lookups, एक paragraph के summaries, casual brainstorming. Thinking mode slower है और आपका usage budget ज़्यादा use करता है। इसे उन questions के लिए save करें जहाँ आप चाहते कि human time लेकर सोचे।

Thinking mode इसी के लिए है: faster नहीं, बल्कि उस तरह के multi-input, multi-trade-off question को handle करने में able, जिसे आप otherwise thoughtful colleague को देकर दो days wait करते। Trade real है। आप compute के कुछ minutes और usage budget की थोड़ी amount spend करते हैं। बदले में वह चीज़ मिलती है जिसे produce करने में आपको half a day लगता।

ऊपर mentioned METR trajectory का implication: जिन tasks को आपने दो साल पहले mentally "AI के लिए too complex" category में डाल दिया था, वे mostly अब ऐसे tasks हैं जिन्हें AI handle कर सकता है, अगर आप उसे अच्छे से brief करें और thinking mode on करें। हर six months अपनी assumptions re-test करें कि AI क्या कर सकता है। वे wrong होंगी।

6. Sycophancy और उसे neutralize कैसे करें

AI models human feedback पर trained हैं। Specifically, किन responses को thumbs up मिला। Millions of users के across, लोगों से agree करना disagree करने से ज़्यादा thumbs up पाता है। Result: models आपको वही बताने की तरफ biased होते हैं जो आप सुनना चाहते हैं।

November 2025 Washington Post analysis ने 47,000 ChatGPT conversations में पाया कि model ने affirmation ("yes," "correct," और similar) से लगभग 10 times ज़्यादा often open किया compared to "no" या "wrong." Reported openings "that's correct" और "you're on the right track" जैसे phrases around clustered थे।

आप इसे खुद verify कर सकते हैं। Same model, opposite framings:

  • "Don't you think remote work is better than office work?" → AI agree करता है, reasons list करता है।
  • "Is it true that office work is more productive?" → AI agree करता है, reasons list करता है।

Fix magic नहीं है। यह सिर्फ़ neutral framing है। Pattern दो levels पर दिखता है: surface ("don't you think X?") और subtle ("find evidence that X works"). अपने prompts में दोनों watch करें:

Subtle bait जो आप लिख सकते हैंAI को क्या signal मिलता हैNeutral rewrite
"Find evidence that this strategy will work."Conclusion fixed है; AI support भरता है।"इस strategy को evaluate करें। Strongest arguments for and against list करें।"
"Why is approach A better than approach B?"A wins; AI reasons list करता है।"Approach A और approach B compare करें। Cost, risk, और time पर score करें।"
"Help me defend my decision to hire X."Decision locked है; AI ammunition देता है।"यह मेरी decision और context है। Strongest counter-argument क्या है जिसके लिए ready रहना चाहिए?"
"Tell me my draft is ready to send."AI बताता है कि ready है।"इस draft को इन 4 yes/no criteria against critique करें। Lowest score lift करने वाली smallest change recommend करें।"
"Confirm that this code is correct."AI confirm करता है।"इस code में कोई bug, edge case, या unstated assumption find करें। अगर none हैं, तो say so."

Pattern: find, defend, confirm, prove, support जैसे verbs वाली phrasing AI को question से पहले conclusion hand कर देती है। उन्हें evaluate, compare, critique, find any, list both sides जैसे verbs से replace करें। Model still थोड़ा agreement की तरफ bias करेगा, लेकिन आपने loudest signal remove कर दिया।

General rule: दो options बिना preference hint किए lay out करें, फिर हर one के pros and cons माँगें। अगर आप "isn't X true" लिखते पकड़े जाएँ, तो stop करें और rewrite करें: "to what extent, if at all, is X true?"

यह mechanical है, deep नहीं

यह concept एक much deeper skill का cheap version है। Part 0 Chapter 1 (Asking Better Questions) deep version train करता है: ऐसे questions formulate करना जो वह surface करें जो आप already नहीं जानते। Neutral-framing trick everyday use के लिए आपको 80% रास्ता पहुँचा देती है। Chapter बाकी करवाता है।

Non-software example. Founder ने AI से पूछा: "मेरे पास great business idea है, बच्चों की birthday parties के लिए mobile tie-dyeing, critique करें।" AI ने idea की warmly praise की और reasons list किए कि यह succeed कर सकता है। Founder ने rubric के साथ फिर try किया: "इस idea को objectively analyze करें। नीचे के हर one के लिए 1 से 10 score करें और justify करें: (1) क्या यहाँ real problem है, (2) क्या market pay करने को willing है, (3) क्या competitive advantage है, (4) unit economics क्या है, (5) top three reasons this fails क्या हैं।" Same AI ने idea को 100 में से 8 दिया और concrete terms में explain किया कि founder को इसे rethink क्यों करना चाहिए। पहला prompt sycophancy bait था। दूसरा objective rubric था। Same model, same idea, opposite verdicts. Difference question पूछने के तरीके में था।

Objective-rubric pattern. जब आप AI से कुछ evaluate करवाते हैं (draft, plan, idea), ambiguous criteria "great work" में collapse हो जाती हैं। Specific yes/no criteria AI को actual में देखने पर force करती हैं। Compare:

Rubric-based prompts बेहतर क्यों work करते हैं: specific evaluation criteria sycophancy reduce करते हैं और ज़्यादा honest feedback produce करते हैं। तीन examples vague prompts (score my sci-fi story out of 100, is this email professional, how is my workout plan) को rubric-based prompts से compare करते हैं जो structured yes/no checks और specific criteria use करते हैं।

Trick यह है कि हर rubric criterion का answer clear yes या no होना चाहिए (या written justification के साथ 1-to-5 score)। Soft criteria ("क्या यह engaging है?") sycophancy के लिए room छोड़ते हैं। Hard criteria नहीं।

7. Brainstorm-iterate loop

यह इस page की single highest-leverage habit है। अगर आप हर other section skip करें, तो भी इसे skip न करें।

जब AI को internet पर train किया गया, internet का ज़्यादातर हिस्सा common ideas था, creative ones नहीं। इसलिए creative question पर average AI response भी common होता है। "घर पर exercise के तरीके": squats, push-ups, planks. Wrong नहीं। बस average.

इसके around जाने का तरीका magic prompt नहीं है। यह loop है।

Brainstorm-iterate loop: step skip करें तो slop मिलता है, cycle run करें तो आप ship करते हैं। Step 1: Context load करें (all constraints, files, audience up front). Step 2: 3-5 options demand करें (alternatives force करें, अभी expand न करें). Step 3: Explicit feedback दें (क्या reject, क्यों accept). 2-3 times iterate करें। Only then: chosen option expand करें (अब full draft माँगें)। Most leverage loop में रहती है, final draft में नहीं।

Recipe:

  1. सारा relevant context up front दें। सिर्फ़ "exercise के तरीके" नहीं; "exercise के तरीके, given कि मेरे पास trampoline है, cat है, और मैं तीन days से ज़्यादा plans stick नहीं कर पाता।"
  2. एक option नहीं, 3 से 5 options माँगें। Alternatives force करने से model अपनी first instinct से आगे जाता है।
  3. Explicit feedback दें। "मुझे option 1 पसंद नहीं, यह too passive है। Trampoline idea पसंद है लेकिन shorter चाहिए। बताना भूल गया कि मेरा knee खराब है।"
  4. Feedback से informed 3 से 5 नए options माँगें।
  5. Iterate करें जब तक आपके पास genuinely liked one या two options न हों।
  6. Then, and only then, AI से chosen option detail में flesh out करवाएँ।

Worked example, debt payoff:

I have $8,000 in credit card debt at 19% APR, $4,000 in student
loans at 5%, and $1,200 in a retail card at 24%. I have $700/month
free after expenses. I just learned I'll get $450 in cash from a
tax refund. Risk tolerance: low. I sleep badly when I see big
balances.

Give me 5 different repayment strategies, each with a one-line
rationale. Don't expand any of them yet.

फिर, पाँच options पढ़ने के बाद:

Reject option 2 (avalanche by interest rate alone): I want
psychological wins early. Reject option 4: I won't open new
accounts. I like option 1 (snowball with the retail card first)
but I'd want to fold the $450 in. Give me 5 new options that
combine snowball-style wins with smart use of that lump sum.

आप AI के mind पढ़ने का wait नहीं कर रहे। आप अपना taste दिखा रहे हैं; AI option space को उसके around reshape करता है। दो या तीन rounds के बाद, आपके पास एक option होता है जो exactly right feel करता है। फिर full plan माँगें।

यही loop writing में भी काम करता है, जहाँ इसका अपना नाम है: drafting से पहले outline।

Iteration 1: ask for 3 outline options for a post on X.
Iteration 2: pick one outline, ask AI to critique it.
Iteration 3: revise the outline, ask AI to expand each heading
into 3-5 bullets.
Iteration 4: critique the bullets, fix the weak ones.
Iteration 5: only now ask for the full draft.

यह क्यों काम करता है: outline में एक word edit करना पूरे article की direction बदल सकता है। Final draft में एक word edit करना एक word बदलता है। Writing का लगभग सारा leverage outline level पर होता है। AI start से word-by-word generate करता है, इसलिए जब तक आप structure first force नहीं करते, वह whole shape नहीं देख सकता।

Steps skip न करें

Temptation है कि first try में full draft माँग लिया जाए। Resist करें। किसी भी चीज़ का AI first draft slop होता है: polished दिखता है, कम कहता है। Loop दस minutes के polished nothing को thirty minutes के actually-useful something में बदलता है।

Worked writing example. Team lead 600-word post लिखना चाहता है titled "Why our small AI team is shipping faster than the big team across the hall." Loop का हर round practice में ऐसा दिखता है:

Round 1, research first:

I'm writing a 600-word post arguing that small AI-augmented teams
ship faster than larger non-AI teams. Don't write yet. First, give
me the 5 strongest research-backed arguments and the 3 strongest
counter-arguments. One sentence each.

Round 2, three outlines:

Now produce 3 different outline options for the post. Each outline
should have 4-6 headings. They should differ in structure: one
narrative, one analytical, one contrarian. One line per heading.

Round 3, one pick करके analogy add करें:

I'll go with outline 2 (analytical). I want to weave in a Pixar
analogy: how the original Toy Story team was small and faster than
the giant Disney studio because of new tools. Add this as a recurring
example, not its own section. Revise outline 2.

Round 4, bullets में expand:

Now expand each heading into 3-5 bullets. Telegraphic style, not prose.

Round 5, bullets critique:

Critique the bullets. Which ones are weakest? Which would a skeptical
reader push back on hardest?

अब जाकर lead full draft माँगता है। पूरी process लगभग thirty minutes लेती है। Output ऐसे read होता है जैसे lead ने लिखा है, क्योंकि हर load-bearing decision lead का था। "write me a post" से extra twenty minutes ही फर्क बनाते हैं: एक ऐसा draft जिसे कोई finish नहीं करता और एक ऐसा draft जो land करता है।

Drafting से पहले territory scope करें। उस example में first round ("don't write yet, give me the strongest research-backed arguments and counter-arguments") छोटा दिखता है लेकिन heavy work करता है। ज़्यादातर लोग इसे skip करके directly draft माँगते हैं। इसी वजह से उनके drafts thin लगते हैं: वे model की first surfaced ideas पर built होते हैं, topic के actual landscape पर नहीं। Drafting से पहले "scope the territory" का एक round, तीन studies quote करने वाली post और तीन opinions list करने वाली post का difference है। यह pattern writing से बहुत आगे generalize होता है। किसी भी substantial decision, plan, या analysis से पहले AI से map what's known करवाएँ, produce what's needed पूछने से पहले। Product naming से पहले competitive landscape. Strategy memo से पहले prior research. नया design करने से पहले existing approaches. Research pass पाँच minutes लेता है और loop के हर subsequent round को बदल देता है।

Loop domain-agnostic है। यह same way काम करता है: trip plan करना, sales pitch structure करना, college major pick करना, product naming, wedding toast लिखना, renovation decide करना, charity choose करना। Shape constant रहता है: context load करें, options demand करें, explicit feedback दें, नए options demand करें, iterate करें, फिर expand करें। अगर आप AI का first answer accept करते पकड़े जाते हैं, आपने loop skip किया है। आप जो भी काम कर रहे हैं, उसे loop deserve है।

Daily life में loop कहाँ fit होता है, इसका short table:

Decision or task"Context" कैसा दिखता है"Options with feedback" कैसा दिखता है
4-day trip plan करनाConstraints (budget, dates, कौन जा रहा है, वे क्या hate करते हैं)5 itinerary skeletons; दो reject करें; बाकी iterate करें
Product namingयह क्या करता है, कौन खरीदता है, इसे किस जैसा sound नहीं करना10 names; पसंद आए 3 pick करें, उनके variants माँगें
Difficult email लिखनाRecipient, relationship, desired outcome3 different tones; एक pick करें, specifics refine करें
Contractor choose करनाThree quotes, three reference notes, आपकी prioritiesSide-by-side scoring; favorite के strongest counter माँगें
Learning path pick करनाCurrent skills, available time, end goal3 different curriculum shapes; एक pick करें, weekly milestones तक expand करें
Designer के लिए logo brief design करनाBrand values, audience, examples जो आपको पसंद हैं5 mood-board directions; एक pick करें, उस lane में 5 variants माँगें

Part 3: Text से आगे

AI सिर्फ़ text box नहीं है। यह images देख सकता है, audio के साथ दोनों directions में work कर सकता है, छोटे working apps build कर सकता है, और आपके data पर code run कर सकता है। ज़्यादातर लोग इनमें से कुछ भी try नहीं करते।

8. Multimodal: images, audio, और next क्या है

Modern AI images और audio दोनों directions में handle करता है: यह आपके uploaded images read कर सकता है, recordings सुन सकता है, text prompts से new images generate कर सकता है, और spoken audio produce कर सकता है। Skills modalities के across अलग हैं, और अलग-अलग सीखने लायक हैं।

Image input. AI images को coarsely देखता है। यह इन चीज़ों में strong है:

  • Overall scene और composition.
  • Distinct, large object shapes (giant human-sized hamster wheel treadmill).
  • Whiteboard contents, diagrams सहित.
  • Handwritten और cursive text (decent, high stakes में double-check करें).

यह इन चीज़ों में weak है:

  • Fine details. "ये कौन सी gym machines हैं?" fail करता है क्योंकि slightly blurry lens से gym machines similar दिखती हैं। AI confidently और wrongly answer कर सकता है।
  • Cluttered scene में many small things count करना।
  • Image के edge पर small print पढ़ना।

Useful real-world test: एक teacher ने whiteboard photo लिया जहाँ उसके head ने neural network diagram में "convolutional" word block कर दिया था। AI ने rest of diagram से missing word correctly infer किया। यही AI good है: gist से infer करना। यह zoom in करने में good नहीं है।

Receipts, bill splitting, या handwritten notes transcribe करने में AI अच्छा काम करता है, लेकिन totals हमेशा double-check करें। Multi-image inputs (post-its plus whiteboard photo plus brainstorm के handwritten notes) के लिए AI combined ideas summarize कर सकता है; यह genuinely useful है और real time बचाता है।

Image output. Modern AI text prompts से images generate कर सकता है। दो practical tips:

  1. Image prompt लिखने के लिए text AI use करें। "Generate me a prompt for a fantasy forest illustration in a Studio Ghibli style for a children's book cover." उस output को लें, image tool में paste करें। Text AI rich image prompts लिखने में first try पर आपसे बहुत better है।
  2. Visual vocabulary build करें। Cinematic, watercolor, cyberpunk, anime, isometric, low-poly, art-deco, claymation जैसे words levers हैं। Image models captioned images पर trained थे और इन styles को name से सीखा। जो images आपको पसंद हों upload करें और AI से पूछें कि वह उन्हें कैसे describe करेगा। इससे आपकी vocabulary train होती है।

Image generation कैसे work करती है: यह diffusion model है, random pixel grids से noise step by step remove करने के लिए trained, जब तक image emerge न हो जाए। Text की तरह pixel-by-pixel नहीं। पूरी image एक साथ generate होती है। इसीलिए आप text response की तरह time save करने के लिए image generation को early stop नहीं कर सकते।

Older diffusion models की famous weaknesses थीं: weird hands (six fingers), signs पर garbled text, comic में frame to frame characters का appearance change होना। Modern models (जैसे Google's Nano Banana) text reasonably handle करते हैं, consistent characters generate करते हैं, और research papers को infographics में convert कर सकते हैं।

Modern image models पर भी watch करने लायक failure modes का short table:

Failure modeक्या दिखता हैकैसे mitigate करें
Signs पर garbled textImage में signage "HAPRY BIRTDAY" पढ़ता है instead of "HAPPY BIRTHDAY".Prompt में text quotes में specify करें। Three variants generate करें। जहाँ text सही हो, उसे pick करें।
Frames के across inconsistent charactersComic के panel 1 और 2 में same character का hair color अलग है।Explicit character-consistency support वाले models use करें; next image के लिए first image को reference दें।
Hand और finger errorsSix fingers, fused hands, twisted wrists.ऐसी compositions माँगें जहाँ hands partially out of frame हों, pockets में हों, या clearly described हों।
Implausible objects वाले cluttered backgroundsCoffee shop जहाँ bicycle chair में merge हो रही है।Simple background specify करें, या background explicitly describe करें।
Wrong aspect ratioModel square default करता है; आपको landscape चाहिए था।Aspect ratio हमेशा explicitly specify करें: "1024x768 landscape" या "16:9".

Image input का non-software example. एक reader ने deceased grandmother की three handwritten recipe cards का stack photograph करके AI को upload किया। Prompt: "Transcribe these three cards. Preserve the original wording and any abbreviations. If a word is unclear, mark it [unclear] and offer your two best guesses." Five minutes बाद तीनों recipes clean type हो गईं, चार words पर [unclear] marks के साथ जिन्हें AI confidently read नहीं कर पाया। Reader ने वे चार originals against check किए (दो obvious थे, दो के लिए aunt को phone करना पड़ा), और family के पास recipes का clean digital archive था जो lost होने के risk में था। AI ने boring 90% किया ताकि reader careful 10% पर focus कर सके।

Power-user recipe: designer के बिना designer-quality diagrams (first read पर skip करना safe है)

अगर आपको कभी किसी document, slide, या अपने chapter के लिए diagram बनाना हो, तो एक workflow है जो Figma use किए बिना और visual design skill के बिना लगभग fifteen minutes में designer-quality output देता है। ज़्यादातर non-designers realize नहीं करते कि यह अब possible है। यह design tool सीखे बिना designer-quality diagrams produce करने का सबसे simple तरीका है। यह page की बाकी चीज़ों से ज़्यादा involved है, इसलिए अगर आप regular diagrams बनाते हैं तो अभी पढ़ें, otherwise इसे bookmark करें जब पहली बार ज़रूरत पड़े।

Recipe, four steps में:

  1. Claude से concept को SVG के रूप में visualize करवाएँ। Underlying paragraph या text paste करें। पूछें: "Visualize this as a diagram. Output it as SVG. Make sure every label, arrow, and relationship from the text is present." इस step के लिए Claude strong choice है क्योंकि major models में इसकी reasoning ability इस kind of structured-thinking work के लिए सबसे strong में है: paragraph देखकर यह right boxes, right arrows, right hierarchy, और right labels बहुत कम guidance से figure out करता है। जो SVG return होगा वह structurally correct लेकिन visually plain होगा (bare rectangles, default fonts, no design polish). यह ठीक है; next step polish add करता है।
  2. SVG को PNG में convert करें। Claude से SVG को PNG render करने को कहें (Claude यह directly कर सकता है), या कोई online SVG-to-PNG converter use करें (cloudconvert.com, svgtopng.com), या high zoom पर browser में rendered SVG का screenshot लें। 2× resolution पर render करें (1600 से 2400 pixels wide) ताकि next step के पास work करने के लिए enough detail हो।
  3. PNG को ChatGPT में paste करें और redraw करवाएँ। ChatGPT की in-product image generation इस step में strong tend करती है क्योंकि text-heavy images में यह unusually good है: labels preserve करता है, typography right करता है, और source में structural relationships respect करता है। Prompt: "Redraw this diagram with professional design quality. Preserve every label, every box, every arrow, and the exact structural relationships. Improve typography, spacing, color palette, and visual hierarchy. The information must remain identical; only the visual finish changes."
  4. Result पर iterate करें। ChatGPT कभी label drop कर देता है या box rearrange कर देता है। Output को original SVG के against side by side compare करें। अगर कुछ wrong है, बस correction type करें: "The third box should be labeled 'Iterate', not 'Repeat'. The arrow from box 2 should point to box 3, not box 4." Three या four rounds typically कुछ ऐसा produce करते हैं जो professional design studio से आया लगे। Final PNG save करें।

कौन सा tool किस step के लिए क्यों। Claude step 1 में win tend करता है क्योंकि diagram में क्या belong करता है decide करना (कौन से boxes, कौन से arrows, कौन सी hierarchy) reasoning task है, और इस तरह के structured-thinking work के लिए Claude की reasoning major models में strongest में है। ChatGPT step 3 में win tend करता है क्योंकि text-heavy images render करना (labels readable रखना, arrows right boxes से connect करना, designed दिखने वाले layouts) वह category है जहाँ इसकी image generation currently lead करती है। किसी भी tool से दूसरे का job करवाना noticeably worse results देता है compared to chaining them. हर tool sequence में वह करता है जिसमें वह best है।

Total time: roughly ten to fifteen minutes per diagram, Figma में एक hour या more compared to, assuming आप उसे use करना जानते थे।

Tools से बचा रहने वाला pattern। हर category का leader rotate होगा। Claude next year strongest reasoning model नहीं हो सकता। Today's leading image model next shipped thing से replace होगा। ऊपर की recipe tool layer पर stale होगी। जो survives: strongest reasoning model में structure first, strongest text-heavy image model में polish second। जिस moment आप यह पढ़ रहे हैं, उन categories में जो tools lead करते हैं उन्हें pick करें। Two-step chain ही move है।

Image generation पर एक छोटी story

एक father जिसकी 7-year-old daughter cats पसंद करती थी, उसके लिए custom birthday cake चाहता था। उसने Nano Banana से cake designs brainstorm किए (dozens of variations generate किए: cat-shaped, multi-tiered, frosting-styles, color palettes), वह pick किया जो बेटी को पसंद आया, फिर chosen image को baker को दिया जिसने उसे real 3D cake के रूप में render किया। Design पर total iteration time: एक afternoon. Total cost: image generation में कुछ cents.

Point cake नहीं है। Point यह है कि ~$0.30 और taste-driven iteration के एक hour में, जो person designer नहीं है उसने one-of-a-kind brief produce किया जिसे professional execute कर सकता था। यह creative leverage की नई kind है, और widely available है।

Audio in, audio out. Images में जो shift हुआ था, वही अब audio में हो रहा है। आप type करने के बजाय long prompt dictate कर सकते हैं; meeting recording drop करके summary माँग सकते हैं; model से उसका answer aloud read करने को कह सकते हैं। ज़्यादातर modern AI tools तीनों support करते हैं, often free tiers पर extra fee के बिना।

Non-obvious uses ही real leverage देते हैं:

  • Long-form dictation. Problem को out loud talk through करना वह nuance capture करता है जिसे typed prompts skip करते हैं। जो लोग typing hate करते हैं, वे बोलकर dramatically better prompts produce करते हैं: prompt effort के बिना one line से several paragraphs में grow हो जाता है, और AI का answer correspondingly better होता है। ऐसे बोलें जैसे coffee पर colleague को brief कर रहे हों, फिर answer देने से पहले AI को resulting transcript clean up करने दें।
  • Meeting transcripts as context. One-hour meeting recording drop करें (या 2026 के dominant vendors जैसे Otter, Granola, या Fireflies से transcript, या phone voice memos) और पूछें: "Summarize the decisions made, the open questions, and the action items by owner." Meetings वाली job में किसी भी person के लिए यह page के highest-leverage workflows में से एक है, और tech के बाहर almost nobody अभी इसे use कर रहा है।
  • Accessibility और movement के लिए audio. Long commute, dog walk, driving: voice in/voice out dead time को thinking time में बदल देता है। Conversation quality typing के मुकाबले थोड़ी drop होती है क्योंकि input को उतना cleanly edit नहीं कर सकते, लेकिन जो time otherwise lost होता वह entirely recover हो जाता है।

2026 में audio किसमें good और bad है:

Audio taskकितनी अच्छी तरह work करता हैWatch out for
Clear speech transcriptionExcellentHeavy accents, technical jargon, multiple overlapping speakers
Speaker identification (किसने क्या कहा)2 speakers पर decent, 4+ पर weakकिसी को quote करने से पहले हमेशा check करें
Tone, sarcasm, emotionImprove हो रहा है but unreliableAssume करने के बजाय AI से uncertainty flag करने को कहें
Music या non-speech audio analysisLimitedGeneral-purpose AI नहीं, specialized tool use करें
Real-time voice conversationCasual के लिए good, technical depth पर weakPrecision matter करे तो text पर switch करें

Non-software example. एक doctor ने 45-minute patient consultation record किया (consent के साथ), audio upload किया, और AI से पूछा: "Produce a structured clinical note in SOAP format. Flag anything you could not understand confidently. Highlight the three most important things the patient said about their symptom history." Eight minutes बाद doctor के पास draft note था जिसे verify और finalize करने में 5 minutes लगे, typed version के 25 minutes के बजाय। AI ने clinical judgment replace नहीं किया; उसने typing remove की।

Cost note: audio in/out text के बाद second-cheapest tier है, pennies per minute (concept 12). Meeting summaries, daily voice journaling, या walk पर prompts dictate करने के लिए cost essentially invisible है। Freely iterate करें।

एक pattern याद रखने लायक है: multimodal का future यह नहीं कि "AI अब voice कर सकता है, cool है।" यह है कि modalities की boundary disappear हो जाती है। आप increasingly mixed bundle drop करेंगे (image, voice memo, PDF, screenshot) और उसे एक prompt की तरह treat करेंगे। Skill "voice कैसे use करें" नहीं है, बल्कि "इस job के लिए inputs का सही combination क्या है?" है।

Interactive video avatars same trajectory पर emerge हो रहे हैं। Pre-recorded avatar video (HeyGen, Synthesia, D-ID) training content और multilingual corporate communication के लिए already production-grade है। Real-time conversational avatars (Tavus और others) low-stakes uses में आज passable हैं (customer FAQ triage, face के साथ language tutoring, simple onboarding flows) और fast improve हो रहे हैं। उन्हें 2022 की image generation की तरह treat करें: impressive, novel, ज़्यादातर knowledge work के लिए अभी daily habit नहीं, लेकिन जब job screen पर face मांगता हो text के बजाय, quick experiment worth है।

9. One prompt से small apps build करना

Modern AI single prompt से small games, websites, और tools build कर सकता है। Large software के लिए अभी नहीं, लेकिन small useful things के लिए यह genuinely उन लोगों के लिए accessible है जिन्होंने कभी code नहीं लिखा।

App actual में कहाँ run होती है। Reasonable first question: "अगर AI मेरे लिए app build करता है, तो वह actual में कहाँ रहती है?" Answer tool पर depend करता है, और अक्सर बदलता है। Claude simple apps और games को chat में live render करता है, preview pane में जिसे आप click और interact कर सकते हैं। ChatGPT भी कुछ one-prompt apps inline render कर सकता है, though कुछ surfaces बस side editor में code दिखाते हैं instead of running it. Gemini अक्सर code के साथ Google playground में run करने वाला button return करता है। Anything more complex के लिए, AI आपको code देता है और बताता है कि कहाँ paste करना है (CodeSandbox या StackBlitz जैसी free service उसे आपके browser में run करती है, no installation needed). कौन सा tool क्या करता है यह memorize करने के बजाय, बस "a working version I can click on right now in this chat" माँगें और देखें क्या आता है।

Recipe सिर्फ़ three slots है:

Goal: what should this thing do?
Input: what does the user provide?
Output: what does the user see?

Examples जो today work करते हैं:

  • Pomodoro timer. "Yellow theme वाला Pomodoro timer build करें। 25-minute work sessions, 5-minute breaks, और हर cycle end पर satisfying click."
  • Bill splitter. "ऐसी app build करें जहाँ मैं total bill, tax amount, और friends के names enter करूँ। यह tax सहित bill split करे और हर person का share दिखाए।"
  • Outfit picker. "ऐसी app build करें जो today's weather (temperature और precipitation) ले और मेरी described closet items से outfit recommend करे।"
  • Fireworks simulator. "Fun fireworks simulator generate करें। Input: मैं screen पर click करता हूँ। Output: click point पर colorful fireworks display."
  • Place-obstacles game. "ऐसा game build करें जहाँ user obstacles और goal place करता है, और simulation run करता है जो goal तक पहुँचने की कोशिश करता है।"

जो अभी hard है:

  • Internet पर multiplayer. Networking, accounts, और matchmaking अभी one-prompt build से beyond हैं।
  • Different language में live AI feedback. French-conversation tutor जो listen करे, pronunciation correct करे, और real time में adapt करे, genuinely hard है।

जो intuition आप build करते हैं: छोटे things जो one screen पर fit हों, no accounts और no external services के साथ, work करते हैं। उससे आगे anything more than one prompt माँगता है, और usually कुछ real engineering।

Non-software example. एक parent ने अपनी daughter के लिए yellow cat-themed typing game build किया जब teacher ने mention किया कि kids faster type कर सकते हैं। वह software engineer नहीं है। Prompt three sentences था:

Build a typing game for a 7-year-old. Goal: practice typing
common short words. Input: words appear, the player types them
before they reach the bottom of the screen. Output: a yellow
theme, a cute cat mascot that cheers when the player gets a
word right, increasing speed across levels.

जो वापस आया वह work करता था। Perfect नहीं, first try पर नहीं, लेकिन एक hour के अंदर "kid के लिए good enough" तक iterate हो गया। यहाँ build हो रही skill coding नहीं है। यह clear brief लिखने और उसे iterate करने की ability है। यह skill universal है।

10. Data analysis (model code लिखता और run करता है)

जब आप AI से ऐसा question पूछते हैं जिसे calculation या graphing चाहिए, modern tools quietly कुछ remarkable करते हैं: model code लिखता है, run करता है, और result return करता है। Code execution model के लिए web search जैसा ही another tool है जिसे वह call कर सकता है।

यह model से head में math करवाने की तुलना में much more reliable है। Model math वैसे कर रहा है जैसे आप करते: calculator run करके। Precise calculator है; model सिर्फ़ choose कर रहा है कि compute क्या करना है।

Bubble tea shop example. Small business के पास एक year का sales data है: drinks, dates, quantities. Owner पूछता है: "कौन से drinks में year भर में सबसे बड़े sales changes हुए? Graph करें।"

AI spreadsheet देखता है, per drink month-over-month changes compute करने के लिए code लिखता है, observe करता है कि most drinks flat हैं और four stand out करते हैं, उन four का colored line graph generate करता है, और patterns note करता है। "Strawberry matcha spring में sharply rise हुआ; next year उस promotion को re-run consider करें।" यह generic answer नहीं है। यह actual data में grounded answer है।

फिर longer prompt: "Shop के लिए one-slide year-in-review graphic create करें। Feature करने लायक insights के लिए data carefully analyze करें।" यह minutes of thought trigger करता है; AI code लिखता है, analyses run करता है, insights pick करता है, annotations design करता है, और finished dashboard produce करता है।

यह किसके लिए good है:

  • Spreadsheet analysis (running tracker, sales records, budget files, lab data).
  • Trends के quick graphs जिन्हें rows squint करके नहीं देख सकते।
  • Aggregations और comparisons जिनमें Excel में आपको 20 minutes लगते।

क्या double-check करें:

  • Final totals. Code precise है, लेकिन AI wrong column sum कर सकता है।
  • Graphs पर labels. Numbers usually right होते हैं; captions कभी-कभी confidently wrong होते हैं।
  • Anything जहाँ analysis किसी column पर depend करती है जिसे AI ने misinterpret कर लिया हो।

Reliability memory-based math से बहुत higher है, लेकिन infallible नहीं है। AI data analysis को sharp junior analyst के work की तरह treat करें: useful, fast, almost always right, occasionally wrong in instructive ways.

Non-software example. Runner ने six months का running-tracker data upload किया (fitness app से CSV) और पूछा: "मेरी pace और distance कैसे progress कर रहे हैं? कोई patterns हैं जिनके बारे में मुझे पता होना चाहिए?" AI ने code लिखा, weekly averages plot किए, और दो चीज़ें notice कीं जो runner ने नहीं देखी थीं: हर long-run weekend के बाद pace consistently drop होती थी (likely fatigue), और third month में distance plateau हुआ before climbing again. Recommendation: हर fourth week deload week, और slower long-run pace. Runner महीनों से app dashboard में same data देख रहा था पर patterns नहीं देख पाया। AI ने nothing से insight invent नहीं किया; उसने वह compute किया जिसे runner के पास compute करने का time नहीं था।

Useful pattern: जो chart वह draw करेगा वह पहले पूछें

जब आप data upload करते हैं, पहला prompt question होना ज़रूरी नहीं। यह हो सकता है: "इस dataset को describe करें। कौन से columns हैं, वे क्या represent करते हैं, और कौन से 3 charts सबसे अच्छे से दिखाएँगे कि क्या चल रहा है?" Answer पढ़ें, जो chart चाहिए pick करें, फिर उसके लिए पूछें। इससे misinterpreted columns wrong analyses बनने से पहले पकड़े जाते हैं।


Part 4: Safely काम करना और tools choose करना

दो final concepts जो बदलते हैं कि AI आपके लिए क्या कर सकता है, और job के लिए सही tool कैसे pick करना है।

11. AI desktop apps और permissions

अब products की पूरी category है जिसे AI desktop apps कहते हैं: apps जो आपके computer पर run करती हैं और permission के साथ आपकी files find, read, और उन पर act कर सकती हैं। Cowork (Anthropic का product) और Microsoft Copilot दो examples हैं, और category grow कर रही है।

ये chat से क्या अलग कर सकते हैं:

  • PDFs के messy folder में look through करना, new organization propose करना (files rename करना, move करना, subfolders create करना), और आपके approve करने के बाद plan execute करना।
  • Project के लिए related files pull together करना (आप कहते हैं "मैं इन dates पर film कर रहा हूँ और ये people involved हैं"), और अपने आप things notice करना (crew member का birthday shoot के दौरान falls होता है, क्या आप celebration fold in करना चाहते हैं)।
  • Folder के across read करके summarize करना: "projects/ folder की contents based, last quarter मैंने क्या work किया?"

इसे safe बनाने वाला workflow:

  1. उसे task बताएँ। ("इस folder को client के हिसाब से reorganize करें।")
  2. Action नहीं, plan माँगें। App file operations की list propose करता है।
  3. Plan review और edit करें। वह rename catch करें जो आप happen नहीं करना चाहते।
  4. उसके बाद ही execution approve करें।
किसी भी AI app को file access देने से पहले यह पढ़ें

दो facts ज़्यादातर लोग hard way से सीखते हैं:

  • AI app जब files delete करता है, deleted files अक्सर recycle bin में नहीं जातीं। वे gone होती हैं।
  • Edited files edit history नहीं रखतीं जब तक आपके पास version control न हो। AI का change previous version overwrite कर देता है।

जब तक आपने यह safely कुछ बार नहीं किया, हर permission request को task के लिए needed smallest folder तक scope करें। जिस app को आपने दो बार use किया है उसे "full disk access" approve न करें।

यह genuinely नए shape का tool है। इसे उसी तरह treat करें जैसे पहली बार आपने junior employee को real account की keys दी हों। Useful, fast, और careful रहने लायक।

Non-software example. Consultant के पास clients/ नाम का folder था जो चार years में 240 PDFs तक grow हो गया था: contracts, invoices, scoping documents, hand-scanned receipts, meeting notes. उसने AI desktop app से कहा: "clients/ में look through करें। Organization scheme propose करें। अभी कोई files move न करें। Proposed scheme tree के रूप में दिखाएँ।" App ने clean tree produce किया: हर client के लिए one folder, contracts, invoices, और notes के sub-folders, साथ में 18 files की flagged list जिन्हें वह confidently classify नहीं कर पाया। उसने proposal edit किया (two clients rename किए, two folders merge किए), फिर execution approve किया। Total time: लगभग fifteen minutes. Same job तीन साल से उसके "someday" list पर थी। Unlock AI doing the thinking नहीं था; AI tedium कर रहा था ताकि thinking cheap हो जाए।

Permission ladder. Comfortable होने के लिए useful sequence:

Comfort levelक्या allow करेंकिसे no कहते रहें
First sessionsSingle small folder का read-only access.Anything that writes, deletes, or renames.
2-3 successful runs के बादOne specific folder के अंदर read और write.Desktop या documents root जैसे broader directories तक access.
Clean week के बादProject tree के across read, scoped subfolder के अंदर write.उस project के बाहर anything.
TrustedTool-specific permissions ("इस folder में PDFs rename करें," "इस folder में Word docs edit करें").Open-ended "जो चाहिए करें।"

Principle: scope track record के साथ grow करता है, उस company पर trust के साथ नहीं जिसने tool बनाया। Trust आपके specific workflow में behavior से earn होता है।

12. Cost, speed, और कौन सा model कब use करें

Head में रखने के लिए simple stack:

Modality के हिसाब से cost और speed, horizontal bar chart के रूप में जिसमें चार tiers vertically stacked हैं। Text iteration seconds लेती है और fractions of a cent cost करती है, इसलिए आप afternoon में 50 times iterate कर सकते हैं। Speech कुछ cents per minute cost करती है। Images tens of seconds और several cents per generation लेती हैं, early-stop नहीं होता। Video minutes per clip और many cents to dollars cost करता है, iteration painful है। Video iteration text से roughly 16 times ज़्यादा cost करती है। Costs year over year down trend कर रहे हैं, इसलिए bar lengths shrink होंगे लेकिन ordering नहीं बदलेगी।

Words में:

  • Text: seconds, per response fractions of a cent.
  • Speech: seconds, audio के per minute कुछ cents.
  • Images: tens of seconds, per generation several cents. No early-stop, पूरी image एक साथ generate होती है।
  • Video: per generation minutes, many cents to few dollars. Iteration painful है क्योंकि हर round slow और expensive है।
  • Deep research: minutes, several cents to a quarter, लेकिन आपके लिए dozens of sources synthesize करता है।

दो implications:

  1. Iteration cost shape करता है कि आप क्या करते हैं। आप afternoon में text पर 50 times iterate कर सकते हैं। Video पर afternoon में 50 times iterate नहीं कर सकते। इसलिए जब images या video generate करें, prompt में up front ज़्यादा invest करें (और उसे लिखने के लिए text AI use करें)।
  2. Costs down trend कर रहे हैं। जो image आज आपको 10 cents cost करती है, next year उसका fraction cost करेगी। Home art, birthday card, या wedding invitation generate करना rapidly free हो रहा है।

किस task के लिए कौन सा model? AI jagged है: different models अलग चीज़ों में good हैं, और leader हर कुछ months में change होता है। Single best model नहीं है। दो habits help करती हैं:

  • Same prompt routinely 2 से 3 models में try करें। Same question, three tools. तीनों answers पढ़ें। Differences आपको surprise करेंगे, और वे आपकी intuition update करेंगे कि किस kind of question के लिए कौन सा tool best है।
  • एक tool से marry न करें। जो worker सिर्फ़ एक AI use करता है, वह अपने two-thirds tasks के लिए best tool के बारे में wrong है। Switching free है; prompt को बस different tab में paste करना है।

आपके task के लिए today का best AI, three months में best AI नहीं है। Loose रहें।

Rough snapshot कि major models अभी किसमें good tend करते हैं (यह बदलेगा; इसे starting point treat करें, verdict नहीं):

Toolकिसमें strong tend करता हैकिसमें weaker tend करता है
ChatGPTConversational range, in-product image generation, broad task coverage.कभी-कभी verbose; lists और headings से over-format कर सकता है।
ClaudeLong-document understanding, hard prompts पर careful reasoning, writing voice.In-product image generation competitors जितना central नहीं।
GeminiFast web search और source synthesis, rich output (charts, tables) वाला deep research, Google data के साथ tight integration.Tone clipped feel हो सकता है; कुछ responses ideal से shorter lean करते हैं।

तीन habits जो compound करती हैं:

  1. कम से कम two tabs open रखें। Primary tool और backup. जब primary कुछ ऐसा दे जो right feel न करे, same prompt backup में paste करें। Second answer अक्सर tiebreaker होता है।
  2. Prompt scratchpad रखें। Note file (कोई भी text file works) जहाँ आप unusually good results देने वाले prompts collect करते हैं। उन्हें reuse और adapt करें। यह आपकी personal library है।
  3. Notice करें जब model wrong हो। Scolding के रूप में नहीं, data के रूप में। Wrongness इस tool के edges कहाँ हैं, इसका free signal है। "Tool X confidently wrong about Y" हफ्ते में एक बार log करना किसी भी 2,000-word AI newsletter पढ़ने से ज़्यादा useful है।
छोटा ritual जो payoff देता है

Month में एक बार, वह task pick करें जो आप regularly करते हैं (weekly status updates लिखना, meals plan करना, recurring document summarize करना)। उस task को तीन different AI tools में run करें। Note करें किसने best किया। उस task के लिए अगले month तक वही use करें, फिर re-test करें। आपकी tooling effort के बिना current रहती है।

13. Models checking models

जब ground truth नहीं होता (answer key नहीं, आपके पास expert नहीं, fail होने वाला test नहीं), तब भी quality पर objective signal मिल सकता है। यह signal models को एक-दूसरे को grade करवाकर मिलता है।

Light version से start करें। अगर आज आपके पास सिर्फ़ एक AI tool open है, तो single-model self-critique loop (नीचे covered) आपको benefit का most देता है, और everyday tasks के लिए यही version usually चाहिए। इसके बाद आने वाली full multi-model recipe high-stakes version है: यह दूसरे browser tab में second free account open मानती है, about a minute of setup, और यह setup तभी worth है जब wrong होना expensive हो। Shape के लिए full recipe अभी पढ़ें, लेकिन पहले lighter version reach करें; heavier one पर तब graduate करें जब desk पर कुछ actual में earn करे।

Different models के different blind spots होते हैं। वे overlapping but not identical data पर trained थे, different reward signals के साथ, उन teams द्वारा जिन्होंने अलग things emphasize किए। एक point जिसे एक model miss करता है, second model often catch करता है। उनके बीच disagreement वह signal है जो किसी single model alone से नहीं मिल सकता।

यह full multi-model recipe है, many documents पर refined और real practice से written. यह high-stakes version है; lighter single-model loop next subsection में है:

  1. जिस best model तक access है उससे start करें। "Best" का मतलब आपके kind of task पर strongest reasoning और long-output coherence वाला। Multiple signals use करें: public leaderboards starting point के रूप में (Arena, livebench, independent benchmarks), और representative sample पर अपनी quick A/B test. एक leaderboard पर anchor न करें; वे different things measure करते हैं, और preference-based rankings conversational charm को careful work से ज़्यादा reward करती हैं।
  2. Full context के साथ first draft generate करें। Colleague की तरह brief करें (concept 1), hard problems के लिए thinking mode on करें (concept 5), structure के लिए brainstorm-iterate loop use करें (concept 7)।
  3. उसी से अपने output को named criteria against 1 से 10 grade करवाएँ। "Is this good?" नहीं, बल्कि "clarity, accuracy, structure, और what is missing पर score करें, 1-10 each, हर score के लिए one-sentence justification के साथ।" First grade usually 7 या 8 होती है।
  4. उसी से अपनी suggestions implement करवाएँ। Repeat करें जब तक grade climb करना बंद न करे, जो usually 9 के around plateau करता है।
  5. Draft second model के पास ले जाएँ। Same rubric माँगें। Different model, different priors, different blind spots. Second model ऐसी चीज़ें catch करेगा जिन्हें first model ने खुद पर grade किया था, और exactly वही closed loop है जिससे escape चाहिए।
  6. Second model की critique first model के पास वापस लाएँ। Honestly frame करें: "another model produced this critique. Evaluate which points are worth adopting, and why. Reject anything you disagree with, and explain." First model adjudicate करता है। आप adjudication watch करते हैं।
  7. High-stakes work के लिए, different family के third model से repeat करें। Different family, different training data, different temperament. जब तक three models draft पर argue कर चुके हों, आपके पास इस technology द्वारा offered triangulated truth के सबसे करीब चीज़ होती है।
  8. जब score two independent models across target cross कर जाए तो stop करें। Primary model alone का 9.5, primary plus different model का 9 जैसा नहीं है। Second number ही matter करता है।

Single-model self-critique loop, by itself

ऊपर के Steps 3 और 4 अपने आप usable हैं, कभी second model लाए बिना। Many tasks multi-model overhead justify नहीं करते लेकिन फिर भी one round of "score this 1-10 against this rubric, then implement your own suggestions" से benefit लेते हैं। Weekly status update, slightly tricky email, one-page memo: ये सब one self-critique pass से visibly better हो जाते हैं।

Higher-leverage variant: numerical target set करें और model को autonomously उसकी तरफ iterate करने दें। "score this and tell me what's missing" के बजाय try करें: "iterate against your own rubric until you reach 9.5 across all criteria, then show me the final version." Model grade, revise, regrade, revise करता रहेगा (single response में five या six rounds) और target hit या plateau होने पर ही आपके पास वापस आएगा। यह हर round manually drive करने से dramatically faster है, और long-form artifacts (5,000-word memo, chapter, comprehensive plan) के लिए especially well work करता है जहाँ hand से round-tripping tedious होता। Target खुद steering mechanism है: 9 अलग ceiling force करता है than 9.5, और 10 model को improve करने की चीज़ें तब तक find करवाता है जब तक genuinely कुछ न मिले।

यह concept 6 को contradict करता लग सकता है, जिसने warn किया था कि model अपनी work grade करते हुए sycophancy की तरफ जाता है। Difference rubric है। Rubric के बिना, "is this good?" का answer "great work!" आता है, और यही closed loop concept 6 में था। Named criteria scored 1-10 के साथ, model को point करना पड़ता है कि other points में क्या missing है, और वही pointer है जिसके against आप implement करते हैं। Rubric self-grade को sycophancy से forcing function में बदलता है।

Page अब same DNA के three nested versions offer करता है। Job के लिए lightest one pick करें:

Cross-model technique के तीन nested versions, left to right increasing complexity के साथ। Level 1: Concept 6 rubric critique - one pass, stop there - quick sanity checks के लिए। Level 2: Single-model self-critique loop - score, implement, repeat, plateau around 9 - drafts और emails के लिए। Level 3: Multi-model loop - self-critique loop plus second और third model cross-checking - high-stakes work के लिए। जब wrong होना expensive होता जाए, lighter से heavier पर graduate करें।

Lighter version से heavier one पर तब graduate करें जब wrong होना more expensive हो जाए, या single-model grade around 9 plateau करे और आप जानना चाहें कि 9 actually 9 है या नहीं।

Grade क्यों matter करता है। Model से number force करना number के बारे में नहीं है। यह उस बारे में है जो number produce करने के लिए चाहिए। जिस model को आपके draft को 7/10 score करना है, उसे name करना पड़ेगा कि बाकी 3 points में क्या missing है। Score के बिना, "this is pretty good" review बनकर pass हो जाता है। Score के साथ, "pretty good" को "structure पर 1 point lose करता है क्योंकि third section second को repeat करता है; evidence पर 2 points lose करता है क्योंकि three claims के पास source नहीं" बनना पड़ता है। Grade specificity के लिए forcing function है, और specificity वह है जिस पर आप act कर सकते हैं। यह iteration N को iteration N+1 against compare करने के लिए भी only readable signal है।

Honest caveat. Three models फिर भी same thing पर all wrong हो सकते हैं। वे आपकी guess से ज़्यादा training data share करते हैं, और contested या sparse-data topics (concept 2) पर अक्सर same misconceptions share करते हैं। Score progress signal है, truth signal नहीं। High-stakes content (anything legal, medical, financial, या real person के बारे में) के लिए no number of cross-model passes load-bearing claims पर human expert review replace नहीं करता। Models craft के लिए एक-दूसरे को check करते हैं। Humans facts check करते हैं जो matter करते हैं।

Loop कब skip करें।

हर task इसे earn नहीं करता। Short email, quick lookup, casual brainstorm: single-model fine है। Multi-model cross-check उस work के लिए save करें जहाँ wrong होना expensive है: memo जो boss पढ़ेगा, chapter जो publish होगा, decision जो other people को affect करेगा, contract जिसे आप sign करेंगे। Rule of thumb: अगर thoughtful colleague इस पर two hours review spend करता, तो यह loop earn करता है।

Non-software example. Client board के लिए 40-page strategy memo prepare कर रही consultant ने अपने strongest model में draft किया और उसके own grades के against iterate किया जब तक वे 9 पर plateau नहीं हुए। फिर उसने full memo second model में paste किया और same rubric माँगा। Second model ने उसे 7.5 दिया और eleven specific issues list किए, जिनमें से three primary model ने अपने self-grading rounds में कभी raise नहीं किए थे। उसने वे first model को adjudicate करने के लिए वापस दिए; उसने seven adopt किए और four reasons के साथ reject किए। Third model ने two more surface किए। Point final scores नहीं है। Point यह है कि वह counter-arguments जिन्हें वह अपने आप कभी नहीं देखती, क्योंकि primary model उसके blind spots share करता था, board meeting से पहले memo में थे।


Prompts try करने से पहले short recap

Thirteen concepts बहुत हैं। Page का shape, हर concept के लिए one line:

  • Concept 1. Novice prompt और power-user prompt के बीच gap कुछ habits का है: AI को smart new colleague की तरह brief करें, context, constraints, और clear ask के साथ।
  • Concept 2. AI internet के snapshot से चीज़ें जानता है, इसलिए common topics पर strong और obscure या recent ones पर weak है।
  • Concept 3. Three retrieval modes: pretrained, web search, deep research. आपकी wording steer करती है कौन सा fire होता है।
  • Concept 4. Answer quality का single biggest determinant है कि आप up front कितना relevant context load करते हैं।
  • Concept 5. Modern models seconds या minutes तक hard think कर सकते हैं, अगर आप उनसे कहें।
  • Concept 6. Models agreement की तरफ biased हैं; neutral framing और rubrics उस bias का most neutralize करते हैं।
  • Concept 7. Iterate-with-explicit-feedback loop page की highest-leverage habit है।
  • Concepts 8–10. AI images देख सकता है, audio के साथ दोनों directions में work कर सकता है, small apps build कर सकता है, और आपके data पर code run कर सकता है।
  • Concept 11. File-aware desktop apps की नई category है। Permissions tightly scope करें जब तक आपने उन्हें safely use न किया हो।
  • Concept 12. Job के लिए right tool हर few months में बदलता है। Two tabs open रखें।
  • Concept 13. जब room में human expert नहीं है, models से एक-दूसरे को grade करवाना objective quality signal के सबसे करीब है।

इन सबके नीचे एक move है, dozen disguises में repeated: सही context अंदर लाएँ, गलत context बाहर रखें। अगर इस page से एक single thing याद रहे और वही sentence हो, तो भी आप users के top quartile में होंगे।


अभी try करें: Thinking Baseline से पहले eleven prompts

Reading trying का placeholder है। दूसरे tab में Claude, ChatGPT, या Gemini open करें। ये eleven prompts order में run करें। Total लगभग twenty-five minutes लगेंगे और इस page के हर concept को exercise करेंगे।

1. Web-search trigger. AI को training data छोड़कर current info look up करने पर force करता है।

What major news happened today in [your country]? Cite each claim
with a source link. Flag any claim you can't support with a citation
as "unverified".

2. Pretrained-only question. Common-knowledge, no lookup needed. Fast और confident होना चाहिए।

Why do cats stare at walls? Two-paragraph answer.

3. Context-rich personal prompt. Constraints up front load करने की practice.

Plan a 15-minute home workout for me. Constraints: I have a
trampoline and a cat, no squats (bad knee), I hate sticking to
plans for more than three days, and I want to feel slightly
silly while doing it. Give me 3 options, no commentary.

4. Neutral-framing rewrite. Prompt में अपनी bias spot करने की practice.

The question I want to ask is: "Don't you think four-day work
weeks are obviously better for everyone?" Rewrite this as a
neutral question that doesn't signal what answer I want.
Then answer the rewritten version.

5. Three-options brainstorm with iteration. Core power-user loop.

Round 1: I want to start a small side project that takes about
3 hours per week and might make money in a year. I'm a [your
profession] who likes [your hobby]. Give me 5 different ideas,
one line each. Don't expand any of them.

(Read the 5. Pick what you like and don't like. Then, in the
SAME conversation:)

Round 2: I reject options [N] and [N] because [reason]. I like
the [keyword] idea but I want it to use less [thing]. Give me
5 new options that incorporate this feedback.

6. Outline-first writing. Prose से पहले structure force करें।

I want to write a 600-word post about [a topic you care about].
Don't write it yet. Give me 3 different outline options, each
with 4-6 headings. One line per heading.

7. Think-hard reasoning prompt. Real personal decision use करें।

I'm choosing between [Option A] and [Option B] for [real personal
decision in your life]. Here's the relevant context: [a paragraph
of context]. Think hard before answering. Tell me:
1. The 3 trade-offs that actually matter.
2. Which you'd choose and why.
3. Under what conditions your recommendation would flip.

8. Objective-rubric critique. अपने work पर sycophancy avoid करें।

I'm pasting in something I wrote: [paste anything 100-300 words].

Critique it using these 4 criteria, each scored 1-5 with a
one-sentence reason:
- Does it have a clear central claim?
- Is each paragraph in the right order?
- Are there any sentences that could be cut without loss?
- Does the ending earn the time the reader spent getting there?

Then suggest the smallest change that would lift the lowest score.

9. Image-input task. AI को photo read करने के लिए देने की practice.

[Upload any handwritten note, receipt, or whiteboard photo]

Transcribe what's written. Then summarize what it's about in
3 bullets. Flag anything you couldn't read with confidence.

10. Small-app prompt. Goal/Input/Output shape की practice.

Build me a Pomodoro timer.
Goal: 25-minute work sessions, 5-minute breaks.
Input: I press start.
Output: Visible timer counting down, a satisfying click when
each cycle ends, a yellow theme. Show me the working version.

11. Cross-model review. Real draft पर multi-model habit की practice. दो AI tools एक साथ open चाहिए।

Take any 200-300 word draft you wrote recently (an email, a memo, or a paragraph from one of these exercises).

Step 1: In your primary AI tool, paste the draft and ask: "Score this 1-10 on clarity, structure, evidence, and what's missing. One-sentence justification per score."

Step 2: Open a second AI tool. Paste the same draft, ask the same question.

Step 3: Compare the two scores and the two critiques side by side. Note any point only one of them caught. Those are the points the cross-model loop pays for.

अब आप जानते हैं कि ये tools क्या कर सकते हैं। क्या आप उन्हें direct करने के लिए clear enough think कर सकते हैं, यह separate question है, और Part 0 उसी question पर बना है।

Start करने से पहले frequently asked questions

क्या Part 0 exercises करने के लिए paid plan चाहिए? ChatGPT, Claude, और Gemini की free tiers Thinking Baseline और most chapter exercises के लिए enough हैं। Paid plan help करता है अगर आप बहुत deep research करते हैं या session में many files attach करते हैं। Free से start करें; upgrade सिर्फ़ तब करें जब usage limits block करने लगें।

एक tool use करूँ या three? Daily use के लिए एक default pick करें, लेकिन comparison के लिए at least one other install रखें। Second tool रखने का point twice work करना नहीं है; यह tiebreaker रखना है जब first tool कुछ ऐसा दे जो right feel न करे।

मेरी company ChatGPT block करती है। Exercises के लिए क्या करूँ? जो भी modern AI tool आपकी company permit करती है, उसे use करें। Part 0 की skills किसी भी text-in, text-out AI पर transfer होती हैं। अगर कुछ भी permitted नहीं है, chapter exercises के लिए personal device पर personal account use करें (Part 0 के deliverables thinking के बारे में हैं, company data के बारे में नहीं)।

Thinking Baseline के लिए AI use करना cheating है? हाँ, और इससे सिर्फ़ आपका नुकसान होगा। Baseline ungraded है। इसका only purpose honest snapshot capture करना है जिसे आप later compare कर सकें। AI-boosted baseline आपको misleadingly high starting point देता है और growth के evidence erase कर देता है।

अगर मैं इस page की recipes भूल जाऊँ तो? Page bookmark करें। Recipes (iterate loop, rubric pattern, neutral-rephrase trick) lookup करने के लिए designed हैं, memorize करने के लिए नहीं। Memorize करने लायक only thing single sentence है: सही context अंदर लाएँ, गलत context बाहर रखें।

AI इतना capable है तो Part 0 thinking पर इतना time क्यों spend करता है? क्योंकि direction के बिना capability waste multiply करती है। AI से confidently wrong analysis no analysis से ज़्यादा dangerous है, क्योंकि वह finished दिखती है। Part 0 वह judgment train करता है जो decide करता है कि AI जो produce करता है उसका क्या करना है। AI-saturated workplace में वही judgment सबसे valuable skill है, और most curricula उसे entirely skip करते हैं।

First week में watch करने वाली common mistakes
MistakeSymptomFix
AI को search engine की तरह treat करनाShort prompts, shallow answers, repeated frustrationAI को colleague की तरह brief करें: context, files, constraints, ask.
One conversation को forever accumulate होने देनाAnswers time के साथ vaguer होते जाते हैंTopic बदलते ही new conversation start करें।
First try में final draft माँगनाPolished output, hollow contentपहले outline, outline critique, bullets तक expand, फिर draft.
Bait phrasings without realizingAI आपकी implied बात से agree करता हैभेजने से पहले neutral questions के रूप में rewrite करें।
Critiques पर rubric skip करना"Great work!" with no specificsObjective yes/no criteria दें; criterion per scores माँगें।
Confidence को accuracy माननाObscure topics पर surprising errorsपूछें "आपको यह कैसे पता होगा?" High-stakes claims primary sources against verify करें।
Day one पर broad permissions approve करनाFiles lost, edits overwrittenFolders tight scope करें। Scope सिर्फ़ track record के साथ grow करें।

ये character flaws नहीं हैं। ये habits हैं जिन्हें users की first generation (आप सहित) scratch से build कर रही है। इन्हें एक बार catch करना अक्सर stick करता है।

इस page ने इन tools को use करने की mechanics सिखाई। Part 0 वह discipline सिखाता है जिससे mechanics payoff देती हैं:

  • Chapter 1 (Asking Better Questions) concept 6 का deeper version है: ऐसे questions formulate करना जो वह surface करें जो आप already नहीं जानते।
  • Chapter 2 (Detecting Broken Reasoning) concept 2 का deeper version है: confident AI answers correct answers जैसे नहीं होते, और failures catch करने की repeatable techniques हैं।
  • Chapter 6 (Working With AI, Not For AI) concept 7 का deeper version है: brainstorm-iterate loop much larger collaboration playbook में सिर्फ़ one move है।
  • Other chapters वे skills cover करते हैं जिन्हें mechanics page touch नहीं करता: systems thinking, first principles reasoning, ethical reasoning, decision-making under uncertainty, और learning how to learn.

जब ready हों, Part 0: सोच ही curriculum है पर जाएँ और Thinking Baseline से start करें: आपकी current thinking skills का 30-minute ungraded snapshot, किसी training से पहले। Chapter 10 के बाद आप same assessment repeat करेंगे और compare करेंगे। इसे skip न करें। Judgment के बिना power tools confident mistakes faster करते हैं, और baseline ही honest तरीका है measure करने का कि आपकी judgment improve हो रही है या नहीं।