क्या यह एक Agent Problem है? एक Crash Course

3 Gates · 3 Wrong Turns · One Clear Path

दो लोग मिलकर एक छोटी online shop चलाते हैं। सोमवार को दोनों को वही एक काम मिलता है: 400 customer messages का ढेर जमा हो गया है, और उन्हें इन messages को groups में sort करना है (complaints, questions, orders, other) और शुक्रवार तक एक छोटा summary लिखना है।

Ana किसी भी tool को खोलने से पहले रुककर दस minutes सोचती है। वह खुद से तीन simple सवाल पूछती है। पहला: क्या यह सच में AI का काम भी है, या message app का अपना search और filter ही इसे कर सकता है? Groups बनाने के लिए judgment चाहिए (यह तय करना कि किसे "complaint" मानें, यह काम कोई simple filter नहीं कर सकता), तो हाँ, यह AI का काम है। दूसरा: क्या वह इसे एक बार करेगी या हर हफ़्ते? हर हफ़्ते। इसलिए वह note बना लेती है कि बाद में कुछ ऐसा build करेगी जो यह काम खुद-ब-खुद कर दे, और फिलहाल शुक्रवार की deadline पूरी करने के लिए हाथ से एक quick version कर लेती है। तीसरा: finished काम कैसा दिखना चाहिए? हर message के लिए एक row वाला एक spreadsheet, साथ में एक one-page summary. वह AI tool तब खोलती है जब उसे ठीक-ठीक पता होता है कि उसे क्या चाहिए।

Yusuf तुरंत AI tool खोलता है और type करता है, "help me with these customer messages." Tool उससे पूछता है कि उसे क्या चाहिए। उसे ठीक से पता नहीं, इसलिए वह चलते-चलते सोचता जाता है। दो घंटे बाद उसके पास एक ऐसा summary है जिस पर वह भरोसा कर सके या नहीं, यह उसे यकीन नहीं; अगले हफ़्ते इस काम को दोहराने का कोई तरीका नहीं; और अगले सोमवार वही ढेर फिर उसका इंतज़ार कर रहा होगा, जिसे वह फिर हाथ से ही sort करेगा।

वही काम। वही tool. Ana ने कुछ भी type करने से पहले काम को तीन gates से गुज़ारा। Yusuf सीधे tool में घुस गया और सवाल tool को पूछने दिए। यह course वही तीन gates सिखाता है।

यह किसके लिए है

हर वह व्यक्ति जिसके पास इनमें से कोई एक AI tool है (Claude Code, OpenCode, Cowork, या OpenWork) और असली काम का ढेर है, और जिसे हमेशा यकीन नहीं रहता कि यह tool ही उस काम के लिए सही जगह है। यह course बीच में बैठता है: इन tools से मिल लेने और यह देख लेने के बाद कि वे क्या कर सकते हैं, लेकिन इनसे असली problems solve करना सीखने से पहले। यह तय करने के बारे में है कि tool को क्या देना है, और काम कहाँ जाना चाहिए।

हर जगह के पाठकों के लिए एक किताब

यह किताब दुनिया भर में पढ़ी जाती है, उन लोगों द्वारा जो कई अलग-अलग भाषाओं में काम और पढ़ाई करते हैं। इस page के examples plain English और रोज़मर्रा की situations use करते हैं (एक छोटी shop, files का एक folder, messages का एक ढेर) जिनका मतलब वही रहता है, चाहे आप कहीं भी रहते हों। साथ चलने के लिए आपको किसी एक देश के tools, कानून, या पैसे के बारे में जानने की ज़रूरत नहीं।

एक quick reminder: "agent" क्या होता है?

General agent एक ऐसा AI tool है जो सिर्फ़ बात नहीं करता, बल्कि काम करता है। यह आपकी files खोल सकता है, उन्हें पढ़ सकता है, नई files लिख सकता है, छोटे programs run कर सकता है, और आपके लिए दूसरे apps use कर सकता है। इस किताब के चार general agents हैं Claude Code, OpenCode, Cowork, और OpenWork; Claude Code और OpenCode उन लोगों के लिए हैं जो code के साथ काम करते हैं, जबकि Cowork और OpenWork बाकी सबके लिए हैं। याद रखने का छोटा तरीका: chatbot आपके सवाल का जवाब देता है; agent जाकर काम कर देता है। पूरा course इसी एक फ़र्क पर बना है।

Prerequisites

इस page से पहले दो चीज़ें। पहली, How to Think in the AI Era पूरा करें; यह आपको सिखाता है कि AI के साथ काम करते हुए अपनी judgment कैसे बनाए रखें। यह course उसे दोहराता नहीं। दूसरी, कम से कम एक tool course पूरा करें, Claude Code & OpenCode या Cowork & OpenWork, ताकि आपने देख लिया हो कि agent क्या कर सकता है। जब तक आपको पता न हो कि agent क्या है, आप यह तय नहीं कर सकते कि "यह agent वाला problem है या नहीं"।

📚 Teaching Aid

Open Full Slideshow

View Full Presentation: क्या यह एक Agent Problem है?

एक line में नियम

सबसे सस्ती गलती वही है जिसे आप शुरू करने से पहले पकड़ लेते हैं।

इसका मतलब यह है। आपके plan की गलती को सुधारने में कुछ खर्च नहीं होता, आप बस अपना इरादा बदल देते हैं। लेकिन जो गलती आप तब notice करते हैं जब agent एक घंटा गलत काम कर चुका होता है, वह आपका पूरा घंटा ले लेती है। इसलिए अपनी मेहनत लगाने की सबसे समझदार जगह बिल्कुल शुरुआत है, कुछ भी type करने से पहले।

Agent के साथ जो कुछ भी गलत होता है, उसका लगभग सब कुछ यहीं, शुरुआत में ही गलत हुआ था:

आपने ऐसी चीज़ के लिए agent use किया जिसे spreadsheet एक ही step में कर देता है।
आपने वही task दो महीने तक हर हफ़्ते हाथ से किया, जबकि आप कुछ ऐसा build कर सकते थे जो यह आपके लिए कर देता।
आपने agent को इस धुँधले अंदाज़े के साथ खोला कि आपको क्या चाहिए, इसलिए उसने साफ़-सुथरा काम किया, पर गलत चीज़ पर।

इनमें से कोई भी गलत typing से नहीं होता। ये सब गलत जगह से शुरू करने से होते हैं। कितनी भी चतुर wording इन्हें ठीक नहीं करती, क्योंकि गलत सवाल का perfect जवाब भी गलत ही रहता है। यह course आपको तीन checks देता है (हम इन्हें gates कहते हैं) जिनसे आप शुरू करने से पहले अपना काम गुज़ारते हैं। हर gate एक common गलती रोकता है।

तीन gates, और हर जवाब आपको कहाँ भेजता है। ज़्यादातर बर्बाद हुआ समय सीधे आख़िर पर कूद जाने से आता है।

तीन gates, order में:

Gate	सवाल	यह कौन सी गलती रोकता है
1	क्या इसके लिए सच में agent चाहिए?	बड़े tool को छोटे काम पर लगाना, या छोटे tool को बड़े काम पर
2	एक बार, या हर हफ़्ते?	एक बार के काम के लिए helper बनाना, या दोहराने वाले काम को हमेशा हाथ से करना
3	"finished" कैसा दिखता है?	गलत target पर लगाया गया साफ़-सुथरा काम

इन्हें order में लें। Gate 2 तभी matter करता है जब Gate 1 कहे "हाँ, agent।" Gate 3 तभी matter करता है जब Gate 2 कहे "इसे अभी करना है।" कोई gate skip करें और आप उसी की गलती कर बैठते हैं।

इस page को कैसे पढ़ें

आपके पास कितना समय है	क्या पढ़ें
15 minutes	नियम, ऊपर वाली picture, और हर gate के नीचे का छोटा summary। आपके अगले task को sort करने के लिए इतना काफ़ी।
45 minutes	तीनों gates examples के साथ, सिर्फ़ पढ़ना।
एक पूरा working day (सबसे अच्छा)	सब कुछ, हर "your turn" को अपने हफ़्ते के किसी असली task पर try करते हुए।

ये gates तब टिकते हैं जब आप इन्हें अपने काम पर try करते हैं। पढ़ना आपको moves दिखा देता है। इन्हें तीन असली tasks पर करना, यही इन्हें आदत बनाता है।

छोटा version (तीन bullets)

अगर आप सिर्फ़ इन तीन को याद रखें, तो जो सबसे ज़रूरी है उसका ज़्यादातर हिस्सा आपके पास है:

हर काम AI का काम नहीं होता, और हर AI काम के लिए agent नहीं चाहिए। अगर कोई spreadsheet, कोई search box, या आपके अपने तीस seconds इसे कर देते हैं, तो वही करें। अगर आपको सिर्फ़ एक जवाब चाहिए, तो वह chatbot है। Agent उस काम के लिए है जो fuzzy हो, अलग-अलग तरह की files में फैला हो, और जिसमें tool को आपकी files, data, या apps के साथ सच में कुछ करना पड़े, सिर्फ़ उनके बारे में बात नहीं करनी।
आप इसे कितनी बार करते हैं, यही सब कुछ तय करता है। ऐसा task जो आप एक बार करते हैं → agent खोलें, हल करें, हो गया। ऐसा task जो आप हर हफ़्ते, उसी तरीके से करते हैं → इसे हाथ से करना बंद करें और एक helper build करें जो इसे आपके लिए कर दे। दुनिया की सबसे common बर्बादी यही है: एक "helper-बनाने-लायक" task को बार-बार हाथ से करते रहना।
Agent खोलने से पहले तय करें कि "finished" कैसा दिखता है। तीन चीज़ें नाम से बताएँ: यह किस चीज़ से काम करता है, आख़िर में आपको क्या चाहिए, और वह एक check जो बताए कि यह सही है। साफ़ target वाला agent उसे hit करता है। Fuzzy target वाला agent कुछ साफ़-सुथरा और गलत बना देता है।

बाकी का page इन तीन को ऐसे gates में बदल देता है जिन्हें आप सच में चला सकते हैं।

Gate 1 — क्या इसके लिए सच में agent चाहिए?

यह कौन सी गलती रोकता है: "मैंने बीस minutes लगाकर agent से ऐसा कुछ करवाया जिसे spreadsheet एक ही step में कर देता है, या मैंने सिर्फ़ ऐसा सवाल पूछने के लिए पूरा agent खोल लिया जिसका जवाब chatbot पाँच seconds में दे देता है।"

इस gate में दो छोटे checks हैं, order में।

Check 1a — क्या इसके लिए AI चाहिए, या कोई regular tool जो आपके पास पहले से है?

Agents fuzzy काम में अच्छे होते हैं: ऐसा काम जिसमें judgment चाहिए, जो अलग-अलग तरह की files को mix करता है, और जिसे करने के लिए कोई normal app बनाया ही नहीं गया। जो काम कोई regular tool पहले से perfectly कर देता है, उसके लिए वे सबसे अच्छा choice नहीं हैं।

यह रहा simple test। अगर आप task को एक ऐसे exact step के रूप में बता सकते हैं जो हर बार वही रहता है, तो regular tool शायद ज़्यादा तेज़ और ज़्यादा reliable है:

"इस column के numbers जोड़ दें।" → यह spreadsheet का काम है। AI नहीं।
"मेरे contacts में Khan नाम के सभी लोगों को ढूँढें।" → यह आपके contacts app का search box है। AI नहीं।
"इस document में हर '2024' को '2025' में बदल दें।" → यह find-and-replace है। AI नहीं।

जिस पल task को judgment चाहिए (जैसे "इन messages को topic के हिसाब से sort करें," जहाँ आपको तय करना पड़ता है कि हर topic का मतलब क्या है), या वह अलग-अलग तरह की files को mix करता है जिन्हें कोई single app एक साथ नहीं खोल सकती (photos और PDFs और screenshots), या बात बस इतनी है कि इसे करने वाला कोई app है ही नहीं, तब आप Check 1a से आगे निकल चुके हैं। यह AI का काम है।

Check 1b — क्या इसके लिए agent चाहिए, या बस एक chatbot?

यह वह check है जिसे लोग सबसे ज़्यादा skip करते हैं। reminder box वाला नियम याद रखें: chatbot जवाब देता है, agent काम करता है।

तो पूछें: क्या इस task के लिए tool को मेरी असली चीज़ों को छूना पड़ता है?

"debit और credit के बीच का फ़र्क समझाएँ।" → इसके लिए एक जवाब चाहिए। यह आपकी किसी चीज़ को नहीं छूता। यह chatbot का काम है। अच्छे chatbot जवाब पाने की skill है How to Think in the AI Era, यह course नहीं।
"मेरे 400 customer messages को देखें और हर एक को किसी group में रखें।" → इसके लिए tool को आपकी असली files खोलनी और उन पर act करना पड़ता है। यह agent का काम है।

पूरा फ़र्क है answer बनाम action। अगर आपको बस कुछ जानना है, या draft या कुछ ideas चाहिए, तो वह answer वाला काम है, यानी chatbot। अगर आपको tool से अपनी files खुलवानी हैं, उन्हें बदलवाना है, कुछ run करवाना है, या आपके लिए कोई दूसरा app use करवाना है, तो वह action वाला काम है, यानी agent।

A funnel. काम का एक टुकड़ा Check 1a ("क्या कोई regular tool इसे पहले से कर देता है?") से मिलता है; हाँ "Spreadsheet / search / find-replace / बस कर दें" की ओर निकलता है। नहीं Check 1b ("क्या इसे मेरी files, data, या apps पर act करना पड़ता है?") में गिरता है; नहीं "एक chatbot (बस एक जवाब)" की ओर निकलता है। हाँ "Agent job: Gate 2 पर जाएँ" में गिरता है। दो छोटे सवाल, तीन exits। सिर्फ़ सबसे नीचे वाला agent है।

पहले एक रोज़मर्रा का example

खाना पकाने के बारे में सोचें। "अंडा कितनी देर उबालूँ?" एक जवाब है; आप पूछते हैं, एक number मिलता है, हो गया। यह chatbot है। लेकिन "मेरे fridge में देखें, जो कुछ है उसे देखें, और इस हफ़्ते के तीन dinners के लिए एक shopping list बनाएँ" के लिए किसी को सच में जाकर कई चीज़ें करनी पड़ती हैं। यह वैसा ही task है जिसके लिए agent होता है। और "मेरे grocery receipt पर prices जोड़ दें" इनमें से कोई नहीं है; यह तो बस एक calculator है।

एक काम का example

Mei एक छोटी company का office चलाने में मदद करती है। एक ही सुबह चार काम आते हैं। वह हर एक को Gate 1 से गुज़ारती है:

"expenses की इस list का total क्या है?" → spreadsheet इसे जोड़ देता है। AI भी नहीं। 1a पर ही रुक जाएँ।
"purchase order क्या होता है, यह समझाएँ।" → उसे बस एक जवाब चाहिए; यह उसकी किसी चीज़ को नहीं छूता। Chatbot। 1b पर रुक जाएँ।
"bills के इस folder को देखें और वे ढूँढें जिन पर signature नहीं है।" → इसके लिए judgment चाहिए (हर एक को पढ़ना) और यह उसकी files पर act करता है। Agent। Gate 1 पास।
"bank की payments की list की हमारी अपनी list से तुलना करें और बताएँ कि क्या match नहीं होता।" → दो अलग files, judgment चाहिए, उसके data पर act करता है। Agent। Gate 1 पास।

उसके चार "AI tasks" में से दो agent के tasks थे ही नहीं। यह normal है और अच्छा है। Gate 1 इसलिए नहीं है कि काम को agent की तरफ़ धकेले। यह इसलिए है कि जो काम वहाँ का नहीं है, उसे वहाँ पहुँचने से रोके।

अब आपकी बारी

अपने हफ़्ते से पाँच tasks लें, कुछ भी जिसके लिए आपने "AI से पूछने" की बात सोची हो। हर एक के लिए लिखें कि वह कौन सा exit लेता है: regular tool, chatbot, या agent। फिर एक छोटा sentence लिखें कि क्यों।

1Your Work

अपने पाँच tasks नीचे list करें। Grader आपकी sorting को rate करता है और वह task flag करता है जिसे आपने सबसे ज़्यादा संभावना से गलत किया, खासकर "agent" को भेजा गया कोई task जिसे असल में बस एक जवाब चाहिए।

आपके पाँच tasks, हर line पर एक। हर एक के लिए: task, उसका exit (regular tool / chatbot / agent), और एक reason (जैसे 'इसे spreadsheet कर देता है', 'बस एक जवाब चाहिए', 'tool को मेरी files पर act करना पड़ता है')।

2Get Your Score

Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.

अगर पाँचों "agent" निकलें, तो आप शायद इसे ज़बरदस्ती कर रहे हैं; फिर से देखें और वह एक ढूँढें जो असल में spreadsheet या chatbot है। अगर कोई भी "agent" न निकले, तो यह भी एक असली finding है। हो सकता है इस हफ़्ते में agent-shaped काम था ही नहीं। यह ठीक है।

यह क्यों काम करता है (इसके पीछे का research) — optional

हर काम के लिए एक पसंदीदा tool की ओर हाथ बढ़ाने की आदत का एक नाम है। Abraham Kaplan ने 1964 में इसे law of the instrument कहा, और Abraham Maslow ने दो साल बाद इसे इसका मशहूर रूप दिया: अगर आपके पास सिर्फ़ एक hammer है, तो हर problem कील जैसी दिखने लगती है। Agent एक powerful, रोमांचक tool है, इसलिए वह नया hammer बन जाता है, और Gate 1 वह आदत है जो आपको उसे किसी पेंच पर चलाने से रोकती है।

इसी idea का एक नापा-तौला version भी है। Goodhue और Thompson के Task-Technology Fit model (1995) ने पूछा कि कुछ software असल में लोगों के काम को बेहतर क्यों बनाता है जबकि कुछ नहीं, और पाया कि फ़ायदा इस पर कम depend करता है कि tool कितना अच्छा या popular है, और इस पर ज़्यादा कि वह task के साथ fit होता है या नहीं। गलत task पर लगाया गया कोई पसंदीदा tool कम देता है; fit होने वाला कोई साधारण tool बहुत देता है। Gate 1 task-technology fit को दो सवालों में सिकोड़ देता है जिनका जवाब आप दस seconds में दे सकते हैं।

Sources: Kaplan, A. (1964). The Conduct of Inquiry. Maslow, A. (1966). The Psychology of Science. Goodhue, D. L., & Thompson, R. L. (1995). "Task-Technology Fit and Individual Performance," MIS Quarterly, 19(2), 213–236.

Gate 2 — एक बार, या हर हफ़्ते?

यह कौन सी गलती रोकता है: "मैंने ऐसी चीज़ के लिए एक पूरा permanent helper बना डाला जिसे मैं ठीक एक बार ही करूँगा, या, इससे कहीं ज़्यादा बार, मैंने वही task महीनों तक हर हफ़्ते हाथ से किया, और कभी notice ही नहीं किया कि मैं इसे करने के लिए एक helper बना सकता था।"

जब Gate 1 कह दे "हाँ, agent," तो अगला सवाल है कि यह किस तरह का agent काम है। यह पूरी किताब का सबसे ज़रूरी idea है, इसलिए हम दोनों तरह के कामों को नाम देते हैं।

Mode 1 और Mode 2, सरल शब्दों में

Mode 1 — एक बार हल करें। आप agent खोलते हैं, task करते हैं, result लेते हैं, और चले जाते हैं। पीछे कुछ नहीं रहता। ज़्यादातर काम, ज़्यादातर वक़्त, यही होता है।
Mode 2 — एक helper build करें। आप एक permanent AI worker बनाते हैं जो यह task बार-बार, खुद, हर बार आपके किए बिना कर देता है। (किताब इस worker को Digital FTE कहती है: एक "digital full-time employee".) इसे set up करने में ज़्यादा मेहनत लगती है, और यह तभी worth है जब task बार-बार लौटता हो।

कैसे पहचानें कि आप किसके सामने हैं? तीन चीज़ें check करें। हर एक को एक ऐसे dial की तरह सोचें जिसे आप ऊपर या नीचे कर सकते हैं। कोई task Mode 2 तभी होता है जब तीनों dials ऊपर किए गए हों:

कितनी बार? क्या आप इसे एक बार या कभी-कभार करते हैं (dial नीचे → Mode 1), या बार-बार, हर हफ़्ते या हर दिन (dial ऊपर → Mode 2)?
कितना एक जैसा? क्या यह हर बार एक ही shape का होता है, यानी एक ही तरह का input, वही steps, वही finished result (dial ऊपर → Mode 2)? या हर बार अलग दिखता है और नई सोच माँगता है (dial नीचे → Mode 1)?
Worth है? क्या काम इतना बड़ा है कि helper बनाने की मेहनत वसूल हो जाए (dial ऊपर → Mode 2)? सिर्फ़ यह न तौलें कि यह कितनी बार होता है: हर run में आपका कितना समय लगता है, यह कितने items handle करता है, गलती कितनी महँगी पड़ेगी, और इसे करने के लिए दूसरा काम रोकने की झंझट कितनी है। ऐसा task जिसे आप हर हफ़्ते दोहराते हैं लेकिन जो चार minutes लेता है, दो items handle करता है, और छूट जाए तो कोई नुकसान नहीं करता, उसे build करना worth नहीं भी हो सकता। (यही वजह है कि gate का चटपटा नाम, "एक बार या हर हफ़्ते," सिर्फ़ trigger है; असली फ़ैसला इसी dial में रहता है।)

अगर एक dial भी नीचे है, यानी आप इसे कभी-कभार करते हैं, या यह हर बार बदलता है, या यह इतना छोटा है कि इसमें पड़ना बेकार है, तो Mode 1 में रहें। Helper तभी build करें जब task दोहराया जाने वाला, हर बार एक जैसा, और worth हो।

तीन dials: "कितनी बार?" (एक बार से हर हफ़्ते तक), "कितना एक जैसा?" (अलग से एक ही shape तक), और "Worth है?" (छोटे से बड़े या जोखिम भरे तक)। जब तीनों दाईं ओर इशारा करें, तो verdict है Mode 2, helper build करें। अगर कोई एक भी बाईं ओर इशारा करे, तो verdict है Mode 1, एक बार हल करें। Mode 2 के लिए तीनों dials ऊपर चाहिए। इनमें से कोई एक भी नीचे हो तो आप Mode 1 में ही रहते हैं।

सबसे महँगी गलती

Gate 2 को गलत करने के दो तरीके हैं। एक बार के काम के लिए permanent helper बनाना छोटी गलती है; आप एक दोपहर बर्बाद करते हैं, notice करते हैं, और आगे बढ़ जाते हैं।

महँगी गलती चुपचाप होती है, और लगभग हर कोई करता है: किसी Mode 2 task को बार-बार, हमेशा के लिए, हाथ से करते रहना।

यह छिपी रहती है क्योंकि हर बार छोटी लगती है। हर सोमवार आप पच्चीस minutes लगाकर agent से हफ़्ते के messages इकट्ठा करवाते हैं, उन्हें sort करवाते हैं, और एक summary लिखवाते हैं। हर बार यह ठीक चलता है। आप इसका कभी जोड़ नहीं लगाते। लेकिन एक साल में यह बीस घंटे से ज़्यादा हो जाता है, जो एक ऐसे task पर हाथ से लगे जो दोहराया जाने वाला है, हर बार एक जैसा है, और साफ़ तौर पर एक बार build करने लायक है। आपने helper कभी नहीं बनाया क्योंकि कोई एक सोमवार कभी इतना बड़ा नहीं लगा कि आप रुककर फ़ैसला करें।

इसका fix यह है कि फ़ैसले को एक deliberate check बनाएँ, न कि कोई ऐसी चीज़ जिसके महसूस होने का आप इंतज़ार करें। Randall Munroe का एक पुराना, मशहूर cartoon है जिसका नाम है "Is It Worth the Time?" (xkcd comic 1205)। यह एक simple table दिखाता है: अगर कोई task बार-बार दोहराता है, तो आप उसे करने वाली कोई चीज़ build करने में ठीक-ठाक समय लगा सकते हैं, और फिर भी कुल मिलाकर समय बचा सकते हैं। आपको exact numbers की ज़रूरत नहीं। आपको बस आदत चाहिए। तो यह रहा simple नियम:

जब आप वही task उसी तरीके से तीसरी बार करें, तो रुकें और Gate 2 चलाएँ। अगर तीनों dials ऊपर हैं, तो आप अब सच में कोई problem हल नहीं कर रहे; आप वही helper बन रहे हैं जिसे आपने अभी तक build नहीं किया। यही आपका संकेत है कि इसे एक worker में बदल दें।

एक काम का example

David एक 12-व्यक्तियों वाली company का रोज़मर्रा का काम चलाता है। दो tasks, जो दोनों दोहराने वाले दिखते हैं:

नए employee के लिए accounts और access set up करना। यह शायद कुछ-कुछ महीनों में एक बार होता है, और हर नया व्यक्ति थोड़ा अलग होता है: अलग role, अलग apps, अलग special cases। कितनी बार? कम। कितना एक जैसा? कम। दो dials नीचे। यह Mode 1 में रहता है: हर बार agent के साथ इसे नए सिरे से हल करें। कोई rigid helper तभी टूट जाएगा जब पहली बार कोई असामान्य व्यक्ति join करेगा।
सोमवार वाला message summary। हर हफ़्ते, एक ही तरह का input, वही finished result, और हर बार 25 minutes लेता है। कितनी बार? ज़्यादा। कितना एक जैसा? ज़्यादा। Worth है? हाँ। तीनों dials ऊपर। यह Mode 2 है। David की चाल है इसे एक worker में बदलना: method साबित होने तक इसे हाथ से हल करते रहें, फिर इसे promote करें ताकि यह उसके बिना चले। From One-Off to Worker आपको दिखाता है कि कैसे।

वही व्यक्ति, वही हफ़्ता, दो उलट जवाब। नए-employee वाला task दोहराने वाला दिखता है, लेकिन यह "कितना एक जैसा?" dial पर fail करता है। सोमवार वाला summary तीनों पर पास होता है। Gate 2 ही इन दोनों में फ़र्क बताता है, उससे पहले कि आप या तो पहले को ज़रूरत से ज़्यादा build कर बैठें या दूसरे को साल भर हाथ से करते रहें।

अब आपकी बारी

तीन tasks list करें जो आपने agent के साथ एक से ज़्यादा बार किए हैं। हर एक के लिए तीनों dials set करें (कितनी बार, कितना एक जैसा, worth है) और जवाब लिखें: Mode 1 या Mode 2।

1Your Work

अपने तीन tasks नीचे उनके dials और verdicts के साथ list करें। Grader जाँचता है कि आपकी dial settings हर Mode 1 या Mode 2 call को सच में support करती हैं या नहीं, और कोई भी ऐसा "Mode 2" task flag करता है जो असल में हर run इतना बदलता है कि उसे किसी rigid worker को सौंपा नहीं जा सकता।

आपके तीन tasks, हर एक का एक block: कितनी बार (low/high); कितना एक जैसा (low/high); worth है (no/yes); Verdict (Mode 1, या Mode 2 सिर्फ़ तब जब तीनों ऊपर हों); किसी भी Mode 2 के लिए, एक line कि इसे हाथ से करते रहने में आप क्या खोते हैं।

2Get Your Score

Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.

जो task आपको चौंकाता है, वही जिसे आप हाथ से करते आ रहे हैं और जो निकलता है Mode 2, वह इस पूरे page पर मिलने वाली सबसे कीमती चीज़ है। वे घंटे हैं जो आपको वापस मिलने वाले हैं।

यह क्यों काम करता है (इसके पीछे का research) — optional

Gate 2 नए कपड़ों में एक पुराना नियम है। Software में, Martin Fowler की Refactoring (1999) ने Rule of Three को popular किया, जिसका श्रेय वे Don Roberts को देते हैं: पहली बार आप कोई चीज़ करते हैं, तो बस कर देते हैं; दूसरी बार, दोहराने पर भी फिर कर देते हैं; तीसरी बार, आप रुकते हैं और reusable version बना लेते हैं। तीसरा दोहराव ही संकेत है, पहला नहीं, क्योंकि बहुत जल्दी बनाने का मतलब है pattern समझने से पहले गलत चीज़ बना लेना। यही ठीक-ठीक Gate 2 का trigger है: जब आप वही task उसी तरीके से तीसरी बार करें, तो रुकें और तय करें कि helper बनाना है या नहीं।

"worth है?" dial एक दूसरी मशहूर चेतावनी की गूँज है। Donald Knuth की वह बात कि premature optimization हर बुराई की जड़ है (1974) असल में मेहनत के बारे में है: किसी चीज़ को automatic बनाने में तब तक काम न झोंकें जब तक आपको पता न हो कि उसे automate करना worth है। ऐसे task के लिए permanent helper बनाना जिसे आप एक बार करेंगे, वही गलती उलटी है। और automate करना कब फ़ायदेमंद होता है, इसका मोटा-मोटा हिसाब Randall Munroe की "Is It Worth the Time?" table (xkcd 1205) में है: task जितनी बार दोहराता है, आप helper बनाने में उतना ज़्यादा समय लगाकर भी कुल मिलाकर समय बचा सकते हैं।

Sources: Fowler, M. (1999). Refactoring: Improving the Design of Existing Code (Rule of Three, attributed to Don Roberts). Knuth, D. E. (1974). "Structured Programming with go to Statements," ACM Computing Surveys, 6(4). Munroe, R. "Is It Worth the Time?", xkcd 1205.

Gate 3 — "finished" कैसा दिखता है?

यह कौन सी गलती रोकता है: "Agent ने प्यारा काम किया। बस वह काम वही नहीं था जो मुझे चाहिए था, और यह मुझे तभी पता चला जब वह पूरा हो चुका था।"

आप तय कर चुके हैं कि यह agent का काम है (Gate 1) और आप इसे एक बार हल करेंगे (Gate 2)। Agent खोलने से पहले आख़िरी gate: तय करें कि finished का मतलब क्या है, लिखकर, तीन छोटी lines में।

यह किस चीज़ से काम करता है (input)। ठीक-ठीक वह जिसे agent को देखना चाहिए: कौन सा folder, कौन सी files, कौन से messages। Specific रहें। "मेरी emails" बहुत धुँधला है। "पिछले 7 दिनों के मेरे Support folder के 400 messages" साफ़ है।
आख़िर में आपको क्या चाहिए (output)। वह चीज़ जो काम पूरा होने पर मौजूद हो: एक spreadsheet, एक one-page summary, rename की गई files का एक folder। सिर्फ़ topic नहीं, shape बताएँ।
वह check जिसका मतलब है काम हो गया (done-check)। वह एक चीज़ जिसे देखकर आप जान सकें कि काम finished और सही है। उदाहरण के लिए: "हर message ठीक एक group में है, और group की गिनतियाँ जुड़कर 400 बनती हैं।" जब यह सच हो, तो आप done हैं। जब न हो, तो नहीं।

बस इतना ही, तीन lines। आप अभी पूरी instructions नहीं लिख रहे, और आप agent को यह नहीं बता रहे कि काम कैसे करना है। आप सिर्फ़ target तय कर रहे हैं, ताकि जब agent उसे hit करे, तो आपको पता चल जाए।

यह prompt लिखने जैसा नहीं है

Gate 3 तय करता है कि finished कैसा दिखता है, यानी target। Agent को काम करते समय आप जो असली instructions देते हैं (request को कैसे phrase करना है, tables माँगना, result check करना) वे अगले course, Problem Solving with General Agents, में सिखाई जाती हैं। ऐसे समझें: Gate 3 है target चुनना। अगला course है उसे hit करना सीखना। Target यहाँ चुनें, फिर निशाना लगाना सीखने के लिए उस course पर जाएँ।

दो cards। भरा हुआ card, "Agent खोलने से पहले," इन्हें list करता है: WORKS FROM (Support में 400 messages, पिछले 7 दिन), WANT AT THE END (एक spreadsheet और एक one-page note), और DONE WHEN (हर message एक group में; गिनतियाँ जुड़कर 400)। खाली card, "ज़्यादातर लोग क्या लाते हैं," में तीन खाली lines और शब्द "कुछ नहीं" है। शुरू करने से पहले तीन lines। Agent ऐसा target hit कर सकता है जो उसे दिखता हो।

एक काम का example

शुरुआत वाली Ana पर लौटते हैं, अपने 400 customer messages के साथ। (उसके task का एक Mode 2 भविष्य है, लेकिन जब तक वह worker मौजूद नहीं है, वह इसे अब भी हर हफ़्ते एक बार हल करती है, इसलिए Gate 3 हर run पर लागू होता है।) Agent खोलने से पहले, वह तीन lines लिखती है:

Works from: पिछले 7 दिनों के मेरे Support folder के 400 messages।

I want at the end: हर message के लिए एक row वाला एक spreadsheet, जिसमें columns हों: किसने भेजा, date, group (इनमें से एक: complaint, question, order, other), और एक-line summary। साथ में एक one-page note जिसमें हर group की गिनती और तीन सबसे common complaints हों।

Done when: हर message ठीक एक group में है, group की गिनतियाँ जुड़कर 400 बनती हैं, और note के numbers spreadsheet से match करते हैं।

अब वह agent खोलती है। जब वह लौटता है, तो उसके पास यह जाँचने का exact तरीका है कि यह सच में finished है या नहीं, और done-check ("गिनतियाँ जुड़कर 400") ऐसी चीज़ है जिसे वह या agent seconds में confirm कर सकते हैं। Yusuf, जिसने agent को "help me with these messages" के साथ खोला था, उसके पास इनमें से कुछ नहीं था। ठीक इसीलिए उसका result ऐसा था जिस पर वह न भरोसा कर सकता था और न जाँच सकता था।

अब आपकी बारी

वह सबसे हालिया असली task लें जो आपने किसी agent को दिया, या वह अगला जो आप देने वाले हैं। तीन lines लिखें: works from, want at the end, done when। फिर done-check को गौर से देखें: क्या आप इसे सच में जाँच सकते हैं? क्या आप, या agent, इसे एक minute के अंदर confirm कर सकते हैं? अगर आपका done-check "summary अच्छा है" जैसा कुछ धुँधला है, तो यह अभी असली check नहीं है। इसे तब तक तेज़ करें जब तक यह ऐसा कुछ न बन जाए जिसे आप साफ़-साफ़ test कर सकें।

1Your Work

अपनी तीन lines नीचे लिखें। Grader का सबसे तीखा test आपकी "Done when" line है: क्या यह ऐसी चीज़ है जिसे आप सच में एक minute के अंदर जाँच सकें, या भेस बदले एक धुँधली राय?

Works from: ठीक-ठीक वह जिसे agent को देखना चाहिए (कौन सा folder, files, या messages, specific रहें)।

I want at the end: जो चीज़ आप चाहते हैं, और उसकी shape (किन columns वाला spreadsheet? एक one-page summary? rename की गई files का एक folder?)।

Done when: वह एक चीज़ जिसे जाँचकर आप जान सकें कि यह सही है (एक minute के अंदर testable, 'यह अच्छा लगता है' नहीं)।

2Get Your Score

Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.

यह क्यों काम करता है (इसके पीछे का research) — optional

goals पर दशकों की research एक ही दिशा में इशारा करती है। Edwin Locke और Gary Latham की goal-setting theory (उनके 2002 के American Psychologist वाले paper में सारांशित) ने सैकड़ों studies में पाया कि specific और measurable goals धुँधले "अच्छे से कर दें" वाले goals के मुकाबले कहीं बेहतर performance देते हैं, क्योंकि एक specific goal आपको ठीक-ठीक बताता है कि किस पर निशाना लगाना है और ठीक कब आपने उसे hit कर लिया। Agent को दी गई कोई धुँधली instruction ("एक अच्छा summary बना दें") एक "अच्छे से कर दें" वाला goal है। तीन lines इसे एक specific goal में बदल देती हैं।

Software teams व्यवहार में इसी नतीजे पर पहुँचीं और इसे नाम दिया Definition of Done। काम शुरू होने से पहले, team उस exact checklist पर सहमत हो जाती है जो किसी task को complete बताती है, ताकि "finished" बाद में बहस की जाने वाली राय नहीं, बल्कि एक साझा, जाँचने लायक तथ्य हो। Gate 3 एक अकेले task के लिए आपका अपना Definition of Done है, agent के शुरू होने से पहले लिखा गया, ताकि उसके पास एक ऐसा target हो जो उसे दिखता हो।

Sources: Locke, E. A., & Latham, G. P. (2002). "Building a Practically Useful Theory of Goal Setting and Task Motivation," American Psychologist, 57(9), 705–717. "Definition of Done" — standard practice in Agile/Scrum software development.

अब तीनों को एक असली task पर चलाएँ

जब तक आप एक असली task को एक ही बैठक में तीनों gates से नहीं गुज़ारते, तब तक ये gates theory ही रहते हैं।

कुछ ऐसा चुनें जो आपको अभी करना है। इसे गुज़ारें:

Gate 1. Regular tool, chatbot, या agent? अगर यह "agent" से पहले रुक जाता है, तो आपने अभी अपना एक पूरा session बचा लिया; सही tool use करें और आगे बढ़ें।
Gate 2. अगर यह agent का काम है: इसे एक बार करें (Mode 1), या एक helper build करें (Mode 2)? अगर तीनों dials ऊपर हैं, तो यह एक Mode 2 task है: method बदलना बंद करने तक इसे हाथ से हल करते रहें, फिर इसे एक worker में बदल दें। From One-Off to Worker आपको दिखाता है कि यह कब साबित होता है और इसे कैसे promote करना है।
Gate 3. अगर यह एक-बार-हल-करने वाला agent काम है: तीन lines लिखें। Works from, want at the end, done when।

अगर task दूसरे सिरे से निकल आता है, यानी agent, Mode 1, तीन lines लिखी हुईं, तब आप agent खोलते हैं। और अब आप एक sorted, साफ़ task के साथ Problem Solving with General Agents में कदम रखते हैं और उसे सच में हल करने के सात principles सीखते हैं।

यह क्यों matter करता है। इन gates में करीब दस minutes लगते हैं। जो गलतियाँ ये रोकते हैं उनमें दोपहरें लगती हैं, और Mode 2 वाली गलतियों में महीने। पूरा सौदा यही है: शुरू करने से पहले थोड़ी सोच, उन घंटों के बदले जो वरना आप गलत जगह से शुरू करके खो देते।

पहला फ़ैसला कभी यह नहीं था कि agent से कैसे बात करें। यह था कि बात करनी चाहिए या नहीं, यह किस तरह का काम है, और किस ओर। इसे सही कर लें, और agent-से-बात-करने वाला हिस्सा आसान हो जाता है।

हर जवाब आपको कहाँ भेजता है (एक reference card)

तीन gates ने आपके काम को किसी tool का नाम लिए बिना route किया, जान-बूझकर। आप जिस gate पर पहुँचते हैं वह constant है; आप जो tool use करते हैं वह variable है, और tools हर कुछ महीनों में बदलते हैं। 2026 में यह variable जैसा है, वह यहाँ है। इसे उस gate से शुरू करके पढ़ें जिस पर आप पहुँचे, उल्टे तरीके से नहीं।

Gates ने आपको कहाँ भेजा	इसका मतलब	use करने लायक tools (2026)
बस एक जवाब (Gate 1 → chatbot)	आपको knowledge, एक draft, या ideas चाहिए थे। आपकी किसी चीज़ को नहीं छुआ जाता।	claude.ai, ChatGPT, या Gemini। इसकी skill है How to Think in the AI Era।
एक बार हल करें (Gate 1 → agent, फिर Gate 2 → Mode 1)	एक ऐसा agent जिसे आप session के अंदर चलाते हैं: वह act करता है, आप देखते हैं, आप ship करते हैं, आप चले जाते हैं।	Claude Code या OpenCode (terminal या code editor); Cowork या OpenWork (desktop app)। यही Problem Solving with General Agents सिखाता है।
Worker को own करें (यह एक ownership choice है, mode नहीं)	आप एक ऐसा durable worker चाहते हैं जिसे आप खुद run और own करें, जो हफ़्तों भर याद रखे और तब भी जवाब दे सके जब आप सो रहे हों।	एक personal harness (वह software जो किसी worker को आपके लिए ज़िंदा और याद रखता हुआ बनाए रखता है): OpenClaw, जो कई chat apps पर आप तक पहुँचता है, या Hermes, जो आपके काम को गहराई से याद रखता है। देखें Personal Agent Harnesses।
इसे manufacture करें (Gate 2 → Mode 2)	किसी organization के लिए बनाया गया एक worker, यानी एक Digital FTE (एक "digital full-time employee") जिसे reliably और बड़े पैमाने पर चलने के लिए deploy किया जाता है।	OpenAI Agents SDK, या कोई managed Claude agent setup। यह पूरा Mode 2 — Manufacturing track है; Choosing Agentic Architectures आपको चुनने में मदद करता है।

एक जगह जहाँ ये धुँधले हो जाते हैं। तीसरी और चौथी row दोनों "एक durable worker जो आपके बिना चलता है" हैं। इन्हें अलग बताने वाली बात है worker किसके लिए है। अगर यह आपके लिए है, यानी आपका inbox, आपका code, आपके छोटे-मोटे काम, तो यह एक personal harness है, और इसे build करने के लिए आपको पूरा Mode 2 track नहीं चाहिए। अगर यह किसी organization के लिए है, यानी deploy किया गया, governed, बड़े पैमाने के लिए बनाया गया, तो यह Mode 2 है। वही गतिविधि, अलग owner.

और किसी personal harness को own करना कोई तीसरा mode नहीं है। यह ownership का एक अलग सवाल है: आप अपने own किए हुए harness के ऊपर या तो Mode 1 (कोई one-off हल करना) या Mode 2 (टिकाऊ बनाना) चला सकते हैं। दो अलग सवाल, और ये कभी टकराते नहीं: ownership पूछता है "मैं इसे चलाता हूँ, या own करता हूँ?"; mode पूछता है "मैं इसे एक बार हल करता हूँ, या टिकने के लिए बनाता हूँ?"

अब भी unsure हैं कि कौन सा tool fit होता है? किताब Which AI Employees in 2026 में एक चलती-फिरती comparison रखती है।

Flashcards study aid

Knowledge Check

अभी-अभी जिन ideas से आप गुज़रे, उन पर एक quick gated self-check।

Checking access...

यह किसके लिए है​

📚 Teaching Aid​

एक line में नियम​

इस page को कैसे पढ़ें​

छोटा version (तीन bullets)​

Gate 1 — क्या इसके लिए सच में agent चाहिए?​

Check 1a — क्या इसके लिए AI चाहिए, या कोई regular tool जो आपके पास पहले से है?​

Check 1b — क्या इसके लिए agent चाहिए, या बस एक chatbot?​

पहले एक रोज़मर्रा का example​

एक काम का example​

अब आपकी बारी​

Gate 2 — एक बार, या हर हफ़्ते?​

सबसे महँगी गलती​

एक काम का example​

अब आपकी बारी​

Gate 3 — "finished" कैसा दिखता है?​

एक काम का example​

अब आपकी बारी​

अब तीनों को एक असली task पर चलाएँ​

हर जवाब आपको कहाँ भेजता है (एक reference card)​

Flashcards study aid​

Knowledge Check​

यह किसके लिए है

📚 Teaching Aid

एक line में नियम

इस page को कैसे पढ़ें

छोटा version (तीन bullets)

Gate 1 — क्या इसके लिए सच में agent चाहिए?

Check 1a — क्या इसके लिए AI चाहिए, या कोई regular tool जो आपके पास पहले से है?

Check 1b — क्या इसके लिए agent चाहिए, या बस एक chatbot?

पहले एक रोज़मर्रा का example

एक काम का example

अब आपकी बारी

Gate 2 — एक बार, या हर हफ़्ते?

सबसे महँगी गलती

एक काम का example

अब आपकी बारी

Gate 3 — "finished" कैसा दिखता है?

एक काम का example

अब आपकी बारी

अब तीनों को एक असली task पर चलाएँ

हर जवाब आपको कहाँ भेजता है (एक reference card)

Flashcards study aid

Knowledge Check