Skip to main content

فرق الإنسان والوكيل: نموذج تشغيل قوة عملك

تعلّمك هذه الدورة نموذج تشغيل فريق من عمال الذكاء الاصطناعي يعملون إلى جانب البشر. والوحدة التي يقوم عليها هذا النموذج هي عامل واحد موثوق، أي Digital FTE: عامل يشغّل الحلقة، ويعمل من ذاكرة قابلة للبحث، ويسجّل الدخول بهويته الخاصة، ويصعّد عند الحدود. تبني هذا العامل عبر هذا المسار؛ ويمكنك كتابة نموذج التشغيل هذا أولاً على الورق، ثم وصله بالعمال الأحياء عندما يصبحون متاحين. العامل الموثوق الواحد هو الوحدة. أما تشغيل فريق منهم فهو مهارة مختلفة عن بناء عامل واحد، وهذه الدورة تعلّمك تلك المهارة: كيف تحوّل الواحد إلى كثير.

الفريق المؤلف من كثيرين ليس نسخة أكبر من عامل واحد. إنه شيء مختلف، ويحتاج إلى مهارة مختلفة: لا بناء عامل، بل تشغيل فريق من هؤلاء العمال إلى جانب البشر.

هذه الدورة هي ذلك نموذج التشغيل. أما الدورات الأربع بعدها فهي الآلات التي تعمل فوقه: وكيل قائد يوظّف مجلساً (Workforce with Paperclip)، وقوة عمل تنمّي نفسها (Self-Expanding Workforce)، وموافقة مفوضة (Identic AI)، وعمال قادرون على الكسب (Payment-Enabled Agents). لا تعمل أي من تلك الآلات على فريق لم تتعلم تشغيله بعد. لذلك، قبل أن تؤتمت قوة العمل، تحدد كيف يشارك البشر والعمال قائمة واحدة، ومساحة عمل واحدة، وهدفاً واحداً.

رسم يوضح التحول الذي تدور حوله هذه الدورة. في اليسار، "single-player": إنسان واحد أمام نافذة دردشة واحدة، يعمل مع وكيل واحد على مهمة واحدة. في اليمين، "multiplayer": فريق من عدة بشر وعدة وكلاء يتشاركون مساحة عمل واحدة، وقائمة واحدة، وهدف نجم شمالي واحد، مع أسهم من كل عضو نحو الهدف المشترك. يقرأ التعليق: كانت الوحدة عاملاً واحداً؛ أما الفريق فهو البشر وDigital FTEs وهم يسحبون معاً.

ملاحظة عن نوع هذه الدورة. بقية دورات قوة العمل تبني وأنت تتابع. أما هذه فلا. ستكتب هنا القليل من الكود. ستكتب مستندات تشغيلية (قائمة، بطاقات أدوار، نجم شمالي، معيار تحقق) كما يكتبها المدير، مع فارق أن وكيلك يصوغ المسودة وأنت تقرر. المخرجات هي الاتفاقات التي يعمل عليها الفريق. هي أقل بريقاً من الكود، لكنها أكثر حسماً: تفشل معظم فرق الإنسان والوكيل بسبب الممارسات، لا بسبب التقنية.

وهي أيضاً أكثر دورة يسهل الوصول إليها في هذا القسم. فالأدوار، والأهداف، والثقة، ومن يملك ماذا، أمور تفهمها بالفعل من العمل مع البشر. لا يغيّر الوكلاء تلك الأساسيات. إنهم يرفعون كلفة الخطأ فيها.

من أين جاءت هذه الممارسات

تستند الأنماط هنا إلى وصف Anthropic لطريقة تشغيلها فرق الإنسان والوكيل داخلياً، وقد رُبطت بالأطر التي بناها هذا الكتاب من قبل (الروابط الكاملة في Sources في النهاية). عندما تذكر Anthropic نتيجة محددة، فهي نتيجتها وتُنسب إليها. أما الميزات التي تعتمد عليها (وكلاء يعملون في أدوات فريق مشتركة، ووكلاء لهم بيانات اعتماد وذاكرة خاصة بهم) فهي القدرات نفسها التي تبنيها عبر هذا المسار.

📚 Teaching Aid

Open Full Slideshow

اعرض العرض الكامل — فرق الإنسان والوكيل

ما ستبنيه (مجموعة artifacts)

ليس تطبيقاً، بل مجموعة مستندات تشغيلية يعمل عليها فريقك. يمنحك المشروع الابتدائي كل واحد منها كقالب؛ وتملؤها بمساعدة وكيلك.

  • قائمة الفريق: كل عضو، بشراً كان أم وكيلاً، مع الدور، والمالك، والأدوات، ومستوى الاستقلالية.
  • بطاقة دور لكل وكيل: ما يملكه، وما لا يملكه، وأدواته، وكيف يُفحص عمله، ومتى يصعّد.
  • اتفاق عمل: ما هو عام افتراضياً، وحدود الأمان القليلة، وما يبقى خاصاً.
  • مستند النجم الشمالي: هدف الفريق الطموح الواحد، وأي وكلاء يمكنهم التصرف بناءً عليه من دون مطالبة.
  • معيار تحقق: كيف يُقيّم ناتج العمل، بحيث يمكن الوثوق به من دون أن يقرأ الإنسان كل سطر.
  • إعداد doer-verifier: وكيل ثانٍ مهمته الوحيدة فحص الأول.
  • تقرير أسبوعي: سجل "الدروس والأخطاء" الذي يجعل الفريق يتحسن.
  • ميزانية انتباه: ما تراجعه أنت، وما يُجمّع في دفعات، والحد الأقصى لما يصل إليك.

الإعداد

  1. نزّل المشروع الابتدائي (human-agent-teams-starter.zip) وفك ضغطه. إنه مجلد قوالب، لا كود. افتحه في أي محرر.
  2. من الأفضل أن يكون لديك Digital FTE (Building a Digital FTE) لتشغّل حوله فريقاً حقيقياً. لا عامل بعد؟ لا بأس: أنجز هذه الدورة في وضع التخطيط (الملاحظة أدناه)، ثم صِل دليلك بعامل حي عندما يوجد.
  3. امتلك مكاناً يكون فيه العمل مرئياً للفريق: قناة مشتركة، أو مكتبة مستندات، أو مستودع. يقرأ الوكلاء مما يُكتب هناك.
  4. جهّز وكيلك للصياغة معك (claude.ai، أو Cowork، أو عاملك). يُملأ كل artifact في المشروع الابتدائي بالإيقاع نفسه: أنت توجّه، والوكيل يصوغ، وأنت تقرر.

من هنا، يعلّم كل جزء ممارسة واحدة، ثم يجعلك تكتب المستند الذي يضعها موضع التنفيذ. لن تُختبر في النظرية؛ ستغادر ومعك دليل تشغيل لفريق.

فحص الجاهزية (افعله قبل الجزء 2)

تفترض هذه الدورة أن عاملك يستطيع بالفعل قراءة السجل المكتوب لفريقك. اختبر ذلك الآن: اطلب من وكيلك العثور على قرار أو مستند من الأسبوع الماضي، في قناة لا يملكها. إن استطاع، فأنت جاهز. وإن عاد خاوياً، فلم تكمل بعد نظام السجل القابل للبحث من AI Searchable Context. أنجز ذلك أولاً. من دونه، لا تجد أي ممارسة هنا شيئاً تقرؤه.

لم تصل بعد؟ شغّلها في وضع التخطيط

يمكنك إنجاز هذه الدورة كلها قبل امتلاك المكدّس التقني: استخدم claude.ai أو Cowork كوكيل صياغة، واكتب كل مستندات التشغيل، وعلّم كل دور وكيل بأنه "planned" بدلاً من "active". ستغادر ومعك دليل تشغيل كامل على الورق. عُد عندما تُبنى أول عمالك واستبدل الأدوار المخططة بأدوار حية.


الجزء 1: من عامل واحد إلى فريق

المفهوم 1: انتهى زمن single-player

كان العمل مع الذكاء الاصطناعي سابقاً single-player: شخص واحد، ونافذة دردشة واحدة، ومهمة واحدة. يفعل Digital FTE أكثر من ذلك أصلاً. التحول الذي تقوم عليه هذه الدورة هو multiplayer: كثير من الناس وكثير من الوكلاء في مساحة عمل واحدة، يسحبون نحو أهداف مشتركة. يضع البشر الاستراتيجية؛ وينفّذ الوكلاء.

الوكيل multiplayer هو وكيل يعمل مع عدة بشر في الوقت نفسه. مثل Digital FTE، لديه ذاكرة ومهارات خاصة به. وعلى عكس نافذة الدردشة، لديه بيانات اعتماد خاصة به (ليست مستعارة من شخص) ويعيش حيث يحدث العمل: في قنوات الفريق ومستنداته، لا في جلسة خاصة.

الوحدة هي Digital FTE. أما الفريق فهو بشر و Digital FTEs يتشاركون قائمة واحدة. الفريق هو العمل التجاري.

المفهوم 2: الأجزاء التي يحتاجها العامل

لا يعمل الفريق حتى يمتلك كل وكيل ثلاثة أشياء، وهذا المسار يبني الثلاثة:

  • ذاكرة دائمة: حتى يحمل الهدف عبر أيام، لا عبر تعليمة واحدة فقط (AI Searchable Context).
  • هويته الخاصة: بيانات اعتماد غير مرتبطة بإنسان، لكي يعمل داخل حواجز الأمان التي تضعها أنت بدلاً من استعارة تسجيل دخول شخص ما (AI Identity).
  • وصول واسع وقابل للبحث: لكي يتعلم كيف تعمل المنظمة مما هو مكتوب (نظام سجلك في Postgres وRAG: الاسترجاع، أي الذاكرة القابلة للبحث التي منحته إياها).

من دون هذه الأشياء، تعني عبارة "أضف وكيلاً إلى الفريق" أن شخصاً يشارك كلمة مروره مع سكربت. ومعها، تعني عاملاً ينتمي إلى القائمة. يمكنك تصميم نموذج التشغيل الآن، ثم وصله بالعمال الأحياء عندما تصبح تلك الثلاثة متاحة؛ فالممارسات البشرية تجلس فوقها في الحالتين.

Checkpoint: أنت تعرف الوحدة. العامل ذو الذاكرة والهوية والوصول هو ما يتكوّن منه الفريق. والآن تجعل كثيراً منهم يعملون مع البشر.

المفهوم 3: المورد النادر هو الحكم البشري

يحمي نموذج التشغيل كله شيئاً واحداً: انتباه البشر وحكمهم. الوكلاء سريعون وكثيرون؛ أما البشر فهم عنق الزجاجة والسلطة. توجد كل ممارسة في هذه الدورة لإبقاء البشر يقررون الأشياء التي لا ينبغي أن يقررها إلا البشر، ولإبعادهم عن كل ما عدا ذلك.

سمّ نمط الفشل أولاً، لأنه النمط الشائع. من دون نموذج تشغيل، يشغّل الناس أساطيل من ذكاءات اصطناعية شخصية على الجانب. يتكرر العمل. ويتفتت سياق الفريق إلى نوافذ خاصة لا يستطيع أحد آخر، بشراً كان أم وكيلاً، رؤيتها. ويُحسب المقياس الذي يحتاجه الجميع بخمس طرق مختلفة. ليس العلاج مزيداً من الوكلاء؛ بل تشغيل فريق واحد في العلن.

بقية الدورة أربع ممارسات تفعل ذلك بالضبط.

نموذج التشغيل مرسوم كأربع ممارسات على أربع بطاقات. البطاقة 1، "Work in the open": يتدفق السياق إلى كل زميل داخل حدود قليلة واضحة. البطاقة 2، "One roster, clear roles": كل عضو، بشراً كان أم وكيلاً، يملك عملاً مسمى بالأدوات الصحيحة. البطاقة 3، "A north star": هدف طموح واحد يضعه البشر ويخبر الوكلاء أي عمل يستحق الفعل. البطاقة 4، "Trust, earned": تنمو الاستقلالية مع الموثوقية المثبتة، وكل عمل قابل للفحص. وفي الأسفل شريط يقول: كل ممارسة تحمي شيئاً واحداً، هو الحكم البشري.

Checkpoint: أنت تعرف الشكل. أربع ممارسات، وغاية واحدة. بعد ذلك، الأولى.


الجزء 2: العمل في العلن

المفهوم 4: إن لم يكن مكتوباً، فهو غير موجود

يبني الوكيل فهمه بالكامل من الأشياء التي يجعلها الفريق قابلة للبحث: القنوات، والكود، والمستندات، والملاحظات. لا تصل إليه الرسائل الخاصة، ولا أحاديث الممرات، ولا الملفات المقيدة. بالنسبة إلى الوكيل، غير المكتوب غير مرئي.

لذلك، الممارسة الأولى ثقافية قبل أن تكون تقنية: اعمل في العلن. تهبط القرارات في القنوات والمستندات، لا في الرسائل المباشرة والاجتماعات بلا ملاحظات. اكتب artifacts بحيث يستطيع الوكيل العثور عليها: صار الوكيل الآن قارئاً أساسياً لتوثيقك، لا فكرة لاحقة.

العائد حقيقي، وتذكره Anthropic بوضوح. الوكيل الذي يستطيع قراءة قرارات الفريق لن يقترح عملاً قتلتموه مسبقاً. والذي يستطيع قراءة مواصفات فريق آخر سيعيد استخدام نمط نجح. وبما أن الوكيل يقرأ أسرع بكثير من أي إنسان، فإنه يبرز غالباً عملاً ذا صلة كان الناس سيفوتونه. لا تبقى الشفافية فضيلة؛ تصير رافعة.

المفهوم 5: الحدود على مستوى مساحة العمل، لا المستند

هناك طريقة خاطئة لتقرير ما يستطيع الوكيل رؤيته: مستنداً بمستند، وقناة بقناة. هذا إنهاك قرار للبشر والوكلاء معاً: هل يجب أن يكون هذا خاصاً؟ هل يمكنني مشاركة ذلك المستند؟ هل يُسمح لهذا الوكيل بالدخول إلى ذلك الخيط؟ الخطوط اللينة لكل عنصر مُرهقة وسهلة الخطأ.

الطريقة الصحيحة: حدود أمان قليلة وواضحة مرسومة على مستوى مساحة العمل: حد الأمان ليس إلا جداراً حول مجموعة معلومات، مع قاعدة تحدد من بداخله. داخل الحد، يتدفق السياق إلى كل زميل، إنساناً كان أم ذكاءً اصطناعياً. عدد قليل من الخطوط الواضحة أفضل من عدد كبير من الخطوط اللينة، ويزيل ضريبة "هل أستطيع مشاركة هذا؟" اليومية.

هنا يستحق نظام السجل مكانه. الحد هو الجدار؛ والمخزن القابل للبحث من AI Searchable Context هو ما يتدفق بحرية داخله. ارسم الجدار مرة واحدة؛ ودع الاسترجاع يفعل الباقي.

اذكر الاستثناء صراحة، لأن public-by-default لا يعني أن كل شيء عام. بعض العمل حساس ويخص إنساناً واحداً ووكيلًا واحداً. هذا رسالة مباشرة إلى الوكيل، أو التطبيقات الخاصة (claude.ai، وCowork) فوق موصلاتك الشخصية، حيث تبقى المحادثة خاصة. اجعل الأصل هو العلن؛ واترك مساراً واضحاً وضيّقاً لما يجب أن يبقى خاصاً.

Draft it. افتح 01-working-agreement.md والصق في وكيلك:

Draft a working agreement for my team. State what is public by default. List the few security boundaries we need (no more than a handful) and who is inside each. List what stays private (one human, one agent). For each boundary, write one sentence a new teammate could follow.

Check it. هل تستطيع صياغة كل حد في جملة واحدة؟ إن لم تستطع، فلديك حدود أكثر مما ينبغي. اجعلها قليلة وواضحة، وإلا فلن تصمد.

Checkpoint: السياق يتدفق. يعمل فريقك حيث يستطيع الوكلاء القراءة، خلف جدران قليلة يستطيع أي شخص تسميتها. والآن ضع أسماء على العمل.


الجزء 3: قائمة واحدة وأدوار واضحة

المفهوم 6: للفريق قائمة

يتشارك فريق الإنسان والوكيل قائمة واحدة، ومجموعة artifacts واحدة، ومساحة عمل واحدة. لذلك اكتب القائمة: كل عضو، بشراً كان أم وكيلاً، وما يملكه كل واحد.

يحمل الوكلاء أدواراً مختلفة. أحدهم يملك تحليل البيانات؛ وآخر يحفظ معيار التصميم ويفرضه؛ وثالث يشغّل تلخيص البحث. عندما يبدأ مشروع، يتحاور البشر مع الوكلاء لتحديد الأدوار التي ستُسند وكيف سيعملون معاً: القائمة هي ناتج تلك المحادثة، لا تخمين مسبق.

هذه هي Roles Taxonomy وDigital FTE taxonomy لديك، وقد صارتا ملموستين لفريق واحد. يقول الكتالوج أي أنواع من العمال يمكن أن توجد؛ وتقول القائمة أيهم موجود في هذا الفريق ومن يملك ماذا.

المفهوم 7: الدور بطاقة، وskill file

يحصل كل وكيل على بطاقة دور: ما يملكه، وما لا يملكه، والأدوات والوصول الذي يحتاجه، وكيف يُفحص عمله، ومتى يصعّد إلى إنسان. يتعلق النطاق بما "لا يملكه" بقدر ما يتعلق بما "يملكه": فالوكيل ذو الحواف الضبابية ينجرف إلى عمل الآخرين.

سمّ الأدوات، لأن الدور من دونها لقب بلا يدين. يحتاج المحلل إلى قاعدة البيانات. ويحتاج وكيل QA إلى أداة المتصفح. اذكر الوصول الذي يتطلبه كل دور، وامنح ذلك فقط (least privilege هي القاعدة نفسها التي ستقابلها مجدداً مع الموافقة المفوضة).

ثم اكتب الدور بوصفه skill file. هذه الحركة تجعل أطر الكتاب تترابط: عرّف دور الوكيل في skill، فيصير الدور قابلاً للنقل: يستطيع أي شخص في المنظمة إنشاء وكيل آخر من النوع نفسه منه. تتوقف الأدوار عن كونها مربعات في مخطط تنظيمي، وتصبح مهارات قابلة للنسخ. (المهارات هي الرافعة القابلة للنقل عبر هذا الكتاب كله؛ والدور شيء آخر يمكن أن تحمله skill.)

أبقِ الأدوار البشرية فقط صريحة. يعمل البشر في الخيوط نفسها التي يعمل فيها الوكلاء، لكنهم يمسكون بالأدوار التي لا يستطيع حملها إلا البشر: القرارات ذات التبعات، والحكم الذي له كلفة. القائمة هي الطريقة التي تبقي بها الحكم البشري على القرارات التي تحتاجه، وتبعده عن التي لا تحتاجه.

عندما يحتاج وكيل إلى وكيل آخر

أحياناً تكون المهمة أكبر من عامل واحد، فيُنشئ وكيل قائد زملاء بالسياق الصحيح لمهمة فرعية: باحث هنا، ومراجع هناك. هذا الحدس صحيح، وهو ما تؤتمته الدورة التالية: Workforce with Paperclip يحوّل "قائد يوظّف مجلساً" إلى قوة عمل مُدارة تحت ميزانيات وموافقات. قائمتك وبطاقات أدوارك هي مدخلاته. هنا تكتب الأدوار يدوياً لكي تفهم ما سيفعله Paperclip لك لاحقاً.

ملاحظتان صادقتان عن الميزة الأساسية حتى منتصف 2026: فرق وكلاء Claude Code تجريبية ومعطّلة افتراضياً (تشغّلها بإعداد)، والقائد وحده ينشئ الزملاء؛ ولا يستطيع الزملاء إنشاء زملائهم. لذلك، فعبارة "وكلاء ينشئون وكلاء" تعني حقاً "قائداً ينشئ فريقاً مسطحاً". عاملها كميزة مبكرة، واقرأ التوثيق الحالي قبل أن تعتمد عليها في الإنتاج.

Draft it. افتح 02-roster.md ونسخة من 03-role-cards/role-card.template.md والصق:

Draft a team roster for [team]. List every member, human and agent. For each: role, who owns it, the tools and access it needs, and its autonomy level. Mark the roles only a human should hold. Then write a full role card for [my worker]: owns, does NOT own, tools/access, how its work is verified, and what triggers an escalation to a human.

Check it. لكل عضو مالك و"does not own". ولكل وكيل أدواته ومُشغّل تصعيد واضح. إن استطاع عضوان ادعاء المهمة نفسها، فالنطاقات ليست حادة بما يكفي بعد.

Checkpoint: لكل شخص مساره. بشر ووكلاء على قائمة واحدة، يملك كل منهم عملاً مسمى ومعه الأدوات اللازمة. والآن أعط الفريق اتجاهاً.


الجزء 4: النجم الشمالي

المفهوم 8: هدف يجعل الوكيل مبادراً

يجعل السياق والأدوار الوكيل ينجز العمل الذي تسنده إليه. أما النجم الشمالي فيجعله يقترح العمل الصحيح. النجم الشمالي هدف طموح واسع يخبر الفريق أي مهام ومسارات عمل تستحق الفعل: الجملة الواحدة التي يُقاس كل شيء آخر عليها. يضعه البشر دائماً، مستنداً إلى رسالة العمل التجاري.

بعد كتابته، تشاركه مع وكلاء الفريق. ثم (وهذا هو الجزء الذي يتخطاه الناس) تسمّي أي وكلاء يمكنهم التصرف بناءً عليه من دون مطالبة. لا ينبغي لكل وكيل أن يقترح عملاً. فقط الذين لديهم المهارات والثقة المكتسبة لفعل ذلك جيداً.

مثال Anthropic صغير ودقيق: فريق كان نجمه الشمالي "جعل تهيئة المنتج للمستخدمين أكثر إفادة"؛ أوصى وكيل فيه بمبادرة منه بإعادة كتابة رسائل خطأ التهيئة، وهي تغييرات رفعت نجاح التهيئة بشكل قابل للقياس في الأسبوع التالي. لم ينتظر الوكيل أن يُطلب منه ذلك. أخبره النجم الشمالي أن إعادة الكتابة على خط الرسالة.

هذه هي مهمة الشركة AI-Native لديك، وقد دُفعت إلى فريق واحد. للشركة رسالة؛ وللفريق نجم شمالي يخدمها؛ وللوكيل عمل يخدم النجم الشمالي. يمتد الخط مباشرة من الهدف إلى المهمة.

المفهوم 9: المبادرة امتياز تمنحه

الخطر في الوكيل المبادر أن يقترح عملاً لا ينبغي أن يمسه. لذلك تكون المبادرة مسمّاة، لا مفترضة. تقول أي وكلاء يمكنهم اقتراح مسارات عمل، ويكون النجم الشمالي هو الاختبار الذي يجب أن ينجحه كل اقتراح. والوكيل الذي لا يملك هذا المنح لا يتوقف عن عمله المكلّف به: إنه لا يعمل كمستقل فقط.

Draft it. افتح 04-north-star.md والصق:

Help me write a north star for [team]. It should be one ambitious goal, grounded in our mission. State why it matters. Name which agents on the roster may propose new work against it, and the guardrails on those proposals. Write it so an agent, given only this doc, could judge whether a new idea is on-mission.

Check it. اقرأه كما سيقرأه الوكيل المسمى. هل يستطيع، بهذا المستند وحده، التمييز بين فكرة على خط الرسالة وأخرى خارجه؟ إن لم يستطع، فالنجم غامض أكثر من اللازم ليقود.

Checkpoint: للفريق اتجاه. هدف واحد يضعه البشر، ومعه قلة مسماة يُسمح لها بمطاردته. والآن قرر إلى أي مدى تتركهم يركضون.


الجزء 5: الثقة المكتسبة

المفهوم 10: تنمو الاستقلالية مع الموثوقية

لا تسلّم زميلاً جديداً المفاتيح في يومه الأول. ولا تسلّم وكيلاً 500 إصلاح خطأ في يومه الأول أيضاً. وصل مهندسو Anthropic إلى هناك (وكلاء أُرسلوا لمعالجة مئات الإصلاحات وحدهم)، لكن الأمر لم يبدأ هكذا. امنح الاستقلالية بنسبة تتناسب مع الموثوقية المثبتة، ثم وسّعها عمداً، حسب نوع المهمة.

تحتاج معرفة كيفية أداء مهمة جيداً إلى دورات تغذية راجعة حتى تُستخرج من الضمن إلى العلن: للإنسان الجديد، وللوكيل أيضاً. وأعد الاختبار كلما تغيّرت النماذج: فقد يقيد حاجز أمان ساعد نموذجاً أضعف نموذجاً أقوى، وقد تحتاج التعليمة إلى إعادة صياغة عندما يتحسن النموذج. الثقة لا تُضبط مرة واحدة؛ بل تُعاير.

سلم ثقة، بأربع درجات صاعدة موسومة بمستوى الاستقلالية. L1 "Review everything": يفحص إنسان كل قرار يتخذه الوكيل. L2 "Verify the work": يفحص معيار أو وكيل ثان الناتج قبل الإنسان. L3 "Batch the escalations": يرفع الوكيل فقط القرارات ذات التبعات، مجمّعة. L4 "Earned autonomy": يشغّل الوكيل نوع مهمة وحده، مع توسيع النطاق بعد انتصارات متكررة. أسفل الدرجات، يعني L0 مسودة فقط، فالإنسان هو من ينجز العمل. سهم إلى أعلى الدرجات موسوم "demonstrated reliability"، وملاحظة جانبية تقول "وسّع حسب نوع المهمة، لا كله مرة واحدة."

اجعل السلم عملياً بمنحه درجات ثابتة. اضبط مستوى الاستقلالية لكل وكيل حسب نوع المهمة في القائمة، لا مستوى واحداً للوكيل كله:

LevelWhat the agent doesWhere the human is
L0Drafts only; the human does the workhuman does everything
L1Acts, but a human reviews every outputhuman reviews all
L2Acts; a verifier checks; human reviews only exceptionshuman reviews exceptions
L3Acts within limits; batches escalations to the humanhuman reviews batched escalations
L4Runs the task type on its own, within approved scopehuman reviews the weekly report

يبدأ الوكيل الجديد عند L1 في نوع مهمة، ويشق طريقه إلى الأعلى بعد انتصارات متكررة ومتحققة. يمكن للوكيل نفسه أن يكون عند L4 في نوع مهمة وعند L1 في نوع آخر: تُمنح الاستقلالية إلى عامل على مهمة، لا إلى عامل عموماً.

المفهوم 11: اجعل العمل قابلاً للفحص

الشيء الذي يسمح بنمو الاستقلالية بأمان هو هذا: يمكن التحقق من العمل قبل أن ينظر إليه إنسان. للكود اختبارات، بالطبع. لكن معظم الأعمال الأخرى يمكن تقييمها أيضاً: مستند وفق معيار ودليل أسلوب، وتقرير وفق قائمة تحقق. عندما تضع الحد وتجعل كل تكليف قابلاً للفحص، تبقى الجودة عالية ولا تنجرف بعيداً عما قصدته.

هذا هو Eval-Driven Development على مستوى الفريق (Eval-Driven Development). هناك يقيّم التقييم العامل تلقائياً. وهنا يكون المعيار هو ذلك التقييم مطبقاً على ناتج عامل واحد: الفكرة نفسها، مكتوبة كقائمة تحقق يستطيع زميل تشغيلها.

ثم doer-verifier: ينجز وكيل المهمة، وتكون مهمة وكيل ثانٍ الوحيدة فحصها. (تسمي Anthropic هذا doer-verifier harness.) إنها تأمين رخيص، وتنفق وقت وكيل لتوفير وقت إنسان: يلتقط verifier الانجراف قبل أن يُنفق انتباهك النادر عليه.

Draft it. افتح 05-verification-rubric.md و06-doer-verifier.md والصق:

Write a verification rubric for [my worker]'s main output: the concrete checks that decide whether the work is good enough to ship, in plain pass/fail terms. Then describe a doer-verifier setup: a second agent whose only job is to grade the first's output against this rubric and return pass/fail with reasons.

Check it. هل يستطيع وكيل ثانٍ تقييم عمل الأول باستخدام هذا المعيار وحده، وهل ستثق أنت في نتيجة pass؟ إن كان "pass" لا يزال يجعلك ترغب في قراءة كل سطر، فالمعيار ليس محدداً بما يكفي.

المفهوم 12: أنفق انتباه البشر كأنه مال

ما إن يصبح الوكلاء مستقلين حتى يظهر نمط فشل جديد: غرق البشر في المخرجات. لذلك تعامل مع انتباه البشر بوصفه المورد النادر الذي هو عليه. تجعل أفضل الفرق وكلاءها يجمعون الأسئلة في مرور واحد، ويعيدون السياق الأساسي حتى يلحق الإنسان بسرعة، ويحدون عدد العناصر التي يراها الإنسان دفعة واحدة.

تعطي بعض الفرق وكيلاً واحداً مهمة وحيدة: تقرير ما الذي يُرفع إلى البشر. وتضع بعض الفرق سقفاً لكمية ما يفعله الوكيل يومياً: لا لإبطائه، بل كي يبقى البشر قادرين على الانخراط في العمل ب meaningful way، ويحافظوا على المهارات التي تهمهم.

ابنِ التأمل داخل الدورة. اطلب من الفريق تقريراً أسبوعياً عن "lessons and missteps"، حتى تُتعقب الأخطاء وتتوقف عن التكرار. تتبّع أنواع المهام التي كسب كل وكيل استقلالية فيها، ووسّع النطاق فقط بعد انتصارات متكررة. التقرير هو كيف يتحسن الفريق قصداً لا مصادفة.

Draft it. افتح 07-weekly-report.md و08-attention-budget.md والصق:

Draft a weekly team report template that captures, for each agent: what it shipped, its lessons and missteps this week, and which task types it has earned more autonomy on. Then propose an attention budget for me: what I will review, what gets batched, and the cap on how much reaches me at once.

Check it. في أسبوع مزدحم، هل يبقي هذا الإنسان يقرر الأشياء المهمة ولا شيء غيرها؟ إن كان الإنسان لا يزال مضطراً لقراءة كل شيء، فالميزانية لا تحمي المورد النادر.

Checkpoint: الثقة قرص ضبط، لا مفتاح. العمل قابل للفحص، والاستقلالية تتسع بالدليل، وانتباه البشر يُنفق حيث يحتسب. صار لديك نموذج التشغيل كله.


الجزء 6: أقم فريقك

تعلمت أربع ممارسات وصغت مستنداً لكل منها. والآن اجمعها في دليل تشغيل فريق واحد.

دليل التشغيل: مجلد واحد، وثمانية ملفات

الدليل مجلد، مرقم بالترتيب الذي تملؤه به. يشحن المشروع الابتدائي هذا بالضبط:

human-agent-team/
01-working-agreement.md few clear boundaries · what's public · what's private
02-roster.md every member · owner · tools · autonomy level (L0–L4)
03-role-cards/ one card per agent (copy the template)
role-card.template.md
reconciler.md (filled example)
04-north-star.md the one goal · which agents may act on it unprompted
05-verification-rubric.md the pass/fail checks a verifier can apply
06-doer-verifier.md which agent checks which, and what happens on fail
07-weekly-report.md shipped · lessons & missteps · autonomy changes
08-attention-budget.md what you review · what's batched · the cap

لكل ملف قائمة تحقق قصيرة مطلوبة (في القالب، ومكررة في "Check it" في نهاية كل جزء). لا يكتمل ملف حتى تكون قائمته كلها نعم. ولا يكتمل الدليل حتى تكتمل الملفات الثمانية كلها.

املأه بالترتيب

الترتيب هو ترتيب الاعتماد. ترتبط الممارسات الأربع بخمس خطوات ملء (تنقسم ممارسة الثقة إلى تحقق وانتباه)، وتنتج تلك الخطوات الملفات الثمانية: دليل واحد يُرى على ثلاثة مستويات تكبير.

  1. Working agreement: ما هو عام، والحدود القليلة، وما يبقى خاصاً. (السياق أولاً؛ لا يعمل شيء آخر من دونه.)
  2. Roster + role cards: كل عضو، وما يملكه، وأدواته، ومشغلات التصعيد.
  3. North star: الهدف، ومن يجوز له مطاردته من دون مطالبة.
  4. Verification rubric + doer-verifier: كيف يُفحص العمل قبل أن تراه.
  5. Weekly report + attention budget: كيف يتحسن الفريق وكيف يحمي وقتك.

خمسة مستندات تشغيلية في ترتيب الاعتماد، يغذي كل واحد التالي: اتفاق العمل، ثم القائمة وبطاقات الأدوار، ثم النجم الشمالي، ثم معيار التحقق وdoer-verifier، ثم التقرير الأسبوعي وميزانية الانتباه. اثنان منها يسلّمان إلى بقية Phase 3: تغذي القائمة Workforce with Paperclip (الذي يوظف منها)، وتغذي ميزانية الانتباه Identic AI (الذي يؤتمتها). يقول التعليق: املأ كل واحد مع وكيلك؛ قرر كل واحد بنفسك؛ يشحن starter هذه الخمسة كقوالب.

شغّل كل واحد بالإيقاع نفسه: الصق مطالبة الجزء، واقرأ ما يصوغه الوكيل، ثم قرر: احذف، اشحذ، وافق. أنت السلطة؛ والوكيل هو الصائغ.

استخدم أسئلة Anthropic الخمسة كاختبار إنجاز. يكون الفريق جاهزاً عندما تكون كل إجابة نعم:

  1. هل المعلومات والوصول اللذان يحتاجهما الوكلاء والبشر عامان وقابلان للبحث على نطاق واسع؟
  2. هل تستطيع كتابة قائمة فريقك، بشراً ووكلاء، وذكر ما يملكه كل عضو؟
  3. هل يمتلك كل إنسان ووكيل الأدوات الصحيحة لأداء عمله؟
  4. هل لديك معايير أو اختبارات للتحقق من منتجات العمل الأساسية؟
  5. هل لدى الفريق نجم شمالي واضح يستطيع الجميع الرجوع إليه؟

مثال عملي: فريق إغلاق مالي

تبقى القوالب مجردة حتى ترى واحداً مملوءاً. هنا فريق مالي صغير يدير الإغلاق الشهري (مراقب بشري وثلاثة وكلاء)، مع الأجزاء المهمة وقد صارت ملموسة. (يشحن starter هذا باسم examples/finance-close-team.md.)

النجم الشمالي: كل رقم يغادر المبنى صحيح ويمكن تتبعه إلى مصدره.

MemberHuman/AgentOwnsTools / accessAutonomy
ControllerHumanSign-off on anything that leaves the companynonehuman-only
PullerAgentPulling figures from the source systemsERP / GL read-onlyL2 (verified)
ReconcilerAgentMatching figures across sources, flagging variancesthe ledger, the system of recordL3 on routine ties; L1 on new accounts
CheckerAgentGrading the reconciliation against the rubricthe rubricdoer-verifier only

التفصيل الذي يجعله آمناً هو مشغّل التصعيد، مكتوباً بوضوح على بطاقة دور Reconciler.

Example: مشغّل تصعيد Reconciler

صعّد إلى Controller عندما: يتجاوز أي فرق 1% من رصيد الحساب أو $10,000، أيهما أصغر (محافظ عمداً، حتى تصعّد الحسابات الصغيرة عند تغييرات صغيرة)، أو لا يكون لأي رقم مصدر في نظام السجل. وإلا، طابقه وسجّله.

وهذا هو معيار التحقق الذي يطبقه Checker. لا تمر المطابقة إلا إذا:

Example: معيار Checker
  1. every balance ties to its source within threshold; 2. every variance has a reason code; 3. every source document is linked in the system of record; 4. every exception is listed in the escalation queue.

خط التصعيد هذا هو نموذج التشغيل كله في صورة مصغرة. يشغّل Reconciler المطابقات الروتينية وحده (L3)، ويتحقق Checker وفق المعيار قبل أن ينظر أحد (doer-verifier)، وتتوقف الأرقام بلا مصدر أو الجوهرية وتصل إلى إنسان (انتباه يُنفق فقط حيث يحتسب)، ويمسك Controller بالدور الوحيد الذي يشحن رقماً إلى العالم الخارجي. لاحظ أن Reconciler هو L3 في المطابقات الروتينية لكنه L1 في الحسابات الجديدة: استقلالية حسب نوع المهمة، لا حسب الوكيل. بدّل الحدود والمصادر، ويشغّل الشكل نفسه الحسابات الدائنة، أو الرواتب، أو تقارير مجلس الإدارة.

Checkpoint: تستطيع تشغيل فريق. اتفاق عمل، وقائمة بأدوار واضحة، ونجم شمالي، وطريقة للتحقق من العمل، وميزانية لانتباهك. هذا نموذج تشغيل، وهو ما تعمل عليه بقية دورات قوة العمل.


الجزء 7: السقف، حيث ينمو

لا يوسّع نموذج التشغيل الفريق وحده. إنه يضع القواعد؛ أما الدورات الأربع التالية فهي الآلات التي تعمل عليها، وكل واحدة تأخذ artifact كتبته للتو كمدخل:

  • Workforce with Paperclip يؤتمت القائمة: وكيل قائد يوظف ويدير مجلساً من العمال تحت ميزانيات وموافقات ومسار تدقيق كامل. قائمتك وبطاقات أدوارك هي ما يوظف منه.
  • Self-Expanding Workforce تنمّي الفريق مع نمو العمل، بدلاً من أن تضيف كل عامل يدوياً.
  • Identic AI هي ميزانية انتباهك مؤتمتة: هوية موقعة تمسح الموافقات الروتينية داخل حدود تضعها، وتبرز فقط القرارات ذات التبعات.
  • Payment-Enabled Agents تجعل العامل يتعامل مالياً: الخطوة من فريق يوفر الكلفة إلى فريق يكسب.

ابنِ نموذج التشغيل أولاً، فيكون لدى تلك الآلات شيء سليم تعمل عليه. تخطّه، وستكون تؤتمت فريقاً لم يكن متماسكاً أصلاً.

أما سقف الممارسات نفسها: لا جديد في هذا للبشر. نجم شمالي واضح، وأدوار معرفة، وعمل في العلن، ومعيار مشترك للجودة، ومساحة للتعلم من الأخطاء: هذه عادات فرق صحية عرفناها لعقود. لا يبتكرها الوكلاء. إنهم يجعلون تخطيها قاتلاً، لأن الوكيل سيضخّم الممارسة السيئة بسرعة تضخيمه للممارسة الجيدة. الفرق التي تستفيد أكثر من وكلائها هي الأكثر انضباطاً في الأساسيات.

هذا هو الخط الذي كان الكتاب يمشي نحوه: قوة عمل من Digital FTEs، تعمل على نموذج التشغيل هذا، داخل شركة AI-native. تصل إلى هذا النموذج وأنت تفكر في عامل واحد. وتغادر قادراً على تشغيل فريق منهم مع البشر، وعلى توسيع ما ينتجه ذلك الفريق وحوكمته وبيعه.

الدليل نفسه، فرق أخرى

مجموعة artifacts شكل واحد؛ يتغير الفريق ولا تتغير المستندات:

  • فريق بحث: وكلاء محلل ومركّب ومدقق حقائق تحت نجم شمالي يقول "أجب عن السؤال، مع المصادر".
  • فريق تسليم: مخطط، ومنفذ، وdoer-verifier تحت معيار جودة، مع إنسان يمسك قرار الشحن.
  • فريق مالي: وكيل سحب بيانات، ووكيل مطابقة، وإنسان يملك كل رقم يغادر المبنى.

المستندات الخمسة نفسها. قائمة مختلفة، ونجم شمالي مختلف، ومعيار مختلف.

Capstone: أقم فريقاً حقيقياً

اختر هدفاً حقيقياً في منظمتك وأنتج مجموعة artifacts كاملة له: اتفاق عمل، وقائمة، وبطاقات أدوار، ونجم شمالي، ومعيار تحقق، وdoer-verifier، وتقرير أسبوعي، وميزانية انتباه.

1Your Work
2Get Your Score

Discuss with an AI. Question your scores.
Come back when you have your BEST evaluation.

يشحن starter مثالاً مقيماً (examples/finance-close-team-graded.md)، وهو دليل مالي كامل حصل على 15/16 وفق هذه الفحوصات الثمانية، مع تسمية الفحص الضعيف وإظهار الإصلاح. اقرأه قبل تقييم دليلك: يوضح ما يلتقطه المعيار وكيف يبدو الدليل القوي.

Sources

تعلّم هذه الدورة من وصف Anthropic لتشغيل فرق الإنسان والوكيل، مربوطاً بالأطر التي بناها هذا الكتاب من قبل. المصدر الأساسي ومادة Anthropic التي يستند إليها:

Flashcards Study Aid


اختبر فهمك

Checking access...