مقدمة: نحو تفاعل أكثر سلاسة بين المستخدمين ووكلاء الذكاء الاصطناعي

تتجاوز وكلاء الذكاء الاصطناعي دورها التقليدي كأدوات خلفية آلية، لتصبح عناصر تفاعلية مرئية ضمن التطبيقات الحديثة. لكن جعل هذه الوكلاء تفاعلية بشكل حقيقي، قادرة على الاستجابة للمستخدمين وتوجيه سير العمل بشكل استباقي، كان يُشكل تحديًا هندسيًا كبيرًا. فكل فريق عمل كان يبني قنوات اتصال خاصة به، بالإضافة إلى معالجة الأحداث وإدارة الحالة، وكل ذلك لاحتياجات تفاعل متشابهة. وقد قدم الإصدار الأول من AG-UI، الذي أُعلن عنه في مايو 2025، نموذجًا عمليًا مفتوح المصدر لبروتوكول اتصال مباشر بين وكيل الذكاء الاصطناعي والمستخدم. وقدّم هذا الإصدار بنية أحادية التدفق – عادةً ما يتم استخدام HTTP POST مع Server-Sent Events (SSE) – وأنشأ مفردات من أحداث JSON منظمة (مثل TEXT_MESSAGE_CONTENT، TOOL_CALL_START، STATE_DELTA) التي يمكنها تشغيل مكونات الواجهة الأمامية التفاعلية. وقد عالج الإصدار الأول تحديات التكامل الأساسية – البث في الوقت الفعلي، وتنسيق الأدوات، والمشاركة في الحالة، ومعالجة الأحداث الموحدة – لكن المستخدمين وجدوا أن هناك حاجة إلى مزيد من التنظيم لأنواع الأحداث، والإصدارات، ودعم الإطار للانتقال إلى بيئة الإنتاج على نطاق أوسع.

ما الذي يميز تحديث AG-UI الأخير؟

يُمثل تحديث AG-UI الأخير خطوة تطورية هامة للتطبيقات التي تعتمد على وكلاء الذكاء الاصطناعي. على عكس المحاولات السابقة العشوائية لتحقيق التفاعلية، تم بناء أحدث إصدار من AG-UI حول أحداث واضحة ومعرّفة بالإصدار. لم يتم ربط البروتوكول ارتباطًا وثيقًا بأي بنية محددة؛ فهو مصمم للعمل مع العديد من الخوادم الخلفية لوكلاء الذكاء الاصطناعي وأنواع العملاء المختلفة مباشرةً.

الميزات الرئيسية في تحديث AG-UI الأخير:

  • مجموعة رسمية من حوالي 16 نوعًا من الأحداث، تغطي دورة حياة الوكيل بالكامل – المخرجات المنقولة، واستدعاءات الأدوات، وتحديثات الحالة، ومطالبات المستخدم، ومعالجة الأخطاء.
  • مخططات أحداث أنظف، مما يسمح للعملاء ووكلاء الذكاء الاصطناعي بالتفاوض على القدرات ومزامنة الحالة بشكل أكثر موثوقية.
  • دعم أقوى لكل من التكامل المباشر (الأصلي) والتغليف القائم على المُكيّف لوكلاء الذكاء الاصطناعي القديمة.
  • وثائق وأدوات تطوير برمجيات موسعة تجعل البروتوكول عمليًا للاستخدام في بيئة الإنتاج، وليس مجرد التجارب.

التحديات التقنية للتفاعل مع وكلاء الذكاء الاصطناعي

لا تزال العديد من وكلاء الذكاء الاصطناعي اليوم مخفية في الخلفية، مصممة للتعامل مع الطلبات وإرجاع النتائج، مع القليل من الاهتمام بالتفاعل مع المستخدم في الوقت الفعلي. إن جعل الوكلاء تفاعليًا يعني حل العديد من التحديات التقنية:

  • البث: تحتاج وكلاء الذكاء الاصطناعي إلى إرسال نتائج أو رسائل متزايدة بمجرد توفرها، وليس فقط في نهاية العملية.
  • المُشاركة في الحالة: يجب أن يتزامن كل من وكيل الذكاء الاصطناعي وواجهة المستخدم، ويعكس التغييرات مع تقدم المهمة.
  • استدعاءات الأدوات: يجب أن تكون وكلاء الذكاء الاصطناعي قادرة على طلب أدوات خارجية (مثل واجهات برمجة التطبيقات أو إجراءات المستخدم) والحصول على النتائج بطريقة منظمة.
  • التراسل ثنائي الاتجاه: يجب أن يكون بإمكان المستخدمين الرد على وكيل الذكاء الاصطناعي أو توجيهه، وليس فقط مراقبته بشكل سلبي.
  • الأمان والتحكم: يجب أن تكون استدعاءات الأدوات، والإلغاءات، وإشارات الخطأ واضحة ويتم إدارتها بأمان.

بدون بروتوكول مشترك، ينتهي الأمر بكل مطور بإعادة اختراع هذه العجلات – غالبًا بشكل غير مثالي.

آلية عمل تحديث AG-UI الأخير

يُحدد تحديث AG-UI الأخير التفاعل بين وكيل الذكاء الاصطناعي والمستخدم كبث لأحداث من النوع. تُصدر وكلاء الذكاء الاصطناعي هذه الأحداث أثناء عملها؛ ويشترك العملاء في البث، ويفسرون الأحداث، ويرسلون الردود عند الحاجة.

تدفق الأحداث:

جوهر تحديث AG-UI الأخير هو تصنيف الأحداث. هناك حوالي 16 نوعًا من الأحداث، بما في ذلك:

  • message: مخرجات وكيل الذكاء الاصطناعي، مثل تحديث الحالة أو جزء من النص المُولّد.
  • function_call: يطلب وكيل الذكاء الاصطناعي من العميل تشغيل دالة أو أداة، وغالبًا ما يتطلب موردًا خارجيًا أو إجراءً من المستخدم.
  • state_update: يُزامن المتغيرات أو معلومات التقدم.
  • input_request: يُطالب المستخدم بقيمة أو خيار.
  • tool_result: يرسل النتائج من الأدوات إلى وكيل الذكاء الاصطناعي.
  • error و control: تُشير إلى الأخطاء، والإلغاءات، أو الإكمال.

جميع الأحداث مشفرة بـ JSON، ومنظمة، ومعرّفة بالإصدار. يجعل هذا الهيكل من السهل تحليل الأحداث، ومعالجة الأخطاء بشكل صحيح، وإضافة إمكانيات جديدة بمرور الوقت.

دمج وكلاء الذكاء الاصطناعي والعملاء:

هناك نمطان رئيسيان للتكامل:

  • الأصلي: يتم إنشاء وكلاء الذكاء الاصطناعي أو تعديلها لإصدار أحداث AG-UI مباشرةً أثناء التنفيذ.
  • المُكيّف: بالنسبة لوكلاء الذكاء الاصطناعي القديمة أو من جهات خارجية، يمكن لوحدة مُكيّف اعتراض المخرجات وترجمتها إلى أحداث AG-UI.

على جانب العميل، تفتح التطبيقات اتصالاً دائمًا (عادةً عبر SSE أو WebSocket)، وتستمع إلى الأحداث، وتحديث واجهتها أو إرسال استجابات منظمة حسب الحاجة. البروتوكول لا يعتمد على وسيلة نقل محددة، ولكنه يدعم البث في الوقت الفعلي للاستجابة السريعة.

تبني AG-UI والنظام البيئي

شهد AG-UI منذ إصداره الأول تبنيًا واسعًا بين أطر عمل تنسيق وكلاء الذكاء الاصطناعي الشائعة. وقد ساهم مخطط الأحداث الموسّع في أحدث إصدار من AG-UI والوثائق المحسّنة في تسريع جهود التكامل. وتشمل عمليات التكامل الحالية أو الجارية:

  • LangChain، CrewAI، Mastra، AG2، Agno، LlamaIndex: كل منها يوفر تنسيقًا لوكلاء الذكاء الاصطناعي التي يمكنها الآن عرض حالتها الداخلية وتقدمها بشكل تفاعلي.
  • AWS، A2A، ADK، AgentOps: جارٍ العمل على ربط أدوات السحابة، والمراقبة، وتشغيل وكلاء الذكاء الاصطناعي مع AG-UI.
  • Human Layer (تكامل Slack): يُظهر كيف يمكن لوكلاء الذكاء الاصطناعي أن يصبحوا أعضاء فريق متعاونين في بيئات المراسلة.

وقد اكتسب البروتوكول قبولًا لدى المطورين الذين يتطلعون إلى تجنب بناء معالجات المقابس ومخططات الأحداث المخصصة لكل مشروع. يحتوي حاليًا على أكثر من 3500 نجمة على GitHub ويُستخدم في عدد متزايد من المنتجات التي تعتمد على وكلاء الذكاء الاصطناعي.

تجربة المطور

صُمّم تحديث AG-UI الأخير لتقليل الاحتكاك لكل من مُنشئي وكلاء الذكاء الاصطناعي ومهندسي الواجهة الأمامية.

  • أدوات تطوير برمجيات وقوالب: تقوم أداة سطر الأوامر npx create-ag-ui-app بإنشاء مشروع مع جميع التبعيات وعمليات التكامل النموذجية المضمنة.
  • مخططات واضحة: يتم تحديد إصدار الأحداث وتوثيقها، مما يدعم معالجة الأخطاء القوية وإمكانية التوسعة في المستقبل.
  • وثائق عملية: تساعد أدلة التكامل في العالم الحقيقي، وأمثلة التدفقات، والأصول المرئية في تقليل المحاولات والخطأ.

جميع الموارد والأدلة متاحة على AG-UI.com. يقوم فريق CopilotKit أيضًا بتنظيم ندوة عبر الإنترنت. ادعم مشروع المصدر المفتوح وقم بوضع نجمة لمستودع AG-UI على GitHub. مجتمع Discord: https://go.copilotkit.ai/AG-UI-Discord

حالات الاستخدام

  • الزملاء المدمجون: وكلاء الذكاء الاصطناعي التي تعمل جنبًا إلى جنب مع المستخدمين في التطبيقات الحالية، وتقدم اقتراحات وشروحات مع تطور المهام.
  • واجهات المستخدم التفاعلية: أنظمة الحوار التي تحافظ على حالة الجلسة وتدعم التفاعلات متعددة الأدوار مع استخدام الأدوات.
  • أتمتة سير العمل: وكلاء الذكاء الاصطناعي التي تُنسق التسلسلات التي تتضمن كل من الإجراءات الآلية وخطوات المشاركة البشرية.

الخاتمة

يوفر تحديث AG-UI الأخير بروتوكولًا خفيفًا محددًا جيدًا لإنشاء تطبيقات تفاعلية تعتمد على وكلاء الذكاء الاصطناعي. تُجرد بنيته القائمة على الأحداث الكثير من تعقيدات مزامنة المستخدم ووكيل الذكاء الاصطناعي، والاتصال في الوقت الفعلي، وإدارة الحالة. بفضل المخططات الواضحة، ودعم الإطار الواسع، والتركيز على التكامل العملي، يُمكّن تحديث AG-UI الأخير فرق التطوير من بناء أنظمة ذكاء اصطناعي تفاعلية أكثر موثوقية – دون حل نفس المشاكل منخفضة المستوى مرارًا وتكرارًا. يمكن للمطورين المهتمين بتبني أحدث إصدار من AG-UI العثور على أدوات تطوير برمجيات، ووثائق تقنية، وأصول التكامل على AG-UI.com.

المصدر: MarkTechPost