بروتوكول AG-UI: تفاعل سلس بين وكلاء الذكاء الاصطناعي وتطبيقات الواجهة الأمامية

شهدت وكلاء الذكاء الاصطناعي تطوراً ملحوظاً في أتمتة المهام الخلفية، مثل تلخيص النصوص، وهجرة البيانات، والجدولة. لكن هذه الوكلاء تعمل عادةً خلف الكواليس، مُستجيبة لسير عمل مُحدد مسبقاً، وتُعيد النتائج دون تفاعل المستخدم. ومع تزايد تفاعلية تطبيقات الذكاء الاصطناعي، برزت الحاجة إلى وكلاء قادرين على التعاون المباشر مع المستخدمين في الوقت الفعلي. يُقدم بروتوكول AG-UI (Agent-User Interaction Protocol) حلاً لهذه الحاجة، كونه بروتوكولاً مفتوحاً قائماً على الأحداث، مصمم لإنشاء طبقة اتصال مُنسقة بين وكلاء الذكاء الاصطناعي الخلفية وتطبيقات الواجهة الأمامية، مما يُمكّن التفاعل في الوقت الفعلي من خلال تدفق أحداث JSON مُنسقة. ومن خلال تنظيم هذا التبادل، يُسهّل AG-UI تطوير أنظمة ذكاء اصطناعي ليست مستقلة فحسب، بل واعية للمستخدم ومتجاوبة معه.

تطور بروتوكولات الوكلاء: من MCP إلى A2A وصولاً إلى AG-UI

تطور بروتوكول AG-UI بشكل تدريجي. فقد بدأ الأمر ببروتوكول MCP (Message Control Protocol)، الذي مكّن الاتصال المُنسق عبر المكونات المُعَمّلة. ثم أتت بروتوكولات A2A (Agent-to-Agent) التي مكّنت التنسيق بين وكلاء الذكاء الاصطناعي المُتخصصة. ويُكمّل AG-UI الصورة، كونه أول بروتوكول يُنشئ جسرًا واضحًا بين وكلاء الذكاء الاصطناعي الخلفية وواجهات المستخدم الأمامية. هذه هي الطبقة المفقودة للمطورين الذين يحاولون تحويل سير عمل نماذج اللغات الكبيرة (LLM) الخلفية إلى تطبيقات ديناميكية، وتفاعلية، ومركزية على الإنسان.

لماذا نحتاج إلى AG-UI؟

حتى الآن، كانت معظم وكلاء الذكاء الاصطناعي تعمل في الخلفية بكفاءة، لكنها غير مرئية. تُستخدم أدوات مثل LangChain وLangGraph وCrewAI وMastra بشكل متزايد لتنسيق سير العمل المعقد، إلا أن طبقة التفاعل ظلت مجزأة وعشوائية. وقد كانت تنسيقات WebSocket المخصصة، وحيل JSON، أو حيل هندسة المُطالبات مثل “Thought:nAction:” هي القاعدة. لكن عند بناء وكلاء تفاعليين مثل Cursor –الذين يعملون جنباً إلى جنب مع المستخدمين في بيئات البرمجة–، تزداد التعقيدات بشكل كبير. ويواجه المطورون عدة مشاكل صعبة، منها:

  • البث المباشر لواجهة المستخدم: تُنتج نماذج اللغات الكبيرة النتائج بشكل تدريجي، لذا يحتاج المستخدمون إلى رؤية الردود رمزاً برمز.
  • تنسيق الأدوات: يجب أن تتفاعل الوكلاء مع واجهات برمجة التطبيقات (APIs)، وتُشغل الأكواد، وأحياناً تتوقف للحصول على تعليقات من المستخدم دون حجب السياق أو فقده.
  • الحالة المُتغيرة المُشتركة: في حالات مثل قواعد البيانات أو جداول البيانات، لا يمكنك إعادة إرسال الكائنات الكاملة في كل مرة؛ تحتاج إلى اختلافات مُنسقة.
  • التزامن والتحكم: قد يُرسل المستخدمون استعلامات متعددة أو يُلغون الإجراءات في منتصف الطريق. يجب إدارة الخيوط وحالات التشغيل بشكل نظيف.
  • الأمان والامتثال: تتطلب الحلول الجاهزة للمؤسسات دعم CORS، ورؤوس المصادقة، وسجلات التدقيق، والفصل الواضح لمسؤوليات العميل والخادم.
  • اختلاف الأطر: تستخدم كل أداة وكيل –LangGraph، CrewAI، Mastra– واجهاتها الخاصة، مما يُبطئ تطوير الواجهة الأمامية.

ما الذي يقدمه AG-UI؟

يُقدم AG-UI حلاً موحداً. إنه بروتوكول بث أحداث خفيف الوزن يستخدم HTTP القياسي (مع أحداث المُخدم المُرسلة، أو SSE) لربط خلفية الوكيل بأي واجهة أمامية. ترسل طلب POST واحد إلى نقطة نهاية وكيلك، ثم تستمع إلى تدفق أحداث مُنسقة في الوقت الفعلي. يحتوي كل حدث على:

  • نوع: مثل TEXT_MESSAGE_CONTENT، TOOL_CALL_START، STATE_DELTA
  • حمولة مُكتوبة مُبسطة

ويدعم البروتوكول:

  • بث الرموز المباشر
  • تقدم استخدام الأدوات
  • اختلافات التصحيحات والرقعة
  • أخطاء وأحداث دورة الحياة
  • عمليات تسليم متعددة الوكلاء

تجربة مطور سهلة: قابس وتشغيل لوكلاء الذكاء الاصطناعي

يأتي AG-UI مع مجموعات تطوير برمجيات (SDKs) بلغات TypeScript وPython، وهو مُصمم للتكامل مع أي خلفية تقريباً –OpenAI، Ollama، LangGraph، أو وكلاء مخصصة. يمكنك البدء في دقائق باستخدام دليل البدء السريع ومنصة الاختبار. مع AG-UI:

  • تصبح مكونات الواجهة الأمامية والخلفية قابلة للتبديل.
  • يمكنك إضافة واجهة مستخدم React باستخدام مكونات CopilotKit دون أي تعديل على الخلفية.
  • يمكنك تبديل GPT-4 بنموذج Llama محلي دون تغيير واجهة المستخدم.
  • يمكنك مزج ومطابقة أدوات الوكيل (LangGraph، CrewAI، Mastra) من خلال نفس البروتوكول.

كما صُمّم AG-UI مع مراعاة الأداء: استخدم JSON العادي عبر HTTP من أجل التوافق، أو قم بالترقية إلى مُسلسل ثنائي للحصول على سرعة أعلى عند الحاجة.

ما الذي يُمكّن AG-UI؟

AG-UI ليس مجرد أداة مطورين – بل هو محفز لتجربة مستخدم غنية بالذكاء الاصطناعي. من خلال توحيد الواجهة بين الوكلاء والتطبيقات، يُمكّن المطورين من:

  • بناء أسرع مع عدد أقل من المُكيّفات المخصصة.
  • تقديم تجربة مستخدم أكثر سلاسة وتفاعلية.
  • تصحيح أخطاء سلوك الوكيل وإعادة تشغيله باستخدام سجلات مُتناسقة.
  • تجنب اعتماد البائعين من خلال تبديل المكونات بحرية.

على سبيل المثال، يمكن لوكيل تعاوني مدعوم بـ LangGraph الآن مشاركة خطته الحية في واجهة مستخدم React. يمكن لمساعد قائم على Mastra التوقف لطلب تأكيد من المستخدم قبل تنفيذ التعليمات البرمجية. يمكن لوكلاء AG2 وA2A تبديل السياقات بسلاسة مع إبقاء المستخدم على اطلاع.

الخاتمة

AG-UI خطوة كبيرة إلى الأمام للذكاء الاصطناعي التفاعلي الذي يواجه المستخدم. مع استمرار نمو وكلاء نماذج اللغات الكبيرة في التعقيد والإمكانيات، تصبح الحاجة إلى بروتوكول اتصال نظيف، وقابل للتوسيع، ومفتوح أكثر إلحاحاً. يُقدم AG-UI هذا بالضبط – معيار حديث لبناء وكلاء لا تتصرف فقط، بل تتفاعل. سواء كنت تبني مساعدين آليين أو مساعدين خفيفين الوزن، فإن AG-UI يُضيف هيكلة، وسرعة، ومرونة إلى واجهة الوكيل الأمامية. تفضل بزيارة صفحة GitHub هنا. جميع الحقوق لهذه الدراسة تخص باحثي هذا المشروع. شكر خاص لفريق Tawkit على القيادة الفكرية. وقد دعمنا فريق Tawkit في هذا المحتوى/المقال.

المصدر: MarkTechPost