بروتوكول تفاعل الوكيل-المستخدم (AG-UI): ثورة في تفاعل الإنسان مع الذكاء الاصطناعي

يُعَدّ بروتوكول تفاعل الوكيل-المستخدم (AG-UI) نقلة نوعية في عالم الذكاء الاصطناعي، حيث يوفر معيارًا مفتوحًا وبسيطًا وقائمًا على الأحداث لربط وكلاء الذكاء الاصطناعي الخلفية بالتطبيقات الأمامية. يُمكن هذا البروتوكول التفاعل في الوقت الفعلي من خلال تيار من أحداث JSON منظمة، مما يُسهم في تطوير أنظمة ذكاء اصطناعي ليست مستقلة فقط، بل واعية للمستخدم ومتجاوبة معه.

تطور بروتوكولات وكلاء الذكاء الاصطناعي: من MCP إلى A2A وصولاً إلى AG-UI

لقد شهدت رحلة تطوير بروتوكولات وكلاء الذكاء الاصطناعي تطورًا تدريجيًا:

  • MCP (Message Control Protocol): يُمكّن هذا البروتوكول الاتصال المُنظم بين المكونات المعيارية.
  • A2A (Agent-to-Agent): سمح هذا البروتوكول بالتنسيق بين وكلاء الذكاء الاصطناعي المتخصصة.
  • AG-UI: يُمثّل هذا البروتوكول الحلقة المفقودة، حيث يُنشئ جسرًا بين وكلاء الذكاء الاصطناعي الخلفية وواجهات المستخدم الأمامية، مما يُمكّن المطورين من تحويل سير العمل المعتمدة على نماذج اللغات الكبيرة (LLM) إلى تطبيقات تفاعلية ديناميكية ومركزية على المستخدم.

لماذا نحتاج إلى AG-UI؟

حتى الآن، كانت معظم وكلاء الذكاء الاصطناعي تعمل في الخلفية بكفاءة عالية ولكن دون وضوح للمستخدم. على الرغم من استخدام أدوات مثل LangChain وLangGraph وCrewAI وMastra بشكل متزايد لتنسيق سير العمل المعقدة، إلا أن طبقة التفاعل ظلت مجزأة وعشوائية. كانت الطرق التقليدية تعتمد على:

  • تنسيقات WebSocket مخصصة.
  • حلول JSON مؤقتة.
  • حيل هندسة المطالبات مثل “Thought:nAction:”.

ومع ذلك، عند بناء وكلاء تفاعلية مثل Cursor – والتي تعمل جنبًا إلى جنب مع المستخدمين في بيئات البرمجة – فإن التعقيد يزداد بشكل كبير. يواجه المطورون عدة تحديات صعبة، منها:

  • البث المباشر لواجهة المستخدم: تُنتج نماذج اللغات الكبيرة الإخراج بشكل تدريجي، لذا يحتاج المستخدمون إلى رؤية الردود رمزًا تلو الآخر.
  • تنسيق الأدوات: يجب أن تتفاعل الوكلاء مع واجهات برمجة التطبيقات (APIs)، وتُشغّل التعليمات البرمجية، وأحيانًا تتوقف للحصول على ردود فعل من المستخدم دون حظر العملية أو فقدان السياق.
  • الحالة القابلة للتغيير المشتركة: بالنسبة لأشياء مثل قواعد البيانات أو جداول البيانات، لا يمكنك إعادة إرسال الكائنات الكاملة في كل مرة؛ بل تحتاج إلى اختلافات مُنظمة.
  • التزامن والتحكم: قد يُرسل المستخدمون استعلامات متعددة أو يلغون الإجراءات في منتصف الطريق. يجب إدارة الخيوط وحالات التشغيل بشكل نظيف.
  • الأمن والامتثال: تتطلب الحلول الجاهزة للمؤسسات دعم CORS، ورؤوس المصادقة، وسجلات التدقيق، وفصل واضح لمسؤوليات العميل والخادم.
  • اختلاف الأطر: تستخدم كل أداة وكلاء – LangGraph، CrewAI، Mastra – واجهاتها الخاصة، مما يُبطئ تطوير واجهة المستخدم الأمامية.

ما الذي يوفره AG-UI؟

يوفر AG-UI حلاً موحدًا. إنه بروتوكول بث أحداث خفيف الوزن يستخدم HTTP القياسي (مع أحداث مُرسلة من الخادم، أو SSE) لربط خلفية الوكيل بأي واجهة أمامية. ترسل طلب POST واحد إلى نقطة نهاية الوكيل، ثم تستمع إلى تيار من الأحداث المُنظمة في الوقت الفعلي. كل حدث يحتوي على:

  • نوع: مثل TEXT_MESSAGE_CONTENT، TOOL_CALL_START، STATE_DELTA
  • حمولة مُحددة: بيانات الحدث.

يدعم البروتوكول:

  • بث الرموز المباشر.
  • تقدم استخدام الأدوات.
  • اختلافات التصحيحات.
  • أحداث الأخطاء ودورة الحياة.
  • عمليات تسليم متعددة الوكلاء.

تجربة المطور: سهولة الاستخدام مع وكلاء الذكاء الاصطناعي

يأتي AG-UI مع مجموعات تطوير برمجيات (SDKs) بلغات TypeScript وPython، وهو مصمم للتكامل مع أي خلفية تقريبًا – OpenAI، Ollama، LangGraph، أو وكلاء مخصصة. يمكنك البدء في دقائق باستخدام دليل البدء السريع ومنصة التجربة. مع AG-UI:

  • تصبح مكونات واجهة المستخدم الأمامية والخلفية قابلة للتبديل.
  • يمكنك إضافة واجهة مستخدم React باستخدام مكونات CopilotKit دون أي تعديل على الخلفية.
  • يمكنك تبديل GPT-4 بنموذج Llama محلي دون تغيير واجهة المستخدم.
  • يمكنك مزج ومطابقة أدوات الوكيل (LangGraph، CrewAI، Mastra) من خلال نفس البروتوكول.

كما صُمّم AG-UI مع مراعاة الأداء: استخدم JSON العادي عبر HTTP للتوافق، أو قم بالترقية إلى مُسلسل ثنائي للحصول على سرعة أعلى عند الحاجة.

ما الذي يُمكّن AG-UI؟

ليس AG-UI مجرد أداة مطورين، بل هو مُحفّز لتجربة مستخدم غنية بالذكاء الاصطناعي. من خلال توحيد واجهة الاتصال بين الوكلاء والتطبيقات، يُمكّن AG-UI المطورين من:

  • بناء أسرع مع عدد أقل من المُكيّفات المخصصة.
  • تقديم تجربة مستخدم أكثر سلاسة وتفاعلية.
  • تصحيح الأخطاء وإعادة تشغيل سلوك الوكيل باستخدام سجلات مُتناسقة.
  • تجنب عوائق الموردين من خلال تبديل المكونات بحرية.

الخاتمة

يُمثّل AG-UI خطوة كبيرة إلى الأمام في مجال الذكاء الاصطناعي التفاعلي الذي يواجه المستخدم. مع استمرار نمو وكلاء نماذج اللغات الكبيرة في التعقيد والإمكانيات، تزداد الحاجة إلى بروتوكول اتصال نظيف وقابل للتوسيع ومفتوح. يوفر AG-UI بالضبط ذلك – معيارًا حديثًا لبناء وكلاء لا تتصرف فقط، بل تتفاعل. سواء كنت تبني مساعدين تلقائيين أو مساعدين خفيفين الوزن، فإن AG-UI يُضفي البنية والسرعة والمرونة على واجهة التفاعل بين واجهة المستخدم الأمامية والوكيل.

المصدر: MarkTechPost