بروتوكول AG-UI: ثورة في تواصل واجهات المستخدم مع وكلاء الذكاء الاصطناعي

تطورت وكلاء الذكاء الاصطناعي بشكل كبير، متجاوزة كونها مجرد روبوتات دردشة تُعيد الإجابات. أصبحت الآن أنظمة معقدة قادرة على التفكير خطوة بخطوة، واستدعاء واجهات برمجة التطبيقات (APIs)، وتحديث لوحات التحكم، والتعاون مع البشر في الوقت الفعلي. لكن هذا التطور يطرح سؤالاً أساسياً: كيف تتواصل هذه الوكلاء مع واجهات المستخدم؟

تحديات التواصل التقليدي

قد تعمل حلول مؤقتة مثل المنافذ (Sockets) وواجهات برمجة التطبيقات المخصصة في النماذج الأولية، إلا أنها لا تُناسب التوسع. فكل مشروع يعيد ابتكار طريقة بث النتائج، وإدارة استدعاءات الأدوات، أو معالجة تصحيحات المستخدم. هنا يأتي دور بروتوكول AG-UI (Agent–User Interaction) لسد هذه الفجوة.

ما الذي يقدمه بروتوكول AG-UI؟

يُعدّ AG-UI بروتوكول بث أحداث مصمم خصيصاً للتواصل بين الوكلاء وواجهات المستخدم. بدلاً من إرجاع كتلة نصية واحدة، تُصدر الوكلاء سلسلة متصلة من أحداث JSON:

  • TEXT_MESSAGE_CONTENT: لبث الاستجابات رمزاً تلو الآخر.
  • TOOL_CALL_START / ARGS / END: لاستدعاء الدوال الخارجية.
  • STATE_SNAPSHOT و STATE_DELTA: للحفاظ على تزامن حالة واجهة المستخدم مع الخلفية.
  • أحداث دورة الحياة (RUN_STARTED، RUN_FINISHED): لتحديد إطار كل تفاعل.

يتدفق كل هذا عبر ناقلات قياسية مثل HTTP SSE أو WebSockets، لذا لا يحتاج المطورون إلى إنشاء بروتوكولات مخصصة. تُشترك واجهة المستخدم مرة واحدة فقط، ويمكنها عرض النتائج الجزئية، وتحديث الرسوم البيانية، وحتى إرسال تصحيحات المستخدم أثناء التشغيل.

يجعل هذا التصميم AG-UI أكثر من مجرد طبقة رسائل – إنه عقد بين الوكلاء وواجهات المستخدم. يمكن أن تتطور أطر عمل الخلفية، ويمكن أن تتغير واجهات المستخدم، ولكن طالما أنها تتحدث AG-UI، يبقى كل شيء قابلاً للتشغيل البيني.

تكاملات الجهات الأولى والشركاء

يكتسب AG-UI شعبية واسعة بسبب اتساع نطاق تكاملاته المدعومة. بدلاً من ترك المطورين يربطون كل شيء يدوياً، تأتي العديد من أطر عمل الوكلاء مع دعم AG-UI مُدمج:

  • Mastra (TypeScript): دعم أصلي لـ AG-UI مع كتابة قوية، مثالي للتمويل والمساعدين القائمين على البيانات.
  • LangGraph: AG-UI مُدمج في سير عمل التنسيق بحيث يصدر كل عقدة أحداثاً منظمة.
  • CrewAI: تنسيق متعدد الوكلاء مُعرض لواجهات المستخدم عبر AG-UI، مما يسمح للمستخدمين بمتابعة وتوجيه “فرق الوكلاء”.
  • Agno: أنظمة متعددة الوكلاء كاملة المكدس مع خوادم خلفية جاهزة لـ AG-UI للوحات التحكم وأدوات التشغيل.
  • LlamaIndex: يضيف سير عمل استرجاع بيانات تفاعلية مع بث أدلة مباشرة إلى واجهات المستخدم.
  • Pydantic AI: مجموعة أدوات تطوير برمجيات Python مع AG-UI مُدمج، بالإضافة إلى تطبيقات نموذجية مثل AG-UI Dojo.
  • CopilotKit: مجموعة أدوات واجهة المستخدم الأمامية تقدم مكونات React تشترك في تدفقات AG-UI.

هناك تكاملات أخرى قيد التطوير – مثل وكلاء AWS Bedrock، و Google ADK، ووكلاء Cloudflare – مما سيجعل AG-UI في متناول الجميع على منصات الحوسبة السحابية الرئيسية. كما تتوسع مجموعات أدوات تطوير البرمجيات بلغات متعددة: الدعم الكامل بلغة Kotlin، بينما لغات .NET، و Go، و Rust، و Nim، و Java قيد التطوير.

حالات استخدام في العالم الحقيقي

تستخدم فرق الرعاية الصحية، والتمويل، والتحليلات AG-UI لتحويل تيارات البيانات الهامة إلى واجهات غنية بالسياق:

  • يرى الأطباء تحديثات بيانات المرضى الحيوية دون إعادة تحميل الصفحات.
  • يقوم متداولو الأسهم بتشغيل وكيل تحليل الأسهم ومشاهدة بث النتائج مباشرةً.
  • يشاهد المحللون لوحة تحكم تعمل بـ LangGraph تُظهر خطط الرسم البياني رمزاً تلو الآخر أثناء تفكير الوكيل.

يتجاوز AG-UI عرض البيانات، حيث يُبسط أتمتة سير العمل. يتم تقليل الأنماط الشائعة – مثل هجرة البيانات، وتلخيص البحوث، وملء النماذج – إلى تدفق حدث SSE واحد بدلاً من المنافذ المخصصة أو حلقات الاستطلاع. بما أن الوكلاء يصدرون فقط تصحيحات STATE_DELTA، فإن واجهة المستخدم تُحدث فقط الأجزاء التي تغيرت، مما يقلل من عرض النطاق الترددي ويُزيل عمليات إعادة التحميل المفاجئة. تُشغل نفس الآلية روبوتات دعم العملاء على مدار الساعة، والتي تُظهر مؤشرات الكتابة، وتقدم أدوات الاستدعاء، والإجابات النهائية في نافذة دردشة واحدة، مما يحافظ على تفاعل المستخدمين طوال التفاعل.

يُمكن AG-UI المطورين من إنشاء مساعدي البرمجة وتطبيقات متعددة الوكلاء باستخدام الحد الأدنى من أكواد الربط. يتم إنشاء تجارب تُشبه GitHub Copilot – اقتراحات في الوقت الفعلي تُبث في المحررين – بمجرد الاستماع إلى أحداث AG-UI. أطر عمل مثل LangGraph و CrewAI و Mastra تُصدر بالفعل أنواع أحداث المواصفات الـ 16، لذلك يمكن للفرق تبديل وكلاء الخلفية بينما تظل واجهة المستخدم الأمامية دون تغيير. يُسرّع هذا الفصل النمذجة الأولية عبر المجالات: يمكن لبرنامج الضرائب عرض تقديرات الاستقطاعات المتفائلة أثناء تشغيل التحقق من الصحة في الخلفية، ويمكن لصفحة CRM ملء تفاصيل العميل تلقائياً أثناء إرجاع الوكيل بيانات منظمة إلى واجهة مستخدم Svelte + Tailwind.

AG-UI Dojo

قدّم CopilotKit مؤخراً AG-UI Dojo، وهي مجموعة من العروض التوضيحية القابلة للتشغيل تُعلّم وتُصدق تكاملات AG-UI من النهاية إلى النهاية. تتضمن كل عينة معاينة مباشرة، ورمزاً، ووثائق مرتبطة، وتغطي ستة أساسيات ضرورية لواجهات المستخدم الإنتاجية:

  • الدردشة الوكيلة (البث + خطافات الأدوات)
  • التخطيط مع مشاركة الإنسان
  • واجهة المستخدم التوليدية القائمة على الوكلاء والأدوات
  • الحالة المُشتركة
  • تحديثات الحالة التنبؤية للتعاون في الوقت الفعلي

يمكن للفرق استخدام Dojo كقائمة مرجعية لاستكشاف مشاكل ترتيب الأحداث، وشكل الحمولة، ومزامنة حالة واجهة المستخدم والوكيل قبل الشحن، مما يقلل من غموض التكامل ووقت تصحيح الأخطاء.

خارطة الطريق والمساهمات المجتمعية

تُظهر خارطة الطريق العامة اتجاه AG-UI وأين يمكن للمطورين المساهمة:

  • نضج مجموعات أدوات تطوير البرمجيات: استثمار مستمر في مجموعات أدوات تطوير البرمجيات TypeScript و Python، مع التوسع في المزيد من اللغات.
  • أدوات تصحيح الأخطاء وأدوات المطور: معالجة أفضل للأخطاء، وقابلية للملاحظة، ووضوح أحداث دورة الحياة.
  • الأداء وناقلات النقل: العمل على معالجة الحمولات الكبيرة وناقلات البث البديلة خارج SSE/WS.
  • تطبيقات وأماكن لعب نموذجية: يُظهر AG-UI Dojo لبنات بناء لواجهات المستخدم ويتوسع مع المزيد من الأنماط.

من جانب المساهمات، أضاف المجتمع تكاملات، وحسّن مجموعات أدوات تطوير البرمجيات، ووسّع الوثائق، وبنى عروضاً توضيحية. جاءت طلبات السحب عبر أطر عمل مثل Mastra و LangGraph و Pydantic AI من كل من المُحافظين والمساهمين الخارجيين. يضمن هذا النموذج التعاوني أن يُشكل AG-UI احتياجات المطورين الحقيقية، وليس فقط كتاب المواصفات.

الخلاصة

يُعتبر AG-UI بروتوكول التفاعل الافتراضي لواجهات مستخدم الوكلاء. يُوحد الأرضية بين الوكلاء وواجهات المستخدم الأمامية، مما يجعل التطبيقات أكثر استجابة وشفافية وقابلية للصيانة. مع تكاملات الجهات الأولى عبر أطر العمل الشائعة، والمساهمات المجتمعية التي تُشكل خارطة الطريق، والأدوات مثل AG-UI Dojo التي تُقلل من عتبة الدخول، فإن النظام البيئي ينضج بسرعة.

الأسئلة الشائعة

س1: ما هي المشكلة التي يحلها AG-UI؟

يُوحد AG-UI كيفية تواصل الوكلاء مع واجهات المستخدم. بدلاً من واجهات برمجة التطبيقات المؤقتة، يُحدد بروتوكول حدث واضح لبث النص، واستدعاءات الأدوات، وتحديثات الحالة، وإشارات دورة الحياة – مما يجعل واجهات المستخدم التفاعلية أسهل في البناء والصيانة.

س2: أي أطر عمل تدعم AG-UI بالفعل؟

يحتوي AG-UI على تكاملات من الجهة الأولى مع Mastra، و LangGraph، و CrewAI، و Agno، و LlamaIndex، و Pydantic AI. وتشمل تكاملات الشركاء CopilotKit على واجهة المستخدم الأمامية. الدعم لوكلاء AWS Bedrock، و Google ADK، ولغات إضافية مثل .NET، و Go، و Rust قيد التطوير.

س3: كيف يختلف AG-UI عن واجهات برمجة التطبيقات REST؟

يعمل REST للمهام الفردية لطلب – استجابة. صُمّم AG-UI للوكلاء التفاعليين – فهو يدعم بث الإخراج، والتحديثات المتزايدة، واستخدام الأدوات، وإدخال المستخدم أثناء التشغيل، وهو ما لا يستطيع REST معالجته بشكل أصلي.

س4: ما هي ناقلات النقل التي يستخدمها AG-UI؟

بشكل افتراضي، يعمل AG-UI على أحداث الخادم المُرسلة عبر HTTP (SSE). يدعم أيضاً WebSockets، وتتضمن خارطة الطريق استكشاف ناقلات نقل بديلة لحالات استخدام البيانات عالية الأداء أو الثنائية.

س5: كيف يمكن للمطورين البدء في استخدام AG-UI؟

يمكنك تثبيت مجموعات أدوات تطوير البرمجيات الرسمية (TypeScript، Python) أو استخدام أطر عمل مدعومة مثل Mastra أو Pydantic AI. يُقدم AG-UI Dojo أمثلة عملية ولبنات بناء واجهة المستخدم لتجربة تيارات الأحداث.

المصدر: MarkTechPost