Magentic-UI: مساعد افتراضي مفتوح المصدر للتعاون مع المستخدمين في إنجاز المهام المعقدة
يُعَدّ استخدام الويب الحديث امتدادًا للتفاعلات الرقمية المتعددة، بدءًا من ملء النماذج وإدارة الحسابات وصولًا إلى تنفيذ استعلامات البيانات والتنقل عبر لوحات التحكم المعقدة. وعلى الرغم من ارتباط الويب ارتباطًا وثيقًا بعمليات الإنتاجية والعمل، إلا أن العديد من هذه الإجراءات لا تزال تتطلب مدخلات بشرية متكررة. ويُلاحظ هذا بشكل خاص في البيئات التي تتطلب تعليمات مفصلة أو قرارات تتجاوز عمليات البحث البسيطة.
التحديات في أتمتة المهام عبر الإنترنت
بينما برزت وكلاء الذكاء الاصطناعي لدعم أتمتة المهام، إلا أن العديد منها يُعطي الأولوية للاستقلالية التامة. ومع ذلك، غالبًا ما يؤدي هذا إلى تهميش التحكم من قبل المستخدم، مما يؤدي إلى نتائج تختلف عن توقعاته. تتمثل القفزة التالية في تعزيز الإنتاجية من خلال الذكاء الاصطناعي في وكلاء مصممين ليس ليحلوا محل المستخدمين، بل ليتعاونوا معهم، مع مزج الأتمتة بالمدخلات البشرية المستمرة في الوقت الفعلي للحصول على نتائج أكثر دقة وموثوقية.
يُشكل نقص الرؤية والتدخل أحد التحديات الرئيسية في نشر وكلاء الذكاء الاصطناعي للمهام القائمة على الويب. غالبًا ما لا يستطيع المستخدمون رؤية الخطوات التي يخطط لها الوكيل، وكيف ينوي تنفيذها، أو متى قد ينحرف عن المسار الصحيح. في السيناريوهات التي تتضمن قرارات معقدة، مثل إدخال معلومات الدفع، أو تفسير المحتوى الديناميكي، أو تشغيل البرامج النصية، يحتاج المستخدمون إلى آليات للتدخل وإعادة توجيه العملية. بدون هذه القدرات، تخاطر الأنظمة بالقيام بأخطاء لا رجعة فيها أو عدم مواءمة أهداف المستخدم. يُبرز هذا قصورًا كبيرًا في أتمتة الذكاء الاصطناعي الحالية: وهو غياب التصميم البشري المُبني على التفاعل الديناميكي، حيث يقوم المستخدمون بتوجيه وسياقة سلوك الوكيل ديناميكيًا، دون أن يكونوا مجرد متفرجين.
Magentic-UI: نهج جديد للتعاون بين الإنسان والذكاء الاصطناعي
قدمت شركة مايكروسوفت نظام Magentic-UI، وهو نموذج أولي مفتوح المصدر يُركز على التفاعل التعاوني بين الإنسان والذكاء الاصطناعي للمهام القائمة على الويب. على عكس الأنظمة السابقة التي تهدف إلى الاستقلالية الكاملة، يُعزز هذا النظام التخطيط المشترك في الوقت الفعلي، ومشاركة التنفيذ، والإشراف خطوة بخطوة من قبل المستخدم.
الميزات الرئيسية لـ Magentic-UI:
- التخطيط المشترك (Co-planning): يُتيح للمستخدمين عرض وتعديل الخطوات المقترحة من قبل الوكيل قبل البدء في التنفيذ، مما يوفر تحكمًا كاملاً في ما سيفعله الذكاء الاصطناعي.
- التنفيذ المشترك (Co-tasking): يُمكّن من الرؤية في الوقت الفعلي أثناء التشغيل، مما يسمح للمستخدمين بإيقاف مؤقت، أو تعديل، أو تولي إجراءات محددة.
- حماية الإجراءات (Action guards): تأكيدات قابلة للتخصيص لأنشطة عالية الخطورة مثل إغلاق علامات تبويب المتصفح أو النقر فوق “إرسال” في نموذج، وهي إجراءات قد يكون لها عواقب غير مقصودة.
- تعلم الخطط (Plan learning): يسمح لـ Magentic-UI بتذكر وصقل الخطوات للمهام المستقبلية، وتحسين الأداء بمرور الوقت من خلال الخبرة.
بنية Magentic-UI:
يعتمد Magentic-UI على إطار عمل AutoGen من مايكروسوفت، وهو مُتكامل بشكل وثيق مع Azure AI Foundry Labs. وهو تطوير مباشر لنظام Magentic-One المُقدم سابقًا. يتكون من فريق مُدار من الوكلاء:
- المدير (Orchestrator): يقود التخطيط وصنع القرار.
- متصفح الويب (WebSurfer): يتعامل مع تفاعلات المتصفح.
- المبرمج (Coder): يُنفذ التعليمات البرمجية في بيئة رملية.
- متصفح الملفات (FileSurfer): يُفسر الملفات والبيانات.
نتائج الاختبارات:
خضعت أداء Magentic-UI لاختبارات صارمة باستخدام معيار GAIA، والذي يتضمن مهامًا معقدة مثل التنقل على الويب وتفسير المستندات. أظهرت النتائج تحسنًا ملحوظًا في معدل إنجاز المهام عند التعاون مع المستخدم:
- بشكل مستقل: أكمل 30.3% من المهام بنجاح.
- مع مُستخدم مُحاكى: ارتفعت نسبة النجاح إلى 51.9% (تحسن بنسبة 71%).
السلامة والأمان:
يتميز Magentic-UI بآليات أمان قوية، حيث يتم تشغيل كل إجراء للمتصفح أو التعليمات البرمجية داخل حاوية Docker، مما يضمن عدم الكشف عن بيانات اعتماد المستخدم. يمكن للمستخدمين تحديد قوائم مسموح بها للوصول إلى المواقع، ويمكن حماية كل إجراء من خلال مطالبات الموافقة. كما نجح النظام في اختبارات اختراق ضد هجمات التصيد الاحتيالي وحقن التعليمات البرمجية.
الخلاصة:
يُعالج Magentic-UI مشكلة قائمة منذ زمن طويل في أتمتة الذكاء الاصطناعي، وهي نقص الشفافية والتحكم. بدلاً من استبدال المستخدمين، يُمكنهم من البقاء في مركز العملية. يُظهر النظام أداءً جيدًا حتى مع الحد الأدنى من المساعدة، ويتعلم التحسن في كل مرة. يُشكل التصميم المُدار، ووسائل الحماية القوية، ونموذج التفاعل المُفصل أساسًا قويًا لمساعدين ذكيين في المستقبل.
اترك تعليقاً