بحث جوجل الذكي متعدد الوكلاء (MASS): إطار عمل جديد لتحسين وكلاء الذكاء الاصطناعي

يُعدّ استخدام أنظمة متعددة الوكلاء تطوراً بالغ الأهمية في مجال الذكاء الاصطناعي، وذلك لقدرتها على تنسيق عمل نماذج اللغات الكبيرة (LLMs) المتعددة لحل المشكلات المعقدة. وبدلاً من الاعتماد على منظور نموذج واحد، تقوم هذه الأنظمة بتوزيع الأدوار بين الوكلاء، حيث يساهم كل وكيل بوظيفة فريدة. ويعزز هذا التقسيم للعمل قدرة النظام على التحليل والاستجابة والتصرف بطرق أكثر قوة ومتانة. سواءً في تصحيح الأكواد البرمجية، أو تحليل البيانات، أو توليد النصوص المعززة بالاسترجاع، أو صنع القرار التفاعلي، فإن الوكلاء المُدارين بنماذج اللغات الكبيرة تحقق نتائج لا تستطيع النماذج المفردة تحقيقها باستمرار.

قوة التصميم في أنظمة متعددة الوكلاء

تكمن قوة هذه الأنظمة في تصميمها، خاصةً في تكوين الروابط بين الوكلاء، والمعروفة باسم “التراكيب الطوبولوجية”، وفي التعليمات المحددة الموجهة لكل وكيل، والتي تُعرف بـ”المطالبات”. ومع نضج هذا النموذج الحسابي، تحول التحدي من إثبات جدواه إلى تحسين البنية والسلوك لتحقيق نتائج أفضل.

التحديات في تصميم أنظمة متعددة الوكلاء

تتمثل إحدى المشاكل الرئيسية في صعوبة تصميم هذه الأنظمة بكفاءة. فعند تغيير المطالبات (المدخلات المُهيكلة التي توجه دور كل وكيل) قليلاً، قد تتغير الأداء بشكل كبير. هذه الحساسية تجعل التوسع محفوفاً بالمخاطر، خاصةً عندما تكون الوكلاء مرتبطة معاً في سير عمل حيث تُستخدم مخرجات وكيل ما كمدخلات لوكيل آخر. فقد تتكاثر الأخطاء أو حتى تتضخم. علاوة على ذلك، فإن القرارات المتعلقة بالهندسة الطوبولوجية، مثل تحديد عدد الوكلاء المشاركين، وأسلوب تفاعلهم، وتسلسل المهام، لا تزال تعتمد بشكل كبير على التكوين اليدوي والتجربة والخطأ. مساحة التصميم واسعة وغير خطية، حيث تجمع بين العديد من الخيارات لكل من هندسة المطالبات وبناء الطوبولوجيا. وكان تحسين كليهما في وقت واحد بعيداً عن متناول أساليب التصميم التقليدية.

بحث جوجل: إطار عمل MASS

قدّم باحثون في جوجل وجامعة كامبريدج إطار عمل جديداً يُسمى “بحث نظام متعدد الوكلاء” (MASS). تقوم هذه الطريقة بأتمتة تصميم أنظمة متعددة الوكلاء من خلال تداخل تحسين كل من المطالبات والطوبولوجيات في نهج مُرحلي. وعلى عكس المحاولات السابقة التي تعاملت مع المكونين بشكل مستقل، يبدأ MASS بتحديد العناصر (المطالبات والهياكل الطوبولوجية) الأكثر تأثيراً على الأداء. وبتقليل البحث إلى هذه المساحة الفرعية المؤثرة، يعمل الإطار بكفاءة أكبر مع تقديم نتائج ذات جودة أعلى.

مراحل عمل إطار عمل MASS

يتقدم الإطار عبر ثلاث مراحل:

  1. التحسين الموضعي للمطالبات: يتم تحسين مطالبات كل وحدة بناء في نظام متعدد الوكلاء.
  2. اختيار تراكيب سير العمل الفعالة: بناءً على المطالبات المُحسّنة، يتم اختيار التراكيب الطوبولوجية.
  3. التحسين العالمي للمطالبات: يتم ضبط التعليمات بدقة على مستوى النظام بأكمله لتعظيم الكفاءة الجماعية.

لا يقتصر الإطار على تقليل العبء الحسابي فحسب، بل يُزيل أيضاً عبء الضبط اليدوي عن الباحثين.

النتائج و التحسينات

في مهام مثل المنطق، والفهم متعدد الخطوات، وتوليد الأكواد، تفوقت أنظمة متعددة الوكلاء المُحسّنة باستمرار على المعايير القياسية الحالية. في اختبار الأداء باستخدام Gemini 1.5 Pro على مجموعة بيانات MATH، أظهرت الوكلاء الذين تم تحسين مطالباتهم دقة متوسطة حوالي 84% باستخدام تقنيات مطالبات مُحسّنة، مقارنة بـ 76-80% للوكلاء المُوسّعة من خلال الاتساق الذاتي أو المناقشة متعددة الوكلاء. في معيار HotpotQA، حقق استخدام طوبولوجيا المناقشة ضمن MASS تحسيناً بنسبة 3%. على النقيض من ذلك، فشلت الطوبولوجيات الأخرى، مثل الانعكاس أو التلخيص، في تحقيق مكاسب أو حتى أدت إلى تدهور بنسبة 15%. على LiveCodeBench، وفرت طوبولوجيا Executor زيادة بنسبة +6%، لكن أساليب مثل الانعكاس شهدت نتائج سلبية مرة أخرى.

النقاط الرئيسية

  • تعقيد تصميم أنظمة متعددة الوكلاء يتأثر بشكل كبير بحساسية المطالبات والترتيب الطوبولوجي.
  • تحسين المطالبات، على مستوى الوحدة ونظام العمل، أكثر فعالية من مجرد زيادة عدد الوكلاء.
  • ليست كل الطوبولوجيات مفيدة؛ المناقشة أضافت +3% في HotpotQA، بينما تسبب الانعكاس في انخفاض يصل إلى -15%.
  • يُدمج إطار عمل MASS تحسين المطالبات والطوبولوجيا في ثلاث مراحل، مما يقلل بشكل كبير من العبء الحسابي وعبء التصميم.
  • طوبولوجيات مثل المناقشة و Executor فعالة، بينما قد تُقلل أخرى، مثل الانعكاس والتلخيص، من أداء النظام.
  • يتجنب MASS تعقيد البحث الكامل من خلال تقليم مساحة التصميم بناءً على تحليل التأثير المبكر، مما يحسن الأداء مع توفير الموارد.
  • النهج مُدوّن ويدعم تكوينات وكلاء قابلة للتوصيل والتشغيل، مما يجعله قابلاً للتكيف مع مختلف المجالات والمهام.
  • نماذج أنظمة متعددة الوكلاء النهائية من MASS تتفوق على النماذج القياسية المتقدمة عبر العديد من المعايير مثل MATH و HotpotQA و LiveCodeBench.

الخلاصة

يحدد هذا البحث حساسية المطالبات وتعقيد الطوبولوجيا كعوائق رئيسية في تطوير أنظمة متعددة الوكلاء (MAS) ويقترح حلاً مُهيكلاً يُحسّن كلا المجالين بشكل استراتيجي. يُظهر إطار عمل MASS نهجاً قابلاً للتوسع وكفاءة في تصميم أنظمة متعددة الوكلاء، مع تقليل الحاجة إلى الإدخال البشري مع تعظيم الأداء. يقدم البحث أدلة مقنعة على أن تصميم المطالبات بشكل أفضل أكثر فعالية من مجرد إضافة وكلاء، وأن البحث المُستهدف ضمن مجموعات فرعية طوبولوجية مؤثرة يؤدي إلى مكاسب كبيرة في المهام الواقعية.

المصدر: MarkTechPost