هندسة وكلاء الخلط (MoA): نقلة نوعية في أداء نماذج اللغات الضخمة

تُعد هندسة وكلاء الخلط (Mixture-of-Agents – MoA) نهجًا تحوليًا لتعزيز أداء نماذج اللغات الضخمة (LLM)، خاصةً في المهام المعقدة والمتشعبة التي قد تعاني فيها النماذج المفردة من قصور في الدقة أو المنطق أو التخصص حسب المجال.

كيف تعمل هندسة وكلاء الخلط؟

  • هيكل طبقي: تُنظم أطر عمل MoA العديد من وكلاء LLM المتخصصين في طبقات. يتلقى كل وكيل ضمن طبقة جميع مخرجات الوكلاء في الطبقة السابقة كسياق لاستجابته الخاصة – وهذا يعزز المخرجات الأكثر ثراءً وشمولية.
  • تخصص الوكلاء: يمكن تصميم كل وكيل أو ضبطه بدقة لمجالات أو أنواع مشاكل محددة (مثل القانون، الطب، المالية، البرمجة)، ليعمل بشكل مشابه لفريق من الخبراء، يساهم كل منهم برؤى فريدة.
  • تركيب المعلومات التعاوني: تبدأ العملية بتوزيع موجه (Prompt) بين وكلاء المقترحين الذين يقدم كل منهم إجابات ممكنة. يتم تجميع مخرجاتهم، وصقلها، وتجميعها بواسطة طبقات لاحقة (مع وكلاء “المجمعين”)، مما يخلق تدريجيًا نتيجة واحدة شاملة وعالية الجودة.
  • التحسين المستمر: من خلال تمرير الاستجابات عبر طبقات متعددة، يحسن النظام بشكل متكرر عمق المنطق، والاتساق، والدقة – بشكل مشابه لألواح خبراء البشر الذين يراجعون اقتراحًا ويعززونه.

لماذا تتفوق MoA على نماذج LLM المفردة؟

  • أداء أعلى: تفوقت أنظمة MoA مؤخرًا على النماذج الرائدة المفردة (مثل GPT-4 Omni) في معايير تقييم LLM التنافسية، محققةً، على سبيل المثال، 65.1٪ على AlpacaEval 2.0 مقابل 57.5٪ لـ GPT-4 Omni – باستخدام نماذج LLM مفتوحة المصدر فقط.
  • معالجة أفضل للمهام المعقدة متعددة الخطوات: إن تفويض المهام الفرعية إلى وكلاء يتمتعون بخبرة محددة في المجال يسمح باستجابات دقيقة وموثوقة حتى في الطلبات المعقدة. هذا يعالج القيود الرئيسية للنماذج “متعددة المهام”.
  • القابليّة للتوسّع والتكيّف: يمكن إضافة وكلاء جدد أو إعادة تدريب الوكلاء الحاليين للتعامل مع الاحتياجات الناشئة، مما يجعل النظام أكثر مرونة من إعادة تدريب نموذج أحادي على كل تحديث.
  • تقليل الأخطاء: من خلال منح كل وكيل تركيزًا أضيق واستخدام منسق لتنسيق المخرجات، تقلل هندسة MoA من احتمالية حدوث أخطاء وسوء الفهم – مما يعزز كل من الموثوقية والتفسير.

مثال عملي وتطبيقات

تخيل تشخيصًا طبيًا: يتخصص وكيل واحد في الأشعة، وآخر في علم الجينوم، وثالث في العلاجات الدوائية. يراجع كل منهم حالة المريض من زاوية خاصة به. يتم دمج استنتاجاتهم ووزنها، مع قيام مجمعين من المستوى الأعلى بتجميع أفضل توصية للعلاج. يتم الآن تكييف هذا النهج مع الذكاء الاصطناعي لكل شيء من التحليل العلمي إلى التخطيط المالي، والقانون، وإنشاء المستندات المعقدة.

النقاط الرئيسية

  • الذكاء الجماعي مقابل الذكاء الاصطناعي الأحادي: تستغل هندسة MoA نقاط القوة الجماعية للوكلاء المتخصصين، مما ينتج عنه نتائج تتجاوز النماذج العامة المفردة.
  • النتائج الرائدة وحافة البحث المفتوحة: تحقق أفضل نماذج MoA نتائج رائدة في معايير الصناعة وهي محور بحث نشط، يدفع حدود قدرة الذكاء الاصطناعي إلى الأمام.
  • الإمكانات التحويلية: من تطبيقات المؤسسات المهمة إلى مساعدي البحث وأتمتة المجالات المحددة، يُعيد اتجاه MoA تشكيل ما هو ممكن مع وكلاء الذكاء الاصطناعي.

باختصار، يؤدي الجمع بين وكلاء الذكاء الاصطناعي المتخصصين – كل منهم يتمتع بخبرة محددة في المجال – من خلال هندسة MoA إلى مخرجات أكثر موثوقية ودقة من أي نموذج LLM مفرد، خاصةً للمهام المتطورة متعددة الأبعاد.

المصادر:

[قائمة المصادر الأصلية باللغة الإنجليزية، مع ترجمة مختصرة للعناوين العربية إن أمكن]

المصدر: MarkTechPost