تحسين ذكاء اصطناعي لمعهد ماساتشوستس للتكنولوجيا: قفزة نوعية في التخطيط بدقة تصل إلى 94%

يُقدم باحثون من مختبر علوم الكمبيوتر والذكاء الاصطناعي (CSAIL) في معهد ماساتشوستس للتكنولوجيا (MIT) إنجازًا بارزًا في مجال الذكاء الاصطناعي، يتمثل في تطوير إطار عمل جديد يُعزز بشكل كبير قدرة نماذج اللغات الكبيرة على التخطيط. يُعرف هذا الإطار بـ “PDDL-INSTRUCT”، وهو يجمع بين التفكير المنطقي المتسلسل والتحقق الخارجي من خطط العمل، مما يؤدي إلى تحسين أداء هذه النماذج في مهمات التخطيط المعقدة.

تحدي التخطيط في نماذج اللغات الكبيرة

تُعاني نماذج اللغات الكبيرة من مشكلة توليد خطط تبدو منطقية ظاهريًا، لكنها في الواقع غير صالحة من الناحية المنطقية. يُعالج PDDL-INSTRUCT هذه المشكلة من خلال:

  • دلالات واضحة للحالة والفعل: يُحدد الإطار دلالات واضحة لكل من حالة النظام والفعاليات التي تُنفذ عليه.
  • التحقق من صحة الخطوات: يتم التحقق من صحة كل خطوة من خطوات الخطة باستخدام أداة التحقق من الخطط “VAL”. يمكن أن يكون التغذية الراجعة من هذه الأداة ثنائية (صحيح/غير صحيح) أو مفصلة (توضح السبب وراء الخطأ). أظهرت التغذية الراجعة المفصلة نتائج أفضل بكثير.
  • التفكير المنطقي المتسلسل (CoT): يُشجع الإطار النموذج على التفكير خطوة بخطوة، مع مراعاة الشروط المسبقة والآثار المترتبة على كل فعل.
  • التحسين على مرحلتين: تتضمن عملية التحسين مرحلتين: المرحلة الأولى تُركز على تحسين سلاسل التفكير، بينما تُركز المرحلة الثانية على تحسين دقة التخطيط النهائي.

النتائج المذهلة: تحسين يصل إلى 64 مرة

أُجريت التجارب على مجموعة من اختبارات التخطيط المعروفة باسم “PlanBench”، والتي تتضمن:

  • Blocksworld: حقق النموذج المُحسّن (Llama-3-8B) دقة تصل إلى 94% في توليد خطط صالحة.
  • Mystery Blocksworld: أظهر النموذج تحسنًا كبيرًا، حيث زادت نسبة الخطط الصالحة بمقدار 64 مرة مقارنة بالنتائج السابقة. يُعد هذا الاختبار تحديًا خاصًا، حيث تُخفى أسماء المتغيرات لمنع النموذج من الاعتماد على أنماط محددة.
  • Logistics: شهد هذا الاختبار أيضًا زيادة كبيرة في عدد الخطط الصالحة.

بشكل عام، أظهرت النتائج تحسنًا مطلقًا يصل إلى 66% مقارنة بالنماذج غير المُحسّنة. كما أظهرت أهمية التغذية الراجعة المفصلة من أداة التحقق.

الاستنتاج: طريق جديد للتدريب العصبي الرمزي

يُظهر PDDL-INSTRUCT إمكانية تحسين كبير في قدرة نماذج اللغات الكبيرة على التخطيط من خلال دمج التفكير المنطقي المتسلسل والتحقق الخارجي. على الرغم من أن نطاق التطبيق الحالي يقتصر على مجالات PDDL الكلاسيكية، إلا أن النتائج المُذهلة تُشير إلى طريق جديد للتدريب العصبي الرمزي، حيث تُربط خطوات التفكير بدلالات رسمية ويتم التحقق منها تلقائيًا. يُشير هذا إلى فائدة فورية في أنظمة الوكلاء التي تسمح بوجود مُتحقق في الحلقة، بينما لا تزال هناك حاجة للبحث في مجالات التخطيط طويلة الأمد، والتخطيط الزمني/الرقمي، والتخطيط الحساس للتكلفة.

روابط إضافية

  • الورقة البحثية
  • [صفحة GitHub](رابط GitHub)
  • [حساب Twitter](رابط Twitter)
  • [صفحة Reddit](رابط Reddit)
  • [النشرة البريدية](رابط النشرة البريدية)

المصدر: MarkTechPost