ميمب: إطار عمل مستقل عن المهمة لتعزيز الذاكرة الإجرائية في وكلاء اللغات الكبيرة
يُعدّ وكلاء اللغات الكبيرة (LLM agents) أدوات قوية قادرة على إدارة مهام معقدة، بدءًا من البحث على الويب وتوليد التقارير ووصولاً إلى تحليل البيانات وسير العمل البرمجية متعددة الخطوات. ومع ذلك، فإنهم يواجهون صعوبةً في التعامل مع الذاكرة الإجرائية، والتي غالبًا ما تكون جامدة، مصممة يدويًا، أو محصورة داخل أوزان النموذج. هذا يجعلها هشة، حيث يمكن أن تؤدي الأحداث غير المتوقعة، مثل أعطال الشبكة أو تغييرات واجهة المستخدم، إلى إعادة تشغيل كاملة. وعلى عكس البشر الذين يتعلمون من خلال إعادة استخدام التجارب السابقة كروتين، يفتقر وكلاء LLM الحاليون إلى طريقة منهجية لبناء وصقل وإعادة استخدام المهارات الإجرائية. وتقدم الأطر الحالية تجريدات، لكنها تترك تحسين دورات حياة الذاكرة دون حلٍّ كبير.
دور الذاكرة في وكلاء اللغات الكبيرة
تُلعب الذاكرة دورًا بالغ الأهمية في وكلاء اللغة، حيث تسمح لهم باستدعاء التفاعلات السابقة عبر سياقات قصيرة المدى، وحلقية، وطويلة المدى. بينما تستخدم الأنظمة الحالية طرقًا مثل تضمين المتجهات، والبحث الدلالي، والهياكل الهرمية لتخزين واسترجاع المعلومات، إلا أن إدارة الذاكرة بكفاءة، خاصةً الذاكرة الإجرائية، لا تزال تمثل تحديًا. تساعد الذاكرة الإجرائية الوكلاء على استيعاب وتلقين المهام المتكررة، ومع ذلك، فإن استراتيجيات إنشاء وتحديث وإعادة استخدامها لم يتم استكشافها بشكل كافٍ. وبالمثل، يتعلم الوكلاء من التجربة من خلال التعلم المعزز، أو التقليد، أو إعادة التشغيل، لكنهم يواجهون مشاكل مثل انخفاض الكفاءة، وضعف التعميم، والنسيان.
إطار عمل ميمب: ذاكرة إجرائية قابلة للتكيف
يقدم باحثون من جامعة تشجيانغ ومجموعة علي بابا إطار عمل ميمب (Memp)، المصمم لمنح الوكلاء ذاكرةً إجرائيةً مدى الحياة وقابلة للتكيف. يحوّل ميمب المسارات السابقة إلى تعليمات مفصلة على مستوى الخطوات ونصوصًا عالية المستوى، مع تقديم استراتيجيات لبناء الذاكرة واسترجاعها وتحديثها. وعلى عكس الأساليب الثابتة، فهو يُحسّن المعرفة باستمرار من خلال الإضافة، والتحقق، والتأمل، والتخلص، مما يضمن الصلة والكفاءة.
تجارب ميمب ونتائجها
عند اختباره على ALFWorld و TravelPlanner، حسّن ميمب الدقة باستمرار، وقلل من الاستكشاف غير الضروري، وحسّن استخدام الرموز. ومن الجدير بالذكر أن الذاكرة المُبنية من نماذج أقوى تم نقلها بفعالية إلى نماذج أضعف، مما عزز أدائها. ويُظهر هذا أن ميمب يُمكّن الوكلاء من التعلم والتكيف والتعميم عبر المهام.
عندما يتفاعل الوكيل مع بيئته، بتنفيذ الإجراءات، واستخدام الأدوات، وصقل السلوك عبر خطوات متعددة، يكون هذا عملية اتخاذ قرارات ماركوف. تُنشئ كل خطوة حالات، وإجراءات، وردود فعل، مما يُشكل مسارات تُنتج أيضًا مكافآت بناءً على النجاح. ومع ذلك، فإن حل المهام الجديدة في بيئات غير مألوفة غالبًا ما يؤدي إلى إهدار الخطوات والرموز، حيث يُكرر الوكيل الإجراءات الاستكشافية التي تم تنفيذها بالفعل في المهام السابقة.
بناءً على إلهام من الذاكرة الإجرائية البشرية، يُزوّد الإطار المقترح الوكلاء بوحدة ذاكرة تخزّن، وتستعيد، وتُحدّث المعرفة الإجرائية. يُمكّن هذا الوكلاء من إعادة استخدام التجارب السابقة، مما يُقلل من المحاولات الزائدة ويُحسّن الكفاءة في المهام المعقدة. تُظهر التجارب على TravelPlanner و ALFWorld أن تخزين المسارات كخطوات مفصلة أو نصوص مجردة يُعزز الدقة ويُقلل من وقت الاستكشاف. وتُحسّن استراتيجيات الاسترجاع القائمة على التشابه الدلالي استخدام الذاكرة بشكل أكبر. وفي الوقت نفسه، تسمح آليات التحديث الديناميكي، مثل التحقق، والتعديل، والتأمل، للوكلاء بتصحيح الأخطاء، والتخلص من المعرفة القديمة، وصقل المهارات باستمرار.
تُظهر النتائج أن الذاكرة الإجرائية لا تُحسّن فقط معدلات إتمام المهام والكفاءة، بل تُنقل أيضًا بفعالية من النماذج الأقوى إلى النماذج الأضعف، مما يُعطي الأنظمة الأصغر مكاسب كبيرة في الأداء. علاوة على ذلك، فإن توسيع نطاق الاسترجاع يُحسّن النتائج حتى نقطة معينة، وبعدها يمكن أن تُثقل الذاكرة المفرطة السياق وتُقلل من الفعالية. ويُبرز هذا الذاكرة الإجرائية كطريقة قوية لجعل الوكلاء أكثر تكيفًا وكفاءة وتشابهًا مع البشر في تعلّمهم.
الخاتمة
في الختام، يُعدّ ميمب إطار عمل مستقل عن المهمة يعامل الذاكرة الإجرائية كعنصر أساسي لتحسين وكلاء اللغات الكبيرة. من خلال تصميم استراتيجيات منهجية لبناء الذاكرة واسترجاعها وتحديثها، يسمح ميمب للوكلاء بتقطير وصقل وإعادة استخدام التجارب السابقة، مما يُحسّن الكفاءة والدقة في المهام طويلة الأفق مثل TravelPlanner و ALFWorld. وعلى عكس الذاكرة الثابتة أو المصممة يدويًا، يتطور ميمب ديناميكيًا، ويُحدّث باستمرار ويُتخلص من المعرفة القديمة. تُظهر النتائج مكاسب ثابتة في الأداء، وتعلّمًا فعالًا، وفوائد قابلة للنقل عند نقل الذاكرة من نماذج أقوى إلى نماذج أضعف. بالنظر إلى المستقبل، يمكن أن تُعزز أساليب الاسترجاع الأكثر ثراءً وآليات التقييم الذاتي قدرة الوكلاء على التكيف في السيناريوهات الواقعية.
روابط إضافية
- [الورقة البحثية](رابط الورقة البحثية)
- [صفحة جيثب](رابط صفحة جيثب)
- [حساب تويتر](رابط حساب تويتر)
- [صفحة ريديت](رابط صفحة ريديت)
- [نشرة البريد الإلكتروني](رابط نشرة البريد الإلكتروني)





اترك تعليقاً