ذاكرة دائمة للمحادثات: بنك ذاكرة Vertex AI من جوجل
يُعَد تطوير وكلاء الذكاء الاصطناعي وتسويقهم هدفًا رئيسيًا للمطورين، لكنّ العقبة الرئيسية التي تواجههم تكمن في غياب الذاكرة. فبدون القدرة على استرجاع التفاعلات السابقة، يعامل الوكيل كل محادثة وكأنها الأولى، مما يؤدي إلى تكرار الأسئلة، وعدم القدرة على تذكر تفضيلات المستخدم، ونقص عام في التخصيص. هذا بدوره يُسبب الإحباط لكل من المستخدمين والمطورين.
التحديات التقليدية لإدارة ذاكرة المحادثات
تاريخيًا، حاول المطورون التخفيف من هذه المشكلة عن طريق إدراج حوارات الجلسات بأكملها مباشرةً في نافذة سياق نموذج اللغة الكبير (LLM). لكن هذا النهج مكلف وغير فعال من الناحية الحسابية، مما يؤدي إلى ارتفاع تكاليف الاستنتاج وبطء أوقات الاستجابة. علاوة على ذلك، فإن إدخال الكثير من المعلومات، وخاصة التفاصيل غير ذات الصلة، قد يُقلل من جودة مخرجات النموذج، ويسبب مشاكل مثل “الضياع في المنتصف” و “تعفن السياق”.
بنك ذاكرة Vertex AI: حلول مبتكرة لإدارة الذاكرة
لتجاوز هذه القيود، أعلنت جوجل كلاود عن الإصدار التجريبي العام لـ “بنك الذاكرة” (Memory Bank)، وهو خدمة مُدارة جديدة ضمن محرك وكلاء Vertex AI. صُمّم بنك الذاكرة لمساعدتك في بناء وكلاء محادثة شخصيين للغاية، مما يُسهل التفاعلات الأكثر طبيعية وسياقية واستمرارية.
مثال: في وكيل الرعاية الصحية الشخصي، تُعد معلومات أساسية عن حساسية المستخدم وأعراضه السابقة (المذكورة في الجلسات السابقة) ضرورية لتقديم استجابة أكثر استنارة في الجلسة الحالية.
يعالج بنك الذاكرة مشكلة الذاكرة الأساسية بعدة طرق رئيسية:
- التخصيص: يتجاوز النصوص العامة عن طريق تذكر تفضيلات المستخدم، والأحداث الرئيسية، والخيارات السابقة لتخصيص كل استجابة.
- الاستمرارية: يمكن للمحادثات أن تستأنف بسلاسة من حيث توقفت، حتى عبر جلسات متعددة قد تمتد لأيام أو أسابيع.
- السياق المُحسّن: يتم تزويد الوكلاء بالخلفية اللازمة حول المستخدم، مما يؤدي إلى استجابات أكثر صلة، وشمولية، وفائدة.
- تحسين تجربة المستخدم: يقضي على إحباط المستخدمين من تكرار المعلومات، مما يخلق محادثات أكثر طبيعية وكفاءة وجاذبية.
آلية عمل بنك الذاكرة
يعمل بنك الذاكرة من خلال عملية ذكية متعددة المراحل، مستفيدًا من نماذج جوجل Gemini وأبحاثها الجديدة:
-
الفهم واستخراج الذكريات: يحلل بنك الذاكرة سجل محادثة المستخدم (المُخزّن في جلسات محرك الوكيل) لاستخراج الحقائق الرئيسية، والتفضيلات، والسياق. تحدث هذه العملية بشكل غير متزامن في الخلفية، وتوليد ذكريات جديدة دون الحاجة من المطورين إلى بناء خطوط أنابيب استخراج معقدة.
-
التخزين وتحديث الذكريات بذكاء: يتم تخزين المعلومات الرئيسية، مثل “أفضل الأيام المشمسة”، وتنظيمها حسب نطاق مُحدد، مثل معرف المستخدم. عندما تظهر معلومات جديدة، يمكن لبنك الذاكرة، باستخدام Gemini، دمجها مع الذكريات الموجودة، وحل التناقضات، وضمان بقاء الذكريات محدثة.
-
استرجاع المعلومات ذات الصلة: عندما تبدأ جلسة محادثة جديدة، يمكن للوكيل استرجاع هذه الذكريات المُخزّنة. يمكن أن يكون هذا الاسترجاع عبارة عن استدعاء بسيط لجميع الحقائق أو بحث متقدم عن التشابه باستخدام الاشتمالات للعثور على الذكريات الأكثر صلة بالموضوع الحالي. هذا يضمن أن يكون الوكيل مُجهزًا دائمًا بالسياق الصحيح.
تُعد هذه العملية بأكملها مُرتكزة على أسلوب بحث جديد من أبحاث جوجل، قُبل في ACL 2025، والذي يوفر نهجًا ذكيًا قائمًا على الموضوع لكيفية تعلم الوكلاء واسترجاع المعلومات، مما يُحدد معيارًا جديدًا لأداء ذاكرة الوكيل. مثال على ذلك هو كيفية تذكر وكيل مُرافق الجمال الشخصي لنوع بشرة المستخدم المتطور لإجراء توصيات منتجات مُخصصة.
البدء مع بنك الذاكرة
يتم دمج بنك الذاكرة مع مجموعة تطوير الوكلاء (ADK) وجلسات محرك الوكيل. يمكن للمطورين تعريف وكيل باستخدام ADK وتمكين جلسات محرك الوكيل لإدارة سجل المحادثة داخل الجلسات الفردية. يمكن بعد ذلك تمكين بنك الذاكرة لتوفير ذاكرة طويلة المدى عبر جلسات متعددة.
يمكنك دمج بنك الذاكرة في وكيلك بطريقتين رئيسيتين:
- تطوير وكيل باستخدام مجموعة تطوير وكلاء جوجل (ADK) للحصول على تجربة جاهزة للاستخدام.
- تطوير وكيل يُنسق مكالمات واجهة برمجة التطبيقات (API) إلى بنك الذاكرة إذا كنت تقوم ببناء وكيلك باستخدام أي إطار عمل آخر، بما في ذلك الإطارات الشائعة مثل LangGraph و CrewAI.
بالنسبة للمبتدئين في جوجل كلاود ولكنهم يستخدمون ADK، يسمح وضع التسجيل السريع لجلسات محرك الوكيل وبنك الذاكرة بالتسجيل باستخدام حساب Gmail للحصول على مفتاح API والبناء ضمن حصص الاستخدام المجانية قبل الترقية بسلاسة إلى مشروع جوجل كلاود الكامل للإنتاج.





اترك تعليقاً