ليان: ثورة في البحث عن أقرب الجيران التقريبي (ANN) لتطبيقات الذكاء الاصطناعي الشخصية
تُعدّ تقنيات البحث القائمة على المتجهات (Embeddings) أكثر كفاءة من الطرق التقليدية القائمة على الكلمات المفتاحية في العديد من المجالات، وذلك لقدرتها على استخلاص التشابه الدلالي باستخدام تمثيل المتجهات الكثيفة، بالإضافة إلى تقنية البحث عن أقرب الجيران التقريبي (ANN). ومع ذلك، تُسبب بنية بيانات ANN زيادة كبيرة في حجم التخزين، حيث تصل إلى 1.5 إلى 7 أضعاف حجم البيانات الخام الأصلية. يُمكن التحكم بهذه الزيادة في التخزين في تطبيقات الويب واسعة النطاق، لكنها تصبح غير عملية على الأجهزة الشخصية أو مجموعات البيانات الضخمة. لذا، يُعدّ تقليل حجم التخزين إلى أقل من 5% من حجم البيانات الأصلية أمرًا بالغ الأهمية لنشر التطبيقات على الأجهزة الطرفية، لكن الحلول الحالية لا تحقق ذلك بشكل كامل.
تحديات تقنيات البحث عن أقرب الجيران التقريبي (ANN) الحالية
- تقليل حجم التخزين مع الحفاظ على الدقة: تقنيات مثل الكمي المنتج (PQ) تُقلل من حجم التخزين، لكنها تؤدي إما إلى انخفاض في الدقة أو زيادة في زمن البحث.
- طرق البحث القائمة على الرسوم البيانية: تعتبر الطرق القائمة على الرسوم البيانية مثل HNSW و NSG و Vamana من أفضل الطرق الحالية نظرًا لتوازنها بين الدقة والكفاءة. ومع ذلك، تواجه جهود تقليل حجم الرسم البياني، مثل اختيار الجيران المُتعلم، قيودًا بسبب التكاليف العالية للتدريب واعتمادها على البيانات المُسمّاة.
- البيئات ذات الموارد المحدودة: تقوم تقنيات مثل DiskANN و Starling بتخزين البيانات على القرص، بينما تُحسّن FusionANNS من استخدام الأجهزة. لكن طرق مثل AiSAQ و EdgeRAG تحاول تقليل استخدام الذاكرة، إلا أنها لا تزال تعاني من زيادة كبيرة في حجم التخزين أو انخفاض الأداء على نطاق واسع.
- تقنيات ضغط المتجهات: تقنيات مثل PQ و RabitQ توفر الكمي مع حدود خطأ نظرية، لكنها تكافح للحفاظ على الدقة ضمن ميزانيات ضيقة.
ليان: حلٌّ مبتكر لتحديات تخزين بيانات ANN
قام باحثون من جامعات كاليفورنيا، بيركلي، وهونغ كونغ، وخدمة أمازون السحابية، وجامعة كاليفورنيا، ديفيس، بتطوير ليان (LEANN)، وهو مؤشر بحث ANN فعال من حيث التخزين، مُحسّن للأجهزة الشخصية ذات الموارد المحدودة. يدمج ليان بنية مُدمجة قائمة على الرسوم البيانية مع استراتيجية إعادة الحساب أثناء التشغيل، مما يُمكّن من الاسترجاع السريع والدقيق مع تقليل حجم التخزين.
مميزات ليان:
- تخزين صغير للغاية: يحقق ليان تخفيضًا يصل إلى 50 مرة في حجم التخزين مقارنة بالفهرسة القياسية، حيث يُقلل حجم الفهرس إلى أقل من 5% من حجم البيانات الخام الأصلية.
- دقة عالية: يحافظ على 90% من معدل الاستدعاء لأفضل 3 نتائج في أقل من ثانيتين على معايير تقييم أسئلة وأجوبة واقعية.
- سرعة عالية: يستخدم خوارزمية بحث ذات مستويين ومجموعات ديناميكية، مما يُعزز من استخدام وحدة معالجة الرسومات (GPU) ويقلل من زمن الوصول.
آلية عمل ليان:
يعتمد ليان على إطار عمل HNSW، حيث يلاحظ أن كل استعلام يحتاج إلى متجهات لمجموعة فرعية محدودة فقط من العقد، مما يُشجّع على الحساب عند الطلب بدلاً من تخزين جميع المتجهات مسبقًا. ويُقدم ليان تقنيتين رئيسيتين:
- خوارزمية بحث ذات مستويين مع مجموعات ديناميكية: لتقليل زمن إعادة الحساب.
- طريقة تقليم الرسوم البيانية عالية الكفاءة: لتقليل حجم تخزين البيانات الوصفية.
يتمثل سير عمل ليان في حساب المتجهات لجميع عناصر مجموعة البيانات، ثم بناء مؤشر متجه باستخدام نهج قائم على الرسوم البيانية جاهز للاستخدام.
مقارنة ليان مع تقنيات أخرى:
يتفوق ليان على EdgeRAG، وهي طريقة إعادة حساب قائمة على IVF، من حيث التخزين وزمن الوصول، حيث يحقق تخفيضات في زمن الوصول تتراوح من 21.17 إلى 200.60 مرة عبر مجموعات بيانات وأنظمة أساسية مختلفة. ويعود هذا الميزة إلى تعقيد إعادة الحساب متعدد اللوغاريتمات في ليان، والذي يتوسع بكفاءة أكبر من نمو EdgeRAG √𝑁. أما من حيث الدقة، فيحقق ليان أداءً أفضل عبر معظم مجموعات البيانات، باستثناء GPQA، حيث يحد التباين التوزيعي من فعاليته. وبالمثل، على HotpotQA، يحد إعداد الاسترجاع أحادي القفزة من مكاسب الدقة، حيث تتطلب مجموعة البيانات استنتاجًا متعدد القفزات.
القيود والعمل المستقبلي:
على الرغم من نقاط قوته، يواجه ليان قيودًا، مثل ارتفاع استخدام التخزين الذروي أثناء بناء الفهرس، والذي يمكن معالجته من خلال ما قبل التجميع أو تقنيات أخرى. وقد يركز العمل المستقبلي على تقليل زمن الوصول وتحسين الاستجابة، مما يُمهد الطريق لاعتماد أوسع في البيئات ذات الموارد المحدودة.






اترك تعليقاً