نموذج جيميني للدمج النصي: جيل جديد من الذكاء الاصطناعي
يُسَرّنا أن نعلن عن إتاحة نموذج جيميني للدمج النصي (gemini-embedding-001) بشكل عام للمطورين عبر واجهة برمجة تطبيقات جيميني و Google AI Studio. يُقدّم هذا النموذج إمكانيات قوية ومرنة لتمثيل النصوص بلغات متعددة، مُضيفاً قيمة كبيرة لنظام الذكاء الاصطناعي الأوسع.
دعم متعدد اللغات ومرونة الأبعاد
- دعم أكثر من 100 لغة: صُمّم نموذج جيميني للدمج النصي خصيصاً للتطبيقات العالمية، ويعمل بأكثر من مئة لغة، مما يجعله الحل الأمثل للمشاريع التي تتطلب معالجة لغات متنوعة.
- تعلم التمثيل المتداخل (Matryoshka): تعتمد بنية النموذج على تقنية تعلم التمثيل المتداخل، مما يسمح للمطورين بتغيير حجم متجهات الدمج بكفاءة. يمكنك الاختيار من بين الأبعاد الافتراضية (3072) أو تقليلها إلى 1536 أو 768، حسب التوازن المطلوب بين الدقة والأداء في تطبيقك. تتيح لك هذه البنية القابلة للتكيف تحسين السرعة والتكلفة والتخزين مع الحد الأدنى من فقدان الجودة عند تقليل حجم المتجه.
المواصفات الفنية وأداء النموذج
- سعة الإدخال: يعالج ما يصل إلى 2048 وحدة رمز (token) لكل إدخال، مع تلميحات حول زيادة هذه القدرة في التحديثات المستقبلية.
- المركز الأول في الاختبارات المعيارية: منذ إطلاقه المبكر، حقق نموذج gemini-embedding-001 أعلى الدرجات في معيار دمج النصوص الضخم متعدد اللغات (MTEB)، متفوقاً على نماذج جوجل السابقة والعروض الخارجية في مجالات مثل العلوم والقانون والبرمجة. يُظهر الجدول التالي مقارنة أداءه مع نماذج أخرى:
| المقياس/المهمة | gemini-embedding-001 | نماذج جوجل القديمة | Cohere v3.0 | OpenAI-3-large |
|---|---|---|---|---|
| متوسط MTEB (متعدد اللغات) (المهمة) | 68.37 | 62.13 | 61.12 | 58.93 |
| متوسط MTEB (متعدد اللغات) (نوع المهمة) | 59.59 | 54.32 | 53.23 | 51.41 |
| استخراج النصوص | 79.28 | 70.73 | 70.50 | 62.17 |
| التصنيف | 71.82 | 64.64 | 62.95 | 60.27 |
| التجميع | 54.59 | 48.47 | 46.89 | 46.89 |
| الاسترجاع الفوري | 5.18 | 4.08 | -1.89 | -2.68 |
| التصنيف متعدد العلامات | 29.16 | 22.82 | 22.74 | 22.03 |
| تصنيف الأزواج | 83.63 | 81.14 | 79.88 | 79.17 |
| إعادة الترتيب | 65.58 | 61.22 | 64.07 | 63.89 |
| الاسترجاع | 67.71 | 59.68 | 59.16 | 59.27 |
| تشابه النصوص الدلالي (STS) | 79.47 | 76.11 | 74.87 | 71.68 |
| MTEB (الإنجليزية، الإصدار الثاني) | 73.36 | 69.53 | 66.01 | 66.43 |
| MTEB (البرمجة، الإصدار الأول) | 76 | 65.45 | 61.94 | 58.95 |
| استرجاع XOR | 90.42 | 65.67 | — | 68.76 |
| XTREME-UP | 64.33 | 34.97 | — | 18.80 |
- بنية موحدة: يُدمج النموذج إمكانيات كانت تتطلب سابقاً نماذج متخصصة متعددة، مما يُبسّط سير العمل لمهام البحث والاسترجاع والتجميع والتصنيف.
الميزات الرئيسية
- دمج افتراضي بـ 3072 بعداً (مع دعم التقريب لـ 1536 أو 768).
- تطبيع المتجهات للتوافق مع قياس التشابه الكوني وأطر بحث المتجهات.
- انخفاض طفيف في الأداء مع انخفاض الأبعاد.
- توافق محسّن مع قواعد بيانات المتجهات الشائعة (مثل Pinecone، ChromaDB، Qdrant، Weaviate) وقواعد بيانات جوجل (AlloyDB، Cloud SQL).
التطبيقات العملية
- البحث الدلالي والاسترجاع: مطابقة مُحسّنة للمستندات والمقاطع عبر اللغات.
- التصنيف والتجميع: تصنيف نصوص قوي وتجميع مستندات.
- جيل المعزز بالاسترجاع (RAG): دقة استرجاع مُحسّنة للتطبيقات المدعومة بنماذج اللغات الكبيرة.
- التطبيقات متعددة اللغات: إدارة سهلة للمحتوى المُدوّل دولياً.
التكامل والنظام البيئي
- وصول واجهة برمجة التطبيقات: استخدم gemini-embedding-001 في واجهة برمجة تطبيقات جيميني، و Google AI Studio، و Vertex AI.
- تكامل سلس: متوافق مع حلول قواعد بيانات المتجهات الرائدة ومنصات الذكاء الاصطناعي القائمة على السحابة، مما يُمكّن من نشر سهل في خطوط البيانات والتطبيقات الحديثة.
التسعير والترحيل
| المستوى | التسعير | الملاحظات |
|---|---|---|
| مجاني | استخدام محدود | مثالي للنماذج الأولية والتجريب |
| مدفوع | 0.15 دولارًا أمريكيًا لكل مليون وحدة رمز | قابل للتطوير لاحتياجات الإنتاج |
جدول إلغاء الخدمة:
- gemini-embedding-exp-03-07: إلغاء الخدمة في 14 أغسطس 2025.
- النماذج السابقة (embedding-001، text-embedding-004): إلغاء الخدمة بحلول أوائل عام 2026.
يوصى بالترحيل إلى gemini-embedding-001 للاستفادة من التحسينات والدعم المستمر.
التطلع للمستقبل
- معالجة الدُفعات: أعلنت جوجل عن دعم قادم لواجهات برمجة تطبيقات الدُفعات لتمكين إنشاء دمج غير متزامن وفعال من حيث التكلفة على نطاق واسع.
- دمج الوسائط المتعددة: قد تسمح التحديثات المستقبلية بدمج موحد ليس فقط للنصوص، بل أيضاً للرموز والصور، مما يُوسّع نطاق تطبيقات جيميني.
الخاتمة
يُمثّل إتاحة نموذج gemini-embedding-001 بشكل عام تقدماً كبيراً في مجموعة أدوات جوجل للذكاء الاصطناعي، حيث يُزوّد المطورين بحل قوي ومرن ومتعدد اللغات لدمج النصوص، يتكيف مع مجموعة واسعة من احتياجات التطبيقات. بفضل أبعاده القابلة للتطوير، وأداءه الرائد متعدد اللغات، وتكامله السلس مع أنظمة الذكاء الاصطناعي وبحث المتجهات الشائعة، يُمكّن هذا النموذج الفرق من بناء تطبيقات أذكى وأسرع وأكثر صلة عالمياً. مع استمرار جوجل في الابتكار بميزات مثل معالجة الدُفعات ودعم الوسائط المتعددة، يُرسي نموذج gemini-embedding-001 أساساً قوياً لمستقبل الفهم الدلالي في الذكاء الاصطناعي. اطلع على التفاصيل التقنية.






اترك تعليقاً