نموذج كُون 3 ماكس: عملاق علي بابا اللغوي الجديد بتريليون معامل!
قدم فريق كُون التابع لشركة علي بابا نموذجًا لغويًا ضخمًا جديدًا يُدعى “كُون 3 ماكس-معاينة” (Instruct)، والذي يضم أكثر من تريليون معامل، ليُصبح بذلك أكبر نماذجهم اللغوية حتى الآن. ويتوفر هذا النموذج الرائد عبر منصة “كُون شات”، وواجهة برمجة التطبيقات على علي بابا كلاود، ومنصة “أوبن روتر”، بالإضافة إلى اعتماده كنموذج افتراضي في أداة “آني كودر” من هوجينغ فيس. لكن كيف يُقارن هذا النموذج مع غيره في عالم نماذج اللغات الضخمة الحالي؟
حجم كُون 3 ماكس وقدراته:
- عدد المعاملات: أكثر من تريليون معامل.
- نافذة السياق: تصل إلى 262,144 رمزًا (258,048 رمزًا للإدخال، و 32,768 رمزًا للإخراج).
- ميزة الكفاءة: يتضمن تخزين مؤقت للسياق لتسريع جلسات المحادثات المتعددة.
يُمثل اختيار علي بابا زيادة حجم النموذج خيارًا استراتيجيًا مدروسًا، يُبرز قدراته التقنية والتزامه بالبحث في مجال نماذج التريليون معامل، في وقت تتجه فيه الصناعة نحو نماذج أصغر وأكثر كفاءة.
أداء كُون 3 ماكس مقارنةً بالنماذج الأخرى:
أظهرت المقاييس المعيارية أن كُون 3 ماكس يتفوق على نموذج كُون 3-235B-A22B-2507، ويتنافس بقوة مع نماذج كلاود أوبس 4، وكيمي K2، وديب سيك-V3.1، عبر معايير مختلفة مثل SuperGPQA، وAIME25، وLiveCodeBench v6، وArena-Hard v2، وLiveBench. وهذا يُشير إلى قدرته العالية في مجالات متنوعة كالتفكير المنطقي والبرمجة والمهام العامة.
التسعير:
تطبق علي بابا كلاود نظام تسعير متدرجًا قائمًا على عدد الرموز:
- 0-32 ألف رمز: 0.861 دولار أمريكي لكل مليون رمز إدخال، و 3.441 دولار أمريكي لكل مليون رمز إخراج.
- 32-128 ألف رمز: 1.434 دولار أمريكي لكل مليون رمز إدخال، و 5.735 دولار أمريكي لكل مليون رمز إخراج.
- 128-252 ألف رمز: 2.151 دولار أمريكي لكل مليون رمز إدخال، و 8.602 دولار أمريكي لكل مليون رمز إخراج.
يُعد هذا النموذج فعال من حيث التكلفة للمهام الصغيرة، لكن تكلفته ترتفع بشكل كبير مع زيادة حجم السياق في المهام المعقدة.
نهج المصدر المغلق وتأثيره:
على عكس إصدارات كُون السابقة، فإن هذا النموذج ليس مفتوح المصدر. يقتصر الوصول إليه على واجهات برمجة التطبيقات ومنصات الشركاء. ويُبرز هذا الخيار تركيز علي بابا على الجانب التجاري، لكنه قد يُبطئ من انتشاره على نطاق أوسع في أوساط البحث والمجتمعات مفتوحة المصدر.
النقاط الرئيسية:
- أول نموذج كُون بتريليون معامل: يتجاوز كُون 3 ماكس تريليون معامل، ليُصبح أكبر وأكثر نماذج علي بابا اللغوية تقدمًا حتى الآن.
- معالجة سياق فائقة الطول: يدعم 262 ألف رمز مع تخزين مؤقت، مما يُمكّن من معالجة وثائق وجلسات موسعة تتجاوز معظم النماذج التجارية.
- أداء تنافسي في المقاييس المعيارية: يتفوق على كُون 3-235B ويتنافس مع كلاود أوبس 4، وكيمي K2، وديب سيك-V3.1 في مهام التفكير المنطقي والبرمجة والمهام العامة.
- الاستنتاج الناشئ رغم التصميم: على الرغم من عدم تسويقه كنموذج للتفكير المنطقي، إلا أن النتائج الأولية تُظهر قدرات استنتاجية منظمة في المهام المعقدة.
- نموذج تسعير متدرج ومصدر مغلق: يتوفر عبر واجهات برمجة التطبيقات مع تسعير قائم على الرموز؛ اقتصادي للمهام الصغيرة لكنه مكلف في استخدام سياق أطول، مما يُحد من إمكانية الوصول إليه.
الخلاصة:
يُحدد كُون 3 ماكس-معاينة معيارًا جديدًا في حجم نماذج اللغات الضخمة التجارية. ويُبرز تصميمه الذي يضم تريليون معامل، وطول سياقه الذي يصل إلى 262 ألف رمز، ونتائجه القوية في المقاييس المعيارية، عمق علي بابا التقني. ومع ذلك، فإن إصدار النموذج كمصدر مغلق وتسعيره المتدرج المرتفع يُثير تساؤلات حول إمكانية الوصول إليه على نطاق أوسع. يمكنكم زيارة كُون شات وواجهة برمجة تطبيقات علي بابا كلاود للاطلاع أكثر.
اترك تعليقاً