نموذج كيما K2: ثورة في الذكاء الاصطناعي بتقنية معالجة الخبرات الضخمة

أطلقت شركة مونشوت للذكاء الاصطناعي في يوليو 2025 نموذج كيما K2، وهو نموذج مفتوح المصدر مبني على تقنية “مزيج الخبراء” (MoE) يضم تريليون معلمة، مع 32 مليار معلمة نشطة لكل رمز. تم تدريب النموذج باستخدام مُحسّن MuonClip على 15.5 تريليون رمز، محققًا تدريبًا مستقرًا على هذا النطاق غير المسبوق دون مواجهة عدم الاستقرار النموذجي الذي يُلاحظ في النماذج الضخمة جدًا.

التحوّل من التفكير إلى الفعل: الذكاء الاصطناعي الوكيل

على عكس روبوتات الدردشة التقليدية، صُمّم كيما K2 خصيصًا للعمل الوكيل. فهو يدعم بروتوكول سياق النموذج (MCP) بشكلٍ أصلي، وقد تم تدريبه على تفاعلات الأدوات المتعددة الخطوات المُحاكاة، مما يُمكّنه من تحليل المهام بشكلٍ مستقل، وتنفيذ تسلسلات الأدوات، وكتابة الأكواد وإصلاحها، وتحليل البيانات، وتنسيق سير العمل – كل ذلك بإشراف بشري ضئيل. يكمن التحول الأساسي في تمكين سير العمل في العالم الحقيقي، والذي يتضمن:

  • تنفيذ الأكواد بشكلٍ مستقل.
  • تحليل البيانات مع الرسوم البيانية والواجهات.
  • تطوير تطبيقات الويب من الألف إلى الياء.
  • تنسيق أكثر من 17 أداة في كل جلسة بدون تدخل بشري.

تدريب متطور وهندسة معمارية مبتكرة

يُظهر التصميم التقني لـ K2 العديد من العناصر الجديدة:

  • تصميم محول MoE: 384 خبيرًا مع توجيه إلى 8 خبراء نشطين لكل رمز، بالإضافة إلى خبير مشترك للسياق العام. يستخدم النموذج 64 رأسًا للانتباه ويدعم نافذة سياق 128 ألف رمز.
  • محسّن MuonClip: نسخة معدّلة من Muon تُثبّت التدريب على نطاق واسع. يستخدم قصّ qk للحد من درجات الانتباه عن طريق إعادة قياس مصفوفات Q/K، مما يمنع بشكل فعال عدم الاستقرار في الطبقات العميقة.
  • مجموعة بيانات التدريب: أكثر من 15.5 تريليون رمز من مصادر متعددة اللغات والوسائط، مما يمنح K2 تعميمًا قويًا وطريقة استنتاج استخدام الأدوات عبر مجالات متنوعة.

يأتي النموذج في نسختين: كيما K2-Base، وهو النموذج الأساسي المثالي لإعادة التدريب وبناء حلول مخصصة؛ وكيما K2-Instruct، وهو النسخة المُدرّبة مسبقًا المُحسّنة للاستخدام الفوري في الدردشة العامة ومهام استخدام الأدوات الوكيلة. تم تحسين Instruct لتفاعل سريع ومنخفض زمن الوصول بدلاً من التفكير طويل الأمد.

مقاييس الأداء

يتفوق كيما K2 على نماذج Claude Sonnet 4 و GPT-4.1 في البرمجة والتفكير الوكيل في المعايير:

المعيار كيما K2 GPT-4.1 Claude Sonnet 4
SWE-bench 71.6% 54.6% ~72.7%
الترميز الوكيل (Tau2) 65.8% 45.2% ~61%
LiveCodeBench v6 (Pass@1) 53.7% 44.7% 47.4%
MATH-500 97.4% 92.4%
MMLU 89.5% ~90.4% ~92.9%

يُظهر أداءه في معايير الوكيل مثل Tau2 و LiveCodeBench قدرته الفائقة على التعامل مع مهام البرمجة متعددة الخطوات في العالم الحقيقي – متفوقًا على العديد من النماذج الخاصة.

الكفاءة من حيث التكلفة

ربما يكون العنصر الأكثر إثارة هو التسعير:

  • Claude 4 Sonnet: 3 دولارات إدخال / 15 دولارًا مخرجات لكل مليون رمز
  • Gemini 2.5 Pro: 2.5 دولار إدخال / 15 دولارًا مخرجات
  • Kimi K2: 0.60 دولار إدخال / 2.50 دولار مخرجات

يُعد كيما K2 أرخص بنحو 5 مرات من Claude أو Gemini مع تقديم أداءٍ مساوٍ أو أفضل في العديد من المقاييس. تُضع هذه الميزة التكلفة، إلى جانب الوصول المفتوح والدعم للنشر المحلي، K2 كبديل اقتصادي فعال للمطورين والشركات وفرق البحث.

الاستنتاج

كيما K2 ليس مجرد نموذج أكبر – إنه مخطط لما يأتي بعد سباق التفكير: الذكاء الاصطناعي الذي يضع التنفيذ أولاً. من خلال الجمع بين نطاق تريليون معلمة، وتكاليف استنتاج منخفضة، وقدرات وكيلة مدمجة بعمق، يفتح كيما K2 الباب أمام أنظمة ذكاء اصطناعي تفعل أكثر من مجرد إنشاء – فهي تبني وتعمل وتحلها بشكلٍ مستقل.

يمكنكم الاطلاع على النماذج على Hugging Face وصفحة GitHub. جميع حقوق البحث تعود إلى باحثي هذا المشروع. تابعونا أيضًا على Twitter و Youtube، ولا تنسوا الانضمام إلى مجتمعنا ML SubReddit الذي يضم أكثر من 100 ألف عضو والاشتراك في قائمتنا البريدية.

المصدر: MarkTechPost