نماذج لغة Mistral AI الجديدة: ديفسترال 2507 لتطوير البرمجيات
أطلقت شركة Mistral AI، بالتعاون مع All Hands AI، إصدارات محدثة من نماذجها اللغوية الكبيرة الموجهة للمطورين، تحت اسم Devstral 2507. يتضمن الإصدار نموذجين رئيسيين: Devstral Small 1.1 و Devstral Medium 2507، المصممان لدعم الاستدلال على التعليمات البرمجية القائمة على الوكلاء، وتوليد البرامج، وتنفيذ المهام المُهيكلة عبر مستودعات البرامج الكبيرة. وقد تم تحسين هذين النموذجين من حيث الأداء والتكلفة، مما يجعلهما مناسبين للاستخدام في العالم الحقيقي ضمن أدوات المطورين وأنظمة أتمتة التعليمات البرمجية.
Devstral Small 1.1: نموذج مفتوح للاستخدام المحلي والمدمج
يعتمد Devstral Small 1.1 (المُسمى أيضًا devstral-small-2507) على نموذج Mistral-Small-3.1 الأساسي، ويحتوي على ما يقارب 24 مليار معلمة. يدعم نافذة سياقية تبلغ 128 كيلوبايت من الرموز، مما يسمح له بمعالجة مدخلات التعليمات البرمجية متعددة الملفات والطلبات الطويلة النموذجية في سير عمل هندسة البرمجيات. تم ضبط النموذج بدقة للحصول على مخرجات مُهيكلة، بما في ذلك تنسيقات XML ووظائف الاستدعاء. هذا يجعله متوافقًا مع أطر عمل الوكلاء مثل OpenHands، ومناسبًا لمهام مثل التنقل في البرنامج، والتحرير متعدد الخطوات، وبحث التعليمات البرمجية. وهو مرخص بموجب ترخيص Apache 2.0، ومتاح للاستخدام البحثي والتجاري.
الأداء: نتائج اختبار SWE-Bench
حقق Devstral Small 1.1 نسبة 53.6% في اختبار SWE-Bench Verified، والذي يقيم قدرة النموذج على توليد تصحيحات صحيحة لمشاكل GitHub الحقيقية. وهذا يمثل تحسنًا ملحوظًا مقارنة بالإصدار السابق (1.0)، ويضعه في المقدمة مقارنةً بالنماذج الأخرى المتاحة علنًا من نفس الحجم تقريبًا. تم الحصول على النتائج باستخدام هيكل OpenHands، الذي يوفر بيئة اختبار قياسية لتقييم وكلاء التعليمات البرمجية. وفي حين أنه لا يضاهي أداء أكبر النماذج التجارية، إلا أن هذا الإصدار يوفر توازنًا عمليًا بين الحجم، وتكلفة الاستدلال، وأداء الاستنتاج المناسب للعديد من مهام البرمجة.
النشر: الاستدلال المحلي والكمية
تم إصدار النموذج في تنسيقات متعددة. تتوفر إصدارات مُكمّاة في GGUF للاستخدام مع llama.cpp و vLLM و LM Studio. تتيح هذه التنسيقات تشغيل الاستدلال محليًا على وحدات معالجة الرسومات عالية الذاكرة (مثل RTX 4090) أو أجهزة Apple Silicon التي تحتوي على 32 جيجابايت من ذاكرة الوصول العشوائي أو أكثر. هذا مفيد للمطورين أو الفرق التي تفضل العمل دون الاعتماد على واجهات برمجة التطبيقات المُستضافة. كما تُتيح Mistral النموذج عبر واجهة برمجة التطبيقات الخاصة بها. السعر الحالي هو 0.10 دولار لكل مليون رمز إدخال و 0.30 دولار لكل مليون رمز إخراج، وهو نفس سعر النماذج الأخرى في سلسلة Mistral-Small.
Devstral Medium 2507: دقة أعلى، متوفر عبر واجهة برمجة التطبيقات فقط
لا يُعد Devstral Medium 2507 مفتوح المصدر، وهو متوفر فقط عبر واجهة برمجة تطبيقات Mistral أو من خلال اتفاقيات نشر المؤسسات. يقدم نفس طول سياق الرموز البالغ 128 كيلوبايت مثل الإصدار الصغير، لكن مع أداء أعلى. يحرز النموذج 61.6% في اختبار SWE-Bench Verified، متفوقًا على العديد من النماذج التجارية، بما في ذلك Gemini 2.5 Pro و GPT-4.1، في نفس إطار التقييم. تُعد قدرته الأقوى على الاستدلال عبر السياقات الطويلة مناسبة لوكلاء التعليمات البرمجية التي تعمل عبر مستودعات كبيرة أو مستودعات ذات تبعيات بين الملفات. سعر واجهة برمجة التطبيقات هو 0.40 دولار لكل مليون رمز إدخال و 2 دولار لكل مليون رمز إخراج. يتوفر الضبط الدقيق لمستخدمي المؤسسات عبر منصة Mistral.
مقارنة وملاءمة حالات الاستخدام
| النموذج | نتيجة SWE-Bench Verified | مفتوح المصدر | تكلفة الإدخال | تكلفة الإخراج | طول السياق | 
|---|---|---|---|---|---|
| Devstral Small 1.1 | 53.6% | نعم | 0.10 دولار/مليون | 0.30 دولار/مليون | 128 كيلوبايت من الرموز | 
| Devstral Medium | 61.6% | لا | 0.40 دولار/مليون | 2.00 دولار/مليون | 128 كيلوبايت من الرموز | 
يناسب Devstral Small بشكل أفضل التطوير المحلي، أو التجريب، أو التكامل في أدوات مطور العميل، حيث يكون التحكم والكفاءة أمرًا بالغ الأهمية. على النقيض من ذلك، يوفر Devstral Medium دقة واتساقًا أعلى في مهام تحرير التعليمات البرمجية المُهيكلة، وهو مُصمم للخدمات الإنتاجية التي تستفيد من الأداء العالي على الرغم من ارتفاع التكلفة.
التكامل مع الأدوات والوكلاء
صُمّم كلا النموذجين لدعم التكامل مع أطر عمل وكلاء التعليمات البرمجية مثل OpenHands. يسمح دعم استدعاءات الوظائف المُهيكلة وتنسيقات إخراج XML بتكاملها في سير العمل الآلي لإنشاء الاختبارات، وإعادة هيكلة التعليمات البرمجية، وإصلاح الأخطاء. يُسهل هذا التوافق ربط نماذج Devstral بإضافات IDE، وبوتات التحكم في الإصدار، وأنابيب CI/CD الداخلية. على سبيل المثال، يمكن للمطورين استخدام Devstral Small لإنشاء نماذج أولية لسير العمل المحلي، بينما يمكن استخدام Devstral Medium في الخدمات الإنتاجية التي تُطبق التصحيحات أو تُصنف طلبات السحب بناءً على اقتراحات النموذج.
الخاتمة
يعكس إصدار Devstral 2507 تحديثًا مُستهدفًا لمجموعة نماذج لغة Mistral المُوجهة للتعليمات البرمجية، مُقدمًا للمستخدمين مقايضة أوضح بين تكلفة الاستدلال ودقة المهمة. يُوفر Devstral Small نموذجًا مفتوحًا يمكن الوصول إليه مع أداء كافٍ للعديد من حالات الاستخدام، بينما يلبي Devstral Medium احتياجات التطبيقات التي تعتبر فيها الصحة والموثوقية أمرًا بالغ الأهمية. يُعد توفر كلا النموذجين ضمن خيارات نشر مختلفة أمرًا مُهمًا عبر مختلف مراحل سير عمل هندسة البرمجيات – من تطوير وكلاء تجريبي إلى النشر في بيئات تجارية. يمكنكم الاطلاع على التفاصيل الفنية، وأوزان نموذج Devstral Small على Hugging Face، وسيكون Devstral Medium متاحًا أيضًا على Mistral Code لعملاء المؤسسات وعلى واجهة برمجة التطبيقات للضبط الدقيق.







اترك تعليقاً