ميركوري: ثورة في توليد الأكواد البرمجية بسرعة فائقة
قدم مختبر Inception Labs نموذجًا لغويًا ضخمًا جديدًا قائمًا على تقنية الانتشار (Diffusion) يُدعى “ميركوري” (Mercury)، مصمم خصيصًا لتوليد الأكواد البرمجية بسرعة فائقة. يُعدّ ميركوري نقلة نوعية في مجال الذكاء الاصطناعي التوليدي، متجاوزًا قيود نماذج اللغة التقليدية.
تحديات نماذج اللغة التلقائية في توليد الأكواد
تُستخدم نماذج اللغة التلقائية (Autoregressive) بشكل واسع في توليد الأكواد، إلا أنها تعاني من قيود في السرعة والكفاءة. تعتمد هذه النماذج على توليد الرموز (Tokens) بشكل تسلسلي، رمزًا تلو الآخر، مما يؤدي إلى بطء العملية، خاصةً في المهام التفاعلية التي تتطلب استجابات آنية. على الرغم من وجود بعض التحسينات في نماذج مثل GPT-4o و Claude 3.5 Haiku، إلا أن هذه القيود الأساسية تبقى قائمة.
ميركوري: حلول سريعة وفعالة لتوليد الأكواد
يُقدم ميركوري حلًا مبتكرًا لهذه المشكلة من خلال اعتماده على تقنية الانتشار، التي تُمكّنه من توليد الرموز بشكل متوازٍ. يتألف ميركوري من نسختين: ميركوري كودر ميني (Mercury Coder Mini) وميركوري كودر سمول (Mercury Coder Small).
آلية عمل تقنية الانتشار في ميركوري
تعتمد نماذج ميركوري على عمليات الانتشار حيث يتمّ تحسين المخرجات بشكل تكراري من ضجيج عشوائي أولي إلى بيانات متماسكة. على عكس النماذج التقليدية التي تتوقع الرموز بشكل تسلسلي، تُحسّن نماذج ميركوري العديد من الرموز في كلّ تكرار، مما يُحسّن من استخدام وحدة معالجة الرسومات (GPU) بشكل كبير.
تدريب نماذج ميركوري
خلال عملية التدريب، استخدمت نماذج ميركوري مجموعات بيانات ضخمة تتكون من تريليونات الرموز، تمّ الحصول عليها من عمليات البحث على الويب، وبيانات اصطناعية، ومستودعات خاصة. تتضمن عملية تدريب الانتشار عملية إضافة ضجيج تدريجيًا للبيانات النظيفة، وعملية عكسية لإزالة هذا الضجيج بشكل تكراري. يستخدم ميركوري خسارة انتشار لإزالة الضجيج (denoising diffusion loss)، مما يُمكّن من تعديل الرموز بشكل متزامن ويعزز التوازي.
أداء ميركوري: سرعة ودقة عالية
أظهرت اختبارات الأداء نتائج مبهرة لنماذج ميركوري:
- ميركوري كودر ميني: حقق سرعة إنتاج تصل إلى 1109 رمزًا في الثانية، أي أسرع بكثير من النماذج التلقائية التقليدية.
- ميركوري كودر سمول: حقق سرعة إنتاج تصل إلى 737 رمزًا في الثانية، مع الحفاظ على دقة عالية.
دقة النماذج:
- HumanEval: حقق ميركوري كودر سمول دقة 90.0%، وميركوري كودر ميني دقة 88.0%.
- MultiPL-E: حقق ميركوري كودر سمول دقة 76.2%، وميركوري كودر ميني دقة 74.1%.
- مهام ملء الفراغات: تفوق ميركوري كودر سمول النماذج الأخرى في مهام ملء الفراغات، محققًا دقة 84.8% مقابل 82.5% لنموذج Codestral 2501.
تقييمات المستخدمين:
حصل ميركوري كودر ميني على المرتبة الثانية في تفضيلات المستخدمين على منصة Copilot Arena، متفوقًا على نماذج مثل GPT-4o Mini و Gemini 1.5 Flash، مع أدنى زمن انتقال (Latency) يبلغ 25 مللي ثانية فقط.
دقة اللغات البرمجية:
أظهر ميركوري كودر سمول دقة عالية في اختبارات اللغات البرمجية المختلفة ضمن معيار MultiPL-E:
- C++: 82.0%
- Java: 80.1%
- JavaScript: 83.9%
- PHP: 78.3%
- Bash: 50.1%
- TypeScript: 82.6%
النتائج الرئيسية:
- سرعة عالية: يُحقق ميركوري سرعة إنتاج تصل إلى عشرة أضعاف سرعة النماذج التقليدية.
- دقة ممتازة: يُظهر ميركوري أداءً عالياً في معايير اختبار الأكواد القياسية.
- توافق مع سير العمل: يتوافق ميركوري مع تقنيات الإرشاد (Prompting) الموجودة، مما يُسهّل دمجه في سير عمل المطورين.
روابط إضافية:
- [الورقة البحثية](رابط الورقة البحثية)
- [واجهة برمجة التطبيقات (API)](رابط API)
- [دردشة](رابط الدردشة)
يمكنكم متابعتنا على [Twitter](رابط تويتر) والانضمام إلى مجتمعنا على [Reddit](رابط Reddit) للاطلاع على المزيد من المعلومات.
اترك تعليقاً