نماذج لغة كبيرة متقدمة من Mistral AI: سلسلة Magistral

أعلنت شركة Mistral AI مؤخراً عن إطلاق سلسلة Magistral، وهي أحدث سلسلة من نماذج اللغات الكبيرة (LLMs) المُحسّنة للتفكير المنطقي. يمثل هذا الإطلاق خطوة هامة إلى الأمام في تطوير قدرات نماذج اللغات الكبيرة، حيث تركز على الاستنتاج في وقت الاستدلال، وهو مجال بالغ الأهمية في تصميم نماذج اللغات الكبيرة. تتضمن سلسلة Magistral نموذجين رئيسيين: Magistral Small و Magistral Medium.

مميزات سلسلة Magistral: تحول نحو التفكير المنظم

تتميز سلسلة Magistral بمجموعة من المزايا الرئيسية التي تُعزز دقتها وكفاءتها:

1. الإشراف على سلسلة الأفكار (Chain-of-Thought):

تم تدريب كلا النموذجين باستخدام تقنية “سلسلة الأفكار” (CoT)، والتي تُمكّن من توليد استنتاجات وسيطة خطوة بخطوة. يساهم هذا في تحسين الدقة، وقابلية التفسير، وقوة النموذج، خاصةً في مهام التفكير متعدد الخطوات الشائعة في مجالات مثل الرياضيات، والتحليل القانوني، وحل المشكلات العلمية.

2. دعم التفكير متعدد اللغات:

يدعم نموذج Magistral Small لغات متعددة، بما في ذلك الفرنسية، والإسبانية، والعربية، والصينية المبسطة. توسّع هذه القدرة اللغوية المتعددة نطاق تطبيقاته في السياقات العالمية، مُقدّمةً أداءً في التفكير يتجاوز قدرات العديد من النماذج المنافسة التي تركز بشكل أساسي على اللغة الإنجليزية.

3. النشر المفتوح مقابل النشر الخاص:

  • Magistral Small: متوفر علنًا عبر منصة Hugging Face برخصة Apache 2.0، وهو مُصمم للأبحاث، والتخصيص، والاستخدام التجاري دون قيود ترخيصية.
  • Magistral Medium: نموذج خاص مُحسّن للنشر في الوقت الحقيقي عبر خدمات السحابة وواجهة برمجة التطبيقات (API) من Mistral. يوفر هذا النموذج إنتاجية وقابلية للتطوير مُحسّنتين.

4. نتائج الاختبارات المعيارية:

أظهرت التقييمات الداخلية دقة بنسبة 73.6% لنموذج Magistral Medium على مجموعة بيانات AIME2024، ترتفع إلى 90% باستخدام تصويت الأغلبية. حقق نموذج Magistral Small دقة 70.7%، وترتفع إلى 83.3% تحت نفس تكوينات المجموعة. تُظهر هذه النتائج أن سلسلة Magistral تنافس نماذج رائدة معاصرة.

5. الإنتاجية وزمن الانتظار:

يُقدّم نموذج Magistral Medium إنتاجية عالية تصل إلى 1000 رمز في الثانية، وهو مُحسّن لبيئات الإنتاج الحساسة لزمن الانتظار. تُعزى هذه المكاسب في الأداء إلى خطوط أنابيب التعلم المعزز المُخصصة واستراتيجيات فك التشفير الفعالة.

بنية النموذج

تسلط الوثائق التقنية المصاحبة من Mistral الضوء على تطوير خط أنابيب مُخصّص للتعلم المعزز (RL) المُحسّن. بدلاً من استخدام قوالب RLHF الموجودة، صمم مهندسو Mistral إطار عمل داخلي مُحسّن لفرض تتبعات تفكير مُتّسقة وعالية الجودة. بالإضافة إلى ذلك، تتميز النماذج بآليات تُوجّه توليد خطوات التفكير صراحةً، والتي تُسمى “محاذاة لغة التفكير”. يضمن هذا الاتساق عبر المخرجات المعقدة. تحافظ البنية على التوافق مع ضبط التعليمات، وفهم التعليمات البرمجية، وعناصر استدعاء الوظائف من عائلة النماذج الأساسية لـ Mistral.

الآثار الصناعية والمسار المستقبلي

اعتماد الشركات:

بفضل قدراتها المُحسّنة في مجال التفكير والدعم متعدد اللغات، يُعدّ نموذج Magistral مُناسبًا للنشر في الصناعات الخاضعة للتنظيم، مثل الرعاية الصحية، والتمويل، والتكنولوجيا القانونية، حيث تُعدّ الدقة، والشرح، والتتبع ذات أهمية بالغة.

كفاءة النموذج:

من خلال التركيز على التفكير في وقت الاستدلال بدلاً من التوسع القائم على القوة الغاشمة، تُعالج Mistral الطلب المتزايد على النماذج الفعالة، والتي لا تتطلب موارد حوسبة باهظة.

التمايز الاستراتيجي:

تُمكّن استراتيجية الإصدار ذات المستويين – المفتوح والخاص – Mistral من خدمة مجتمع المصادر المفتوحة وسوق الشركات في وقت واحد، مما يُعكس استراتيجيات مُشابهة في منصات البرامج الأساسية.

اختبارات معيارية عامة:

في حين أن المقاييس الأولية للأداء تستند إلى مجموعات بيانات داخلية، فإن الاختبارات المعيارية العامة ستكون ضرورية. ستساعد منصات مثل MMLU، وGSM8K، وBig-Bench-Hard في تحديد القدرة التنافسية الأوسع للسلسلة.

الخلاصة

تجسّد سلسلة Magistral تحولًا مُتعمّداً من التفوق في حجم المعلمات إلى التفكير المُحسّن للاستدلال. بفضل الدقة التقنية، والوصول متعدد اللغات، والأخلاقيات القوية للمصادر المفتوحة، تُمثّل نماذج Magistral من Mistral AI نقطة تحول حاسمة في تطوير نماذج اللغات الكبيرة. مع ظهور التفكير كعامل تمييز رئيسي في تطبيقات الذكاء الاصطناعي، يوفر Magistral بديلاً فعالاً وعالي الأداء، متجذرًا في الشفافية والكفاءة والريادة الأوروبية في مجال الذكاء الاصطناعي. يمكنكم الاطلاع على نموذج Magistral-Small على Hugging Face، وجرّبوا نسخة تجريبية من Magistral Medium في Le Chat أو عبر واجهة برمجة التطبيقات على La Plateforme.

المصدر: MarkTechPost