نموذج نيموترون نانو 4B من إنفيديا: قوة المعالجة على أطراف الشبكة
أعلنت شركة إنفيديا مؤخراً عن إطلاق نموذجها الجديد للتفكير اللغوي المفتوح المصدر، Llama Nemotron Nano 4B، والذي يُعدّ نقلة نوعية في مجال الذكاء الاصطناعي على أجهزة الحواف. يتميز هذا النموذج بأدائه القوي وفعاليته العالية في مختلف المهام العلمية، وبرمجة الكمبيوتر، والرياضيات الرمزية، واستدعاء الدوال، واتباع التعليمات، مع حجمه الصغير الذي يسمح بنشره على أجهزة الحواف.
مميزات نموذج نيموترون نانو 4B:
- حجم صغير وفعالية عالية: يحتوي النموذج على 4 مليارات معلمة فقط، ومع ذلك، فإنه يتفوق في الدقة وسرعة المعالجة على النماذج المفتوحة المصدر المماثلة التي تحتوي على 8 مليارات معلمة، بنسبة تصل إلى 50% وفقًا لمعايير إنفيديا الداخلية.
- مثالي لأجهزة الحواف: يُعتبر هذا النموذج حلاً عملياً لنشر وكلاء الذكاء الاصطناعي القائمة على اللغة في البيئات ذات الموارد المحدودة، حيث يركز على كفاءة الاستدلال.
- هندسة معمارية متطورة: يستند نموذج Nemotron Nano 4B إلى بنية Llama 3.1، ويتشارك في أصوله مع عائلة “Minitron” من إنفيديا. يتبع تصميم محول كثيف، فقط على مُشفّر، وقد تم تحسينه لأداء فعال في أحمال العمل المكثفة التي تتطلب التفكير، مع الحفاظ على عدد قليل من المعلمات.
- تحسين متعدد المراحل: خضع النموذج لعملية تدريب متعددة المراحل، شملت ضبطًا دقيقًا مُشرفًا على مجموعات بيانات مُختارة بعناية، تغطي مجالات الرياضيات، والترميز، ومهام التفكير، واستدعاء الدوال. بالإضافة إلى التعلم المُشرف التقليدي، تم استخدام تقنية تحسين التعزيز القائم على المكافآت (RPO) لتعزيز فائدة النموذج في بيئات المحادثة واتباع التعليمات.
أداء النموذج واختباراته:
على الرغم من حجمه الصغير، يُظهر نموذج Nemotron Nano 4B أداءً قويًا في مهام التفكير أحادية الدورة ومتعددة الدورات. يقدم النموذج سرعة استدلال أعلى بنسبة 50% مقارنةً بالنماذج المفتوحة المصدر المماثلة التي تحتوي على 8 مليارات معلمة. يدعم النموذج نافذة سياقية تصل إلى 128,000 رمز، وهو أمر مفيد بشكل خاص للمهام التي تتضمن وثائق طويلة، أو استدعاءات دوال متداخلة، أو سلاسل استدلال متعددة القفزات. وقد تجاوز النموذج النماذج المفتوحة المصدر الأخرى في اختبارات الرياضيات، وتوليد التعليمات البرمجية، ودقة استدعاء الدوال.
نشر النموذج على أجهزة الحواف:
تتمثل إحدى الميزات الرئيسية لـ Nemotron Nano 4B في تركيزه على النشر على أجهزة الحواف. تم اختبار النموذج وتحسينه خصيصاً للتشغيل بكفاءة عالية على منصات NVIDIA Jetson و NVIDIA RTX GPUs. هذا يسمح بقدرات استدلال في الوقت الحقيقي على الأجهزة المدمجة منخفضة الطاقة، بما في ذلك أنظمة الروبوتات، ووكلاء الحواف الذاتية، أو محطات عمل المطورين المحلية.
الترخيص والوصول:
يُصدر النموذج بموجب ترخيص نموذج إنفيديا المفتوح، والذي يسمح بالاستخدام التجاري. وهو متوفر عبر Hugging Face على الرابط huggingface.co/nvidia/Llama-3.1-Nemotron-Nano-4B-v1.1، مع جميع أوزان النموذج ذات الصلة، وملفات التكوين، وعناصر المُعالج اللغوي.
الخلاصة:
يمثل نموذج Nemotron Nano 4B استثمار إنفيديا المستمر في توفير نماذج ذكاء اصطناعي عملية وقابلة للتطوير لجمهور أوسع من المطورين، خاصةً أولئك الذين يستهدفون نشر النماذج على أجهزة الحواف أو في سيناريوهات حساسة للتكلفة. بينما لا يزال المجال يشهد تقدماً سريعاً في النماذج الضخمة جداً، فإن النماذج الصغيرة والكفؤة مثل Nemotron Nano 4B توفر توازناً، مما يسمح بمرونة النشر دون المساومة بشكل كبير على الأداء.
اترك تعليقاً