الكاتب: عمر أحمد
-
LongWriter-Zero: إطار تعلم تقوية لتوليد نصوص طويلة للغاية بدون بيانات اصطناعية
LongWriter-Zero: إطارٌ جديدٌ لِتوليد النصوص الطويلة للغاية باستخدام تقنيات تعلم التعزيز دون الحاجة إلى بيانات اصطناعية يُمثّل توليد النصوص الطويلة للغاية، التي تمتد لآلاف الكلمات، تحديًا متزايد الأهمية في العديد من التطبيقات الواقعية، مثل كتابة القصص والقضايا القانونية والمواد التعليمية. ومع ذلك، لا تزال نماذج… قراءة المزيد
-

نماذج الانتشار المُقنّعة المُحسّنة: إطار عمل MDM-Prime
نماذج الانتشار المُقنّعة المُحسّنة: إطار عمل MDM-Prime لإنتاج بيانات أكثر دقة وكفاءة مقدمة: تحديات نماذج الانتشار المُقنّعة (MDMs) تُعدّ نماذج الانتشار المُقنّعة (MDMs) أدوات قوية لتوليد البيانات المنفصلة، مثل النصوص أو التسلسلات الرمزية، من خلال الكشف التدريجي عن الرموز (tokens) بمرور الوقت. في كل خطوة،… قراءة المزيد
-

إطار عمل G-ACT: توجيه تحيز لغات البرمجة في نماذج اللغات الكبيرة
إطار عمل G-ACT: توجيه تحيز لغات البرمجة في نماذج اللغات الكبيرة تُظهر نماذج اللغات الكبيرة (LLMs) تقدماً مذهلاً في معالجة اللغة الطبيعية، مما يُمكّن تطوير أنظمة قادرة على إدارة سير العمل المعقدة. ومع ذلك، لا يزال استخدام هذه النماذج في توليد الشيفرات العلمية مجالاً غير… قراءة المزيد
-
دليل برمجي لبناء خط أنابيب تحليل بيانات وظيفي باستخدام مكتبة Lilac
دليل برمجي لبناء خط أنابيب تحليل بيانات وظيفي باستخدام مكتبة Lilac يقدم هذا الدليل الشامل خطوات بناء خط أنابيب تحليل بيانات وظيفي وكامل باستخدام مكتبة Lilac في بيثون، دون الاعتماد على معالجة الإشارات. يجمع هذا النهج بين قدرات إدارة مجموعات البيانات في Lilac ونمط البرمجة… قراءة المزيد
-
مجموعة بيانات Dex1B: مليار نموذج لتحسين التلاعب اليدوي في الروبوتات
مجموعة بيانات Dex1B: ثورة في مجال التلاعب اليدوي للروبوتات يُعَدّ تطوير أنظمة روبوتية قادرة على التلاعب اليدوي الدقيق أحد التحديات الرئيسية في مجال الروبوتات. فبينما تُوفر الأيدي الروبوتية مرونة أكبر وإمكانيات تلاعب أثرى من الأدوات البسيطة مثل الكلابات، إلا أن تعقيدها يجعلها صعبة التحكم. وقد… قراءة المزيد
-
بناء أدوات ذكاء اصطناعي مخصصة لتعزيز وكلاء الذكاء الاصطناعي
بناء أدوات ذكاء اصطناعي مخصصة لوكلاء الذكاء الاصطناعي: دمج التعلم الآلي والتحليل الإحصائي يُعد بناء أدوات مخصصة أمرًا بالغ الأهمية لتطوير وكلاء ذكاء اصطناعي قابلين للتخصيص. يوضح هذا البرنامج التعليمي كيفية إنشاء أداة تحليل بيانات قوية وذكية باستخدام بايثون، يمكن دمجها في وكلاء ذكاء اصطناعي… قراءة المزيد
-

هنيون-A13B: نموذج لغة كبير مفتوح المصدر بكفاءة عالية و قدرة استنتاجية متقدمة
هنيون-A13B: ثورة في نماذج اللغات الكبيرة أطلقت شركة تينسنت نموذج اللغة الكبير المفتوح المصدر “هنيون-A13B”، وهو نموذج مبني على بنية “مزيج الخبراء” (MoE) المتفرقة. على الرغم من أن النموذج يتكون من 80 مليار معلمة إجمالاً، إلا أن 13 مليار معلمة فقط تكون نشطة أثناء الاستنتاج،… قراءة المزيد
-
نموذج كُوين-في لو: ثورة في معالجة اللغة والرؤية متعددة الوسائط
نموذج كُوين-في لو: ثورة في معالجة اللغة والرؤية متعددة الوسائط أعلنت شركة علي بابا عن إطلاق نموذجها الجديد “كُوين-في لو” (Qwen-VLo)، وهو إضافة مميزة لعائلة نماذج كُوين، مصمم لتوحيد فهم وتوليد المحتوى متعدد الوسائط ضمن إطار عمل واحد. يُعدّ كُوين-في لو محركًا إبداعيًا قويًا، يُمكّن… قراءة المزيد
-
تقييم نماذج اللغات الكبيرة باستخدام MLflow: دليل عملي
تقييم نماذج اللغات الكبيرة باستخدام MLflow: دليل عملي يُعدّ MLflow منصة قوية مفتوحة المصدر لإدارة دورة حياة تعلم الآلة. بينما يُستخدم تقليديًا لتتبع تجارب النماذج، وتسجيل المعلمات، وإدارة عمليات النشر، فقد أضاف MLflow مؤخرًا دعمًا لتقييم نماذج اللغات الكبيرة (LLMs). في هذا البرنامج التعليمي، سنستكشف… قراءة المزيد
-
طفرة في الترجمة الآلية: نموذج TOWER+ متعدد اللغات الموحد
طفرة في الترجمة الآلية: نموذج TOWER+ متعدد اللغات الموحد يُعَدّ التقدم المحرز في مجال نماذج اللغات الكبيرة (LLMs) محركًا رئيسيًا للتطوير في مجال الترجمة الآلية. فهذه النماذج، المدربة على مجموعات بيانات ضخمة، قادرة على ترجمة عشرات اللغات واللهجات مع مراعاة الفروق اللغوية الدقيقة. لكن، غالبًا… قراءة المزيد
