الكاتب: عمر أحمد
-
نموذج TwinMind Ear-3: ثورة في دقة التعرف على الكلام بأسعار لا تُصدق
نموذج TwinMind Ear-3: ثورة في دقة التعرف على الكلام بأسعار لا تُصدق أعلنت شركة TwinMind، وهي شركة ناشئة متخصصة في تقنيات الذكاء الاصطناعي للصوت ومقرها كاليفورنيا، عن إطلاق نموذجها الجديد للتعرف على الكلام، Ear-3، والذي يدعي تحقيق أداء متطور على عدة مقاييس رئيسية، بالإضافة إلى… قراءة المزيد
-
نماذج التعرف الضوئي على الحروف (OCR): أفضل النماذج مفتوحة المصدر
نماذج التعرف الضوئي على الحروف (OCR): نظرة شاملة على أحدث التقنيات يُعرف التعرف الضوئي على الحروف (OCR) بأنه العملية التي تُحوّل الصور المحتوية على نصوص – مثل الصفحات الممسوحة ضوئياً، والإيصالات، والصور الفوتوغرافية – إلى نصوص قابلة للقراءة آلياً. وقد تطورت هذه العملية من أنظمة… قراءة المزيد
-
تشغيل تطبيقات خارجية مع ChatGPT: ثورة في الأتمتة والربط بين التطبيقات
تشغيل تطبيقات خارجية مع ChatGPT: ثورة في الأتمتة والربط بين التطبيقات أعلنت شركة OpenAI مؤخراً عن تحديثٍ رئيسيٍّ لوضع المطور في ChatGPT، يتمثل في دعمٍ كاملٍ لبروتوكول سياق النموذج (MCP) والذي يُمكّن من إجراء عمليات الكتابة والتحديث على التطبيقات الخارجية، بالإضافة إلى أتمتة سير العمل… قراءة المزيد
-
mmBERT: نموذج لغوي متعدد اللغات فائق السرعة والكفاءة
mmBERT: ثورة في معالجة اللغات الطبيعية متعددة اللغات يُمثل نموذج mmBERT تقدماً هائلاً في مجال معالجة اللغات الطبيعية متعددة اللغات، حيث يُقدّم بديلاً متطوراً لنموذج XLM-R الذي هيمن على هذا المجال لسنوات طويلة. يتميز mmBERT بسرعته الفائقة وكفاءته العالية وقدرته على معالجة كم هائل من… قراءة المزيد
-
بناء وكلاء متقدمين باستخدام بروتوكول سياق النموذج (MCP) وتنسيق متعدد الوكلاء
# بناء وكلاء متقدمين باستخدام بروتوكول سياق النموذج (MCP) وتنسيق متعدد الوكلاء يوضح هذا البرنامج التعليمي كيفية بناء وكيل متقدم يستخدم بروتوكول سياق النموذج (MCP) يعمل بسلاسة داخل بيئات Jupyter أو Google Colab. صُمم النظام مع مراعاة التطبيق العملي في العالم الحقيقي، مع التركيز على… قراءة المزيد
-
إطار عمل NVIDIA الجديد للبحث العميق: ثورة في البحث الآلي القابل للتدقيق
إطار عمل NVIDIA الجديد للبحث العميق: ثورة في البحث الآلي القابل للتدقيق يُعَدّ البحث العميق باستخدام الذكاء الاصطناعي مجالاً سريع التطور، لكن أدوات البحث الحالية تواجه تحديات جوهرية. تعتمد معظم هذه الأدوات على سير عمل ثابتة مرتبطة بنماذج لغوية كبيرة (LLMs) محددة، مما يحدّ من… قراءة المزيد
-
نموذج ERNIE-4.5-21B-A3B-Thinking: التفكير العميق بكفاءة عالية
نموذج ERNIE-4.5-21B-A3B-Thinking: التفكير العميق بكفاءة عالية أعلنت شركة بايدو عن إطلاق نموذجها اللغوي الكبير الجديد ERNIE-4.5-21B-A3B-Thinking، وهو نموذج مُصمم خصيصًا للتفكير العميق، مع التركيز على الكفاءة، ومعالجة السياقات الطويلة، وإمكانية دمج الأدوات الخارجية. ينتمي هذا النموذج إلى عائلة ERNIE-4.5، ويعتمد على بنية “مزيج الخبراء” (MoE)… قراءة المزيد
-
سجل MCP: طبقة اكتشاف اتحادية لذكاء الأعمال جاهزة للإنتاج
سجل MCP: طبقة اكتشاف اتحادية تُسهّل تبني ذكاء الأعمال في المؤسسات أعلن فريق تطوير بروتوكول سياق النموذج (MCP) عن إطلاق النسخة التجريبية من سجل MCP، وهو نظام يُعتبر القطعة الأخيرة في أحجية جعل ذكاء الأعمال جاهزًا تمامًا للإنتاج في المؤسسات. يُعد سجل MCP أكثر من… قراءة المزيد
-
بناء خط أنابيب لتحسين الكلام والتعرف الآلي على الكلام (ASR) باستخدام SpeechBrain في بايثون
بناء خط أنابيب متكامل لتحسين الكلام والتعرف الآلي عليه باستخدام SpeechBrain في بايثون يُقدم هذا البرنامج التعليمي تدفق عمل متطور وعملي باستخدام مكتبة SpeechBrain في بيئة بايثون. سنبدأ بتوليد عينات كلام نظيفة باستخدام gTTS، ثم نقوم عمداً بإضافة ضوضاء لمحاكاة سيناريوهات العالم الحقيقي، وبعد ذلك… قراءة المزيد
-
كشف باحثو معهد محمد بن زايد للذكاء الاصطناعي عن نموذج K2 Think: نظام معالجة لغوية مفتوح المصدر ذو 32 مليار معلمة
نظام K2 Think: ثورة في معالجة اللغة الطبيعية بمعلمات أقل أعلن فريق من الباحثين في معهد نماذج الأساسيات في معهد محمد بن زايد للذكاء الاصطناعي (MBZUAI) وشركة G42 عن إطلاق نظام K2 Think، وهو نظام مفتوح المصدر لمعالجة اللغة الطبيعية يتكون من 32 مليار معلمة،… قراءة المزيد