جدول المحتويات

جوجل تُطلق جيميني 2.5 برو (إصدار I/O): ثورة في مجال الذكاء الاصطناعي

أطلقت جوجل، قبيل مؤتمرها السنوي للمطورين I/O، معاينةً مبكرةً لنموذجها الرائد للذكاء الاصطناعي، جيميني 2.5 برو (إصدار I/O). ويُمثل هذا الإصدار تحديثًا كبيرًا يركز على تطوير البرمجيات والتفكير متعدد الوسائط والفهم. يُقدم هذا الإصدار أحدث تحسينات ملحوظة في دقة البرمجة، وتوليد تطبيقات الويب، وفهم الفيديو، مما يضعه في طليعة قادة تصنيفات نماذج اللغات الكبيرة. وبفضل تصنيفه الأول في فئات تطوير تطبيقات الويب والبرمجة على منصة LM Arena، يُعتبر جيميني 2.5 برو (إصدار I/O) منافسًا جادًا في مجال مساعدة البرمجة بتقنيات الذكاء الاصطناعي التطبيقية والذكاء متعدد الوسائط.

ريادتنا في تطوير تطبيقات الويب: صدارة منصة WebDev Arena

يمتاز إصدار I/O بقدراته المتميزة في تطوير برمجيات واجهة المستخدم الأمامية، حيث حقق المركز الأول في قائمة تصنيفات WebDev Arena، وهو مقياس قائم على تقييم بشري لتطبيقات الويب المُولدة. مقارنةً بسلفه، تحسن النموذج بمقدار +147 نقطة إلو، مما يؤكد التقدم الملحوظ في الجودة والاتساق. وتشمل الإمكانيات الرئيسية:

توليد واجهة المستخدم الأمامية من النهاية إلى النهاية: يُولد جيميني 2.5 برو (إصدار I/O) تطبيقات كاملة جاهزة للتصفح من مطالبة واحدة. وتشمل المخرجات HTML مُنسقًا بشكل جيد، و CSS سريع الاستجابة، وجافا سكريبت وظيفية، مما يقلل الحاجة إلى مطالبات متكررة أو معالجة لاحقة.
توليد واجهة المستخدم عالية الدقة: يُفسر النموذج مطالبات واجهة المستخدم المُنسقة بدقة، مُنتجًا مكونات رمز قابلة للقراءة ومعيارية، مناسبة للنشر المباشر أو الدمج في قواعد الرموز الموجودة.
الاتساق عبر الوسائط المختلفة: تظل المخرجات مُتناسقة عبر مختلف مهام واجهة المستخدم الأمامية، مما يُمكّن المطورين من استخدام النموذج في إنشاء نماذج التصميم، والتصميم، وحتى عرض المكونات على مستوى المكونات. يجعل هذا جيميني قيماً بشكل خاص في تبسيط سير العمل الخاص بواجهات المستخدم الأمامية، من النموذج الأولي إلى النموذج الوظيفي.

الأداء العام في البرمجة: تفوق على GPT-4 و Claude 3.7

إلى جانب تطوير تطبيقات الويب، يُظهر جيميني 2.5 برو (إصدار I/O) إمكانيات برمجة قوية للأغراض العامة. يحتل الآن المرتبة الأولى في معيار البرمجة في LM Arena، متفوقًا على منافسين مثل GPT-4 و Claude 3.7 Sonnet. وتشمل التحسينات الملحوظة:

دعم البرمجة متعددة الخطوات: يمكن للنموذج إجراء مهام مُتسلسلة مثل إعادة هيكلة الرمز، وتحسينه، والترجمة بين اللغات المختلفة بدقة مُتحسنة.
تحسين استخدام الأدوات: تُفيد جوجل بتقليل أخطاء استدعاء الأدوات أثناء الاختبار الداخلي، وهو إنجاز مهم لسير العمل في التطوير في الوقت الحقيقي حيث يكون استدعاء الأدوات مرتبطًا ارتباطًا وثيقًا بمخرجات النموذج.
التعليمات المُنسقة عبر Vertex AI: في بيئات المؤسسات، يدعم النموذج تعليمات النظام المُنسقة، مما يمنح الفرق تحكمًا أكبر في تدفق التنفيذ، خاصةً في الأنظمة متعددة الوكلاء أو القائمة على سير العمل.

تجعل هذه التحسينات مجتمعةً إصدار I/O مساعدًا أكثر موثوقية للمهام التي تتجاوز الإكمالات ذات الوظيفة الواحدة، مما يدعم ممارسات تطوير البرمجيات في العالم الحقيقي.

فهم الفيديو الأصلي والسياقات متعددة الوسائط

في قفزة ملحوظة نحو الذكاء الاصطناعي العام، يُقدم جيميني 2.5 برو (إصدار I/O) دعمًا مُدمجًا لفهم الفيديو. يُحرز النموذج 84.8٪ في معيار VideoMME، مما يشير إلى أداء قوي في مهام التفكير المكاني والزماني. وتشمل الميزات الرئيسية:

الفهم المباشر للفيديو إلى الهيكل: يمكن للمطورين إدخال مدخلات فيديو في AI Studio والحصول على مخرجات مُنسقة، مما يلغي الحاجة إلى خطوات وسيطة يدوية أو تبديل النماذج.
نافذة سياق متعددة الوسائط مُوحدة: يقبل النموذج تسلسلات مُمتدة ومتعددة الوسائط – نصوص، وصور، وفيديوهات – ضمن سياق واحد. يُبسط هذا تطوير سير العمل متعدد الوسائط حيث يكون الاستمرارية واحتباس الذاكرة أمرًا ضروريًا.
جاهزية التطبيق: تم دمج فهم الفيديو في AI Studio اليوم، مع إمكانيات مُوسعة متاحة عبر Vertex AI، مما يجعل النموذج قابلاً للاستخدام على الفور للأدوات المُوجهة للمؤسسات. يجعل هذا جيميني مناسبًا لمجموعة من حالات الاستخدام الجديدة، من تلخيص محتوى الفيديو وأسئلة وأجوبة تعليمية إلى التكيف الديناميكي لواجهة المستخدم بناءً على مصادر الفيديو.

النشر والتكامل

يتوفر جيميني 2.5 برو (إصدار I/O) الآن عبر منصات جوجل الرئيسية:

Google AI Studio: للتجريب التفاعلي وإنشاء النماذج الأولية السريعة.
Vertex AI: للنشر على مستوى المؤسسات مع دعم التكوين على مستوى النظام واستخدام الأدوات.
تطبيق Gemini: للوصول العام عبر واجهات اللغة الطبيعية.

بينما لا يدعم النموذج بعد ضبط الدقة، إلا أنه يقبل التخصيص القائم على المطالبات والإدخال/الإخراج المُنسق، مما يجعله قابلًا للتكيف مع خطوط الأنابيب الخاصة بالمهام دون إعادة تدريب.

الخاتمة

يُمثل جيميني 2.5 برو (إصدار I/O) خطوة كبيرة إلى الأمام في جعل نماذج اللغات الكبيرة مفيدة عمليًا للمطورين والمؤسسات على حد سواء. وتُظهر قيادته لكل من قوائم تصنيف WebDev والبرمجة، إلى جانب الدعم الأصلي لإدخال الوسائط المتعددة، التركيز المتزايد لجوجل على التطبيق العملي في العالم الحقيقي. بدلاً من التركيز فقط على معايير نماذج اللغات الخام، يُعطي هذا الإصدار الأولوية للجودة الوظيفية، مُقدمًا للمطورين مخرجات مُنسقة ودقيقة وواعية بالسياق عبر مجموعة متنوعة من المهام. مع جيميني 2.5 برو (إصدار I/O)، تستمر جوجل في تشكيل مستقبل أنظمة الذكاء الاصطناعي المُركز على المطورين.

المصدر: MarkTechPost

التعليقات

اترك تعليقاً إلغاء الرد

مقالات مميزة

تلفزيونات سامسونج Micro RGB الجديدة: مليارات الألوان ليست الميزة الأهم

شركة “Inertia” تسعى لتسويق إحدى أكثر التجارب العلمية تعقيداً في العالم: الاندماج النووي بالليزر

هواوي تشوّق لهاتف Pura X Max: تصميم عريض ينافس تسريبات آبل القادمة

جوجل تُطلق جيميني 2.5 برو (إصدار I/O): تفوق على GPT-4 في البرمجة ودعم فهم الفيديو الأصلي وريادة منصة WebDev Arena