جميني روبوتكس أون-ديڤايس: ثورة في ذكاء الروبوتات المحلي

أعلنت جوجل ديب مايند عن إصدارها الجديد، جميني روبوتكس أون-ديڤايس، وهو نسخة محلية مضغوطة من نموذجها القوي للرؤية واللغة والفعل (VLA)، والذي يُضفي ذكاءً روبوتيًا متقدمًا مباشرةً على الأجهزة. يمثل هذا الإصدار خطوةً هامةً في مجال الذكاء الاصطناعي المتجسد، حيث يلغي الحاجة إلى الاتصال المستمر بالسحابة مع الحفاظ على المرونة والشمولية والدقة العالية المرتبطة بعائلة نماذج جميني.

الذكاء الاصطناعي المحلي لإتقان الروبوتات في العالم الحقيقي

تقليديًا، اعتمدت نماذج VLA عالية السعة على المعالجة السحابية نظرًا للقيود الحسابية وقيود الذاكرة. مع جميني روبوتكس أون-ديڤايس، تقدم ديب مايند بنيةً تعمل بالكامل على وحدات معالجة الرسوميات (GPUs) المحلية المدمجة داخل الروبوتات، مما يدعم السيناريوهات الحساسة للوقت والتى تعاني من قيود عرض النطاق الترددي مثل المنازل والمستشفيات وأرضيات المصانع.

يحافظ النموذج المحلي على نقاط القوة الأساسية لجميني روبوتكس: القدرة على فهم التعليمات البشرية، واستيعاب المدخلات المتعددة الوسائط (البصرية والنصية)، وإنشاء إجراءات حركية في الوقت الفعلي. كما أنه يتميز بكفاءة عالية في التعلم، حيث يتطلب من 50 إلى 100 مثال فقط لتعميم مهارات جديدة، مما يجعله عمليًا للنشر في العالم الحقيقي عبر مجموعة متنوعة من الإعدادات.

الميزات الأساسية لجميني روبوتكس أون-ديڤايس

  • التنفيذ المحلي الكامل: يعمل النموذج مباشرةً على وحدة معالجة الرسوميات (GPU) الموجودة على متن الروبوت، مما يسمح بالتحكم في الحلقة المغلقة دون الاعتماد على الإنترنت.
  • براعة اليدين: يمكنه تنفيذ مهام معالجة ثنائية الأيدي معقدة ومنسقة، وذلك بفضل تدريبه المسبق على مجموعة بيانات ALOHA والضبط الدقيق اللاحق.
  • التوافق مع أنظمة متعددة: على الرغم من تدريبه على روبوتات محددة، إلا أن النموذج يُعمم عبر منصات مختلفة، بما في ذلك الروبوتات البشرية والروبوتات الصناعية ثنائية الذراع.
  • التكيف السريع: يدعم النموذج التعلم السريع للمهام الجديدة من عدد قليل من الأمثلة، مما يقلل بشكل كبير من وقت التطوير.

القدرات والتطبيقات في العالم الحقيقي

تتطلب مهام التلاعب البارع، مثل طي الملابس أو تجميع المكونات أو فتح الجرار، تحكمًا دقيقًا في الحركة وتكاملًا في الوقت الفعلي للردود. يُمكّن جميني روبوتكس أون-ديڤايس هذه القدرات مع تقليل تأخر الاتصال وتحسين الاستجابة. هذا أمر بالغ الأهمية بشكل خاص لنشر الأجهزة الطرفية حيث تكون الاتصال غير موثوق به أو حيث توجد مخاوف تتعلق بخصوصية البيانات.

تشمل التطبيقات المحتملة:

  • روبوتات مساعدة منزلية قادرة على أداء المهام اليومية.
  • روبوتات الرعاية الصحية التي تساعد في إعادة التأهيل أو رعاية المسنين.
  • أنظمة الأتمتة الصناعية التي تتطلب عمال خط تجميع متكيفين.

مجموعة تطوير البرامج (SDK) وتكامل MuJoCo للمطورين

إلى جانب النموذج، أصدرت ديب مايند مجموعة تطوير البرامج (SDK) لجميني روبوتكس، والتي توفر أدوات لاختبار وضبط النموذج المحلي وتكامله في سير العمل المخصص. تدعم مجموعة تطوير البرامج:

  • خطوط أنابيب التدريب للضبط المحدد للمهمة.
  • التوافق مع أنواع مختلفة من الروبوتات وإعدادات الكاميرا.
  • التقييم داخل محاكي فيزياء MuJoCo، الذي تم فتح مصدره مع معايير جديدة مصممة خصيصًا لتقييم مهام البراعة ثنائية الأيدي.

يُعد الجمع بين الاستنتاج المحلي وأدوات المطورين وبيئات المحاكاة القوية، جميني روبوتكس أون-ديڤايس حلاً نموذجيًا وقابلًا للتوسيع لباحثي ومطوري الروبوتات.

جميني روبوتكس ومستقبل الذكاء الاصطناعي المتجسد المحلي

ركزت مبادرة جميني روبوتكس الأوسع على توحيد الإدراك والتفكير والفعل في البيئات المادية. يُسهم هذا الإصدار المحلي في سد الفجوة بين أبحاث الذكاء الاصطناعي الأساسية والأنظمة القابلة للنشر التي يمكنها العمل بشكل مستقل في العالم الحقيقي. في حين أظهرت نماذج VLA الكبيرة مثل جميني 1.5 تعميمًا مثيرًا للإعجاب عبر الوسائط، إلا أن زمن استجابة الاستنتاج واعتمادها على السحابة قد حدّ من قابليتها للتطبيق في مجال الروبوتات. يعالج الإصدار المحلي هذه القيود من خلال رسوميات الحساب المُحسّنة، وضغط النماذج، والهندسة المعمارية المحددة للمهام المصممة لوحدات معالجة الرسوميات المدمجة.

الآثار الأوسع على نشر الروبوتات والذكاء الاصطناعي

من خلال فصل نماذج الذكاء الاصطناعي القوية عن السحابة، يُمهد جميني روبوتكس أون-ديڤايس الطريق للروبوتات القابلة للتطوير والمحافظة على الخصوصية. يتوافق هذا مع الاتجاه المتزايد نحو الذكاء الاصطناعي الطرفي، حيث يتم نقل أعباء العمل الحسابية إلى أقرب إلى مصادر البيانات. لا يُحسّن هذا السلامة والاستجابة فحسب، بل يضمن أيضًا أن تتمكن الوكلاء الروبوتية من العمل في بيئات ذات متطلبات صارمة للوقت أو الخصوصية.

مع استمرار ديب مايند في توسيع نطاق الوصول إلى مجموعة أدوات الروبوتات الخاصة بها – بما في ذلك فتح منصة المحاكاة وإصدار معايير جديدة – أصبح الباحثون في جميع أنحاء العالم الآن مجهزين بشكل أفضل للتجربة والتكرار وبناء أنظمة روبوتية موثوقة وفي الوقت الفعلي.

المصدر: MarkTechPost