روبوتات تدرك أجسامها بفضل نظام رؤية جديد

مقدمة

في مختبر علوم الحاسوب والذكاء الاصطناعي (CSAIL) في معهد ماساتشوستس للتكنولوجيا (MIT)، تُظهر يد روبوتية ناعمة قدرتها على الإمساك بدقة بأجسام صغيرة. وليس ما يثير الدهشة هو التصميم الميكانيكي أو أجهزة الاستشعار المدمجة – في الواقع، اليد الروبوتية خالية من أي منها. فالنظام بأكمله يعتمد على كاميرا واحدة تراقب حركات الروبوت وتستخدم بياناتها البصرية للتحكم فيه.

نظام جاكوبيان العصبي (NJF): نهج جديد للتحكم في الروبوتات

يُقدم هذا النظام، الذي طوره علماء في CSAIL، منظورًا مختلفًا للتحكم في الروبوتات. بدلاً من استخدام النماذج المصممة يدويًا أو مجموعات أجهزة الاستشعار المعقدة، يسمح هذا النظام للروبوتات بتعلم كيفية استجابة أجسامها لأوامر التحكم، وذلك من خلال الرؤية فقط. يُطلق على هذا النهج اسم “مجالات جاكوبيان العصبية” (NJF)، وهو يمنح الروبوتات نوعًا من الوعي الذاتي الجسدي. وقد نُشر بحث مفتوح المصدر حول هذا العمل في مجلة Nature في 25 يونيو.

التحول من برمجة الروبوتات إلى تعليمها

يقول سيزهي ليستر لي، طالب دكتوراه في الهندسة الكهربائية وعلوم الحاسوب في MIT، والباحث الرئيسي في هذا العمل: “يشير هذا العمل إلى تحول من برمجة الروبوتات إلى تعليمها. اليوم، تتطلب العديد من مهام الروبوتات هندسة وتشفيرًا مكثفين. في المستقبل، نتوقع إظهار ما يجب على الروبوت فعله، وتركه يتعلم كيفية تحقيق الهدف بشكل مستقل.”

التغلب على تحديات التحكم في الروبوتات اللينة

ينبع الدافع من إعادة صياغة بسيطة ولكنها قوية: إن العائق الرئيسي أمام الروبوتات الميسورة التكلفة والمرنة ليس الأجهزة، بل التحكم في القدرة، والذي يمكن تحقيقه بطرق متعددة. تُصمم الروبوتات التقليدية لتكون جامدة وغنية بأجهزة الاستشعار، مما يسهل إنشاء توأم رقمي، وهو نسخة رياضية دقيقة تُستخدم للتحكم. ولكن عندما يكون الروبوت لينًا أو قابلًا للتشوه أو غير منتظم الشكل، فإن هذه الافتراضات تنهار. بدلاً من إجبار الروبوتات على مطابقة نماذجنا، يُغير NJF هذا المفهوم – مما يمنح الروبوتات القدرة على تعلم نموذجها الداخلي الخاص من خلال الملاحظة.

توسيع نطاق تصميم الروبوتات

يمكن أن يؤدي فصل النمذجة وتصميم الأجهزة إلى توسيع نطاق تصميم الروبوتات بشكل كبير. في الروبوتات اللينة والمستوحاة بيولوجيًا، غالبًا ما يقوم المصممون بتضمين أجهزة استشعار أو تقوية أجزاء من الهيكل فقط لجعل النمذجة ممكنة. يُلغي NJF هذا القيد. لا يحتاج النظام إلى أجهزة استشعار مدمجة أو تعديلات تصميم لجعل التحكم ممكنًا. يصبح المصممون أكثر حرية في استكشاف أشكال غير تقليدية وغير مقيدة دون القلق من إمكانية نمذجتها أو التحكم فيها لاحقًا.

آلية عمل النظام

يقول لي: “فكر في كيفية تعلم التحكم في أصابعك: أنت تحركها، تراقب، تتكيف. هذا ما يفعله نظامنا. إنه يجرب إجراءات عشوائية ويحدد أي عناصر تحكم تحرك أي أجزاء من الروبوت.”

أثبت النظام أنه قوي عبر مجموعة من أنواع الروبوتات. اختبر الفريق NJF على يد روبوتية ناعمة تعمل بالهواء المضغوط قادرة على القرص والإمساك، ويد أليغرو جامدة، وذراع روبوتية مطبوعة ثلاثية الأبعاد، وحتى منصة دوارة بدون أجهزة استشعار مدمجة. في كل حالة، تعلم النظام شكل الروبوت وكيفية استجابته لإشارات التحكم، فقط من خلال الرؤية والحركة العشوائية.

التطبيقات المحتملة

يرى الباحثون إمكانات تتجاوز المختبر بكثير. يمكن أن تقوم الروبوتات المجهزة بـ NJF ذات يوم بأداء مهام زراعية بدقة تحديد موقع على مستوى السنتيمتر، أو العمل في مواقع البناء بدون مجموعات أجهزة استشعار معقدة، أو التنقل في بيئات ديناميكية حيث تفشل الطرق التقليدية.

بنية النظام

في جوهر NJF شبكة عصبية تلتقط جانبين مترابطين من تجسيد الروبوت: هندسته ثلاثية الأبعاد وحساسيته لإدخالات التحكم. يعتمد النظام على مجالات الإشعاع العصبية (NeRF)، وهي تقنية تعيد بناء المشاهد ثلاثية الأبعاد من الصور عن طريق تعيين الإحداثيات المكانية لقيم اللون والكثافة. يوسع NJF هذا النهج من خلال تعلم ليس فقط شكل الروبوت، ولكن أيضًا مجال جاكوبيان، وهو دالة تتنبأ بكيفية تحرك أي نقطة على جسم الروبوت استجابةً لأوامر المحرك.

تدريب النظام

لتدريب النموذج، يقوم الروبوت بحركات عشوائية بينما تسجل كاميرات متعددة النتائج. لا يلزم أي إشراف بشري أو معرفة مسبقة بهيكل الروبوت – يقوم النظام ببساطة باستنتاج العلاقة بين إشارات التحكم والحركة من خلال الملاحظة.

التحكم في الوقت الحقيقي

بمجرد اكتمال التدريب، يحتاج الروبوت فقط إلى كاميرا أحادية العين للتحكم في الحلقة المغلقة في الوقت الحقيقي، وتعمل بسرعة حوالي 12 هرتز. هذا يسمح له بمراقبة نفسه باستمرار، والتخطيط، والتصرف بشكل استجابة. تجعل هذه السرعة NJF أكثر جدوى من العديد من محاكيات الفيزياء للروبوتات اللينة، والتي غالبًا ما تكون كثيفة الحساب للغاية للاستخدام في الوقت الحقيقي.

التعميم والقدرة على التكيف

في عمليات المحاكاة المبكرة، تمكنت حتى أصابع وشرائح ثنائية الأبعاد بسيطة من تعلم هذا التعيين باستخدام عدد قليل فقط من الأمثلة. من خلال نمذجة كيفية تشوه أو تحول نقاط محددة استجابةً للعمل، يبني NJF خريطة كثيفة للتحكم. يسمح هذا النموذج الداخلي له بتعميم الحركة عبر جسم الروبوت، حتى عندما تكون البيانات ضعيفة أو غير كاملة.

المستقبل

يقول لي: “ما هو مثير للاهتمام حقًا هو أن النظام يكتشف بنفسه أي محركات تتحكم في أي أجزاء من الروبوت. هذا ليس مبرمجًا – إنه ينشأ بشكل طبيعي من خلال التعلم، مثلما يكتشف الشخص أزرار جهاز جديد.”

الخاتمة

لعدة عقود، فضلت الروبوتات الآلات الجامدة، التي يسهل نمذجتها – مثل الأذرع الصناعية الموجودة في المصانع – لأن خصائصها تبسط التحكم. لكن المجال تحرك نحو روبوتات لينة مستوحاة بيولوجيًا يمكنها التكيف مع العالم الحقيقي بشكل أكثر سلاسة. المساومة؟ من الصعب نمذجة هذه الروبوتات.

يقول المؤلف الرئيسي والأستاذ المساعد في معهد ماساتشوستس للتكنولوجيا فنسنت سيتزمان، الذي يقود مجموعة تمثيل المشهد: “غالبًا ما تبدو الروبوتات اليوم بعيدة المنال بسبب أجهزة الاستشعار باهظة الثمن والبرمجة المعقدة. هدفنا مع مجالات جاكوبيان العصبية هو خفض الحاجز، مما يجعل الروبوتات ميسورة التكلفة وقابلة للتكيف وفي متناول المزيد من الناس. الرؤية هي جهاز استشعار قوي وموثوق. وهي تفتح الباب أمام الروبوتات التي يمكنها العمل في بيئات فوضوية وغير منظمة، من المزارع إلى مواقع البناء، دون بنية تحتية باهظة الثمن.”

يضيف المؤلف المشارك دانييلا روس، أستاذة الهندسة الكهربائية وعلوم الكمبيوتر في معهد ماساتشوستس للتكنولوجيا ومديرة CSAIL: “يمكن للرؤية وحدها توفير الإشارات اللازمة لتحديد الموقع والتحكم – مما يلغي الحاجة إلى أنظمة تحديد المواقع العالمية أو أنظمة التتبع الخارجية أو أجهزة الاستشعار المعقدة المدمجة. وهذا يفتح الباب أمام سلوك قوي وقابل للتكيف في بيئات غير منظمة، من الطائرات بدون طيار التي تتنقل في الداخل أو تحت الأرض بدون خرائط إلى الروبوتات المتنقلة التي تعمل في المنازل أو المستودعات المزدحمة، وحتى الروبوتات ذات الأرجل التي تعبر التضاريس غير المستوية. من خلال التعلم من التغذية الراجعة البصرية، فإن هذه الأنظمة تُطور نماذج داخلية لحركتها وديناميكياتها، مما يسمح بعملية تشغيل مرنة ذاتية الإشراف حيث تفشل طرق تحديد المواقع التقليدية.”

التحديات المستقبلية والخطط البحثية

في حين أن تدريب NJF يتطلب حاليًا كاميرات متعددة ويجب إعادة إجراؤه لكل روبوت، يتخيل الباحثون بالفعل إصدارًا أكثر سهولة. في المستقبل، يمكن لهواة التصميم تسجيل حركات الروبوت العشوائية باستخدام هواتفهم، تمامًا كما يقومون بتصوير سيارة مستأجرة قبل القيادة، واستخدام هذا الفيديو لإنشاء نموذج تحكم، دون الحاجة إلى معرفة مسبقة أو معدات خاصة.

لا يُعمم النظام بعد عبر روبوتات مختلفة، وهو يفتقر إلى الإحساس بالقوة أو اللمس، مما يحد من فعاليته في المهام الغنية بالتلامس. لكن الفريق يستكشف طرقًا جديدة لمعالجة هذه القيود: تحسين التعميم، ومعالجة حالات الانسداد، وتوسيع قدرة النموذج على التفكير على مدى أفق مكاني وزمني أطول.

يختتم لي قائلاً: “تمامًا كما يطور البشر فهمًا بديهيًا لكيفية تحرك أجسامهم والاستجابة للأوامر، يمنح NJF الروبوتات هذا النوع من الوعي الذاتي المتجسد من خلال الرؤية وحدها. هذا الفهم هو أساس التلاعب والتحكم المرن في البيئات الواقعية. يعكس عملنا، في جوهره، اتجاهًا أوسع نطاقًا في الروبوتات: الانتقال من برمجة النماذج التفصيلية يدويًا إلى تعليم الروبوتات من خلال الملاحظة والتفاعل.”

المصدر: MIT News