مقدمة: التعلم الآلي والبيانات المتناظرة

يُشكّل التعامل مع البيانات المتناظرة تحديًا رئيسيًا في مجال التعلم الآلي. ففي حين يُدرك الإنسان بسهولة تناظر صورةٍ لجزيءٍ ما، حتى بعد تدويرها، قد يُخطئ نموذج التعلم الآلي في تصنيفها، مُعتبرًا إياها نقطة بيانات جديدة. تُعرف هذه الخاصية في علم الحاسوب بالتناظر، حيث يبقى البُنية الأساسية للبيانات ثابتةً رغم بعض التحويلات، مثل التدوير أو الانعكاس. يُؤدي عدم فهم التناظر في نماذج اكتشاف الأدوية، على سبيل المثال، إلى تنبؤات غير دقيقة حول خصائص الجزيئات.

التحدي: الكفاءة الحسابية في التعلم الآلي مع البيانات المتناظرة

على الرغم من بعض النجاحات التجريبية، لم يكن من الواضح وجود طريقة فعّالة حسابيًا لتدريب نموذجٍ يُضمن احترامه للتناظر. تُجيب دراسةٌ جديدة أجراها باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) على هذا السؤال، مُقدمةً أول طريقةٍ للتعلم الآلي مع التناظر، وهي فعّالةٌ بشكلٍ مُثبتٍ من حيث الحساب والبيانات المطلوبة.

أهمية فهم التناظر

يُوضح هذا البحث سؤالًا أساسيًا، كما يُساعد الباحثين في تطوير نماذج تعلم آلي أكثر قوةً وقدرةً على التعامل مع التناظر. تُفيد هذه النماذج في تطبيقاتٍ متنوعة، بدءًا من اكتشاف مواد جديدة، وصولًا إلى تحديد الشذوذ الفلكي، وفكّ تعقيدات أنماط المناخ. كما يقول بهروز طهماسب، طالب دراسات عليا في معهد ماساتشوستس للتكنولوجيا والباحث الرئيسي المشارك في هذه الدراسة: “تُعتبر هذه التناظرات معلوماتٍ قيّمةً تُخبرنا بها الطبيعة حول البيانات، ويجب أن نأخذها في الاعتبار في نماذج التعلم الآلي لدينا. لقد أثبتنا الآن إمكانية إجراء التعلم الآلي مع البيانات المتناظرة بطريقة فعّالة.”

الحل المُقترح: خوارزمية جديدة للتعلم الآلي مع البيانات المتناظرة

تظهر البيانات المتناظرة في العديد من المجالات، خاصةً العلوم الطبيعية والفيزياء. يُمكن لنموذجٍ يُدرك التناظرات تحديد جسمٍ ما، مثل سيارة، بغض النظر عن مكانه في الصورة. ولكن، دون تصميم نموذج التعلم الآلي للتعامل مع التناظر، قد يصبح أقل دقةً وأكثر عرضةً للفشل عند مواجهة بيانات متناظرة جديدة في المواقف الواقعية. من ناحية أخرى، يمكن أن تكون النماذج التي تستفيد من التناظر أسرع وتتطلب بيانات أقل للتدريب.

المقاربات السابقة:

  • زيادة البيانات (Data Augmentation): تُعد طريقة شائعة، لكنها مكلفة حسابيًا إذا أردنا ضمان احترام التناظر.
  • ترميز التناظر في بنية النموذج: مثل الشبكات العصبية الرسومية (GNNs)، وهي فعّالة لكن فهم آلية عملها غير واضح.

النهج الجديد:

بناءً على تقييمٍ نظريّ، صمم الباحثون خوارزميةً فعّالةً للتعلم الآلي مع البيانات المتناظرة. استخدموا أفكارًا من الجبر لتبسيط المشكلة، وأفكارًا من الهندسة لالتقاط التناظر بفعالية، ثم دمجوا كليهما في مشكلة تحسين يمكن حلها بكفاءة.

النتائج والتأثيرات

تتطلب الخوارزمية الجديدة عينات بيانات أقل للتدريب من المقاربات الكلاسيكية، مما يُحسّن دقة النموذج وقدرته على التكيف مع تطبيقات جديدة. يُمكن أن تؤدي هذه النتائج إلى تطوير بنى شبكات عصبية جديدة أكثر دقةً وأقل استهلاكًا للموارد من النماذج الحالية. كما يُمكن استخدام هذا التحليل كنقطة انطلاق لدراسة آلية عمل الشبكات العصبية الرسومية (GNNs) وكيفية اختلاف عملياتها عن الخوارزمية التي طورها باحثو MIT.

التمويل

تم تمويل هذا البحث جزئيًا من قبل: مؤسسة الأبحاث الوطنية في سنغافورة، مختبرات DSO الوطنية في سنغافورة، مكتب أبحاث البحرية الأمريكية، المؤسسة الوطنية للعلوم الأمريكية، ومنحة ألكساندر فون هومبولت.

المصدر: MIT News