نموذج غاليليو مفتوح المصدر: ثورة في رصد الأرض والاستشعار عن بعد
يُشكل نموذج غاليليو، الذي أطلقته وكالة ناسا بالتعاون مع باحثين من جامعات ومؤسسات بحثية مرموقة (جامعة ماكغيل، وناسا هارفيست Ai2، وجامعة كارلتون، وجامعة كولومبيا البريطانية، ومعهد فيكتور، وجامعة ولاية أريزونا)، نقلة نوعية في مجال رصد الأرض والاستشعار عن بعد. فهو نموذج أساسي متعدد الوسائط مفتوح المصدر، مصمم لتحليل وفهم تدفقات بيانات رصد الأرض المتنوعة على نطاق واسع.
خصائص نموذج غاليليو المميزة:
-
تصميم مُحوّل متعدد الوسائط (Multimodal Transformer): يعتمد غاليليو على بنية محوّل الرؤية (ViT) المُعدّلة بعناية لمعالجة أنواع بيانات متنوعة، تشمل:
- صور بصرية متعددة الأطياف (مثل Sentinel-2).
- بيانات الرادار ذي الفتحة الاصطناعية (SAR) (مثل Sentinel-1).
- بيانات الارتفاع والانحدار (مثل بيانات SRTM من ناسا).
- بيانات الطقس والمناخ (مثل بيانات هطول الأمطار ودرجة الحرارة من ERA5).
- خرائط تغطية الأرض، والبيانات السكانية، وبيانات الإضاءة الليلية، وغيرها.
-
معالجة مرنة للمدخلات: تقوم خط أنابيب تمييز الرموز في غاليليو بتقسيم مدخلات الاستشعار عن بعد إلى رقعة مكانية، وخطوات زمنية، ومجموعات قنوات منطقية. يسمح هذا للنموذج بمعالجة الصور، والمتسلسلات الزمنية، والبيانات الجدولية الثابتة في تكوين معماري واحد.
-
تعلم الميزات المحلية والعالمية الموحد: تُعد خوارزمية التدريب الذاتي المُشرف لنموذج غاليليو من الابتكارات الأساسية، حيث تجمع بين:
- الخسائر العالمية: تشجع على التجريد على سياقات مكانية أو زمنية واسعة – مثالية لتحديد الميزات الكبيرة أو التي تتغير ببطء (الأنهار الجليدية، وفقدان الغابات).
- الخسائر المحلية: تعزز الحساسية للتفاصيل الدقيقة – أمر بالغ الأهمية للكشف عن الأشياء الصغيرة التي تتغير بسرعة (القوارب، والحطام).
تختلف الأهداف المحلية والعالمية في:
- عمق التنبؤ: تستهدف المهام العالمية التمثيلات الكامنة العميقة؛ تستخدم المهام المحلية ميزات مُسقطة خطيًا ضحلة.
- استراتيجيات الإخفاء: تستخدم المهام العالمية أقنعة زمانية مكانية منظمة ومترابطة (إجبار التنبؤات على فترات زمنية طويلة)؛ تستخدم المهام المحلية أقنعة عشوائية غير منظمة.
يعزز هذا التدريب ثنائي الهدف تمثيل الميزات متعددة المقاييس، مما يجعل غاليليو قابلاً للتعميم عبر المهام وقوياً حتى مع وجود بيانات مُسمّاة محدودة.
مجموعة بيانات التدريب واستراتيجيته:
لضمان التنوع الدلالي والجغرافي، تغطي مجموعة بيانات تدريب غاليليو الكرة الأرضية بأكملها، وعينات من خلال نهج التجميع لزيادة تنوع تغطية الأرض والانتشار الجغرافي. تتضمن مجموعة البيانات أكثر من 127,000 عينة مُحاذية مكانيًا وزمنيًا، وتشمل كل منها أربع فئات وتسعة أنواع من بيانات الاستشعار عن بعد. يستمر التدريب لمدة 500 حقبة على موارد حوسبة كبيرة.
- حجم الدفعة: حجم دفعة فعال يبلغ 512.
- زيادة البيانات: الانعكاس، والدوران، وأحجام الرقع المتغيرة.
- التحسين: AdamW مع معدل تعلم مُجدول ومسوحات اضمحلال الوزن.
نتائج الاختبار:
يُظهر غاليليو تفوقًا في التعميم على 11 مجموعة بيانات متنوعة و 15 مهمة تالية، تشمل تصنيف الصور ومتسلسلات البكسل الزمنية، بالإضافة إلى التقسيم. يتفوق تحديدًا على مجموعات البيانات العامة مثل EuroSat، وBigEarthNet، وSo2Sat، وMADOS (الحطام البحري)، وSen1Floods11 (رسم خرائط الفيضانات SAR)، وCropHarvest (تصنيف المحاصيل متعددة الوسائط)، وغيرها الكثير.
أبرز نتائج أداء غاليليو-Base (ViT-Base):
- التصنيف (التحسين الدقيق):
- EuroSat: 97.7% (دقة مرتبة أولى، 100% من بيانات التدريب) – يتفوق على النماذج المتخصصة مثل CROMA (96.6%) وSatMAE (96.6%).
- متسلسلات البكسل الزمنية:
- CropHarvest (كينيا): 84.2% (يتفوق على Presto وAnySat).
- Breizhcrops: 73.0%.
- التقسيم (mIoU):
- MADOS: 67.6%.
- PASTIS: 79.4%.
يُظهر غاليليو أداءً متفوقًا بشكل ثابت ومرونة عبر جميع معايير رصد الأرض الرئيسية. تجدر الإشارة إلى أن المتغيرات الصغيرة للنموذج (ViT-Nano، ViT-Tiny) تحقق أيضًا نتائج متميزة أو شبه متميزة، وهو أمر بالغ الأهمية للبيئات التي تفتقر إلى الموارد.
التحليل الاستنتاجي وأهمية المدخلات:
يؤدي إزالة أي وسائط فردية (مثل أضواء ليل VIIRS، أو ERA5، أو خرائط العالم الديناميكي) من التدريب إلى انخفاض ملحوظ في الأداء – حتى في المعايير التي لا تستخدم هذا النوع من المدخلات مباشرة. على سبيل المثال، يؤدي غياب بيانات VIIRS إلى تقليل MADOS mIoU من 67.8% إلى 63.5%، مما يدل على قيمة تعدد الوسائط الكامل لتعميم الميزات.
مفتوح المصدر وتأثيره في العالم الحقيقي:
- الأوزان والرموز المفتوحة: تتوفر جميع الرموز، وأوزان النموذج، وبيانات التدريب على GitHub، مما يعزز الشفافية واعتماد مجتمع رصد الأرض العالمي.
- الفوائد الاجتماعية: يدعم غاليليو أنشطة ناسا هارفيست المهمة، مثل رسم خرائط أنواع المحاصيل العالمية، ورسم خرائط الكوارث السريعة (الفيضانات، وحرائق الغابات)، والكشف عن التلوث البحري. تجعل قدرة النموذج على العمل ببيانات مُسمّاة محدودة قيمته عالية بشكل خاص في المناطق التي تندر فيها الحقيقة الأرضية، مما يدعم جهود الأمن الغذائي والتكيف مع المناخ.
ملخص تقني:
| النموذج | المعلمات | المهام المدعومة | الترتيب (الأقل أفضل) | الوسائط المدخلة |
|---|---|---|---|---|
| غاليليو-Base | 85 مليون | صور، متسلسلات زمنية | 1 (بشكل عام) | بصرية، SAR، طقس، إلخ |
| نماذج متخصصة رائدة | متنوعة | عادةً 1 أو 2 نوع | 3-10 | محدودة |
غاليليو-Base: أداء متفوق بشكل ثابت ومرونة عبر جميع معايير رصد الأرض الرئيسية.
الخاتمة:
تمثل التطورات المنهجية والهندسية لنموذج غاليليو – المدخلات متعددة الوسائط، وتعلم الميزات المحلية والعالمية متعددة المقاييس، والتدريب واسع النطاق ومتنوع جغرافياً – معيارًا جديدًا للذكاء الاصطناعي العام للاستشعار عن بعد. تدعم مرونته عمليات النشر العملية من رصد البيئة إلى الصمود في وجه تغير المناخ، مما يوفر خرائط وتوقعات عالية الجودة وموثوقة بغض النظر عن المهمة أو الموقع الجغرافي. مع الوصول مفتوح المصدر والتطوير النشط، من المقرر أن يحفز غاليليو موجة جديدة من الابتكار في علوم النظام الأرضي، مما يمكّن الممارسين في كل مكان.





اترك تعليقاً