نموذج باندا: ثورة في التنبؤ بالأنظمة الديناميكية غير الخطية

يُعَدّ التنبؤ بسلوك الأنظمة الديناميكية غير الخطية، مثل ديناميكيات الموائع أو نشاط الدماغ، تحديًا كبيرًا نظرًا لحساسيتها العالية للظروف الأولية. فأدنى خطأ في نمذجة هذه الأنظمة قد يؤدي إلى نتائج خاطئة بشكل سريع، مما يحد من فعالية العديد من أساليب تعلم الآلة العلمية (SciML). تعتمد طرق التنبؤ التقليدية على نماذج مُدرّبة على سلاسل زمنية محددة أو مجموعات بيانات واسعة تفتقر إلى البنية الديناميكية الحقيقية. إلا أن الأبحاث الحديثة أظهرت إمكانية نماذج التنبؤ المحلية في التنبؤ بهذه الأنظمة بدقة أكبر على فترات زمنية أطول، وذلك من خلال تعلم القواعد العددية التي تحكم هذه الأنظمة.

التحدي: تعميم خارج المجال

يكمن التحدي الحقيقي في تحقيق التعميم خارج المجال، أي إنشاء نماذج قادرة على التكيف والتنبؤ بأنظمة ديناميكية جديدة لم تُشاهَد من قبل. يتطلب ذلك دمج المعرفة المسبقة مع القدرة على التكيف محليًا. ومع ذلك، فإن الحاجة إلى بيانات خاصة بالمهمة تحد من الطرق الحالية، وغالبًا ما تتجاهل خصائص أساسية في الأنظمة الديناميكية مثل الإرجودية، واقتران القنوات، والكميات المحفوظة.

تعلم الآلة للأنظمة الديناميكية (MLDS)

يستخدم تعلم الآلة للأنظمة الديناميكية (MLDS) الخصائص الفريدة لهذه الأنظمة كتحيزات استنتاجية. وتشمل هذه الخصائص العلاقات الثابتة بين متغيرات النظام، والمقاييس الإحصائية الثابتة، مثل الجاذبات الغريبة أو الكميات المحفوظة. تستخدم نماذج MLDS هذه الخصائص لبناء نماذج أكثر دقة وقابلية للتعميم، مع دمج تقنيات الاحتمالية أو المتغيرات الكامنة أحيانًا.

نموذج باندا: حلّ مبتكر

قدّم باحثون في معهد أودن بجامعة تكساس في أوستن نموذج باندا (Panda – Patched Attention for Nonlinear Dynamics)، وهو نموذج مُدرّب مسبقًا على بيانات اصطناعية فقط من 20,000 نظام ديناميكي فوضوي تم توليده خوارزميًا. تم إنشاء هذه الأنظمة باستخدام خوارزمية تطورية تستند إلى معادلات تفاضلية عادية فوضوية معروفة. وعلى الرغم من تدريبه فقط على معادلات تفاضلية عادية منخفضة الأبعاد، إلا أن باندا يُظهر قدرة قوية على التنبؤ من الصفر على الأنظمة غير الخطية في العالم الحقيقي، بما في ذلك ديناميكيات الموائع وعلم وظائف الأعضاء، كما أنه يُعمم بشكل غير متوقع على المعادلات التفاضلية الجزئية.

تصميم نموذج باندا

يُدمج النموذج ابتكارات مثل التدريب المُقنّع، واهتمام القنوات، والتصحيح المُعَكّر لالتقاط البنية الديناميكية. كما ظهر قانون تحجيم عصبي، يربط أداء التنبؤ في باندا بتنوع أنظمة التدريب.

توليد البيانات:

تم توليد 20,000 نظام فوضوي جديد باستخدام خوارزمية جينية تتطور من مجموعة مُختارة من 135 معادلة تفاضلية عادية فوضوية معروفة. تُطفر هذه الأنظمة وتُعاد دمجها باستخدام نهج منتج مائل، مع الاحتفاظ فقط بالسلوكيات الفوضوية الحقيقية من خلال اختبارات صارمة. تساهم الإضافات مثل تضمينات تأخير الوقت والتحويلات الأفينية في توسيع مجموعة البيانات مع الحفاظ على ديناميكياتها. تم الاحتفاظ بمجموعة منفصلة من 9300 نظام غير مرئي لاختبار الصفر.

بنية النموذج:

يعتمد نموذج باندا على PatchTST، وهو مُعزز بميزات مثل اهتمام القنوات، وطبقات اهتمام القناة الزمنية، وتضمينات ديناميكية باستخدام ميزات متعددة الحدود وفورييه، مستوحاة من نظرية عامل كوبرمان.

نتائج مذهلة

يُظهر باندا قدرات قوية على التنبؤ من الصفر على أنظمة ديناميكية غير خطية غير مرئية، متفوقًا على نماذج مثل Chronos-SFT عبر مقاييس وأفق تنبؤ مختلفة. وبوصله مُدرّب فقط على أنظمة ثلاثية الأبعاد، فإنه يُعمم على أنظمة ذات أبعاد أعلى نظرًا لاهتمام القنوات. وعلى الرغم من عدم مواجهته للمعادلات التفاضلية الجزئية أثناء التدريب، إلا أن باندا ينجح أيضًا في البيانات التجريبية الواقعية والمعادلات التفاضلية الجزئية الفوضوية، مثل شارع دوامة كورا-موتو-سيفياشينسكي وفون كارمان. تؤكد عمليات استئصال الهيكلة على أهمية اهتمام القنوات وتضمينات الديناميكيات. يُظهر النموذج تحجيمًا عصبيًا مع زيادة تنوع النظام الديناميكي، ويشكل أنماط اهتمام قابلة للتفسير، مما يشير إلى الرنين وهيكل حساس للجاذب. هذا يدل على التعميم الواسع لباندا عبر السلوكيات الديناميكية المعقدة.

الخلاصة والمستقبل

باختصار، باندا هو نموذج مُدرّب مسبقًا مصمم لكشف الأنماط القابلة للتعميم في الأنظمة الديناميكية. بفضل تدريبه على مجموعة كبيرة ومتنوعة من الأنظمة الفوضوية الاصطناعية، يُظهر باندا قدرة قوية على التنبؤ من الصفر على بيانات العالم الحقيقي غير المرئية، وحتى المعادلات التفاضلية الجزئية، على الرغم من تدريبه فقط على معادلات تفاضلية عادية منخفضة الأبعاد. يتحسن أداءه مع تنوع النظام، ويكشف عن قانون تحجيم عصبي. يُظهر النموذج أيضًا رنينًا غير خطي ناشئًا في أنماط الاهتمام. في حين يركز على الديناميكيات منخفضة الأبعاد، إلا أن هذا النهج قد يُوسّع إلى أنظمة ذات أبعاد أعلى من خلال الاستفادة من التفاعلات المتناثرة. تشمل الاتجاهات المستقبلية استراتيجيات تدريب مسبق بديلة لتحسين التنبؤ بسلوكيات الفوضى.

المصدر: MarkTechPost