محرك AutoDS: ثورة في الاكتشاف العلمي بفضل مفاجأة بايز
قدم معهد ألن للذكاء الاصطناعي (AI2) محرك AutoDS (الاكتشاف الذاتي عبر المفاجأة)، وهو نموذج أولي ثوري لإجراء اكتشافات علمية مستقلة مفتوحة. على عكس مساعدي البحث المعتمدين على الذكاء الاصطناعي التقليديين الذين يعتمدون على أهداف أو استفسارات محددة من قبل الإنسان، يُنشئ AutoDS، ويختبر، ويكرر الفرضيات بشكل مستقل من خلال قياس البحث عن “مفاجأة بايز” – وهو مقياس مبدئي لاكتشاف حقيقي، حتى يتجاوز ما يبحث عنه البشر تحديدًا.
من الاستفسار القائم على الأهداف إلى الاستكشاف المفتوح
تدور الأساليب التقليدية للاكتشاف العلمي المستقل (ASD) عادةً حول الإجابة على أسئلة بحث محددة مسبقًا: توليد فرضيات ذات صلة بمشكلة معينة، ثم التحقق منها تجريبياً. يختلف AutoDS بشكل أساسي عن هذا النموذج. مستوحى من الاستكشاف الذي يدفعه الفضول لدى العلماء البشر، يعمل AutoDS بطريقة مفتوحة – فهو يقرر ما هي الأسئلة التي يجب طرحها، و أي فرضيات يجب متابعتها، و كيف يمكن بناء على النتائج السابقة، كل ذلك بدون أهداف محددة مسبقًا.
يُعتبر الاكتشاف المفتوح تحديًا بطبيعته، ويتطلب آليات للتنقل عبر مساحات الفرضيات الشاسعة وتحديد أولويات الفرضيات التي تستحق التحقيق. للتعامل مع هذه التحديات، يُحدد AutoDS مفهوم “المفاجأة” – وهو تحول قابل للقياس في الاعتقاد حول فرضية ما قبل وبعد الحصول على أدلة تجريبية.
قياس مفاجأة بايز باستخدام نماذج اللغات الكبيرة
يكمن جوهر AutoDS في إطار عمل جديد لتقدير مفاجأة بايز. بالنسبة لكل فرضية تم إنشاؤها، تعمل نماذج اللغات الكبيرة (LLMs) المتطورة – مثل GPT-4o – كراقبين احتماليين، مُستخرجة “اعتقادهم” حول الفرضية (في شكل احتمالات) قبل وبعد الاختبار التجريبي. يتم تصميم توزيعات الاعتقاد هذه، التي تم إنشاؤها من خلال أخذ عينات متعددة من الأحكام من نموذج اللغة الكبير، باستخدام توزيعات بيتا. لكشف الاكتشافات ذات المغزى، يحسب AutoDS تباعد كولباك-لايبلر (KL) بين التوزيعات الخلفية (بعد الأدلة) والسابقة (قبل الأدلة) لتوزيعات بيتا – وهو مقياس رسمي لمفاجأة بايز. ومن المهم أن يتم التعامل فقط مع تحولات الاعتقاد التي تتجاوز عتبة التغيير الأدلة (مثلًا، من صحيح على الأرجح إلى خاطئ على الأرجح) على أنها مفاجئة حقًا، مما يركز النظام على الاكتشافات الجوهرية بدلاً من تحديثات عدم اليقين التافهة.
البحث الفعال عن الفرضيات باستخدام بحث شجرة مونت كارلو
يتطلب استكشاف المشهد الشاسع للفرضيات بكفاءة أكثر من أخذ عينات ساذجة. يستخدم AutoDS بحث شجرة مونت كارلو (MCTS) مع توسيع تدريجي لتوجيه بحثه عن اكتشافات مفاجئة. تمثل كل عقدة في شجرة البحث فرضية، وتتوافق الفروع مع فرضيات جديدة مشروطة بالنتائج السابقة. يسمح هذا الهيكل لـ AutoDS بالحفاظ على توازن بين استكشاف طرق جديدة ومتابعة الخيوط المثمرة. على عكس طرق البحث الجشعة أو البحث الشعاعي التي تخاطر إما بالإفراط في الالتزام أو التقليم المبكر، يحافظ MCTS على كفاءة اكتشاف عالية تحت حساب ثابت. تجريبيًا، عبر 21 مجموعة بيانات من مجالات مثل علم الأحياء والاقتصاد وعلوم السلوك، يتفوق AutoDS على أخذ عينات متكررة، وطرق البحث الجشعة، وطرق البحث الشعاعي – واكتشاف 5-29٪ من الفرضيات التي يعتبرها نموذج اللغة الكبير مفاجئة.
بنية معمارية متعددة الوكلاء متعددة نماذج اللغات الكبيرة
يُنسق AutoDS سلسلة من وكلاء نماذج اللغات الكبيرة المتخصصة، كل منها مسؤول عن جزء مختلف من سير عمل الاكتشاف العلمي المستقل:
- توليد الفرضيات
- تصميم التجارب
- البرمجة والتنفيذ
- تحليل النتائج ومراجعتها
- إزالة الازدواجية للفرضيات المتشابهة دلاليًا باستخدام خط أنابيب تصنيف هرمي: تُستخدم تضمينات نصية تعتمد على نماذج اللغات الكبيرة مع عمليات تحقق من التكافؤ الدلالي بين الأزواج لضمان أن تتضمن مجموعة الإخراج النهائية اكتشافات متميزة حقًا.
المواءمة البشرية والقابلة للتفسير
يُعتبر المواءمة مع الحدس العلمي البشري معيارًا أساسيًا. في تقييم بشري مُنظم (مع مراجعين حاصلين على شهادات ماجستير / دكتوراه في مجالات العلوم والتكنولوجيا والهندسة والرياضيات)، اعتبر 67٪ من الفرضيات التي اعتبرها AutoDS مفاجئة مفاجئة أيضًا من قبل خبراء المجال. علاوة على ذلك، تطابقت مقياس مفاجأة بايز في AutoDS بشكل أكبر مع الحكم البشري مقارنة بمقاييس بديلة مثل “الاهتمام” أو “الفائدة” المتوقعة. ومن المثير للاهتمام أن طبيعة واتجاه تحولات الاعتقاد المفاجئة تختلف باختلاف المجال العلمي – مما يبرز، على سبيل المثال، أن الادعاءات التأكيدية غالبًا ما تتطلب أدلة أقوى لتكون مفاجئة بشكل مقنع مقارنة بالتفنيدات الجديدة.
الاعتبارات العملية والآفاق المستقبلية
يُظهر AutoDS صلاحية تنفيذية وتجريبية عالية، حيث تم اعتبار أكثر من 98٪ من الاكتشافات التي تم تقييمها مُنفذة بشكل صحيح من قبل المراجعين البشريين. بينما تعتمد خطوط الأنابيب الحالية على نماذج اللغات الكبيرة التي تعمل عبر واجهات برمجة التطبيقات وبالتالي تواجه قيودًا في زمن الوصول، قام الفريق أيضًا باستكشاف تنفيذ “بحث برمجي” يوفر نتائج أسرع بكثير، وإن كانت أقل ثراءً من الناحية المفاهيمية. على الرغم من أن AutoDS هو حاليًا نموذج أولي بحثي (مع تخطيط للمصدر المفتوح في المستقبل)، إلا أن بنيته ونجاحه التجريبي يرسم مسارًا مقنعًا للعلوم القابلة للتطوير والمدعومة بالذكاء الاصطناعي.
الخلاصة:
يمثل AutoDS تقدمًا كبيرًا في التفكير العلمي المستقل. من خلال الانتقال من البحث الذي يعتمد على الأهداف إلى الاستكشاف المستقل القائم على الفضول – وتأسيس بحثه على مفاجأة بايز – يشير إلى الطريق نحو أنظمة ذكاء اصطناعي مستقبلية قادرة على استكمال أو تسريع أو حتى قيادة الاكتشاف العلمي بشكل مستقل.






اترك تعليقاً