نماذج الذكاء الاصطناعي تكشف أسرار معالجة المعلومات البصرية في الدماغ

مقدمة: رحلة استكشافية في أعماق الرؤية البشرية

يُعد فهم آلية بناء الدماغ لتمثيلات داخلية للعالم المرئي أحد التحديات الأكثر إثارة للاهتمام في علم الأعصاب. خلال العقد الماضي، أعادت تقنيات التعلم العميق تشكيل مجال رؤية الكمبيوتر، حيث أنتجت شبكات عصبية لا تقتصر دقتها على مستوى دقة الإنسان في مهام التعرف على الصور فحسب، بل تبدو أيضًا أنها تعالج المعلومات بطرق تشبه أدمغتنا. هذا التداخل غير المتوقع يثير سؤالاً مثيراً للاهتمام: هل يمكن لدراسة نماذج الذكاء الاصطناعي أن تساعدنا على فهم أفضل لكيفية تعلم الدماغ نفسه الرؤية؟

قام باحثون في ميتا للذكاء الاصطناعي و المدرسة العادية العليا باستكشاف هذا السؤال من خلال التركيز على نموذج DINOv3، وهو محول رؤية ذاتي الإشراف تم تدريبه على مليارات الصور الطبيعية. قاموا بمقارنة التنشيطات الداخلية لـ DINOv3 باستجابات الدماغ البشري لنفس الصور، باستخدام تقنيتين تصوير عصبي متكاملتين: التصوير بالرنين المغناطيسي الوظيفي (fMRI) الذي يوفر خرائط مكانية عالية الدقة للنشاط القشري، وقياس مغناطيسية الدماغ (MEG) الذي يلتقط التوقيت الدقيق لاستجابات الدماغ. معًا، قدمت هذه البيانات نظرة ثرية لكيفية معالجة الدماغ للمعلومات البصرية. رابط البحث

التفاصيل التقنية: عوامل الاختلاف في النماذج

استكشف فريق البحث ثلاثة عوامل قد تدفع إلى تشابه الدماغ والنموذج: حجم النموذج، وكمية بيانات التدريب، ونوع الصور المستخدمة للتدريب. لإنجاز ذلك، درب الفريق إصدارات متعددة من DINOv3، مع تغيير هذه العوامل بشكل مستقل.

التشابه بين الدماغ والنموذج: نتائج مذهلة

وجد فريق البحث أدلة قوية على التقارب عند النظر في مدى تطابق DINOv3 مع استجابات الدماغ. تنبأت تنشيطات النموذج بإشارات fMRI في كل من المناطق البصرية المبكرة والمناطق القشرية الأعلى رتبة. بلغت أعلى درجات ارتباط الفوكسل R = 0.45، وأظهرت نتائج MEG أن المحاذاة بدأت مبكرًا منذ 70 مللي ثانية بعد ظهور الصورة واستمرت حتى ثلاث ثوانٍ. الأهم من ذلك، أن الطبقات المبكرة من DINOv3 اصطفت مع مناطق مثل V1 و V2، بينما تطابقت الطبقات الأعمق مع النشاط في المناطق الأعلى رتبة، بما في ذلك أجزاء من القشرة الجبهية.

مسارات التدريب: تطابق يتبع نمطًا تطوريًا

كشف تتبع هذه أوجه التشابه خلال عملية التدريب عن مسار تطوري. ظهرت المحاذاة البصرية منخفضة المستوى مبكرًا جدًا، بعد جزء صغير فقط من التدريب، بينما تطلبت المحاذاة عالية المستوى مليارات الصور. هذا يعكس الطريقة التي يتطور بها الدماغ البشري، حيث تنضج المناطق الحسية قبل القشرة الإتحادية. أظهرت الدراسة أن المحاذاة الزمنية ظهرت بشكل أسرع، والمحاذاة المكانية بشكل أبطأ، وتشابه التشفير بينهما، مما يبرز الطبيعة الطبقية للتطور التمثيلي.

دور عوامل النموذج: الحجم والبيانات والتدريب

كان دور عوامل النموذج مثيرًا للاهتمام بنفس القدر. حققت النماذج الأكبر باستمرار درجات تشابه أعلى، خاصة في المناطق القشرية الأعلى رتبة. حسّن التدريب الأطول المحاذاة بشكل عام، مع استفادة التمثيلات عالية المستوى أكثر من التعرض المطول. كان لنوع الصور أهمية أيضًا: أنتجت النماذج المدربة على الصور التي تركز على الإنسان أقوى محاذاة. أظهرت تلك المدربة على صور الأقمار الصناعية أو الخلوية تقاربًا جزئيًا في المناطق البصرية المبكرة، ولكن تشابهًا أضعف بكثير في مناطق الدماغ الأعلى رتبة. يشير هذا إلى أن البيانات ذات الصلة بالبيئة ضرورية لالتقاط النطاق الكامل للتمثيلات الشبيهة بالإنسان.

الروابط مع الخصائص القشرية: بنية الدماغ والذكاء الاصطناعي

من المثير للاهتمام، أن توقيت ظهور تمثيلات DINOv3 تزامن أيضًا مع الخصائص التركيبية والوظيفية للقشرة. اصطفت المناطق التي تتمتع بتوسع تطوري أكبر، أو قشرة سميكة، أو جداول زمنية داخلية أبطأ، في وقت لاحق من التدريب. على العكس من ذلك، اصطفت المناطق الغنية بالميلين بشكل أسرع، مما يعكس دورها في معالجة المعلومات السريعة. تشير هذه الارتباطات إلى أن نماذج الذكاء الاصطناعي يمكن أن تقدم أدلة حول المبادئ البيولوجية الكامنة وراء التنظيم القشري.

الطبيعة مقابل التجربة: توازن دقيق

تسلط الدراسة الضوء على التوازن بين البنية الفطرية والتعلم. تمنح بنية DINOv3 خط أنابيب معالجة هرمي، لكن التشابه الكامل مع الدماغ لم يظهر إلا مع التدريب المطول على بيانات صالحة بيئيًا. يعكس هذا التفاعل بين الأولويات المعمارية والخبرة مناقشات في علم النفس المعرفي حول الفطرة والتجربة.

التوازي التطوري: مراحل النمو المتشابهة

التشابهات مع التطور البشري مذهلة. تمامًا كما تنضج القشرة الحسية في الدماغ بسرعة وتتطور المناطق الإتحادية ببطء، اصطفت DINOv3 مع المناطق الحسية في وقت مبكر من التدريب ومع المناطق الجبهية في وقت لاحق بكثير. يشير هذا إلى أن مسارات التدريب في نماذج الذكاء الاصطناعي واسعة النطاق قد تعمل كنظائر حسابية للنضج التدريجي لوظائف الدماغ البشري.

ما وراء المسار البصري: آفاق جديدة

امتدت النتائج إلى ما وراء المسارات البصرية التقليدية. أظهر DINOv3 محاذاة في المناطق الجبهية ومتعددة الوسائط، مما يثير تساؤلات حول ما إذا كانت هذه النماذج تلتقط سمات أعلى رتبة ذات صلة بالتفكير وصنع القرار. بينما ركزت هذه الدراسة فقط على DINOv3، إلا أنها تشير إلى إمكانيات مثيرة لاستخدام الذكاء الاصطناعي كأداة لاختبار فرضيات حول تنظيم الدماغ وتطوره.

خاتمة: رؤى ثاقبة من عالم الذكاء الاصطناعي

في الختام، تُظهر هذه الأبحاث أن نماذج رؤية ذاتية الإشراف مثل DINOv3 ليست مجرد أنظمة رؤية كمبيوتر قوية. إنها تقارب أيضًا جوانب من معالجة المعلومات البصرية البشرية، وكيفية تشكيل حجم التدريب والبيانات التقارب بين الأدمغة والآلات. من خلال دراسة كيفية تعلم النماذج “الرؤية”، نكتسب رؤى قيّمة حول كيفية تطوير الدماغ البشري نفسه القدرة على إدراك وتفسير العالم.

المصدر: MarkTechPost