أينيس: ثورة الذكاء الاصطناعي في دراسة النقوش اللاتينية القديمة
يُمثّل مجال النقوش، الذي يُعنى بدراسة النصوص المنقوشة على مواد متينة كالحجر والمعادن، مصدرًا أساسيًا لفهم العالم الروماني. إلا أن هذا المجال يواجه تحديات جمة، منها:
- النقوش المكسورة أو غير المكتملة: حيث تفتقر أجزاء من النصوص.
- التأريخ غير الدقيق: صعوبة تحديد تاريخ النقش بدقة.
- التنوع الجغرافي: انتشار النقوش عبر امبراطورية رومانية شاسعة.
- الاختصارات المتعددة: استخدام الاختصارات بكثرة في النصوص.
- الحجم الهائل للنقوش: يوجد أكثر من 176,000 نقش لاتيني، مع إضافة حوالي 1,500 نقش سنويًا.
أينيس: حلول الذكاء الاصطناعي لتحديات دراسة النقوش
للتغلب على هذه التحديات، طورت جوجل ديب مايند نظام “أينيس”، وهو شبكة عصبية توليدية تعتمد على بنية “محوّل” (Transformer)، قادرة على:
- استعادة الأجزاء المفقودة من النصوص: باستعادة النصوص التالفة أو غير المكتملة.
- التأريخ: تحديد تاريخ النقش بدقة.
- التحديد الجغرافي: تحديد مكان اكتشاف النقش.
- ربط النقوش بمصادر تاريخية أخرى: إيجاد نقوش مشابهة لتوضيح السياق التاريخي.
مجموعة بيانات النقوش اللاتينية (LED)
يعتمد نظام أينيس في تدريبه على مجموعة بيانات النقوش اللاتينية (LED)، وهي عبارة عن مجموعة بيانات متكاملة تضم 176,861 نقشًا لاتينيًا، مجمعة من ثلاث قواعد بيانات رئيسية. وتشمل هذه البيانات حوالي 16 مليون حرف، تغطي نقوشًا تمتد من القرن السابع قبل الميلاد إلى القرن الثامن الميلادي. وتحتوي حوالي 5% من هذه النقوش على صور بالأبيض والأسود. وتستخدم البيانات عمليات نسخ على مستوى الحرف، مع استخدام رموز خاصة للدلالة على النصوص المفقودة، إضافة إلى بيانات وصفية تشمل الموقع الجغرافي (أكثر من 62 مقاطعة رومانية) والتاريخ حسب العقد.
بنية النموذج وطرق الإدخال
يعتمد أينيس على بنية “محوّل” (Transformer) عميقة وضيقة، مستوحاة من بنية T5، مع دمج “الترجمة الدورانية” (Rotary Positional Embeddings) لمعالجة الحروف محليًا وسياقيًا. ويتم معالجة النصوص المدخلة مع الصور (إن وجدت) من خلال شبكة Convolutional ضحلة (ResNet-8)، التي تُغذّي المدخلات المرئية إلى وحدة تحديد الموقع الجغرافي فقط. ويتضمن النموذج عدة وحدات متخصصة لأداء المهام التالية:
- الاستعادة: التنبؤ بالحروف المفقودة، مع دعم الفجوات ذات الطول غير المعروف.
- التحديد الجغرافي: تصنيف النقوش ضمن 62 مقاطعة رومانية، باستخدام النصوص والصور.
- التحديد الزمني: تقدير تاريخ النص حسب العقد، باستخدام توزيع احتمالي تنبؤي.
كما يُنشئ النموذج تمثيلاً موحدًا مُثريًا تاريخيًا من خلال دمج مخرجات الوحدة الأساسية ووحدات المهام. ويُمكّن هذا التمثيل من استرجاع نقوش متوازية مرتبة حسب التشابه باستخدام “تشابه جيب التمام” (Cosine Similarity)، مما يُدمج التشابهات اللغوية والنقشية والثقافية الأوسع نطاقًا، وذلك ما يتجاوز المطابقات النصية الدقيقة.
عملية التدريب وزيادة البيانات
تم تدريب أينيس على أجهزة TPU v5e، بمُعاملات معالجة تصل إلى 1024 زوجًا من النصوص والصور. تم دمج خسائر كل مهمة مع وزن مُحسّن. تم زيادة البيانات من خلال:
- إخفاء نصوص عشوائية.
- قص النصوص.
- حذف الكلمات.
- حذف علامات الترقيم.
- زيادة الصور (التكبير، الدوران، تعديلات السطوع/التباين).
- إسقاط البيانات (Dropout).
- تلطيف العلامات (Label Smoothing).
الأداء والتقييم
أظهر أينيس تحسينات ملحوظة عند تقييمه على مجموعة اختبار LED ودراسة تعاونية بين الإنسان والذكاء الاصطناعي مع 23 باحثًا في النقوش:
- الاستعادة: انخفض معدل خطأ الحرف (CER) إلى حوالي 21% عند استخدام أينيس، مقارنة بـ 39% للخبراء البشريين دون مساعدة. يُحقق النموذج نفسه حوالي 23% CER على مجموعة الاختبار.
- التحديد الجغرافي: يُحقق حوالي 72% من الدقة في تصنيف المقاطعة من بين 62 خيارًا. مع مساعدة أينيس، يحسّن المؤرخون الدقة حتى 68%.
- التحديد الزمني: متوسط الخطأ في تقدير التاريخ هو حوالي 13 عامًا لأينيس، مع تقليل المؤرخين المُساعدين بالذكاء الاصطناعي الخطأ من حوالي 31 عامًا إلى 14 عامًا.
- النقوش المتوازية: تم قبول النقوش المتوازية المُسترجعة كنقطة انطلاق مفيدة للبحث التاريخي في حوالي 90% من الحالات، ويزيد ثقة المؤرخين بنسبة 44% في المتوسط.
دراسات حالة
- أفعال الإمبراطور أوغسطس (Res Gestae Divi Augusti): كشف تحليل أينيس عن توزيعات تأريخ ثنائية الوضع، تعكس النقاشات العلمية حول طبقاته ومراحله التكوينية (أواخر القرن الأول قبل الميلاد وأوائل القرن الأول الميلادي).
- مذبح نذري من ماينز (CIL XIII، 6665): تم تحديد تاريخه وموقعه بدقة بفضل أينيس.
دمج أينيس في سير العمل البحثي والتعليمي
يعمل أينيس كأداة تعاونية، وليس بديلاً للمؤرخين. فهو يُسرّع البحث عن النقوش المتوازية، ويساعد في الاستعادة، ويُحسّن تحديد المواقع، مما يُمكّن العلماء من التركيز على التفسيرات عالية المستوى. الأداة ومجموعة البيانات متاحة بحرية عبر منصة “التنبؤ بالماضي” (Predicting the Past). كما تم تطوير منهج تعليمي يستهدف طلاب المدارس الثانوية والمعلمين، لتعزيز معرفة التكنولوجيا الرقمية من خلال الربط بين الذكاء الاصطناعي والدراسات الكلاسيكية.
أسئلة شائعة
س1: ما هو أينيس وما هي مهامه؟
أينيس هو شبكة عصبية توليدية متعددة الوسائط طورتها جوجل ديب مايند لدراسة النقوش اللاتينية. يساعد المؤرخين في استعادة النصوص التالفة أو المفقودة في النقوش اللاتينية القديمة، وتقدير تاريخها، وتحديد أصلها الجغرافي، واسترجاع نقوش متوازية ذات صلة تاريخيًا للتحليل السياقي.
س2: كيف يتعامل أينيس مع النقوش غير المكتملة أو التالفة؟
يمكن لأينيس التنبؤ بقطع النصوص المفقودة حتى عندما يكون طول الفجوة غير معروف. يستخدم بنية محوّل (Transformer) ووحدات شبكة عصبية متخصصة لإنشاء عدة فرضيات استعادة محتملة، مرتبة حسب الاحتمالية، لتسهيل التقييم من قبل الخبراء ومواصلة البحث.
س3: كيف يتم دمج أينيس في سير عمل المؤرخين؟
يُوفر أينيس للمؤرخين قوائم مرتبة من النقوش المتوازية وفرضيات تنبؤية للاستعادة، والتأريخ، وتحديد المنشأ. تعزز هذه النتائج ثقة ودقة المؤرخين، وتقلل من وقت البحث، وتدعم التحليل التعاوني بين الإنسان والذكاء الاصطناعي. النموذج ومجموعات البيانات متاحة بحرية عبر منصة “التنبؤ بالماضي”.





اترك تعليقاً