تحسين موثوقية تصنيفات الذكاء الاصطناعي عبر تقنية تعزيز وقت الاختبار
مقدمة
يُشكل الغموض في التصوير الطبي تحديًا كبيرًا للأطباء الذين يحاولون تشخيص الأمراض. فعلى سبيل المثال، قد يبدو الانصباب الجنبي (تراكم غير طبيعي للسوائل في الرئتين) في صورة أشعة سينية للصدر مشابهًا جدًا للترسبات الرئوية (تراكم القيح أو الدم). يمكن أن تساعد نماذج الذكاء الاصطناعي الأطباء في تحليل صور الأشعة السينية من خلال تحديد التفاصيل الدقيقة وزيادة كفاءة عملية التشخيص. ومع ذلك، نظرًا لوجود العديد من الحالات المرضية المحتملة في صورة واحدة، قد يرغب الطبيب في النظر في مجموعة من الاحتمالات بدلاً من الاعتماد على تنبؤ واحد فقط من الذكاء الاصطناعي.
التصنيف المطابق وتحدياته
تُعد طريقة التصنيف المطابق (Conformal Classification) من الطرق الواعدة لإنتاج مجموعة من الاحتمالات، حيث يمكن تطبيقها بسهولة على نماذج التعلم الآلي الموجودة. ومع ذلك، قد ينتج عن هذه الطريقة مجموعات كبيرة جدًا من الاحتمالات، مما يجعلها غير عملية.
منهجية البحث والنتائج
طور باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) تحسينًا بسيطًا وفعالًا يمكنه تقليل حجم مجموعات التنبؤ بنسبة تصل إلى 30٪ مع زيادة موثوقية التنبؤات. يعتمد هذا التحسين على دمج تقنية تعزيز وقت الاختبار (Test-Time Augmentation – TTA) مع التصنيف المطابق. تقوم تقنية TTA بإنشاء تعديلات متعددة لصورة واحدة في مجموعة البيانات، مثل اقتصاص الصورة، أو قلبها، أو التكبير، إلخ. ثم يتم تطبيق نموذج رؤية الكمبيوتر على كل نسخة من الصورة نفسها، ويتم تجميع تنبؤاته.
قام الباحثون بتطبيق هذه التقنية من خلال الاحتفاظ ببعض بيانات الصور المُمَوَّهة المستخدمة في عملية التصنيف المطابق. قاموا بتعلم كيفية تجميع التعديلات على هذه البيانات المُحتفظ بها، مما يُعزز الصور تلقائيًا بطريقة تُعظم دقة تنبؤات النموذج الأساسي. ثم قاموا بتشغيل التصنيف المطابق على تنبؤات النموذج الجديدة المُعززة بتقنية TTA. نتج عن ذلك مجموعة أصغر من التنبؤات المحتملة مع ضمان نفس مستوى الثقة.
أظهرت النتائج أن دمج تقنية TTA مع التصنيف المطابق يُقلل حجم مجموعات التنبؤ بنسبة تتراوح بين 10٪ و 30٪ عبر عدة معايير تصنيف صور قياسية، مع الحفاظ على ضمان الاحتمالية. كما وجد الباحثون أن تعزيز الدقة بفضل TTA يفوق تكلفة فقدان البيانات المُمَوَّهة المستخدمة عادةً في عملية التصنيف المطابق.
المناقشة والنتائج المستقبلية
يُعد هذا النهج بسيطًا في التنفيذ وفعالًا عمليًا ولا يتطلب إعادة تدريب النموذج. يُثير هذا العمل أسئلة مثيرة حول كيفية استخدام البيانات المُمَوَّهة بعد تدريب النموذج، حيث يمثل تخصيص البيانات المُمَوَّهة بين خطوات ما بعد التدريب المختلفة اتجاهًا مهمًا للأبحاث المستقبلية. يهدف الباحثون في المستقبل إلى التحقق من فعالية هذا النهج في سياق نماذج تصنيف النصوص بدلاً من الصور، بالإضافة إلى دراسة طرق لتقليل الحسابات اللازمة لتقنية TTA.
تمويل البحث
تم تمويل هذا البحث جزئيًا من قبل شركة Wistrom.
اترك تعليقاً