جينسيج: إحداث نقلة نوعية في تقسيم الصور الطبية باستخدام الذكاء الاصطناعي التوليدي
يُعد تقسيم الصور الطبية ركيزة أساسية في مجال الذكاء الاصطناعي في الرعاية الصحية الحديثة، حيث يُمكّن من أداء مهام حيوية مثل الكشف عن الأمراض، ومراقبة تطورها، وتخطيط العلاج الشخصي. في تخصصات مثل الأمراض الجلدية، والأشعة، وأمراض القلب، تزداد الحاجة إلى تقسيم دقيق – أي تعيين فئة لكل بكسل في الصورة الطبية. ومع ذلك، يبقى التحدي الرئيسي هو ندرة مجموعات البيانات الكبيرة والمعلّمة بدقة. يتطلب إنشاء هذه المجموعات جهدًا مكثفًا من قبل أخصائيين مدربين لإضافة تعليقات توضيحية على مستوى البكسل، مما يجعلها عملية مكلفة وتستغرق وقتًا طويلًا. في بيئات الرعاية الصحية الواقعية، غالبًا ما يؤدي هذا إلى ما يُعرف بـ”أنظمة البيانات المنخفضة للغاية”، حيث يكون عدد الصور الموصوفة قليلًا جدًا لتدريب نماذج التعلم العميق القوية. ونتيجة لذلك، غالبًا ما تعمل نماذج تقسيم الصور القائمة على الذكاء الاصطناعي بشكل جيد على بيانات التدريب، لكنها تفشل في التعميم، خاصةً عبر المرضى الجدد، أو معدات التصوير المختلفة، أو المستشفيات الخارجية – وهي ظاهرة تُعرف باسم “الإفراط في التجهيز”.
النهج التقليدية وقصورها
للتغلب على هذه القيود المتعلقة بالبيانات، تم تجربة استراتيجيتين رئيسيتين:
- زيادة البيانات: هذه التقنية توسع مجموعة البيانات بشكل مصطنع عن طريق تعديل الصور الموجودة (الدوران، الانعكاس، الترجمة، إلخ)، على أمل تحسين قوة النموذج.
- التعلم شبه الخاضع للإشراف: تعتمد هذه النهج على مجموعات كبيرة من الصور الطبية غير الموصوفة، مما يُحسّن نموذج التقسيم حتى في غياب التسميات الكاملة.
ومع ذلك، فإن كلا النهجين له عيوب كبيرة:
- فصل توليد البيانات عن تدريب النموذج: يعني أن البيانات المُعززة غالبًا ما تكون غير مُطابقة لاحتياجات نموذج التقسيم.
- طرق التعلم شبه الخاضع للإشراف: تتطلب كميات كبيرة من البيانات غير الموصوفة – يصعب الحصول عليها في السياقات الطبية نظرًا لقوانين الخصوصية، والاعتبارات الأخلاقية، والعوائق اللوجستية.
جينسيج: ذكاء اصطناعي توليدي مصمم خصيصًا لتقسيم الصور الطبية
طوّر فريق من الباحثين البارزين من جامعة كاليفورنيا سان دييغو، وجامعة كاليفورنيا بيركلي، ستانفورد، ومعهد وايزمان للعلوم، إطار جينسيج (GenSeg) – وهو إطار ذكاء اصطناعي توليدي من الجيل التالي مصمم خصيصًا لتقسيم الصور الطبية في سيناريوهات البيانات المنخفضة.
الميزات الرئيسية لـجينسيج:
- إطار توليدي شامل: ينتج أزواجًا اصطناعية واقعية وعالية الجودة من الصورة والقناع.
- التحسين متعدد المستويات (MLO): يُدمج جينسيج ملاحظات أداء التقسيم مباشرة في عملية توليد البيانات الاصطناعية. على عكس الزيادة التقليدية، فإنه يضمن تحسين كل مثال اصطناعي لتحسين نتائج التقسيم.
- لا حاجة لمجموعات بيانات كبيرة غير موصوفة: يلغي جينسيج الاعتماد على البيانات الخارجية النادرة والحساسة للخصوصية.
- لا يعتمد على نموذج معين: يمكن دمجه بسلاسة مع الهياكل الشائعة مثل UNet و DeepLab ونماذج تعتمد على المحولات.
كيفية عمل جينسيج: تحسين البيانات الاصطناعية لنتائج حقيقية
بدلاً من توليد الصور الاصطناعية بشكل أعمى، يتبع جينسيج عملية تحسين من ثلاث مراحل:
- توليد الصور المعززة بالقناع الاصطناعي: من مجموعة صغيرة من الأقنعة الموصوفة من قبل الخبراء، يطبق جينسيج عمليات تعزيز، ثم يستخدم شبكة توليدية متنافسة (GAN) لتركيب الصور المقابلة – مما يخلق أمثلة تدريب اصطناعية دقيقة ومقترنة.
- تدريب نموذج التقسيم: تدرب أزواج الصور الحقيقية والاصطناعية نموذج التقسيم، مع تقييم الأداء على مجموعة بيانات التحقق.
- توليد البيانات المُحرك بالأداء: تُعلّم ملاحظات دقة التقسيم على البيانات الحقيقية وتُحسّن مُولد البيانات الاصطناعية باستمرار، مما يضمن الملاءمة ويُعظم الأداء.
النتائج التجريبية: جينسيج يُحدد معايير جديدة
تم اختبار جينسيج بدقة عبر 11 مهمة تقسيم، و 19 مجموعة بيانات متنوعة للتصوير الطبي، وأنواع وأعضاء مختلفة من الأمراض، بما في ذلك آفات الجلد، والرئتين، وسرطان الثدي، وقرح القدم، والبوليبات. وتشمل النقاط البارزة:
- دقة فائقة حتى مع مجموعات بيانات صغيرة للغاية: (بقدر 9-50 صورة مُوصوفة لكل مهمة).
- تحسينات في الأداء بنسبة 10-20%: مقارنة بالأساسيات القياسية لزيادة البيانات والتعلم شبه الخاضع للإشراف.
- يتطلب بيانات مُوصوفة أقل بـ 8-20 مرة: للوصول إلى دقة مكافئة أو أعلى مقارنة بالطرق التقليدية.
- تعميم قوي خارج المجال: تنتقل النماذج المُدرّبة على جينسيج بشكل جيد إلى مستشفيات جديدة، أو طرق تصوير، أو مجموعات مرضى.
لماذا يُعد جينسيج تغييرًا جذريًا للذكاء الاصطناعي في الرعاية الصحية؟
تُلبّي قدرة جينسيج على إنشاء بيانات اصطناعية مُحسّنة للمهمة أكبر عقبة في مجال الذكاء الاصطناعي الطبي: ندرة البيانات الموصوفة. باستخدام جينسيج، يمكن للمستشفيات والعيادات والباحثين:
- تقليل تكاليف ووقت إضافة التعليقات التوضيحية بشكل كبير.
- تحسين موثوقية النموذج وتعميمه – وهو مصدر قلق رئيسي للنشر السريري.
- تسريع تطوير حلول الذكاء الاصطناعي للأمراض النادرة، أو الفئات السكانية غير الممثلة، أو طرق التصوير الناشئة.
الخلاصة: جلب ذكاء اصطناعي طبي عالي الجودة إلى بيئات البيانات المحدودة
يُمثل جينسيج قفزة كبيرة إلى الأمام في تحليل الصور الطبية المُدار بالذكاء الاصطناعي، خاصةً عندما تكون البيانات الموصوفة عاملًا مقيدًا. من خلال ربط توليد البيانات الاصطناعية بشكل وثيق بالتحقق الحقيقي، يوفر جينسيج دقة عالية وكفاءة وقابلية للتكيف – دون عوائق الخصوصية والأخلاقيات المرتبطة بجمع مجموعات بيانات ضخمة. بالنسبة لمطوري الذكاء الاصطناعي الطبي والأطباء: يمكن أن يُطلق دمج جينسيج العنان للإمكانات الكاملة للتعلم العميق حتى في أكثر بيئات الرعاية الصحية قلةً للبيانات.
اترك تعليقاً