مجموعة MedGemma من جوجل: ثورة في فهم النصوص والصور الطبية

قدمَت جوجل خلال مؤتمرها السنوي I/O 2025، مجموعة نماذج MedGemma مفتوحة المصدر، مصممة خصيصاً لفهم النصوص والصور الطبية بشكل متعدد الوسائط. وتعتمد هذه المجموعة على بنية Gemma 3، بهدف تزويد المطورين بأداة قوية لبناء تطبيقات الرعاية الصحية التي تتطلب تحليلاً متكاملاً للصور الطبية والبيانات النصية.

أنواع النماذج والهندسة المعمارية

تتوفر MedGemma بنسختين:

  • MedGemma 4B: نموذج متعدد الوسائط يحتوي على 4 مليارات بارامتر، قادر على معالجة كل من الصور الطبية والنصوص. يستخدم هذا النموذج مُشفّر صور SigLIP المُدرّب مسبقاً على مجموعات بيانات طبية مُجهولة الهوية، بما في ذلك صور أشعة الصدر، وصور الأمراض الجلدية، وصور طب العيون، وشرائح الأنسجة المرضية. أما مكون نموذج اللغة، فقد تم تدريبه على بيانات طبية متنوعة لضمان فهم شامل.

  • MedGemma 27B: نموذج نصي فقط يحتوي على 27 مليار بارامتر، مُحسّن للمهام التي تتطلب فهماً عميقاً للنصوص الطبية والتفكير السريري. تم تدريب هذا النموذج حصرياً باستخدام التعليمات، وهو مُصمم للتطبيقات التي تتطلب تحليلاً نصياً متقدماً.

النشر والوصول

يمكن للمطورين الوصول إلى نماذج MedGemma من خلال منصة Hugging Face، بشرط الموافقة على شروط استخدام Health AI Developer Foundations. ويمكن تشغيل النماذج محلياً لأغراض التجريب، أو نشرها كنقاط نهاية HTTPS قابلة للتطوير عبر منصة Vertex AI من جوجل Cloud للتطبيقات الإنتاجية. كما توفر جوجل موارد، بما في ذلك دفاتر Colab، لتسهيل عملية ضبط النموذج الدقيق ودمجه في مختلف سير العمل.

التطبيقات وحالات الاستخدام

تُعد MedGemma نموذجاً أساسياً للعديد من تطبيقات الرعاية الصحية، منها:

  • تصنيف الصور الطبية: يُناسب نموذج 4B تصنيف أنواع مختلفة من الصور الطبية، مثل مسوحات الأشعة وصور الأمراض الجلدية.
  • تفسير الصور الطبية: يمكنه توليد تقارير أو الإجابة على أسئلة تتعلق بالصور الطبية، مما يُساعد في عمليات التشخيص.
  • تحليل النصوص السريرية: يتميز نموذج 27B بفهمه و تلخيصه للملاحظات السريرية، مما يدعم مهام مثل فرز المرضى ودعم اتخاذ القرارات.

التكييف والضبط الدقيق

على الرغم من أن MedGemma يوفر أداءً أساسياً قوياً، إلا أن المطورين مدعوون للتحقق من صحة النماذج وضبطها الدقيق لتناسب حالات استخدامهم الخاصة. ويمكن استخدام تقنيات مثل هندسة المُطالبات، والتعلم ضمن السياق، وطرق الضبط الدقيق الفعالة من حيث المعلمات مثل LoRA، لتحسين الأداء. وتوفر جوجل إرشادات وأدوات لدعم هذه عمليات التكييف.

الخاتمة

تمثل MedGemma خطوة مهمة في توفير أدوات مفتوحة المصدر وسهلة الوصول لتطوير الذكاء الاصطناعي الطبي. وبفضل قدراتها المتعددة الوسائط وقابلية تطويرها وقابليتها للتكيف، فهي مورد قيّم للمطورين الذين يهدفون إلى بناء تطبيقات تجمع بين تحليل الصور الطبية والنصوص. يمكنكم الاطلاع على النماذج على Hugging Face وصفحة المشروع.

المصدر: MarkTechPost