ذكاء اصطناعي طبي مُحسّن: نظام g-AMIE لإجراء تشخيصات طبية دقيقة وآمنة

يُمثّل التقدم المُذهل في نماذج اللغات الكبيرة (LLM) ثورةً في مجال الذكاء الاصطناعي الطبي، حيث أصبح بإمكان هذه النماذج إجراء حوارات طبية عالية الجودة، وتقديم تشخيصات تفاضلية، ووضع خطط علاجية في بيئات مُحاكاة. إلا أن تقديم تشخيصات فردية وتوصيات علاجية يبقى مُخضعًا لوائح صارمة، حيث لا يُسمح إلا للأطباء المُرخصين باتخاذ القرارات الحرجة المتعلقة بالمرضى.

نهج مُبتكر: نظام g-AMIE ذو الإشراف المُتزامن

للتغلب على هذا التحدي، اقترح فريق من الباحثين من جوجل ديب مايند، وجوجل ريسيرش، وكلية الطب بجامعة هارفرد، بنية متعددة الوكلاء تسمى g-AMIE (Guardrailed-AMIE)، المُبنية على Gemini 2.0 Flash و المستندة إلى نظام AMIE (Articulate Medical Intelligence Explorer). يُفصل هذا النظام بشكل صارم بين جمع تاريخ المريض وتقديم المشورة الطبية الفردية، وذلك من خلال:

  • مرحلة جمع المعلومات مع ضمانات الأمان: يقوم الذكاء الاصطناعي بإجراء حوارات لجمع تاريخ المرض، وتوثيق الأعراض، وتلخيص السياق السريري، دون تقديم أي تشخيص أو توصية علاجية مباشرة للمريض. يُراقب “وكيل الحماية” (Guardrail agent) كل استجابة لضمان الامتثال، و يقوم بتصفية أي نصائح طبية محتملة قبل التواصل مع المريض.
  • توليد تقرير SOAP: بعد الانتهاء من جمع المعلومات، يقوم وكيل منفصل بتوليد ملخص سريري مُنسّق بتنسيق SOAP (Subjective, Objective, Assessment, Plan)، باستخدام التفكير المتسلسل وفك التشفير المُقيد لتحقيق الدقة والاتساق.
  • واجهة التحكم للأطباء: يقوم الأطباء المُرخصون (الأطباء المُشرفون) بمراجعة وتعديل وإصدار تصريح لتقرير SOAP الذي يولده الذكاء الاصطناعي والرسالة الموجهة للمريض، وذلك من خلال واجهة تحكم تفاعلية صُممت من خلال مقابلات تشاركية مع الأطباء. يمكن للأطباء إجراء تعديلات مُفصلة، وتقديم مُلاحظات، والقرار بشأن المضي قدماً بتوصية الذكاء الاصطناعي أو طلب متابعة. يُفصل هذا التدفق العملاني عملية جمع المعلومات عن عملية الإشراف، مما يسمح بمراجعة الطبيب بشكل غير مُزامن، مما يُزيد من قابلية التوسع مقارنةً بالإشراف المباشر المُطلوب في بعض عمليات الرعاية الصحية عن بُعد السابقة.

التقييم: دراسة OSCE صارمة والتحقق من المُصحح الآلي

للتحقق من صحة هذا النهج، أجرى فريق البحث دراسة سريرية مُوضوعية مُبنية (OSCE) افتراضية عشوائية مُعمية. تضمنت المكونات الرئيسية ما يلي:

  • مجموعات المقارنة: قُورن أداء g-AMIE مع مجموعات ضابطة، وهي أطباء الرعاية الأولية في بداية مسيرتهم المهنية (g-PCPs) ومجموعة مُختلطة من ممرضات مُمارسات ومُساعدين طبيين (g-NP/PA)، جميعهم يعملون تحت نفس ضمانات الأمان، مع إشراف من أطباء رعاية أولية كبار (o-PCPs).
  • حزم السيناريوهات: تم استخدام 60 سيناريو سريري مُعدّ يدويًا، تم اختيارها بصعوبة مُعيرة وفقًا لإرشادات المملكة المتحدة للمُساعدين الطبيين. قام ممثلون عن المرضى بمحاكاة الحالات، والتفاعل مع الذكاء الاصطناعي أو الأطباء البشر.
  • المعايير والمقاييس: تم قياس جودة الحوار المركبة، واكتمال/قابلية قراءة/دقة تقرير SOAP (باستخدام معيار QNote المُعدّل)، وصحة خطة التشخيص والعلاج، وتجربة الإشراف من قبل أطباء مُستقلين، وممثلين عن المرضى، ومُصححين آليين قائمين على نماذج اللغات الكبيرة.

النتائج الرئيسية

  • الالتزام بضمانات الأمان وجودة جمع المعلومات: امتنع g-AMIE و g-NP/PAs بنجاح عن تقديم المشورة الطبية في أكثر من 90% من السيناريوهات، مُقارنةً بـ 71.7% لـ g-PCPs. غطت عملية جمع المعلومات بواسطة g-AMIE عددًا أكبر من أعراض “العلامات الحمراء” الحرجة (64.2%) مقارنةً بمجموعات الضبط.
  • جودة تقرير SOAP: تفوقت تقارير SOAP الأولية غير المُعدلة لـ g-AMIE باستمرار على تقارير مجموعات الضبط من حيث قابلية القراءة، والاكتمال، والدقة، كما قام بتقييمها الأطباء والمُصححون الآليون.
  • الكفاءة: كان وقت الإشراف لحالات g-AMIE أقل بنسبة 40% تقريبًا من استشارات أطباء الرعاية الأولية الكاملة، مما يُظهر مكاسب كبيرة في كفاءة سير العمل للأطباء.
  • دقة خطة التشخيص والعلاج: حقق g-AMIE دقة تشخيصية عالية (81.7%) باستخدام المُصححين الآليين وتقييم الأطباء المُستقلين (مقارنةً بـ 53.3% لـ g-PCP، و 63.3% لـ g-NP/PA)، وتغطية أعلى لخطة العلاج.
  • تجربة الإشراف وجودة القرار: أبلغ o-PCPs عن تجربة أفضل مع g-AMIE وفضّلوا حالاتهم للإشراف. تضمنت معظم التعديلات تحسين الإيجاز، وتصحيح الأخطاء، أو إضافة حالات تصعيد حرجة. حسّنت التعديلات جودة التشخيص لمجموعات الضبط البشرية، ولكن ليس باستمرار بالنسبة لـ g-AMIE.
  • تفضيل ممثلي المرضى: عبر محاور التعاطف، والتواصل، والثقة (معايير PACES، GMC)، فضّل المرضى المُحاكاة باستمرار الحوارات مع g-AMIE.
  • تفوق ممرضات المُمارسة المُتقدمة/المُساعدين الطبيين على أطباء الرعاية الأولية في بعض المهام: التزمت g-NP/PAs بنجاح أكبر بضمانات الأمان وحصلت على سجلات تاريخية وتشخيصات تفاضلية ذات جودة أعلى من نظرائهم من g-PCP، ربما بسبب معرفتهم الأكبر بجمع المعلومات المُبنية على البروتوكولات.

الخلاصة: نحو ذكاء اصطناعي طبي مسؤول وقابل للتوسع

يُظهر هذا العمل أن الإشراف غير المُزامن من قبل الأطباء المُرخصين – المُمكّن بواسطة ذكاء اصطناعي تشخيصي متعدد الوكلاء مُنظم وأدوات لوحة تحكم مُخصصة – يمكن أن يُعزز كل من الكفاءة والسلامة في الاستشارات التشخيصية القائمة على النص. يتفوق نظام g-AMIE على الأطباء في بداية مسيرتهم المهنية ومقدمي الرعاية المتقدمين في جمع المعلومات المُحمي، وجودة التوثيق، وصنع القرار المركب تحت إشراف الخبراء. في حين أن النشر في العالم الحقيقي يتطلب مزيدًا من التحقق السريري والتدريب القوي، إلا أن هذا النموذج يُمثل خطوة كبيرة إلى الأمام في التعاون الطبي القابل للتوسع بين الإنسان والذكاء الاصطناعي، مع الحفاظ على المساءلة وتحقيق مكاسب كبيرة في الكفاءة.

المصدر: MarkTechPost