التنبؤ بدقة مواقع البروتينات داخل الخلايا البشرية باستخدام الذكاء الاصطناعي
مقدمة
يُعدّ تحديد موقع البروتينات داخل الخلية أمراً بالغ الأهمية لفهم وظائفها ودورها في العمليات الخلوية. فاختلال موقع بروتين ما قد يساهم في ظهور العديد من الأمراض، مثل مرض الزهايمر، وتليف الكيسي، والسرطان. وتحتوي الخلية البشرية الواحدة على ما يقارب 70,000 بروتين ومتحوّل بروتيني مختلف، مما يجعل تحديد مواقعها يدوياً عمليةً مكلفةً للغاية وتستغرق وقتاً طويلاً. لذا، تسعى تقنيات الحوسبة الحديثة إلى تبسيط هذه العملية باستخدام نماذج التعلم الآلي التي تعتمد غالباً على مجموعات بيانات ضخمة تحتوي على آلاف البروتينات ومواقعها، والتي تم قياسها عبر العديد من خطوط الخلايا. ومن أكبر هذه المجموعات، أطلس البروتين البشري (Human Protein Atlas)، الذي يُوثّق السلوك الخلوي الفرعي لأكثر من 13,000 بروتين في أكثر من 40 خط خلية. لكن على الرغم من ضخامة هذه البيانات، إلا أنها لا تغطي سوى 0.25% من جميع الأزواج الممكنة من البروتينات وخطوط الخلايا ضمن قاعدة البيانات.
نهج حاسوبي جديد للتنبؤ بمواقع البروتينات
قام باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) وجامعة هارفارد ومعهد براود التابع لـ MIT وهارفارد بتطوير نهج حاسوبي جديد قادر على استكشاف الفراغات غير المستكشفة بكفاءة. تتميز هذه الطريقة بقدرتها على التنبؤ بموقع أي بروتين في أي خط خلية بشري، حتى عندما لم يتم اختبار البروتين وخط الخلية من قبل.
التفوق في تحديد الموقع على مستوى الخلية الواحدة
تتجاوز تقنية الباحثين العديد من الطرق القائمة على الذكاء الاصطناعي من خلال تحديد موقع البروتين على مستوى الخلية الواحدة، بدلاً من تقدير متوسط عبر جميع خلايا نوع معين. يُمكن لهذا التحديد على مستوى الخلية الواحدة تحديد موقع بروتين معين في خلية سرطانية محددة بعد العلاج، على سبيل المثال.
دمج نماذج لغة البروتينات ورؤية الحاسوب
جمع الباحثون نموذج لغة البروتين بنوع خاص من نماذج رؤية الحاسوب لالتقاط تفاصيل غنية عن البروتين والخلية. في النهاية، يحصل المستخدم على صورة للخلية مع جزء مُبرز يُشير إلى تنبؤ النموذج لموقع البروتين. وبما أن تحديد موقع البروتين يدل على حالته الوظيفية، فإن هذه التقنية قد تساعد الباحثين والأطباء على تشخيص الأمراض أو تحديد أهداف الأدوية بكفاءة أكبر، بالإضافة إلى تمكين علماء الأحياء من فهم أفضل لكيفية ارتباط العمليات البيولوجية المعقدة بتحديد موقع البروتين.
نموذج PUPS: طريقة ثنائية الخطوات للتنبؤ
للتغلب على قيود نماذج التنبؤ بالبروتينات الموجودة، ابتكر الباحثون طريقة من جزئين للتنبؤ بموقع البروتينات غير المرئية، والتي أطلقوا عليها اسم PUPS.
- الجزء الأول: يستخدم نموذج تسلسل البروتين لالتقاط خصائص تحديد الموقع الخاصة بالبروتين وهيكله ثلاثي الأبعاد بناءً على سلسلة الأحماض الأمينية التي تُشكّله.
- الجزء الثاني: يُدمج نموذج “إعادة إنشاء الصور” (image inpainting)، المصمم لملء الأجزاء المفقودة من الصورة. ينظر نموذج رؤية الحاسوب هذا إلى ثلاث صور مُلوّنة للخلية لجمع المعلومات حول حالة تلك الخلية، مثل نوعها، وخصائصها الفردية، وما إذا كانت تعاني من ضغط.
يقوم PUPS بدمج التمثيلات التي أنشأها كل نموذج للتنبؤ بموقع البروتين داخل خلية واحدة، باستخدام مُشفّر الصور لإخراج صورة مُبرزّة تُظهر الموقع المُتنبأ به.
تدريب النموذج وتحسين دقته
استخدم الباحثون بعض الحيل أثناء عملية التدريب لتعليم PUPS كيفية دمج المعلومات من كل نموذج بطريقة تمكنه من إجراء تخمين مُستنير حول موقع البروتين، حتى لو لم يرَ هذا البروتين من قبل. على سبيل المثال، قاموا بتعيين مهمة ثانوية للنموذج أثناء التدريب: تسمية حجرة التوطين صراحةً، مثل نواة الخلية. تم ذلك جنباً إلى جنب مع مهمة إعادة إنشاء الصور الأساسية لمساعدة النموذج على التعلم بشكل أكثر فعالية.
كما أن حقيقة أن PUPS تم تدريبه على البروتينات وخطوط الخلايا في نفس الوقت تساعده على تطوير فهم أعمق لمكان ميل البروتينات إلى التوطين في صورة الخلية. يمكن لـ PUPS حتى أن يفهم، من تلقاء نفسه، كيف تساهم أجزاء مختلفة من تسلسل البروتين بشكل منفصل في توطينه العام.
التحقق من صحة النتائج والتطبيقات المستقبلية
قام الباحثون بالتحقق من أن PUPS يمكنه التنبؤ بموقع البروتينات الجديدة في خطوط الخلايا غير المرئية من خلال إجراء تجارب مخبرية ومقارنة النتائج. بالإضافة إلى ذلك، عند مقارنته بنموذج ذكاء اصطناعي أساسي، أظهر PUPS متوسط خطأ تنبؤ أقل عبر البروتينات التي تم اختبارها.
في المستقبل، يرغب الباحثون في تحسين PUPS بحيث يتمكن النموذج من فهم تفاعلات البروتين-البروتين وإجراء تنبؤات توطين للعديد من البروتينات داخل الخلية. على المدى الطويل، يرغبون في تمكين PUPS من إجراء تنبؤات في سياق الأنسجة البشرية الحية، بدلاً من الخلايا المُزرعة.
التمويل
تم تمويل هذا البحث من قبل مركز إريك ووندي شميدت في معهد براود، والمعاهد الوطنية للصحة، والمؤسسة الوطنية للعلوم، وصندوق بوروز ويلكوم، ومؤسسة سيرل سكولارز، ومعهد هارفارد للخلايا الجذعية، ومعهد ميركين، ومكتب أبحاث البحرية، ووزارة الطاقة.








اترك تعليقاً