ألفا جينوم: نموذج عميق للتعلم يغيّر فهمنا للجينوم

أعلنت جوجل ديب مايند مؤخراً عن إطلاق ألفا جينوم (AlphaGenome)، وهو إطار عمل جديد قائم على تقنيات التعلم العميق مصمم للتنبؤ بالآثار التنظيمية للاختلافات في تسلسل الحمض النووي عبر مجموعة واسعة من النماذج البيولوجية. يمتاز ألفا جينوم بقدرته على معالجة تسلسلات الحمض النووي الطويلة – حتى 1 ميغابايت – وإنتاج تنبؤات عالية الدقة، مثل أحداث الربط على مستوى القاعدة، وإمكانية الوصول إلى الكروماتين، وتعبير الجينات، وربط عوامل النسخ.

مميزات ألفا جينوم المبتكرة:

  • معالجة تسلسلات طويلة: يتعامل ألفا جينوم مع تسلسلات حمض نووي طويلة تصل إلى 1 ميغابايت، متجاوزاً قيود النماذج السابقة التي كانت تقتصر على تسلسلات أقصر.
  • دقة عالية في التنبؤ: يوفر ألفا جينوم تنبؤات عالية الدقة على مستوى القاعدة الفردية، مما يسمح بفهم أعمق للآثار الوراثية.
  • قدرات متعددة الوسائط: يُدمج ألفا جينوم 11 نموذجاً مختلفاً للتنبؤ، ويعالج أكثر من 5000 مسار جينومي بشري وأكثر من 1000 مسار جينومي للفأر، مما يجعله نموذجاً شاملاً للغاية.
  • هندسة معمارية متقدمة: يعتمد ألفا جينوم على بنية شبكة على شكل حرف U (U-Net) مع نواة محوّل (Transformer)، مما يسمح بمعالجة متوازية لقطع الحمض النووي بطول 131 كيلوبايت على أجهزة TPUv3. يستخدم هذا النظام تضمينات ثنائية الأبعاد لنمذجة التفاعلات المكانية (مثل خرائط التلامس) وتضمينات أحادية البعد للمهام الجينومية الخطية.

عملية التدريب والاختبار:

تضمن تدريب ألفا جينوم مرحلتين:

  1. مرحلة ما قبل التدريب (Pre-training): تم استخدام نماذج محددة لكل مجموعة بيانات و نماذج تجمع جميع المجموعات للتنبؤ من المسارات التجريبية المرصودة.
  2. مرحلة التقطير (Distillation): تم تدريب نموذج أصغر (طالب) على تعلم التنبؤات من نماذج أكبر (معلم)، مما يضمن سرعة الاستنتاج (حوالي ثانية واحدة لكل متغير) على وحدات معالجة الرسوميات مثل NVIDIA H100.

تم اختبار ألفا جينوم بدقة ضد نماذج متخصصة ومتعددة الوسائط عبر 24 مسارًا جينوميًا و 26 مهمة للتنبؤ بتأثير المتغيرات. وقد تفوق على أو طابق أفضل النماذج الحالية في 22/24 و 24/26 من التقييمات على التوالي. ففي مهام الربط، وتعبير الجينات، والمهام المتعلقة بالكروماتين، تجاوز باستمرار نماذج متخصصة مثل SpliceAI و Borzoi و ChromBPNet.

أمثلة على أداء ألفا جينوم المتميز:

  • الربط (Splicing): ألفا جينوم هو الأول الذي ينمذج مواقع الربط، واستخدام مواقع الربط، والوصلات المتشابكة في آن واحد بدقة 1 زوج قاعدي. وقد تفوق على Pangolin و SpliceAI في 6 من 7 معايير.
  • التنبؤ بـ eQTL: حقق النموذج تحسناً نسبياً بنسبة 25.5% في التنبؤ باتجاه التأثير مقارنةً بـ Borzoi.
  • إمكانية الوصول إلى الكروماتين: أظهر ألفا جينوم ارتباطًا قوياً مع بيانات DNase-seq و ATAC-seq التجريبية، متفوقاً على ChromBPNet بنسبة 8-19%.

التنبؤ بتأثير المتغيرات من التسلسل فقط:

من نقاط القوة الرئيسية لألفا جينوم قدرته على التنبؤ بتأثير المتغيرات (VEP) من التسلسل فقط، دون الاعتماد على بيانات علم الوراثة السكانية، مما يجعله قوياً في التعامل مع المتغيرات النادرة والمناطق التنظيمية البعيدة. يستطيع ألفا جينوم بتنبؤ واحد تقييم كيف قد تؤثر الطفرة على أنماط الربط، ومستويات التعبير، وحالة الكروماتين – كل ذلك بطريقة متعددة الوسائط.

تطبيقات ألفا جينوم:

  • تفسير إشارات دراسات الارتباط الجيني على نطاق واسع (GWAS): يساعد ألفا جينوم في تفسير إشارات GWAS عن طريق تحديد اتجاه آثار المتغيرات على تعبير الجينات.
  • تحليل متغيرات الأمراض: أظهر ألفا جينوم فائدته في علم جينوم السرطان، حيث تطابقت تنبؤاته مع التغيرات الإبيجينومية المعروفة وآليات زيادة التعبير.

الخلاصة:

يُعد ألفا جينوم من جوجل ديب مايند نموذجاً قوياً للتعلم العميق يتنبأ بآثار طفرات الحمض النووي عبر العديد من الوسائط التنظيمية بدقة عالية. يُجمع بين نمذجة التسلسل طويل المدى، والتنبؤ متعدد الوسائط، والمخرجات عالية الدقة في بنية موحدة. بفضل تفوقه على النماذج المتخصصة والعالمية عبر 50 معياراً، يُحسّن ألفا جينوم بشكل كبير من تفسير المتغيرات الجينية غير المشفرة، وهو متوفر الآن في مرحلة المعاينة لدعم أبحاث الجينوم في جميع أنحاء العالم.

المصدر: MarkTechPost