نموذج حاسوبي متطور للتنبؤ بمدى ذوبان الجزيئات في المذيبات العضوية
مقدمة
طور مهندسو الكيمياء في معهد ماساتشوستس للتكنولوجيا (MIT) نموذجًا حاسوبيًا قائمًا على تقنيات تعلم الآلة، قادرًا على التنبؤ بدقة مدى ذوبان أي جزيء معين في مذيب عضوي. تُعد هذه الخطوة حاسمة في تصنيع الأدوية والكثير من المواد الكيميائية الأخرى. يُسهم هذا النموذج في تسهيل تطوير طرق جديدة لإنتاج الأدوية والجزيئات المفيدة.
أهمية التنبؤ بمدى الذوبان
يُعد التنبؤ بدقة بمدى ذوبان المذاب في مذيب معين أمرًا بالغ الأهمية في اختيار المذيب المناسب لأي تفاعل كيميائي، خاصة في مجال تصنيع الأدوية. يقول Lucas Attia، طالب دراسات عليا في MIT وأحد المؤلفين الرئيسيين للدراسة: “إن التنبؤ بالذوبان يُعتبر خطوة محددة للمعدل في التخطيط الاصطناعي وتصنيع المواد الكيميائية، وخاصة الأدوية، لذا كان هناك اهتمامٌ طويل الأمد بإمكانية إجراء تنبؤات أفضل للذوبان”.
النموذج الجديد وتطبيقاته
يُتيح هذا النموذج الجديد، المتاح مجانًا للجميع، إمكانية تحديد المذيبات الأقل ضررًا على البيئة مقارنةً بالعديد من المذيبات الصناعية الشائعة الاستخدام. يُضيف Jackson Burns، طالب دراسات عليا في MIT وأحد المؤلفين الرئيسيين للبحث: “توجد بعض المذيبات المعروفة بقدرتها على إذابة معظم المواد. إنها مفيدة للغاية، لكنها ضارة بالبيئة والإنسان، لذا تتطلب العديد من الشركات تقليل استخدام هذه المذيبات إلى الحد الأدنى. يُعد نموذجنا مفيدًا للغاية في تحديد المذيب الأنسب، والذي نأمل أن يكون أقل ضررًا للبيئة”.
المقارنة مع النماذج السابقة
استند النموذج الجديد إلى مشروع قام به Attia و Burns في دورة بـ MIT حول تطبيق تعلم الآلة على مشاكل هندسة الكيمياء. تقليديًا، استخدم الكيميائيون نموذجًا يُعرف باسم “نموذج إبراهام للذوبان” (Abraham Solvation Model) للتنبؤ بالذوبان، والذي يعتمد على جمع مساهمات الهياكل الكيميائية داخل الجزيء. على الرغم من فائدة هذه التنبؤات، إلا أن دقتها محدودة.
في السنوات القليلة الماضية، بدأ الباحثون في استخدام تعلم الآلة لتحسين دقة التنبؤات. قبل عمل Burns و Attia، كان أفضل نموذج للتنبؤ بالذوبان هو نموذج SolProp الذي طُور في مختبر Green عام 2022. يعتمد هذا النموذج على التنبؤ بمجموعة من الخصائص ذات الصلة ودمجها باستخدام الديناميكا الحرارية للتنبؤ بالذوبان، لكنه يعاني من صعوبة في التنبؤ بالذوبان للجزيئات الجديدة.
بيانات التدريب وتحسين الدقة
كان أحد أسباب عدم كفاءة نماذج الذوبان السابقة هو عدم وجود مجموعة بيانات شاملة لتدريبها. ومع ذلك، تم إصدار مجموعة بيانات جديدة في عام 2023 تسمى BigSolDB، والتي جمعت بيانات من ما يقارب 800 ورقة علمية، بما في ذلك معلومات حول ذوبان حوالي 800 جزيء في أكثر من 100 مذيب عضوي شائع الاستخدام في الكيمياء الاصطناعية.
درب Attia و Burns نموذجين مختلفين على هذه البيانات، وكلاهما يمثل الهياكل الكيميائية للجزيئات باستخدام تمثيل رقمي يُعرف باسم “المدمج” (embeddings)، والذي يتضمن معلومات مثل عدد الذرات في الجزيء والذرات المرتبطة ببعضها البعض. يمكن للنماذج بعد ذلك استخدام هذه التمثيلات للتنبؤ بمجموعة متنوعة من الخصائص الكيميائية.
أظهرت النتائج أن نماذجهم الجديدة أكثر دقة من SolProp بمقدار ضعفين إلى ثلاثة أضعاف، خاصةً في التنبؤ بالتغيرات في الذوبان بسبب درجة الحرارة.
النتائج والمستقبل
أصدر الباحثون نموذج FastSolv، القائم على FastProp، للجمهور نظرًا لسرعته وسهولة استخدامه. وقد بدأت العديد من شركات الأدوية في استخدامه بالفعل. يُشير الباحثون إلى إمكانية زيادة دقة النماذج من خلال توفير بيانات تدريب واختبار أفضل، والتي يجب أن تكون موحدة في طريقة جمعها.
التمويل
تم تمويل هذا البحث جزئيًا من قبل وزارة الطاقة الأمريكية.








اترك تعليقاً