تطوير أنظمة تخزين البيانات لتلبية متطلبات ثورة الذكاء الاصطناعي

تأثير الذكاء الاصطناعي على تخزين البيانات

يُحدث الذكاء الاصطناعي تحولاً جذرياً في طريقة تخزين البيانات والوصول إليها في المؤسسات. فقد صُممت أنظمة تخزين البيانات التقليدية للتعامل مع أوامر بسيطة من عدد قليل من المستخدمين في وقت واحد، بينما تتطلب أنظمة الذكاء الاصطناعي الحديثة، التي تضم ملايين الوكلاء، الوصول المستمر ومعالجة كميات هائلة من البيانات بالتوازي. وتُعاني أنظمة التخزين التقليدية من طبقات معقدة من العمليات، مما يُبطئ من سرعة أنظمة الذكاء الاصطناعي لأن البيانات يجب أن تمر عبر عدة مراحل قبل الوصول إلى وحدات معالجة الرسومات (GPUs) التي تُعتبر بمثابة الخلايا العصبية للذكاء الاصطناعي.

حل Cloudian للتحدي

تساهم شركة Cloudian، التي شارك في تأسيسها مايكل تسو (خريج MIT) وهروشي أوهتا، في مواكبة ثورة الذكاء الاصطناعي من خلال تطوير نظام تخزين قابل للتوسع للشركات. يساعد هذا النظام على تدفق البيانات بسلاسة بين أنظمة التخزين ونماذج الذكاء الاصطناعي. يُقلل النظام من التعقيد من خلال تطبيق الحوسبة المتوازية على تخزين البيانات، ودمج وظائف الذكاء الاصطناعي والبيانات على منصة معالجة متوازية واحدة تقوم بتخزين، واسترجاع، ومعالجة مجموعات بيانات قابلة للتوسع، مع عمليات نقل مباشرة و عالية السرعة بين أنظمة التخزين ووحدات معالجة الرسومات (GPUs) ووحدات المعالجة المركزية (CPUs).

تُسهل منصة الحوسبة والتخزين المتكاملة من Cloudian عملية بناء أدوات ذكاء اصطناعي على نطاق تجاري، وتوفر للشركات أساس تخزين قادر على مواكبة تطور الذكاء الاصطناعي.

أهمية البيانات في الذكاء الاصطناعي

يُعلق مايكل تسو على أهمية البيانات قائلاً: “أحد الجوانب التي يغفل عنها الكثيرون فيما يتعلق بالذكاء الاصطناعي هو أهمية البيانات. لا يمكنك تحقيق تحسن بنسبة 10% في أداء الذكاء الاصطناعي بزيادة البيانات بنسبة 10% أو حتى 10 أضعاف، بل تحتاج إلى زيادة البيانات بألف مرة. تكمن أهمية تطوير هذا المجال في القدرة على تخزين هذه البيانات بطريقة سهلة الإدارة، وبطريقة تسمح بدمج العمليات الحسابية فيها، بحيث يمكن تشغيل العمليات أثناء وصول البيانات دون الحاجة إلى نقلها.”

مسيرة مايكل تسو في مجال الحوسبة المتوازية

تلقى تسو تعليمه الجامعي في معهد ماساتشوستس للتكنولوجيا (MIT) في التسعينيات، حيث تعرف على الحوسبة المتوازية بفضل البروفيسور ويليام دالي، وهو نوع من الحوسبة التي تتم فيها العديد من العمليات الحسابية في وقت واحد. كما عمل تسو في مجال الحوسبة المتوازية مع الأستاذ المساعد جريج بابادوبولوس. يذكر تسو: “كانت فترة رائعة، فمعظم الجامعات كانت لديها مشروع حوسبة فائقة واحد، بينما كان لدى MIT أربعة مشاريع”.

خلال دراسته العليا، عمل تسو مع العالم الباحث الأول ديفيد كلارك، وهو رائد في مجال الحوسبة ساهم في البنية التحتية المبكرة للإنترنت، لا سيما بروتوكول التحكم في النقل (TCP) الذي يُسلم البيانات بين الأنظمة. يقول تسو: “خلال دراستي العليا في MIT، عملت على عمليات الشبكات المنفصلة والمتقطعة لأنظمة موزعة واسعة النطاق. الأمر مضحك، فبعد 30 عاماً، ما زلت أقوم بنفس العمل اليوم”.

مسيرة تسو المهنية وتأسيس Cloudian

بعد تخرجه، عمل تسو في مختبر هندسة Intel، حيث اخترع خوارزميات مزامنة البيانات التي تستخدمها شركة بلاك بيري. كما قام بإنشاء مواصفات لشركة نوكيا أشعلت صناعة تنزيل نغمات الرنين. ثم انضم إلى Inktomi، وهي شركة ناشئة شارك في تأسيسها إريك بروير (خريج MIT)، والتي كانت رائدة في تقنيات البحث وتوزيع محتوى الويب.

في عام 2001، أسس تسو شركة Gemini Mobile Technologies مع جوزيف نورتون (خريج MIT) وغيرهم. قامت الشركة ببناء أكبر أنظمة الرسائل النصية على الهاتف المحمول في العالم للتعامل مع النمو الهائل للبيانات من الهواتف المزودة بكاميرات. ثم، في أواخر العقد الأول من القرن الحادي والعشرين، أصبحت الحوسبة السحابية طريقة فعالة للشركات لاستئجار الخوادم الافتراضية مع نمو عملياتها. لاحظ تسو أن كمية البيانات التي يتم جمعها تنمو بشكل أسرع بكثير من سرعة الشبكات، لذلك قرر تغيير مسار الشركة.

يُوضح تسو: “يتم إنشاء البيانات في العديد من الأماكن المختلفة، وهذه البيانات لها جاذبيتها الخاصة: ستكلفك نقله أموالاً ووقتاً. هذا يعني أن الحالة النهائية هي سحابة موزعة تمتد إلى أجهزة وأجهزة خادم طرفية. يجب عليك إحضار السحابة إلى البيانات، وليس البيانات إلى السحابة”.

أطلق تسو Cloudian رسميًا من Gemini Mobile Technologies في عام 2012، مع التركيز الجديد على مساعدة العملاء في تخزين البيانات القابلة للتوسع والموزعة والمتوافقة مع السحابة. يقول تسو: “ما لم نره عندما بدأنا الشركة هو أن الذكاء الاصطناعي سيكون الحالة المثالية لاستخدام البيانات على الحافة”.

الربط بين أبحاث MIT والحلول الحديثة

يرى تسو روابط قوية بين أبحاثه في MIT والصناعة اليوم، على الرغم من أن أبحاثه بدأت قبل أكثر من عقدين من الزمن. يقول تسو: “يشبه الأمر أن حياتي بأكملها تُعاد، لأن ديفيد كلارك وأنا كنا نتعامل مع الشبكات المنفصلة والمتصلة بشكل متقطع، والتي تُشكل جزءًا من كل حالة استخدام طرفية اليوم، وكان البروفيسور دالي يعمل على وصلات سريعة وقابلة للتوسع للغاية. الآن، عندما تنظر إلى بنية الشريحة الحديثة من NVIDIA وطريقة قيامهم بالتواصل بين الشرائح، ستجد عمل دالي في كل مكان. مع البروفيسور بابادوبولوس، عملت على تسريع برنامج التطبيق باستخدام أجهزة حاسوب متوازية دون الحاجة إلى إعادة كتابة التطبيقات، وهذه هي المشكلة التي نحاول حلها مع NVIDIA. ومن المصادفة أن كل ما كنت أفعله في MIT يتجلى الآن”.

منصة Cloudian وتكاملها مع أنظمة الذكاء الاصطناعي

تستخدم منصة Cloudian اليوم بنية تخزين كائنية، حيث يتم تخزين جميع أنواع البيانات – المستندات، مقاطع الفيديو، بيانات المستشعرات – ككائن فريد به بيانات وصفية. يمكن لتخزين الكائنات إدارة مجموعات بيانات ضخمة في بنية ملف مسطحة، مما يجعلها مثالية للبيانات غير المنظمة وأنظمة الذكاء الاصطناعي، ولكنها لم تكن تقليدياً قادرة على إرسال البيانات مباشرة إلى نماذج الذكاء الاصطناعي دون نسخ البيانات أولاً في نظام ذاكرة الكمبيوتر، مما يخلق زمن انتقال واختناقات طاقة للشركات.

في يوليو، أعلنت Cloudian عن توسيع نظام تخزين الكائنات الخاص بها بقاعدة بيانات متجهة تخزن البيانات في شكل يمكن استخدامه على الفور بواسطة نماذج الذكاء الاصطناعي. مع استيعاب البيانات، تقوم Cloudian بالحساب في الوقت الفعلي للشكل المتجه لتلك البيانات لتشغيل أدوات الذكاء الاصطناعي مثل محركات التوصية، والبحث، ومساعدي الذكاء الاصطناعي. أعلنت Cloudian أيضًا عن شراكة مع NVIDIA تسمح لنظام التخزين الخاص بها بالعمل مباشرةً مع وحدات معالجة الرسومات (GPUs) الخاصة بشركة الذكاء الاصطناعي. تقول Cloudian إن النظام الجديد يُمكّن عمليات ذكاء اصطناعي أسرع و يُقلل من تكاليف الحوسبة.

يقول تسو: “اتصلت بنا NVIDIA قبل عام ونصف تقريبًا لأن وحدات معالجة الرسومات (GPUs) مفيدة فقط مع البيانات التي تبقيها مشغولة. الآن، مع إدراك الناس أنه من الأسهل نقل الذكاء الاصطناعي إلى البيانات بدلاً من نقل مجموعات البيانات الضخمة. تُدمج أنظمة التخزين لدينا الكثير من وظائف الذكاء الاصطناعي، لذلك نتمكن من معالجة البيانات قبل وبعد المعالجة للذكاء الاصطناعي بالقرب من المكان الذي نجمع فيه البيانات ونخزنها”.

تطبيقات Cloudian العملية

تساعد Cloudian حوالي 1000 شركة حول العالم على تحقيق قيمة أكبر من بياناتها، بما في ذلك مصنعي السيارات الكبار، ومقدمي الخدمات المالية، ومنظمات الرعاية الصحية، والوكالات الحكومية.

على سبيل المثال، تساعد منصة تخزين Cloudian إحدى شركات صناعة السيارات الكبيرة على استخدام الذكاء الاصطناعي لتحديد متى تحتاج كل من روبوتات التصنيع الخاصة بها إلى الصيانة. تعمل Cloudian أيضًا مع المكتبة الوطنية للطب لتخزين مقالات البحث وبراءات الاختراع، وقاعدة بيانات السرطان الوطنية لتخزين تسلسلات الحمض النووي للأورام – وهي مجموعات بيانات غنية يمكن لنماذج الذكاء الاصطناعي معالجتها للمساعدة في البحث على تطوير علاجات جديدة أو الحصول على رؤى جديدة.

يختتم تسو قائلاً: “كانت وحدات معالجة الرسومات (GPUs) مُمكّناً رائعاً. يُضاعف قانون مور كمية الحوسبة كل عامين، لكن وحدات معالجة الرسومات (GPUs) قادرة على موازاة العمليات على الشرائح، بحيث يمكنك ربط وحدات معالجة الرسومات (GPUs) معًا وتجاوز قانون مور. يدفع هذا النطاق الذكاء الاصطناعي إلى مستويات جديدة من الذكاء، ولكن الطريقة الوحيدة لجعل وحدات معالجة الرسومات (GPUs) تعمل بجد هي تزويدها بالبيانات بنفس سرعة حسابها – والطريقة الوحيدة للقيام بذلك هي التخلص من جميع الطبقات بينها وبين بياناتك”.

المصدر: MIT News