نموذج LSM-2 من جوجل: التعلم المباشر من بيانات الأجهزة القابلة للارتداء غير المكتملة

تُحدث الأجهزة القابلة للارتداء ثورة في مجال مراقبة الصحة من خلال تمكينها لجمع الإشارات الفسيولوجية والسلوكية باستمرار، مثل معدل ضربات القلب، والنشاط، ودرجة الحرارة، وموصلية الجلد. ومع ذلك، فإن البيانات الواقعية التي تولدها هذه الأجهزة معرضة بشدة للفقدان بسبب أعطال أجهزة الاستشعار، وإزالة الجهاز، والشحن، والتشويش الحركي، وأوضاع توفير الطاقة، وغيرها من الانقطاعات. يمثل هذا تحديًا كبيرًا لتعلم البيانات الذاتية (SSL) والنماذج الأساسية، والتي تتوقع عادةً تدفقات بيانات كاملة ومنتظمة. وكانت الحلول السابقة تعتمد غالبًا على استيفاء البيانات أو تجاهل الحالات غير المكتملة، مما يُعرّض لخطر إدخال تحيز أو إضاعة معلومات قيّمة.

تحدي البيانات المفقودة في الأجهزة القابلة للارتداء

  • تجزئة البيانات: في مجموعة بيانات ضخمة تتكون من 1.6 مليون عينة بيانات يومية (1440 دقيقة) من الأجهزة القابلة للارتداء، لم تكن أي عينة كاملة تمامًا؛ فالبيانات المفقودة منتشرة على نطاق واسع، وغالبًا ما تكون منظمة في فجوات طويلة، وليست مجرد انقطاعات عشوائية بسيطة.
  • أنماط البيانات المفقودة: تتضمن الأسباب الشائعة ما يلي:
    • إيقاف تشغيل الجهاز (الشحن أو عدم ارتدائه).
    • تعطيل أجهزة الاستشعار الانتقائي (توفير الطاقة أو عمليات محددة).
    • التشويش الحركي أو الضوضاء البيئية.
    • القراءات خارج النطاق أو المستحيلة فسيولوجيًا التي تم تصفيتها أثناء المعالجة الأولية.
  • تأثير ذلك على النمذجة: تتطلب العديد من الأنماط الفسيولوجية ذات الصلة سريريًا (مثل الإيقاعات اليومية، وتباين معدل ضربات القلب) تحليل تسلسلات طويلة – حيث يكون فقدان البيانات مضمونًا تقريبًا.

إستراتيجية الإخفاء التكيفي والموروث (AIM) : النهج التقني

يقدم باحثون من جوجل DeepMind إطار عمل LSM-2 (النموذج الحسي الكبير 2) مصحوبًا باستراتيجية الإخفاء التكيفي والموروث (AIM) الجديدة، والتي تعالج هذه المشكلات بشكل مباشر، وتتعلم تمثيلات قوية من بيانات أجهزة الاستشعار القابلة للارتداء غير المكتملة دون استيفاء صريح.

المفاهيم الرئيسية:

  • الإخفاء الموروث: يُشير إلى الرموز التي تتوافق مع البيانات المفقودة بالفعل في بيانات أجهزة الاستشعار.
  • الإخفاء الاصطناعي: يُخفي الرموز المرصودة بشكل عشوائي لتوفير أهداف إعادة بناء للتعلم الذاتي بدون إشراف.

يتم دمج هذين النوعين من الإخفاء بواسطة بنية ترميز-فك تعتمد على المحولات، مما يسمح للنموذج بـ:

  • التعلم مباشرة من البيانات غير المكتملة وغير المستوفاة.
  • التكيف ديناميكيًا مع البيانات المفقودة في العالم الحقيقي أثناء الاستنتاج.
  • إنتاج تمثيلات قوية لكل من الفجوات الجزئية والمنهجية في البيانات.

استراتيجيات الإخفاء للتعلم المسبق:

  • الاستيفاء العشوائي: إسقاط 80٪ من الرموز لمحاكاة ضوضاء أجهزة الاستشعار.
  • الشرائح الزمنية: إسقاط 50٪ من النوافذ الزمنية (جميع أجهزة الاستشعار مفقودة خلال فترات عشوائية).
  • شرائح أجهزة الاستشعار: إسقاط 50٪ من قنوات أجهزة الاستشعار على مدار اليوم بالكامل (نمذجة فترات إيقاف تشغيل أجهزة الاستشعار الانتقائية).

يجمع AIM بين كفاءة إخفاء الانقطاع (الإزالة من الحساب) ومرونة إخفاء الانتباه (الدعم للفقدان المتغير ديناميكيًا)، مما يسمح للنموذج بالتوسع إلى تسلسلات إدخال طويلة (يوم كامل، >3000 رمز).

تفاصيل مجموعة البيانات والتعلم المسبق

  • المقياس: 40 مليون ساعة من بيانات أجهزة استشعار متعددة الوسائط على مدار اليوم، تم جمعها من 60440 مشاركًا بين مارس ومايو 2024.
  • أجهزة الاستشعار: قياس ضغط الدم الضوئي (PPG)، ومقياس التسارع، والنشاط الكهروجلدي (EDA)، ودرجة حرارة الجلد، وجهاز قياس الارتفاع. ساهمت كل أجهزة الاستشعار بميزات مجمعة دقيقة عبر نافذة 24 ساعة.
  • التنوع الديموغرافي: المشاركون من مختلف الفئات العمرية (18-96 عامًا)، والجنسين، وفئات مؤشر كتلة الجسم.
  • البيانات المُعلّمة التابعة: دراسة الأيض (التنبؤ بارتفاع ضغط الدم والقلق؛ n=1250 مستخدمًا مُعلّمًا)، والتعرف على النشاط (20 فئة نشاط، 104086 حدثًا).

التقييم والنتائج

تم تقييم LSM-2 القائم على AIM في المهام التالية:

  • التصنيف: ارتفاع ضغط الدم الثنائي، والقلق، والتعرف على النشاط ذي الـ 20 فئة.
  • الانحدار: العمر ومؤشر كتلة الجسم.
  • التوليد: استعادة أجهزة الاستشعار المفقودة (الاستيفاء العشوائي، الفجوات الزمنية/الإشارات).

النتائج الكمية:

المهمة المقياس أفضل LSM-1 LSM-2 مع AIM التحسين
ارتفاع ضغط الدم F1 0.6400 0.651 +1.7%
التعرف على النشاط F1 0.4700 0.474 +0.8%
مؤشر كتلة الجسم (الانحدار) Corr 0.667 0.673 +1.0%
الاستيفاء العشوائي (80٪) MSE (↓) 0.30 0.20 انخفاض الخطأ بنسبة +33%
استعادة إشارتين MSE (↓) 0.73 0.17 انخفاض الخطأ بنسبة +77%

أظهر LSM-2 مع AIM انخفاضًا في الأداء بنسبة 73٪ أقل (في المتوسط) مقارنةً بـ LSM-1 عندما تمت إزالة أجهزة استشعار أو نوافذ زمنية محددة بشكل مصطنع.

الرؤى التقنية

  • التعامل المباشر مع البيانات المفقودة في العالم الحقيقي: LSM-2 هو أول نموذج أساسي قابل للارتداء يتم تدريبه وتقييمه مباشرةً على بيانات غير مكتملة، دون استيفاء صريح.
  • آلية الإخفاء الهجينة: يحقق الإخفاء التكيفي والموروث كل من الكفاءة الحسابية (عبر إزالة الانقطاع) والمرونة (عبر إخفاء الانتباه).
  • الترميزات القابلة للتعميم: حتى مع وجود بنية أساسية مجمدة ومسبارات خطية بسيطة، يحقق LSM-2 نتائج متقدمة في كل من المهام السريرية/المهام على مستوى الشخص والمهام على مستوى الحدث، متفوقًا على خطوط الأساس الخاضعة للإشراف وتعلم البيانات الذاتية التبايني.
  • القوة التوليدية والتمييزية: LSM-2 هو النموذج الوحيد الذي تم تقييمه وقادر على إعادة بناء الإشارات المفقودة وتوليد ترميزات قابلة للتطبيق عبر مهام متعددة، مما يشير إلى فائدة التطبيقات الطبية والسلوكية في العالم الحقيقي.

الخاتمة

يُمثل LSM-2 مع الإخفاء التكيفي والموروث خطوة كبيرة إلى الأمام لنشر رؤى الصحة التي تعتمد على الذكاء الاصطناعي باستخدام بيانات أجهزة الاستشعار القابلة للارتداء في العالم الحقيقي. من خلال تبني البيانات المفقودة المنتشرة والمنظمة بشكل مباشر، وتوحيد القدرات التوليدية والتمييزية تحت نموذج أساسي واحد فعال وقوي، يضع هذا النهج أرضية أساسية لمستقبل الأجهزة القابلة للارتداء والذكاء الاصطناعي الصحي في بيئات البيانات الواقعية غير المثالية.

المصدر: MarkTechPost