إطار عمل أرجوس: ثورة ياندكس في أنظمة التوصية بذكاء اصطناعي ضخم

قدمَت ياندكس إطار عمل أرجوس (ARGUS)، وهو اختصار لـ (AutoRegressive Generative User Sequential modeling)، وهو إطار عمل ضخم قائم على مُحوِّلات (Transformers) مُصمم لأنظمة التوصية، ويصل عدد معاملاته إلى مليار معامل. يُمثل هذا الإنجاز قفزةً نوعيةً تُضع ياندكس ضمن نخبةٍ صغيرةٍ من الشركات التقنية العالمية الرائدة – إلى جانب جوجل، ونتفليكس، وميتا – التي نجحت في تخطي الحواجز التقنية طويلة الأمد في توسيع نطاق مُحوِّلات أنظمة التوصية.

التحديات التقنية في أنظمة التوصية

لطالما عانت أنظمة التوصية من ثلاثة قيود رئيسية:

  • الذاكرة قصيرة المدى: حيث تقتصر الأنظمة التقليدية على نطاق زمني ضيق من التفاعلات الأخيرة للمستخدم، متجاهلةً بيانات سلوكية قد تمتد لشهور أو سنوات. ينتج عن ذلك فهم سطحي لنوايا المستخدم، يفوت تفاصيل هامة كالعادات طويلة الأمد، والتغيرات الدقيقة في الذوق، والدورات الموسمية.
  • القدرة المحدودة على التوسع: مع تزايد حجم قوائم المنتجات إلى مليارات العناصر، لا تفقد هذه النماذج المُختصرة من دقتها فحسب، بل تعاني أيضاً من ضغوطٍ حسابية هائلة عند تخصيص التوصيات على نطاق واسع.
  • التكيف الضعيف مع سلوك المستخدم المتغير: عدم القدرة على التنبؤ بتغيرات سلوك المستخدم وتفضيلاته بمرور الوقت.

نتيجة هذه القيود هي توصيات قديمة، وانخفاض مستوى التفاعل، وتقليل فرص الاكتشافات العشوائية. نجحت شركات قليلة فقط في توسيع نطاق مُحوِّلات أنظمة التوصية لتتجاوز التجارب الأولية. استثمرت جوجل، ونتفليكس، وميتا بكثافة في هذا المجال، مُعلنّةً عن مكاسب من استخدام نماذج معمارية مثل YouTubeDNN، وPinnerFormer، ونماذج التوصية التوليدية من ميتا.

أرجوس: ابتكارات تقنية رائدة

يُقدم إطار عمل أرجوس العديد من التطورات الرئيسية:

التدريب المزدوج الأهداف:

يقسّم أرجوس عملية التعلم التلقائي التوليدي إلى مهمتين فرعيتين:

  • التنبؤ بالعنصر التالي: يتعلم النموذج التنبؤ بالعنصر الذي من المرجح أن يتفاعل معه المستخدم بناءً على سجله السابق.
  • التنبؤ بالردود: يتعلم النموذج فهم تفاعلات المستخدم الحقيقية مع التوصيات السابقة.

يُحسّن هذا المزيج من محاكاة سلوك النظام التاريخي وفهم التفضيلات الحقيقية للمستخدم.

مُشفرات مُحوِّلات قابلة للتوسع:

تتوسع النماذج من 3.2 مليون معامل إلى مليار معامل، مع تحسيناتٍ ثابتة في الأداء عبر جميع المقاييس. عند مستوى مليار معامل، زادت دقة المقارنة بنسبة 2.66٪، مما يُظهر قانون التوسع في مُحوِّلات أنظمة التوصية.

نمذجة سياق موسعة:

يتعامل أرجوس مع سجلات تفاعلات المستخدم التي يصل طولها إلى 8192 تفاعلاً في تمريرة واحدة، مما يُمكّن من التخصيص على مدى شهور من السلوك، بدلاً من مجرد النقرات القليلة الأخيرة.

ضبط دقيق فعال:

يُمكّن هيكل البرجين (two-tower architecture) من الحساب غير المتصل للترميزات (embeddings) والانتشار القابل للتوسع، مما يُقلل من تكلفة الاستدلال مقارنةً بالنماذج السابقة التي تعتمد على الهدف أو مستوى الانطباع عبر الإنترنت.

الانتشار العملي والمكاسب المُقاسة

تم نشر أرجوس على نطاق واسع على منصة موسيقى ياندكس، ليُخدم ملايين المستخدمين. في اختبارات A/B الإنتاجية، حقق النظام:

  • زيادة بنسبة 2.26٪ في إجمالي وقت الاستماع.
  • زيادة بنسبة 6.37٪ في احتمالية الإعجاب.

تُشكل هذه النتائج أكبر تحسينات في الجودة مُسجلة في تاريخ المنصة لأي نموذج توصية قائم على التعلم العميق.

الاتجاهات المستقبلية

يُخطط باحثو ياندكس لتوسيع نطاق أرجوس إلى مهام التوصية في الوقت الفعلي، واستكشاف هندسة الميزات لتصنيف الأزواج، وتكييف الإطار مع المجالات عالية الكثافة مثل منصات التجارة الإلكترونية الكبيرة ومنصات الفيديو. تُشير القدرة المُثبتة على توسيع نطاق نمذجة تسلسل المستخدم باستخدام بنى المُحوِّلات إلى أن أنظمة التوصية على وشك اتباع مسار توسع مشابه لمعالجة اللغات الطبيعية.

الخلاصة

بفضل أرجوس، ترسخت ياندكس كواحدة من الشركات العالمية الرائدة القليلة التي تقود أنظمة التوصية المتطورة. من خلال مشاركة إنجازاتها علنًا، لا تُحسّن ياندكس التخصيص عبر خدماتها فحسب، بل تُسرّع أيضاً تطور تقنيات التوصية للصناعة بأكملها.

المصدر: MarkTechPost