وكلاء البحث العميق: خارطة طريق منهجية لأنظمة البحث الذاتية القائمة على نماذج اللغات الكبيرة

يقدم باحثون من جامعة ليفربول، ومعمل نوح آرك في هواوي، وجامعة أكسفورد، وكلية لندن الجامعية، تقريراً يشرح “وكلاء البحث العميق” (DR agents)، وهو نموذج جديد في مجال البحث الذاتي. تعتمد هذه الأنظمة على نماذج اللغات الكبيرة (LLMs) وهي مصممة للتعامل مع المهام المعقدة طويلة الأمد التي تتطلب استدلالاً ديناميكياً، وتخطيطاً تكيفياً، واستخداماً متكرراً للأدوات، ونواتج تحليلية منظمة. على عكس أساليب توليد البيانات المعززة بالاسترجاع (RAG) التقليدية أو نماذج استخدام الأدوات الثابتة، فإن وكلاء البحث العميق قادرون على التنقل في نوايا المستخدم المتغيرة ومناظر المعلومات الغامضة من خلال دمج كل من واجهات برمجة التطبيقات (APIs) المنظمة وآليات الاسترجاع القائمة على المتصفح.

القيود في أطر البحث الحالية قبل وكلاء البحث العميق

قبل ظهور وكلاء البحث العميق، ركزت معظم الأنظمة التي تعتمد على نماذج اللغات الكبيرة على استرجاع الحقائق أو الاستدلال بخطوة واحدة. حسّنت أنظمة RAG من أساس الحقائق، بينما سمحت أدوات مثل FLARE و Toolformer باستخدام الأدوات الأساسية. ومع ذلك، افتقرّت هذه النماذج إلى القدرة على التكيف في الوقت الفعلي، والتفكير العميق، والقدرة على التوسع النمطية. وقد واجهت صعوبات في تماسك السياق الطويل، واسترجاع متعدد الدورات بكفاءة، وتعديل سير العمل الديناميكي – وهي متطلبات أساسية للبحث في العالم الحقيقي.

الابتكارات المعمارية في وكلاء البحث العميق

يعالج التصميم الأساسي لوكلاء البحث العميق قيود أنظمة الاستدلال الثابتة. وتشمل المساهمات التقنية الرئيسية ما يلي:

  • تصنيف سير العمل: التمييز بين سير العمل البحثي الثابت (يدوي، تسلسل ثابت) والديناميكي (تكيفية، في الوقت الفعلي).
  • بروتوكول سياق النموذج (MCP): واجهة موحدة تسمح بالتفاعل الآمن والمتسق مع الأدوات وواجهات برمجة التطبيقات الخارجية.
  • بروتوكول العامل إلى العامل (A2A): يسهّل الاتصال اللامركزي والمنظم بين الوكلاء لتنفيذ المهام التعاونية.
  • أساليب الاسترجاع الهجينة: يدعم كل من استحصال البيانات القائمة على واجهات برمجة التطبيقات (منظمة) والقائمة على المتصفح (غير منظمة).
  • استخدام الأدوات متعددة الوسائط: دمج تنفيذ التعليمات البرمجية، وتحليلات البيانات، وإنشاء الوسائط المتعددة، وتحسين الذاكرة داخل حلقة الاستنتاج.

خط أنابيب النظام: من الاستعلام إلى توليد التقرير

يعالج وكلاء البحث العميق استعلام البحث النموذجي من خلال:

  1. فهم الهدف: عبر استراتيجيات التخطيط فقط، أو من الهدف إلى التخطيط، أو التخطيط الموحد للهدف.
  2. الاسترجاع: باستخدام كل من واجهات برمجة التطبيقات (مثل arXiv، و ويكيبيديا، و بحث جوجل) وبيئات المتصفح للمحتوى الديناميكي.
  3. استدعاء الأدوات: من خلال MCP لتنفيذ مهام مثل البرمجة النصية، والتحليلات، أو معالجة الوسائط.
  4. التقارير المنظمة: بما في ذلك الملخصات القائمة على الأدلة، والجداول، أو التصور.
  5. آليات الذاكرة: مثل قواعد البيانات المتجهة، أو الرسوم البيانية المعرفية، أو المستودعات المنظمة، تمكّن الوكلاء من إدارة الاستدلال طويل السياق وتقليل التكرار.

المقارنة مع نماذج RAG ووكلاء استخدام الأدوات التقليديين

على عكس أساليب RAG التي تعمل على خطوط أنابيب استرجاع ثابتة، فإن وكلاء البحث العميق:

  • يقومون بالتخطيط متعدد الخطوات مع أهداف مهام متطورة.
  • يكيّفون استراتيجيات الاسترجاع بناءً على تقدم المهمة.
  • ينسّقون بين العديد من الوكلاء المتخصصين (في بيئات متعددة الوكلاء).
  • يستخدمون سير عمل غير متزامن ومتوازي.

يُمكّن هذا التصميم من تنفيذ مهام البحث بشكل أكثر تماسكاً وقابلية للتطوير ومرونة.

التطبيقات الصناعية لوكلاء البحث العميق

  • OpenAI DR: يستخدم نموذج استدلال o3 مع سير عمل ديناميكي قائم على التعلم المعزز، واسترجاع متعدد الوسائط، وإنشاء تقارير ممكّنة بالشفرة.
  • Gemini DR: مبني على Gemini-2.0 Flash؛ يدعم نوافذ السياق الكبيرة، وسير العمل غير المتزامن، وإدارة المهام متعددة الوسائط.
  • Grok DeepSearch: يجمع بين الانتباه المتناثر، واسترجاع قائم على المتصفح، وبيئة تنفيذ محصورة.
  • Perplexity DR: يطبق بحثًا متكررًا على الويب مع تنظيم هجين لنموذج اللغات الكبيرة.
  • باحث محلل مايكروسوفت: يدمج نماذج OpenAI ضمن Microsoft 365 لأنابيب بحث آمنة محددة المجال.

المعايير والأداء

تم اختبار وكلاء البحث العميق باستخدام معايير تقييم الإجابة على الأسئلة وتنفيذ المهام:

  • الإجابة على الأسئلة: HotpotQA، GPQA، 2WikiMultihopQA، TriviaQA
  • البحث المعقد: MLE-Bench، BrowseComp، GAIA، HLE

تقيس المعايير عمق الاسترجاع، ودقة استخدام الأدوات، وتماسك الاستدلال، والتقارير المنظمة. تتفوق وكلاء مثل DeepResearcher و SimpleDeepSearcher باستمرار على الأنظمة التقليدية.

أسئلة شائعة

  • س1: ما هي وكلاء البحث العميق؟ ج: وكلاء البحث العميق هي أنظمة قائمة على نماذج اللغات الكبيرة تقوم بشكل مستقل بتنفيذ سير عمل بحث متعدد الخطوات باستخدام التخطيط الديناميكي وتكامل الأدوات.
  • س2: كيف تتفوق وكلاء البحث العميق على نماذج RAG؟ ج: تدعم وكلاء البحث العميق التخطيط التكيفي، والاسترجاع متعدد الخطوات، واستخدام الأدوات المتكرر، وتوليد التقارير في الوقت الفعلي.
  • س3: ما هي البروتوكولات التي تستخدمها وكلاء البحث العميق؟ ج: MCP (لتفاعل الأدوات) و A2A (للتعاون بين الوكلاء).
  • س4: هل هذه الأنظمة جاهزة للإنتاج؟ ج: نعم. قامت OpenAI، وجوجل، ومايكروسوفت، وغيرها بنشر وكلاء بحث عميق في تطبيقات عامة وتجارية.
  • س5: كيف يتم تقييم وكلاء البحث العميق؟ ج: باستخدام معايير تقييم الإجابة على الأسئلة مثل HotpotQA و HLE، ومعايير تنفيذ المهام مثل MLE-Bench و BrowseComp.

(يرجى مراجعة الورقة البحثية للحصول على مزيد من المعلومات.)

المصدر: MarkTechPost