باحث جوجل العميق المُستند إلى الانتشار (TTD-DR): ثورة في مجال البحث العميق بفضل الذكاء الاصطناعي
حققت وكلاء البحث العميق (DR) شعبية واسعة في مجال البحث العلمي والصناعة على حد سواء، مدفوعة بالتقدم المُذهل في نماذج اللغات الكبيرة (LLMs). لكن معظم وكلاء البحث العميق العامة المتاحة للجمهور لم تُصمم لتُحاكي عملية التفكير والكتابة البشرية. غالبًا ما تفتقر هذه الوكلاء إلى الخطوات المُنظمّة التي تُساعد الباحثين البشر، مثل صياغة المسودة، والبحث، واستخدام الملاحظات. تُجمع وكلاء البحث العميق الحالية خوارزميات وقت الاختبار وأدوات متنوعة دون إطار عمل متماسك، مما يُبرز الحاجة المُلحة لإطارات عمل مُصممة خصيصًا لتُضاهي أو تتفوق على قدرات البحث البشرية.
الفجوة بين البحث البشري والذكاء الاصطناعي
يُوجد فجوة كبيرة بين كيفية قيام البشر بالبحث وكيفية تعامل وكلاء الذكاء الاصطناعي مع مهام البحث المعقدة، وذلك بسبب غياب العمليات الإدراكية المُلهمة من الإنسان في الطرق الحالية. تُحاول الأعمال القائمة، مثل توسيع نطاق وقت الاختبار، استخدام خوارزميات التكرير التكراري، وآليات النقاش، والبطولات لتصنيف الفرضيات، وأنظمة النقد الذاتي لتوليد مقترحات بحثية. تستخدم أنظمة متعددة الوكلاء مُخططين ومنسقين وباحثين ومُبلغين لإنتاج استجابات مُفصلة، بينما تُمكّن بعض الأطر أوضاع المُساعد البشري لدمج الملاحظات. تركز مناهج ضبط الوكيل على التدريب من خلال أهداف التعلم متعدد المهام، والضبط الدقيق المُشرف على المكونات، وتعلم التعزيز لتحسين قدرات البحث والتصفح.
نموذج الانتشار (Diffusion) في البحث العميق
تحاول نماذج انتشار LLM كسر افتراضات أخذ العينات ذاتية التكرار من خلال توليد مسودات ضوضاء كاملة وإزالة الضوضاء من الرموز بشكل تكراري للحصول على مخرجات عالية الجودة. قدّم باحثو جوجل باحث جوجل العميق المُستند إلى الانتشار وقت الاختبار (TTD-DR)، مستوحى من الطبيعة التكرارية للبحث البشري من خلال دورات مُتكررة من البحث والتفكير والتحسين.
إطار عمل TTD-DR: تصميم مُلهم من قدرات الإنسان
يُصور هذا الإطار توليد تقارير البحث كعملية انتشار، تبدأ بمسودة تُشكل مخططًا مُحدّثًا وقاعدة متطورة لتوجيه اتجاه البحث. تخضع المسودة لتحسين تكراري من خلال عملية “إزالة الضوضاء”، مُسترشدة ديناميكيًا بآلية استرجاع تُدمج المعلومات الخارجية في كل خطوة. يُجعل هذا التصميم المُركز على المسودة كتابة التقارير أكثر سرعة وتماسكًا مع تقليل فقدان المعلومات أثناء عمليات البحث التكراري.
مراحل إطار عمل TTD-DR:
- توليد خطة البحث: تُستخدم وكلاء LLM مُتخصصة لتحديد نطاق البحث، وتحديد الأسئلة البحثية، وتخطيط منهجية البحث.
- البحث والتوليف التكراري: تُستخدم وكلاء LLM أخرى للبحث عن المعلومات ذات الصلة، وتلخيصها، وتجميعها في المسودة الأولية. تتم عملية “إزالة الضوضاء” في هذه المرحلة.
- توليد التقرير النهائي: يتم صقل المسودة النهائية وتنسيقها وتحريرها لإنتاج تقرير بحثي مُتكامل.
النتائج المُذهلة لـ TTD-DR
حقق TTD-DR نتائج متقدمة على معايير الأداء التي تتطلب بحثًا مكثفًا واستدلالًا متعدد القفزات. في المقارنات المُباشرة مع OpenAI Deep Research، حقق TTD-DR معدلات فوز بلغت 69.1% و 74.5% لمهام توليد تقارير بحثية طويلة، متفوقًا بنسبة 4.8%، 7.7%، و 1.7% على ثلاث مجموعات بيانات بحثية ذات إجابات قصيرة. أظهر أداءً قويًا في درجات المُقيم التلقائي للـ Helpfulness و Comprehensiveness، خاصةً في مجموعات بيانات LongForm Research. علاوة على ذلك، حققت خوارزمية التطور الذاتي معدلات فوز بلغت 60.9% و 59.8% ضد OpenAI Deep Research على LongForm Research و DeepConsult.
الخلاصة
يُقدم جوجل TTD-DR، وهي طريقة تُعالج القيود الأساسية من خلال تصميم إدراكي مُلهم من قدرات الإنسان. يُصور إطار العمل توليد تقارير البحث كعملية انتشار، باستخدام هيكل مسودة قابلة للتحديث يُوجه اتجاه البحث. يضمن TTD-DR، المُعزز بخوارزميات التطور الذاتي المُطبقة على كل مكون من مكونات سير العمل، توليد سياق عالي الجودة طوال عملية البحث. أظهرت التقييمات أن أداء TTD-DR المُتقدم عبر معايير الأداء المختلفة، التي تتطلب بحثًا مكثفًا واستدلالًا متعدد القفزات، مع نتائج مُمتازة في كل من تقارير البحث الطويلة الشاملة ومهام الاستدلال المُتعدد القفزات المُوجزة.
اترك تعليقاً