وكيل ChatGPT: ثورة الذكاء الاصطناعي في الأتمتة العملية
في 17 يوليو 2025، أطلقت شركة OpenAI وكيل ChatGPT، محولةً بذلك مساعد المحادثة ChatGPT إلى وكيل ذكاء اصطناعي موحد قادر على تنفيذ مهام معقدة متعددة الخطوات بشكل مستقل، بدءًا من تصفح الويب وحتى تنفيذ الأكواد، وذلك ضمن بيئة حاسوب افتراضية.
الجسور بين القدرات السابقة
يبني وكيل ChatGPT على أداتين سابقتين:
- Operator: والذي أتاحت تفاعلات محدودة مع الويب، مثل النقر والتمرير وملء النماذج، باستخدام وكيل قائم على المتصفح.
- Deep Research: والذي قدم تصفحًا ذاتيًا وتوليفًا للتقرير على فترات زمنية أطول.
ومع ذلك، كانت لكل منهما قيودها: فـ Operator كان بإمكانه التفاعل، لكنه لم يتمكن من إجراء تحليل متعمق، بينما كان Deep Research قادراً على التحليل، ولكنه لم يتمكن من التفاعل ديناميكيًا مع المواقع. يُدمج وكيل ChatGPT نقاط القوة في كلتا الأداتين، مُوحدًا التصفح واستخدام الأدوات والتفكير داخل بنية وكيل واحد.
البنية الداخلية وسير العمل
تتكون جوهر البيئة الحاسوبية الافتراضية من:
- متصفح مرئي للمواقع التي تواجه المستخدم.
- متصفح نصي مُحسّن للتفكير المنظم.
- قشرة/محطة طرفية لتنفيذ الأكواد.
- مُوصلات واجهة برمجة التطبيقات المتكاملة لخدمات مثل Gmail أو GitHub.
يتكيف الوكيل باستمرار، مُقررًا ما إذا كان سينقر على الأزرار أو سيُشغّل البرامج النصية أو سيحلل المحتوى، مع الحفاظ على الحالة عبر الأدوات. تحدث جميع الإجراءات داخل سياق وكيل مُتحكم فيه، مما يضمن إمكانية التتبع والمرونة.
أمثلة على المهام: من التخطيط إلى التنفيذ
يمكن لوكيل ChatGPT معالجة مهام مثل:
- إيجاز التقويم: مسح تقويمك، وجلب الأخبار ذات الصلة، وتلخيص الاجتماعات القادمة.
- طلب البقالة: البحث عن المكونات، ومقارنة الأسعار، ووضع الطلبات.
- التحليل التنافسي: جلب صفحات المنافسين، ونسخ البيانات، وإنشاء شرائح أو جداول بيانات.
- نمذجة مالية: تنزيل البيانات، وتحديث جداول البيانات، والحفاظ على التنسيق.
تتضمن هذه سير العمل استخدام أدوات متعددة الوسائط: تسجيل الدخول إلى المواقع، وتشغيل البرامج النصية في المحطة الطرفية، ثم تغليف النتائج في مستندات قابلة للتحرير – كل ذلك بإشرافك.
الأداء: المقاييس والمقارنات البشرية
تُفيد تقارير OpenAI بتحقيق مكاسب كبيرة عبر العديد من المقاييس:
- امتحان الإنسانية الأخير (Humanity’s Last Exam): معدل النجاح بنسبة 41.6٪ (أفضل نتيجة لوكيل)، وحتى 44.4٪ مع التجارب المتوازية.
- FrontierMath: دقة 27.4٪ باستخدام دعم المحطة الطرفية والرمز، متفوقة على النماذج السابقة.
- SpreadsheetBench: درجة إجمالية 45.5٪ مع تحرير XLSX، مقارنةً بـ Copilot في Excel بنسبة 20٪ والنتائج البشرية حوالي 71٪.
- مقارنة داخلية لأداء العمل المعرفي: أدوات الوكيل تلبي أو تتجاوز أداء الخبراء في حوالي 50٪ من الوقت.
- BrowseComp & WebArena: نتائج جديدة متطورة بنسبة 68.9٪ في المهام القائمة على التصفح.
تُظهر هذه التقييمات تحسنًا ملحوظًا في كل من الاستقلالية وتعقيد المهمة.
السلامة والتخفيف من المخاطر
يُدخِل الاستقلال الوكيل الجديد مخاطر جديدة. نفذت OpenAI العديد من الضمانات:
- تأكيد صريح قبل أي إجراء ذي عواقب (مثل عمليات الشراء، والنشر).
- وضع المراقبة: تتطلب بعض المهام الحساسة إشرافًا نشطًا.
- دفاعات قوية ضد حقن المطالبات، بما في ذلك التدريب على اكتشاف المطالبات غير الطبيعية على الويب ومراقبة مخرجات الأدوات.
- آليات الخصوصية: وضع الاستيلاء المحدد للجلسة بدون الاحتفاظ بالمدخلات الحساسة مثل كلمات المرور.
- تدابير التهديدات البيولوجية: مصنفة على أنها عالية الخطورة للعوامل البيولوجية، مما يؤدي إلى نمذجة تهديدات محسنة، وتدريب على الرفض، والمراقبة المباشرة، وأنظمة مكافآت الأخطاء.
تهدف هذه الطبقات إلى تقليل سوء الاستخدام – من تسرب البيانات إلى اختطاف المهام.
كيفية البدء
متوفر الآن لمستخدمي ChatGPT Pro و Plus و Team:
- يحصل مستخدمو Pro على الوصول اليوم مع 400 رسالة في وضع الوكيل/شهر.
- سيحصل مستخدمو Plus و Team على وصول تدريجي في الأيام القادمة (40 رسالة/شهر).
- ستتبع مستويات المؤسسات والتعليم في الأسابيع القادمة.
- الإطلاق التدريجي خارج الولايات المتحدة (EEA، سويسرا) جارٍ.
يمكنك التبديل إلى “وضع الوكيل” عبر قائمة الأدوات في أي محادثة ووصف سير العمل المطلوب. يتم سرد التقدم في الوقت الفعلي، ويمكنك إيقاف مؤقت، أو الاستيلاء على زمام الأمور، أو التوقف في أي لحظة.
الأهمية لسير العمل المعزز بالذكاء الاصطناعي
يمثل وكيل ChatGPT قفزة من أنظمة الاستجابة الاستعلامية السلبية إلى العمال الرقميين الاستباقيين. من خلال الجمع بين:
- التفكير اللغوي (عبر نماذج من فئة GPT-4).
- تنظيم الأدوات (المتصفحات، والمحطات الطرفية).
- بيئات التنفيذ التي تحافظ على السياق.
… تُمكّن OpenAI حالات استخدام أكثر استقلالية، وموثوقية، وتركيزًا على العمل. في حين أن الضوابط ضرورية للوقاية من سوء الاستخدام، إلا أن هذا الإصدار يوسع نطاق ما يمكن لمساعدي الذكاء الاصطناعي فعله، وليس مجرد قوله.
بالنسبة للمطورين وعلماء البيانات، يصبح وكيل ChatGPT منصة: وكيل قابل للبرمجة، وقابل للملاحظة، قادر على النسخ، والتحليل، والتوليف، والتصدير عند الطلب. إنه يفتح فرصًا لسير عمل الجيل التالي في البحث، وأتمتة الأعمال، والإنتاجية الشخصية.
الخاتمة
وكيل ChatGPT ليس مجرد تحسين للمحادثة – بل هو تحول استراتيجي نحو سير عمل الذكاء الاصطناعي العام والمستقل. يُشير ظهوره إلى انتقال نماذج اللغات الكبيرة من المستشارين السلبيين إلى الوكلاء النشطين، الذين يقومون بالبحث، والإبداع، والعمل في العالم الحقيقي في بيئة موحدة وقابلة للتحكم. توقع أن ينضج هذا ليصبح قدرة أساسية عبر المجالات المعززة بالذكاء الاصطناعي.





اترك تعليقاً