بناء وكيل ويب متعدد المجالات بالذكاء الاصطناعي باستخدام Notte و Gemini

هذا البرنامج التعليمي يوضح تطبيقًا متقدمًا وكاملًا لوكيل Notte للذكاء الاصطناعي، مدمجًا مع واجهة برمجة تطبيقات Gemini لتوفير القدرة على الاستدلال والأتمتة. من خلال الجمع بين إمكانيات أتمتة متصفح Notte والمخرجات المنظمة عبر نماذج Pydantic، يُظهر هذا البرنامج التعليمي كيف يمكن لوكيل ويب مدعوم بالذكاء الاصطناعي البحث عن المنتجات، ومراقبة وسائل التواصل الاجتماعي، وتحليل الأسواق، ومسح فرص العمل، والمزيد.

تم تصميم البرنامج التعليمي كدليل عملي، يتضمن وظائف نمطية، وعروض توضيحية، وسير عمل تُظهر كيف يمكن للمطورين الاستفادة من الأتمتة التي تعمل بالذكاء الاصطناعي للمهام الواقعية مثل أبحاث التجارة الإلكترونية، واستخبارات المنافسة، واستراتيجية المحتوى.

1. تثبيت التبعيات وإعداد بيئة العمل:

  • أولاً، قم بتثبيت جميع التبعيات المطلوبة، بما في ذلك Notte و Gemini والمكتبات الداعمة:
pip install notte python-dotenv pydantic google-generativeai requests beautifulsoup4
!patchright install --with-deps chromium
  • بعد ذلك، قم بتكوين مفتاح واجهة برمجة تطبيقات Gemini الخاص بك للمصادقة:
import os
import google.generativeai as genai
from dotenv import load_dotenv

load_dotenv()  # تحميل متغيرات البيئة من ملف .env
GEMINI_API_KEY = os.environ.get("GEMINI_API_KEY") # استخراج مفتاح API من متغيرات البيئة
genai.configure(api_key=GEMINI_API_KEY)
import notte
  • تأكد من تعيين GEMINI_API_KEY بقيمة مفتاح API الخاص بك.

2. تعريف نماذج Pydantic:

نُحدد نماذج Pydantic المنظمة التي تتيح لنا التقاط البيانات والتحقق من صحتها بشكل متسق. مع ProductInfo, NewsArticle, SocialMediaPost, و SearchResult، نضمن أن وكيل الذكاء الاصطناعي يُخرج معلومات موثوقة ومنظمة بشكل جيد للمنتجات، والمقالات الإخبارية، ومنشورات وسائل التواصل الاجتماعي، ونتائج البحث:

from pydantic import BaseModel
from typing import List, Optional

class ProductInfo(BaseModel):
    name: str
    price: str
    rating: Optional[float]
    availability: str
    description: str

class NewsArticle(BaseModel):
    title: str
    summary: str
    url: str
    date: str
    source: str

class SocialMediaPost(BaseModel):
    content: str
    author: str
    likes: int
    timestamp: str
    platform: str

class SearchResult(BaseModel):
    query: str
    results: List[dict]
    total_found: int

3. بناء وكيل Notte المتقدم:

نقوم بتغليف Notte في AdvancedNotteAgent مدار بواسطة سياق (context manager) يُنشئ جلسة متصفح بدون واجهة رسومية (headless) ونموذج استدلال يعمل بـ Gemini، مما يسمح لنا بأتمتة مهام الويب متعددة الخطوات بشكل موثوق. ثم نضيف طرقًا عالية المستوى، بما في ذلك البحث عن المنتجات، وتجميع الأخبار، والاستماع الاجتماعي، ومسح المنافسين، والبحث عن الوظائف، ومقارنة الأسعار، وبحث المحتوى، والتي تُعيد مخرجات منظمة ونظيفة:

class AdvancedNotteAgent:
    # ... (كود الفئة كما هو موجود في النص الأصلي) ...

4. عروض توضيحية لوظائف وكيل الويب:

نُشغل مجموعة من العروض التوضيحية التي تُظهر أتمتة الويب الواقعية من النهاية إلى النهاية، بما في ذلك البحث عن المنتجات ومقارنة الأسعار، وتجميع الأخبار الجديدة، ومراقبة المحادثات على وسائل التواصل الاجتماعي. نقوم أيضًا بإجراء عمليات مسح تنافسية، وتحليل سوق العمل، وتتبع اتجاهات المدونات/الفيديوهات، مما يُنتج رؤى منظمة وجاهزة للاستخدام من كل مهمة.

def demo_ecommerce_research():
    # ... (كود الدالة كما هو موجود في النص الأصلي) ...

def demo_news_intelligence():
    # ... (كود الدالة كما هو موجود في النص الأصلي) ...

# ... (باقي الدوال التوضيحية) ...

5. إدارة سير العمل متعدد الوكلاء:

نُصمم WorkflowManager يُربط بين مهام وكيل الذكاء الاصطناعي المتعددة في خط أنابيب منظم واحد. من خلال إضافة مهام نمطية مثل البحث عن المنتجات، وتحليل المنافسين، ومراقبة المشاعر، يمكننا تنفيذ سير عمل بحث السوق الكامل بالتسلسل (أو بالتوازي). هذا يحول العروض التوضيحية الفردية إلى نظام متعدد الوكلاء منسق يوفر رؤى شاملة لاتخاذ القرارات الواقعية المدروسة.

class WorkflowManager:
    # ... (كود الفئة كما هو موجود في النص الأصلي) ...

6. اختبارات سريعة ووظائف مساعدة:

نقوم بتغليف كل شيء بوظيفة main() تشغل جميع العروض التوضيحية من النهاية إلى النهاية، ثم نضيف أدوات مساعدة سريعة، بما في ذلك quick_scrape, quick_search, و quick_form_fill, لأداء مهام محددة بحد أدنى من الإعداد. نقوم أيضًا بتضمين اختبارات سريعة للتحقق من صحة الأدوات المساعدة ومهمة ويكيبيديا مخصصة قبل استدعاء خط أنابيب الوكيل الكامل، مما يضمن قدرتنا على التكرار بسرعة مع ممارسة خط أنابيب الوكيل الكامل في نفس الوقت.

def main():
    # ... (كود الدالة كما هو موجود في النص الأصلي) ...

7. الخلاصة:

يُوضح هذا البرنامج التعليمي كيف يمكن لـ Notte، عند دمجه مع Gemini، أن يتحول إلى وكيل ويب قوي ومتعدد الأغراض يعمل بالذكاء الاصطناعي للبحث والمراقبة والتحليل. لا يُظهر فقط عروضًا توضيحية فردية للتجارة الإلكترونية والأخبار ووسائل التواصل الاجتماعي، بل يتوسع أيضًا إلى سير عمل متقدم متعدد الوكلاء يجمع بين الرؤى عبر المجالات. باتباع هذا الدليل، يمكن للمطورين إنشاء نماذج أولية سريعة لوكلاء الذكاء الاصطناعي في Colab، وتوسيعها بمهام مخصصة، وتكييف النظام لاستخبارات الأعمال، والأتمتة، وحالات الاستخدام الإبداعية. لا تنسَ مراجعة صفحة GitHub للحصول على المزيد من الشروحات والأكواد.

المصدر: MarkTechPost