بحث Salesforce للذكاء الاصطناعي: معايير جديدة وآليات أمان لوكلاء ذكاء اصطناعي موثوقين وقادرين
يُقدم بحث Salesforce للذكاء الاصطناعي خارطة طريق شاملة لبناء وكلاء ذكاء اصطناعي أكثر ذكاءً، وموثوقية، وتنوعاً. وتركز هذه المبادرة الحديثة على معالجة القيود الأساسية في أنظمة الذكاء الاصطناعي الحالية، خاصةً عدم اتساق أدائها في المهام، ونقص متانتها، وتحديات تكيفها مع سير العمل المعقدة في المؤسسات. ومن خلال تقديم معايير جديدة، وهندسة نماذج جديدة، وآليات أمان، تُنشئ Salesforce إطارًا متعدد الطبقات لتوسيع نطاق الأنظمة الوكيلة بشكل مسؤول.
معالجة “الذكاء المتقطع” من خلال معايير مُحددة
واحدة من التحديات الرئيسية التي سلط هذا البحث الضوء عليها هي ما تُسميه Salesforce “الذكاء المتقطع”: السلوك غير المنتظم لوكلاء الذكاء الاصطناعي عبر مهام ذات تعقيد مماثل. ولتشخيص هذه المشكلة والحد منها بشكل منهجي، قدم الفريق معيار SIMPLE. وتحتوي هذه المجموعة من البيانات على 225 سؤالاً بسيطاً موجهة نحو التفكير يجيب عليها البشر باتساق شبه مثالي، ولكنها لا تزال غير تافهة بالنسبة لنماذج اللغات. والهدف هو الكشف عن الثغرات في قدرة النماذج على التعميم عبر مشاكل تبدو موحدة، خاصةً في سيناريوهات التفكير في العالم الحقيقي.
ويُكمل SIMPLE معيار ContextualJudgeBench، الذي يُقيّم قدرة الوكيل على الحفاظ على الدقة والأمانة في الإجابات الخاصة بالسياق. ولا يُركز هذا المعيار فقط على الصحة الواقعية، بل أيضًا على قدرة الوكيل على إدراك متى يجب الامتناع عن الإجابة – وهي سمة مهمة للتطبيقات الحساسة للثقة مثل المجالات القانونية والمالية والرعاية الصحية.
تعزيز السلامة والمتانة مع آليات الثقة
إدراكًا لأهمية موثوقية الذكاء الاصطناعي في بيئات المؤسسات، تُوسّع Salesforce طبقة الثقة الخاصة بها بضمانات جديدة. وقد تم تدريب عائلة نماذج SFR-Guard على بيانات المجال المفتوح وبيانات محددة (CRM) لاكتشاف حقن المُطالبات، والمخرجات السامة، والمحتوى المُهلوس. وتعمل هذه النماذج كمرشحات ديناميكية، وتدعم الاستدلال في الوقت الفعلي مع إمكانيات الاعتدال السياقي.
ومكوّن آخر، وهو CRMArena، عبارة عن مجموعة تقييم قائمة على المحاكاة مصممة لاختبار أداء الوكيل في ظل ظروف تُحاكي سير عمل CRM الحقيقي. وهذا يضمن قدرة وكلاء الذكاء الاصطناعي على التعميم ما وراء مطالبات التدريب والعمل بشكل يمكن التنبؤ به عبر مهام المؤسسة المتنوعة.
عائلات نماذج متخصصة للتفكير والفعل
لدعم سلوك أكثر تنظيماً وتركيزاً على الأهداف في الوكلاء، قدمت Salesforce عائلتين جديدتين من النماذج: xLAM و TACO.
تم تحسين سلسلة xLAM (نماذج اللغة والفعل الموسعة) لاستخدام الأدوات، والتفاعل متعدد الأدوار، واستدعاء الوظائف. وتختلف هذه النماذج في الحجم (من 1 مليار إلى أكثر من 200 مليار معلمة) وهي مصممة لدعم عمليات النشر على مستوى المؤسسات، حيث يكون التكامل مع واجهات برمجة التطبيقات ومصادر المعرفة الداخلية أمرًا ضروريًا.
تهدف نماذج TACO (تحسين سلسلة الفكر والفعل) إلى تحسين قدرات التخطيط للوكيل. ومن خلال تصميم خطوات التفكير الوسيطة والأفعال المقابلة بشكل صريح، تُحسّن TACO قدرة الوكيل على تحليل الأهداف المعقدة إلى تسلسلات من العمليات. وهذا الهيكل ذو صلة خاصة بحالات الاستخدام مثل أتمتة المستندات، والتحليلات، وأنظمة دعم القرار.
تشغيل الوكلاء عبر Agentforce
يتم توحيد هذه الإمكانيات تحت Agentforce، وهي منصة Salesforce لبناء ونشر الوكلاء المستقلين. وتتضمن المنصة مُنشئ وكلاء بدون ترميز، والذي يسمح للمطورين وخبراء المجال بتحديد سلوكيات الوكيل والقيود باستخدام اللغة الطبيعية. ويضمن التكامل مع نظام Salesforce الأوسع قدرة الوكلاء على الوصول إلى بيانات العملاء، واستدعاء سير العمل، والبقاء قابلاً للمراجعة.
وجدت دراسة أجرتها Valoir أن الفرق التي تستخدم Agentforce يمكنها بناء وكلاء جاهزين للإنتاج أسرع بـ 16 مرة مقارنة بالنهج البرمجية التقليدية، مع تحسين دقة التشغيل بنسبة تصل إلى 75٪. ومن المهم أن وكلاء Agentforce مضمنين ضمن طبقة ثقة Salesforce، ويورثون ميزات السلامة والامتثال المطلوبة في سياقات المؤسسات.
الخلاصة
يعكس برنامج أبحاث Salesforce تحولاً نحو تطوير ذكاء اصطناعي أكثر دقة ووعياً بالهندسة المعمارية. ومن خلال الجمع بين التقييمات المُحددة، ونماذج السلامة الدقيقة، والهندسة المعمارية المصممة خصيصاً للتفكير والفعل، تُمهد الشركة الطريق لأنظمة وكيلة من الجيل التالي. وهذه التطورات ليست تقنية فحسب، بل هيكلية أيضًا – مع التركيز على الموثوقية، وقابلية التكيف، والانسجام مع الاحتياجات الدقيقة لبرامج المؤسسات.
اترك تعليقاً