دمج أكواد أكثر دقة وكفاءة مع Osmosis-Apply-1.7B
أعلنت شركة Osmosis AI عن إطلاق نموذجها مفتوح المصدر Osmosis-Apply-1.7B، وهو متغير مُحسّن من Qwen3-1.7B، مصمم خصيصاً لأداء مهام دمج الأكواد بدقة عالية وبشكل مُنظم. مستوحى من أدوات التكامل في بيئات التطوير المتكاملة (IDE) مثل “التطبيق الفوري” في Cursor، تم تحسين Osmosis-Apply-1.7B للتعامل مع تعديلات الأكواد على مستوى الدوال مع مراعاة سياق الكود. يحقق النموذج أداءً قوياً مع عدد أقل من المعلمات مقارنةً بنماذج الأساس الأكبر حجماً، وذلك من خلال الاستفادة من علامات التنسيق الخاصة بالاكواد، ومجموعة بيانات عالية الجودة، وتكامل بروتوكول سياق النموذج (MCP).
تصميم خاص لمهام دمج الأكواد
على عكس نماذج اللغات الكبيرة متعددة الأغراض التي تواجه صعوبة في تطبيق الاختلافات والدمج الدلالي، تم تدريب Osmosis-Apply-1.7B خصيصاً لتطبيق التعديلات المُنَظَّمة على مستوى الدالة أو الكتلة. يستقبل النموذج ثلاث مدخلات مُنَظَّمة:
- الكود الأصلي.
- مجموعة التعديلات أو الاختلافات.
- تنسيق الدمج المتوقع.
ثم يُعيد النموذج كتلة كود مُعدّلة حيث يتم تطبيق التغيير داخل علامات <edit>
المُضمنة داخل كتلة <code>
. يتوافق هذا التنسيق مع توقعات الإنتاج ويُبسّط عملية التحقق.
عملية التدريب وهيكل المكافآت
تم ضبط Osmosis-Apply-1.7B بدقة على حوالي 100,000 عملية إلتزام (Commit) من العالم الحقيقي من مجموعة بيانات commitpackft، مما يمثل أقل من 15% من النص الكامل. تم تنظيم كل عينة تدريب لتمثيل سير عمل المطورين العملي. تم استخدام نظام ما بعد التدريب قائم على المكافآت:
- تطابق كامل (بما في ذلك التنسيق): المكافأة = 1.0
- تطابق دلالي (باستثناء الأسطر الفارغة): المكافأة = 0.2
- تطابق غير صحيح أو فاشل: المكافأة = 0.0
يعزز هذا المخطط للمكافآت المخرجات عالية الدقة مع السماح ببعض المرونة في التباين الأسلوبي، مما يُحاكي بشكل وثيق كيفية عمل مراجعات الأكواد في الممارسة العملية.
نتائج المقاييس
قامت Osmosis AI بقياس أداء النموذج باستخدام تقييم مكون من 10,000 عينة من مجموعة بيانات commitpackft. تُظهر متوسط نقاط المكافآت أداءً قوياً مقارنةً بنماذج اللغات الكبيرة الأخرى:
النموذج | درجة المكافأة |
---|---|
Osmosis-Apply-1.7B | 0.9805 |
Claude 4 Sonnet | 0.9328 |
GPT-3.5-turbo | 0.8639 |
Gemini-2.5-Flash | 0.7745 |
تُبرز هذه النتائج قوة النموذج في تطبيق التغييرات المُحلية مع الحفاظ على الدلالة والتنسيق والهيكل.
تكامل بروتوكول سياق النموذج (MCP) لسير عمل المطورين
من أهم مميزات النموذج دعمه الأصلي لبروتوكول سياق النموذج (MCP)، مما يُمكّن من استدعاء السياق المُنظم مع التسلسلات الهرمية للملفات، وأسماء الدوال، وعلامات التعديل. يلتزم النموذج بمواصفات apply-code MCP، مما يسمح باستخدامه بسلاسة في أدوات سطر الأوامر (CLI) وأدوات بيئات التطوير المتكاملة (IDE). يُعيد النموذج التغييرات على نطاق مستوى الدالة و يُشير إلى التعديلات باستخدام علامات مُنَظَّمة على طراز XML، مما يُبسّط تتبع الاختلافات والأدوات التابعة.
أدوات المطور وحالات الاستخدام
أصدرت Osmosis AI أيضاً تطبيقاً مرجعياً يدعم كل من الاستنتاج المحلي والتكامل مع خدمات مثل vLLM أو خادم Gulp. تتضمن الأدوات أمثلة استخدام قائمة على سطر الأوامر، وتطبيق خادم MCP، ودلائل نشر آمنة. تتضمن حالات الاستخدام الرئيسية:
- أدوات بيئات التطوير المتكاملة (IDE) التي تُقدم “تطبيقاً فورياً” للتغييرات التي يُحددها المستخدم.
- روبوتات التحكم المستمر (CI) التي تُطبق إعادة هيكلة تلقائية أو تغييرات بناءً على المراجعات.
- خطوط أنابيب إنشاء مجموعات البيانات للضبط الدقيق التابع.
- أدوات تحويل الكود مع منطق دمج واعٍ للهيكل.
التنسيق والنشر
يُخرج النموذج التعديلات مُحاطة بعلامات <code>
و <edit>
لضمان التوافق مع المُصححين الآليين. تتوفر إصدارات جاهزة للاستنتاج من النموذج بتنسيقات متعددة، بما في ذلك safetensors و GGUF، من أجل نشر فعال. يمكن استضافة Osmosis-Apply-1.7B محلياً أو تقديمها في وضع مُكمّن للحصول على استنتاج مُحسّن على الأجهزة المُقيدة.
التوفر والترخيص
يتوفر Osmosis-Apply-1.7B بموجب ترخيص Apache-2.0، ويُستضاف على كل من Hugging Face و GitHub. يتضمن الإصدار جميع البرامج النصية اللازمة للاستنتاج، وأمثلة للنشر المُتوافق مع MCP، ودلائل تنسيق مُنَظَّمة.
الخاتمة
من خلال إتاحة Osmosis-Apply-1.7B مفتوح المصدر، تُعالج Osmosis AI حاجة رئيسية لأنماط تعديل الكود على مستوى الدالة وواعية للهيكل. على عكس نماذج الأساس، يُجمع هذا النموذج المُتخصص بين الحجم المُدمج والدقة ومواءمة التنسيق. يُعد تكامله مع MCP، وضبطه الدقيق القائم على المكافآت، ودعمه للهيكل النحوي، مثاليًا لأدوات مطوري البرامج في العالم الحقيقي.
اترك تعليقاً