تجاوز مفهوم “الصندوق الأسود” في الرسوم المتحركة

غالباً ما تبدو الموجة الحالية من الرسوم المتحركة المولدة بالذكاء الاصطناعي وكأنها خدعة سحرية لا تعمل إلا مرة واحدة؛ حيث تقوم بإدخال نص توجيهي (Prompt)، فيظهر مقطع فيديو، وإذا لم تعجبك النتيجة – كأن تظهر الأطراف بشكل مشوه وهو أمر شائع في هذه التقنيات – فإن خيارك الوحيد هو المحاولة مرة أخرى بنص جديد. هذا النهج الذي يطلق عليه “الصندوق الأسود” هو بالضبط ما تحاول شركة Cartwheel، الناشئة المتخصصة في الرسوم المتحركة ثلاثية الأبعاد، تفكيكه.

تأسست الشركة على يد أندرو كار وجوناثان جارفيس، وهما خبيران سابقان في شركتي OpenAI وGoogle على التوالي. وتعمل الشركة على بناء مستقبل يتولى فيه الذكاء الاصطناعي المهام التقنية الشاقة في الرسوم المتحركة، مع ترك الجانب الإبداعي والروح الفنية للفنان نفسه.

تحدي ندرة البيانات ثلاثية الأبعاد

وفقاً لمؤسسي الشركة، تتمثل إحدى أكبر العقبات في هذا المجال في ندرة بيانات الحركة ثلاثية الأبعاد (3D motion data) مقارنة بالمحيطات الهائلة من النصوص والصور المتاحة عبر الإنترنت، والتي تُدرب عليها النماذج التقليدية.

يقول جارفيس: “إذا نظرت إلى شركات التقنية الكبرى، ستجد أنها بنت نماذجها بناءً على اللغة المكتوبة والصوت والصور والفيديو لتوفرها بكثرة، مما يسهل عملية العثور على الأنماط. كنا نعلم أن الأمر سيكون صعباً، لكن اتضح أنه أصعب مما تصورنا بعشر أو مئة مرة للحصول على تلك البيانات الخاصة بالحركة”.

من البكسلات المسطحة إلى الهياكل ثلاثية الأبعاد

بينما يركز عمالقة التقنية الآخرون على توليد البكسلات النهائية (الصور المتحركة المسطحة)، قضت Cartwheel سنوات في رسم خرائط لكيفية تحرك البشر في الواقع. تم بناء نماذجهم لفهم الفروق الدقيقة في الأداء، بحيث يمكن تحويل فيديو بسيط ثنائي الأبعاد لشخص يرقص مثلاً إلى هيكل عظمي ثلاثي الأبعاد دقيق وواقعي.

هذا التحول من الصور المسطحة إلى الأصول ثلاثية الأبعاد (3D Assets) هو ما يمنح رسامي الرسوم المتحركة السيطرة التي افتقدوها في عصر الذكاء الاصطناعي الحالي. ويرى التنفيذيون في الشركة أن مشكلة “التشابه” في مخرجات الذكاء الاصطناعي ناتجة عن غياب التحكم؛ فإذا استخدم الجميع نفس المولد لإنتاج فيديو، ستبدأ النتائج في الظهور بشكل متطابق في النهاية.

تمكين الفنان من التعديل والتحكم

يقول كار: “مخرجات نظامنا مصممة ليتم تحريرها والتلاعب بها من قبل البشر. نحن لا نريد أن يكتب الشخص شيئاً ثم ينتظر خروج رسوم متحركة منتهية، فهذا أمر ممل ولن يرغب أحد في مشاهدته. حقيقة أن النظام يسهل دخوله وتعديله تقضي تماماً على مشكلة التشابه؛ حيث يمكنك وضع الحركة على شخصيات مختلفة، وفي بيئات متنوعة، وتغيير الأداء بالزيادة أو النقصان”.

والهدف هو توفير “طبقة تحكم” حيث تكون مخرجات الذكاء الاصطناعي مجرد نقطة انطلاق. ومن خلال توليد بيانات ثلاثية الأبعاد بدلاً من الفيديو المسطح، يمكن للمبدع تغيير الإضاءة، أو تحريك الكاميرا، أو ضبط وضعية الشخصية بعد أن ينتهي الذكاء الاصطناعي من عمله الأولي، مما يجعل هذه التقنية أداة قوية للمحترفين وليست بديلاً عنهم.

بناء عوالم وقصص مفتوحة

بعيداً عن تسريع عملية الرسوم المتحركة، تتطلع الشركة نحو مفهوم يسمى “سرد القصص المفتوحة” أو “بناء العوالم المفتوحة”. ففي مجالات الألعاب المعاصرة ووسائل التواصل الاجتماعي، وصل الطلب على المحتوى إلى حجم لا يمكن للرسوم المتحركة اليدوية تلبيته.

تتخيل Cartwheel شخصيات ليست مجرد حركات مبرمجة مسبقاً، بل مدعومة بنماذج حركة تسمح لها بالتفاعل والأداء في الوقت الفعلي. الأمر لا يتعلق بتصميم كل إطار على حدة، بل بـ “إجراء بروفات” مع ممثل رقمي يفهم القصد من المشهد.

وخلص المؤسسون إلى أن الهدف النهائي هو سد الفجوة بين الرؤية ثنائية الأبعاد والتنفيذ ثلاثي الأبعاد. ويأمل كار وجارفيس أنه مع زيادة أتمتة الرسوم المتحركة، ستصبح في الوقت نفسه أكثر شخصية؛ فالآلة تتعامل مع الميكانيكا الحيوية وتصدير الملفات، بينما يحتفظ الإنسان بالكلمة الأخيرة في التوقيت والذوق والقلب النابض للقصة.