كشفت جوجل ديب مايند عن جيني 2، وهو نموذج ذكاء اصطناعي قادر على توليد بيئات تفاعلية ثلاثية الأبعاد من خلال صورة واحدة. هذه البيئات ليست مجرد صور مرئية، بل عوالم قابلة للعب. نعم، باستخدام لوحة المفاتيح. نعم، من صورة واحدة.
🧠 ما يقوله جوجل
يُطلق عليه DeepMind اسم "نموذج العالم الأساسي". هذا يعني أنه لا يُنشئ مشاهد جميلة فحسب، بل يُنشئ مساحةً كاملةً قابلةً للتحكم حول ما تُقدمه له. المخرج هو عالمٌ أشبه بألعاب الفيديو، حيث يُمكن للوكلاء (أو أنت) التحرك والقفز والتفاعل مع الكائنات والاستكشاف كما في ألعاب التمرير الجانبي.
📦 ماذا يعني ذلك (بالكلمات البشرية)
هذا ليس مجرد رسوم متحركة. يُنشئ جيني ٢ قواعد وردود أفعال وطبقات قابلة للعب. يشبه الأمر أن تطلب من طفل رسم قلعة، وبدلًا من مجرد رسمها، يُسلمك قلعةً جاهزة بجسر متحرك يمكنك المشي عليه.
هذا النوع من الذكاء الاصطناعي هو حلم لـ:
مطورو الألعاب
منشئو البيئة الافتراضية
باحثو AGI يدربون الوكلاء على التنقل في المساحات الديناميكية
ونعم... إنه نوع من المرونة.
📅 متى ومن يحصل عليه؟
حاليًا: لم يُطرح إصدارٌ عامٌ بعد. ما زال في مرحلة البحث. لا واجهة برمجة تطبيقات، ولا قائمة انتظار، ولا خيار "انقر هنا للتجربة". لكنه قادم.
🆚 كيفية مقارنته بنماذج الفيديو/العالم الأخرى للذكاء الاصطناعي
فيما يلي نظرة سريعة على كيفية مقارنة Genie 2 بالأسماء الكبيرة الأخرى:
نموذج | الخالق | نوع الإدخال | نوع الإخراج | المدة القصوى | التفاعلية | حالة الاستخدام |
الجني 2 | جوجل ديب مايند | صورة واحدة | عالم ثلاثي الأبعاد قابل للعب (فيديو 2.5D) | ~1 دقيقة | ✅ قابلة للعب بالكامل | بناء العالم وتدريب الوكلاء |
سورا | أوبن أيه آي | موجه نصي | فيديو عالي الدقة (غير تفاعلي) | ~1 دقيقة | ❌ لا يوجد | إنشاء فيديو سينمائي |
المدرج الجيل الثاني/الرابع | المدرج ML | صورة + نص/فيديو | فيديو منمق | ~4–16 ثانية | ❌ لا يوجد | فيديو قصير، اتجاه إبداعي |
بيكا | مختبرات بيكا | صورة + نص/فيديو | فيديو قصير منمق | ~3–5 ثواني | ❌ لا يوجد | محتوى فيروسي، صور سريعة |
الجني (الإصدار 1) | ديب مايند | صورة | فيديو يشبه اللعبة ثنائية الأبعاد | ~2 ثانية | ⚠️ محدودة | أبحاث النمذجة في العالم المبكر |
ملاحظة: لقد تحسنت لعبة Genie 2 بشكل كبير عن الإصدار 1، حيث انتقلت من ثانيتين إلى ما يقرب من دقيقة، مما أضاف فيزياء ومرئيات ومنطق لعب أفضل.
🧊 منظور فريق Frozen Light
لا يريد جيني ٢ أن يكون أداة الفيديو التالية، بل يريد أن يحل محل محركات الألعاب ويصبح مُعلّم الذكاء الاصطناعي العام. إنه طموح كبير. ما زال الوقت مبكرًا، ونعم، قد يُصاب بالهلوسة بعد دقيقة، لكن لنكن واقعيين: صورة واحدة تتحول إلى عالم قابل للمشي؟ هذا جنون.
هل أصبح الذكاء الاصطناعي العام جاهزًا بعد؟ لا. ولكنه النموذج الذي يُدرّب عليه الذكاء الاصطناعي العام. دعه يتعلم، ويصطدم بالأشياء، ويبني ذاكرةً عن كيفية عمل العالم.
نحن لا نقول أنه جاهز ليحل محل Unity.
ولكن ربما ينبغي لـ Unity أن تنظر خلفها.
هل لديك نسخة احتياطية؟ أوقات ممتعة بانتظارك. 🧞♀️