قدمت شركة Deepmind ، وهي شركة تابعة لشركة Google متخصصة في الذكاء الاصطناعي ، مؤخرًا نموذجها “Gato”. هذا ما يسمى بالذكاء الاصطناعي العام سيكون قادرًا على أداء 600 مهمة مختلفة. وفي معظم هذه المهام ، سيكون أداء الذكاء الاصطناعي أفضل من أداء الإنسان.
🔹️قدمت شركة DeepMind لتوها برنامج Gato الجديد للذكاء الاصطناعي. بدلاً من أن تكون متخصصًا في مهمة محددة ، فهي على العكس قادرة على تنفيذ أكثر من 600 مهمة ، ويمكنها حتى التغلب على الخبراء.
الذكاء الاصطناعي القوي ، المعروف أيضًا باسم الذكاء الاصطناعي المعمم (AGI) ، هو الكأس المقدسة لباحثي الذكاء الاصطناعي. ستكون قادرة على منافسة الذكاء البشري ، أو حتى أن تكون واعية. نشرت شركة DeepMind ، الشركة الشقيقة لشركة Google ، مقالًا عن Gato ، وهو ذكاء اصطناعي جديد للأغراض العامة يمكن أن يكون مقدمة لذكاء اصطناعي قوي. غالبية أنظمة الذكاء الاصطناعي الحالية مخصصة لمهام محددة ، ومدربة على الشبكات العصبية لغرض معين مثل إنشاء التزييف العميق أو لعب الشطرنج. مع Gato ، يتخذ DeepMind نهجًا معاكسًا وأنشأ ذكاءً اصطناعيًا واحدًا قادرًا على أداء العديد من المهام المختلفة جدًا. وفقًا للمؤلفين ، “نفس الشبكة التي لها نفس الأوزان قادرة على تشغيل وحدة التحكم Atari ، وتحديد محتوى الصور ، والدردشة ، وتكديس الكتل بذراع آلية حقيقية وغير ذلك الكثير”. يستخدم الذكاء الاصطناعي السياق ليقرر في أي شكل يعطي إجاباته. إجمالاً ، إنها قادرة على أداء 604 مهمة بنموذج واحد ، وهو إنجاز حقيقي.
🔹️كيف يعمل جاتو يعمل هذا AGI الجديد (بعد الذكاء الاصطناعي العام) كشبكة متعددة الوسائط ، متعددة المهام ، متعددة التجسيدات ، مما يعني أن نفس الشبكة (أي بنية واحدة مع مجموعة واحدة من الأوزان) يمكنها أداء جميع المهام ، على الرغم من تضمينها أنواع مختلفة من المدخلات والمخرجات. في حين أن النسخة التمهيدية لـ Deepmind التي تقدم Gato ليست مفصلة للغاية ، إلا أنها واضحة بما فيه الكفاية من حيث أنها متجذرة بقوة في المحولات المستخدمة في معالجة اللغة الطبيعية وإنشاء النصوص. ومع ذلك ، فهو لا يتم تدريبه على النص فحسب ، بل أيضًا بالصور (الموجودة بالفعل مع نماذج مثل Dall.E) ، وعزم الدوران التي تعمل على أذرع آلية ، وضغط الأزرار من لعب ألعاب الكمبيوتر ، وما إلى ذلك بشكل أساسي ، إذن ، يعالج Gato جميع أنواع المدخلات معًا ويقرر من السياق ما إذا كان سيتم إخراج نص واضح (على سبيل المثال للدردشة أو تلخيص أو ترجمة نص ، وما إلى ذلك) ، أو قوى عزم الدوران (لمشغلات الذراع الآلية) ، أو الضغط على الأزرار (لتشغيل الألعاب) ، إلخ. وهكذا يوضح Gato تنوع البنى القائمة على المحولات للتعلم الآلي ، ويوضح كيف يمكن تكييفها مع مجموعة متنوعة من المهام. لقد رأينا في العقد الماضي تطبيقات مفاجئة للشبكات العصبية المتخصصة في ممارسة الألعاب ، وترجمة النص ، وتعليق الصور ، وما إلى ذلك ، لكن Gato عام بما يكفي لأداء كل هذه المهام بمفرده ، باستخدام مجموعة واحدة من الأوزان وبنية بسيطة نسبيًا. هذا يتعارض مع الشبكات المتخصصة التي تتطلب وحدات متعددة ليتم دمجها من أجل العمل معًا ، والتي يعتمد تكاملها على المشكلة المراد حلها. علاوة على ذلك ، وبشكل مثير للإعجاب ، فإن Gato ليس قريبًا حتى من أكبر الشبكات العصبية التي رأيناها! مع 1.2 مليار أوزان “فقط” ، يمكن مقارنتها بنموذج لغة OpenAI’s GPT-2 ، أي أكثر من 2 أوامر من حيث الحجم أصغر من GPT-3 (مع 175 مليار وزن) وشبكات معالجة اللغة الحديثة الأخرى.
🔹️تدعم النتائج على Gato أيضًا النتائج السابقة التي تفيد بأن التدريب من بيانات ذات طبيعة مختلفة يؤدي إلى تعلم أفضل للمعلومات التي يتم توفيرها. تمامًا مثل البشر يتعلمون عوالمهم من مصادر معلومات متعددة ومتزامنة! تدخل هذه الفكرة بأكملها بشكل كامل في أحد أكثر الاتجاهات إثارة للاهتمام في مجال التعلم الآلي في السنوات الأخيرة: تعدد الوسائط – القدرة على التعامل مع أنواع مختلفة من البيانات ودمجها. حول إمكانات الذكاء الاصطناعي العام – نحو الذكاء الاصطناعي الحقيقي؟ لم أحب حقًا مصطلح الذكاء الاصطناعي. كنت أعتقد أنه لا يوجد شيء يمكنه التغلب على الدماغ البشري. لكن… تعد الإمكانات الكامنة وراء الذكاء الاصطناعي العام الناشئ أكثر إثارة للاهتمام ، وهي بالتأكيد قوية ، مما كانت لدينا قبل عام واحد فقط. هذه النماذج قادرة على حل مجموعة متنوعة من المهام المعقدة بقطعة واحدة من البرامج