ميتا تعرض نموذجها المتعدد الوسائط Chameleon
دخول ميتا إلى مجال النماذج المتعددة الوسائط
تُسارع ميتا في خطى تطوير الذكاء الاصطناعي التوليدي من خلال طرح نموذجها المتعدد الوسائط المسمى Chameleon. يأتي هذا التطور ردًا على المنافسة المتزايدة في هذا المجال، حيث تتجه الأنظار نحو نماذج قادرة على التعامل مع أنواع متعددة من البيانات.
تصميم Chameleon المبتكر
تم تصميم Chameleon خصيصًا للعمل مع البيانات المتعددة الوسائط، بما في ذلك النصوص والصور. يتجنب النموذج الأساليب التقليدية التي تجمع بين مكونات منفصلة، ويعتمد بدلاً من ذلك على معمارية متكاملة من البداية. ونتيجة لذلك، يُظهر Chameleon أداءً استثنائيًا في المهام التي تتطلب فهمًا عميقًا للمعلومات المرئية والنصية.
تدريب ثوري
يتبع Chameleon نهجًا جديدًا لتدريب النماذج المتعددة الوسائط. يعالج النموذج النصوص والصور كتمثيلات رمزية منفصلة، utilizando uma arquitetura de transformer unificada. يقضي هذا النهج على الحاجة إلى وحدات فك التشفير أو التشفير المنفصلة الموجودة في النماذج الأخرى. تم تدريب Chameleon على مجموعة بيانات هائلة تتضمن تريليونات من الرموز المميزة للنصوص والصور، ما مكنه من تعلم العلاقات المعقدة بين البيانات المتعددة الوسائط.
تم نشر هذا المقال بواسطة تطبيق عاجل
التطبيق الأول لمتابعة الأخبار العاجلة في العالم العربي
اضغط لتحميل التطبيق الآن مجاناً