كشفت شركة “Naver Cloud” عن مشروعها الثوري “Omnimodal HyperCLOVA X” خلال الحدث الافتتاحي لمشروع “نموذج الذكاء الاصطناعي المستقل” الذي نظمته وزارة العلوم وتكنولوجيا المعلومات والاتصالات في سيول. وأشار ناكو سونغ، المسؤول عن تقنية الذكاء الاصطناعي واسعة النطاق في “Naver Cloud”، إلى القيود التي تواجهها النماذج اللغوية الحالية، التي تتميز بقدرتها الفائقة على فهم النصوص، لكنها تفتقر إلى القدرات الحسية اللازمة لحل المشكلات المعقدة في العالم الحقيقي.
يهدف مشروع “Omnimodal HyperCLOVA X” إلى تجاوز هذه القيود من خلال دمج فهم وإنتاج البيانات الصوتية والمرئية والفيديو. وقد تم الكشف عن نموذجين مفتوحي المصدر: “HyperCLOVA X Seed 8B Omni”، الذي يتبنى هيكلًا متعدد الوسائط أصيلًا، و”HyperCLOVA X Seed 32B Sync”، الذي يجمع بين الفهم البصري والمحادثة الصوتية واستخدام الأدوات مع الذكاء الاصطناعي الاستنتاجي. وتعد هذه النماذج بتقليل تكاليف التطوير والتشغيل مع تحسين القدرة على حل المشكلات المعقدة.
وقد أظهر نموذج “32B Sync” أداءً عالي المستوى في مجالات مثل المعرفة العامة باللغة الكورية، والفهم البصري، واستخدام الأدوات. كما حقق نتائج استثنائية في اختبارات القبول الجامعي، حيث حصل على درجات كاملة في اللغة الإنجليزية والتاريخ الكوري. وتطمح “Naver Cloud” إلى تطوير وكلاء ذكاء اصطناعي عمليين ومتاحين، قادرين على التكيف مع البيئات الصناعية واليومية، مع تحقيق تكلفة أقل مقارنة بالنماذج الحالية.

