أعلنت شركة الذكاء الاصطناعي الصينية الناشئة “ديب سيك” عن إدخال قدرات متعددة الوسائط إلى روبوت المحادثة الرئيسي الخاص بها، مما يمكنه من معالجة الصور والفيديوهات بجانب النصوص. يتماشى هذا التطور مع منافسين آخرين يقدمون وظائف مشابهة بالفعل. تتوفر هذه الميزة حاليًا لمجموعة مختارة من المستخدمين لاختبارها في مرحلة تجريبية، وذلك بعد إطلاق النموذج الرئيسي الجديد V4 من “ديب سيك” وتخفيضات كبيرة في الأسعار. وقد تم الإعلان عن هذا التحسين من قبل “تشن شياوكانغ”، قائد فريق الوسائط المتعددة، الذي أبرز إضافة وضع التعرف على الصور إلى واجهة المحادثة. يُنظر إلى هذا التحديث على أنه ضروري للتقدم إلى ما هو أبعد من التفاعلات النصية الأساسية إلى تطبيقات أكثر تعقيدًا. وعلى الرغم من حصول “ديب سيك” على اعتراف دولي في يناير 2025 لقدرات النموذج في الاستدلال والكفاءة من حيث التكلفة، إلا أنها تعرضت لانتقادات بسبب افتقارها إلى تقديم عرض متعدد الوسائط.

