تقول Google إن صورتها الجديدة يمكن أن تهجئها بالفعل
تقوم Google بتشغيل إصدار جديد من نموذج توليد الصور الخاص به ، يسمى Imagen 4 ، وتقول الشركة إنها توفر “جودة مذهلة” و “طباعة متفوقة”.
يقول إيلي كولينز ، نائب الرئيس للمنتج في Google DeepMind ، في منشور مدونة: “يجمع أحدث طراز Imagen الخاص بنا بين السرعة ودقة لإنشاء صور مذهلة”. “لدى Imagen 4 وضوحًا ملحوظًا في التفاصيل الدقيقة مثل الأقمشة المعقدة ، وقطرات الماء ، وفراء الحيوانات ، وتفوق في كل من الأنماط الواقعية والتجريدية.” تُظهر الصور من Google بعض التفاصيل الواقعة المثيرة للإعجاب ، مثل واحدة تظهر حوتًا يخرج من الماء وآخر من الحرباء.
نموذج الذكاء الاصطناعى هو أيضًا “أفضل بكثير في الإملاء والطباعة” ، والتي يقول كولينز ، كما يقول كولينز ، مما يجعل من السهل إنشاء بطاقات المعايدة والملصقات والكوميديا. (عندما أضاف Openai مؤخرًا توليد الصور إلى ChatGPT ، وصفت الشركة أيضًا تحسينات النصوص النصية ، لكنها لا تزال عرضة للأضامن.)
في بعض الصور التي توفرها Google ، يبدو النص جيدًا – إنه مقروء تمامًا في كوميدي قصير ، على سبيل المثال ، وحتى خط صغير في ختم وهمية يمكن قراءته. ولكن سيتعين علينا أن نرى كيف تصمد إمكانيات عرض نص النموذج في أيدي المستخدمين العاديين.
سيكون Imagen 4 متاحًا في 20 مايو في تطبيق Gemini ، و Westisk ، و Vertex AI ، وكذلك في الشرائح ، والفيدس ، والمستندات ، “وأكثر في مساحة العمل” ، كما يقول كولينز. أيضًا ، تخطط Google لإطلاق “متغير سريع” من Imagen 4 في وقت ما “قريبًا” ، والذي تقول إنه “ما يصل إلى 10x أسرع من Imagen 3.”