OpenAI: ओपनएआई ने टेक्स्ट-टू-वीडियो जनरेटर टूल 'सोरा' का किया अनावरण
ओपनएआई
OpenAI ने एक नया टूल लॉन्च किया है जो लिखित आदेशों के जवाब में तुरंत लघु वीडियो बना सकता है। इस नए टेक्स्ट-टू-वीडियो जनरेटर टूल को Microsoft समर्थित OpenAI द्वारा 'सोरा' नाम दिया गया है। हालाँकि Google और Meta जैसे तकनीकी दिग्गजों ने अतीत में इसी तरह की तकनीक का प्रदर्शन किया है, ChatGPT का निर्माता गुणवत्ता के मामले में बहुत आगे निकल गया है।
नए टूल की घोषणा करने के लिए, ओपनएआई ने अपने आधिकारिक एक्स (पूर्व में ट्विटर) हैंडल पर साझा किया, “हमारे टेक्स्ट-टू-वीडियो मॉडल सोरा का परिचय। सोरा अत्यधिक विस्तृत दृश्यों, जटिल कैमरा गति और जीवंत भावनाओं वाले कई पात्रों को प्रदर्शित करते हुए 60 सेकंड तक के वीडियो बना सकता है। OpenAI ने टेक्स्ट का एक वीडियो भी संलग्न किया है, “सुंदर, बर्फीला टोक्यो शहर हलचल भरा है। कैमरा शहर की हलचल भरी सड़क पर घूमता है, जिसमें कई लोग सुंदर बर्फीले मौसम का आनंद ले रहे हैं और पास के स्टालों पर खरीदारी कर रहे हैं। खूबसूरत सकुरा पंखुड़ियाँ बर्फ के टुकड़ों के साथ हवा में उड़ रही हैं।
घोषणा के बाद, सोशल मीडिया उपयोगकर्ता ने ओपनएआई के सीईओ सैम अल्टमैन से कहा, "सैम कृपया मुझे बेघर मत करो", जिस पर उन्होंने जवाब दिया, "आपके लिए एक वीडियो तैयार करूंगा, आप क्या चाहेंगे?" बाद में यूजर ने पार्क में शतरंज खेलते बंदर का वीडियो बनाने के लिए कहा। तुरंत, ऑल्टमैन ने एक्स प्लेटफ़ॉर्म पर सोरा द्वारा एक उच्च-गुणवत्ता वाला वीडियो साझा किया।
हालाँकि, टूल अभी तक सार्वजनिक रूप से उपलब्ध है और OpenAI ने इसे कैसे बनाया गया था, इसके बारे में सीमित जानकारी का खुलासा किया है। एक बयान में ओपनएआई ने खुलासा किया कि यह टूल वर्तमान में रेड टीमिंग के लिए उपलब्ध है, जो एआई सिस्टम में खामियों की पहचान करने में मदद करता है, साथ ही मॉडल पर प्रतिक्रिया प्राप्त करने के लिए दृश्य कलाकारों, डिजाइनरों और फिल्म निर्माताओं द्वारा उपयोग किया जाता है। बयान में कहा गया, "सोरा कई पात्रों, विशिष्ट प्रकार की गति और विषय और पृष्ठभूमि के सटीक विवरण के साथ जटिल दृश्य उत्पन्न करने में सक्षम है।" इसके अतिरिक्त, टूल एक ही वीडियो में कई शॉट बना सकता है।
कंपनी ने एक ब्लॉगपोस्ट में कहा कि इसके अलावा, सोरा स्थिर छवि को भी एनिमेट कर सकता है। पिछले साल की शुरुआत में, मेटा ने दो एआई-आधारित सुविधाओं को जोड़ने के लिए अपने इमेज जेनरेशन मॉडल एमु का अनावरण किया था जो टेक्स्ट प्रॉम्प्ट से वीडियो संपादित और उत्पन्न कर सकता है।