Google का Imagen 2 AI मॉडल वीडियो जेनरेशन क्षमताओं के साथ अपग्रेड

Update: 2024-04-10 06:56 GMT
नई दिल्ली : Google ने अपने मूल कृत्रिम बुद्धिमत्ता (AI)-संचालित इमेज जेनरेशन मॉडल Imagen 2 को दो नई क्षमताओं के साथ अपग्रेड किया है। इन क्षमताओं की घोषणा लास वेगास में इसके वार्षिक क्लाउड नेक्स्ट सम्मेलन में की गई। एआई टूल एक उद्यम-केंद्रित उत्पाद है जो वर्टेक्स एआई डेवलपर प्लेटफॉर्म के भीतर उपलब्ध है और कंपनियों के लिए लोगो तत्व और अन्य दृश्य संसाधन बनाने में मदद कर सकता है। अब, तकनीकी दिग्गज ने एआई मॉडल में वीडियो-जनरेशन क्षमताओं को भी जोड़ा है और यह चार सेकंड तक लंबे वीडियो तैयार कर सकता है।
कंपनी द्वारा वीडियो जेनरेशन फीचर को 'टेक्स्ट-टू-लाइव इमेज' कहा जा रहा है। इस क्षमता के साथ, Imagen 2 टेक्स्ट प्रॉम्प्ट से चार-सेकंड लंबे वीडियो बना सकता है। इन वीडियो में कैमरा कोण और गति की एक श्रृंखला होगी। वेंचरबीट की एक रिपोर्ट के अनुसार, जेनरेट किए गए वीडियो में 24 फ्रेम प्रति सेकंड होंगे और 360x640 पिक्सल के रिज़ॉल्यूशन पर वितरित किए जाएंगे। कथित तौर पर Google की भविष्य में इन मेट्रिक्स में सुधार करने की योजना है।
Google ने अपने AI मॉडल की क्षमताओं को प्रदर्शित करने के लिए YouTube पर एक वीडियो भी पोस्ट किया। Google क्लाउड के सीईओ थॉमस कुरियन ने कथित तौर पर एक प्रेस विज्ञप्ति में कहा कि एनिमेटेड छवियां उपयोगकर्ता जुड़ाव में सुधार कर सकती हैं। पीढ़ी की गुणवत्ता रनवे एआई और पिका 1.0 के समान प्रतीत होती है - दोनों आम जनता के साथ-साथ उद्यमों के लिए भी उपलब्ध हैं।
एक सवाल डीपफेक का भी है. यह प्रासंगिक है क्योंकि जेमिनी एआई हाल ही में "कुछ ऐतिहासिक छवि निर्माण चित्रणों में अशुद्धियाँ" दिखाने के बाद आलोचना का शिकार हुआ था। कुछ ही समय बाद, Google ने जेमिनी से छवि निर्माण सुविधा हटा दी। लेकिन कंपनी का कहना है कि इमेजेन के साथ यह अलग होगा। कंपनी के प्रवक्ता ने टेकक्रंच को बताया, “वर्टेक्स एआई में इमेजेन 2 मॉडल में जेमिनी ऐप जैसी समस्याओं का अनुभव नहीं हुआ है। हम बड़े पैमाने पर परीक्षण करना और अपने ग्राहकों के साथ जुड़ना जारी रखते हैं।'' अतिरिक्त सुरक्षा के लिए, एआई मॉडल द्वारा उत्पन्न छवियों और वीडियो को Google डीपमाइंड की सिंथआईडी तकनीक द्वारा लेबल किया जाएगा।
वीडियो निर्माण के अलावा, इमेजेन 2 को इनपेंटिंग और आउटपेंटिंग क्षमताएं भी प्राप्त हुई हैं। यह उपयोगकर्ताओं को एक नए प्रॉम्प्ट के साथ पूरी चीज़ को पुनर्जीवित करने के बजाय छवि के एक निश्चित हिस्से को संपादित करने की अनुमति देगा। किसी छवि में बारीक परिवर्तन करना वांछित परिणाम प्राप्त करने का एक आसान तरीका है। यह सुविधा Microsoft के Copilot और OpenAI के DALL-E 3 द्वारा भी पेश की गई है।
Tags:    

Similar News

-->