प्रौद्योगिकी

माइक्रोसॉफ्ट के नए एआई ऐप ने मोना लिसा को गाना सिखाया, इंटरनेट ने इसे ''पागल'' बताया, वीडियो वायरल

Kajal Dubey
21 April 2024 8:05 AM GMT
नई दिल्ली : माइक्रोसॉफ्ट ने हाल ही में एक नया कृत्रिम बुद्धिमत्ता (एआई) मॉडल पेश किया है जो बात करने वाले मानवीय चेहरों के अति-यथार्थवादी वीडियो उत्पन्न कर सकता है। VASA-1 नामक AI इमेज-टू-वीडियो मॉडल लोगों के चेहरों की स्थिर तस्वीरों को जीवंत एनिमेशन में बदल सकता है। कंपनी का कहना है कि बनाए गए वीडियो में ऑडियो से मेल खाने के लिए होंठों की गति के साथ-साथ चेहरे के भाव और सिर की गति को सिंक्रनाइज़ किया जाएगा ताकि यह प्राकृतिक दिखे।

हाल ही में, ऐप की क्षमताओं को प्रदर्शित करने वाला एक वीडियो सोशल मीडिया पर वायरल हुआ, जिससे लोग आश्चर्यचकित रह गए। एआई-जनरेटेड वीडियो में लियोनार्डो दा विंची की प्रतिष्ठित पेंटिंग मोना लिसा को ऐनी हैथवे के 'पापराज़ी' पर लिप-सिंक करते हुए दिखाया गया है। ''माइक्रोसॉफ्ट ने अभी-अभी VASA-1 को गिराया है। यह एआई एक एकल छवि को ऑडियो संदर्भ से स्पष्ट रूप से गा सकता है और बात कर सकता है। अलीबाबा के ईएमओ के समान। मिन चोई द्वारा साझा किए गए थ्रेड के कैप्शन में लिखा है, ''10 जंगली उदाहरण: 1. मोना लिसा पापराज़ी पर रैप कर रही है।''
वीडियो वायरल हो गया है, कुछ लोग इस मजेदार क्लिप से खुश हैं। एक यूजर ने लिखा, ''मोना लिसा क्लिप ने मुझे हंसते-हंसते फर्श पर लोटने पर मजबूर कर दिया।'' दूसरे ने कमेंट किया, ''ओह, यार। काश दा विंची ही इसका गवाह बन पाता।''
कुछ लोगों ने इसके अनैतिक उपयोग, विशेषकर डीप फेक बनाने के बारे में भी अपनी चिंताएँ व्यक्त कीं।
एक तीसरे ने लिखा, ''डरावना? आकर्षक? एक बात के लिए, डीपफेक क्षमता तेजी से बढ़ी... लेकिन साथ ही कुछ दिलचस्प रचनात्मक संभावनाएं भी खुलती हैं।''
चौथे ने कहा, ''डीपफेक टेक ने अभी एक भयानक छलांग लगाई है और यह जितना हमने कभी सोचा था उससे कहीं अधिक भ्रामक है।''
माइक्रोसॉफ्ट के अनुसार, वीएएसए आकर्षक दृश्य प्रभावशाली कौशल (वीएएस) के साथ आभासी पात्रों के जीवंत बात करने वाले चेहरे बनाने के लिए एक रूपरेखा है।
''VASA-1, न केवल होंठों की हरकतें पैदा करने में सक्षम है जो ऑडियो के साथ उत्कृष्ट रूप से तालमेल बिठाती हैं, बल्कि चेहरे की बारीकियों और प्राकृतिक सिर की गतिविधियों के एक बड़े स्पेक्ट्रम को भी कैप्चर करने में सक्षम है जो प्रामाणिकता और जीवंतता की धारणा में योगदान करती हैं। मुख्य नवाचारों में एक समग्र चेहरे की गतिशीलता और सिर की गति उत्पन्न करने वाला मॉडल शामिल है जो चेहरे के अव्यक्त स्थान में काम करता है, और वीडियो का उपयोग करके इस तरह के एक अभिव्यंजक और सुलझे हुए चेहरे के अव्यक्त स्थान का विकास,'' कंपनी ने लिखा।
माइक्रोसॉफ्ट ने कहा, ''हमारी ऑनलाइन डेमो, एपीआई, उत्पाद, अतिरिक्त कार्यान्वयन विवरण या कोई संबंधित पेशकश जारी करने की कोई योजना नहीं है, जब तक कि हम आश्वस्त न हो जाएं कि प्रौद्योगिकी का उपयोग जिम्मेदारी से और उचित नियमों के अनुसार किया जाएगा।''
Next Story