माइक्रोसॉफ्ट के नए एआई ऐप ने मोना लिसा को गाना सिखाया, इंटरनेट ने इसे ''पागल'' बताया, वीडियो वायरल
नई दिल्ली : माइक्रोसॉफ्ट ने हाल ही में एक नया कृत्रिम बुद्धिमत्ता (एआई) मॉडल पेश किया है जो बात करने वाले मानवीय चेहरों के अति-यथार्थवादी वीडियो उत्पन्न कर सकता है। VASA-1 नामक AI इमेज-टू-वीडियो मॉडल लोगों के चेहरों की स्थिर तस्वीरों को जीवंत एनिमेशन में बदल सकता है। कंपनी का कहना है कि बनाए गए वीडियो में ऑडियो से मेल खाने के लिए होंठों की गति के साथ-साथ चेहरे के भाव और सिर की गति को सिंक्रनाइज़ किया जाएगा ताकि यह प्राकृतिक दिखे।
हाल ही में, ऐप की क्षमताओं को प्रदर्शित करने वाला एक वीडियो सोशल मीडिया पर वायरल हुआ, जिससे लोग आश्चर्यचकित रह गए। एआई-जनरेटेड वीडियो में लियोनार्डो दा विंची की प्रतिष्ठित पेंटिंग मोना लिसा को ऐनी हैथवे के 'पापराज़ी' पर लिप-सिंक करते हुए दिखाया गया है। ''माइक्रोसॉफ्ट ने अभी-अभी VASA-1 को गिराया है। यह एआई एक एकल छवि को ऑडियो संदर्भ से स्पष्ट रूप से गा सकता है और बात कर सकता है। अलीबाबा के ईएमओ के समान। मिन चोई द्वारा साझा किए गए थ्रेड के कैप्शन में लिखा है, ''10 जंगली उदाहरण: 1. मोना लिसा पापराज़ी पर रैप कर रही है।''
वीडियो वायरल हो गया है, कुछ लोग इस मजेदार क्लिप से खुश हैं। एक यूजर ने लिखा, ''मोना लिसा क्लिप ने मुझे हंसते-हंसते फर्श पर लोटने पर मजबूर कर दिया।'' दूसरे ने कमेंट किया, ''ओह, यार। काश दा विंची ही इसका गवाह बन पाता।''
कुछ लोगों ने इसके अनैतिक उपयोग, विशेषकर डीप फेक बनाने के बारे में भी अपनी चिंताएँ व्यक्त कीं।
एक तीसरे ने लिखा, ''डरावना? आकर्षक? एक बात के लिए, डीपफेक क्षमता तेजी से बढ़ी... लेकिन साथ ही कुछ दिलचस्प रचनात्मक संभावनाएं भी खुलती हैं।''
चौथे ने कहा, ''डीपफेक टेक ने अभी एक भयानक छलांग लगाई है और यह जितना हमने कभी सोचा था उससे कहीं अधिक भ्रामक है।''
माइक्रोसॉफ्ट के अनुसार, वीएएसए आकर्षक दृश्य प्रभावशाली कौशल (वीएएस) के साथ आभासी पात्रों के जीवंत बात करने वाले चेहरे बनाने के लिए एक रूपरेखा है।
''VASA-1, न केवल होंठों की हरकतें पैदा करने में सक्षम है जो ऑडियो के साथ उत्कृष्ट रूप से तालमेल बिठाती हैं, बल्कि चेहरे की बारीकियों और प्राकृतिक सिर की गतिविधियों के एक बड़े स्पेक्ट्रम को भी कैप्चर करने में सक्षम है जो प्रामाणिकता और जीवंतता की धारणा में योगदान करती हैं। मुख्य नवाचारों में एक समग्र चेहरे की गतिशीलता और सिर की गति उत्पन्न करने वाला मॉडल शामिल है जो चेहरे के अव्यक्त स्थान में काम करता है, और वीडियो का उपयोग करके इस तरह के एक अभिव्यंजक और सुलझे हुए चेहरे के अव्यक्त स्थान का विकास,'' कंपनी ने लिखा।
माइक्रोसॉफ्ट ने कहा, ''हमारी ऑनलाइन डेमो, एपीआई, उत्पाद, अतिरिक्त कार्यान्वयन विवरण या कोई संबंधित पेशकश जारी करने की कोई योजना नहीं है, जब तक कि हम आश्वस्त न हो जाएं कि प्रौद्योगिकी का उपयोग जिम्मेदारी से और उचित नियमों के अनुसार किया जाएगा।''