विज्ञान

मनुष्य डीपफेक भाषण का विश्वसनीय रूप से पता लगाने में असमर्थ: अध्ययन

Deepa Sahu
4 Aug 2023 12:28 PM GMT
मनुष्य डीपफेक भाषण का विश्वसनीय रूप से पता लगाने में असमर्थ: अध्ययन
x
लंदन: कृत्रिम रूप से उत्पन्न भाषण का पता लगाने की मानवीय क्षमता विश्वसनीय नहीं है। एक अध्ययन से पता चला है कि मनुष्य केवल 73 प्रतिशत मामलों में ही डीपफेक भाषण का पता लगा सकता है।
डीपफेक सिंथेटिक मीडिया हैं जिनका उद्देश्य किसी वास्तविक व्यक्ति की आवाज़ या शक्ल से मिलता जुलना होता है। वे जनरेटिव आर्टिफिशियल इंटेलिजेंस (एआई) की श्रेणी में आते हैं, जो एक प्रकार की मशीन लर्निंग (एमएल) है जो किसी डेटासेट के पैटर्न और विशेषताओं, जैसे किसी वास्तविक व्यक्ति के वीडियो या ऑडियो को सीखने के लिए एक एल्गोरिदम को प्रशिक्षित करता है, ताकि इसे पुन: पेश किया जा सके। मूल ध्वनि या कल्पना.
यूनिवर्सिटी कॉलेज लंदन के शोधकर्ताओं ने प्रत्येक भाषा में 50 डीपफेक भाषण नमूने उत्पन्न करने के लिए दो सार्वजनिक रूप से उपलब्ध डेटासेट, एक अंग्रेजी में और एक मंदारिन में प्रशिक्षित टेक्स्ट-टू-स्पीच (टीटीएस) एल्गोरिदम का उपयोग किया।
ये नमूने मूल इनपुट को पुन: प्रस्तुत करने की संभावना से बचने के लिए एल्गोरिदम को प्रशिक्षित करने के लिए उपयोग किए गए नमूनों से भिन्न थे।
कृत्रिम रूप से तैयार किए गए इन नमूनों और असली नमूनों को 529 प्रतिभागियों के सामने यह देखने के लिए चलाया गया कि क्या वे नकली भाषण से असली चीज़ का पता लगा सकते हैं। प्रतिभागी केवल 73 प्रतिशत बार नकली भाषण की पहचान करने में सक्षम थे, जिसमें डीपफेक भाषण के पहलुओं को पहचानने के लिए प्रशिक्षण प्राप्त करने के बाद थोड़ा सुधार हुआ।
यूसीएल के किम्बर्ली माई ने जर्नल पीएलओएस वन में प्रकाशित अध्ययन में कहा, "हमारे निष्कर्ष इस बात की पुष्टि करते हैं कि मनुष्य डीपफेक भाषण का विश्वसनीय रूप से पता लगाने में असमर्थ हैं, भले ही उन्हें कृत्रिम सामग्री को पहचानने में मदद करने के लिए प्रशिक्षण प्राप्त हुआ हो या नहीं।"
"यह भी ध्यान देने योग्य है कि इस अध्ययन में हमने जिन नमूनों का उपयोग किया था, वे अपेक्षाकृत पुराने एल्गोरिदम के साथ बनाए गए थे, जो यह सवाल उठाता है कि क्या मनुष्य अब और भविष्य में उपलब्ध सबसे परिष्कृत तकनीक का उपयोग करके बनाए गए डीपफेक भाषण का पता लगाने में कम सक्षम होंगे। "
शोधकर्ताओं के लिए अगला कदम कृत्रिम रूप से उत्पन्न ऑडियो और इमेजरी के खतरे का मुकाबला करने के लिए पहचान क्षमताओं को बनाने के चल रहे प्रयासों के हिस्से के रूप में बेहतर स्वचालित भाषण डिटेक्टर विकसित करना है। यद्यपि जेनरेटिव एआई ऑडियो तकनीक से लाभ हैं, जैसे कि उन लोगों के लिए अधिक पहुंच जिनकी वाणी सीमित हो सकती है या जो बीमारी के कारण अपनी आवाज खो सकते हैं, ऐसी आशंकाएं बढ़ रही हैं कि ऐसी तकनीक का उपयोग अपराधियों और राष्ट्र राज्यों द्वारा महत्वपूर्ण नुकसान पहुंचाने के लिए किया जा सकता है। व्यक्तियों और समाजों के लिए.
Next Story