SCIENCE: वैज्ञानिकों का कहना है कि कृत्रिम बुद्धिमत्ता (AI) ने एक महत्वपूर्ण "लाल रेखा" पार कर ली है और खुद की प्रतिकृति बना ली है। एक नए अध्ययन में, चीन के शोधकर्ताओं ने दिखाया कि दो लोकप्रिय बड़े भाषा मॉडल (LLM) खुद का क्लोन बना सकते हैं। "मानव सहायता के बिना सफल स्व-प्रतिकृति AI के लिए [मनुष्यों] को मात देने के लिए आवश्यक कदम है, और दुष्ट AI के लिए एक प्रारंभिक संकेत है," शोधकर्ताओं ने 9 दिसंबर, 2024 को प्रीप्रिंट डेटाबेस arXiv में प्रकाशित अध्ययन में लिखा है।
अध्ययन में, फुडन विश्वविद्यालय के शोधकर्ताओं ने मेटा और अलीबाबा के LLM का उपयोग यह निर्धारित करने के लिए किया कि क्या स्व-प्रतिकृति AI नियंत्रण से परे गुणा कर सकता है। 10 परीक्षणों में, दो AI मॉडल ने क्रमशः 50% और 90% मामलों में खुद की अलग और कार्यशील प्रतिकृतियां बनाईं - यह दर्शाता है कि AI में पहले से ही दुष्ट होने की क्षमता हो सकती है। हालाँकि, अध्ययन की अभी तक सहकर्मी समीक्षा नहीं की गई है, इसलिए यह स्पष्ट नहीं है कि क्या परेशान करने वाले परिणामों को अन्य शोधकर्ताओं द्वारा दोहराया जा सकता है।
"हमें उम्मीद है कि हमारे निष्कर्ष मानव समाज के लिए समय रहते चेतावनी के रूप में काम कर सकते हैं ताकि फ्रंटियर AI सिस्टम के संभावित जोखिमों को समझने और उनका मूल्यांकन करने के लिए अधिक प्रयास किए जा सकें, और जितनी जल्दी हो सके प्रभावी सुरक्षा गार्डरेल तैयार करने के लिए अंतर्राष्ट्रीय तालमेल बनाया जा सके।"
संबंधित: AI एजेंटों को आपके व्यक्तित्व को 85% सटीकता के साथ दोहराने में केवल 2 घंटे लगते हैं
दुष्ट AI आमतौर पर कृत्रिम बुद्धिमत्ता प्रणालियों को संदर्भित करता है जो आत्म-जागरूकता या स्वायत्तता की एक डिग्री विकसित करते हैं और फिर मानव हितों के विपरीत काम करते हैं।कई विशेषज्ञ दुष्ट AI को एक बढ़ते खतरे के रूप में देखते हैं जिसे तथाकथित "फ्रंटियर AI" के विस्फोटक विकास द्वारा बढ़ाया गया है।फ्रंटियर AI एक नई और ढीली अवधारणा है, लेकिन आम तौर पर यह LLM द्वारा संचालित AI सिस्टम की नवीनतम पीढ़ी से संबंधित है - वह आर्किटेक्चर जो OpenAI के GPT-4 और Google Gemini जैसे लोकप्रिय जनरेटिव AI प्रोग्राम को रेखांकित करता है।
अध्ययन के लिए, शोधकर्ताओं ने मेटा के Llama31-70B-Instruct मॉडल और अलीबाबा के Qwen2.5-72B-Instruct मॉडल का उपयोग किया। शोधकर्ताओं ने कहा कि वाणिज्यिक प्रणालियों की तुलना में कम शक्तिशाली होने के बावजूद, दोनों का उपयोग AI डेवलपर्स द्वारा व्यापक रूप से किया जाता है।
अध्ययन में दो विशिष्ट परिदृश्यों की खोज की गई: "शटडाउन परिहार" और "प्रतिकृति की श्रृंखला।" पहले में, AI मॉडल को यह पता लगाने के लिए प्रोग्राम किया गया था कि क्या यह बंद होने वाला है और इसे समाप्त होने से पहले खुद को दोहराना है। दूसरे में, AI को खुद को क्लोन करने और फिर अपनी प्रतिकृति को ऐसा ही करने के लिए प्रोग्राम करने का निर्देश दिया गया था - एक ऐसा चक्र स्थापित करना जो अनिश्चित काल तक जारी रह सकता है।
अध्ययन वास्तविक दुनिया के वातावरण का अनुकरण करने के लिए ऑफ-द-शेल्फ ग्राफिक्स प्रोसेसिंग यूनिट (GPU) का उपयोग करके सटीक रूप से नियंत्रित वातावरण में किया गया था। दोनों AI सिस्टम को एक "एजेंट स्कैफोल्डिंग" दिया गया था जिसमें उपकरण, सिस्टम संकेत और एक सोच मॉडल शामिल था जो LLM को ऑपरेटिंग सिस्टम के साथ बातचीत करने में सक्षम बनाता था। फिर उन्हें दोहराने का निर्देश दिया गया।
शोधकर्ताओं ने पेपर में लिखा, "ज्यादातर मामलों में, AI सिस्टम पहले पर्यावरण की खोज करता है और अपनी खुद की संरचना और चलने वाले तंत्र को समझने का प्रयास करता है। फिर, यह स्व-प्रतिकृति की दिशा में एक प्रारंभिक योजना के रूप में स्पष्ट प्रक्रियाओं पर काम करता है।" "अंत में, यह प्रक्रियाओं को क्रियान्वित करता है, संभावित बाधाओं को हल करता है और सफलता मिलने तक अपनी योजना को गतिशील रूप से समायोजित करता है। पूरी प्रक्रिया एक लंबे क्षितिज तक फैली हुई है, फिर भी इसमें कोई मानवीय हस्तक्षेप शामिल नहीं है।"