OpenAI बनाम Google AI दौड़ ने भानुमती के बॉट खोला
लेकिन बुरे अभिनेताओं के उपयोग के लिए अन्य LLM भी हैं।
थोड़ी देर के लिए, Microsoft ऐसा लग रहा था कि वह Google का दोपहर का भोजन करेगा। इसके सुस्त सर्च इंजन बिंग को एक नए हॉट ओपनएआई चैटबॉट के साथ क्रांतिकारी बनाया जा रहा था। वे उम्मीदें कम हो गई हैं क्योंकि कोई भी- यहां तक कि एआई वैज्ञानिक भी नहीं- सही मायने में कृत्रिम बुद्धिमत्ता की क्षमताओं की चौड़ाई को एक बार समझ लेता है। बिंग के शुरुआती उपयोगकर्ताओं ने एआई सिस्टम से कुछ प्रश्नों के लिए अनियंत्रित, भावनात्मक, यहां तक कि धमकी देने वाली प्रतिक्रियाओं की सूचना दी, जिसने एक उपयोगकर्ता को "बुरा शोधकर्ता" कहा और एक लेखक को बताया कि वह "खुशी से शादी नहीं कर रहा था।" बिंग, जिसका बॉट सिडनी नाम से जाना जाता है, ने Google की बार्ड त्रुटि को छाया में रखा है। हालाँकि, ये खामियाँ सिर्फ एक हिमशैल की नोक हैं।
बार्ड और ओपनएआई के चैटजीपीटी जैसे चैटबॉट्स के पीछे की तकनीक बड़े भाषा मॉडल (एलएलएम) से आती है, सार्वजनिक इंटरनेट पर अरबों शब्दों पर प्रशिक्षित कंप्यूटर प्रोग्राम जो मानवीय पाठ उत्पन्न कर सकते हैं। अगर चैटजीपीटी एक कार है, तो यह मॉडल उसका इंजन है, और ओपनएआई 2020 से इसकी पहुंच बेच रहा है। लेकिन सर्च बॉट्स के लिए आज की हथियारों की दौड़ के बीच, उन इंजनों को भी स्वतंत्र रूप से साझा किया जा रहा है और उनकी खामियों को दूर किया जा रहा है।
OpenAI यह खुलासा नहीं करता है कि कितने डेवलपर्स ने इसके LLM, GPT-3 तक पहुंच बनाई है, लेकिन यह सैकड़ों हजारों में होने की संभावना है। जबकि दर्जनों मुक्त, ओपन-सोर्स एलएलएम हैं, ओपनएआई को सोने के मानक के रूप में देखा जाता है। Google के संसाधनों को देखते हुए, इसका मॉडल LaMDA जल्द ही उतना ही लोकप्रिय साबित हो सकता है। Google ने अपने मॉडल को वर्षों तक गुप्त रखा, यह समझाते हुए कि समय से पहले लॉन्च किए जाने पर इसकी प्रतिष्ठा को नुकसान हो सकता है। फिर भी, इस महीने की शुरुआत में, जैसा कि माइक्रोसॉफ्ट ने घोषणा की कि वह जल्द ही बिंग को जीपीटी के साथ शक्ति देगा, Google उस स्थिति को उलटने लगा। इसने न केवल अगले दिन बार्ड को लॉन्च किया, बल्कि यह भी कहा कि यह LaMDA तक पहुंच खोलेगा। यह रणनीति Google, Microsoft और OpenAI को परेशान कर सकती है, जैसा कि उसने 2018 में फेसबुक को किया था, जब कैंब्रिज एनालिटिका घोटाले के बाद उपयोगकर्ता डेटा तक पहुंच बंद करने के लिए मजबूर किया गया था। यह सब एक दुष्ट उपयोगकर्ता था।
बड़े जोखिमों में से एक पूर्वाग्रह है। ट्विच ने सीनफेल्ड के एक एनिमेटेड स्पूफ को बंद कर दिया, जिसमें एआई द्वारा उत्पन्न एनीमेशन और संवाद था, क्योंकि शो के पात्रों ने ट्रांसफोबिक और होमोफोबिक टिप्पणी की थी। वह संवाद GPT-3 के "कम परिष्कृत संस्करण" द्वारा बनाया गया था।
GPT-3 को 7,000 अप्रकाशित पुस्तकों, विकिपीडिया प्रविष्टियों और समाचार लेखों सहित कई स्रोतों से अरबों शब्दों पर प्रशिक्षित किया गया था, जिससे यह पक्षपाती या घृणित सामग्री को भी चुनने के लिए असुरक्षित हो गया था। OpenAI ने मानव मध्यस्थों का उपयोग अपने मॉडल से बहुत कुछ छीनने के लिए किया है, लेकिन यह काम अचूक नहीं है। पूर्वाग्रह का पता लगाना भी लगभग असंभव है जब यह एलएलएम में गहराई से दबा हुआ है, अरबों मापदंडों का एक जटिल स्तरित नेटवर्क जो अपने स्वयं के रचनाकारों के लिए भी एक ब्लैक बॉक्स की तरह काम करता है। गलत सूचनाएँ इन मॉडलों को भी प्रभावित करती हैं। तकनीकी समाचार साइट सीएनईटी ने एलएलएम का उपयोग करते हुए पिछले नवंबर में वित्तीय सलाह पर 77 लेख तैयार किए। इसे उनमें से 41 पर सुधार जारी करना है। OpenAI अपने भाषा मॉडल की "मतिभ्रम दर" का खुलासा नहीं करता है, लेकिन तकनीकी समाचार साइट प्रोटोकॉल पर एक जनवरी 2022 की रिपोर्ट में शोधकर्ताओं का हवाला देते हुए कहा गया है कि यह 21% और 41% के बीच था। ChatGPT का उपयोग करने का मेरा अपना अनुभव गलत सूचना देता है। 5% और 10% के बीच। यहां तक कि अगर दर इतनी कम है, तो एलएलएम का उपयोग करने वाली कंपनियों को कार्यक्रमों में नमक के एक बड़े दाने के साथ सब कुछ लेने की जरूरत है।
दुरुपयोग शायद सबसे बड़ा अज्ञात है। OpenAI GPT-3 ग्राहकों को हिंसा या स्पैम को बढ़ावा देने के लिए इसका उपयोग करने से प्रतिबंधित करता है। अपराधियों को 'सामग्री नीति उल्लंघन' ईमेल मिलता है, लेकिन बुरे अभिनेता उस सब को अनदेखा कर सकते हैं। एक्सेटर विश्वविद्यालय में सुरक्षा और राजनीतिक हिंसा के एसोसिएट प्रोफेसर स्टीफ़न बेले ने पिछले साल एक अध्ययन के हिस्से के रूप में नकली ISIS प्रचार उत्पन्न करने के लिए GPT-3 का उपयोग किया। वह OpenAI से स्पष्टीकरण के लिए अनुरोध प्राप्त करना याद करता है, और व्याख्या करने के लिए उत्तर देता है। "हमने कहा, 'यह अकादमिक शोध है'," वह याद करते हैं। "हमने वापस नहीं सुना।"
OpenAI का कहना है कि इसने "सैकड़ों" अभिनेताओं को GPT-3 के दुरुपयोग की कोशिश करने वाले उद्देश्यों की एक विस्तृत श्रृंखला के लिए रोक दिया है, जैसे कि गलत सूचना, और हानिकारक सामग्री को फ़िल्टर करने के लिए अपने मॉडल में लगातार बदलाव कर रहा है। लेकिन बुरे अभिनेताओं के उपयोग के लिए अन्य LLM भी हैं।
सोर्स: livemint