प्रौद्योगिकी

AI टूल ने 'Real Vs Fake' शोध पत्रों की पहचान करने में 94% सटीकता हासिल की

Harrison
4 Sep 2024 2:11 PM GMT
AI टूल ने Real Vs Fake शोध पत्रों की पहचान करने में 94% सटीकता हासिल की
x
New Delhi नई दिल्ली: शोधकर्ताओं ने एक ऐसा उपकरण विकसित किया है जो चैटजीपीटी सहित एआई-चैटबॉट द्वारा बनाए गए शोध लेख से मूल शोध लेख को अलग कर सकता है।300 नकली और असली वैज्ञानिक पत्रों के एक सेट में, 'xFakeSci' नामक एआई-आधारित उपकरण ने 94 प्रतिशत तक नकली पत्रों का पता लगाया।यह अधिक सामान्य डेटा-माइनिंग तकनीकों के बीच देखी गई सफलता दर से लगभग दोगुना था, स्टेट यूनिवर्सिटी ऑफ़ न्यूयॉर्क, यूएस और हेफ़ेई यूनिवर्सिटी ऑफ़ टेक्नोलॉजी, चीन के लेखकों ने कहा।
"... हम xFakeSci, एक नया लर्निंग एल्गोरिदम पेश करते हैं, जो चैटजीपीटी-जनरेटेड लेखों को वैज्ञानिकों द्वारा उत्पादित प्रकाशनों से अलग करने में सक्षम है," उन्होंने जर्नल साइंटिफिक रिपोर्ट्स में प्रकाशित अध्ययन में लिखा है।एआई-आधारित एल्गोरिदम विकसित करने के लिए, शोधकर्ताओं ने दो अलग-अलग डेटासेट विकसित किए। उनमें से एक में लगभग 4,000 वैज्ञानिक लेख थे जो पबमेड से लिए गए थे, एक खुला डेटाबेस जिसमें बायोमेडिकल और जीवन विज्ञान शोध पत्र हैं और जिसे यूएस नेशनल इंस्टीट्यूट ऑफ हेल्थ द्वारा बनाए रखा जाता है।
दूसरे में 300 नकली लेख शामिल थे, जिन्हें शोधकर्ताओं ने ChatGPT का उपयोग करके बनाया था।"मैंने ठीक वही कीवर्ड इस्तेमाल करने की कोशिश की, जिनका इस्तेमाल मैंने PubMed डेटाबेस से साहित्य निकालने के लिए किया था, ताकि हमारे पास तुलना का एक सामान्य आधार हो। मेरा अंतर्ज्ञान था कि नकली दुनिया बनाम वास्तविक दुनिया में एक पैटर्न प्रदर्शित होना चाहिए, लेकिन मुझे नहीं पता था कि यह पैटर्न क्या था," अध्ययन के सह-लेखक अहमद अबदीन हामिद, जो न्यूयॉर्क स्टेट यूनिवर्सिटी में विजिटिंग रिसर्च फेलो हैं, ने कहा।
300 नकली लेखों में से, 100 प्रत्येक अल्जाइमर रोग, कैंसर और अवसाद जैसी चिकित्सा स्थितियों से संबंधित थे। 100 में से प्रत्येक में 50 चैटबॉट-निर्मित लेख और PubMed से लिए गए 50 प्रामाणिक सार शामिल थे।xFakeSci एल्गोरिदम को वैज्ञानिक पत्रों वाले पहले डेटासेट पर प्रशिक्षित किया गया और फिर दूसरे पर इसके प्रदर्शन के लिए परीक्षण किया गया।लेखकों ने लिखा, "xFakeSci एल्गोरिदम ने 80 से 94 प्रतिशत तक (सटीकता) स्कोर प्राप्त किया, जो सामान्य डेटा माइनिंग एल्गोरिदम से बेहतर प्रदर्शन था, जो 38 से 52 प्रतिशत के बीच (सटीकता) स्कोर करता था।"
Next Story