OpenAI ने ChatGPT के कोड आउटपुट में त्रुटियों को खोजने के लिए अपना GPT-4-संचालित CriticGPT पेश किया है। हालाँकि कंपनी ने चेतावनी दी है कि प्रतिक्रियाएँ हमेशा सही नहीं होंगी, लेकिन यह उपयोगकर्ताओं को CriticGPT का उपयोग किए बिना की तुलना में अधिक समस्याओं को पकड़ने में मदद कर सकता है। AI अनुसंधान और परिनियोजन फर्म OpenAI ने वायरल चैटबॉट ChatGPT द्वारा लौटाए गए कोड आउटपुट में त्रुटियों को खोजने के लिए GPT-4-संचालित CriticGPT की घोषणा की। कंपनी ने बताया कि वह CriticGPT जैसे मॉडल को अपने रीइनफोर्समेंट लर्निंग फ्रॉम ह्यूमन फीडबैक (RLHF) लेबलिंग पाइपलाइन में एकीकृत करेगी, जो प्रशिक्षकों को AI सहायता प्रदान करने और उन्नत AI सिस्टम का मूल्यांकन करने में मदद कर सकता है।
CriticGPT आलोचना लिख सकता है जो चैट मॉडल के उत्तरों में अशुद्धियों को उजागर कर सकता है। जबकि कंपनी ने चेतावनी दी कि प्रतिक्रियाएँ हमेशा सही नहीं होंगी, यह उपयोगकर्ताओं को AI का उपयोग किए बिना की तुलना में अधिक समस्याओं को पकड़ने में मदद कर सकती है। AI मॉडल को RLHF और त्रुटि-भरे कोड के साथ प्रशिक्षित किया गया था। मॉडल को प्रशिक्षित करने के लिए, OpenAI ने AI प्रशिक्षकों से ChatGPT द्वारा उत्पन्न कोड में गलतियाँ डालने और उदाहरण फ़ीडबैक को नोट करने के लिए कहा जैसे कि उन्होंने जो बग डाला था उसे पकड़ लिया हो। प्रतिक्रिया के रूप में, CriticGPT ChatGPT के कोड में डाले गए और "स्वाभाविक रूप से होने वाले" बग को पकड़ सकता है।
कंपनी ने कहा, "स्वाभाविक रूप से होने वाली बग्स के 63 प्रतिशत मामलों में प्रशिक्षकों द्वारा चैटजीपीटी आलोचनाओं की तुलना में क्रिटिकजीपीटी आलोचनाओं को प्राथमिकता दी जाती है, आंशिक रूप से इसलिए क्योंकि नया आलोचक कम 'नाइटपिक्स' (छोटी शिकायतें जो बेकार होती हैं) उत्पन्न करता है और समस्याओं को कम बार भ्रमित करता है।" जबकि मॉडल लंबी और अधिक व्यापक आलोचनाएँ उत्पन्न कर सकता है, OpenAI ने CriticGPT की कई सीमाओं को उजागर किया। AI को चैटजीपीटी उत्तरों पर प्रशिक्षित किया जाता है जो छोटे होते हैं। भविष्य की संभावनाओं के लिए, इसे लंबे और अधिक जटिल कार्यों से निपटने के लिए प्रशिक्षित किया जा सकता है। अधिकांश AI मॉडल की तरह, यह परिणाम लौटाते समय भ्रमित हो सकता है।
क्रिटिकजीपीटी वर्तमान योजना में फैली हुई त्रुटियों से निपट नहीं सकता है जो उत्तर के कई हिस्सों में बिखरी हो सकती हैं। इसके अलावा, कंपनी ने कहा कि यदि कोई "कार्य या प्रतिक्रिया अत्यधिक जटिल है, तो क्रिटिकजीपीटी वाला कोई विशेषज्ञ भी इसका सही मूल्यांकन करने में सक्षम नहीं हो सकता है," OpenAI ने उल्लेख किया। इस बीच, कंपनी ने हाल ही में अपने अपग्रेडेड GPT-4o मॉडल का अनावरण किया। आप इस बारे में यहाँ और अधिक पढ़ सकते हैं।