प्रौद्योगिकी

CriticGPT: OpenAI ने CriticGPT आधारित मॉडल पेश

Deepa Sahu
28 Jun 2024 8:16 AM GMT
CriticGPT: OpenAI ने CriticGPT आधारित मॉडल पेश
x
OpenAI ने ChatGPT के कोड आउटपुट में त्रुटियों को खोजने के लिए अपना GPT-4-संचालित CriticGPT पेश किया है। हालाँकि कंपनी ने चेतावनी दी है कि प्रतिक्रियाएँ हमेशा सही नहीं होंगी, लेकिन यह उपयोगकर्ताओं को CriticGPT का उपयोग किए बिना की तुलना में अधिक समस्याओं को पकड़ने में मदद कर सकता है। AI अनुसंधान और परिनियोजन फर्म OpenAI ने वायरल चैटबॉट ChatGPT द्वारा लौटाए गए कोड आउटपुट में त्रुटियों को खोजने के लिए GPT-4-संचालित CriticGPT की घोषणा की। कंपनी ने बताया कि वह CriticGPT जैसे मॉडल को अपने रीइनफोर्समेंट लर्निंग फ्रॉम ह्यूमन फीडबैक
(RLHF
) लेबलिंग पाइपलाइन में एकीकृत करेगी, जो प्रशिक्षकों को AI सहायता प्रदान करने और उन्नत AI सिस्टम का मूल्यांकन करने में मदद कर सकता है।
CriticGPT आलोचना लिख ​​सकता है जो चैट मॉडल के उत्तरों में अशुद्धियों को उजागर कर सकता है। जबकि कंपनी ने चेतावनी दी कि प्रतिक्रियाएँ हमेशा सही नहीं होंगी, यह उपयोगकर्ताओं को AI का उपयोग किए बिना की तुलना में अधिक समस्याओं को पकड़ने में मदद कर सकती है। AI मॉडल को RLHF और त्रुटि-भरे कोड के साथ प्रशिक्षित किया गया था। मॉडल को प्रशिक्षित करने के लिए, OpenAI ने
AI
प्रशिक्षकों से ChatGPT द्वारा उत्पन्न कोड में गलतियाँ डालने और उदाहरण फ़ीडबैक को नोट करने के लिए कहा जैसे कि उन्होंने जो बग डाला था उसे पकड़ लिया हो। प्रतिक्रिया के रूप में, CriticGPT ChatGPT के कोड में डाले गए और "स्वाभाविक रूप से होने वाले" बग को पकड़ सकता है।
कंपनी ने कहा, "स्वाभाविक रूप से होने वाली बग्स के 63 प्रतिशत मामलों में प्रशिक्षकों द्वारा चैटजीपीटी आलोचनाओं की तुलना में क्रिटिकजीपीटी आलोचनाओं को प्राथमिकता दी जाती है, आंशिक रूप से इसलिए क्योंकि नया आलोचक कम 'नाइटपिक्स' (छोटी शिकायतें जो बेकार होती हैं) उत्पन्न करता है और समस्याओं को कम बार भ्रमित करता है।" जबकि मॉडल लंबी और अधिक व्यापक आलोचनाएँ उत्पन्न कर सकता है, OpenAI ने CriticGPT की कई सीमाओं को उजागर किया। AI को चैटजीपीटी उत्तरों पर प्रशिक्षित किया जाता है जो छोटे होते हैं। भविष्य की संभावनाओं के लिए, इसे लंबे और अधिक जटिल कार्यों से निपटने के लिए प्रशिक्षित किया जा सकता है। अधिकांश AI मॉडल की तरह, यह परिणाम लौटाते समय भ्रमित हो सकता है।
क्रिटिकजीपीटी वर्तमान योजना में फैली हुई त्रुटियों से निपट नहीं सकता है जो उत्तर के कई हिस्सों में बिखरी हो सकती हैं। इसके अलावा, कंपनी ने कहा कि यदि कोई "कार्य या प्रतिक्रिया अत्यधिक जटिल है, तो क्रिटिकजीपीटी वाला कोई विशेषज्ञ भी इसका सही मूल्यांकन करने में सक्षम नहीं हो सकता है," OpenAI ने उल्लेख किया। इस बीच, कंपनी ने हाल ही में अपने अपग्रेडेड GPT-4o मॉडल का अनावरण किया। आप इस बारे में यहाँ और अधिक पढ़ सकते हैं।
Next Story