प्रौद्योगिकी

Meta का नया एआई मॉडल अन्य एआई मॉडलों के काम की जांच करेगा

Harrison
19 Oct 2024 1:22 PM GMT
Meta का नया एआई मॉडल अन्य एआई मॉडलों के काम की जांच करेगा
x
Washington वाशिंगटन। फेसबुक के मालिक मेटा ने शुक्रवार को कहा कि वह अपने शोध प्रभाग से नए AI मॉडल का एक बैच जारी कर रहा है, जिसमें एक "स्व-शिक्षित मूल्यांकनकर्ता" भी शामिल है जो AI विकास प्रक्रिया में कम मानवीय भागीदारी की ओर एक मार्ग प्रदान कर सकता है।यह रिलीज़ मेटा द्वारा अगस्त के एक पेपर में टूल की शुरूआत के बाद की गई है, जिसमें विस्तार से बताया गया है कि यह मॉडल की प्रतिक्रियाओं के बारे में विश्वसनीय निर्णय लेने के लिए OpenAI के हाल ही में जारी किए गए o1 मॉडल द्वारा उपयोग की जाने वाली उसी "चेन ऑफ़ थॉट" तकनीक पर कैसे निर्भर करता है।
उस तकनीक में जटिल समस्याओं को छोटे तार्किक चरणों में तोड़ना शामिल है और ऐसा लगता है कि यह विज्ञान, कोडिंग और गणित जैसे विषयों में चुनौतीपूर्ण समस्याओं पर प्रतिक्रियाओं की सटीकता में सुधार करता है।मेटा के शोधकर्ताओं ने मूल्यांकनकर्ता मॉडल को प्रशिक्षित करने के लिए पूरी तरह से AI-जनरेटेड डेटा का उपयोग किया, उस चरण में मानव इनपुट को भी समाप्त कर दिया।
AI का मज़बूती से मूल्यांकन करने के लिए AI का उपयोग करने की क्षमता स्वायत्त AI एजेंटों के निर्माण की दिशा में एक संभावित मार्ग की झलक प्रदान करती है जो अपनी गलतियों से सीख सकते हैं, परियोजना के पीछे मेटा के दो शोधकर्ताओं ने रॉयटर्स को बताया।एआई क्षेत्र में कई लोग ऐसे एजेंटों को डिजिटल सहायक के रूप में देखते हैं जो मानवीय हस्तक्षेप के बिना कई तरह के कार्यों को करने के लिए पर्याप्त बुद्धिमान होते हैं।
स्व-सुधार मॉडल आज इस्तेमाल की जाने वाली अक्सर महंगी और अक्षम प्रक्रिया की आवश्यकता को कम कर सकते हैं जिसे मानव प्रतिक्रिया से सुदृढीकरण सीखना कहा जाता है, जिसके लिए मानव एनोटेटर्स से इनपुट की आवश्यकता होती है, जिनके पास डेटा को सटीक रूप से लेबल करने और जटिल गणित और लेखन प्रश्नों के उत्तरों को सही सत्यापित करने के लिए विशेष विशेषज्ञता होनी चाहिए।
शोधकर्ताओं में से एक जेसन वेस्टन ने कहा, "हमें उम्मीद है कि जैसे-जैसे एआई अधिक से अधिक सुपर-ह्यूमन बनता जाएगा, यह अपने काम की जांच करने में बेहतर होता जाएगा, ताकि यह वास्तव में औसत मानव से बेहतर हो जाए।"उन्होंने कहा, "स्व-शिक्षित होने और आत्म-मूल्यांकन करने में सक्षम होने का विचार मूल रूप से एआई के इस तरह के सुपर-ह्यूमन स्तर तक पहुंचने के विचार के लिए महत्वपूर्ण है।"
Google और Anthropic सहित अन्य कंपनियों ने भी RLAIF, या AI प्रतिक्रिया से सुदृढीकरण सीखने की अवधारणा पर शोध प्रकाशित किया है। हालाँकि, मेटा के विपरीत, वे कंपनियाँ अपने मॉडल को सार्वजनिक उपयोग के लिए जारी नहीं करती हैं।मेटा द्वारा शुक्रवार को जारी किए गए अन्य एआई उपकरणों में कंपनी के छवि-पहचान सेगमेंट एनीथिंग मॉडल का अपडेट शामिल है, जो एक ऐसा उपकरण है जो एलएलएम प्रतिक्रिया निर्माण समय और डेटासेट को गति देता है जिसका उपयोग नई अकार्बनिक सामग्रियों की खोज में सहायता के लिए किया जा सकता है।
Next Story