माइक्रोसॉफ्ट ने मजबूत एआई 'लघु भाषा मॉडल' लॉन्च किया
नई दिल्ली (आईएनएस): माइक्रोसॉफ्ट ने Phi-2 नाम से अपना नवीनतम कॉम्पैक्ट "लघु भाषा मॉडल" जारी किया है जो 13 अरब से कम मापदंडों के साथ कुछ बड़े ओपन-सोर्स लामा 2 मॉडल के बराबर या बेहतर प्रदर्शन जारी रखता है। पिछले कुछ महीनों में, माइक्रोसॉफ्ट रिसर्च की मशीन लर्निंग फाउंडेशन टीम ने "फी" नामक छोटे भाषा …
नई दिल्ली (आईएनएस): माइक्रोसॉफ्ट ने Phi-2 नाम से अपना नवीनतम कॉम्पैक्ट "लघु भाषा मॉडल" जारी किया है जो 13 अरब से कम मापदंडों के साथ कुछ बड़े ओपन-सोर्स लामा 2 मॉडल के बराबर या बेहतर प्रदर्शन जारी रखता है।
पिछले कुछ महीनों में, माइक्रोसॉफ्ट रिसर्च की मशीन लर्निंग फाउंडेशन टीम ने "फी" नामक छोटे भाषा मॉडल (एसएलएम) का एक सूट जारी किया है जो विभिन्न बेंचमार्क पर उल्लेखनीय प्रदर्शन हासिल करता है।पहले मॉडल, 1.3 बिलियन पैरामीटर Phi-1 ने मौजूदा एसएलएम (विशेष रूप से ह्यूमनएवल और एमबीपीपी बेंचमार्क पर) के बीच पायथन कोडिंग पर अत्याधुनिक प्रदर्शन हासिल किया।
कंपनी ने कहा, "अब हम 2.7 बिलियन पैरामीटर वाला भाषा मॉडल Phi-2 जारी कर रहे हैं, जो उत्कृष्ट तर्क और भाषा समझ क्षमताओं को प्रदर्शित करता है, जो 13 बिलियन से कम पैरामीटर वाले बेस भाषा मॉडल के बीच अत्याधुनिक प्रदर्शन प्रदर्शित करता है।" एक अपडॆट।
Phi-2 शोधकर्ताओं के लिए एक आदर्श खेल का मैदान है, जिसमें यंत्रवत व्याख्या, सुरक्षा सुधार, या विभिन्न कार्यों पर फाइन-ट्यूनिंग प्रयोग के आसपास अन्वेषण शामिल है।
माइक्रोसॉफ्ट ने कहा, "हमने भाषा मॉडल पर अनुसंधान और विकास को बढ़ावा देने के लिए Azure AI स्टूडियो मॉडल कैटलॉग में Phi-2 उपलब्ध कराया है।"
भाषा मॉडल के आकार में सैकड़ों अरबों मापदंडों की भारी वृद्धि ने कई उभरती क्षमताओं को खोल दिया है जिन्होंने प्राकृतिक भाषा प्रसंस्करण के परिदृश्य को फिर से परिभाषित किया है।
हालाँकि, एक सवाल बना हुआ है कि क्या प्रशिक्षण के लिए रणनीतिक विकल्पों, जैसे डेटा चयन, का उपयोग करके ऐसी उभरती क्षमताओं को छोटे पैमाने पर हासिल किया जा सकता है।
माइक्रोसॉफ्ट ने कहा, "फी मॉडल के साथ हमारे काम का उद्देश्य एसएलएम को प्रशिक्षित करके इस प्रश्न का उत्तर देना है जो बहुत अधिक पैमाने के मॉडल के बराबर प्रदर्शन हासिल करते हैं (फिर भी अभी भी अग्रणी मॉडल से दूर हैं)।कंपनी ने अनुसंधान समुदाय से आमतौर पर उपयोग किए जाने वाले संकेतों पर व्यापक परीक्षण भी किया है।
टेक दिग्गज ने कहा, "हमने बेंचमार्क नतीजों की अपेक्षा के अनुरूप व्यवहार देखा।"