माइक्रोसॉफ्ट ने मजबूत एआई लघु भाषा मॉडल लॉन्च किया

नई दिल्ली: माइक्रोसॉफ्ट ने Phi-2 नाम से अपना नवीनतम कॉम्पैक्ट "लघु भाषा मॉडल" जारी किया है जो 13 बिलियन से कम मापदंडों के साथ कुछ बड़े ओपन-सोर्स लामा 2 मॉडल के बराबर या बेहतर प्रदर्शन जारी रखता है। पिछले कुछ महीनों में, माइक्रोसॉफ्ट रिसर्च की मशीन लर्निंग फाउंडेशन टीम ने "फी" नामक छोटे भाषा मॉडल …

Update: 2023-12-18 08:41 GMT

नई दिल्ली: माइक्रोसॉफ्ट ने Phi-2 नाम से अपना नवीनतम कॉम्पैक्ट "लघु भाषा मॉडल" जारी किया है जो 13 बिलियन से कम मापदंडों के साथ कुछ बड़े ओपन-सोर्स लामा 2 मॉडल के बराबर या बेहतर प्रदर्शन जारी रखता है।

पिछले कुछ महीनों में, माइक्रोसॉफ्ट रिसर्च की मशीन लर्निंग फाउंडेशन टीम ने "फी" नामक छोटे भाषा मॉडल (एसएलएम) का एक सूट जारी किया है जो विभिन्न बेंचमार्क पर उल्लेखनीय प्रदर्शन हासिल करता है। पहले मॉडल, 1.3 बिलियन पैरामीटर Phi-1 ने मौजूदा एसएलएम (विशेष रूप से ह्यूमनएवल और एमबीपीपी बेंचमार्क पर) के बीच पायथन कोडिंग पर अत्याधुनिक प्रदर्शन हासिल किया। कंपनी ने कहा, "अब हम 2.7 बिलियन पैरामीटर वाला भाषा मॉडल Phi-2 जारी कर रहे हैं, जो उत्कृष्ट तर्क और भाषा समझ क्षमताओं को प्रदर्शित करता है, जो 13 बिलियन से कम पैरामीटर वाले बेस भाषा मॉडल के बीच अत्याधुनिक प्रदर्शन प्रदर्शित करता है।" एक अपडॆट।
Phi-2 शोधकर्ताओं के लिए एक आदर्श खेल का मैदान है, जिसमें यंत्रवत व्याख्या, सुरक्षा सुधार, या विभिन्न कार्यों पर फाइन-ट्यूनिंग प्रयोग के आसपास अन्वेषण शामिल है।

माइक्रोसॉफ्ट ने कहा, "हमने भाषा मॉडल पर अनुसंधान और विकास को बढ़ावा देने के लिए Azure AI स्टूडियो मॉडल कैटलॉग में Phi-2 उपलब्ध कराया है।" भाषा मॉडल के आकार में सैकड़ों अरबों मापदंडों की भारी वृद्धि ने कई उभरती क्षमताओं को खोल दिया है जिन्होंने प्राकृतिक भाषा प्रसंस्करण के परिदृश्य को फिर से परिभाषित किया है। हालाँकि, एक सवाल बना हुआ है कि क्या प्रशिक्षण के लिए रणनीतिक विकल्पों, जैसे डेटा चयन, का उपयोग करके ऐसी उभरती क्षमताओं को छोटे पैमाने पर हासिल किया जा सकता है।

माइक्रोसॉफ्ट ने कहा, "फी मॉडल के साथ हमारे काम का उद्देश्य एसएलएम को प्रशिक्षित करके इस प्रश्न का उत्तर देना है जो बहुत अधिक पैमाने के मॉडल के बराबर प्रदर्शन हासिल करते हैं (फिर भी अभी भी अग्रणी मॉडल से दूर हैं)। कंपनी ने अनुसंधान समुदाय से आमतौर पर उपयोग किए जाने वाले संकेतों पर व्यापक परीक्षण भी किया है। टेक दिग्गज ने कहा, "हमने बेंचमार्क नतीजों की अपेक्षा के अनुरूप व्यवहार देखा।"

Similar News

-->