DeepSeek, एक छोटी चीनी एआई कंपनी, अमेरिकी तकनीकी वर्चस्व को कैसे चुनौती दे रही

Update: 2025-01-31 14:19 GMT
Delhi दिल्ली। चीनी आर्टिफिशियल इंटेलिजेंस (AI) कंपनी DeepSeek ने बेहद कुशल AI मॉडल जारी करके टेक समुदाय में हलचल मचा दी है, जो OpenAI और Anthropic जैसी अमेरिकी कंपनियों के अत्याधुनिक उत्पादों के साथ प्रतिस्पर्धा कर सकते हैं। 2023 में स्थापित DeepSeek ने अपने प्रतिद्वंद्वियों की तुलना में बहुत कम नकदी और कंप्यूटिंग शक्ति के साथ अपने परिणाम प्राप्त किए हैं। पिछले सप्ताह जारी DeepSeek के "रीजनिंग" R1 मॉडल ने शोधकर्ताओं में उत्साह, निवेशकों में आश्चर्य और AI दिग्गजों की प्रतिक्रियाओं को जन्म दिया। कंपनी ने 28 जनवरी को एक मॉडल पेश किया जो इमेज के साथ-साथ टेक्स्ट के साथ भी काम कर सकता है। तो, DeepSeek ने क्या किया है और यह कैसे किया? DeepSeek ने क्या किया दिसंबर में DeepSeek ने अपना V3 मॉडल जारी किया।
हालांकि इन मॉडलों में त्रुटियाँ होने की संभावना होती है और कभी-कभी वे अपने तथ्य खुद ही बना लेते हैं, लेकिन वे सवालों के जवाब देने, निबंध लिखने और कंप्यूटर कोड बनाने जैसे काम कर सकते हैं। समस्या-समाधान और गणितीय तर्क के कुछ परीक्षणों में, वे औसत मानव से बेहतर स्कोर करते हैं। V3 को लगभग 5.58 मिलियन डॉलर की कथित लागत पर प्रशिक्षित किया गया था। यह GPT-4 की तुलना में नाटकीय रूप से सस्ता है, उदाहरण के लिए, जिसे विकसित करने में $100 मिलियन से अधिक की लागत आई थी। DeepSeek ने यह भी दावा किया है कि उसने लगभग 2,000 विशेष कंप्यूटर चिप्स, विशेष रूप से NVIDIA द्वारा बनाए गए H800 GPU का उपयोग करके V3 को प्रशिक्षित किया है। यह फिर से अन्य कंपनियों की तुलना में बहुत कम है, जिन्होंने संभवतः 16,000 अधिक शक्तिशाली H100 चिप्स का उपयोग किया होगा। 20 जनवरी को, DeepSeek ने R1 नामक एक और मॉडल जारी किया। यह एक तथाकथित "तर्क" मॉडल है, जो जटिल समस्याओं को चरणबद्ध तरीके से हल करने का प्रयास करता है। ये मॉडल कई कार्यों में बेहतर प्रतीत होते हैं, जिनमें संदर्भ की आवश्यकता होती है और जिनमें कई परस्पर संबंधित भाग होते हैं, जैसे कि रीडिंग कॉम्प्रिहेंशन और रणनीतिक योजना। R1 मॉडल V3 का संशोधित संस्करण है, जिसे रीइन्फोर्समेंट लर्निंग नामक तकनीक से संशोधित किया गया है। R1 पिछले साल जारी OpenAI के o1 के समान स्तर पर काम करता प्रतीत होता है। डीपसीक ने भी छोटे ओपन-सोर्स मॉडल के "रीजनिंग" संस्करण बनाने के लिए उसी तकनीक का उपयोग किया, जो घरेलू कंप्यूटर पर चल सकते हैं। इस रिलीज़ ने डीपसीक में लोगों की दिलचस्पी को बहुत बढ़ा दिया है, जिससे इसके V3-संचालित चैटबॉट ऐप की लोकप्रियता बढ़ गई है और निवेशकों द्वारा AI उद्योग का पुनर्मूल्यांकन करने के कारण तकनीकी शेयरों में भारी गिरावट आई है। लेखन के समय, चिपमेकर NVIDIA ने लगभग $600 बिलियन का मूल्य खो दिया है।
Tags:    

Similar News

-->