
x
DeepSeek V4 होने का संदेह
पिछले हफ़्ते एक डेवलपर प्लेटफ़ॉर्म पर गुमनाम रूप से सामने आए एक शक्तिशाली आर्टिफिशियल इंटेलिजेंस (AI) मॉडल के बारे में बुधवार को पता चला कि यह चीनी स्मार्टफ़ोन और EV दिग्गज कंपनी Xiaomi का है। इससे पहले, इस मॉडल ने यह अटकलें तेज़ कर दी थीं कि स्टार्टअप DeepSeek अपने अगले-जेनरेशन के सिस्टम को लॉन्च से पहले चुपचाप टेस्ट कर रहा है।
पिछले साल DeepSeek के कम लागत वाले मॉडल DeepSeek-V3 और R1 के रिलीज़ होने से वैश्विक टेक शेयरों में भारी गिरावट आई थी, जिससे निवेशकों के मन में यह सवाल उठने लगा था कि क्या अमेरिकी AI कंपनियों को AI कंप्यूटिंग पावर पर अरबों डॉलर खर्च करने की ज़रूरत है। तब से, DeepSeek-V4 में लोगों की काफ़ी दिलचस्पी बढ़ी है; यह एक ऐसा अगले-जेनरेशन का मॉडल है जिसे अभी तक रिलीज़ नहीं किया गया है।
Hunter Alpha नाम का यह रहस्यमयी और मुफ़्त मॉडल 11 मार्च को AI गेटवे प्लेटफ़ॉर्म OpenRouter पर बिना किसी डेवलपर के नाम के सामने आया था, और बाद में प्लेटफ़ॉर्म ने इसे एक "सीक्रेट मॉडल" बताया।
Xiaomi की AI मॉडल टीम MiMo, जिसे DeepSeek की पूर्व शोधकर्ता Luo Fuli चलाती हैं, ने बुधवार को बताया कि Hunter Alpha असल में "MiMo-V2-Pro का शुरुआती आंतरिक टेस्ट वर्शन" है। यह एक प्रमुख मॉडल है जिसे AI एजेंटों के "दिमाग" के तौर पर काम करने के लिए डिज़ाइन किया गया है। ये AI एजेंट ऐसे टूल होते हैं जो यूज़र्स को चैटबॉट की तुलना में कम मानवीय निर्देशों और निगरानी के साथ जटिल काम करने की सुविधा देते हैं।
Xiaomi का यह नया मॉडल ऐसे समय में रिलीज़ हुआ है जब OpenClaw, जो एक ओपन-सोर्स एजेंट फ़्रेमवर्क है, को चीन में हर तरह के यूज़र्स तेज़ी से अपना रहे हैं।
Luo ने गुरुवार को X पर एक पोस्ट में कहा, "मैं इसे एक 'चुपचाप किया गया हमला' कहती हूँ - इसलिए नहीं कि हमने इसकी योजना बनाई थी, बल्कि इसलिए कि चैट से एजेंट वाले तरीके में बदलाव इतनी तेज़ी से हुआ कि हमें भी इस पर मुश्किल से ही यकीन हुआ।"
उन्होंने आगे कहा, "लोग पूछते हैं कि हम इतनी तेज़ी से आगे क्यों बढ़ते हैं? मैंने DeepSeek R1 को बनाते समय यह बात खुद अपनी आँखों से देखी थी।"
MiMo-V2-Pro, OpenClaw समेत पाँच प्रमुख एजेंट फ़्रेमवर्क के साथ मिलकर काम करेगा, ताकि दुनिया भर के डेवलपर्स को एक हफ़्ते तक मुफ़्त एक्सेस दिया जा सके।
गुरुवार को Xiaomi के हांगकांग में लिस्टेड शेयरों में 5.8% तक की तेज़ी देखी गई।
वह रहस्यमयी चीनी मॉडल
पिछले हफ़्ते Reuters द्वारा किए गए टेस्ट के दौरान, Hunter Alpha चैटबॉट ने खुद को "एक चीनी AI मॉडल बताया जिसे मुख्य रूप से चीनी भाषा में प्रशिक्षित किया गया है" और कहा कि इसका डेटा मई 2025 तक का है - यह वही जानकारी की समय-सीमा (knowledge cutoff point) है जिसकी जानकारी DeepSeek के अपने चैटबॉट ने भी दी थी। लेकिन, जब इसके बनाने वाले के बारे में पूछा गया, तो सिस्टम ने अपने डेवलपर की पहचान बताने से मना कर दिया।
चैटबॉट ने कहा, "मुझे सिर्फ़ अपना नाम, अपना पैरामीटर स्केल और अपनी कॉन्टेक्स्ट विंडो की लंबाई पता है।"
Hunter Alpha का प्रोफ़ाइल पेज इसे 1-ट्रिलियन-पैरामीटर मॉडल बताता है। इसका मतलब है कि इसे लगभग एक ट्रिलियन एडजस्ट होने वाली वैल्यूज़ का इस्तेमाल करके ट्रेन किया गया था। ये वैल्यूज़ तय करती हैं कि सिस्टम भाषा को कैसे प्रोसेस करता है और जवाब कैसे देता है।
यह सिस्टम 1 मिलियन टोकन तक की कॉन्टेक्स्ट विंडो का भी दावा करता है। यह इस बात का पैमाना है कि कोई AI मॉडल एक ही बातचीत के दौरान कितना टेक्स्ट प्रोसेस या याद रख सकता है। एक टोकन मोटे तौर पर टेक्स्ट के एक छोटे से हिस्से, जैसे किसी शब्द के एक हिस्से के बराबर होता है।
AI एजेंट सिस्टम बनाने वाले इंजीनियर नबील हौआम ने कहा, "जो कॉम्बिनेशन सबसे अलग था, वह था Hunter Alpha की 1-मिलियन-टोकन कॉन्टेक्स्ट विंडो, जो उसकी सोचने-समझने की क्षमता और मुफ़्त एक्सेस के साथ जुड़ी थी।"
उन्होंने आगे कहा, "इस तरह की कॉन्टेक्स्ट विंडो वाले ज़्यादातर नए मॉडल बड़े पैमाने पर इस्तेमाल करने पर काफ़ी महंगे पड़ते हैं।"
ये स्पेसिफ़िकेशन DeepSeek के अगली पीढ़ी के V4 मॉडल के बारे में स्थानीय मीडिया की उम्मीदों से मिलते-जुलते थे। चीनी मीडिया आउटलेट्स ने बताया है कि यह मॉडल अप्रैल में ही लॉन्च हो सकता है।
Umur Ozkul, जो स्वतंत्र AI बेंचमार्क टेस्ट करते हैं, ने कहा कि जिस समय और क्षमताओं का दावा किया गया है, उसे देखते हुए इस मॉडल को DeepSeek से जोड़ने का अंदाज़ा लगाना समझ में आता है।
चुपके से टेस्टिंग
चुपके से मॉडल लॉन्च करना कोई नई बात नहीं है। OpenRouter जैसे प्लेटफ़ॉर्म डेवलपर्स को एक ही इंटरफ़ेस के ज़रिए दर्जनों AI मॉडलों को सवाल भेजने की सुविधा देते हैं। इस वजह से ये नए सिस्टम की टेस्टिंग के लिए एक लोकप्रिय जगह बन गए हैं।
फ़रवरी में OpenRouter पर Pony Alpha नाम का एक अनजान मॉडल सामने आया था। इसके पाँच दिन बाद ही चीनी कंपनी Zhipu AI ने पुष्टि की कि यह उसके GLM-5 सिस्टम का ही एक हिस्सा है।
Hunter Alpha के प्रोफ़ाइल पेज पर एक नोटिस में बताया गया था कि इस मॉडल के लिए दिए गए सभी प्रॉम्प्ट और पूरे किए गए काम "प्रोवाइडर द्वारा रिकॉर्ड किए जाते हैं और मॉडल को बेहतर बनाने के लिए इस्तेमाल किए जा सकते हैं।" यह बात इस पूरे इंडस्ट्री में अपनाए जाने वाले उस तरीके को दिखाती है, जिसमें बिना किसी पक्षपात के फ़ीडबैक पाने के लिए चुपके से मॉडल लॉन्च किए जाते हैं।
MiMo के मुताबिक, प्लेटफ़ॉर्म पर आने के बाद इस मॉडल को बहुत तेज़ी से अपनाया गया। इसका कुल इस्तेमाल एक ट्रिलियन टोकन से भी ज़्यादा हो गया और यह OpenRouter के लीडरबोर्ड चार्ट में सबसे ऊपर पहुँच गया।
Tagsरहस्यमयी AI मॉडलDeepSeek V4संदेहMysterious AI modeldoubtजनता से रिश्ता न्यूज़जनता से रिश्ताजनता से रिश्ता.कॉमआज की ताजा न्यूज़हिंन्दी न्यूज़भारत न्यूज़खबरों का सिलसिलाआज की ब्रेंकिग न्यूज़आज की बड़ी खबरमिड डे अख़बारJanta Se Rishta NewsJanta Se RishtaToday's Latest NewsHindi NewsIndia NewsKhabron Ka SilsilaToday's Breaking NewsToday's Big NewsMid Day Newspaper
Next Story





