व्यापार

रहस्यमयी AI मॉडल, जिसके DeepSeek V4 होने का संदेह था, सामने आ गया

nidhi
19 March 2026 12:34 PM IST
रहस्यमयी AI मॉडल, जिसके DeepSeek V4 होने का संदेह था, सामने आ गया
x
DeepSeek V4 होने का संदेह
पिछले हफ़्ते एक डेवलपर प्लेटफ़ॉर्म पर गुमनाम रूप से सामने आए एक शक्तिशाली आर्टिफिशियल इंटेलिजेंस (AI) मॉडल के बारे में बुधवार को पता चला कि यह चीनी स्मार्टफ़ोन और EV दिग्गज कंपनी Xiaomi का है। इससे पहले, इस मॉडल ने यह अटकलें तेज़ कर दी थीं कि स्टार्टअप DeepSeek अपने अगले-जेनरेशन के सिस्टम को लॉन्च से पहले चुपचाप टेस्ट कर रहा है।
पिछले साल DeepSeek के कम लागत वाले मॉडल DeepSeek-V3 और R1 के रिलीज़ होने से वैश्विक टेक शेयरों में भारी गिरावट आई थी, जिससे निवेशकों के मन में यह सवाल उठने लगा था कि क्या अमेरिकी AI कंपनियों को AI कंप्यूटिंग पावर पर अरबों डॉलर खर्च करने की ज़रूरत है। तब से, DeepSeek-V4 में लोगों की काफ़ी दिलचस्पी बढ़ी है; यह एक ऐसा अगले-जेनरेशन का मॉडल है जिसे अभी तक रिलीज़ नहीं किया गया है।
Hunter Alpha नाम का यह रहस्यमयी और मुफ़्त मॉडल 11 मार्च को AI गेटवे प्लेटफ़ॉर्म OpenRouter पर बिना किसी डेवलपर के नाम के सामने आया था, और बाद में प्लेटफ़ॉर्म ने इसे एक "सीक्रेट मॉडल" बताया।
Xiaomi की AI मॉडल टीम MiMo, जिसे DeepSeek की पूर्व शोधकर्ता Luo Fuli चलाती हैं, ने बुधवार को बताया कि Hunter Alpha असल में "MiMo-V2-Pro का शुरुआती आंतरिक टेस्ट वर्शन" है। यह एक प्रमुख मॉडल है जिसे AI एजेंटों के "दिमाग" के तौर पर काम करने के लिए डिज़ाइन किया गया है। ये AI एजेंट ऐसे टूल होते हैं जो यूज़र्स को चैटबॉट की तुलना में कम मानवीय निर्देशों और निगरानी के साथ जटिल काम करने की सुविधा देते हैं।
Xiaomi का यह नया मॉडल ऐसे समय में रिलीज़ हुआ है जब OpenClaw, जो एक ओपन-सोर्स एजेंट फ़्रेमवर्क है, को चीन में हर तरह के यूज़र्स तेज़ी से अपना रहे हैं।
Luo ने गुरुवार को X पर एक पोस्ट में कहा, "मैं इसे एक 'चुपचाप किया गया हमला' कहती हूँ - इसलिए नहीं कि हमने इसकी योजना बनाई थी, बल्कि इसलिए कि चैट से एजेंट वाले तरीके में बदलाव इतनी तेज़ी से हुआ कि हमें भी इस पर मुश्किल से ही यकीन हुआ।"
उन्होंने आगे कहा, "लोग पूछते हैं कि हम इतनी तेज़ी से आगे क्यों बढ़ते हैं? मैंने DeepSeek R1 को बनाते समय यह बात खुद अपनी आँखों से देखी थी।"
MiMo-V2-Pro, OpenClaw समेत पाँच प्रमुख एजेंट फ़्रेमवर्क के साथ मिलकर काम करेगा, ताकि दुनिया भर के डेवलपर्स को एक हफ़्ते तक मुफ़्त एक्सेस दिया जा सके।
गुरुवार को Xiaomi के हांगकांग में लिस्टेड शेयरों में 5.8% तक की तेज़ी देखी गई।
वह रहस्यमयी चीनी मॉडल
पिछले हफ़्ते Reuters द्वारा किए गए टेस्ट के दौरान, Hunter Alpha चैटबॉट ने खुद को "एक चीनी AI मॉडल बताया जिसे मुख्य रूप से चीनी भाषा में प्रशिक्षित किया गया है" और कहा कि इसका डेटा मई 2025 तक का है - यह वही जानकारी की समय-सीमा (knowledge cutoff point) है जिसकी जानकारी DeepSeek के अपने चैटबॉट ने भी दी थी। लेकिन, जब इसके बनाने वाले के बारे में पूछा गया, तो सिस्टम ने अपने डेवलपर की पहचान बताने से मना कर दिया।
चैटबॉट ने कहा, "मुझे सिर्फ़ अपना नाम, अपना पैरामीटर स्केल और अपनी कॉन्टेक्स्ट विंडो की लंबाई पता है।"
Hunter Alpha का प्रोफ़ाइल पेज इसे 1-ट्रिलियन-पैरामीटर मॉडल बताता है। इसका मतलब है कि इसे लगभग एक ट्रिलियन एडजस्ट होने वाली वैल्यूज़ का इस्तेमाल करके ट्रेन किया गया था। ये वैल्यूज़ तय करती हैं कि सिस्टम भाषा को कैसे प्रोसेस करता है और जवाब कैसे देता है।
यह सिस्टम 1 मिलियन टोकन तक की कॉन्टेक्स्ट विंडो का भी दावा करता है। यह इस बात का पैमाना है कि कोई AI मॉडल एक ही बातचीत के दौरान कितना टेक्स्ट प्रोसेस या याद रख सकता है। एक टोकन मोटे तौर पर टेक्स्ट के एक छोटे से हिस्से, जैसे किसी शब्द के एक हिस्से के बराबर होता है।
AI एजेंट सिस्टम बनाने वाले इंजीनियर नबील हौआम ने कहा, "जो कॉम्बिनेशन सबसे अलग था, वह था Hunter Alpha की 1-मिलियन-टोकन कॉन्टेक्स्ट विंडो, जो उसकी सोचने-समझने की क्षमता और मुफ़्त एक्सेस के साथ जुड़ी थी।"
उन्होंने आगे कहा, "इस तरह की कॉन्टेक्स्ट विंडो वाले ज़्यादातर नए मॉडल बड़े पैमाने पर इस्तेमाल करने पर काफ़ी महंगे पड़ते हैं।"
ये स्पेसिफ़िकेशन DeepSeek के अगली पीढ़ी के V4 मॉडल के बारे में स्थानीय मीडिया की उम्मीदों से मिलते-जुलते थे। चीनी मीडिया आउटलेट्स ने बताया है कि यह मॉडल अप्रैल में ही लॉन्च हो सकता है।
Umur Ozkul, जो स्वतंत्र AI बेंचमार्क टेस्ट करते हैं, ने कहा कि जिस समय और क्षमताओं का दावा किया गया है, उसे देखते हुए इस मॉडल को DeepSeek से जोड़ने का अंदाज़ा लगाना समझ में आता है।
चुपके से टेस्टिंग
चुपके से मॉडल लॉन्च करना कोई नई बात नहीं है। OpenRouter जैसे प्लेटफ़ॉर्म डेवलपर्स को एक ही इंटरफ़ेस के ज़रिए दर्जनों AI मॉडलों को सवाल भेजने की सुविधा देते हैं। इस वजह से ये नए सिस्टम की टेस्टिंग के लिए एक लोकप्रिय जगह बन गए हैं।
फ़रवरी में OpenRouter पर Pony Alpha नाम का एक अनजान मॉडल सामने आया था। इसके पाँच दिन बाद ही चीनी कंपनी Zhipu AI ने पुष्टि की कि यह उसके GLM-5 सिस्टम का ही एक हिस्सा है।
Hunter Alpha के प्रोफ़ाइल पेज पर एक नोटिस में बताया गया था कि इस मॉडल के लिए दिए गए सभी प्रॉम्प्ट और पूरे किए गए काम "प्रोवाइडर द्वारा रिकॉर्ड किए जाते हैं और मॉडल को बेहतर बनाने के लिए इस्तेमाल किए जा सकते हैं।" यह बात इस पूरे इंडस्ट्री में अपनाए जाने वाले उस तरीके को दिखाती है, जिसमें बिना किसी पक्षपात के फ़ीडबैक पाने के लिए चुपके से मॉडल लॉन्च किए जाते हैं।
MiMo के मुताबिक, प्लेटफ़ॉर्म पर आने के बाद इस मॉडल को बहुत तेज़ी से अपनाया गया। इसका कुल इस्तेमाल एक ट्रिलियन टोकन से भी ज़्यादा हो गया और यह OpenRouter के लीडरबोर्ड चार्ट में सबसे ऊपर पहुँच गया।
Next Story