व्यापार

AI Summit 2026: दिल्ली में पेश किए गए 3 सॉवरेन AI LLM मॉडल्स से मिलें

nidhi
20 Feb 2026 9:49 AM IST
AI Summit 2026: दिल्ली में पेश किए गए 3 सॉवरेन AI LLM मॉडल्स से मिलें
x
दिल्ली में पेश
AI इम्पैक्ट समिट कई वजहों से सुर्खियों में रहा है। चाहे चीनी रोबोडॉग्स को गलत तरीके से हमारा अपना कहा जाना हो, या टेक लीडर्स का स्टेज पर हाथ पकड़कर अजीब व्यवहार करना हो। हालांकि, कुछ घोषणाएं ऐसी भी थीं जिन पर हमें ध्यान देने की ज़रूरत है। उदाहरण के लिए, भारत ने तीन मेड-इन-इंडिया सॉवरेन AI LLM मॉडल लॉन्च किए, जिन्हें दुनिया के सामने गर्व से दिखाया गया। ये तीन मॉडल भारत की कंपनियों सर्वम AI, ज्ञानी AI और भारतजेन ने बनाए हैं।
तीनों मॉडल - सर्वम AI के ट्विन LLM, ज्ञानी.ai का वचना वॉइस स्टैक, और भारतजेन का परम2, इंडियाAI मिशन के प्रोडक्ट हैं, जो 2024 में 10,000 करोड़ रुपये से ज़्यादा के बजट के साथ शुरू की गई एक सरकारी पहल है। इसका मकसद भारत के 22 तय भाषाएं बोलने वाले 1.4 बिलियन लोगों को AI टूल्स देना, कम बैंडविड्थ वाले गांवों में स्मार्टफोन ले जाना और सरकारी सेवाओं के साथ ऐसे तरीकों से बातचीत करना था, जिन्हें समझने के लिए चैटGPT को कभी ट्रेन नहीं किया गया।
गूगल के CEO सुंदर पिचाई, जो ऑडियंस में थे, ने सीधे शब्दों में कहा, "भारत में मुझे जो डेवलपर एनर्जी मिलती है, वह किसी से कम नहीं है। आप जिस बारे में बात कर रहे हैं, वह असल में हो रहा है। भारत बहुत अच्छी स्थिति में है।"
आइए, हर सॉवरेन LLM के बारे में जानें कि वे क्या देते हैं:
1. सर्वम AI
तीनों लॉन्च में से, सर्वम AI की घोषणा शायद सबसे ज़्यादा देखी गई। बेंगलुरु के इस स्टार्टअप को भारत सरकार ने अप्रैल 2025 में 67 कंपनियों की शॉर्टलिस्ट में से चुना था ताकि IndiaAI मिशन के तहत देश का पहला स्वदेशी फाउंडेशनल LLM बनाया जा सके। समिट में, इसने अपना वादा पूरा किया।
सर्वम ने एक साथ दो मॉडल पेश किए - एक 30-बिलियन-पैरामीटर मॉडल जिसका नाम विक्रम (स्पेस पायनियर विक्रम साराभाई के नाम पर) है, जिसे 32,000-टोकन कॉन्टेक्स्ट विंडो के साथ रियल-टाइम बातचीत के लिए बनाया गया है, और एक 105-बिलियन-पैरामीटर मॉडल जो 128,000-टोकन विंडो के साथ भारी, ज़्यादा मुश्किल रीज़निंग टास्क के लिए बनाया गया है। दोनों को पूरी तरह से भारत में ट्रेन किया गया था, ये अमेरिकी या चीनी मॉडल का फ़ाइन-ट्यून किया हुआ रूप नहीं थे, बल्कि घरेलू इंफ़्रास्ट्रक्चर का इस्तेमाल करके सॉवरेन कंप्यूट पर शुरू से बनाए गए थे, और भारतीय भाषा के डेटा से भरे हुए थे।
लॉन्च के समय दिखाए गए बेंचमार्क ने मॉडल्स को मैथमेटिकल रीजनिंग, कोडिंग एक्यूरेसी और आम प्रॉब्लम-सॉल्विंग जैसे कामों में Gemma 27B, Mistral-32-24B, Nemotron-30B, Qwen-30B, और GPT-OSS-20B के मुकाबले में रखा। Sarvam के को-फ़ाउंडर विवेक राघवन ने प्रोजेक्ट की फ़िलॉसफ़ी को समझाया, "AI में सॉवरेनिटी सबसे बड़े मॉडल बनाने से कहीं ज़्यादा मायने रखती है।"
ये मॉडल तीन वेरिएंट में आते हैं जिन्हें बड़े सॉवरेन LLM रोडमैप के तहत डेवलप किया जा रहा है। एडवांस्ड रीजनिंग और जेनरेशन के लिए Sarvam-Large, रियल-टाइम इंटरैक्टिव एप्लिकेशन्स के लिए Sarvam-Small, और Sarvam-Edge, जो शायद सबसे खास है, जो पूरी तरह से बिना इंटरनेट कनेक्टिविटी के कंज्यूमर डिवाइस पर चलता है। ऐसे देश के लिए जहां शहरी सेंटर्स के बाहर कनेक्टिविटी अभी भी बहुत कम है, एक AI जो हिंदी, कन्नड़, तेलुगु या गुजराती में ऑफ़लाइन काम करता है, कोई लग्ज़री नहीं है। यह इंफ्रास्ट्रक्चर है।
इसे कैसे एक्सेस करें: सर्वम के मॉडल्स API के ज़रिए sarvam.ai पर उपलब्ध हैं, जिसमें टेस्टिंग के लिए एक डेवलपर प्लेग्राउंड है। सॉवरेन LLM स्टैक को सरकारी पार्टनरशिप के ज़रिए भी डिप्लॉय किया जा रहा है, जिसमें वॉयस-बेस्ड सिटिज़न सर्विसेज़ के लिए UIDAI (आधार) शामिल है।
2. Gnani.ai
अगर सर्वम भारत का दिमाग बना रहा है, तो Gnani.ai इसकी आवाज़ बना रहा है। बेंगलुरु की यह कन्वर्सेशनल AI कंपनी - जो इस समिट से पहले ही एक दिन में 10 मिलियन कॉल्स प्रोसेस कर रही थी - एक ऐसा सिस्टम लेकर आई है जो 10 सेकंड से भी कम ऑडियो का इस्तेमाल करके 12 भारतीय भाषाओं में इंसानी आवाज़ को क्लोन कर सकता है।
इस प्रोडक्ट का नाम वचन TTS (टेक्स्ट-टू-स्पीच) है, और यह उस तरह की टेक्नोलॉजी है जो 'एक्सेसिबल AI' का असल में मतलब बताती है। इसे एक छोटा ऑडियो सैंपल दें - एक सरकारी अधिकारी का रिकॉर्ड किया गया अभिवादन, एक टीचर की आवाज़, एक हेल्थकेयर वर्कर का परिचय - और वचना उस आवाज़ की पिच, लय और बोलने के स्टाइल को क्लोन करता है, फिर इसे हर उस भाषा में इस्तेमाल करता है जिसे यह सपोर्ट करता है, बिना आवाज़ की पहचान खोए। एक डिस्ट्रिक्ट कलेक्टर हिंदी, तमिल और ओडिया में इमरजेंसी अलर्ट दे सकता है, सभी अपनी आवाज़ में, हर एक को अलग से रिकॉर्ड किए बिना।
सपोर्टेड भाषाएँ पूरे भारत में फैली हुई हैं - हिंदी, बंगाली, तमिल, तेलुगु, कन्नड़, मलयालम, गुजराती, मराठी, पंजाबी, ओडिया, असमिया और इंडियन इंग्लिश। मॉडल 4.23 का मीन ओपिनियन स्कोर और 0.6 प्रतिशत से कम कैरेक्टर एरर रेट हासिल करता है, ये नंबर इसे पूरी तरह से ह्यूमन-क्वालिटी टेरिटरी में रखते हैं। टाटा ग्रुप और एयर इंडिया जैसे क्लाइंट इसे पहले से ही इस्तेमाल कर रहे हैं।
TTS के साथ, Gnani.ai ने वचना STT (स्पीच-टू-टेक्स्ट) भी लॉन्च किया, जिसे 1,000 से ज़्यादा डोमेन पर दस लाख घंटे से ज़्यादा रियल-वर्ल्ड ऑडियो पर ट्रेन किया गया है। यह भारत की खराब ऑडियो असलियत, शोर वाले कॉल सेंटर, कम्प्रेस्ड टेलीफोनी, इलाके के लहजे और कोड-मिक्स्ड स्पीच (रोज़मर्रा की इंग्लिश और लोकल भाषाओं का मेल) को हैंडल करता है - बिना किसी डोमेन-स्पेसिफिक फाइन-ट्यूनिंग के। हिंदी और इंडियन इंग्लिश के लिए वर्ड एरर रेट 5 परसेंट से कम है, और ज़्यादातर दूसरी सपोर्टेड भाषाओं के लिए 10 परसेंट से कम है।
इसके इस्तेमाल के मामले बहुत बड़े हैं - पब्लिक अनाउंसमेंट, इमरजेंसी अलर्ट, एजुकेशनल कॉन्टेंट
Next Story