तेलंगाना

IIIT-हैदराबाद ने भारत का पहला एआई-आधारित आदिवासी भाषा अनुवादक विकसित किया

Payal
4 Sept 2025 7:31 PM IST
IIIT-हैदराबाद ने भारत का पहला एआई-आधारित आदिवासी भाषा अनुवादक विकसित किया
x
Hyderabad.हैदराबाद: अंतर्राष्ट्रीय सूचना प्रौद्योगिकी संस्थान (IIIT) - हैदराबाद ने आदिवासी भाषाओं के लिए अपनी तरह का पहला कृत्रिम बुद्धिमत्ता (AI)-संचालित अनुवादक 'आदि वाणी' विकसित करने में महत्वपूर्ण भूमिका निभाई है, जिसे हाल ही में केंद्र सरकार द्वारा लॉन्च किया गया है। यह अनुवादक, जो एक समर्पित वेब प्लेटफ़ॉर्म के अलावा गूगल प्ले पर भी उपलब्ध है, संताली, भीली, मुंडारी और गोंडी भाषाओं का समर्थन करता है। कुई और गारो जैसी और भाषाएँ जल्द ही इसमें जोड़ी जाएँगी। इस अनुवादक के विकास का उद्देश्य आदिवासी और गैर-आदिवासी समुदायों के बीच संवाद की खाई को पाटना और लुप्तप्राय भाषाओं की रक्षा करना है। IIT दिल्ली के नेतृत्व में प्रमुख संस्थानों के एक संघ द्वारा विकसित, जिसमें IIIT हैदराबाद, बिट्स पिलानी और IIIT नया रायपुर शामिल हैं, झारखंड, ओडिशा, मध्य प्रदेश, छत्तीसगढ़ और मेघालय के आदिवासी अनुसंधान संस्थानों
(TRI)
के सहयोग से विकसित किया गया है। यह प्लेटफ़ॉर्म हिंदी/अंग्रेजी और आदिवासी भाषाओं के बीच पाठ और भाषण दोनों का रीयल-टाइम अनुवाद सक्षम बनाता है। इसके अलावा, 'आदि वाणी' ऑप्टिकल कैरेक्टर रिकग्निशन तकनीक के माध्यम से लोककथाओं, मौखिक परंपराओं और सांस्कृतिक विरासत के संरक्षण में मदद करती है। यह सरकारी योजनाओं और अन्य महत्वपूर्ण पहलों के बारे में जागरूकता फैलाकर आदिवासी समुदायों में नागरिक समावेशन को बढ़ावा दे सकती है।
2011 की जनगणना के अनुसार, भारत में 461 आदिवासी भाषाएँ और 71 विशिष्ट आदिवासी मातृभाषाएँ हैं। इनमें से 81 संवेदनशील और 42 गंभीर रूप से संकटग्रस्त हैं। सीमित दस्तावेज़ीकरण और पीढ़ी दर पीढ़ी संचरण अंतराल के कारण ये भाषाएँ विलुप्त होने के खतरे का सामना कर रही हैं। भाषा प्रौद्योगिकी अनुसंधान केंद्र, आईआईआईटी-हैदराबाद की सबसे पुरानी प्रयोगशाला में वाक् और प्राकृतिक भाषा प्रसंस्करण समूहों ने अंग्रेजी से संताली, हिंदी से संताली और हिंदी से संताली की 4 मशीनी अनुवाद प्रणालियों के लिए ट्रांसफॉर्मर-आधारित अनुक्रम-से-अनुक्रम (seq2seq) आर्किटेक्चर का उपयोग किया। “यह न्यूरल मशीन ट्रांसलेशन (एनएमटी) में अत्याधुनिक दृष्टिकोण बन गया है। समानांतर कॉर्पस का निर्माण आदिवासी अनुसंधान संस्थान, ओडिशा की मदद से किया गया था। आधार मॉडल तैयार होने के बाद, अतिरिक्त डेटा तैयार किया गया और संताली मूल भाषियों द्वारा पोस्ट-एडिट किया गया, जिससे सिस्टम को बेहतर बनाने में मदद मिली,” आईआईआईटी-हैदराबाद की प्रोफ़ेसर राधिका ममीदी ने कहा। शोधकर्ताओं ने संताली, मुंडारी और भीली भाषाओं के लिए एक टेक्स्ट-टू-स्पीच (टीटीएस) टूल भी विकसित किया है। गोंडी के लिए टीटीएस टूल अभी विकास के चरण में है। टीटीएस टूल बनाने वाली शोधार्थी अनिंदिता मंडल ने मूल भाषियों के साथ मिलकर काम किया और उन्होंने आईआईआईटी-हैदराबाद में स्पीच डेटा रिकॉर्ड करने में काफ़ी समय बिताया।
Next Story