तेलंगाना

IIIT-हैदराबाद ने भारत का पहला एआई-आधारित आदिवासी भाषा अनुवादक विकसित किया

Ratna Netam
4 Sept 2025 7:31 PM IST
IIIT-हैदराबाद ने भारत का पहला एआई-आधारित आदिवासी भाषा अनुवादक विकसित किया
x
Hyderabad.हैदराबाद: अंतर्राष्ट्रीय सूचना प्रौद्योगिकी संस्थान (IIIT) - हैदराबाद ने आदिवासी भाषाओं के लिए अपनी तरह का पहला कृत्रिम बुद्धिमत्ता (AI)-संचालित अनुवादक 'आदि वाणी' विकसित करने में महत्वपूर्ण भूमिका निभाई है, जिसे हाल ही में केंद्र सरकार द्वारा लॉन्च किया गया है। यह अनुवादक, जो एक समर्पित वेब प्लेटफ़ॉर्म के अलावा गूगल प्ले पर भी उपलब्ध है, संताली, भीली, मुंडारी और गोंडी भाषाओं का समर्थन करता है। कुई और गारो जैसी और भाषाएँ जल्द ही इसमें जोड़ी जाएँगी। इस अनुवादक के विकास का उद्देश्य आदिवासी और गैर-आदिवासी समुदायों के बीच संवाद की खाई को पाटना और लुप्तप्राय भाषाओं की रक्षा करना है। IIT दिल्ली के नेतृत्व में प्रमुख संस्थानों के एक संघ द्वारा विकसित, जिसमें IIIT हैदराबाद, बिट्स पिलानी और IIIT नया रायपुर शामिल हैं, झारखंड, ओडिशा, मध्य प्रदेश, छत्तीसगढ़ और मेघालय के आदिवासी अनुसंधान संस्थानों
(TRI)
के सहयोग से विकसित किया गया है। यह प्लेटफ़ॉर्म हिंदी/अंग्रेजी और आदिवासी भाषाओं के बीच पाठ और भाषण दोनों का रीयल-टाइम अनुवाद सक्षम बनाता है। इसके अलावा, 'आदि वाणी' ऑप्टिकल कैरेक्टर रिकग्निशन तकनीक के माध्यम से लोककथाओं, मौखिक परंपराओं और सांस्कृतिक विरासत के संरक्षण में मदद करती है। यह सरकारी योजनाओं और अन्य महत्वपूर्ण पहलों के बारे में जागरूकता फैलाकर आदिवासी समुदायों में नागरिक समावेशन को बढ़ावा दे सकती है।
2011 की जनगणना के अनुसार, भारत में 461 आदिवासी भाषाएँ और 71 विशिष्ट आदिवासी मातृभाषाएँ हैं। इनमें से 81 संवेदनशील और 42 गंभीर रूप से संकटग्रस्त हैं। सीमित दस्तावेज़ीकरण और पीढ़ी दर पीढ़ी संचरण अंतराल के कारण ये भाषाएँ विलुप्त होने के खतरे का सामना कर रही हैं। भाषा प्रौद्योगिकी अनुसंधान केंद्र, आईआईआईटी-हैदराबाद की सबसे पुरानी प्रयोगशाला में वाक् और प्राकृतिक भाषा प्रसंस्करण समूहों ने अंग्रेजी से संताली, हिंदी से संताली और हिंदी से संताली की 4 मशीनी अनुवाद प्रणालियों के लिए ट्रांसफॉर्मर-आधारित अनुक्रम-से-अनुक्रम (seq2seq) आर्किटेक्चर का उपयोग किया। “यह न्यूरल मशीन ट्रांसलेशन (एनएमटी) में अत्याधुनिक दृष्टिकोण बन गया है। समानांतर कॉर्पस का निर्माण आदिवासी अनुसंधान संस्थान, ओडिशा की मदद से किया गया था। आधार मॉडल तैयार होने के बाद, अतिरिक्त डेटा तैयार किया गया और संताली मूल भाषियों द्वारा पोस्ट-एडिट किया गया, जिससे सिस्टम को बेहतर बनाने में मदद मिली,” आईआईआईटी-हैदराबाद की प्रोफ़ेसर राधिका ममीदी ने कहा। शोधकर्ताओं ने संताली, मुंडारी और भीली भाषाओं के लिए एक टेक्स्ट-टू-स्पीच (टीटीएस) टूल भी विकसित किया है। गोंडी के लिए टीटीएस टूल अभी विकास के चरण में है। टीटीएस टूल बनाने वाली शोधार्थी अनिंदिता मंडल ने मूल भाषियों के साथ मिलकर काम किया और उन्होंने आईआईआईटी-हैदराबाद में स्पीच डेटा रिकॉर्ड करने में काफ़ी समय बिताया।
Next Story