यिसी रेड्स टेक के साथ लीपफ्रॉग डिजिटल डिवाइड की योजना

Update: 2023-05-01 08:24 GMT
भारतीय विज्ञान संस्थान (IISc) के शोधकर्ता 2023 के अंत तक भारत की डिजिटल महत्वाकांक्षाओं को और अधिक समावेशी बनाने के उद्देश्य से टेक्स्ट-टू-स्पीच (TTS) संश्लेषण प्रणाली जारी करने की योजना बना रहे हैं।
SYSPIN (सिंथेसाइजिंग स्पीच इन इंडियन लैंग्वेजेस) टेक्स्ट को नौ भारतीय भाषाओं में संबंधित आवाजों में परिवर्तित करता है और इन डेटासेट को प्रकाशित करता है। डेटासेट नवोन्मेषकों के लिए एक खुले संसाधन के रूप में दोगुना हो जाता है, जिससे उन्हें वित्त और कृषि में आर्टिफिशियल इंटेलिजेंस-संचालित आवाज-आधारित सेवाओं को विकसित करने के लिए प्रोत्साहित किया जाता है।
IISc द्वारा प्रवर्तित ARTPARK के साथ साझेदारी में कार्यान्वित, SYSPIN एक संभावित गेम चेंजर हो सकता है क्योंकि यह प्रौद्योगिकी-सक्षम सेवाओं को इन भाषाओं को बोलने वाले लगभग 602 मिलियन लोगों के करीब ला सकता है।
परियोजना अन्वेषक प्रशांत कुमार घोष ने कहा कि बंगाली, हिंदी, कन्नड़, मराठी और तेलुगु में डेटासेट और मॉडल संकलित किए गए हैं और परियोजना को साल के अंत तक पूरा करने के लिए निर्धारित किया गया है।
शोधकर्ताओं ने कहा कि तकनीकी विशेषज्ञता और ओपन वॉयस डेटा की अनुपलब्धता ने कम संसाधनों वाली भारतीय भाषाओं में एआई-संचालित भाषण प्रौद्योगिकियों की संभावनाओं को बाधित किया है। कार्यक्रम में भोजपुरी, छत्तीसगढ़ी, मगधी और मैथिली अन्य भाषाएं हैं। अपने विस्तारित दौर में, SYSPIN शिक्षा, ई-गतिशीलता और स्वास्थ्य सेवा सहित अधिक क्षेत्रों को कवर करते हुए कई भारतीय भाषाओं में TTS को सक्षम कर सकता है।
सामाजिक-आर्थिक पिछड़ेपन और कम साक्षरता ने भारत की आबादी के बड़े हिस्से को डिजिटल नवाचारों तक सीमित पहुंच के साथ छोड़ दिया है।
SYSPIN के लिए एक प्रचार वीडियो दिखाता है कि कैसे एक टीटीएस-आधारित फोन एप्लिकेशन एक अनपढ़ आदमी को अपनी बेटी के लिए स्कूलों के बारे में जानकारी खोजने में मदद करता है, जो उसे मैथिली में पढ़कर सुनाया जाता है, जो बिहार में बोली जाने वाली भाषाओं में से एक है।
"लक्ष्य वॉयस-आधारित इंटरफेस को सक्षम करना है जो उन लोगों की भी मदद करता है जो पढ़ नहीं सकते हैं। प्रति भाषा लगभग 80 घंटे का टीटीएस डेटा, एक पुरुष और एक महिला की आवाज में, और संबंधित कंप्यूटर प्रोग्राम विकसित किए जा रहे हैं। पूरा काम डाला जा रहा है। चुनौतियों में उपयोग करने के लिए (प्रतियोगिताएं जहां प्रतिभागी प्रकाशित वॉयस डेटा के आधार पर टीटीएस सिस्टम का निर्माण करते हैं), “आईआईएससी के इलेक्ट्रिकल इंजीनियरिंग विभाग के एक एसोसिएट प्रोफेसर घोष ने डीएच को बताया।
टीम दो डोमेन के लिए प्रासंगिक टेक्स्ट डिज़ाइन करती है, विषयों और वक्ताओं की पहचान करती है, डेटा एकत्र करती है और मान्य करती है, और फिर, इसे ओपन-सोर्स करती है।
पाठ सामान्यीकरण जिसमें प्रतीकों, संख्याओं और संक्षिप्ताक्षरों का संदर्भ-विशिष्ट भाषण में रूपांतरण शामिल है, टीटीएस सिस्टम के लिए महत्वपूर्ण है।
टीटीएस कॉर्पस का आकार भारतीय भाषाओं में किसी भी मौजूदा कॉर्पस की तुलना में "कई गुना बड़ा" होने की उम्मीद है। घोष ने कहा कि टीटीएस डेटा की ओपन-सोर्सिंग इसे शोधकर्ताओं, प्रौद्योगिकी नवोन्मेषकों, सामाजिक उद्यमियों और स्टार्टअप्स के लिए एप्लिकेशन-विशिष्ट मॉडल विकसित करने के लिए सुलभ बनाती है।
Tags:    

Similar News

-->