भाषा के भाग्य विधाता

Breaking

Home
/
अन्य खबरें
/
सम्पादकीय
/
भाषा के भाग्य विधाता

अभी हाल में गूगल ने चौबीस नई भाषाओं को अपनी मशीनी अनुवाद प्रणाली में जोड़ा, जिनमें देश की आठ भाषाएं- संस्कृत, भोजपुरी, डोगरी, असमिया, मिजो, कोंकणी, मैथिली और मणिपुरी शामिल हैं।

अरिमर्दन कुमार त्रिपाठी: अभी हाल में गूगल ने चौबीस नई भाषाओं को अपनी मशीनी अनुवाद प्रणाली में जोड़ा, जिनमें देश की आठ भाषाएं- संस्कृत, भोजपुरी, डोगरी, असमिया, मिजो, कोंकणी, मैथिली और मणिपुरी शामिल हैं। जबकि इसमें पहले से बांग्ला, गुजराती, हिंदी, कन्नड़, मलयालम, मराठी, नेपाली, ओड़िया, पंजाबी, सिंधी, तमिल, तेलुगू और उर्दू जैसी भारतीय भाषाएं थीं।

इस प्रकार अब तक विश्व की कुल एक सौ तैंतीस भाषाओं के मध्य परस्पर मशीनी अनुवाद की व्यवस्था गूगल ने कर दी है, जो भारतीय सहित वैश्विक भाषाई अवरोध को पार करने की दृष्टि से एक बड़ी उपलब्धि है। गूगल अनुवाद एक ऐसे पुल की तरह है, जो ऐप के माध्यम से मोबाईल पर कार्य करने की अपनी सुविधा के कारण लोगों की जेब में हमेशा रहता है। हां, अनुवाद की गुणवत्ता का सवाल हमेशा प्रासंगिक रहता है और यहां भी है, लेकिन इन सबके बावजूद कई बहुसंख्यक भाषाओं में यह बढ़िया अनुवाद करने लगा है।

बहरहाल, गूगल से हाल की जुड़ी भाषाओं को देखने पर कई उत्साहजनक निष्कर्ष निकाले जा सकते हैं, जिनमें प्रमुख यह है कि भारतीय ज्ञान परंपरा की एक प्रतिनिधि भाषा संस्कृत में अभी तक सक्षम मशीनी अनुवाद प्रणाली नहीं थी और आज हम गूगल की शोध उपलब्धि को अपने माथे पर लगा कर गर्व महसूस कर रहे हैं, दूसरा यह कि इनमें भोजपुरी जैसी भाषा भी है, जिसे देश के संविधान की आठवीं अनुसूची में शामिल कराने के लिए एक समांतर आंदोलन चलता रहता है।

सरकार ने तो इधर नहीं देखा, पर संख्या बल के महत्त्व को स्वीकार करते हुए गूगल यानी बाजार ने भोजपुरी को अपना संरक्षण प्रदान कर दिया है। इन भाषाओं में मिजो और कोंकणी जैसी भाषाएं भी हैं, जिन्हें बोलने वालों की संख्या तुलनात्मक रूप से बहुत कम है और देश में संख्या बल के अधिक्रम में ये बहुत नीचे आती हैं। ऐसे में, अब निश्चित रूप से अल्पसंख्यक भाषा-भाषियों को भी उम्मीद सीधे गूगल से ही करनी चाहिए कि उनकी भाषाओं को इस सूची में जोड़ा जाएगा।

ऐसी उम्मीद का एक बड़ा आधार यह भी है कि वर्तमान शोध प्रक्रिया में गूगल जिस तकनीक का उपयोग कर रहा है, उसमें वह 'जीरो शाट' पद्धति का इस्तेमाल किया गया है, जिसमें एक भाषी कार्पस अर्थात 'डिजिटल टेक्स्ट' से भी कृत्रिम मेधा के आधार पर एल्गोरिथ्म का विकास किया गया है, जबकि गूगल का शुरुआती शोध द्विभाषी यानी समांतर कार्पस के मुक्त दोहन और अकूत संग्रह के आधार पर केंद्रित था।

जाहिर है, यह भाषाई डेटा गूगल मुफ्त में लोगों की रचनात्मक गतिविधियों से चुरा कर लेता है। हालांकि यहां सकारात्मक रूप में इसको इस तरह से भी देखा जाना चाहिए कि कोई अल्पसंख्यक भाषा-भाषी, जब अपनी भाषा के माध्यम से इंटरनेट की दुनिया में जितना अधिक सक्रिय रहेगा, उतना ही अधिक संभावना है कि गूगल उनकी भाषाओं की भी सुध ले और उनको भी प्रौद्योगिकीय मंचों पर मुख्य धारा की भाषाओं के साथ खड़ा करे। निश्चित रूप से इन सबके बीच उसका अपना हित तो है ही।

खैर यह सब देखते हुए 2010-12 के दौरान की कुछ घटनाएं याद आ रहीं हैं, जिसमें एक दिवंगत शिक्षक, जो देश में मशीनी अनुवाद के पुरोधाओं में से एक थे, के अपने अनुभव भी हैं। वे उन दिनों भारत सरकार के लिए काम रहे थे और अपने शोध की तमाम उपलब्धियों के बावजूद कई बार नौकरशाही को लेकर हताश दिखते थे, जिसमें नौकरशाही उनके प्रयास से विकसित हो रहे मशीनी अनुवाद प्रणाली की गूगल से तुलना करती थी, जबकि दोनों के सामर्थ्य, संसाधन और कार्य-पद्धति में कोई तुलना संभव ही नहीं था।

देश में मशीनी अनुवाद का यह वही दौर था, जब नियम आधारित प्रणाली अपने चरम पर थी और गूगल की सांख्यिकीय पद्धति अपनी प्रारंभिक अवस्था में थी। यानी किसी नदी पर एक-एक र्इंट जोड़ कर पुल बनाने का काम देश में हो रहा था, जो तत्कालीन परिस्थितियों में सफल भी था, जबकि गूगल की पद्धति उसी पुल को जेसीबी मशीन से रातों-रात बनाने जैसा है।

देश में मशीनी अनुवाद के शोध का यह कशमकश चल ही रहा था कि 2012 में भारत सरकार के इन कार्यों से जुड़े एक शीर्ष अधिकारी ने व्यक्तिगत बातचीत में बताया कि 'नहीं, अब हम लोग मशीनी अनुवाद के लिए कुछ नहीं करेंगे, क्योंकि गूगल कर रहा है।' ऐसे में, जब आज हम गूगल के इन प्रयासों को देख रहे हैं, तो यह भी समझ में आ रहा है कि गूगल की इन उपलब्धियों में देश की सरकारों का भी उतना ही सहयोग है, वह चाहे अज्ञानता या अकर्मण्यता के कारण हो या दूरदृष्टि के अभाव में। प्रकारांतर से सरकारी नीतिगत रिक्तता के कारण ही गूगल ने हमारे इंटरनेट डेटा का मुक्त दोहन किया है और आज उससे उत्पाद बना कर हमें ही परोस रहा है और विकल्पहीन परिस्थितियों में हमारे पास जश्न मनाने के अलावा कोई दूसरा काम भी नहीं है।

TagsMore recently Google has added twenty-four new languages to its machine translation system in which the country's eight languages- Sanskrit

Breaking

Subhi

छत्तीसगढ़

विश्व

Breaking

भाषा के भाग्य विधाता

Subhi

छत्तीसगढ़

विश्व

Follow us On: