- Home
- /
- अन्य खबरें
- /
- सम्पादकीय
- /
- भाषा के भाग्य विधाता
अरिमर्दन कुमार त्रिपाठी: अभी हाल में गूगल ने चौबीस नई भाषाओं को अपनी मशीनी अनुवाद प्रणाली में जोड़ा, जिनमें देश की आठ भाषाएं- संस्कृत, भोजपुरी, डोगरी, असमिया, मिजो, कोंकणी, मैथिली और मणिपुरी शामिल हैं। जबकि इसमें पहले से बांग्ला, गुजराती, हिंदी, कन्नड़, मलयालम, मराठी, नेपाली, ओड़िया, पंजाबी, सिंधी, तमिल, तेलुगू और उर्दू जैसी भारतीय भाषाएं थीं।
इस प्रकार अब तक विश्व की कुल एक सौ तैंतीस भाषाओं के मध्य परस्पर मशीनी अनुवाद की व्यवस्था गूगल ने कर दी है, जो भारतीय सहित वैश्विक भाषाई अवरोध को पार करने की दृष्टि से एक बड़ी उपलब्धि है। गूगल अनुवाद एक ऐसे पुल की तरह है, जो ऐप के माध्यम से मोबाईल पर कार्य करने की अपनी सुविधा के कारण लोगों की जेब में हमेशा रहता है। हां, अनुवाद की गुणवत्ता का सवाल हमेशा प्रासंगिक रहता है और यहां भी है, लेकिन इन सबके बावजूद कई बहुसंख्यक भाषाओं में यह बढ़िया अनुवाद करने लगा है।
बहरहाल, गूगल से हाल की जुड़ी भाषाओं को देखने पर कई उत्साहजनक निष्कर्ष निकाले जा सकते हैं, जिनमें प्रमुख यह है कि भारतीय ज्ञान परंपरा की एक प्रतिनिधि भाषा संस्कृत में अभी तक सक्षम मशीनी अनुवाद प्रणाली नहीं थी और आज हम गूगल की शोध उपलब्धि को अपने माथे पर लगा कर गर्व महसूस कर रहे हैं, दूसरा यह कि इनमें भोजपुरी जैसी भाषा भी है, जिसे देश के संविधान की आठवीं अनुसूची में शामिल कराने के लिए एक समांतर आंदोलन चलता रहता है।
सरकार ने तो इधर नहीं देखा, पर संख्या बल के महत्त्व को स्वीकार करते हुए गूगल यानी बाजार ने भोजपुरी को अपना संरक्षण प्रदान कर दिया है। इन भाषाओं में मिजो और कोंकणी जैसी भाषाएं भी हैं, जिन्हें बोलने वालों की संख्या तुलनात्मक रूप से बहुत कम है और देश में संख्या बल के अधिक्रम में ये बहुत नीचे आती हैं। ऐसे में, अब निश्चित रूप से अल्पसंख्यक भाषा-भाषियों को भी उम्मीद सीधे गूगल से ही करनी चाहिए कि उनकी भाषाओं को इस सूची में जोड़ा जाएगा।
ऐसी उम्मीद का एक बड़ा आधार यह भी है कि वर्तमान शोध प्रक्रिया में गूगल जिस तकनीक का उपयोग कर रहा है, उसमें वह 'जीरो शाट' पद्धति का इस्तेमाल किया गया है, जिसमें एक भाषी कार्पस अर्थात 'डिजिटल टेक्स्ट' से भी कृत्रिम मेधा के आधार पर एल्गोरिथ्म का विकास किया गया है, जबकि गूगल का शुरुआती शोध द्विभाषी यानी समांतर कार्पस के मुक्त दोहन और अकूत संग्रह के आधार पर केंद्रित था।
जाहिर है, यह भाषाई डेटा गूगल मुफ्त में लोगों की रचनात्मक गतिविधियों से चुरा कर लेता है। हालांकि यहां सकारात्मक रूप में इसको इस तरह से भी देखा जाना चाहिए कि कोई अल्पसंख्यक भाषा-भाषी, जब अपनी भाषा के माध्यम से इंटरनेट की दुनिया में जितना अधिक सक्रिय रहेगा, उतना ही अधिक संभावना है कि गूगल उनकी भाषाओं की भी सुध ले और उनको भी प्रौद्योगिकीय मंचों पर मुख्य धारा की भाषाओं के साथ खड़ा करे। निश्चित रूप से इन सबके बीच उसका अपना हित तो है ही।
खैर यह सब देखते हुए 2010-12 के दौरान की कुछ घटनाएं याद आ रहीं हैं, जिसमें एक दिवंगत शिक्षक, जो देश में मशीनी अनुवाद के पुरोधाओं में से एक थे, के अपने अनुभव भी हैं। वे उन दिनों भारत सरकार के लिए काम रहे थे और अपने शोध की तमाम उपलब्धियों के बावजूद कई बार नौकरशाही को लेकर हताश दिखते थे, जिसमें नौकरशाही उनके प्रयास से विकसित हो रहे मशीनी अनुवाद प्रणाली की गूगल से तुलना करती थी, जबकि दोनों के सामर्थ्य, संसाधन और कार्य-पद्धति में कोई तुलना संभव ही नहीं था।
देश में मशीनी अनुवाद का यह वही दौर था, जब नियम आधारित प्रणाली अपने चरम पर थी और गूगल की सांख्यिकीय पद्धति अपनी प्रारंभिक अवस्था में थी। यानी किसी नदी पर एक-एक र्इंट जोड़ कर पुल बनाने का काम देश में हो रहा था, जो तत्कालीन परिस्थितियों में सफल भी था, जबकि गूगल की पद्धति उसी पुल को जेसीबी मशीन से रातों-रात बनाने जैसा है।
देश में मशीनी अनुवाद के शोध का यह कशमकश चल ही रहा था कि 2012 में भारत सरकार के इन कार्यों से जुड़े एक शीर्ष अधिकारी ने व्यक्तिगत बातचीत में बताया कि 'नहीं, अब हम लोग मशीनी अनुवाद के लिए कुछ नहीं करेंगे, क्योंकि गूगल कर रहा है।' ऐसे में, जब आज हम गूगल के इन प्रयासों को देख रहे हैं, तो यह भी समझ में आ रहा है कि गूगल की इन उपलब्धियों में देश की सरकारों का भी उतना ही सहयोग है, वह चाहे अज्ञानता या अकर्मण्यता के कारण हो या दूरदृष्टि के अभाव में। प्रकारांतर से सरकारी नीतिगत रिक्तता के कारण ही गूगल ने हमारे इंटरनेट डेटा का मुक्त दोहन किया है और आज उससे उत्पाद बना कर हमें ही परोस रहा है और विकल्पहीन परिस्थितियों में हमारे पास जश्न मनाने के अलावा कोई दूसरा काम भी नहीं है।