NIT Rourkela ने डीप लर्निंग मॉडल का उपयोग करके अत्याधुनिक यातायात प्रबंधन समाधान विकसित किया
Rourkela राउरकेला: राष्ट्रीय प्रौद्योगिकी संस्थान (एनआईटी), राउरकेला के शोधकर्ताओं ने विकासशील देशों में यातायात प्रबंधन में सुधार के उद्देश्य से एक एआई-आधारित मल्टी-क्लास व्हीकल डिटेक्शन (एमसीवीडी) मॉडल और एक लाइट फ्यूजन बाई-डायरेक्शनल फीचर पिरामिड नेटवर्क (एलएफबीएफपीएन) टूल विकसित किया है। इलेक्ट्रॉनिक्स और संचार इंजीनियरिंग विभाग (ईसीई) के एसोसिएट प्रोफेसर संतोस कुमार दास के नेतृत्व में, शोध दल ने एक इंटेलिजेंट व्हीकल डिटेक्शन (आईवीडी) सिस्टम का लाभ उठाया है, जो छवियों और वीडियो में वाहनों की पहचान करने के लिए कंप्यूटर विज़न का उपयोग करता है। यह सिस्टम ट्रैफ़िक प्रवाह को अनुकूलित करने, भीड़भाड़ को कम करने और भविष्य की सड़क योजना में सहायता करने के लिए वास्तविक समय के ट्रैफ़िक डेटा को एकत्र करता है। इस शोध के निष्कर्ष प्रतिष्ठित पत्रिका IEEE ट्रांजेक्शन ऑन इंटेलिजेंट ट्रांसपोर्टेशन सिस्टम में प्रकाशित हुए हैं। दास के अनुसार, संगठित ट्रैफ़िक वाले विकसित देशों में IVD सिस्टम अच्छा प्रदर्शन करते हैं, लेकिन मिश्रित ट्रैफ़िक वाले विकासशील देशों में उन्हें चुनौतियों का सामना करना पड़ता है। भारत जैसे देशों में, कारों और ट्रकों से लेकर साइकिल, रिक्शा, पशु गाड़ियाँ और पैदल यात्री तक कई तरह के वाहन अक्सर एक-दूसरे के बहुत करीब होते हैं, जिससे वाहनों का सटीक पता लगाना मुश्किल हो जाता है।
“रडार और लाइट डिटेक्शन एंड रेंजिंग (LiDAR) जैसे सेंसर सिस्टम सहित पारंपरिक IVD विधियाँ नियंत्रित वातावरण में प्रभावी हैं, लेकिन धूल या बारिश जैसी प्रतिकूल मौसम स्थितियों में संघर्ष करती हैं। इसके अलावा, इन प्रणालियों को स्थापित करना महंगा है। वीडियो-आधारित सिस्टम विशेष रूप से भारत के लिए अधिक आशाजनक हैं, लेकिन पारंपरिक वीडियो प्रोसेसिंग तकनीक तेज़ गति वाले ट्रैफ़िक के साथ संघर्ष करती हैं और महत्वपूर्ण कम्प्यूटेशनल शक्ति की मांग करती हैं,” उन्होंने कहा। “डीप लर्निंग (DL) मॉडल, एक प्रकार का आर्टिफिशियल इंटेलिजेंस (AI) जो मौजूदा डेटा से सीखता है, वीडियो फ़ीड में वाहनों का पता लगाने का एक कुशल तरीका प्रदान करता है। ये मॉडल ट्रैफ़िक छवियों की पहचान करने और उनका विश्लेषण करने के लिए कन्वोल्यूशनल न्यूरल नेटवर्क (CNN) का उपयोग करते हैं। हालाँकि, वे अक्सर अलग-अलग आकार और कोणों के वाहनों का सटीक रूप से पता लगाने में विफल रहते हैं, खासकर व्यस्त, मिश्रित-ट्रैफ़िक वातावरण में। इसके अलावा, ऐसी जटिल स्थितियों के लिए डिज़ाइन किए गए लेबल वाले डेटासेट की कमी है,” उन्होंने कहा।
शोध दल ने नया MCVD मॉडल विकसित किया, जो ट्रैफ़िक छवियों से मुख्य विशेषताओं को कुशलतापूर्वक निकालने के लिए वीडियो डिइंटरलेसिंग नेटवर्क (VDnet) का उपयोग करता है, भले ही वाहनों का आकार और आकार अलग-अलग हो। उन्होंने निकाले गए विवरणों को और अधिक परिष्कृत करने के लिए लाइट फ्यूजन बाई-डायरेक्शनल फ़ीचर पिरामिड नेटवर्क (LFBFPN) नामक एक विशेष उपकरण भी पेश किया।
दास ने कहा, "जो बात LFBFPN को अद्वितीय बनाती है, वह यह है कि यह सटीकता का त्याग किए बिना मॉडल की जटिलता को कम करने वाली एक सरल विधि का उपयोग करता है। फिर सिस्टम संशोधित वाहन डिटेक्शन हेड (MVDH) नामक एक अन्य उपकरण के माध्यम से विवरणों को संसाधित करता है, जो सभी प्रकार की ट्रैफ़िक स्थितियों में वाहनों का सटीक रूप से पता लगाने और उन्हें वर्गीकृत करने में मदद करता है।" MCVD मॉडल मौजूदा तरीकों की तुलना में सटीकता में सुधार दर्शाता है। टीम ने हेटेरोजेनस ट्रैफ़िक लेबल्ड डेटासेट (HTLD) का उपयोग करके मॉडल का परीक्षण किया, जिसमें भारत भर के कई शहरों का डेटा शामिल है और यह सार्वजनिक उपयोग के लिए उपलब्ध है। मॉडल के वास्तविक समय के प्रदर्शन का मूल्यांकन एनवीडिया जेटसन TX2, एक एज कंप्यूटिंग डिवाइस पर भी किया गया, जहाँ इसने चुनौतीपूर्ण मौसम की स्थिति और कम-रिज़ॉल्यूशन वाली छवियों के साथ भी मजबूत गति और सटीकता बनाए रखी।
"पुराने मॉडलों की सीमाओं को पार करके और मिश्रित यातायात की अनूठी चुनौतियों को संबोधित करके, MCVD मॉडल विकासशील देशों में वास्तविक समय में वाहन का पता लगाने के लिए एक स्केलेबल विकल्प प्रदान करता है। इसका उपयोग यातायात प्रणालियों को बेहतर बनाने, भीड़भाड़ को कम करने और सड़क सुरक्षा को बढ़ाने में मदद कर सकता है," उन्होंने कहा। शोध दल इस विचार के आधार पर एक यातायात नियंत्रण प्रणाली विकसित करने पर आगे काम कर रहा है और एक स्टार्ट-अप के माध्यम से इसका व्यावसायीकरण करने की भी योजना बना रहा है।