सम्पादकीय

ट्रैफिक, कोहरा और रात का संगम: सेल्फ-ड्राइविंग AI के लिए अभी भी चुनौती

nidhi
23 May 2026 8:26 AM IST
ट्रैफिक, कोहरा और रात का संगम: सेल्फ-ड्राइविंग AI के लिए अभी भी चुनौती
x
सेल्फ-ड्राइविंग AI के लिए अभी भी चुनौती
इलेक्ट्रॉनिक्स में छपी एक नई स्टडी के मुताबिक, ऑटोनॉमस गाड़ियां (AVs) कंट्रोल्ड सिमुलेशन में बारिश, कोहरा और रात में ड्राइविंग को संभाल सकती हैं, लेकिन जब कई शहरी रिस्क एक साथ आते हैं, तो उनकी परफॉर्मेंस तेज़ी से कमज़ोर हो जाती है।
ऑटोनॉमस गाड़ियों के लिए आर्टिफिशियल इंटेलिजेंस: कॉम्प्लेक्स अर्बन ट्रैफिक सिनेरियो में मज़बूती का एनालिसिस नाम की इस स्टडी में, CARLA Town10HD सिम्युलेटर में एक मॉड्यूलर ऑटोनॉमस-ड्राइविंग सिस्टम बनाया और टेस्ट किया गया, जिसमें CNN-बेस्ड परसेप्शन, A* ग्लोबल पाथ प्लानिंग, और दो कंट्रोल स्ट्रेटेजी: एक क्लासिकल PID कंट्रोलर और एक डीप Q-नेटवर्क रीइन्फोर्समेंट लर्निंग एजेंट के साथ अडैप्टिव स्टीयरिंग असिस्टेंस को मिलाया गया।
नतीजों से पता चलता है कि AVs अलग-अलग डिस्टर्बेंस में बहुत काबिल लग सकती हैं, लेकिन जब विज़िबिलिटी, मौसम, ट्रैफिक और कंट्रोल की ज़रूरतें एक-दूसरे से इंटरैक्ट करती हैं, तो वे कमज़ोर रहती हैं। स्टडी में सिमुलेशन में मज़बूत परसेप्शन रिज़ल्ट बताए गए हैं, जिसमें ट्रैफिक साइन, पैदल चलने वालों, लेन और सीन ज्योमेट्री के लिए क्लासिफिकेशन स्कोर 0.99 के करीब हैं। हालांकि, लेखक चेतावनी देते हैं कि ये रिज़ल्ट सिंथेटिक CARLA डेटा से आए हैं और इन्हें असल दुनिया की परफॉर्मेंस का सबूत नहीं मानना ​​चाहिए।
AI परसेप्शन सिमुलेशन में अच्छा परफॉर्म करता है, लेकिन रियल-वर्ल्ड ट्रांसफर अभी भी साबित नहीं हुआ है।
रिसर्च टीम ने परसेप्शन, प्लानिंग और कंट्रोल के आस-पास बनी एक मॉड्यूलर ऑटोनॉमस-ड्राइविंग पाइपलाइन डेवलप की। सिस्टम ने CARLA में सिम्युलेटेड RGB, सिमेंटिक सेगमेंटेशन और डेप्थ सेंसर का इस्तेमाल किया, जो एक हाई-फिडेलिटी ऑटोनॉमस-ड्राइविंग सिम्युलेटर है जिसका इस्तेमाल बार-बार टेस्टिंग के लिए बड़े पैमाने पर किया जाता है। गाड़ी Town10HD में ऑपरेट होती थी, जो एक कॉम्प्लेक्स शहरी माहौल है जिसमें इंटरसेक्शन, पैदल चलने वालों के ज़ोन, मल्टी-लेन सड़कें, ट्रैफिक लाइट और अलग-अलग तरह के साइनेज हैं।
परसेप्शन के लिए, रिसर्चर्स ने ट्रैफिक साइन, पैदल चलने वालों और लेन को क्लासिफाई करने और कर्व, इंटरसेक्शन और सीधी सड़कों जैसे सीन ज्योमेट्री की पहचान करने के लिए ResNet-18 कन्वोल्यूशनल न्यूरल नेटवर्क का इस्तेमाल किया। लेन-बाउंड्री डिटेक्शन के लिए क्लासिकल इमेज-प्रोसेसिंग मेथड भी जोड़े गए, जिसमें लैटरल-कंट्रोल कैलकुलेशन को सपोर्ट करने के लिए एज और लाइन एक्सट्रैक्शन का इस्तेमाल किया गया।
परसेप्शन मॉडल्स ने सिमुलेशन माहौल में ज़बरदस्त परफॉर्म किया। ऑब्जेक्ट क्लासिफायर 1,970 सिंथेटिक सैंपल के बैलेंस्ड टेस्ट सबसेट पर 99 परसेंट एक्यूरेसी तक पहुंचा। सीन क्लासिफायर कर्व, इंटरसेक्शन और सीधी-सड़क कैटेगरी में भी 99 परसेंट एक्यूरेसी तक पहुंचा। ये नंबर बताते हैं कि सिस्टम ने सिम्युलेटेड विज़ुअल माहौल को असरदार तरीके से सीखा।
स्टडी में बार-बार इस बात पर ज़ोर दिया गया है कि परफॉर्मेंस को सावधानी से समझना चाहिए। ट्रेनिंग और टेस्टिंग दोनों CARLA से बनी सिंथेटिक इमेजरी पर निर्भर थे, जिसका मतलब है कि सिस्टम को रियल-वर्ल्ड डोमेन शिफ्ट का सामना नहीं करना पड़ा। रियल ड्राइविंग इमेज में सेंसर नॉइज़, लेंस डिस्टॉर्शन, मोशन ब्लर, बदलती सड़क की सतहें, अनप्रिडिक्टेबल लाइटिंग, गंदगी, मौसम के आर्टिफैक्ट और सिमुलेशन से अलग व्यवहार शामिल हैं। इसलिए पेपर रियल-वर्ल्ड जनरलाइज़ेशन का दावा नहीं करता है।
ऑटोनॉमस-ड्राइविंग रिसर्च में अक्सर सिमुलेशन और डिप्लॉयमेंट के बीच गैप होता है। एक गाड़ी जो सिम्युलेटर में अच्छा परफॉर्म करती है, वह रियल कैमरों, अनियमित रोड मार्किंग, अनप्रिडिक्टेबल पैदल चलने वालों या सेंसर कैलिब्रेशन प्रॉब्लम के संपर्क में आने पर फेल हो सकती है। लेखक सिमुलेशन-टू-रियलिटी ट्रांसफर को भविष्य की एक बड़ी चुनौती के रूप में पहचानते हैं, न कि एक सॉल्व्ड प्रॉब्लम के रूप में।
स्टडी में एक शुरुआती डोमेन-रैंडमाइजेशन एक्सपेरिमेंट, ट्रेनिंग के दौरान अलग-अलग लाइटिंग, मौसम, कैमरा नॉइज़ और टेक्सचर शामिल थे। कंबाइंड डिस्टर्बेंस के तहत, इसने रूट एफिशिएंसी में सुधार किया और फिक्स्ड-कंडीशन बेसलाइन की तुलना में लैटरल एरर और कोलिजन को कम किया। फिर भी, रिसर्च सिमुलेशन-बेस्ड है और फिजिकल गाड़ियों पर सिस्टम को वैलिडेट नहीं करता है।
PID ज़्यादा स्मूद रहता है जबकि रीइन्फोर्समेंट लर्निंग तेज़ी से लेकिन कम स्टेबिलिटी के साथ आगे बढ़ता है।
रिसर्चर्स ने एक क्लासिकल PID कंट्रोलर को एक DQN रीइन्फोर्समेंट-लर्निंग एजेंट के साथ उन्हीं रूट्स, शुरुआती कंडीशंस और एनवायर्नमेंटल डिस्टर्बेंस के तहत टेस्ट किया।
PID कंट्रोलर एक ट्रेडिशनल कंट्रोल मेथड को दिखाता है जिसे स्टेबिलिटी और इंटरप्रेटेबिलिटी के लिए वैल्यू दी जाती है। इसने स्पीड और स्टीयरिंग को रेगुलेट करने के लिए प्रोपोर्शनल, इंटीग्रल और डेरिवेटिव टर्म्स का इस्तेमाल किया। DQN एजेंट एक लर्निंग-बेस्ड अप्रोच को दिखाता है, जो ड्राइविंग एक्शन्स को चुनने के लिए रीइन्फोर्समेंट लर्निंग का इस्तेमाल करता है। इसे एक एडैप्टिव जियोमेट्रिक स्टीयरिंग-असिस्टेंस मॉड्यूल से सपोर्ट मिला, जिसे शार्प टर्न्स और हाई-इंटरैक्शन मोमेंट्स को स्टेबल करने के लिए डिज़ाइन किया गया था।
कम्पेरिजन से एक क्लियर ट्रेड-ऑफ सामने आया। PID कंट्रोलर ने ज़्यादा स्मूद, ज़्यादा कंसिस्टेंट ट्रैजेक्टरी दीं। इसने कम स्टीयरिंग ऑसिलेशन, ज़्यादा स्टेबल एक्सेलरेशन बिहेवियर और ज़्यादा भरोसेमंद लेन-कीपिंग दिखाई। DQN एजेंट ने रूट्स को तेज़ी से पूरा किया लेकिन ज़्यादा अचानक कंट्रोल एक्शन्स, ज़्यादा डायरेक्शनल वेरिएबिलिटी और कम कंसिस्टेंट ड्राइविंग बिहेवियर प्रोड्यूस किया।
स्टडी के एवरेज कंट्रोल रिजल्ट्स इस गैप को दिखाते हैं। PID कंट्रोलर ने DQN एजेंट की तुलना में ज़्यादा रिवॉर्ड स्कोर हासिल किया, जो ज़्यादा स्टेबल नेविगेशन को दिखाता है। DQN ने कम ट्रैवर्सल टाइम हासिल किया, लेकिन लेखकों ने बताया कि यह स्पीड स्मूदनेस और स्टेबिलिटी की कीमत पर आई। दोनों कंट्रोलर ने डायरेक्ट कंट्रोलर तुलना में बिना टक्कर के इवैल्यूएट किए गए एपिसोड पूरे किए, लेकिन उनकी ड्राइविंग क्वालिटी में बहुत ज़्यादा अंतर था।
स्टैटिस्टिकल टेस्ट ने उन अंतरों को सपोर्ट किया। स्टडी में PID और DQN के बीच स्टीयरिंग स्मूदनेस और लैटरल एरर में बड़े अंतर बताए गए हैं, जिससे पता चलता है कि DQN की ज़्यादा वेरिएबिलिटी रैंडम रन-टू-रन नॉइज़ नहीं थी, बल्कि कंट्रोल बिहेवियर में एक स्ट्रक्चरल अंतर था।
नतीजे रीइन्फोर्समेंट लर्निंग को खारिज नहीं करते हैं। इसके बजाय, वे दिखाते हैं कि जब स्टेट रिप्रेजेंटेशन को आसान बनाया जाता है और रिवॉर्ड फंक्शन एनवायरनमेंटल कॉम्प्लेक्सिटी को पूरी तरह से कैप्चर नहीं करता है, तो अर्बन-ड्राइविंग सेटिंग्स में लर्निंग-बेस्ड कंट्रोल को स्टेबल करना मुश्किल रहता है। इस स्टडी में DQN एजेंट ने पोजीशन, यॉ और स्पीड के साथ एक लो-डाइमेंशनल स्टेट वेक्टर का इस्तेमाल किया, साथ ही चार अलग-अलग एक्शन भी किए। इससे PID के साथ तुलना ज़्यादा कंट्रोल्ड और समझने लायक हो गई, लेकिन इसने एजेंट की बेहतर ड्राइविंग कॉन्टेक्स्ट को समझने की क्षमता को भी सीमित कर दिया।
लेखकों का तर्क है कि भविष्य के RL कंट्रोलर्स को बेहतर स्टेट रिप्रेजेंटेशन, विज़ुअल या सिमेंटिक इनपुट, कंटीन्यूअस एक्शन स्पेस और PPO या SAC जैसे ज़्यादा एडवांस्ड एक्टर-क्रिटिक एल्गोरिदम की ज़रूरत हो सकती है। हालांकि, अपने मौजूदा रूप में, लर्निंग-बेस्ड कंट्रोलर ने पोटेंशियल दिखाया लेकिन क्लासिकल कंट्रोलर की स्टेबिलिटी से मेल नहीं खाता था।
बहुत खराब मौसम और घना ट्रैफिक सिस्टम की कमजोरियों को दिखाते हैं
रिसर्चर्स ने भारी बारिश, घने कोहरे, रात में ड्राइविंग, घने ट्रैफिक और मिली-जुली बहुत खराब स्थितियों में सिस्टम को टेस्ट किया। हर सिनेरियो में 50 इंडिपेंडेंट सिमुलेशन रन का इस्तेमाल किया गया, जिससे यह पता चला कि इंटीग्रेटेड सिस्टम ने अलग-अलग शहरी स्ट्रेसर्स के तहत कैसे काम किया।
अलग-अलग मौसम की गड़बड़ी के तहत, सिस्टम ने अच्छा परफॉर्म किया। भारी बारिश, घना कोहरा और रात में ड्राइविंग, हर एक ने 98 परसेंट सक्सेस रेट, ज़ीरो कोलिजन और लगभग 0.96 की रूट एफिशिएंसी दी। लैटरल एरर एक नैरो रेंज में रहा, जिससे पता चलता है कि सिमुलेशन में गाड़ी अलग-अलग विज़िबिलिटी या मौसम की चुनौतियों के तहत भी रूट फॉलो कर सकती है।
जब रिस्क डायनामिक या कंपाउंड हो गए तो तस्वीर अलग थी। घने ट्रैफिक में, सक्सेस रेट गिरकर 52 परसेंट हो गया, रूट एफिशिएंसी गिरकर 0.52 हो गई, और 24 कोलिजन टिक्स रिकॉर्ड किए गए। इस सिनेरियो में गाड़ियों के बीच कम दूरी थी, जिसके लिए गाड़ी को दूसरे रोड यूज़र्स को रिस्पॉन्ड करना पड़ता था। नतीजे एक बड़ी कमजोरी की ओर इशारा करते हैं: सिस्टम एक प्लान किए गए रास्ते पर चल सकता था, लेकिन जब मल्टी-एजेंट इंटरैक्शन के लिए पहले से अंदाज़ा लगाना, मोल-भाव करना और तेज़ी से एडजस्ट करना ज़रूरी होता था, तो उसे मुश्किल होती थी।
मिली-जुली एक्सट्रीम-कंडीशन्स सिनेरियो भी गंभीर थी। इसमें भारी बारिश, घना कोहरा, रात के हालात, हवा और डायनामिक ट्रैफिक मिला हुआ था। सक्सेस रेट गिरकर 50 परसेंट हो गया, रूट एफिशिएंसी गिरकर 0.50 हो गई, और 23 कोलिजन टिक्स रिकॉर्ड किए गए। सिस्टम ज़्यादा कंजर्वेटिव हो गया, लेकिन इससे बढ़ती अनिश्चितता में फेलियर नहीं रुके।
स्टडी के स्टैटिस्टिकल एनालिसिस से यह कन्फर्म हुआ कि एनवायरनमेंटल कॉम्प्लेक्सिटी का सिस्टम परफॉर्मेंस पर एक मापा जा सकने वाला असर था। अलग-अलग सिनेरियो में रूट एफिशिएंसी, ओवरट्रैवल रेश्यो, स्टीयरिंग स्मूथनेस और एक्सेलरेशन स्मूथनेस में काफी अंतर था। घने ट्रैफिक और एक्सट्रीम कंडीशन ने सबसे ज़्यादा गिरावट पैदा की।
यह इसलिए मायने रखता है क्योंकि असली शहरी ड्राइविंग में एक समय में शायद ही कभी एक क्लीन चैलेंज होता है। एक गाड़ी को एक ही समय में बारिश, खराब लाइटिंग, कंस्ट्रक्शन, पैदल चलने वालों, चकाचौंध, कंजेशन और अनप्रेडिक्टेबल ड्राइवरों का सामना करना पड़ सकता है। स्टडी बताती है कि सिर्फ अलग-अलग कंडीशन में सिस्टम को टेस्ट करने से उनकी तैयारी ज़्यादा हो सकती है।
लेखक ज़रूरी लिमिट को भी मानते हैं। हर खराब सिनेरियो में परसेप्शन मॉड्यूल को अलग से इवैल्यूएट नहीं किया गया था, इसलिए स्टडी यह अलग नहीं कर सकती कि हर मौसम की कंडीशन ने विज़ुअल क्लासिफिकेशन को कितना खराब किया। इस काम में हर कंपोनेंट के अलग-अलग कंट्रीब्यूशन को मापने के लिए डायरेक्ट एब्लेशन एक्सपेरिमेंट भी शामिल नहीं थे। इसने असली हार्डवेयर, असली सड़कों या रियल-वर्ल्ड डेटासेट को टेस्ट नहीं किया। इसलिए, नतीजों को एक कंट्रोल्ड सिमुलेशन बेंचमार्क के तौर पर पढ़ा जाना चाहिए, न कि डिप्लॉयमेंट एविडेंस के तौर पर।
Next Story