प्रौद्योगिकी

Boston डायनेमिक्स का रोबोट डॉग स्पॉट अब 'फेच गेम' खेलने में सक्षम

Harrison
1 Nov 2024 3:39 PM IST
Boston डायनेमिक्स का रोबोट डॉग स्पॉट अब फेच गेम खेलने में सक्षम
x
SCIENCE: कृत्रिम बुद्धिमत्ता (AI) और कंप्यूटर विज़न के मिश्रण की बदौलत कुत्ते जैसे रोबोट एक दिन वस्तुओं को पहचानना सीख सकते हैं।IEEE रोबोटिक्स एंड ऑटोमेशन लेटर्स नामक पत्रिका में 10 अक्टूबर को प्रकाशित एक नए अध्ययन में, शोधकर्ताओं ने "क्लियो" नामक एक विधि विकसित की है जो रोबोट को ऑन-बॉडी कैमरों का उपयोग करके किसी दृश्य को तेज़ी से मैप करने और उन भागों की पहचान करने की अनुमति देती है जो उन्हें दिए गए कार्य के लिए सबसे अधिक प्रासंगिक हैं।
क्लियो "सूचना बाधा" के सिद्धांत का उपयोग करता है, जिसके तहत सूचना को इस तरह से संपीड़ित किया जाता है कि एक तंत्रिका नेटवर्क - मशीन लर्निंग एल्गोरिदम का एक संग्रह जो मानव मस्तिष्क द्वारा सूचना को संसाधित करने के तरीके की नकल करने के लिए स्तरित होता है - केवल प्रासंगिक खंडों को चुनता है और संग्रहीत करता है। सिस्टम से लैस कोई भी रोबोट "प्राथमिक चिकित्सा किट प्राप्त करें" जैसे निर्देशों को संसाधित करेगा और फिर अपने तत्काल वातावरण के केवल उन हिस्सों की व्याख्या करेगा जो उसके कार्यों के लिए प्रासंगिक हैं - बाकी सब को अनदेखा करते हुए।
"उदाहरण के लिए, मान लीजिए कि दृश्य में पुस्तकों का ढेर है और मेरा काम सिर्फ़ हरी किताब प्राप्त करना है। उस स्थिति में हम दृश्य के बारे में सारी जानकारी को इस अड़चन से बाहर निकालते हैं और अंत में खंडों का एक समूह बनाते हैं जो हरी किताब का प्रतिनिधित्व करते हैं," अध्ययन के सह-लेखक डोमिनिक मैगियो, जो एमआईटी में स्नातक छात्र हैं, ने एक बयान में कहा। "अन्य सभी खंड जो प्रासंगिक नहीं हैं, उन्हें बस एक समूह में समूहीकृत कर दिया जाता है जिसे हम आसानी से हटा सकते हैं। और हमारे पास सही ग्रैन्युलैरिटी पर एक ऑब्जेक्ट रह जाता है जो मेरे कार्य का समर्थन करने के लिए आवश्यक है।"
क्लियो को क्रिया में प्रदर्शित करने के लिए, शोधकर्ताओं ने एक बोस्टन डायनेमिक्स स्पॉट क्वाड्रुप्ड रोबोट का उपयोग किया जो क्लियो को एक कार्यालय भवन का पता लगाने और कार्यों का एक सेट करने के लिए चलाता था। वास्तविक समय में काम करते हुए, क्लियो ने एक आभासी मानचित्र तैयार किया जो केवल उसके कार्यों से संबंधित वस्तुओं को दिखाता है, जिसने फिर स्पॉट रोबोट को अपने उद्देश्यों को पूरा करने में सक्षम बनाया। शोधकर्ताओं ने क्लियो के साथ विस्तृत जानकारी के इस स्तर को बड़े भाषा मॉडल (एलएलएम) - कई आभासी तंत्रिका नेटवर्क जो कृत्रिम बुद्धिमत्ता उपकरणों, प्रणालियों और सेवाओं का आधार हैं - को संयोजित करके प्राप्त किया है, जिन्हें कंप्यूटर विज़न के साथ सभी प्रकार की वस्तुओं की पहचान करने के लिए प्रशिक्षित किया गया है।
Next Story