x
व्यक्तिगत चेहरे की विशेषताओं की व्याख्या करके और तीन, प्रत्येक दृश्य में संवादों के साथ उपशीर्षक निकालकर।
हैदराबाद: अंतर्राष्ट्रीय सूचना प्रौद्योगिकी संस्थान, हैदराबाद (IIIT-H) के शोधकर्ता मानवीय भावनाओं और मानसिक अवस्थाओं को पहचानने और उनकी व्याख्या करने के लिए शिक्षण मशीनें हैं। यह प्रभावी कंप्यूटिंग के विकसित क्षेत्र का एक हिस्सा है।
एक नए मशीन लर्निंग (एमएल) मॉडल के साथ जो जटिल फिल्म दृश्यों से भावनाओं का विश्लेषण करता है, IIIT-H सेंटर फॉर विज़ुअल इंफॉर्मेशन टेक्नोलॉजी (CVIT) के शोधकर्ताओं ने कृत्रिम बुद्धिमत्ता (AI) को लक्ष्य के करीब ले लिया है।
एक अध्ययन में, 'आप कैसा महसूस कर रहे हैं'? फिल्म के दृश्यों में भावनाओं और मानसिक अवस्थाओं को सीखना, 'प्राथमिक लेखक ध्रुव श्रीवास्तव सह-लेखक आदित्य कुमार सिंह और प्रोफेसर मकरंद तपस्वी के साथ एक मशीन लर्निंग (एमएल) मॉडल पेश करते हैं जो न केवल भावनाओं को समझने और लेबल करने के लिए एक ट्रांसफॉर्मर-आधारित वास्तुकला पर निर्भर करता है। दृश्य में प्रत्येक फिल्म के चरित्र के लिए बल्कि समग्र दृश्य के लिए भी।
सिनेमा में रोजमर्रा की जिंदगी में मौजूद जटिलताओं को प्रतिबिंबित करने वाली बड़ी मात्रा में भावनात्मक डेटा रखने के साथ, अनुसंधान समूह ने फिल्मों को अपने शुरुआती बिंदु के रूप में अपनाया। हालांकि, स्थैतिक छवियों के विपरीत, फिल्में व्याख्या करने के लिए मशीनों के लिए बेहद जटिल हैं।
अपने मॉडल को प्रशिक्षित करने के लिए, शोधकर्ताओं की टीम ने प्रो. तपस्वी द्वारा मूवीग्राफ्स नामक अपने पिछले काम में एकत्रित मूवी क्लिप के मौजूदा डेटासेट का उपयोग किया जो फिल्म के दृश्यों में चित्रित सामाजिक स्थितियों के विस्तृत ग्राफ-आधारित एनोटेशन प्रदान करता है।
वास्तव में, EmoTx को तीन-आयामी प्रक्रिया के माध्यम से प्रत्येक दृश्य में पात्रों की भावनाओं और मानसिक अवस्थाओं को सटीक रूप से लेबल करने के लिए प्रशिक्षित किया गया था - एक, पूर्ण वीडियो और इसमें शामिल क्रियाओं का विश्लेषण करके, दो, विभिन्न पात्रों की व्यक्तिगत चेहरे की विशेषताओं की व्याख्या करके और तीन, प्रत्येक दृश्य में संवादों के साथ उपशीर्षक निकालकर।
Next Story