तेलंगाना
आईआईआईटी-एच के शोधकर्ता मशीनों को फिल्मों का उपयोग करके भावनाओं की व्याख्या करना सिखे
Rounak Dey
9 Jun 2023 10:09 AM GMT
x
व्यक्तिगत चेहरे की विशेषताओं की व्याख्या करके और तीन, प्रत्येक दृश्य में संवादों के साथ उपशीर्षक निकालकर।
हैदराबाद: अंतर्राष्ट्रीय सूचना प्रौद्योगिकी संस्थान, हैदराबाद (IIIT-H) के शोधकर्ता मानवीय भावनाओं और मानसिक अवस्थाओं को पहचानने और उनकी व्याख्या करने के लिए शिक्षण मशीनें हैं। यह प्रभावी कंप्यूटिंग के विकसित क्षेत्र का एक हिस्सा है।
एक नए मशीन लर्निंग (एमएल) मॉडल के साथ जो जटिल फिल्म दृश्यों से भावनाओं का विश्लेषण करता है, IIIT-H सेंटर फॉर विज़ुअल इंफॉर्मेशन टेक्नोलॉजी (CVIT) के शोधकर्ताओं ने कृत्रिम बुद्धिमत्ता (AI) को लक्ष्य के करीब ले लिया है।
एक अध्ययन में, 'आप कैसा महसूस कर रहे हैं'? फिल्म के दृश्यों में भावनाओं और मानसिक अवस्थाओं को सीखना, 'प्राथमिक लेखक ध्रुव श्रीवास्तव सह-लेखक आदित्य कुमार सिंह और प्रोफेसर मकरंद तपस्वी के साथ एक मशीन लर्निंग (एमएल) मॉडल पेश करते हैं जो न केवल भावनाओं को समझने और लेबल करने के लिए एक ट्रांसफॉर्मर-आधारित वास्तुकला पर निर्भर करता है। दृश्य में प्रत्येक फिल्म के चरित्र के लिए बल्कि समग्र दृश्य के लिए भी।
सिनेमा में रोजमर्रा की जिंदगी में मौजूद जटिलताओं को प्रतिबिंबित करने वाली बड़ी मात्रा में भावनात्मक डेटा रखने के साथ, अनुसंधान समूह ने फिल्मों को अपने शुरुआती बिंदु के रूप में अपनाया। हालांकि, स्थैतिक छवियों के विपरीत, फिल्में व्याख्या करने के लिए मशीनों के लिए बेहद जटिल हैं।
अपने मॉडल को प्रशिक्षित करने के लिए, शोधकर्ताओं की टीम ने प्रो. तपस्वी द्वारा मूवीग्राफ्स नामक अपने पिछले काम में एकत्रित मूवी क्लिप के मौजूदा डेटासेट का उपयोग किया जो फिल्म के दृश्यों में चित्रित सामाजिक स्थितियों के विस्तृत ग्राफ-आधारित एनोटेशन प्रदान करता है।
वास्तव में, EmoTx को तीन-आयामी प्रक्रिया के माध्यम से प्रत्येक दृश्य में पात्रों की भावनाओं और मानसिक अवस्थाओं को सटीक रूप से लेबल करने के लिए प्रशिक्षित किया गया था - एक, पूर्ण वीडियो और इसमें शामिल क्रियाओं का विश्लेषण करके, दो, विभिन्न पात्रों की व्यक्तिगत चेहरे की विशेषताओं की व्याख्या करके और तीन, प्रत्येक दृश्य में संवादों के साथ उपशीर्षक निकालकर।
Next Story