सम्पादकीय

LLMs क्वालिटेटिव हेल्थ रिसर्च में दूसरा लेंस कैसे जोड़ सकते हैं

nidhi
31 May 2026 7:03 AM IST
LLMs क्वालिटेटिव हेल्थ रिसर्च में दूसरा लेंस कैसे जोड़ सकते हैं
x
LLMs क्वालिटेटिव हेल्थ रिसर्च
यूनिवर्सिटी ऑफ़ साउथैम्पटन के कैलम हिल, जैकब कीस्ट, अरुण दहिल और हजीरा डंभा-मिलर की एक नई स्टडी के अनुसार, बड़े लैंग्वेज मॉडल (LLM) हेल्थ रिसर्चर्स को बड़े क्वालिटेटिव डेटासेट का ज़्यादा अच्छे से एनालिसिस करने में मदद कर सकते हैं, लेकिन उन्हें इंसानी इंटरप्रिटेशन के सब्स्टीट्यूट के बजाय एक सेकेंडरी एनालिटिक लेंस के तौर पर देखा जाना चाहिए।
उनकी स्टडी, जिसका टाइटल था मल्टीमॉर्बिडिटी और AI-इनेबल्ड हेल्थ और सोशल केयर: क्वालिटेटिव एनालिटिक वर्कफ़्लो में बड़े लैंग्वेज मॉडल को इंटीग्रेट करने का एक मेथोडोलॉजिकल इलस्ट्रेशन, जर्नल ऑफ़ मल्टीमॉर्बिडिटी एंड कोमॉर्बिडिटी में पब्लिश हुई थी। इसमें AI-सपोर्टेड सोशल केयर की सोच और क्वालिटेटिव रिसर्च में बड़े लैंग्वेज मॉडल की भूमिका, दोनों की जांच करने के लिए मल्टीमॉर्बिडिटी से जूझ रहे लोगों, केयर करने वालों और हेल्थ और सोशल केयर प्रोफेशनल्स के इंटरव्यू का इस्तेमाल किया गया।
यह स्टडी हेल्थ रिसर्च में तेज़ी से बदलते दो मुद्दों पर बात करती है:
पहला है मल्टीमॉर्बिडिटी की बढ़ती चुनौती, जिसे आमतौर पर दो या दो से ज़्यादा पुरानी बीमारियों का एक साथ होना माना जाता है। मल्टीमॉर्बिडिटी वाले लोगों को अक्सर रहने की जगह, खाना, आने-जाने, रोज़मर्रा के काम और सपोर्ट नेविगेशन से जुड़ी सोशल केयर की ज़रूरतें पूरी नहीं होतीं। ये कमियाँ सेहत को कम कर सकती हैं, हॉस्पिटल का इस्तेमाल बढ़ा सकती हैं और पहले से ही दबाव में चल रहे हेल्थ और सोशल केयर सिस्टम पर दबाव बढ़ा सकती हैं।
दूसरा मुद्दा हेल्थ रिसर्च वर्कफ़्लो में AI का बढ़ना है। क्लाउड जैसे बड़े लैंग्वेज मॉडल टेक्स्ट को समराइज़ कर सकते हैं, संभावित थीम की पहचान कर सकते हैं और इंटरव्यू डेटा की बड़ी मात्रा में कॉन्सेप्ट को एक साथ रख सकते हैं। हालाँकि, क्वालिटेटिव रिसर्च में उनके इस्तेमाल पर अभी भी सवाल हैं क्योंकि क्वालिटेटिव इंटरप्रिटेशन कॉन्टेक्स्ट, इमोशनल बारीकियों, पावर डायनामिक्स, पार्टिसिपेंट के मतलब और रिसर्चर की रिफ्लेक्सिविटी पर निर्भर करता है।
इस तरह यह स्टडी ह्यूमन एनालिसिस को बदलने के लिए नहीं थी, बल्कि यह दिखाने के लिए थी कि LLM-असिस्टेड आउटपुट को एक स्ट्रक्चर्ड, ट्रांसपेरेंट और ह्यूमन-रिव्यूड एनालिटिक प्रोसेस में कैसे इंटीग्रेट किया जा सकता है।
रिसर्चर्स ने 75 इंटरव्यू ट्रांसक्रिप्ट का सेकेंडरी थीमैटिक एनालिसिस किया। डेटासेट में मल्टीमॉर्बिडिटी वाले 40 लोग और 35 इनफॉर्मल केयरर या हेल्थ और सोशल केयर प्रोफेशनल शामिल थे, जिनमें जनरल प्रैक्टिशनर, सोशल प्रिस्क्राइबर, कम्युनिटी सपोर्ट वर्कर और वेलबीइंग कोच शामिल थे। पार्टिसिपेंट्स से पहले रोज़ाना की चुनौतियों, सोशल केयर की ज़रूरतों और केयर प्लानिंग के लिए एक काल्पनिक AI-सपोर्टेड टूल पर रिएक्शन के बारे में इंटरव्यू लिया गया था।
मरीज़ों को AI में उम्मीद दिखी लेकिन उन्हें इंपर्सनल केयर से डर लगा।
असल नतीजों से पता चला कि पार्टिसिपेंट्स ने सोशल केयर में AI-इनेबल्ड टूल्स से होने वाले फ़ायदों को पहचाना, खासकर अगर वे टूल्स ज़्यादा पर्सनलाइज़्ड, कोऑर्डिनेटेड और प्रोएक्टिव मदद कर सकें। मल्टीमॉर्बिडिटी से पीड़ित लोग अक्सर केयर को बिखरा हुआ और थका देने वाला बताते थे। कई लोगों को अलग-अलग सर्विसेज़ में अपॉइंटमेंट, दवाएँ, फ़ॉर्म, रेफ़रल और कम्युनिकेशन को खुद ही मैनेज करने के लिए मजबूर होना पड़ा।
पार्टिसिपेंट्स ने हेल्थ और सोशल केयर को नेविगेट करने के काम को लगातार कोऑर्डिनेशन का एक रूप बताया। स्टडी में पाया गया कि मरीज़ों और केयर करने वालों को अक्सर अलग-अलग सर्विसेज़ को लिंक करना पड़ता है, अपनी हिस्ट्री दोहरानी पड़ती है और ऐसे सिस्टम से सपोर्ट के लिए दौड़ना पड़ता है जो अच्छी तरह से कम्युनिकेट नहीं करते हैं। रिसर्चर्स इसे मल्टीमॉर्बिडिटी केयर की बड़ी चुनौती का हिस्सा बताते हैं, जहाँ कॉम्प्लेक्स ज़रूरतों वाले लोगों को अक्सर ऐसी कॉम्प्लेक्सिटी को मैनेज करने के लिए छोड़ दिया जाता है जिसे इंस्टीट्यूशन्स को शेयर करना चाहिए।
पार्टिसिपेंट्स ने भरोसे, प्राइवेसी और ट्रांसपेरेंसी को लेकर भी चिंता जताई। कुछ लोग इस बात को लेकर पक्का नहीं थे कि AI टूल्स उनकी जानकारी का क्या करेंगे, क्या डेटा का इस्तेमाल उन्हें सपोर्ट करने या उनकी प्रोफ़ाइल बनाने के लिए किया जाएगा, और क्या ऑटोमेटेड सिस्टम असली देखभाल की जगहों पर भरोसेमंद होंगे। ये चिंताएँ खास तौर पर इसलिए ज़रूरी थीं क्योंकि मल्टीमॉर्बिडिटी वाले लोग पहले से ही असुरक्षित महसूस कर सकते हैं, सेवाओं पर निर्भर हो सकते हैं और गलत समझे जाने का खतरा हो सकता है।
डिजिटल एक्सेस एक और रुकावट के रूप में सामने आया, जिसमें कुछ पार्टिसिपेंट्स के पास भरोसेमंद डिवाइस, कॉन्फिडेंस या ऑनलाइन सिस्टम इस्तेमाल करने की क्षमता की कमी थी। डिजिटल एक्सक्लूजन सिर्फ इंटरनेट एक्सेस के बारे में नहीं था। इसमें कॉग्निटिव लोड, अफोर्डेबिलिटी, कॉन्फिडेंस और कई लंबे समय की बीमारियों से निपटने के दौरान डिजिटल कामों को मैनेज करने की प्रैक्टिकल मुश्किल भी शामिल थी।
स्टडी में पाया गया कि पार्टिसिपेंट्स चाहते थे कि टेक्नोलॉजी पर्सनल हो, जेनेरिक नहीं। कई लोग ऐसे टूल्स में इंटरेस्टेड थे जो पर्सनल हालात को समझ सकें, लॉन्ग-टर्म केयर प्लानिंग में सपोर्ट कर सकें और हेल्थ और सोशल केयर ऑप्शन को जोड़ने में मदद कर सकें। लेकिन यह इंटरेस्ट कंडीशनल था। पार्टिसिपेंट्स AI पर विचार करने के लिए ज़्यादा तैयार थे अगर यह सच में बोझ कम करता है, कोऑर्डिनेशन को बेहतर बनाता है और उनकी ज़रूरतों का सम्मान करता है। सर्विसेज़ के साथ पिछले नेगेटिव एक्सपीरियंस ने कुछ लोगों को नए वादों के बारे में सावधान कर दिया।
इंटरव्यूज़ में, पार्टिसिपेंट्स ने बार-बार एंपैथी और ह्यूमन कनेक्शन के महत्व पर ज़ोर दिया। पार्टिसिपेंट्स सिर्फ़ जानकारी या एडमिनिस्ट्रेटिव आउटपुट नहीं चाहते थे। वे पूरे इंसान के तौर पर सुने, समझे और पहचाने जाने का एहसास चाहते थे। कुछ ने मौजूदा केयर सिस्टम को ट्रांज़ैक्शनल, जल्दबाज़ी वाला या खारिज करने वाला बताया। यह नतीजा स्टडी के मैसेज का सेंटर है: AI कोऑर्डिनेशन में सपोर्ट कर सकता है, लेकिन अगर सिस्टम ह्यूमन कनेक्शन को नज़रअंदाज़ करते रहे तो यह केयर में रिलेशनल गैप को सॉल्व नहीं कर सकता।
हेल्थ और सोशल केयर प्रोफेशनल्स आमतौर पर कोऑर्डिनेशन में सपोर्ट करने की AI की क्षमता के बारे में मरीज़ों की तुलना में ज़्यादा पॉजिटिव थे। प्रोफेशनल्स अक्सर स्ट्रक्चरल रुकावटों और इस संभावना पर फोकस करते थे कि AI सर्विसेज़ को और ज़्यादा जोड़ने में मदद कर सकता है। मरीज़ों ने इमोशनल बोझ, पिछली निराशा और इस बारे में चिंता बताने की ज़्यादा संभावना जताई कि क्या AI टूल्स इंपर्सनल केयर को और खराब कर देंगे। इस अंतर का मतलब यह नहीं है कि मरीज़ों ने AI को रिजेक्ट कर दिया। यह दिखाता है कि एक्सेप्टेबिलिटी इस बात पर निर्भर करती है कि टूल्स सिर्फ़ एडमिनिस्ट्रेटिव सुविधा के बजाय लाइव एक्सपीरियंस के आधार पर बने हैं या नहीं।
क्लाउड ने काम के पैटर्न तो दिखाए लेकिन मतलब को भी बढ़ा-चढ़ाकर बताया।
रिसर्चर्स ने क्लाउड सॉनेट 4 का इस्तेमाल करके ह्यूमन रिफ्लेक्सिव थीमैटिक एनालिसिस की तुलना LLM-असिस्टेड क्वालिटेटिव एनालिसिस से की। उन्होंने स्टेज्ड प्रॉम्प्ट्स के ज़रिए एनॉनिमाइज़्ड ट्रांसक्रिप्ट को प्रोसेस किया, जिन्हें मतलब की तीन लेयर्स: एक्सप्लोरेटरी, इंटरप्रिटिव और इंटीग्रेटिव से गुज़रने के लिए डिज़ाइन किया गया था।
एक्सप्लोरेटरी लेयर ने बड़े थीम और बार-बार होने वाली चिंताओं पर फोकस किया। इंटरप्रिटिव लेयर ने इमोशनल टोन, इम्प्लिसिट वैल्यूज़ और छिपे हुए मतलब की जांच की। इंटीग्रेटिव लेयर ने मरीज़ों, केयर करने वालों और प्रोफेशनल्स सहित स्टेकहोल्डर ग्रुप्स में क्रॉस-कटिंग पैटर्न की तुलना की। ह्यूमन एनालिसिस और LLM-असिस्टेड एनालिसिस की तुलना फिर कन्वर्जेंस-डाइवर्जेंस मैपिंग के ज़रिए की गई, यह एक ऐसा तरीका है जिसका इस्तेमाल यह पता लगाने के लिए किया जाता है कि आउटपुट कहाँ अलाइन हुए, कहाँ अलग थे और कहाँ मॉडल इंटरप्रिटेशन में सुधार या रिजेक्शन की ज़रूरत थी।
रिसर्चर्स ने ह्यूमन और LLM-असिस्टेड एनालिसिस के बीच काफी कन्वर्जेंस पाया। दोनों तरीकों से केयर का बिखराव, सहानुभूति की कमी, डिजिटल एक्सेस में रुकावटें, AI को लेकर अनिश्चितता, पर्सनलाइज़्ड सपोर्ट की इच्छा, और मल्टीमॉर्बिडिटी को मैनेज करने का इमोशनल और एडमिनिस्ट्रेटिव बोझ पहचाना गया। दोनों ने यह भी पाया कि पार्टिसिपेंट्स लगातार इंसानी रिश्तों पर आधारित जॉइंट-अप केयर चाहते थे।
LLM-असिस्टेड एनालिसिस ने काम की दूसरी फ़्रेमिंग भी पेश कीं। एक उदाहरण कॉग्निटिव ओवरलोड का कॉन्सेप्ट था। मैनुअल कोडिंग ने रिपीटिशन, फ़्रैगमेंटेशन और एडमिनिस्ट्रेटिव बोझ को अलग-अलग चिंताओं के तौर पर पहचाना था। क्लाउड ने इन अनुभवों को कॉग्निटिव ओवरलोड के एक बड़े पैटर्न के तौर पर फ़्रेम करने में मदद की, जिसमें बार-बार अपॉइंटमेंट, फ़ॉर्म, ऑनलाइन सिस्टम और केयर कोऑर्डिनेशन के मानसिक तनाव को कैप्चर किया गया।
एक और काम की मॉडल-जेनरेटेड फ़्रेमिंग इनविज़िबल लेबर थी। मैनुअल एनालिसिस ने उन कामों की पहचान की थी जो मरीज़ और केयर करने वाले करते थे, जैसे अपॉइंटमेंट बुक करना, रेफ़रल को फ़ॉलो-अप करना और सर्विसेज़ के बीच ट्रांसलेट करना। LLM ने इन एक्टिविटीज़ को मरीज़ और केयर करने वालों द्वारा बिखरे हुए सिस्टम के अंदर किए जाने वाले ज़रूरी लेकिन अनजान काम के तौर पर फिर से फ़्रेम किया। रिसर्चर्स ने ट्रांसक्रिप्ट एविडेंस के ख़िलाफ़ वेरिफ़ाई करने पर इस फ़्रेमिंग को काम का पाया।
क्लाउड ने मरीज़-प्रोफ़ेशनल रिश्तों में पावर डायनामिक्स पर भी रोशनी डाली। इसने स्क्रिप्टेड बातचीत के ब्यौरे, इधर-उधर होने या गोल-गोल घूमने को मरीज़ों और हेल्थ प्रोफेशनल्स के बीच असमानता के संकेत के तौर पर समझा। इससे एजेंसी, स्टेटस और पहचान के उन मुद्दों को सामने लाने में मदद मिली जो डेटा में मौजूद थे लेकिन मैनुअल एनालिसिस में कम अहमियत रखते थे।
मॉडल ने फिगरेटिव भाषा को भी एनालिटिकली ज़रूरी माना। इसने ब्लैक बॉक्स, भूलभुलैया और कन्वेयर बेल्ट जैसे मेटाफर को केयर सिस्टम में अकेलेपन, अस्पष्टता और मशीनीकरण के निशान के तौर पर देखा। इससे एनालिसिस यह जांचने में मदद मिली कि पार्टिसिपेंट्स ने सिर्फ़ साफ़ बातों पर ध्यान देने के बजाय, अविश्वास या थकान दिखाने के लिए भाषा का इस्तेमाल कैसे किया।
हालांकि, स्टडी में साफ़ रिस्क भी मिले। क्लाउड ने कभी-कभी इमोशनल टोन को बढ़ा-चढ़ाकर बताया, गलत मतलब निकाला या पार्टिसिपेंट की बातों को आसान बना दिया। एक उदाहरण में, मॉडल ने पार्टिसिपेंट के बयान को चुपचाप हार मानना ​​बताया, लेकिन ह्यूमन रिव्यू में पाया गया कि यह मतलब बड़े ट्रांसक्रिप्ट कॉन्टेक्स्ट से आगे निकल गया। दूसरे मामले में, मॉडल ने हॉस्पिटल के बाद दवा लेने में कन्फ्यूजन के बारे में एक मुश्किल बात को डिस्चार्ज के बाद मरीज़ों के कन्फ्यूज होने के बारे में एक आसान समरी में बदल दिया। रिसर्चर्स ने इन मतलबों को इसलिए खारिज कर दिया क्योंकि उन्होंने ओरिजिनल बात के मतलब को कमजोर या बिगाड़ दिया।
ये उदाहरण स्टडी की मुख्य मेथडोलॉजिकल चेतावनी को सपोर्ट करते हैं। LLM आउटपुट काम के हो सकते हैं, लेकिन वे प्रोविजनल होते हैं। उन्हें ट्रांसक्रिप्ट, रिसर्चर नोट्स और ह्यूमन इंटरप्रिटेशन से चेक किया जाना चाहिए। क्वालिटेटिव रिसर्च में, सवाल सिर्फ यह नहीं है कि क्या कोई मॉडल पैटर्न पहचान सकता है - बल्कि यह भी है कि क्या वे पैटर्न डेटा पर आधारित हैं और उन्हें काफी कॉन्टेक्स्चुअल केयर के साथ समझा गया है।
हेल्थ रिसर्च में ट्रांसपेरेंट LLM वर्कफ़्लो
रिसर्चर्स का तर्क है कि LLM-असिस्टेड एनालिसिस सबसे ज़्यादा काम का हो सकता है जब इसे बड़े क्वालिटेटिव डेटासेट पर लागू किया जाता है, जहाँ स्केल प्रैक्टिकल रुकावटें पैदा करता है। इस स्टडी में, क्लॉड ने 75 ट्रांसक्रिप्ट को तेज़ी से प्रोसेस और सिंथेसाइज़ करने, कैंडिडेट थीम प्रपोज़ करने, अल्टरनेटिव फ़्रेमिंग सामने लाने और क्रॉस-कटिंग पैटर्न पहचानने में मदद की। इससे रिसर्चर्स को रिफ़्लेक्टिव स्टैंडर्ड्स को छोड़े बिना ज़्यादा अच्छे से काम करने में मदद मिल सकती है।
स्टडी LLM आउटपुट को पक्के नतीजों के बजाय कैंडिडेट इंटरप्रिटेशन के तौर पर देखने की सलाह देती है। मॉडल से बनी समरी, थीम और लेबल रिसर्चर को सोचने में मदद कर सकते हैं, लेकिन आखिरी नतीजे इंसानी फ़ैसले से ही आने चाहिए। यह हेल्थ और सोशल केयर रिसर्च में खास तौर पर ज़रूरी है, जहाँ पार्टिसिपेंट्स के अकाउंट्स में अक्सर कमज़ोरी, ट्रॉमा, इंस्टीट्यूशनल अविश्वास और असमान पावर रिलेशनशिप शामिल होते हैं।
रिसर्चर्स अल्टरनेटिव इंटीग्रेटिव नतीजों को सामने लाने के लिए LLM का इस्तेमाल करने की भी सलाह देते हैं। यह मॉडल इंटरव्यू में बड़े रिश्तों की पहचान करने में काम आया, जिसमें केयर फ़्रैगमेंटेशन, इमोशनल बोझ, भरोसे की कमी और AI के प्रति कंडीशनल नज़रिए के बीच लिंक शामिल हैं। ये कनेक्शन रिसर्चर्स को बड़े डेटासेट पर सोचने में मदद कर सकते हैं, लेकिन उन्हें अभी भी वेरिफ़िकेशन की ज़रूरत होती है।
जैसा कि स्टडी बताती है, इंसानी निगरानी सबसे ज़रूरी सुरक्षा है। स्टडी इस बात पर ज़ोर देती है कि क्वालिटेटिव एनालिसिस टॉपिक्स निकालने का कोई मैकेनिकल प्रोसेस नहीं है। इसमें इंटरप्रिटेशन, रिफ्लेक्सिविटी और कॉन्टेक्स्ट पर ध्यान देना शामिल है। LLMs ऑर्गनाइज़ेशन और पैटर्न पहचानने में मदद कर सकते हैं, लेकिन वे मतलब, सबूत और नैतिक असर का आकलन करने की रिसर्चर्स की ज़िम्मेदारी को रिप्लेस नहीं करते हैं।
स्टडी रिप्रोड्यूसिबिलिटी की चुनौतियों की ओर भी इशारा करती है। LLMs प्रोबेबिलिस्टिक सिस्टम हैं, जिसका मतलब है कि वे रन के दौरान अलग-अलग आउटपुट जेनरेट कर सकते हैं। क्लाउड एक जनरल-पर्पस मॉडल है, न कि क्वालिटेटिव हेल्थ रिसर्च के लिए खास तौर पर ट्रेन किया गया सिस्टम। इसके आउटपुट ट्रेनिंग डेटा में बायस दिखा सकते हैं, और इसकी कॉन्टेक्स्टुअल सेंसिटिविटी सीमित हो सकती है। इसलिए रिसर्चर्स ने ट्रांसपेरेंसी को मज़बूत करने के लिए प्रॉम्प्ट्स, मॉडल आउटपुट और कोडिंग डिसीज़न को डॉक्यूमेंट किया।
यह स्टडी इंग्लिश हेल्थ सिस्टम के अंदर की गई थी, जो दूसरे देशों में ट्रांसफरेबिलिटी को सीमित कर सकती है। क्वालिटेटिव रिसर्च के लिए डेटासेट बड़ा था, लेकिन रिक्रूटमेंट वॉलंटरी और नेटवर्क-बेस्ड तरीकों पर निर्भर थी, जिससे पार्टिसिपेंट सिलेक्शन बायस आ सकता है। स्टडी में ह्यूमन और मॉडल परफॉर्मेंस की तुलना करने के लिए क्वांटिटेटिव एग्रीमेंट मेज़र का भी इस्तेमाल नहीं किया गया, जिसे भविष्य की रिसर्च जोड़ सकती है।
हेल्थ सिस्टम, रिसर्चर और मरीज़ों के लिए असर
हेल्थ और सोशल केयर के लिए, नतीजे बताते हैं कि AI वाले टूल मल्टीमॉर्बिडिटी वाले लोगों की मदद कर सकते हैं, जिससे कोऑर्डिनेशन, पर्सनलाइज़ेशन और प्रोएक्टिव सपोर्ट बेहतर होता है, लेकिन उन्हें भरोसे, डिजिटल एक्सेस, इमोशनल सपोर्ट और इंपर्सनल केयर के रिस्क पर ध्यान देकर डिज़ाइन किया जाना चाहिए। मरीज़ और देखभाल करने वाले ऐसे सिस्टम चाहते हैं जो बोझ कम करें, न कि ऐसे टूल जो मुश्किल की एक और लेयर जोड़ दें।
रिसर्चर के लिए, LLM क्वालिटेटिव एनालिसिस के कुछ हिस्सों को तेज़ कर सकते हैं और अनदेखे पैटर्न को सामने लाने में मदद कर सकते हैं, लेकिन वे क्रिटिकल, रिफ्लेक्सिव जजमेंट की जगह नहीं ले सकते। उनकी सबसे अच्छी भूमिका एक स्ट्रक्चर्ड असिस्टेंट के तौर पर है जो एनालिटिक फील्ड को बढ़ाता है, न कि एक अथॉरिटी के तौर पर जो यह तय करती है कि पार्टिसिपेंट का क्या मतलब है।
Next Story