मशीन लर्निंग फार्मा की सबसे धीमी पाइपलाइन में गति लाती है

Breaking

Home
/
अन्य खबरें
/
सम्पादकीय
/
मशीन लर्निंग फार्मा की...

मशीन लर्निंग फार्मा

मशीन लर्निंग दवा की खोज के फ्रंट एंड को बदल रही है, जहाँ रिसर्चर तय करते हैं कि किन टारगेट को फॉलो करना है और किन मॉलिक्यूल्स के लिए महंगी लैबोरेटरी वर्क की ज़रूरत है। इसका गहरा टेस्ट आगे चलकर होता है, जहाँ प्रेडिक्टेड कंपाउंड्स को सिंथेसिस, सेलेक्टिविटी, सेफ्टी, रेगुलेशन और क्लिनिकल परफॉर्मेंस की ज़रूरतों को पूरा करना होता है।

फार्मास्यूटिकल्स में पब्लिश हुई एक नई स्टडी, जिसका टाइटल है "तेज़ी से दवा की खोज के लिए मशीन लर्निंग का इस्तेमाल: मौके और पूरी न हो पाने वाली चुनौतियाँ", मशीन लर्निंग को फार्मास्यूटिकल रिसर्च के लिए एक बड़े सपोर्ट टूल के तौर पर पेश करती है, न कि एक्सपेरिमेंटल साइंस का रिप्लेसमेंट, और इसके लिए मज़बूत वैलिडेशन फ्रेमवर्क, ज़्यादा साफ़ मॉडल एक्सप्लेनेशन और डिज़ाइन-मेक-टेस्ट-एनालाइज़ वर्कफ़्लो के साथ ज़्यादा करीब से इंटीग्रेशन की ज़रूरत है।

मशीन लर्निंग के पाइपलाइन में आने से दवा की खोज में तेज़ी आई है

दवा की खोज मॉडर्न साइंस के सबसे महंगे और रिस्की एरिया में से एक बनी हुई है। रिव्यू में बताया गया है कि किसी दवा को शुरुआती खोज से रेगुलेटरी अप्रूवल तक ले जाने में 10 से 15 साल लग सकते हैं, और इसकी लागत $2.5 बिलियन से ज़्यादा हो सकती है। ज़्यादातर कंपाउंड कभी भी क्लिनिकल डेवलपमेंट से नहीं गुज़रते हैं, और कई सेफ्टी या असर की समस्याओं के कारण देर से फेल होते हैं।

मशीन लर्निंग को इसलिए अपनाया जा रहा है क्योंकि यह बड़े, मुश्किल और अलग-अलग डेटासेट को प्रोसेस कर सकता है, जिन्हें पारंपरिक तरीकों से संभालना मुश्किल होता है। फार्मास्यूटिकल रिसर्च में, उन डेटासेट में केमिकल स्ट्रक्चर, बायोलॉजिकल एसे, जीनोमिक जानकारी, क्लिनिकल रिकॉर्ड, इमेजिंग डेटा, प्रोटीन स्ट्रक्चर और साइंटिफिक लिटरेचर शामिल होते हैं। इन सोर्स में नॉन-लीनियर पैटर्न का पता लगाकर, ML भविष्यवाणी, हाइपोथीसिस बनाने और मॉलिक्यूलर डिज़ाइन में मदद कर सकता है।

यह रिव्यू पहले के कम्प्यूटेशनल तरीकों जैसे कि क्वांटिटेटिव स्ट्रक्चर-एक्टिविटी रिलेशनशिप मॉडलिंग और मॉलिक्यूलर डॉकिंग से ज़्यादा एडवांस्ड ML सिस्टम की ओर बदलाव को ट्रैक करता है। पारंपरिक तरीकों ने मॉलिक्यूलर इंटरैक्शन का अनुमान लगाने में मदद की, लेकिन वे लीनियर अंदाज़ों और छोटे डेटासेट तक सीमित थे। मॉडर्न ML मॉडल बड़े केमिकल और बायोलॉजिकल डेटा से सीख सकते हैं, जबकि ग्राफ़ न्यूरल नेटवर्क मॉलिक्यूल को एटम और बॉन्ड के नेटवर्क के रूप में दिखा सकते हैं। जेनरेटिव सिस्टम, जिसमें वेरिएशनल ऑटोएनकोडर, जेनरेटिव एडवरसैरियल नेटवर्क और डिफ्यूजन मॉडल शामिल हैं, नए मॉलिक्यूलर स्ट्रक्चर का सुझाव दे सकते हैं।

सबसे ज़्यादा दिखने वाली सफलताओं ने उम्मीदें बढ़ा दी हैं। अल्फाफोल्ड ने प्रोटीन स्ट्रक्चर का अनुमान बदल दिया है। इनसिलिको मेडिसिन ने AI से बनने वाले क्लिनिकल कंपाउंड को आगे बढ़ाया है। एटमवाइज़ ने बड़े पैमाने पर वर्चुअल स्क्रीनिंग का इस्तेमाल किया है। डीप लर्निंग ने एंटीबायोटिक की खोज में भी मदद की है। ये मामले दिखाते हैं कि AI पाइपलाइन के कुछ हिस्सों को कैसे तेज़ कर सकता है, लेकिन रिव्यू में चेतावनी दी गई है कि इन्हें इस बात का सबूत न माना जाए कि दवा की खोज पूरी तरह से ऑटोमेटेड हो गई है।

मशीन लर्निंग का रोल टारगेट की पहचान से शुरू होता है। जीनोमिक्स, प्रोटिओमिक्स, बीमारी नेटवर्क, क्लिनिकल रिकॉर्ड और साइंटिफिक लिटरेचर का एनालिसिस करके, ML बीमारी से जुड़े जीन, प्रोटीन और बायोलॉजिकल रास्तों की पहचान करने में मदद कर सकता है जो इलाज के लिए सही हो सकते हैं। नॉलेज ग्राफ और ग्राफ न्यूरल नेटवर्क ऐसे कनेक्शन खोज सकते हैं जो आम एनालिसिस से छूट सकते हैं, जबकि नेचुरल लैंग्वेज प्रोसेसिंग साइंटिफिक और क्लिनिकल टेक्स्ट से जीन-बीमारी और दवा-टारगेट के रिश्ते निकाल सकती है।

हिट की पहचान में, ML बड़ी केमिकल लाइब्रेरी की वर्चुअल स्क्रीनिंग को चालू करके महंगी हाई-थ्रूपुट स्क्रीनिंग पर निर्भरता कम कर सकता है। AI सिस्टम अनुमानित बाइंडिंग के लिए कंपाउंड को रैंक कर सकते हैं, कमज़ोर कैंडिडेट को फ़िल्टर कर सकते हैं और टारगेट प्रॉपर्टी वाले नए मॉलिक्यूल बना सकते हैं। इससे शुरुआती खोज तेज़ और सस्ती हो सकती है, खासकर जब एक्सपेरिमेंटल टेस्टिंग कैपेसिटी सीमित हो।

रिव्यू का एक बड़ा फोकस लीड ऑप्टिमाइज़ेशन है। लेखक तर्क देते हैं कि ML को सिर्फ़ इस आधार पर नहीं आंका जाना चाहिए कि यह पोटेंसी का अनुमान लगाता है या नहीं। असली मेडिसिनल केमिस्ट्री में, ड्रग कैंडिडेट्स को एक्टिविटी, सेलेक्टिविटी, सेफ्टी, सॉल्युबिलिटी, परमीएबिलिटी, मेटाबोलिक स्टेबिलिटी, सिंथेसिस फीजिबिलिटी और डेवलपेबिलिटी में बैलेंस बनाना होता है। एक मॉलिक्यूल जो मॉडल में मजबूत दिखता है, वह फिर भी फेल हो सकता है क्योंकि वह गलत टारगेट पर लग जाता है, उसे अच्छे से नहीं बनाया जा सकता, टॉक्सिसिटी पैदा करता है या फॉर्मूलेशन के लिए कोई प्रैक्टिकल रास्ता नहीं होता।

एक डिसीजन-सपोर्ट टूल के तौर पर, ML साइंटिस्ट्स को एनालॉग्स को रैंक करने, मॉडल के भरोसेमंद डोमेन के बाहर के कंपाउंड्स को फ्लैग करने, ऑफ-टारगेट रिस्क का अनुमान लगाने, ADMET प्रॉपर्टीज़ का मूल्यांकन करने और गाइड करने में मदद कर सकता है कि आगे कौन से कंपाउंड्स बनाए जाने चाहिए। लेकिन रिव्यू यह साफ करता है कि एक्सपर्ट मेडिसिनल केमिस्ट्री का फैसला सेंट्रल बना हुआ है।

ट्रांसलेशन गैप लैब के बाहर AI के असर को लिमिट करता है

सबसे बड़ी चुनौती प्रेडिक्शन्स जेनरेट करना नहीं है, बल्कि यह साबित करना है कि उन प्रेडिक्शन्स से बेहतर दवाएं बनती हैं। रिव्यू इस बात पर जोर देता है कि कई ML एप्लीकेशन्स अभी भी प्रूफ-ऑफ-कॉन्सेप्ट या शुरुआती वैलिडेशन स्टेज पर हैं। एक मॉडल बेंचमार्क डेटासेट पर अच्छा परफॉर्म कर सकता है लेकिन नए केमिकल स्कैफोल्ड्स, नए बायोलॉजिकल टारगेट्स या रियल-वर्ल्ड एक्सपेरिमेंटल कंडीशंस पर अप्लाई करने पर फेल हो सकता है। यह प्रॉब्लम, जिसे डोमेन शिफ्ट के नाम से जाना जाता है, इस फील्ड की सबसे सीरियस लिमिट्स में से एक है।

डेटा की क्वालिटी एक मुख्य कारण है। ड्रग डिस्कवरी डेटासेट अक्सर अधूरे, शोरगुल वाले, प्रोपराइटरी, अच्छी तरह से स्टडी किए गए टारगेट के प्रति बायस्ड और एसे फॉर्मेट में एक जैसे नहीं होते हैं।

Tagsमशीन लर्निंग फार्मा धीमी पाइपलाइन में गति Machine learning pharma speed in slow pipeline Janta Se Rishta News Janta Se Rishta Today's Latest News Hindi News India News Khabron Ka Silsila Today's Breaking News Today's Big News Mid Day Newspaper

Breaking

nidhi

छत्तीसगढ़

विश्व

Breaking

nidhi

छत्तीसगढ़

विश्व

Follow us On: