विज्ञान

एआई तकनीक खरोंच से नए प्रोटीन बनाती है: अनुसंधान

Gulabi Jagat
27 Jan 2023 9:49 PM IST
एआई तकनीक खरोंच से नए प्रोटीन बनाती है: अनुसंधान
x
वाशिंगटन (एएनआई): वैज्ञानिकों ने एक एआई प्रणाली विकसित की है जो खरोंच से कृत्रिम एंजाइम बनाने में सक्षम है। प्रयोगशाला प्रयोगों में, इनमें से कुछ एंजाइमों ने प्रकृति में पाए जाने वाले एंजाइमों की तरह ही काम किया, भले ही उनके कृत्रिम रूप से बनाए गए अमीनो एसिड अनुक्रम किसी भी ज्ञात प्राकृतिक प्रोटीन से व्यापक रूप से भिन्न थे।
प्रयोग दर्शाता है कि प्राकृतिक भाषा प्रसंस्करण, हालांकि इसे भाषा पाठ को पढ़ने और लिखने के लिए विकसित किया गया था, जीव विज्ञान के कम से कम कुछ अंतर्निहित सिद्धांतों को सीख सकता है। सेल्सफोर्स रिसर्च ने एआई प्रोग्राम विकसित किया, जिसे प्रोजेन कहा जाता है, जो कृत्रिम प्रोटीन में अमीनो एसिड अनुक्रमों को इकट्ठा करने के लिए अगली-टोकन भविष्यवाणी का उपयोग करता है।
वैज्ञानिकों ने कहा कि नई तकनीक नोबेल पुरस्कार विजेता प्रोटीन डिजाइन तकनीक, निर्देशित विकास से अधिक शक्तिशाली हो सकती है, और यह नए प्रोटीन के विकास को गति देकर प्रोटीन इंजीनियरिंग के 50 साल पुराने क्षेत्र को सक्रिय करेगी जिसका उपयोग लगभग किसी भी चीज़ के लिए किया जा सकता है। चिकित्सीय से लेकर अपमानजनक प्लास्टिक तक।
"कृत्रिम डिजाइन विकासवादी प्रक्रिया से प्रेरित डिजाइनों की तुलना में बहुत बेहतर प्रदर्शन करते हैं," जेम्स फ्रेजर, पीएचडी, यूसीएसएफ स्कूल ऑफ फार्मेसी में बायोइंजीनियरिंग और चिकित्सीय विज्ञान के प्रोफेसर और काम के एक लेखक ने कहा, जो 26 जनवरी को प्रकाशित हुआ था। प्रकृति जैव प्रौद्योगिकी में। कागज का पिछला संस्करण 2021 के जुलाई से प्रीप्रिंट सर्वर बायोरएक्सिव पर उपलब्ध है, जहां इसने एक सहकर्मी-समीक्षा पत्रिका में प्रकाशित होने से पहले कई दर्जन उद्धरण प्राप्त किए।
"भाषा मॉडल विकास के पहलुओं को सीख रहा है, लेकिन यह सामान्य विकासवादी प्रक्रिया से अलग है," फ्रेजर ने कहा। "अब हमारे पास विशिष्ट प्रभावों के लिए इन गुणों की पीढ़ी को ट्यून करने की क्षमता है। उदाहरण के लिए, एक एंजाइम जो अविश्वसनीय रूप से थर्मोस्टेबल है या अम्लीय वातावरण पसंद करता है या अन्य प्रोटीनों के साथ बातचीत नहीं करेगा।"
मॉडल बनाने के लिए, वैज्ञानिकों ने मशीन लर्निंग मॉडल में सभी प्रकार के 280 मिलियन विभिन्न प्रोटीनों के अमीनो एसिड अनुक्रमों को डाला और इसे कुछ हफ़्ते के लिए जानकारी को पचाने दिया। फिर, उन्होंने इन प्रोटीनों के बारे में कुछ प्रासंगिक जानकारी के साथ, पांच लाइसोजाइम परिवारों से 56,000 अनुक्रमों के साथ इसे भड़काकर मॉडल को ठीक किया।
मॉडल ने जल्दी से एक लाख अनुक्रम उत्पन्न किए, और शोध दल ने परीक्षण के लिए 100 का चयन किया, इस आधार पर कि वे प्राकृतिक प्रोटीन के अनुक्रमों के साथ-साथ एआई प्रोटीन के अंतर्निहित अमीनो एसिड "व्याकरण" और "अर्थशास्त्र" कितने प्राकृतिक थे।
100 प्रोटीन के इस पहले बैच में से, जिसे टिएरा बायोसाइंसेस द्वारा इन विट्रो में जांचा गया था, टीम ने कोशिकाओं में परीक्षण करने के लिए पांच कृत्रिम प्रोटीन बनाए और उनकी गतिविधि की तुलना चिकन अंडे के सफेद भाग में पाए जाने वाले एंजाइम से की, जिसे मुर्गी के अंडे का सफेद लाइसोजाइम कहा जाता है। (एचईडब्ल्यूएल)। इसी तरह के लाइसोजाइम मानव के आंसू, लार और दूध में पाए जाते हैं, जहां वे बैक्टीरिया और कवक से बचाव करते हैं।
दो कृत्रिम एंजाइम HEWL की तुलना में गतिविधि के साथ बैक्टीरिया की कोशिका भित्ति को तोड़ने में सक्षम थे, फिर भी उनके क्रम एक दूसरे के समान लगभग 18% ही थे। दो अनुक्रम लगभग 90% और 70% किसी भी ज्ञात प्रोटीन के समान थे।
एक प्राकृतिक प्रोटीन में सिर्फ एक उत्परिवर्तन इसे काम करना बंद कर सकता है, लेकिन स्क्रीनिंग के एक अलग दौर में, टीम ने पाया कि एआई-जनित एंजाइमों ने तब भी गतिविधि दिखाई, जब उनके अनुक्रम का 31.4% हिस्सा किसी भी ज्ञात प्राकृतिक प्रोटीन से मिलता जुलता था।
कच्चे अनुक्रम डेटा का अध्ययन करके एआई यह जानने में भी सक्षम था कि एंजाइमों को कैसे आकार दिया जाना चाहिए। एक्स-रे क्रिस्टलोग्राफी के साथ मापा गया, कृत्रिम प्रोटीन की परमाणु संरचनाएं वैसी ही दिखीं, जैसी उन्हें दिखनी चाहिए, हालांकि अनुक्रम पहले जैसा कुछ नहीं देखा गया था।
सेल्सफोर्स रिसर्च ने 2020 में ProGen को विकसित किया, जो एक तरह की प्राकृतिक भाषा प्रोग्रामिंग पर आधारित है, जिसे उनके शोधकर्ताओं ने मूल रूप से अंग्रेजी भाषा का पाठ उत्पन्न करने के लिए विकसित किया था।
वे अपने पिछले काम से जानते थे कि एआई प्रणाली खुद को व्याकरण और शब्दों के अर्थ के साथ-साथ अन्य अंतर्निहित नियमों को सिखा सकती है जो लेखन को अच्छी तरह से बनाते हैं।
सेल्सफोर्स रिसर्च में एआई रिसर्च के निदेशक और पेपर के वरिष्ठ लेखक निखिल नाइक ने कहा, "जब आप बहुत सारे डेटा के साथ अनुक्रम-आधारित मॉडल को प्रशिक्षित करते हैं, तो वे सीखने की संरचना और नियमों में वास्तव में शक्तिशाली होते हैं।" "वे सीखते हैं कि कौन से शब्द सह-घटित हो सकते हैं, और संरचना भी।"
प्रोटीन के साथ, डिजाइन के विकल्प लगभग असीम थे। लगभग 300 अमीनो एसिड के साथ लाइसोजाइम प्रोटीन के रूप में छोटे होते हैं। लेकिन 20 संभावित अमीनो एसिड के साथ, संभावित संयोजनों की एक विशाल संख्या (20300) है। यह उन सभी मनुष्यों को लेने से अधिक है जो पूरे समय में रहते थे, पृथ्वी पर रेत के दानों की संख्या से गुणा, ब्रह्मांड में परमाणुओं की संख्या से गुणा।
असीम संभावनाओं को देखते हुए, यह उल्लेखनीय है कि मॉडल इतनी आसानी से काम करने वाले एंजाइम उत्पन्न कर सकता है।
सेल्सफोर्स रिसर्च के पूर्व शोध वैज्ञानिक, प्रोफ्लुएंट बायो के संस्थापक अली मदनी ने कहा, "आउट-ऑफ-द-बॉक्स स्क्रैच से कार्यात्मक प्रोटीन उत्पन्न करने की क्षमता दर्शाती है कि हम प्रोटीन डिजाइन के एक नए युग में प्रवेश कर रहे हैं।" पहले लेखक। "यह प्रोटीन इंजीनियरों के लिए उपलब्ध एक बहुमुखी नया उपकरण है, और हम चिकित्सीय अनुप्रयोगों को देखने के लिए उत्सुक हैं।" (एएनआई)
Next Story