सैम ऑल्टमैन द्वारा संचालित ओपनएआई ने सोमवार को घोषणा की कि वह चैटजीपीटी में नई आवाज और छवि क्षमताओं को पेश कर रहा है जो अब एआई चैटबॉट को देखने, सुनने और बोलने में मदद कर सकती है।
कंपनी ने एक बयान में कहा, ये क्षमताएं आपको आवाज से बातचीत करने या चैटजीपीटी को यह दिखाने की अनुमति देकर एक नया, अधिक सहज प्रकार का इंटरफ़ेस प्रदान करती हैं कि आप किस बारे में बात कर रहे हैं।
“चैटजीपीटी के लिए वॉयस मोड और विज़न! वास्तव में एक कोशिश के काबिल है,'' ऑल्टमैन ने एक्स पर पोस्ट किया।
कंपनी ने कहा कि वह अगले दो हफ्तों में प्लस और एंटरप्राइज उपयोगकर्ताओं के लिए चैटजीपीटी में आवाज और छवियां पेश कर रही है।
माइक्रोसॉफ्ट समर्थित कंपनी ने कहा, "वॉयस आईओएस और एंड्रॉइड पर आ रहा है (आपकी सेटिंग्स में ऑप्ट-इन करें) और छवियां सभी प्लेटफार्मों पर उपलब्ध होंगी।"
नई आवाज क्षमता एक नए टेक्स्ट-टू-स्पीच मॉडल द्वारा संचालित है, जो केवल टेक्स्ट और कुछ सेकंड के नमूना भाषण से मानव-जैसा ऑडियो उत्पन्न करने में सक्षम है।
“हमने प्रत्येक आवाज़ को बनाने के लिए पेशेवर आवाज़ अभिनेताओं के साथ सहयोग किया। ओपनएआई ने कहा, हम आपके बोले गए शब्दों को टेक्स्ट में ट्रांसक्रिप्ट करने के लिए हमारे ओपन-सोर्स स्पीच रिकग्निशन सिस्टम व्हिस्पर का भी उपयोग करते हैं।
छवि समझ मल्टीमॉडल GPT-3.5 और GPT-4 द्वारा संचालित है। ये मॉडल अपने भाषा तर्क कौशल को छवियों की एक विस्तृत श्रृंखला पर लागू करते हैं, जैसे कि तस्वीरें, स्क्रीनशॉट और पाठ और छवि दोनों वाले दस्तावेज़।
नई वॉयस तकनीक कई रचनात्मक और पहुंच-केंद्रित अनुप्रयोगों के लिए द्वार खोलती है।
हालाँकि, "ये क्षमताएँ नए जोखिम भी पेश करती हैं, जैसे कि दुर्भावनापूर्ण अभिनेताओं द्वारा सार्वजनिक हस्तियों का प्रतिरूपण करने या धोखाधड़ी करने की क्षमता," कंपनी ने कहा।
“यही कारण है कि हम इस तकनीक का उपयोग एक विशिष्ट उपयोग के मामले - वॉयस चैट - को सशक्त बनाने के लिए कर रहे हैं। वॉइस चैट उन वॉइस एक्टर्स के साथ बनाई गई थी जिनके साथ हमने सीधे काम किया है,'' इसमें कहा गया है।
Spotify इस तकनीक की शक्ति का उपयोग अपने वॉयस ट्रांसलेशन फीचर के पायलट के लिए कर रहा है, जो पॉडकास्टरों को पॉडकास्टरों की अपनी आवाज में अतिरिक्त भाषाओं में अनुवाद करके उनकी कहानी कहने की पहुंच का विस्तार करने में मदद करता है।
कंपनी ने कहा, "हमने लोगों के बारे में विश्लेषण करने और सीधे बयान देने की चैटजीपीटी की क्षमता को महत्वपूर्ण रूप से सीमित करने के लिए तकनीकी उपाय भी किए हैं क्योंकि चैटजीपीटी हमेशा सटीक नहीं होता है और इन प्रणालियों को व्यक्तियों की गोपनीयता का सम्मान करना चाहिए।"