गूगल ने Gemini 3.5 लाइव ट्रांसलेट लॉन्च किया: इसे ऐसे इस्तेमाल करें
गूगल ने Gemini 3.5 लाइव ट्रांसलेट लॉन्च
गूगल ने Gemini 3.5 लाइव ट्रांसलेट लॉन्च किया है, यह एक नया AI-पावर्ड ऑडियो मॉडल है जो 70 से ज़्यादा भाषाओं में रियल टाइम में स्पीच को ट्रांसलेट करता है। पुराने ट्रांसलेशन टूल्स के उलट, जो जवाब प्रोसेस करने से पहले स्पीकर के खत्म होने का इंतज़ार करते हैं, Gemini 3.5 लाइव ट्रांसलेट लगातार काम करता है, बातचीत के दौरान स्पीकर से बस कुछ सेकंड पीछे रहता है, और इसके लिए मैन्युअल रूप से भाषा चुनने की ज़रूरत नहीं होती।
यह मॉडल आज Android और iOS पर गूगल ट्रांसलेट ऐप, डेवलपर्स के लिए Gemini Live API और एंटरप्राइज़ यूज़र्स के लिए गूगल मीट पर रोल आउट हो रहा है।
Gemini 3.5 लाइव ट्रांसलेट: यह इसे अलग क्यों बनाता है
मौजूदा ट्रांसलेशन टूल्स से दो सबसे बड़े बदलाव स्पीड और वॉइस फिडेलिटी हैं। यह मॉडल बोली जाने वाली भाषा को ऑटोमैटिकली पहचानता है और हर वाक्य के बाद टुकड़ों में बोलने के बजाय तुरंत ट्रांसलेट की गई स्पीच बनाता है।
खास बात यह है कि यह ओरिजिनल स्पीकर के इंटोनेशन, पेसिंग और पिच को बनाए रखता है, इसलिए ट्रांसलेट किया हुआ वर्शन बोलने वाले व्यक्ति जैसा लगता है, न कि कोई आम सिंथेटिक आवाज़ जो ट्रांसक्रिप्ट पढ़ रही हो। इसे शोर वाले असल दुनिया के माहौल को संभालने के लिए भी बनाया गया है, जिससे यह कस्टमर सपोर्ट कॉल, क्लासरूम, राइड-शेयरिंग पिकअप और लाइव इवेंट जैसी सेटिंग्स के लिए प्रैक्टिकल है।
जेमिनी 3.5 लाइव ट्रांसलेट: इसका इस्तेमाल कैसे करें
एंड्रॉइड और iOS पर रेगुलर यूज़र्स के लिए, यह फ़ीचर सीधे Google ट्रांसलेट ऐप के अंदर उपलब्ध है। शुरू करने का तरीका यह है:
1. अपने Android या iOS डिवाइस पर Google ट्रांसलेट ऐप खोलें
2. बातचीत मोड में जाने के लिए माइक्रोफ़ोन आइकन पर टैप करें
3. जेमिनी 3.5 लाइव ट्रांसलेट बोली जाने वाली भाषा को अपने आप पहचान लेगा।
4. नैचुरली बोलें, ट्रांसलेट किया हुआ ऑडियो आपके हेडफ़ोन के ज़रिए लगभग रियल-टाइम में चलेगा।
5. एंड्रॉइड पर, एक नया लिसनिंग मोड ट्रांसलेट किए गए ऑडियो को फ़ोन के ईयरपीस के ज़रिए स्ट्रीम करता है जब आप इसे रेगुलर कॉल की तरह अपने कान पर लगाते हैं, हेडफ़ोन की ज़रूरत नहीं होती।
6. ट्रांसलेट किए गए ऑडियो आउटपुट को सुनने के लिए हेडफ़ोन की कोई भी जोड़ी काम करती है।
जेमिनी 3.5 लाइव ट्रांसलेट: एंटरप्राइज़ यूज़र्स को क्या मिलता है
Google Meet इंटीग्रेशन पहले जो उपलब्ध था, उससे एक बड़ा कदम आगे है। मीट में स्पीच ट्रांसलेशन का पुराना वर्शन सिर्फ़ पाँच भाषाओं को सपोर्ट करता था। नए इंटीग्रेशन से यह 70 से ज़्यादा भाषाओं तक बढ़ जाता है और एक ही मीटिंग में 2,000 से ज़्यादा भाषाओं को जोड़ने का ऑप्शन मिलता है, और सबसे ज़रूरी बात यह है कि अब यह ट्रांसलेशन को सिर्फ़ इंग्लिश तक ही सीमित नहीं रखता है।
गूगल मीट के ज़रिए एंटरप्राइज़ एक्सेस इस महीने प्राइवेट प्रीव्यू में शुरू होगा, और इसके बाद इसे बड़े लेवल पर रोलआउट किया जाएगा। डेवलपर्स आज जेमिनी लाइव API और गूगल AI स्टूडियो के ज़रिए पब्लिक प्रीव्यू में मॉडल को एक्सेस कर सकते हैं।
जेमिनी 3.5 लाइव ट्रांसलेट के हर ऑडियो आउटपुट में एक सिंथआईडी वॉटरमार्क होता है जो सीधे ऑडियो वेवफ़ॉर्म में एम्बेडेड होता है, जो इसे AI-जेनरेटेड कंटेंट के तौर पर पहचानता है। गूगल ने कन्फर्म किया है कि अभी इसे हटाने का कोई तरीका नहीं है।