
x
गूगल ने Gemini 3.5 लाइव ट्रांसलेट लॉन्च
गूगल ने Gemini 3.5 लाइव ट्रांसलेट लॉन्च किया है, यह एक नया AI-पावर्ड ऑडियो मॉडल है जो 70 से ज़्यादा भाषाओं में रियल टाइम में स्पीच को ट्रांसलेट करता है। पुराने ट्रांसलेशन टूल्स के उलट, जो जवाब प्रोसेस करने से पहले स्पीकर के खत्म होने का इंतज़ार करते हैं, Gemini 3.5 लाइव ट्रांसलेट लगातार काम करता है, बातचीत के दौरान स्पीकर से बस कुछ सेकंड पीछे रहता है, और इसके लिए मैन्युअल रूप से भाषा चुनने की ज़रूरत नहीं होती।
यह मॉडल आज Android और iOS पर गूगल ट्रांसलेट ऐप, डेवलपर्स के लिए Gemini Live API और एंटरप्राइज़ यूज़र्स के लिए गूगल मीट पर रोल आउट हो रहा है।
Gemini 3.5 लाइव ट्रांसलेट: यह इसे अलग क्यों बनाता है
मौजूदा ट्रांसलेशन टूल्स से दो सबसे बड़े बदलाव स्पीड और वॉइस फिडेलिटी हैं। यह मॉडल बोली जाने वाली भाषा को ऑटोमैटिकली पहचानता है और हर वाक्य के बाद टुकड़ों में बोलने के बजाय तुरंत ट्रांसलेट की गई स्पीच बनाता है।
खास बात यह है कि यह ओरिजिनल स्पीकर के इंटोनेशन, पेसिंग और पिच को बनाए रखता है, इसलिए ट्रांसलेट किया हुआ वर्शन बोलने वाले व्यक्ति जैसा लगता है, न कि कोई आम सिंथेटिक आवाज़ जो ट्रांसक्रिप्ट पढ़ रही हो। इसे शोर वाले असल दुनिया के माहौल को संभालने के लिए भी बनाया गया है, जिससे यह कस्टमर सपोर्ट कॉल, क्लासरूम, राइड-शेयरिंग पिकअप और लाइव इवेंट जैसी सेटिंग्स के लिए प्रैक्टिकल है।
जेमिनी 3.5 लाइव ट्रांसलेट: इसका इस्तेमाल कैसे करें
एंड्रॉइड और iOS पर रेगुलर यूज़र्स के लिए, यह फ़ीचर सीधे Google ट्रांसलेट ऐप के अंदर उपलब्ध है। शुरू करने का तरीका यह है:
1. अपने Android या iOS डिवाइस पर Google ट्रांसलेट ऐप खोलें
2. बातचीत मोड में जाने के लिए माइक्रोफ़ोन आइकन पर टैप करें
3. जेमिनी 3.5 लाइव ट्रांसलेट बोली जाने वाली भाषा को अपने आप पहचान लेगा।
4. नैचुरली बोलें, ट्रांसलेट किया हुआ ऑडियो आपके हेडफ़ोन के ज़रिए लगभग रियल-टाइम में चलेगा।
5. एंड्रॉइड पर, एक नया लिसनिंग मोड ट्रांसलेट किए गए ऑडियो को फ़ोन के ईयरपीस के ज़रिए स्ट्रीम करता है जब आप इसे रेगुलर कॉल की तरह अपने कान पर लगाते हैं, हेडफ़ोन की ज़रूरत नहीं होती।
6. ट्रांसलेट किए गए ऑडियो आउटपुट को सुनने के लिए हेडफ़ोन की कोई भी जोड़ी काम करती है।
जेमिनी 3.5 लाइव ट्रांसलेट: एंटरप्राइज़ यूज़र्स को क्या मिलता है
Google Meet इंटीग्रेशन पहले जो उपलब्ध था, उससे एक बड़ा कदम आगे है। मीट में स्पीच ट्रांसलेशन का पुराना वर्शन सिर्फ़ पाँच भाषाओं को सपोर्ट करता था। नए इंटीग्रेशन से यह 70 से ज़्यादा भाषाओं तक बढ़ जाता है और एक ही मीटिंग में 2,000 से ज़्यादा भाषाओं को जोड़ने का ऑप्शन मिलता है, और सबसे ज़रूरी बात यह है कि अब यह ट्रांसलेशन को सिर्फ़ इंग्लिश तक ही सीमित नहीं रखता है।
गूगल मीट के ज़रिए एंटरप्राइज़ एक्सेस इस महीने प्राइवेट प्रीव्यू में शुरू होगा, और इसके बाद इसे बड़े लेवल पर रोलआउट किया जाएगा। डेवलपर्स आज जेमिनी लाइव API और गूगल AI स्टूडियो के ज़रिए पब्लिक प्रीव्यू में मॉडल को एक्सेस कर सकते हैं।
जेमिनी 3.5 लाइव ट्रांसलेट के हर ऑडियो आउटपुट में एक सिंथआईडी वॉटरमार्क होता है जो सीधे ऑडियो वेवफ़ॉर्म में एम्बेडेड होता है, जो इसे AI-जेनरेटेड कंटेंट के तौर पर पहचानता है। गूगल ने कन्फर्म किया है कि अभी इसे हटाने का कोई तरीका नहीं है।
Next Story





