img

Up Kiran, Digital Desk: टेक्नोलॉजी की दुनिया में गूगल ने एक और बड़ा धमाका किया है। आर्टिफिशियल इंटेलिजेंस (AI) की रेस में गूगल का सबसे एडवांस मॉडल, जेमिनी (Gemini), अब सिर्फ आपके लिखे हुए शब्दों (Text Prompts) से छोटे-छोटे वीडियो बना सकता है, और वो भी आवाज और डायलॉग के साथ! गूगल ने हाल ही में अपनी इस नई और हैरान कर देने वाली क्षमता का प्रदर्शन किया है, जिसने कंटेंट क्रिएटर्स और फिल्ममेकर्स के लिए भविष्य की नई संभावनाएं खोल दी हैं।

गूगल ने दिखाया है कि कैसे जेमिनी सिर्फ एक लाइन के कमांड से 8 सेकंड तक के हाई-डेफिनिशन (HD) वीडियो क्लिप तैयार कर सकता है। यह AI की दुनिया में एक बहुत बड़ा कदम है, क्योंकि अभी तक ज्यादातर AI वीडियो जेनरेटर सिर्फ मूक (silent) वीडियो ही बना पाते थे।

कैसे काम करता है यह जादू?

यह कोई एक AI मॉडल का कमाल नहीं है, बल्कि इसके पीछे गूगल के कई शक्तिशाली AI मॉडल्स की टीम काम करती है।

वीडियो जेनरेटर (Veo): सबसे पहले, गूगल का वीडियो जेनरेशन मॉडल 'Veo' आपके दिए गए टेक्स्ट प्रॉम्प्ट (जैसे- "एक अंतरिक्ष यात्री चांद पर डांस कर रहा है") को समझकर एक विजुअल क्लिप बनाता है। यह मॉडल करोड़ों वीडियो और तस्वीरों पर ट्रेन किया गया है, जिससे यह समझता है कि दुनिया कैसी दिखती और मूव करती है।

ऑडियो जेनरेटर (Lyria): इसके बाद, गूगल का सबसे एडवांस ऑडियो जेनरेशन मॉडल 'Lyria' इस वीडियो के लिए साउंड इफेक्ट्स, बैकग्राउंड म्यूजिक और यहां तक कि डायलॉग भी तैयार करता है। यह मॉडल वीडियो के कंटेंट को समझता है और उसी के हिसाब से आवाजें बनाता है। उदाहरण के लिए, अगर वीडियो में बारिश हो रही है, तो Lyria बारिश की आवाज बनाएगा।

लिप-सिंक (W.A.L.T): सबसे हैरान करने वाली तकनीक है गूगल का 'W.A.L.T' मॉडल। यह मॉडल वीडियो में मौजूद किरदारों के होठों को जेनरेट हुए डायलॉग के साथ परफेक्टली सिंक कर देता है। इसका मतलब है कि जब कोई किरदार बोलता है, तो ऐसा लगता है कि वह सच में वही डायलॉग बोल रहा है।

इन तीनों मॉडल्स को मिलाकर, जेमिनी एक ऐसा वीडियो तैयार करता है जिसमें विजुअल, साउंड और डायलॉग एक साथ होते हैं, जो देखने में काफी असली लगते हैं।

क्या है इसका भविष्य?

गूगल के CEO सुंदर पिचाई ने इसे "स्टोरीटेलिंग का भविष्य" बताया है। इस टेक्नोलॉजी से:कंटेंट क्रिएटर्स मिनटों में अपनी स्क्रिप्ट के लिए विजुअल तैयार कर सकते हैं।

फिल्ममेकर्स प्री-प्रोडक्शन के लिए स्टोरीबोर्ड और कॉन्सेप्ट वीडियो बना सकते हैं।

आम यूजर्स भी सिर्फ अपनी कल्पना को लिखकर उसे वीडियो में बदल सकते हैं।

हालांकि, यह तकनीक अभी शुरुआती दौर में है और आम लोगों के लिए उपलब्ध नहीं है, लेकिन इसने यह साफ कर दिया है कि AI की दुनिया में अगला बड़ा बदलाव वीडियो कंटेंट में ही आने वाला है।