Up Kiran, Digital Desk: टेक्नोलॉजी की दुनिया में गूगल ने एक और बड़ा धमाका किया है। आर्टिफिशियल इंटेलिजेंस (AI) की रेस में गूगल का सबसे एडवांस मॉडल, जेमिनी (Gemini), अब सिर्फ आपके लिखे हुए शब्दों (Text Prompts) से छोटे-छोटे वीडियो बना सकता है, और वो भी आवाज और डायलॉग के साथ! गूगल ने हाल ही में अपनी इस नई और हैरान कर देने वाली क्षमता का प्रदर्शन किया है, जिसने कंटेंट क्रिएटर्स और फिल्ममेकर्स के लिए भविष्य की नई संभावनाएं खोल दी हैं।
गूगल ने दिखाया है कि कैसे जेमिनी सिर्फ एक लाइन के कमांड से 8 सेकंड तक के हाई-डेफिनिशन (HD) वीडियो क्लिप तैयार कर सकता है। यह AI की दुनिया में एक बहुत बड़ा कदम है, क्योंकि अभी तक ज्यादातर AI वीडियो जेनरेटर सिर्फ मूक (silent) वीडियो ही बना पाते थे।
कैसे काम करता है यह जादू?
यह कोई एक AI मॉडल का कमाल नहीं है, बल्कि इसके पीछे गूगल के कई शक्तिशाली AI मॉडल्स की टीम काम करती है।
वीडियो जेनरेटर (Veo): सबसे पहले, गूगल का वीडियो जेनरेशन मॉडल 'Veo' आपके दिए गए टेक्स्ट प्रॉम्प्ट (जैसे- "एक अंतरिक्ष यात्री चांद पर डांस कर रहा है") को समझकर एक विजुअल क्लिप बनाता है। यह मॉडल करोड़ों वीडियो और तस्वीरों पर ट्रेन किया गया है, जिससे यह समझता है कि दुनिया कैसी दिखती और मूव करती है।
ऑडियो जेनरेटर (Lyria): इसके बाद, गूगल का सबसे एडवांस ऑडियो जेनरेशन मॉडल 'Lyria' इस वीडियो के लिए साउंड इफेक्ट्स, बैकग्राउंड म्यूजिक और यहां तक कि डायलॉग भी तैयार करता है। यह मॉडल वीडियो के कंटेंट को समझता है और उसी के हिसाब से आवाजें बनाता है। उदाहरण के लिए, अगर वीडियो में बारिश हो रही है, तो Lyria बारिश की आवाज बनाएगा।
लिप-सिंक (W.A.L.T): सबसे हैरान करने वाली तकनीक है गूगल का 'W.A.L.T' मॉडल। यह मॉडल वीडियो में मौजूद किरदारों के होठों को जेनरेट हुए डायलॉग के साथ परफेक्टली सिंक कर देता है। इसका मतलब है कि जब कोई किरदार बोलता है, तो ऐसा लगता है कि वह सच में वही डायलॉग बोल रहा है।
इन तीनों मॉडल्स को मिलाकर, जेमिनी एक ऐसा वीडियो तैयार करता है जिसमें विजुअल, साउंड और डायलॉग एक साथ होते हैं, जो देखने में काफी असली लगते हैं।
क्या है इसका भविष्य?
गूगल के CEO सुंदर पिचाई ने इसे "स्टोरीटेलिंग का भविष्य" बताया है। इस टेक्नोलॉजी से:कंटेंट क्रिएटर्स मिनटों में अपनी स्क्रिप्ट के लिए विजुअल तैयार कर सकते हैं।
फिल्ममेकर्स प्री-प्रोडक्शन के लिए स्टोरीबोर्ड और कॉन्सेप्ट वीडियो बना सकते हैं।
आम यूजर्स भी सिर्फ अपनी कल्पना को लिखकर उसे वीडियो में बदल सकते हैं।
हालांकि, यह तकनीक अभी शुरुआती दौर में है और आम लोगों के लिए उपलब्ध नहीं है, लेकिन इसने यह साफ कर दिया है कि AI की दुनिया में अगला बड़ा बदलाव वीडियो कंटेंट में ही आने वाला है।




