अलीबाबा ने हैप्पी ऑयस्टर लॉन्च किया है, जो एक नया कृत्रिम बुद्धिमत्ता “विश्व मॉडल” है जो 3डी वातावरण और इंटरैक्टिव वीडियो बनाने में सक्षम है जो वास्तविक दुनिया भौतिकी का अनुकरण करता है। नए AI मॉडल की घोषणा OpenAI द्वारा अपनी सोरा वीडियो जेनरेशन सेवा को बंद करने के निर्णय के तुरंत बाद आई है। इस बीच, अलीबाबा के नए मॉडल को Tencent से भी प्रतिस्पर्धा का सामना करना पड़ रहा है, जिसका हुमायूं HY-वर्ल्ड 2.0 मॉडल वीडियो क्लिप से पूर्ण 3D दुनिया का पुनर्निर्माण करने में भी सक्षम है।
विशेष रूप से, हैप्पी ऑयस्टर पहले तब वायरल हो गया था जब छद्म नाम हैप्पीहॉर्स-1.0 के तहत मॉडल ने बेंचमार्क प्लेटफॉर्म आर्टिफिशियल एनालिसिस की टेक्स्ट-टू-वीडियो और इमेज-टू-वीडियो रैंकिंग में शीर्ष स्थान हासिल किया था। कंपनी ने बाद में खुलासा किया कि हैप्पी हॉर्स वास्तव में अलीबाबा द्वारा बनाया गया था, और मॉडल बाद में अन्य बेंचमार्किंग प्लेटफार्मों पर भी दिखाई दिया।
नए मॉडल की अपील के बारे में बताते हुए, अलीबाबा ने कहा, “पारंपरिक एआई वीडियो टूल के विपरीत, जो ‘प्रॉम्प्ट लिखें, रेंडरिंग के लिए प्रतीक्षा करें, एक तैयार क्लिप प्राप्त करें’ के एक-शॉट वर्कफ़्लो का पालन करते हैं, हैप्पी ऑयस्टर पीढ़ी प्रक्रिया के दौरान सुनता और प्रतिक्रिया देता रहता है। दृश्य वास्तविक समय में प्रतिक्रिया करता है और विकसित होता रहता है क्योंकि उपयोगकर्ता निर्देश देता रहता है।”
हैप्पी ऑयस्टर क्यों खास है?
अलीबाबा ने अपने आधिकारिक ब्लॉग में बताया कि हैप्पी ऑयस्टर दो मुख्य तरीकों से संचालित होता है: निर्देशन और घूमना।
कंपनी ने अपने ब्लॉग पोस्ट में बताया कि केवल मानक फुटेज तैयार करने के बजाय, निर्देशन मोड एक “चलती हुई भौतिक दुनिया बनाता है जहां प्रकाश, गुरुत्वाकर्षण, चरित्र गति और दृश्य कारणता समय के साथ निरंतर और सुसंगत रहती है।” अलीबाबा का कहना है कि उपयोगकर्ता किसी भी समय कैमरा एंगल बदलने, पात्रों को निर्देशित करने या वास्तविक समय में कहानी को बदलने के लिए टेक्स्ट, आवाज या छवि संकेतों का उपयोग कर सकते हैं।
चीनी टेक दिग्गज ने अपने ब्लॉग पोस्ट में कहा कि मॉडल का वांडरिंग मोड उपयोगकर्ताओं को एक टेक्स्ट या इमेज प्रॉम्प्ट से एक असीम विस्तार योग्य दुनिया बनाने और तलाशने की अनुमति देता है। कंपनी का कहना है कि उपयोगकर्ता उत्पन्न वातावरण में प्रथम-व्यक्ति परिप्रेक्ष्य में घूम सकते हैं, मानक WASD कीबोर्ड और कैमरा नियंत्रण के साथ अपने आंदोलन को नियंत्रित कर सकते हैं, जबकि दुनिया स्थिर और निरंतर रहती है।
कंपनी ने अपने ब्लॉग पोस्ट में कहा, “उपयोगकर्ता प्रथम-व्यक्ति में घूम सकते हैं, स्वतंत्र रूप से दिशा और कैमरे की गति बदल सकते हैं, और मूल फ्रेम से आगे बढ़ सकते हैं, जबकि दुनिया उत्पन्न होती रहती है और सुसंगत रहती है।”
अलीबाबा का कहना है कि दोनों मोड मल्टीमॉडल इनपुट का समर्थन करते हैं और पूर्ण ऑडियो और वीडियो आउटपुट उत्पन्न कर सकते हैं। निर्देशन मोड 480p या 720p रिज़ॉल्यूशन पर तीन मिनट तक लगातार वीडियो उत्पन्न कर सकता है। इस बीच, वांडरिंग मोड वर्तमान में 480p रिज़ॉल्यूशन पर एक मिनट की पीढ़ी तक सीमित है।
हैप्पी ऑयस्टर का उपयोग किस लिए किया जा सकता है?
अलीबाबा का कहना है कि उसके नए मॉडल का उपयोग वास्तविक समय में फिल्म निर्माण, त्वरित स्टोरीबोर्डिंग और इंटरैक्टिव लघु श्रृंखला बनाने के लिए किया जा सकता है, जहां “दर्शकों की पसंद हर घड़ी को अद्वितीय बनाती है”। गेमिंग क्षेत्र के लिए, कंपनी का कहना है कि हैप्पी ऑयस्टर का उपयोग अवधारणा विकास के लिए अपने सुसंगत तर्क और विद्या के साथ संकेतों को खेलने योग्य दुनिया में बदलने के लिए किया जा सकता है।
अलीबाबा का कहना है कि यह मॉडल Happyoyster.cn पर प्रतीक्षा सूची के लिए पंजीकरण करके ‘अर्ली एक्सेस’ पर उपलब्ध है










Leave a Reply