स्टार्टअप, जिसने लोकप्रिय स्टेबल डिफ्यूजन एआई इमेज जनरेटर का सह-निर्माण किया है, ने एक एआई मॉडल जारी किया है जो किसी भी पाठ विवरण को लेता है – जैसे “आकाश में उड़ने वाले कछुए” – और मिलान करने वाले वीडियो फुटेज के तीन सेकंड उत्पन्न करता है।
सुरक्षा और व्यावसायिक कारणों का हवाला देते हुए, रनवे मॉडल को व्यापक रूप से शुरू करने के लिए जारी नहीं कर रहा है, न ही यह स्थिर प्रसार की तरह खुला-स्रोत होगा। टेक्स्ट-टू-वीडियो मॉडल, जिसे Gen-2 डब किया गया है, शुरू में रनवे वेबसाइट पर प्रतीक्षा सूची के माध्यम से डिस्कॉर्ड पर उपलब्ध होगा।
टेक्स्ट इनपुट से वीडियो बनाने के लिए एआई का इस्तेमाल करना कोई नई बात नहीं है। मेटा प्लेटफ़ॉर्म और Google दोनों ने पिछले साल के अंत में टेक्स्ट-टू-वीडियो एआई मॉडल पर शोध पत्र जारी किए। हालांकि, अंतर यह है कि रनवे के टेक्स्ट-टू-वीडियो एआई मॉडल को आम जनता के लिए उपलब्ध कराया जा रहा है, रनवे के मुख्य कार्यकारी अधिकारी क्रिस्टोबल वालेंज़ुएला ने कहा।
रनवे को उम्मीद है कि क्रिएटिव और फिल्म निर्माता उत्पाद का उपयोग करेंगे, वालेंज़ुएला ने कहा।
पिछले महीने, चिप बनाने वाली दिग्गज कंपनी क्वालकॉम ने स्टेबल डिफ्यूजन 1.5, एआई इमेज जनरेटर का प्रदर्शन किया, जो मोबाइल वर्ल्ड कांग्रेस (एमडब्ल्यूसी) 2023 से पहले बिना नेटवर्क एक्सेस वाले एंड्रॉइड हैंडसेट पर चल रहा था। क्वालकॉम के अनुसार, एआई टूल की कंपनी की तैनाती, जिसके लिए आमतौर पर बहुत सारी कंप्यूटिंग शक्ति, कुछ सेकंड में चित्र बनाने में सक्षम है। कंपनी ने स्मार्टफोन पर स्थानीय रूप से चलने के लिए AI टूल को ऑप्टिमाइज़ करने के लिए उपयोग किए जाने वाले स्मार्टफोन हार्डवेयर के विवरण का खुलासा नहीं किया।
लोकप्रिय जनरेटिव AI टूल चलाने के लिए बहुत अधिक कंप्यूटिंग शक्ति का उपभोग करने के लिए जाना जाता है, यही वजह है कि कई सेवाएं जो इस पर निर्भर करती हैं, इन गतिविधियों को उपयोगकर्ता के स्मार्टफोन या कंप्यूटर के बजाय बड़े सर्वर पर करती हैं।
© थॉमसन रॉयटर्स 2023