NVIDIA का AI मॉडल टेक्स्ट डिस्क्रिप्शन से 3D मॉडल तैयार कर सकता है

द्वारा पलक झपकाना 24 नवंबर, 2022

सभी उपयोगकर्ताओं के लिए 3डी? Nvidia का Magic3D टेक्स्ट से 3D मॉडल बना सकता है।

एनवीडिया के शोधकर्ताओं ने शुक्रवार को मैजिक 3डी पेश किया, जो एक आर्टिफिशियल इंटेलिजेंस सिस्टम है, जो टेक्स्ट डिस्क्रिप्शन से 3डी मॉडल जेनरेट कर सकता है। Magic3D “वाटर लिली पर बैठा एक ब्लू-डार्ट मेंढक” जैसा संकेत प्राप्त करने के बाद लगभग 40 मिनट में रंगीन बनावट के साथ एक 3D मेश मॉडल बनाता है। बनाए गए मॉडल को बदला जा सकता है और वीडियो गेम या सीजीआई आर्टवर्क में इस्तेमाल किया जा सकता है। Nvidia ने Magic3D को DreamFusion की प्रतिक्रिया के रूप में तैयार किया, टेक्स्ट-टू-3D मॉडल Google शोधकर्ताओं ने सितंबर में अपने अकादमिक लेख में प्रकट किया। Magic3D कम रिज़ॉल्यूशन पर बनाए गए कच्चे मॉडल को लेने के लिए दो चरण की तकनीक का उपयोग करता है और इसे उच्च रिज़ॉल्यूशन में परिशोधित करता है, जैसे कि ड्रीमफ़्यूज़न 2D छवि बनाने के लिए टेक्स्ट-टू-इमेज मॉडल का उपयोग करता है जिसे बाद में वॉल्यूमेट्रिक NeRF पर अनुकूलित किया जाता है ( तंत्रिका विकिरण क्षेत्र) डेटा। शोध लेखकों का दावा है कि परिणामी Magic3D विधि DreamFusion की तुलना में दोगुनी तेजी से 3D ऑब्जेक्ट बना सकती है।

Magic3D में संकेतों का उपयोग करके 3D मेश को भी संपादित किया जा सकता है। शब्दों को बदलकर मॉडल को संशोधित करने के लिए एक बुनियादी वेक्टर और एक कम-रिज़ॉल्यूशन 3डी मॉडल का उपयोग किया जा सकता है। Magic3D के निर्माता यह भी दिखाते हैं कि एक 3D मॉडल को 2D छवि में कैसे परिवर्तित किया जाए, जिसमें 2D चित्र की उपस्थिति हो, जैसे कि क्यूबिस्ट पेंटिंग, और एक ही विषय वस्तु को कई पीढ़ियों में कैसे बनाए रखा जाए (एक अभ्यास जिसे सुसंगतता के रूप में जाना जाता है)। Nvidia के वैज्ञानिक अध्ययन में कोई Magic3D कोड शामिल नहीं था।

READ  बेडवार्स, स्काईवार्स, सर्वाइवल, मर्डर मिस्ट्री और बहुत कुछ का अनुभव करने के लिए बेस्ट माइनक्राफ्ट सर्वर

मौजूदा प्रसार मॉडल, जो डेटा के एक सेट पर व्यापक प्रशिक्षण के बाद नई सामग्री उत्पन्न करने के लिए तंत्रिका नेटवर्क का उपयोग करते हैं, पाठ से 3डी उत्पन्न करने में सक्षम होने के लिए एक प्राकृतिक कदम की तरह लगते हैं। टेक्स्ट-टू-इमेज मॉडल जैसे DALL-E और स्टेबल डिफ्यूजन विकसित किए गए हैं और साथ ही 2022 में Google और मेटा से मूल टेक्स्ट-टू-वीडियो जेनरेटर भी विकसित किए गए हैं। उपरोक्त 3D टेक्स्ट-टू-इमेज मॉडल ड्रीमफ्यूजन भी Google द्वारा पेश किया गया था। कुछ महीने पहले, और तब से, लोगों ने इसे स्थिर परिनियोजन के आधार पर एक ओपन सोर्स मॉडल के रूप में उपयोग करने के तुलनीय तरीके विकसित किए हैं।

मैजिक 3डी को विकसित करने वाले शोधकर्ताओं का मानना ​​है कि तकनीक बिना किसी विशेष प्रशिक्षण के हर किसी के लिए 3डी मॉडल बनाना संभव बनाएगी। एक बार विकसित होने के बाद, परिणामी तकनीक वीडियो गेम (और आभासी वास्तविकता) के निर्माण को गति देगी और संभवतः फिल्मों और टीवी शो के लिए विशेष प्रभावों में उपयोग करेगी। “हम मानते हैं कि Magic3D के साथ हम 3D संश्लेषण का लोकतंत्रीकरण कर सकते हैं और 3D सामग्री के निर्माण में हर किसी की रचनात्मकता को अनलॉक कर सकते हैं,” लेखक अपने लेख के अंत में समाप्त करते हैं।

इस लेख का हिस्सा

साझा करने के लिए कुछ करें

लेखक के बारे में

लेखक के बारे में अधिक जानकारी

प्रातिक्रिया दे

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *