अभिसरण बाधा को तोड़ना, क्वेरी और टेक्स्ट अभ्यावेदन का अनुमान लगाना

यह इस साल प्रकाशित सबसे दिलचस्प एआई शोध प्रकाशन है। यह अधिक एकत्र करता है हाल की उपलब्धियां आर्टिफिशियल इंटेलिजेंस और डेटा साइंस में। यह कालानुक्रमिक रूप से एक लेख के लिंक के साथ व्यवस्थित किया गया है जो अधिक विवरण में जाता है।

अभिसरण बाधा को तोड़ना: निरंतर समय में अभिसरण धाराओं के माध्यम से अनुकूलन

त्वरित ढाल विधियां बड़े पैमाने पर डेटा-संचालित अनुकूलन समस्याओं की रीढ़ हैं और मशीन सीखने और अन्य क्षेत्रों में स्वाभाविक रूप से दिखाई देती हैं जो डेटा विश्लेषण से संबंधित हैं।

यहां, शोधकर्ता त्वरण के लिए एक ढाल-आधारित अनुकूलन ढांचा प्रस्तुत करते हैं। यह गतिशील प्रणालियों की अस्थायी स्थिर स्थिरता के हाल ही में शुरू किए गए विचार पर आधारित है। यह विधि सरल ग्रेडिएंट-आधारित विधियों का एक सामान्यीकरण प्रतीत होती है, जो एक निर्दिष्ट समय में ऑप्टिमाइज़र में परिवर्तित होने के लिए पैमाना है, भले ही समस्या को शुरू में कैसे सेट किया गया हो। शोधकर्ता इसे पहले निरंतर समय सीमा का उपयोग करके निरंतर समय स्थिर गतिशील प्रणालियों को डिजाइन करने के लिए करते हैं। फिर वे एक सुसंगत विवेकाधीन रणनीति पेश करते हैं जैसे कि समतुल्य असतत-समय एल्गोरिथ्म एक निश्चित संख्या में पुनरावृत्तियों में अनुकूलक को ट्रैक कर सकता है। यह एक सैद्धांतिक विश्लेषण भी प्रदान करता है कि प्रस्तावित ढाल प्रवाह कैसे अभिसरण करता है। इसके अलावा, वे एक साथ जोड़े गए गड़बड़ी को किस हद तक संभालने में सक्षम हैं।

शोधकर्ताओं ने यह भी दिखाया कि निरंतर समय अभिसरण के कारण अभिसरण की दर से जुड़ा अफसोस हमेशा समान होता है। हाइपरपैरामीटर का अर्थ समझना आसान है, और हम वांछित आत्मीयता दरों की जरूरतों को पूरा करने के लिए उन्हें बदल सकते हैं। वे कई संख्यात्मक उदाहरणों में सर्वोत्तम अनुकूलन एल्गोरिदम के साथ प्रस्तावित योजनाओं के त्वरित अभिसरण की तुलना करते हैं। इसके अलावा, उनका काम हमें निरंतर समय में धाराओं को विघटित करके नए अनुकूलन एल्गोरिदम बनाने के बारे में विचार देता है।

READ  संयुक्त राज्य अमेरिका में एक मानव खेत पर एक SpaceX मिसाइल भूमि का मलबा

प्रेडिकेट-अवेयर क्वेरी राउंडिंग कंडीशनल सिंथेसिस मॉडल

अनुमानित क्वेरी प्रोसेसिंग (एक्यूपी) का उद्देश्य महंगे थोक प्रश्नों के त्वरित लेकिन “पर्याप्त पर्याप्त” उत्तर प्रदान करना है, जिससे उपयोगकर्ताओं के लिए बड़े डेटा सेट को अंतःक्रियात्मक रूप से एक्सप्लोर करना आसान हो जाता है। डेटाबेस क्लस्टर में पारंपरिक क्वेरी प्रोसेसिंग की तुलना में, मशीन लर्निंग पर आधारित हाल ही में प्रस्तावित AQP तकनीक बहुत कम प्रतिक्रिया समय प्रदान कर सकती है क्योंकि क्वेरी निष्पादन में केवल मॉडल अनुमान शामिल है।

लेकिन इन विधियों की राउंडिंग त्रुटि खराब हो जाती है क्योंकि फ़िल्टर की संख्या (WHERE क्लॉज़) बढ़ जाती है। अंतर्दृष्टि खोजने के लिए, विश्लेषक अक्सर बहुत से विधेय वाले प्रश्नों का उपयोग करते हैं। इसलिए यदि विश्लेषक गलत निष्कर्ष नहीं निकालना चाहते हैं तो अनुमानित त्रुटि को कम रखना महत्वपूर्ण है।

इस पत्र में, शोधकर्ताओं ने इलेक्ट्रा का प्रस्ताव दिया है, जो एक देशी कथित AQP प्रणाली है जो कई विधेय और बहुत अधिक छोटी गोल त्रुटियों के साथ विश्लेषिकी शैली के प्रश्नों का उत्तर दे सकती है। इलेक्ट्रा एक सशर्त निर्माण मॉडल का उपयोग करता है जो डेटा के सशर्त वितरण को सीखता है और, रन टाइम पर, एक छोटा (1000) लेकिन प्रतिनिधि नमूना उत्पन्न करता है, जिस पर परिणाम का अनुमान लगाने के लिए क्वेरी को चलाया जाता है। तीन वास्तविक दुनिया के डेटासेट और चार अलग-अलग बेसलाइन का उपयोग करके उनके परीक्षण से पता चलता है कि इलेक्ट्रा में बेसलाइन की तुलना में कई विधेय के लिए कम AQP त्रुटि है।

गैर पर्यवेक्षित व्याकरण जाँच के लिए पाठ अभ्यावेदन का गहन संयोजन

READ  एक अधिकारी का कहना है कि अंतरिक्ष स्टेशन के घूर्णन के प्रभाव के अध्ययन की आवश्यकता है

शोधकर्ता इस बात की जांच कर रहे हैं कि कैसे गहन क्लस्टर टेक्स्ट अभ्यावेदन असुरक्षित मॉडल को सिंटैक्स को समझने और सीखने में मदद कर सकते हैं। चूंकि ये उच्च आयामी प्रतिनिधित्व हैं, KMeans जैसी विधियां अच्छी तरह से काम नहीं करती हैं। इसलिए, उनका दृष्टिकोण निरूपण को एक निम्न आयामी स्थान में बदल देता है जो उन्हें समूहबद्ध करने और फिर उन्हें समूहबद्ध करने के लिए अच्छा है।

इस काम में, शोधकर्ता वाक्य रचना के बारे में दो विचारों की जांच करते हैं: भाषण के लिए आंशिक प्रेरण (पीओएसआई) और निर्वाचन क्षेत्र लेबलिंग (कोलैब)। उन्हें यह दिलचस्प लगा कि बहुभाषी BERT (mBERT) अंग्रेजी व्याकरण की आश्चर्यजनक मात्रा जानता है, और शायद अंग्रेजी BERT (EBERT) भी। उनके मॉडल को किसी ऐसी चीज़ को देखने के लिए एक अनुपयोगी जांच के रूप में इस्तेमाल किया जा सकता है जो कम पक्षपाती हो सकती है। उन्होंने पाया कि पर्यवेक्षित जांच की तुलना में असुरक्षित जांच ऊपरी परतों से लाभान्वित होती है। इसके अलावा, शोधकर्ताओं का यह भी कहना है कि उनकी असुरक्षित जांच में विभिन्न तरीकों से POSI के EBERT और mBERT अभ्यावेदन का उपयोग किया जाता है। अंत में, उन्होंने दिखाया कि उनकी जांच यह दिखा कर काम करती है कि इसे एक असुरक्षित भाषा प्रेरण पद्धति के रूप में इस्तेमाल किया जा सकता है। उनकी जांच दोनों व्याकरणिक रूपों के साथ अच्छी तरह से काम करती है क्योंकि यह बदलती है कि कैसे इनपुट का प्रतिनिधित्व किया जाता है।

इसके अलावा, शोधकर्ताओं का कहना है कि उनकी जांच ने 45 अंकों की अंग्रेजी भाषा पीओएसआई में अच्छा प्रदर्शन किया, दस भाषाओं में 12 पीओएसआई अंकों में हाल ही में, और कोलैब में अच्छा प्रदर्शन किया। वे कुछ संसाधनों के साथ भाषाओं पर थोड़ा व्याकरणिक आंदोलन भी करते हैं और कहते हैं कि परिणाम आशाजनक हैं।

READ  चीन ने चंद्रमा की सतह पर एक नया खनिज खोजा, और यह उपलब्धि हासिल करने वाला तीसरा देश बन गया

प्रातिक्रिया दे

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *