Intereting Posts
झील वेल्स हाई स्कूल कीस्टोन प्रोजेक्ट स्पोर्टिंग एज – व्यक्तियों और टीमों के लिए क्या प्रौद्योगिकी आपके परिवार को फैला रहा है? जब अय्यूब लॉस स्ट्राइक्स: कैसे बचें और कामयाब हो आप बात करते हैं, हम सुनो अंतरिक्ष अंतिम फ्रंटियर नहीं है, लेकिन आपको इसे गले लगाने की जरूरत है जीवन के बड़े प्रश्न और ज्ञान के वृक्ष कार्रवाई में 50-0-50 नियम: कट्टर अनुलग्नक 10 युक्तियाँ जब आप बीमार होने के बीमार हैं कोशिश करने के लिए फिलीपींस, औपनिवेशिक मानसिकता, और मानसिक स्वास्थ्य अवधारणाओं की आलोचना करने से सावधान रहें आप पूरी तरह से समझ नहीं आते हैं समझने वाले सपने जानवरों के बारे में: हमारे सहज ज्ञान के बाद बर्डमैन की मौजूदगी संकट बिग बॉयज़ अभिनय बुरी तरह से भारी मारिजुआना का उपयोग आपके मस्तिष्क के डोपामाइन रिलीज़ को कम कर सकता है

न्यू एआई मेथड विद नॉटेड नेयुरिप्स अवार्ड

ODE नेटवर्क एक नवीन गहन तंत्रिका नेटवर्क मॉडल है।

pixabay/geralt

स्रोत: पिक्साबे / गेराल्ट

कृत्रिम बुद्धिमत्ता (एआई) में हालिया सफलताएं काफी हद तक गहरी सीखने के कारण हैं, एक मशीन सीखने की तकनीक जो कंप्यूटर को स्पष्ट हार्डकोडिंग से चलाने के बजाय कई प्रसंस्करण परतों के माध्यम से डेटा से सीखने में सक्षम बनाती है। अधिकांश गहरे सीखने के मॉडल कृत्रिम तंत्रिका नेटवर्क हैं, जो कुछ हद तक मानव मस्तिष्क के जैविक न्यूरॉन्स से प्रेरित हैं। पिछले महीने NeurIPS सम्मेलन में टोरंटो विश्वविद्यालय और कनाडा के वेक्टर इंस्टीट्यूट के एआई शोधकर्ताओं की एक टीम ने “न्यूरल ऑर्डिनरी डिफरेंशियल इक्वेशन” के लिए “बेस्ट पेपर अवार्ड” जीता, जो चयनित केवल चार पेपरों में से एक था। कृत्रिम बुद्धि पर केंद्रित सबसे बड़े सम्मेलनों में से कई हजारों वैज्ञानिक पत्र प्रस्तुत किए।

कई परतों वाले गहरे तंत्रिका नेटवर्क का प्रशिक्षण उथले वास्तुकला की तुलना में कहीं अधिक कठिन है जिसमें एक या दो परतों की संगणना होती है। गहन पर्यवेक्षित तंत्रिका नेटवर्क के क्रमिक-आधारित प्रशिक्षण की चुनौतियों में से एक यह है कि गणना की अधिक परतों के साथ एक अच्छा सामान्यीकरण पर पहुंचना अधिक कठिन होता है क्योंकि गिरावट होती है। Kaiming He और उनकी टीम ने Microsoft रिसर्च में परतों के सुधार के रूप में परतों के सुधार के संदर्भ में अवशिष्ट कार्यों को सीखने के द्वारा गिरावट की समस्या को संबोधित किया। अवशिष्ट नेटवर्क परिमित परिवर्तनों के असतत अनुक्रम को परिभाषित करके काम करते हैं। शोधकर्ताओं ने पाया कि उनके अवशिष्ट नेटवर्क बढ़ी हुई नेटवर्क गहराई के साथ सटीकता प्राप्त कर सकते हैं और इसे अनुकूलित करना भी आसान था।

हालांकि यह दृष्टिकोण एआई सिस्टम के लिए समस्याग्रस्त साबित हो सकता है जहां असतत अंतराल के बजाय डेटा इनपुट यादृच्छिक पर होता है। पारंपरिक आवर्तक तंत्रिका नेटवर्क समय श्रृंखला वास्तुकला इनपुट डेटा के लिए असतत अंतराल की आवश्यकता होती है। उदाहरण के लिए ऑटोमोबाइल लें। एक अच्छी तरह से काम करने वाला वाहन आमतौर पर नियमित रूप से निर्धारित रखरखाव के लिए डीलर से मिल सकता है। लेकिन क्या होता है जब कोई कार दुर्घटना, एक याद, या अप्रत्याशित खराबी होती है? वास्तविक जीवन में, डेटा बिंदु अक्सर यादृच्छिक समय पर होते हैं – अंतराल को असतत करने के लिए फिटिंग डेटा कम सटीकता में योगदान कर सकते हैं।

डेविड डुवेनॉड, जेसी बेटेनकोर्ट, रिकी टीक्यू चेन और यूलिया रुबानोवा की एआई शोध टीम ने एक नए प्रकार के स्केलेबल डीप न्यूरल नेटवर्क मॉडल की शुरुआत की, जो मेमोरी और पैरामीटर कुशल दोनों है। परिमित परिवर्तनों की परतों के असतत अनुक्रम का उपयोग करने के बजाय, उन्होंने एक ODE (साधारण विभेदक समीकरण) नेटवर्क से युक्त एक निरंतर गहराई वाले मॉडल को बनाने के लिए कलन के सिद्धांतों को लागू किया।

अनुसंधान दल ने “तंत्रिका नेटवर्क द्वारा निर्दिष्ट एक साधारण अंतर समीकरण (ODE) का उपयोग करके छिपी हुई इकाइयों की निरंतर गतिशीलता” को परिभाषित किया। ODE नेटवर्क एक ब्लैक-बॉक्स अंतर समीकरण सॉल्वर का उपयोग करके आउटपुट बनाता है जो ग्रेडिएंट्स की गणना करने के लिए सहायक विधि का उपयोग करता है।

इस संरचनात्मक दृष्टिकोण के कई फायदे हो सकते हैं। उनका मॉडल आगे की पास की मध्यवर्ती मात्रा को संग्रहीत नहीं करता है इसलिए यह स्मृति में आने पर लागत प्रभावी है। समाधान भी पैरामीटर कुशल है। पर्यवेक्षित शिक्षण कार्यों के लिए, कम मापदंडों की आवश्यकता होती है, क्योंकि छिपी हुई इकाई गतिकी को समय के निरंतर कार्य के रूप में परिचालित किया जाता है, तो पास की परतों के पैरामीटर स्वतः जुड़ जाते हैं। ODE नेटवर्क मॉडल एक निरंतर समय-श्रृंखला मॉडल है जिसे इनपुट डेटा के यादृच्छिक समय को शामिल करने के लिए डिज़ाइन किया गया है।

इन लाभों के साथ, ODE नेटवर्क में कई क्षेत्रों में गहरे तंत्रिका नेटवर्क को बाधित करने की क्षमता है जहां समय-श्रृंखला डेटा की घटनाएं नियमित अंतराल पर नहीं हो सकती हैं, जैसे स्वास्थ्य देखभाल रोगी की निगरानी, ​​विनिर्माण, व्यक्तिगत चिकित्सा, वैज्ञानिक अनुसंधान, स्वायत्त वाहन, फार्माकोकैमिक्स , परिसंपत्ति ट्रैकिंग सिस्टम, वित्तीय व्यापार, ग्राहक सेवा, व्यापार खुफिया, और कई और अधिक अनुप्रयोग। यह गहरे तंत्रिका नेटवर्क के लिए एक नया मॉडल है जिसमें भविष्य में कृत्रिम बुद्धिमत्ता को अगले स्तर तक ले जाने की क्षमता है।

संदर्भ

चेन, रिकी टीक्यू, रुबनोवा, यूलिया, बेटेनकोर्ट, जेसी, डुवेनॉड, डेविड। “न्यूरल ऑर्डिनरी डिफरेंशियल इक्वेशन “। arXiv: 1806.07366 19 जून 2018।

बेंगियो, योशुआ। “एअर इंडिया के लिए डीप आर्किटेक्चर सीखनामशीन लर्निंग में नींव और रुझान ।” Vol.2, नंबर 1 (2009)।

वह, कैमिंग, झांग, जियानग्यु, रेन शॉक्विंग, सन, जियान। “डीप रेजिडेंशियल लर्निंग फॉर इमेज रिकॉग्निशन।” arXiv: 1512.03385v1। 10 दिसंबर 2015।