द अचिल्स ‘हील ऑफ एआई कंप्यूटर विजन

एआई और तंत्रिका विज्ञान की बाध्यकारी समस्या।

pixabay

स्रोत: पिक्साबे

क्या आप स्वायत्त वाहन में सवारी करेंगे यदि आप जानते हैं कि यह दृश्य समस्याओं के अधीन था? एक्स-रे, अल्ट्रासाउंड, सीटी, पीईटी, या एमआरआई स्कैन जैसी रेडियोलॉजिकल छवियों की कंप्यूटर व्याख्या के आधार पर कैंसर के उपचार के बारे में कैसे पता चलेगा कि कंप्यूटर की दृष्टि को आसानी से बेवकूफ बनाया जा सकता है? कंप्यूटर की दृष्टि में एक समस्या है-यह केवल मशीन इनपुट एल्गोरिदम में डेटा में थोड़े से बदलाव को “गलत” चीजों को देखने में बदल देता है।

कंप्यूटर विजन में हालिया प्रगति काफी हद तक गहरी सीखने, मशीन-आधारित सीखने के एक प्रकार के माध्यम से बेहतर पैटर्न-मान्यता क्षमताओं के कारण हैं। मशीन लर्निंग आर्टिफिशियल इंटेलिजेंस का एक उपसमुच्चय है, जहां कंप्यूटर इनपुट डेटा से प्रोसेसिंग डेटा से अवधारणाओं को सीखने में सक्षम होता है, जहां प्रशिक्षण डेटा को लेबल किया जाता है, या बिना अनपेक्षित शिक्षण या स्पष्ट प्रोग्रामिंग के बिना संयोजन के रूप में। गहरी सीखने की गहराई अपने तंत्रिका नेटवर्क में कृत्रिम तंत्रिका प्रसंस्करण परतों की संख्या को संदर्भित करती है।

केविन आइकॉल्ट, इवान इविटिमोव और कैलिफोर्निया विश्वविद्यालय बर्कले, मिशिगन विश्वविद्यालय, स्टोनी ब्रुक विश्वविद्यालय और वाशिंगटन विश्वविद्यालय के अतिरिक्त शोधकर्ताओं के साथ कृत्रिम बुद्धिमत्ता (एआई) शोधकर्ताओं की एक टीम ने पाया कि यह केवल एक पड़ाव में थोड़े से बदलाव को लेती है। काले और सफेद स्टिकर का उपयोग करते हुए साइन इन करने के लिए अत्याधुनिक डीप न्यूरल नेटवर्क (DNNs) चित्रों को मिसकॉलिफाई करना है। टीम ने अप्रैल 2018 में arXiv में अपने निष्कर्ष प्रकाशित किए।

गहन सीखने के लिए वर्तमान कमियों में से एक प्रशिक्षण के लिए कंप्यूटर के लिए आवश्यक बड़ी मात्रा में डेटा है। इसके विपरीत, एक बार एक बच्चा सीखता है कि एक पक्षी क्या है, वह या तो वह आसानी से एक जानवर की पहचान कर सकता है, क्योंकि उसे अस्तित्व में रहने वाले विभिन्न प्रजातियों के सभी सीखना होगा।

मस्तिष्क के विभिन्न क्षेत्र विभिन्न प्रकार के इनपुट की प्रक्रिया करते हैं। उदाहरण के लिए, पार्श्विका लोब मस्तिष्क का वह क्षेत्र है जहां स्पर्श, तापमान और दर्द के लिए संवेदी इनपुट संसाधित होते हैं। ओसीसीपिटल लोब दृष्टि की व्याख्या करता है। टेम्पोरल लोब सुनने में भूमिका निभाता है। मस्तिष्क के विभिन्न क्षेत्रों में विभिन्न क्षेत्रों में संवेदी इनपुट को देखते हुए, यह एक एकीकृत अनुभव कैसे बनता है? यह बाध्यकारी समस्या का वर्णन करता है।

उदाहरण के लिए, जब आकाश में एक जेट हवाई जहाज ऊपर से गुजरता है, तो मस्तिष्क जानता है कि झपट्टा मारने की आवाज उससे मेल खाती है। मस्तिष्क यह मानता है कि पंख, पूंछ, धड़ और श्वेत प्रदर (संक्षेपण निशान) जेट के हैं, न कि आसपास के आकाश, सूरज या पृष्ठभूमि के बादलों। किसी तरह, मानव मस्तिष्क विभिन्न संवेदी इनपुट डेटा जैसे दृष्टि, ध्वनि, स्वाद, गंध और स्पर्श का सेवन करने में सक्षम होता है और एक सुसंगत अनुभव की रचना करता है। फिर भी यह वैज्ञानिकों के लिए एक रहस्य है कि मस्तिष्क कैसे करता है।

ब्रिटिश गणितज्ञ और तंत्रिका विज्ञानी प्रोफेसर साइमन स्ट्रिंगर ऑफ ऑक्सफोर्ड फाउंडेशन फॉर थियोरेटिकल न्यूरोसाइंस एंड आर्टिफिशियल इंटेलिजेंस वर्तमान में मस्तिष्क में न्यूरॉन्स के लिए शोध कर रहा है जो “बाइंडिंग न्यूरॉन्स” के रूप में कार्य करते हैं और 20 साल के भीतर एक मशीन पर “चूहे जैसी खुफिया” को सर्वोत्तम करने की महत्वाकांक्षा रखते हैं।

अभी के लिए, एआई शोधकर्ताओं के लिए वर्कअराउंड का उद्देश्य औसत पर अच्छा प्रदर्शन प्राप्त करना है, जब यह दृश्य छवियों की सही व्याख्या करने की बात आती है।

“आँख केवल वही देखती है जो मन को समझने के लिए तैयार किया जाता है।” – रॉबर्टसन डेविस

कॉपीराइट © 2019 केमी रोसो सभी अधिकार सुरक्षित।

संदर्भ

नेशनल ज्योग्राफिक। “ब्रेन।” https://www.nationalgeographic.com/science/health-and-human-body/human-body/brain/ से 1-16-2019 को लिया गया।

आईखोल्ट, केविन, इविटिमोव, इवान, फर्नांडीस, अर्लेंस, ली, बो, रहमती, अमीर, जिओ, चौवेई, प्रकाश, अतुल, कोहो, ताडायोशी, गीत, डॉन। “डीप लर्निंग विज़ुअल क्लासिफिकेशन पर रोबस्ट फिजिकल-वर्ल्ड अटैक।” arXiv : 1707.08945v5। 10 अप्रैल 2018।

गेडेस, लिंडा। “‘अजीब घटनाएं’ जो मशीनों को मतिभ्रम बनाती हैं।” बीबीसी 5 दिसंबर 2018।