Intereting Posts
जो लोग कंसुलेशन वाले लोगों को जज करते हैं यह क्यों? आघात क्लैप्टन आघात से उपचार पर खुशी असंभव है अमेरिकी छात्रों ने चीनी के पीछे बुरी तरह प्रभावित; केवी गवर्नर निधि सृजनवादी पार्क एक लिंग नीति एक चूसो मत बनो: नकली समाचार का पता लगाने के लिए महिलाओं को हम से नफरत करते हैं और हम उन्हें क्यों नफरत करते हैं अमेरिका क्यों नहीं पढ़ सकता है इमोजी इंटेलिजेंस: आपके संचार को बढ़ाने के लिए तीन युक्तियाँ साइकोडैनेमिक वि। संज्ञानात्मक थेरेपी: रक्षा तंत्र एक मनोचिकित्सक स्टेज ड्रिवर के साथ स्ट्रिपर्स का इलाज कर रहा है … शादी प्रश्नोत्तरी बचपन की सामाजिक कठिनाइयां समझना माता-पिता को दोष देना – या जब चीजें गलत हो जाती हैं, इसकी गलती क्या है?

आप जो भी पसंद करते हो

सोशल मीडिया पर आपके कार्यों के बारे में क्या कहते हैं।

शुक्रवार को, फेसबुक ने कैम्ब्रिज एनालिटिका (सीए) पर प्रतिबंध लगा दिया। हम चुनाव के ठीक बाद 2016 के अमेरिकी राष्ट्रपति चुनाव में खेले गए सीए के विशिष्ट रूप से लक्षित विज्ञापन दृष्टिकोण की भूमिका के बारे में बात कर रहे हैं। डेटा प्रबंधन प्रोटोकॉल का उल्लंघन होने के कारण यह हालिया प्रतिबंध हाल ही में हुआ है (जो व्यापक रूप से डेटा को प्राप्त, स्थानांतरित और संग्रहीत किया जाता है) – उन डेटा के तरीके के कारण नहीं। एक अकादमिक शोधकर्ता (अलेक्जेंडर कोगन) ने उपयोगकर्ताओं को फेसबुक पर अपने व्यवहार के व्यवहार से उपयोगकर्ताओं की व्यक्तित्व का अनुमान लगाने के लिए डिज़ाइन किए गए ऐप में ऑप्ट-इन करने के लिए डेटा पूछकर डेटा प्राप्त किया। समस्या तब शुरू हुई जब डॉ कोगन ने किसी और को डेटा प्रदान करना चुना। सीए को फेसबुक से प्रतिबंधित कर दिया गया है क्योंकि उन्होंने डेटा का उपयोग नहीं किया और इस्तेमाल किया, लेकिन क्योंकि वे इसे करने के लिए उचित चैनलों से नहीं गए। फेसबुक ने डेटा प्रबंधन प्रोटोकॉल में ब्रेक के बारे में पता लगाया और अनुरोध किया कि सीए डेटा हटा दें। सीए सहमत हो गया, लेकिन फिर फेसबुक ने एक व्हिस्टलब्लॉवर से पता चला कि उन्होंने झूठ बोला था, और इसलिए अब सीए पर प्रतिबंध लगा दिया गया है।

Blogtrepreneur/flickr

स्रोत: ब्लॉग उद्यमी / फ़्लिकर

लेकिन सबसे अधिक ध्यान प्राप्त करने का तरीका यह है कि उन डेटा का उपयोग कैसे किया गया था। उपयोगकर्ताओं की विशेषताओं की भविष्यवाणी करने के लिए ज्यादातर लोगों के लिए चौंकाने वाला प्रतीत होता है कि किस तरह के निर्दोष ऑनलाइन व्यवहार का उपयोग किया जा सकता है। ऐसी भविष्यवाणी और लक्ष्यीकरण हर रोज होता है, जब भी आप किसी ऐसे व्यवहार में संलग्न होते हैं जिसे आपकी पहचान से जोड़ा जा सकता है (या तो ऑनलाइन, सोशल मीडिया प्रोफाइल के माध्यम से जो ईमेल पते या साइट कुकीज़ की तुलना करके या ‘असली दुनिया’ की तुलना में वेबसाइटों पर व्यक्तियों को ट्रैक करता है क्रेडिट रिपोर्टिंग एजेंसियों द्वारा मिलान किए जा रहे विभिन्न बैंक और क्रेडिट कार्ड का उपयोग करके विभिन्न दुकानों पर खरीदी गई खरीद)। इनमें से अधिकतर पूर्वानुमान पृष्ठभूमि में होता है, उपभोक्ताओं के बारे में शायद ही कभी इसके बारे में सोचते हैं, और उपयोगकर्ता के समझौते के ठीक प्रिंट में डेटा के संग्रहण और उपयोग के लिए सहमति मौजूद है, जिनमें से अधिकांश बिना सोच के क्लिक करते हैं।

आपके बारे में आपके ‘पसंद’ क्या कहते हैं

हम आसानी से समझते हैं कि राजनीतिक अभिविन्यास की तरह कुछ अनुमान लगाया जा सकता है कि कोई व्यक्ति कुछ राजनेताओं या संगठनों को पसंद या पालन करता है। यदि एक शोधकर्ता राजनेताओं द्वारा राजनीतिक अभिविन्यास का अनुमान लगाने के लिए एक व्यक्ति का समर्थन करता था, तो हम उस चेहरे को वैध डेटा कहेंगे। यही है, माप (राजनेता समर्थित) स्पष्ट रूप से उस चीज़ से संबंधित है जिसे हम भविष्यवाणी करने की कोशिश कर रहे हैं (राजनीतिक अभिविन्यास)।

कम अंतर्ज्ञानी यह है कि यदि आपके बारे में ज्ञात किसी भी जानकारी द्वारा आपके व्यक्तिगत विशेषताओं का अनुमान लगाया जा सकता है (भले ही अपूर्ण रूप से)। सटीक अनुमान प्रदान करने के लिए उपायों को वैध होने की आवश्यकता नहीं है। अगर हम यह सुनिश्चित कर सकते हैं कि एक चीज लगातार दूसरे से संबंधित है, इससे कोई फर्क नहीं पड़ता कि वह लिंक स्पष्ट या कारण है। यह सब मायने रखता है कि लिंक मौजूद है, और अब हम भविष्यवाणियों के लिए इसका उपयोग कर सकते हैं। इसे आमतौर पर माप के लिए एक अनुभवजन्य, या नीचे-अप, या डेटा संचालित दृष्टिकोण के रूप में जाना जाता है। जानकारी के इन कमजोर (लेकिन गैर-शून्य) टुकड़ों में से एक को एक साथ रखकर हमें वैध सम्मेलन करने की अनुमति मिलती है। यह एकत्रीकरण के सिद्धांत का एक उदाहरण है: अधिक डेटा हमेशा बेहतर होता है, भले ही कुछ या सभी डेटा खराब गुणवत्ता वाले हों। बेशक, भविष्यवाणी की समान सटीकता प्राप्त करने के लिए आपको कम उच्च गुणवत्ता वाले डेटा की आवश्यकता है; लेकिन यदि उच्च गुणवत्ता वाले डेटा पर शक हो सकता है (उदाहरण के लिए, प्रत्यक्ष, चेहरे-वैध उपायों में झूठ बोलने के बारे में चिंताओं) या केवल फ्लैट आउट उपलब्ध नहीं हैं (उदाहरण के लिए, लाखों इंटरनेट उपयोगकर्ताओं के गहन उपाय), बहुत कम गुणवत्ता डेटा ठीक काम करेगा।

माइकल कोसिंस्की के नेतृत्व में कुछ साल पहले एक पेपर (स्टीफन कोलबर्ट द्वारा काफी अच्छी तरह से संक्षेप में) ने दिखाया कि फेसबुक पसंदों से इस तरह के गैर-कानूनी उपायों का निर्माण कैसे किया जा सकता है। प्रत्येक व्यक्तित्व विशेषता या जनसांख्यिकीय परिणाम की भविष्यवाणी करने जैसे प्रत्येक के सभी संभावित संयोजनों का परीक्षण करने के लिए कंप्यूटर का उपयोग करके, शोधकर्ता उपयोगकर्ताओं के व्यक्तित्व, यौन अभिविन्यास, राजनीतिक संबद्धता और अधिक कुशलतापूर्वक अनुमान लगाने में सक्षम थे। एक बार इन एल्गोरिदम लोगों के समूह पर विकसित हो जाते हैं जहां शोधकर्ताओं को उन परिणामों की वास्तविक स्थिति पता होती है, जिन्हें वे रुचि रखते हैं (जिन्हें अक्सर प्रशिक्षण या विकास नमूना कहा जाता है), उन्हें नए लोगों पर लागू किया जा सकता है जहां परिणाम अज्ञात हैं। आप फेसबुक या ट्विटर से अपने डेटा का उपयोग करके इसे आजमा सकते हैं। (यह वेबसाइट सीए घोटाले में निहित शोधकर्ता के साथ संबद्ध नहीं है, और इन लोगों ने संदेह करने का कोई कारण नहीं है कि आपकी जानकारी के साथ कुछ भी नहीं किया गया है, लेकिन फिर भी मान लें कि जब भी आप किसी को अपने डेटा तक पहुंच देते हैं, तो उनके पास डेटा।)

भविष्यवाणी एल्गोरिदम के माध्यम से मेरी फेसबुक प्रोफाइल को चलाने से सटीक रूप से पता चलता है कि मैं महिला हूं (मेरी शीर्ष भविष्यवाणियों में से एक: विन डीज़ल की मेरी पसंद), प्रतिस्पर्धी (क्योंकि मुझे सेफोरा पसंद है), और वास्तव में काफी स्मार्ट (जो मैं सहमत हूं; क्योंकि मुझे पसंद है विल स्मिथ)। लेकिन यह सही नहीं है। एल्गोरिदम गलत तरीके से अनुमान लगाता है कि मैं दुखी हूं (मैं कसम खाता हूं कि मैं नहीं हूं; क्योंकि मुझे रोब ज़ोंबी पसंद है)। यह भी दिलचस्प है कि इस तरह के दृष्टिकोण से कई लक्षणों को सूचित करने के लिए उपयोग किए जाने वाले भविष्यवाणियों की ओर इशारा किया जाता है: स्टारबक्स और बराक ओबामा की मेरी पसंद मेरे बारे में लगभग सभी भविष्यवाणियों में योगदान कारक के रूप में दिखाई देती है। हालांकि, इन एल्गोरिदम का लक्ष्य प्रत्येक व्यक्ति के लिए सही भविष्यवाणी नहीं है। यह बड़े पैमाने पर डेटा इकट्ठा करने और उपयोग करने के बारे में है, ताकि औसतन, राजनीतिक और कॉर्पोरेट विज्ञापनों को अधिक कुशलता से लक्षित किया जा सके (पैसे बचाने और प्रभाव को अधिकतम करने) और अकादमिक / वैज्ञानिक परिप्रेक्ष्य से, हम अपने प्रतिभागियों को समय से बचा सकते हैं उनसे सैकड़ों प्रश्न पूछे जिन्हें उनके मौजूदा डेटा से अनुमानित किया जा सकता है, जब तक कि वे इसे साझा करने के इच्छुक हों।

संदर्भ

कोसिंस्की, स्टिलवेल, और ग्रिपेल (2013)। निजी लक्षण और गुण मानव व्यवहार के डिजिटल रिकॉर्ड से अनुमानित हैं। राष्ट्रीय विज्ञान – अकादमी की कार्यवाही।