सेमल्ट एक्सपर्ट बताता है कि वेब डेटा स्क्रेपिंग को कोर्ट के फैसले से कैसे वैध बनाया गया

हालांकि साइट के मालिकों की स्पष्ट अनुमति के बिना वेबसाइटों से डेटा खंगालना अवैध हो सकता है, एक जज ने हाल ही में कुछ विशेष परिस्थितियों में अन्यथा फैसला सुनाया है। हाईक लैब्स ने हाल ही में लिंक्डइन पेजों से डेटा निकालने से रोकने के लिए लिंक्डइन के खिलाफ मुकदमा दायर किया।

यह ज्यादातर लोगों के लिए एक अशिष्ट आघात के रूप में आया था कि लिंक्डइन को स्टार्टअप को अपने वेब पृष्ठों पर मुफ्त पहुंच देने के लिए कहा गया था। HiQ ने अपने एल्गोरिदम का उपयोग यह पता लगाने के लिए किया कि लिंक्डइन उपयोगकर्ता अपने सार्वजनिक प्रोफ़ाइल में किए गए परिवर्तनों के आधार पर नौकरी की तलाश कर रहा है।

एल्गोरिदम लिंक्डइन वेब पृष्ठों से निकाले गए डेटा पर चलता है। जैसा कि अपेक्षित था, लिंक्डइन को यह पसंद नहीं आया और hiQ को आगे डेटा निष्कर्षण से रोकने के लिए काउंटरमेसर लगाए गए। तकनीकी बाधाओं के अलावा, जोरदार शब्दों में कानूनी चेतावनी भी जारी की गई थी।

स्टार्टअप के पास कानूनी रूप से इस मुद्दे को उठाने के अलावा कोई विकल्प नहीं था। hiQ को कानूनी निवारण की तलाश थी। कंपनी चाहती थी कि लिंक्डइन ने अपने तकनीकी अवरोधों को दूर करने का आदेश दिया। hiQ भी लिंक्डइन पर अपनी डेटा निष्कर्षण प्रक्रिया को वैध बनाना चाहता था।

सौभाग्य से स्टार्टअप के लिए, यह वही मिला जो वह चाहता था। हुकूमत हाईक के पक्ष में थी। लिंक्डइन को आदेश दिया गया था कि वह अपने (लिंक्डइन) वेब पेजों को खंगालने से हाईक में बाधा डालने वाले सभी काउंटरमैनों को हटा दे और हाईक फ्री हैंड दे क्योंकि एक्ट पूरी तरह से कानूनी है। जज ने इस बात पर अपना फैसला सुनाया कि हाईक वह कौन सा डेटा खंगालना चाहती है, जो पब्लिक व्यू के लिए दिखाया गया है।

न्यायाधीश ने न केवल प्रतिवादी को हाईक के खिलाफ लगाए गए सभी निवारक तंत्र को हटाने का आदेश दिया, बल्कि उन्होंने यह भी आदेश दिया कि प्रतिवादी को भविष्य में इस तरह के कृत्यों से बचना चाहिए।

खुले वेब डेटा को बढ़ावा देना

जबकि सत्तारूढ़ अभी भी एक अस्थायी निषेधाज्ञा है, यह सुनकर हर्ष होता है कि कानून खुले वेब डेटा और इंटरनेट पर सूचना तक मुफ्त पहुंच का समर्थन करता है क्योंकि यह निर्णय इसकी पुष्टि करता है। भले ही अंतिम निर्णय प्रतिवादी के पक्ष में हो जाए, लेकिन यह तथ्य पहले ही स्थापित हो चुका है।

न्यायाधीश ने लगभग सभी लिंक्डइन के तर्कों को बंद करके इस नीति को बढ़ावा दिया। जबकि लिंक्डइन ने यह स्थापित करने की कोशिश की कि वादी अपनी गोपनीयता भंग कर रहा था, न्यायाधीश ने इस तथ्य के साथ काउंटर किया कि प्रतिवादी भी डेटा बेच रहा है।

जब तर्क में पानी नहीं था, तो प्रतिवादी ने यह भी कहा कि कंप्यूटर धोखाधड़ी और दुर्व्यवहार अधिनियम (CFAA) के उल्लंघन में hiQ का कृत्य था क्योंकि स्टार्टअप ने अवैध रूप से डेटा की कटाई करने के लिए अपने सर्वर तक पहुँचा था। फिर, तर्क को पंचर कर दिया गया। यह इस आधार पर अस्वीकार कर दिया गया कि hiQ केवल सार्वजनिक, गैर-संरक्षित पृष्ठों पर सामग्री को स्क्रैप कर रहा था।

न्यायाधीश ने मामले को व्यवसाय के घंटों के दौरान खुले स्टोर में चलने के रूप में बदल दिया। ऐसे व्यक्ति को अतिचार नहीं कहा जा सकता। तो, hiQ अतिचार नहीं था। दिलचस्प बात यह है कि जज यह समझाने के लिए आगे बढ़े कि उनका फैसला जनता के हित में क्यों है।

संक्षेप में, अदालत ने स्वीकार किया कि डेटा को क्रॉल, निकालने और विश्लेषण करने की अनुमति देना सार्वजनिक हित में है। इसलिए, सूचना के मुक्त प्रवाह में बाधाओं को दूर करने के लिए प्रोत्साहित करना एक हानिकारक नीति होगी।

आपको शासन से क्या सीखना चाहिए

जबकि आपके पास लिंक्डइन से सीधे डेटा निकालने के कारण नहीं हो सकते हैं, आपको सत्तारूढ़ से सीखना चाहिए। सभी वेबसाइटों के robots.txt फ़ाइल को पढ़ने और सम्मान करने से सुरक्षित खेलना बेहतर है। याद रखें, सत्तारूढ़ अभी भी एक अस्थायी निषेधाज्ञा है। यह अंततः लिंक्डइन के पक्ष में जा सकता है।

जबकि सत्तारूढ़ आपको सीधे प्रभावित नहीं कर सकता है, यह खुशी की बात है कि एक संघीय अदालत जनता के लिए वेब को खुले रखने की नीति को लागू करती है। तो, जानकारी उपलब्ध होनी चाहिए और उन लोगों के लिए सुलभ होनी चाहिए जो इसका अच्छा उपयोग खोज और कर सकते हैं।

वेब डेटा सभी के लिए अत्यंत उपयोगी है, विशेष रूप से मीडिया विश्लेषकों, डेवलपर्स, डेटा वैज्ञानिकों और कुछ अन्य पेशेवरों के लिए। जैसे, सत्तारूढ़ एक स्वागत योग्य विकास है।

send email