बुरी खबर

Meta पर लगा पायरेटेड किताबों से AI मॉडल ट्रेन करने का आरोप

दुनिया की दिग्गज कंपनी Meta पर आरोप लगा है कि उसने अपने Llama AI मॉडल को ट्रेन करने के लिए पायरेटेड किताबों का इस्तेमाल किया है। प्रकाशकों ने कंपनी के खिलाफ कानूनी कार्रवाई की मांग की है।

May 6, 2026, 6:32 PM GMT+05:30

TechSaral.in Tech Desk – हमारी टीम में टेक विशेषज्ञ और टेक पत्रकार शामिल हैं।

Meta के AI मॉडल पर उठे सवाल।

शॉर्टकट में पूरी खबर

1 Meta पर कॉपीराइट कानूनों के उल्लंघन का गंभीर आरोप लगा है।

2 रिपोर्ट्स के अनुसार, Llama मॉडल को 'Books3' जैसे डेटासेट से ट्रेन किया गया।

3 प्रकाशकों का कहना है कि उनकी अनुमति के बिना कंटेंट का इस्तेमाल हुआ है।

कही अनकही बातें

‟

AI कंपनियों द्वारा बिना अनुमति के डेटा का उपयोग करना बौद्धिक संपदा अधिकारों का सीधा उल्लंघन है।

प्रकाशक संघ के प्रतिनिधि

समाचार विस्तार में पूरी खबर

Intro: आर्टिफिशियल इंटेलिजेंस (AI) की दुनिया में इन दिनों बड़ी हलचल मची हुई है। हाल ही में सामने आई एक रिपोर्ट के अनुसार, सोशल मीडिया दिग्गज Meta पर आरोप लगा है कि उसने अपने शक्तिशाली Llama AI मॉडल को ट्रेन करने के लिए पायरेटेड किताबों का बड़े पैमाने पर इस्तेमाल किया है। यह मामला न केवल कॉपीराइट कानूनों के उल्लंघन से जुड़ा है, बल्कि यह टेक जगत में डेटा एथिक्स (Data Ethics) पर एक बड़ी बहस भी छेड़ रहा है।

मुख्य जानकारी (Key Details)

प्रकाशकों और लेखकों का एक बड़ा समूह अब Meta के खिलाफ लामबंद हो गया है। उनका दावा है कि कंपनी ने 'Books3' जैसे डेटासेट का उपयोग किया, जिसमें हजारों ऐसी किताबें शामिल हैं जो पायरेटेड थीं। इन किताबों को बिना किसी रॉयल्टी या अनुमति के AI मॉडल की ट्रेनिंग में इस्तेमाल किया गया। यह पहली बार नहीं है जब किसी बड़ी टेक कंपनी पर इस तरह के आरोप लगे हों, लेकिन Meta का मामला इसलिए गंभीर है क्योंकि Llama मॉडल का उपयोग दुनिया भर में बड़े स्तर पर किया जा रहा है। प्रकाशक अब कंपनी से जवाबदेही और मुआवजे की मांग कर रहे हैं, जिससे आने वाले समय में AI कंपनियों के लिए डेटा सोर्सिंग के नियम और कड़े हो सकते हैं।

तकनीकी विवरण (Technical Insight)

आमतौर पर, AI मॉडल्स को ट्रेन करने के लिए इंटरनेट से लाखों-करोड़ों शब्दों का डेटा इकट्ठा किया जाता है जिसे 'लार्ज लैंग्वेज मॉडल' (LLM) कहा जाता है। Meta के Llama ने भी इसी तरह के डेटासेट का उपयोग किया है। समस्या तब आती है जब इस डेटा में कॉपीराइट सुरक्षित सामग्री शामिल हो जाती है। यह पूरी प्रक्रिया 'स्क्रैपिंग' (Scraping) के जरिए होती है, जहाँ बॉट्स इंटरनेट से डेटा उठाकर उसे मशीन लर्निंग एल्गोरिदम में डाल देते हैं।

भारत और यूजर्स पर असर (Impact on India)

भारत में भी AI का इस्तेमाल तेजी से बढ़ रहा है। यदि ग्लोबल स्तर पर AI कंपनियों पर कॉपीराइट के नियम सख्त होते हैं, तो भारतीय लेखकों और कंटेंट क्रिएटर्स को भी इसका सीधा लाभ मिलेगा। इससे भविष्य में यह सुनिश्चित होगा कि किसी भी भारतीय लेखक की रचना का उपयोग बिना उसकी सहमति के AI ट्रेनिंग में न हो सके। यह डिजिटल युग में क्रिएटर्स के अधिकारों की सुरक्षा के लिए एक महत्वपूर्ण कदम साबित होगा।