सामान्य खबर

Anthropic ने AI की क्षमता मापने का नया तरीका बताया

Anthropic ने हाल ही में एक नई रिसर्च प्रस्तुत की है जिसमें बताया गया है कि किस प्रकार आर्टिफिशियल इंटेलिजेंस (AI) मॉडल्स की वास्तविक दुनिया की नौकरियों में प्रदर्शन करने की क्षमता को मापा जा सकता है। यह स्टडी AI की थ्योरेटिकल क्षमताओं से परे जाकर उसके व्यावहारिक उपयोग पर केंद्रित है।

Mar 31, 2026, 8:52 PM GMT+05:30

TechSaral.in Tech Desk – हमारी टीम में टेक विशेषज्ञ और टेक पत्रकार शामिल हैं।

Anthropic ने AI प्रदर्शन मापने का नया तरीका पेश किया।

शॉर्टकट में पूरी खबर

1 Anthropic ने AI मॉडल्स के लिए 'जॉब मार्केट सिमुलेशन' फ्रेमवर्क विकसित किया है।

2 इस फ्रेमवर्क में वास्तविक दुनिया के 200 से अधिक जॉब रोल्स का मूल्यांकन किया गया है।

3 स्टडी में पाया गया कि वर्तमान AI मॉडल्स अधिकांश नौकरियों में मनुष्यों से पिछड़ रहे हैं।

4 यह मूल्यांकन मॉडल की जटिल समस्याओं को समझने और हल करने की क्षमता पर आधारित है।

कही अनकही बातें

‟

हमारा उद्देश्य AI की केवल थ्योरेटिकल पावर को नहीं, बल्कि यह देखना है कि वह वास्तव में कितने कामों को सफलतापूर्वक कर सकता है।

Anthropic रिसर्च टीम

समाचार विस्तार में पूरी खबर

Intro: आर्टिफिशियल इंटेलिजेंस (AI) की दुनिया में निरंतर प्रगति हो रही है, लेकिन यह समझना हमेशा एक चुनौती रही है कि ये मॉडल्स वास्तविक दुनिया की नौकरियों में कितने सक्षम हैं। हाल ही में, Anthropic ने इस दिशा में एक महत्वपूर्ण कदम उठाया है और AI की क्षमताओं को मापने के लिए एक नया और विस्तृत फ्रेमवर्क प्रस्तुत किया है। यह रिसर्च केवल बेंचमार्क स्कोर पर ध्यान केंद्रित करने के बजाय, AI के व्यावहारिक प्रदर्शन पर जोर देती है, जो भारतीय टेक कम्युनिटी के लिए एक महत्वपूर्ण संदर्भ प्रदान करता है।

मुख्य जानकारी (Key Details)

Anthropic की यह स्टडी AI मॉडल्स को वास्तविक दुनिया के परिदृश्यों में परखने पर आधारित है। शोधकर्ताओं ने लगभग 200 से अधिक विभिन्न जॉब रोल्स को चुना, जिनमें सॉफ्टवेयर डेवलपर, कंटेंट राइटर, इंजीनियर और डेटा एनालिस्ट जैसी भूमिकाएं शामिल थीं। इन रोल्स के लिए आवश्यक कार्यों को सिमुलेट (Simulate) किया गया और AI मॉडल्स को उन पर काम करने के लिए कहा गया। मूल्यांकन इस आधार पर किया गया कि AI मॉडल कितनी सटीकता और दक्षता के साथ उन कार्यों को पूरा कर सकता है। स्टडी के परिणामों से पता चला कि, हालांकि AI कुछ विशिष्ट कार्यों में मजबूत प्रदर्शन कर रहे हैं, लेकिन अधिकांश जटिल और बहु-चरणीय नौकरियों में वे अभी भी मानव प्रदर्शन के स्तर तक नहीं पहुँच पाए हैं। विशेष रूप से, जहां उच्च स्तर की रचनात्मकता, जटिल समस्या-समाधान, या सूक्ष्म मानवीय समझ की आवश्यकता होती है, वहां मॉडल्स पिछड़ते दिखे।

तकनीकी विवरण (Technical Insight)

इस फ्रेमवर्क में 'जॉब-स्पेसिफिक टास्क' (Job-Specific Tasks) पर ध्यान केंद्रित किया गया है। उदाहरण के लिए, एक सॉफ्टवेयर डेवलपर की भूमिका के लिए, AI को न केवल कोड लिखने के लिए कहा गया, बल्कि डिबगिंग (Debugging), आर्किटेक्चर डिजाइन और डॉक्यूमेंटेशन जैसे कार्य भी दिए गए। यह मूल्यांकन मॉडल की 'जीरो-शॉट' (Zero-Shot) या 'फ्यू-शॉट' (Few-Shot) लर्निंग क्षमताओं पर आधारित था। Anthropic ने यह सुनिश्चित किया कि मूल्यांकन निष्पक्ष हो, ताकि AI के वास्तविक प्रदर्शन का सटीक आकलन किया जा सके, न कि केवल उनके प्रशिक्षण डेटा की पुनरावृत्ति का।

भारत और यूजर्स पर असर (Impact on India)

भारत, जो तेजी से डिजिटल अर्थव्यवस्था की ओर बढ़ रहा है, के लिए यह रिसर्च महत्वपूर्ण है। यह समझने में मदद मिलती है कि किन नौकरियों में AI का प्रभाव पहले दिखेगा और किन क्षेत्रों में मानव श्रम की आवश्यकता बनी रहेगी। भारतीय कंपनियां AI को अपनाने की योजना बनाते समय इस डेटा का उपयोग कर सकती हैं ताकि वे सही स्किल गैप्स (Skill Gaps) की पहचान कर सकें और कर्मचारियों को भविष्य के लिए तैयार कर सकें।

🔄 क्या बदला है?

पहले क्या था और अब क्या अपडेट हुआ — तुलना एक नज़र में।

BEFORE (पहले)

AI क्षमताओं का मूल्यांकन मुख्य रूप से अकादमिक बेंचमार्क (Academic Benchmarks) पर आधारित था, जो वास्तविक दुनिया के प्रदर्शन को पूरी तरह नहीं दर्शाते थे।

AFTER (अब)

अब Anthropic के फ्रेमवर्क के जरिए AI मॉडल्स का मूल्यांकन 200 से अधिक वास्तविक जॉब रोल्स के सिमुलेशन के आधार पर किया जा रहा है, जिससे अधिक सटीक परिणाम मिल रहे हैं।

समझिए पूरा मामला

Anthropic ने AI की क्षमताओं को कैसे मापा?

Anthropic ने एक 'जॉब मार्केट सिमुलेशन' फ्रेमवर्क का उपयोग किया, जिसमें 200 से अधिक वास्तविक जॉब रोल्स को शामिल किया गया और AI मॉडल्स के प्रदर्शन का मूल्यांकन किया गया।

क्या AI मॉडल्स ने नौकरियों में अच्छा प्रदर्शन किया?

रिसर्च के अनुसार, अधिकांश नौकरियों में वर्तमान AI मॉडल्स अभी भी मनुष्यों के प्रदर्शन स्तर से काफी पीछे हैं, खासकर जटिल और रचनात्मक भूमिकाओं में।

यह रिसर्च क्यों महत्वपूर्ण है?

यह रिसर्च AI की क्षमताओं को अधिक व्यावहारिक तरीके से समझने में मदद करती है, जिससे भविष्य के AI डेवलपमेंट की दिशा तय की जा सकती है।