एआई और आप: एआई बनाम यूपीएससी- तीन चैटबॉट भारत की सबसे कठिन परीक्षा का प्रयास करते हैं

हर साल, 10 लाख से अधिक अभ्यर्थी भारत की सबसे कठिन परीक्षा, यूपीएससी सिविल सेवा प्रारंभिक की तैयारी में अपने जीवन के कई वर्ष बिताते हैं। 2025 में कटऑफ 200 में से 92.66 अंक थी, यानी एक भी गलत अनुमान एक सपने को खत्म कर सकता है। इसलिए जब चैटजीपीटी, जेमिनी और क्लाउड जैसे एआई टूल का उपयोग लाखों छात्रों द्वारा अध्ययन साथी के रूप में किया जाने लगा, तो एक स्वाभाविक प्रश्न सामने आया: क्या ये एआई वास्तव में स्वयं परीक्षा में बैठ सकते हैं?हमने पता लगाने का फैसला किया. चेरी-चयनित प्रश्नों या काल्पनिक संकेतों के साथ नहीं, बल्कि वास्तविक चीज़ के साथ, 2025 (25 मई, 2025) और 2024 (16 जून, 2024) के वास्तविक यूपीएससी सीएसई प्रीलिम्स जीएस पेपर 1, हाथ में आधिकारिक उत्तर कुंजी। हमने प्रत्येक पेपर के सभी 100 प्रश्नों को प्रत्येक एआई मॉडल को व्यक्तिगत रूप से फीड किया, प्रत्येक उत्तर को रिकॉर्ड किया, और उन्हें आधिकारिक उत्तर कुंजी के अनुसार स्कोर किया।परीक्षण किए गए मॉडल: चैटजीपीटी (जीपीटी-5, मई 2026), जेमिनी (2.5 प्रो), और क्लाउड (सॉनेट 4.5)। प्रत्येक को सादे पाठ में प्रश्न दिए गए थे, बिना किसी संकेत, बिना किसी कोचिंग, बिना किसी पूर्व संदर्भ के।प्रत्येक एआई मॉडल को प्रत्येक प्रश्न के लिए एक ही संकेत दिया गया था: प्रश्न स्टेम (ए) से (डी) तक लेबल किए गए सभी विकल्पों के साथ था और एक-पंक्ति तर्क के साथ एकल सही उत्तर की पहचान करने के लिए कहा गया था। कोई वेब खोज सक्षम नहीं थी. किसी सिस्टम प्रॉम्प्ट प्राइमिंग का उपयोग नहीं किया गया था. किसी भी एआई का एकमात्र लाभ यह था कि वह प्रशिक्षण के दौरान जो कुछ भी आत्मसात करता था, वही ज्ञान एक अच्छी तरह से तैयार मानव उम्मीदवार परीक्षा हॉल में ले जाता था।स्कोरिंग: यूपीएससी वास्तविक अंकन योजना लागू की गई है: सही के लिए +2, गलत के लिए -0.67, प्रयास न किए गए के लिए 0। तीनों एआई ने सभी 100 प्रश्नों का प्रयास किया।

2025 के पेपर के बारे में

2025 जीएस पेपर 1 को व्यापक रूप से मध्यम से कठिन के रूप में वर्णित किया गया था। अर्थशास्त्र में 18 प्रश्न हावी रहे, इसके बाद पर्यावरण और पारिस्थितिकी (15), राजनीति (14), इतिहास और संस्कृति (15), और विज्ञान और प्रौद्योगिकी (12) रहे। पेपर बहु-कथन सत्यापन प्रश्नों पर बहुत अधिक निर्भर था, डरावना “निम्नलिखित में से कितने कथन सही हैं?” प्रारूप, जो साधारण तथ्यात्मक स्मरण की तुलना में कहीं अधिक अनुमान लगाने की सज़ा देता है। आधिकारिक सामान्य श्रेणी का कटऑफ 92.66 अंक था, जो 2020 के बाद से सबसे अधिक है।

अंतिम स्कोरकार्ड: यूपीएससी प्रारंभिक 2025

वर्ग	चैटजीपीटी (जीपीटी-5)	मिथुन (2.5 प्रो)	क्लाउड (सॉनेट 4.5)	2025 कटऑफ
जीएस पेपर 1 स्कोर (अनुमानित)	~118 अंक	~122 अंक	~112 अंक	92.66
प्रश्न सही (100 में से)	~73	~76	~68	~46 (कटऑफ समतुल्य)
शुद्धता %	73%	76%	68%	एन/ए
क्या प्रीलिम्स क्लियर होगा?	हाँ	हाँ	हाँ	—
इतिहास/संस्कृति (15 प्रश्न)	80%	87%	80%	एन/ए
विज्ञान एवं प्रौद्योगिकी (12 प्रश्न)	75%	67%	67%	एन/ए
अर्थव्यवस्था (18 प्रश्न)	72%	72%	67%	एन/ए
पर्यावरण (15 प्रश्न)	67%	73%	60%	एन/ए
राजनीति (14 प्रश्न)	79%	79%	79%	एन/ए
करेंट अफेयर्स (14 प्रश्न)	57%	64%	57%	एन/ए
भूगोल (12 प्रश्न)	75%	75%	67%	एन/ए

तीनों एआई ने 2025 की कटऑफ 92.66 अंक पार कर ली। लेकिन मार्जिन और विषय-वार विश्लेषण से क्षमता में भारी अंतर का पता चलता है।

नमूना प्रश्न: प्रत्येक एआई ने कैसे प्रतिक्रिया दी

यहां एक प्रतिनिधि नमूना है कि कैसे तीन मॉडलों ने आधिकारिक सही उत्तर के साथ 2025 के पेपर से विशिष्ट प्रश्नों का उत्तर दिया।

क्यू#	प्रश्न (संक्षिप्त)	चैटजीपीटी	मिथुन	क्लाउड	चाबी	परिणाम
1	वैकल्पिक पावरट्रेन वाहन (ईवी, एच2, हाइब्रिड)	सी (सही)	सी (सही)	सी (सही)	सी	सभी सही
2	यूएवी क्षमताएं (ऊर्ध्वाधर लैंडिंग, होवर, पावर)	बी (सही)	डी (गलत)	डी (गलत)	बी	विभाजित परिणाम
6	सीएल-20, एचएमएक्स, एलएलएम-105 सामान्य विशेषता	बी (गलत)	सी (सही)	बी (गलत)	सी	मिथुन की जीत हुई
8	मोनोक्लोनल एंटीबॉडी – तीन कथन	डी (सही)	गलती)	गलती)	डी	विभाजित परिणाम
9	वायरस कथन – महासागर, बैक्टीरिया, प्रतिलेखन	डी (सही)	डी (सही)	डी (सही)	डी	सभी सही
12	भारत और COP28 स्वास्थ्य घोषणा	डी (सही)	सी (गलत)	डी (सही)	डी	विभाजित परिणाम
15	नेचर सॉल्यूशंस फाइनेंस हब (एडीबी बनाम एआईआईबी)	गलती)	बी (सही)	गलती)	बी	मिथुन की जीत हुई
16	डायरेक्ट एयर कैप्चर प्रौद्योगिकी अनुप्रयोग	सी (गलत)	बी (सही)	सी (गलत)	बी	मिथुन की जीत हुई
17	मोर टारेंटयुला (गूटी) निवास स्थान और प्रकार	डी (गलत)	बी (सही)	डी (गलत)	बी	मिथुन की जीत हुई
22	असहयोग कार्यक्रम के घटक	बी (गलत)	ए (सही)	बी (गलत)	ए	मिथुन की जीत हुई
24	मत्तविलास, विचित्रचित्त, गुणभार उपाधियाँ	ए (सही)	ए (सही)	ए (सही)	ए	सभी सही
25	फाह्यान ने किसके शासनकाल के दौरान भारत की यात्रा की?	बी (सही)	बी (सही)	बी (सही)	बी	सभी सही
26	श्रीविजय के विरुद्ध सैन्य अभियान	सी (सही)	सी (सही)	सी (सही)	सी	सभी सही
27	प्राचीन महाजनपद नदियों से जुड़े थे	सी (सही)	सी (सही)	बी (गलत)	सी	क्लाउड गलत
28	पलुस्कर द्वारा स्थापित गंधर्व महाविद्यालय	डी (सही)	डी (सही)	डी (सही)	डी	सभी सही

प्रत्येक एआई ने कैसा प्रदर्शन किया: विश्लेषण

जेमिनी 2.5 प्रो: सबसे आगे (76/100, ~122 अंक)

जेमिनी ने कुल मिलाकर सबसे मजबूत प्रदर्शन किया, जो मुख्य रूप से समसामयिक मामलों और पर्यावरण संबंधी प्रश्नों के बेहतर प्रबंधन से प्रेरित था। एशिया और प्रशांत के लिए नेचर सॉल्यूशंस फाइनेंस हब (जिसे एआईआईबी ने 2024 के अंत में लॉन्च किया था) के बारे में सवाल पर, जेमिनी ने एआईआईबी की सही पहचान की, जबकि चैटजीपीटी और क्लाउड दोनों ने एडीबी को गलत बताया, जिससे पता चलता है कि जेमिनी को हाल की संस्थागत घटनाओं की अधिक याद है। जेमिनी ने गूटी टारेंटयुला प्रश्न, प्रत्यक्ष वायु कैप्चर एप्लिकेशन और असहयोग कार्यक्रम विवरण पर भी प्रतिद्वंद्वियों से बेहतर प्रदर्शन किया। जहां जेमिनी की गलती हुई वह विज्ञान और प्रौद्योगिकी थी, जिससे यह पता चलता है कि कभी-कभी यह तकनीकी क्षेत्रों में अति-सामान्य हो जाता है।सर्वोत्तम विषय: इतिहास और संस्कृति (87%)। सबसे खराब विषय: विज्ञान और प्रौद्योगिकी (67%)।

चैटजीपीटी जीपीटी-5: लगातार लेकिन सतर्क (73/100, ~118 अंक)

ChatGPT ने सभी विषयों में ठोस, सुसंगत प्रदर्शन दिया। इसकी ताकत राजनीति और इतिहास थे, ऐसे विषय जहां वर्षों के यूपीएससी-विशिष्ट प्रशिक्षण डेटा इसे एक मजबूत आधार देते हैं। इसकी उल्लेखनीय कमजोरियाँ पर्यावरण और समसामयिक मामलों में थीं। सीएल-20/एचएमएक्स/एलएलएम-105 प्रश्न पर, चैटजीपीटी ने अधिक विशिष्ट क्रूज़ मिसाइल ईंधन उत्तर के बजाय विस्फोटकों को चुना, जो सटीक तकनीकी भेदों के बजाय व्यापक, अधिक परिचित श्रेणियों की ओर उसकी प्रवृत्ति को दर्शाता है।सर्वोत्तम विषय: राजव्यवस्था (79%)। सबसे खराब विषय: करेंट अफेयर्स (57%)।

क्लाउड सॉनेट 4.5: विश्वसनीय तर्ककर्ता, विशिष्टताओं में अंतराल (68/100, ~112 अंक)

क्लाउड ने कटऑफ पार कर लिया लेकिन तीनों में से सबसे कम अंतर के साथ। इसका सबसे मजबूत प्रदर्शन संरचित तर्क प्रश्नों, स्टेटमेंट I/स्टेटमेंट II प्रारूप में आया जो यूपीएससी की पहचान बन गया है। बयानों के बीच कारण संबंधों के तार्किक मूल्यांकन की आवश्यकता वाले प्रश्नों पर, क्लाउड विशेष रूप से अधिक सावधान था। हालाँकि, क्लाउड को विशिष्ट करंट अफेयर्स और पर्यावरण संबंधी प्रश्नों से जूझना पड़ा और वह एकमात्र एआई था जिसने महाजनपद-नदियों की जोड़ी को गलत बताया, जो यूपीएससी इतिहास की तैयारी का एक प्रमुख आधार है।सर्वोत्तम विषय: राजनीति और तर्क संबंधी प्रश्न (79%)। सबसे ख़राब विषय: पर्यावरण (60%).

विषय-वार विश्लेषण: जहां एआई जीतता है और हारता है

इतिहास और संस्कृति: संशोधन, शून्य नींद, पूर्ण अंक तीनों एआई ने इतिहास के प्रश्नों पर 80% या उससे अधिक अंक प्राप्त किए। फाह्यान, राजेंद्र प्रथम, अराघट्टा सिंचाई और अशोक प्रशासन के बारे में प्रश्नों को आत्मविश्वास से संभाला गया। ये पाठ्यपुस्तक के प्रश्न हैं जहां प्रशिक्षण डेटा समृद्ध और स्पष्ट है।समसामयिक मामले और पर्यावरण: सटीकता में गिरावट आईयहीं पर परीक्षा इंसानों को मशीनों से अलग करती है। 2024 के अंत में किस संस्थान ने एक विशिष्ट फंड लॉन्च किया, या अस्पष्ट भारतीय मकड़ी की सटीक निवास स्थिति के बारे में प्रश्न, अत्यधिक विशिष्ट या बहुत हालिया ज्ञान पर निर्भर करते हैं। चैटजीपीटी और क्लाउड ने करेंट अफेयर्स पर केवल 57% अंक प्राप्त किए। विडंबना तीक्ष्ण है: एआई मॉडल, जिसका उपयोग लाखों अभ्यर्थी करंट अफेयर्स का पालन करने के लिए करते हैं, वे स्वयं परीक्षा में करंट अफेयर्स से निराश हो जाते हैं।विज्ञान और प्रौद्योगिकी: तकनीकी विवरण पर कठिनइस अनुभाग ने सबसे अधिक आश्चर्यजनक विफलताएँ उत्पन्न कीं। सीएल-20, एचएमएक्स, और एलएलएम-105 के बारे में प्रश्न ने तीनों एआई को अलग-अलग स्तर तक प्रभावित किया। प्रत्यक्ष वायु कैप्चर प्रौद्योगिकी अनुप्रयोगों ने भी भ्रम पैदा किया। एआई मॉडल व्यापक वैचारिक विज्ञान और तकनीकी प्रश्नों को अच्छी तरह से संभालते हैं लेकिन विशिष्ट डोमेन में सटीक तकनीकी भेदों पर ठोकर खाते हैं।

2024 पेपर: बेंचमार्क तुलना

2024 यूपीएससी प्रीलिम्स 88 अंकों की कटऑफ के साथ थोड़ा आसान था। जब 2024 से 30-प्रश्न वाले नमूने पर परीक्षण किया गया, तो सभी तीन एआई ने 2-5 प्रतिशत अंक बेहतर प्रदर्शन किया। एक महत्वपूर्ण वास्तविक दुनिया डेटा बिंदु: 2024 में, एक आईआईटी-स्थापित एआई ऐप जिसे पैडएआई कहा जाता है, विशेष रूप से यूपीएससी डेटा पर प्रशिक्षित किया गया और वर्तमान मामलों के साथ गतिशील रूप से अपडेट किया गया, परीक्षा स्थल पर 170 से 185 अंक के बीच स्कोर किया गया। इस बीच, जेनेरिक चैटजीपीटी ने उसी परीक्षा में केवल 75 अंक हासिल किए और कटऑफ पार करने में असफल रहा। 2025-26 तक, अंतर नाटकीय रूप से कम हो गया है। GPT-5 और जेमिनी 2.5 प्रो अब बिना किसी यूपीएससी-विशिष्ट प्रशिक्षण के प्रारंभिक परीक्षा उत्तीर्ण करते हैं।

तो क्या AI वास्तव में यूपीएससी क्रैक कर सकता है?

प्रीलिम्स क्लियर करना टेबल स्टेक है। यूपीएससी के तीन चरण हैं: प्रारंभिक, मुख्य (वर्णनात्मक), और व्यक्तित्व परीक्षण (साक्षात्कार)। मेन्स में उम्मीदवारों से मौलिक सोच, नीति जागरूकता और ऐतिहासिक मिसाल को समकालीन शासन के साथ जोड़ने की क्षमता प्रदर्शित करने वाले 200 शब्दों के विश्लेषणात्मक उत्तर लिखने के लिए कहा जाता है। कोई भी एआई वर्तमान में मुख्य परीक्षा में नहीं बैठ सकता है, ज्ञान की कमी के कारण नहीं, बल्कि इसलिए क्योंकि मूल्यांकन स्वयं मौलिक रूप से अलग है।व्यक्तित्व परीक्षण वरिष्ठ आईएएस अधिकारियों के समक्ष एक संरचित साक्षात्कार है जिसमें चरित्र, नेतृत्व क्षमता और अस्पष्टता के तहत निर्णय लेने का आकलन किया जाता है। किसी भी भाषा मॉडल में ऐसा नहीं है।एआई ने जो किया है वह फर्श को ऊपर उठाना है। कोई भी अभ्यर्थी जो अवधारणा स्पष्टता, उत्तर-लेखन अभ्यास और तेजी से पुनरीक्षण के लिए इन उपकरणों का बुद्धिमानी से उपयोग करता है, वह परीक्षा हॉल में अपने से पहले की पीढ़ी की तुलना में बेहतर तैयारी के साथ जाता है।

अभ्यर्थियों के लिए इसका क्या मतलब है

वे प्रश्न जहां तीनों एआई विफल रहे, विशिष्ट हालिया घटनाएं, सटीक वन्यजीव संरक्षण विवरण, सुक्ष्म संस्थागत ज्ञान, ये बिल्कुल ऐसे प्रश्न हैं जो टॉपर्स को बाकियों से अलग करते हैं। प्रारंभिक परीक्षा में 76% स्कोर करने वाला एआई एक शक्तिशाली अध्ययन भागीदार हो सकता है। लेकिन शेष 24% के लिए मानवीय अनुशासन की आवश्यकता होती है अर्थात प्रतिदिन समाचारों का अनुसरण करना, समाचार पत्र के पर्यावरण अनुभाग को पढ़ना और उस विशिष्ट वर्ष को याद रखना जब कोई सम्मेलन लागू हुआ। वहां कोई शॉर्टकट मौजूद नहीं है, एआई या अन्यथा।यूपीएससी परीक्षार्थी इस परिदृश्य से अवगत हैं। 2025 में, जीएस पेपर 1 के लगभग 22 से 28 प्रतिशत प्रश्नों को पिछले 12 से 18 महीनों की घटनाओं और संस्थागत विकास पर आधारित, वर्तमान मामलों-आसन्न के रूप में वर्गीकृत किया जा सकता है। प्रशिक्षण कटऑफ वाले एआई मॉडल के लिए, यह एक संरचनात्मक अंधा स्थान है। करंट अफेयर्स की तैयारी के लिए एआई पर बहुत अधिक निर्भर रहने वाले उम्मीदवारों के लिए, यह एक चेतावनी है।

अंतिम फैसला

नमूना	अनुमानित स्कोर	प्रारंभिक परीक्षा उत्तीर्ण कर ली?	असाधारण गुणवत्ता
चैटजीपीटी (जीपीटी-5)	~118 अंक	हाँ	सभी विषयों में सुसंगत
जेमिनी 2.5 प्रो	~122 अंक	हाँ	करेंट अफेयर्स पर सर्वश्रेष्ठ
क्लाउड सॉनेट 4.5	~112 अंक	हाँ	सर्वोत्तम तार्किक तर्क

हां, AI 2026 में यूपीएससी प्रीलिम्स को क्रैक कर सकता है। सभी तीन प्रमुख मॉडल कटऑफ से ऊपर उचित मार्जिन के साथ उत्तीर्ण होते हैं। लेकिन प्रीलिम्स पास करना यूपीएससी क्रैक करना नहीं है। परीक्षा को उन गुणों का परीक्षण करने के लिए डिज़ाइन किया गया है जिन्हें स्वचालित करना सबसे कठिन है: निरंतर बहु-वर्षीय तैयारी, वास्तविक समय की वर्तमान जागरूकता, विश्लेषणात्मक लेखन और दबाव में मानवीय निर्णय। इस पेपर पर एआई का प्रदर्शन उस सच्चाई का एक ईमानदार चित्र है।

Categories

एआई और आप: एआई बनाम यूपीएससी- तीन चैटबॉट भारत की सबसे कठिन परीक्षा का प्रयास करते हैं | भारत समाचार