मिस्ट्री एआई मॉडल के बारे में संदेह के बाद पता चला कि यह डीपसीक वी4 था

मिस्ट्री एआई मॉडल के बारे में संदेह के बाद पता चला कि यह डीपसीक वी4 था

बीजिंग, 18 मार्च (रायटर्स) – एक शक्तिशाली कृत्रिम बुद्धिमत्ता मॉडल जो पिछले हफ्ते एक डेवलपर प्लेटफॉर्म पर गुमनाम रूप से दिखाई दिया था, बुधवार को चीनी स्मार्टफोन और ईवी दिग्गज Xiaomi का होने का पता चला, इससे अटकलें तेज हो गईं कि स्टार्टअप डीपसीक लॉन्च से पहले चुपचाप अपनी अगली पीढ़ी की प्रणाली का परीक्षण कर रहा था।

डीपसीक के कम लागत वाले मॉडल डीपसीक-वी3 और आर1 की रिलीज ने पिछले साल वैश्विक तकनीकी स्टॉक में बिकवाली शुरू कर दी, जिससे निवेशकों ने सवाल उठाया कि क्या अमेरिकी एआई कंपनियों को एआई कंप्यूटिंग शक्ति पर अरबों डॉलर खर्च करने की जरूरत है। तब से, अगली पीढ़ी के मॉडल डीपसीक-वी4 में काफी रुचि रही है, जिसे अभी तक जारी नहीं किया गया है।

रहस्यमय मुक्त मॉडल, जिसे हंटर अल्फा कहा जाता है, 11 मार्च को एआई गेटवे प्लेटफॉर्म ओपनराउटर पर बिना किसी डेवलपर के आरोप के सामने आया और बाद में प्लेटफॉर्म द्वारा इसे “स्टील्थ मॉडल” के रूप में वर्णित किया गया।

पूर्व डीपसीक शोधकर्ता लुओ फुली द्वारा संचालित Xiaomi की AI मॉडल टीम MiMo ने बुधवार को कहा कि हंटर अल्फा एक “MiMo-V2-Pro का प्रारंभिक आंतरिक परीक्षण बिल्ड” था, एक प्रमुख मॉडल जिसे AI एजेंटों के “मस्तिष्क” के रूप में काम करने के लिए डिज़ाइन किया गया था, उपकरण जो चैटबॉट की तुलना में उपयोगकर्ताओं को कम मानवीय संकेतों और पर्यवेक्षण के साथ जटिल कार्यों को निष्पादित करने की अनुमति दे सकते हैं।

Xiaomi का नया मॉडल रिलीज़ ऐसे समय में हुआ है जब OpenClaw, एक ओपन-सोर्स एजेंट फ्रेमवर्क, चीन में सभी प्रकार के उपयोगकर्ताओं द्वारा तेजी से अपनाया जा रहा है।

लुओ ने गुरुवार को एक एक्स पोस्ट में कहा, “मैं इसे एक शांत घात कहता हूं – इसलिए नहीं कि हमने इसकी योजना बनाई थी, बल्कि इसलिए कि चैट से एजेंट प्रतिमान में बदलाव इतनी तेजी से हुआ, यहां तक ​​कि हमें मुश्किल से इस पर विश्वास भी हुआ।”

उन्होंने कहा, “लोग पूछते हैं कि हम इतनी तेजी से क्यों आगे बढ़ते हैं।” “मैंने इसे डीपसीक आर1 बनाते हुए प्रत्यक्ष रूप से देखा।”

MiMo-V2-Pro दुनिया भर के डेवलपर्स को एक सप्ताह तक मुफ्त पहुंच प्रदान करने के लिए OpenClaw सहित पांच प्रमुख एजेंट फ्रेमवर्क के साथ साझेदारी करेगा।

Xiaomi के हांगकांग-सूचीबद्ध शेयरों में गुरुवार को 5.8% की बढ़ोतरी हुई।

रहस्यमय चीनी मॉडल

पिछले सप्ताह रॉयटर्स द्वारा किए गए परीक्षणों के दौरान, हंटर अल्फा चैटबॉट ने खुद को “एक चीनी एआई मॉडल जो मुख्य रूप से चीनी में प्रशिक्षित है” के रूप में वर्णित किया और कहा कि इसका डेटा मई 2025 तक फैला हुआ है, वही ज्ञान कटऑफ बिंदु जो डीपसीक के स्वयं के चैटबॉट द्वारा रिपोर्ट किया गया था।

हालाँकि, जब इसके निर्माता के बारे में पूछा गया, तो सिस्टम ने इसके डेवलपर की पहचान करने से इनकार कर दिया।

चैटबॉट ने कहा, “मैं केवल अपना नाम, अपना पैरामीटर स्केल और अपनी संदर्भ विंडो की लंबाई जानता हूं।”

हंटर अल्फा का प्रोफाइल पेज इसे 1-ट्रिलियन-पैरामीटर मॉडल के रूप में वर्णित करता है, जिसका अर्थ है कि इसे लगभग एक ट्रिलियन समायोज्य मूल्यों का उपयोग करके प्रशिक्षित किया गया था जो यह निर्धारित करता है कि सिस्टम भाषा को कैसे संसाधित करता है और प्रतिक्रियाएं उत्पन्न करता है।

सिस्टम दस लाख टोकन तक की एक संदर्भ विंडो का भी विज्ञापन करता है, जो इस बात का माप है कि एक एआई मॉडल एक ही इंटरैक्शन के दौरान कितना टेक्स्ट प्रोसेस कर सकता है या याद रख सकता है। एक टोकन मोटे तौर पर पाठ के एक छोटे टुकड़े से मेल खाता है, जैसे कि किसी शब्द का हिस्सा।

एआई एजेंट सिस्टम बनाने वाले इंजीनियर नबील हाउम ने कहा, “जो संयोजन सामने आया वह हंटर अल्फा का 1 मिलियन-टोकन संदर्भ था जो तर्क क्षमता और मुफ्त पहुंच के साथ जोड़ा गया था।”

उन्होंने कहा, “उस संदर्भ विंडो वाले अधिकांश फ्रंटियर मॉडल बड़े पैमाने पर वास्तविक लागत के साथ आते हैं।”

वे विशिष्टताएँ डीपसीक के अगली पीढ़ी के V4 मॉडल के लिए स्थानीय मीडिया की अपेक्षाओं से मिलती जुलती थीं, जिसके बारे में चीनी आउटलेट्स ने बताया है कि यह अप्रैल की शुरुआत में लॉन्च हो सकता है।

स्वतंत्र एआई बेंचमार्क परीक्षण चलाने वाले उमूर ओज़कुल ने कहा कि विज्ञापित समय और क्षमताओं को देखते हुए मॉडल को डीपसीक से जोड़ने की अटकलें समझ में आती हैं।

स्टील्थ मॉडल लॉन्च असामान्य नहीं हैं, क्योंकि ओपनराउटर जैसे प्लेटफॉर्म डेवलपर्स को एक ही इंटरफ़ेस के माध्यम से दर्जनों एआई मॉडल के लिए प्रश्न भेजने की अनुमति देते हैं, जिससे वे नए सिस्टम के लिए एक लोकप्रिय परीक्षण मैदान बन जाते हैं।

पोनी अल्फा नामक एक गुमनाम मॉडल फरवरी में ओपनराउटर पर दिखाई दिया, जिसके पांच दिन बाद चीनी फर्म जिपू एआई ने पुष्टि की कि यह उसके जीएलएम-5 सिस्टम का हिस्सा था।

हंटर अल्फा के प्रोफाइल पेज पर एक नोटिस में कहा गया है कि मॉडल के लिए सभी संकेत और पूर्णताएं “प्रदाता द्वारा लॉग की जाती हैं और मॉडल को बेहतर बनाने के लिए उपयोग किया जा सकता है,” निष्पक्ष प्रतिक्रिया के लिए स्टील्थ मॉडल लॉन्च का उपयोग करने के उद्योग-व्यापी अभ्यास को रेखांकित करता है।

MiMo के अनुसार, प्लेटफ़ॉर्म पर प्रदर्शित होने के बाद मॉडल को तेजी से अपनाया गया, कुल उपयोग में एक ट्रिलियन टोकन को पार कर गया और OpenRouter पर लीडरबोर्ड चार्ट में शीर्ष पर पहुंच गया।

(एडुआर्डो बैपटिस्टा द्वारा रिपोर्टिंग; थॉमस डेरपिंगहॉस द्वारा संपादन)