बीजिंग, 18 मार्च (रायटर्स) – एक शक्तिशाली कृत्रिम बुद्धिमत्ता मॉडल जो पिछले हफ्ते एक डेवलपर प्लेटफॉर्म पर गुमनाम रूप से दिखाई दिया था, बुधवार को चीनी स्मार्टफोन और ईवी दिग्गज Xiaomi का होने का पता चला, इससे अटकलें तेज हो गईं कि स्टार्टअप डीपसीक लॉन्च से पहले चुपचाप अपनी अगली पीढ़ी की प्रणाली का परीक्षण कर रहा था।
डीपसीक के कम लागत वाले मॉडल डीपसीक-वी3 और आर1 की रिलीज ने पिछले साल वैश्विक तकनीकी स्टॉक में बिकवाली शुरू कर दी, जिससे निवेशकों ने सवाल उठाया कि क्या अमेरिकी एआई कंपनियों को एआई कंप्यूटिंग शक्ति पर अरबों डॉलर खर्च करने की जरूरत है। तब से, अगली पीढ़ी के मॉडल डीपसीक-वी4 में काफी रुचि रही है, जिसे अभी तक जारी नहीं किया गया है।
रहस्यमय मुक्त मॉडल, जिसे हंटर अल्फा कहा जाता है, 11 मार्च को एआई गेटवे प्लेटफॉर्म ओपनराउटर पर बिना किसी डेवलपर के आरोप के सामने आया और बाद में प्लेटफॉर्म द्वारा इसे “स्टील्थ मॉडल” के रूप में वर्णित किया गया।
पूर्व डीपसीक शोधकर्ता लुओ फुली द्वारा संचालित Xiaomi की AI मॉडल टीम MiMo ने बुधवार को कहा कि हंटर अल्फा एक “MiMo-V2-Pro का प्रारंभिक आंतरिक परीक्षण बिल्ड” था, एक प्रमुख मॉडल जिसे AI एजेंटों के “मस्तिष्क” के रूप में काम करने के लिए डिज़ाइन किया गया था, उपकरण जो चैटबॉट की तुलना में उपयोगकर्ताओं को कम मानवीय संकेतों और पर्यवेक्षण के साथ जटिल कार्यों को निष्पादित करने की अनुमति दे सकते हैं।
Xiaomi का नया मॉडल रिलीज़ ऐसे समय में हुआ है जब OpenClaw, एक ओपन-सोर्स एजेंट फ्रेमवर्क, चीन में सभी प्रकार के उपयोगकर्ताओं द्वारा तेजी से अपनाया जा रहा है।
लुओ ने गुरुवार को एक एक्स पोस्ट में कहा, “मैं इसे एक शांत घात कहता हूं – इसलिए नहीं कि हमने इसकी योजना बनाई थी, बल्कि इसलिए कि चैट से एजेंट प्रतिमान में बदलाव इतनी तेजी से हुआ, यहां तक कि हमें मुश्किल से इस पर विश्वास भी हुआ।”
उन्होंने कहा, “लोग पूछते हैं कि हम इतनी तेजी से क्यों आगे बढ़ते हैं।” “मैंने इसे डीपसीक आर1 बनाते हुए प्रत्यक्ष रूप से देखा।”
MiMo-V2-Pro दुनिया भर के डेवलपर्स को एक सप्ताह तक मुफ्त पहुंच प्रदान करने के लिए OpenClaw सहित पांच प्रमुख एजेंट फ्रेमवर्क के साथ साझेदारी करेगा।
Xiaomi के हांगकांग-सूचीबद्ध शेयरों में गुरुवार को 5.8% की बढ़ोतरी हुई।
रहस्यमय चीनी मॉडल
पिछले सप्ताह रॉयटर्स द्वारा किए गए परीक्षणों के दौरान, हंटर अल्फा चैटबॉट ने खुद को “एक चीनी एआई मॉडल जो मुख्य रूप से चीनी में प्रशिक्षित है” के रूप में वर्णित किया और कहा कि इसका डेटा मई 2025 तक फैला हुआ है, वही ज्ञान कटऑफ बिंदु जो डीपसीक के स्वयं के चैटबॉट द्वारा रिपोर्ट किया गया था।
हालाँकि, जब इसके निर्माता के बारे में पूछा गया, तो सिस्टम ने इसके डेवलपर की पहचान करने से इनकार कर दिया।
चैटबॉट ने कहा, “मैं केवल अपना नाम, अपना पैरामीटर स्केल और अपनी संदर्भ विंडो की लंबाई जानता हूं।”
हंटर अल्फा का प्रोफाइल पेज इसे 1-ट्रिलियन-पैरामीटर मॉडल के रूप में वर्णित करता है, जिसका अर्थ है कि इसे लगभग एक ट्रिलियन समायोज्य मूल्यों का उपयोग करके प्रशिक्षित किया गया था जो यह निर्धारित करता है कि सिस्टम भाषा को कैसे संसाधित करता है और प्रतिक्रियाएं उत्पन्न करता है।
सिस्टम दस लाख टोकन तक की एक संदर्भ विंडो का भी विज्ञापन करता है, जो इस बात का माप है कि एक एआई मॉडल एक ही इंटरैक्शन के दौरान कितना टेक्स्ट प्रोसेस कर सकता है या याद रख सकता है। एक टोकन मोटे तौर पर पाठ के एक छोटे टुकड़े से मेल खाता है, जैसे कि किसी शब्द का हिस्सा।
एआई एजेंट सिस्टम बनाने वाले इंजीनियर नबील हाउम ने कहा, “जो संयोजन सामने आया वह हंटर अल्फा का 1 मिलियन-टोकन संदर्भ था जो तर्क क्षमता और मुफ्त पहुंच के साथ जोड़ा गया था।”
उन्होंने कहा, “उस संदर्भ विंडो वाले अधिकांश फ्रंटियर मॉडल बड़े पैमाने पर वास्तविक लागत के साथ आते हैं।”
वे विशिष्टताएँ डीपसीक के अगली पीढ़ी के V4 मॉडल के लिए स्थानीय मीडिया की अपेक्षाओं से मिलती जुलती थीं, जिसके बारे में चीनी आउटलेट्स ने बताया है कि यह अप्रैल की शुरुआत में लॉन्च हो सकता है।
स्वतंत्र एआई बेंचमार्क परीक्षण चलाने वाले उमूर ओज़कुल ने कहा कि विज्ञापित समय और क्षमताओं को देखते हुए मॉडल को डीपसीक से जोड़ने की अटकलें समझ में आती हैं।
स्टील्थ मॉडल लॉन्च असामान्य नहीं हैं, क्योंकि ओपनराउटर जैसे प्लेटफॉर्म डेवलपर्स को एक ही इंटरफ़ेस के माध्यम से दर्जनों एआई मॉडल के लिए प्रश्न भेजने की अनुमति देते हैं, जिससे वे नए सिस्टम के लिए एक लोकप्रिय परीक्षण मैदान बन जाते हैं।
पोनी अल्फा नामक एक गुमनाम मॉडल फरवरी में ओपनराउटर पर दिखाई दिया, जिसके पांच दिन बाद चीनी फर्म जिपू एआई ने पुष्टि की कि यह उसके जीएलएम-5 सिस्टम का हिस्सा था।
हंटर अल्फा के प्रोफाइल पेज पर एक नोटिस में कहा गया है कि मॉडल के लिए सभी संकेत और पूर्णताएं “प्रदाता द्वारा लॉग की जाती हैं और मॉडल को बेहतर बनाने के लिए उपयोग किया जा सकता है,” निष्पक्ष प्रतिक्रिया के लिए स्टील्थ मॉडल लॉन्च का उपयोग करने के उद्योग-व्यापी अभ्यास को रेखांकित करता है।
MiMo के अनुसार, प्लेटफ़ॉर्म पर प्रदर्शित होने के बाद मॉडल को तेजी से अपनाया गया, कुल उपयोग में एक ट्रिलियन टोकन को पार कर गया और OpenRouter पर लीडरबोर्ड चार्ट में शीर्ष पर पहुंच गया।
(एडुआर्डो बैपटिस्टा द्वारा रिपोर्टिंग; थॉमस डेरपिंगहॉस द्वारा संपादन)










Leave a Reply