Skip to main content
xआप एक स्वतंत्र और सवाल पूछने वाले मीडिया के हक़दार हैं। हमें आप जैसे पाठक चाहिए। स्वतंत्र और बेबाक मीडिया का समर्थन करें।

डीपसीक का एआई जगत को बड़ा झटका

तकनीकी जगत को अब इस ऐतिहासिक सच्चाई का एहसास हो रहा है कि व्यापार प्रतिबंधों का इस्तेमाल करके विकास को रोकना मुश्किल है।
deepseek
फोटो साभार: फ़्लिकर

तकनीकी जगत को तब झटका लगा जब एक छोटी-सी चीनी कंपनी ने डीपसीक (DeepSeek) नाम की एक एआई (कृत्रिम बुद्धिमत्ता) मॉडल जारी किया जो ओपनएआई के सबसे उन्नत मॉडलों से मेल खाता है और इसकी लागत का एक छोटा सा हिस्सा खर्च होता है। पिछले महीने से तकनीकी जगत में इस बात को लेकर चर्चा हो रही है कि पहले एनवीडिया (Nvidia) के प्रदर्शन का बेसब्री से अनुसरण करने वाले अमेरिकी तकनीकी निवेशकों का नेतृत्व किया जा रहा है और फिर इस बात पर शोक व्यक्त किया जा रहा है कि एआई के स्पुतनिक मोमेंट- डीपसीक के एआई मॉडल- ने अग्रणी तकनीकी कंपनियों के लगभग एक ट्रिलियन डॉलर को खत्म कर दिया है।

दिलचस्प बात यह है कि उच्च-स्तरीय ग्राफिक प्रोसेसिंग यूनिट (जीपीयू) बनाने वाली एनवीडिया को सबसे बड़ा झटका लगा जिसने एक दिन में लगभग 600 मिलियन डॉलर का नुकसान उठाया। GPU मूल रूप से इमेज डेटा के पैरलल प्रोसेसिंग के लिए विकसित किए गए थे, इसलिए इसका नाम "GPU" (Graphics Processing Unit) रखा गया, लेकिन अब इन्हें सभी प्रकार के समानातंर गणना कार्यों के लिए इस्तेमाल किया जा रहा है, जिनमें AI मॉडल भी शामिल हैं।

चीन के इस किफायती इनोवेशन की चौंकाने वाली प्रगति में दूसरी विशेषता यह नहीं है कि इसने अपने सबसे उन्नत मॉडल OpenAI, Anthropic, Google, Meta, आदि द्वारा किए गए खर्च के 3-5% पर बनाए हैं। हालांकि, चीन की यह प्रगति अमेरिका द्वारा (द्विपक्षीय समर्थन के साथ) उन्नत चिप्स पर लगाए गए कड़े प्रतिबंधों के बावजूद हुई है, जिन्हें अमेरिका से चीन को निर्यात किया जा सकता है।

चीन की AI प्रगति को कमजोर करने के लिए खास लक्ष्य यह था कि उन उन्नत GPUs को अनुमति न दी जाए, जिन्हें किसी भी बड़े AI विकास के लिए आवश्यक माना जाता था। OpenAI के मौजूदा प्रमुख सैम आल्टमैन ने पिछले साल भारत यात्रा के दौरान यह खारिज कर दिया था कि अमेरिकी बड़ी तकनीकी कंपनियों के AI विकास को प्रतिस्पर्धा देने की कोई कोशिश "पूरी तरह से निराशाजनक" होगी, क्योंकि ऐसे गणनाओं के लिए आवश्यक बुनियादी ढांचे की लागत उनके लिए पहुंच से बाहर थी। लगभग इसी तरह, भारत के तकनीकी गुरु नंदन नीलेकणी ने कहा था कि भारत को बुनियादी AI मॉडल नहीं बनाने चाहिए, बल्कि उन्हें केवल अपने काम में इस्तेमाल करना चाहिए, जिससे तकनीक की कमान पूरी तरह से अमेरिका को सौंप दी जाए, इस राय का AI कंपनी Perplexity के सह-संस्थापक और CEO ने कड़ा विरोध किया।

आल्टमैन जाहिर तौर पर गलत थे। डीपसीक ने न केवल कम बजट में एक मॉडल बनाया, जो सैकड़ों मिलियन डॉलर खर्च करने वाली कंपनियों के साथ प्रतिस्पर्धा कर सकता है, बल्कि इसने ऐसा हार्डवेयर का इस्तेमाल करके भी किया है जिसे इस तरह की प्रगति को रोकने के लिए "डिज़ाइन" किया गया था। Nvidia द्वारा विशेष रूप से चीनी बाजार के लिए विकसित H-800 चिप्स को इस तरह की AI प्रगति को रोकना था, क्योंकि उन्होंने GPU और मॉडल के प्रशिक्षण के बीच संचार की गति को कम कर दिया था। तकनीकी दुनिया इस साधारण ऐतिहासिक सत्य को देर से समझ रही है कि केवल व्यापार प्रतिबंधों का इस्तेमाल करके प्रगति को रोकना मुश्किल है।

हम यहां जिन AI मॉडल पर चर्चा कर रहे हैं, वे ChatGPT या DeepSeek चैटबॉट नहीं हैं जो आपके सवालों का जवाब देते हैं, कुछ शोध के निष्कर्ष बनाते हैं और यहां तक कि अच्छे निष्कर्ष भी बनाते हैं, जिन्हें Google Search या Amazon के Alexa के बेहतर वर्जन के रूप में देखा जा सकता है। लगभग सभी इंटरनेट कंटेंट को "चट करने" (खिलाने) के बाद, ChatGPT टूल्स नई जानकारी पैदा करने के लिए बहुत कुछ नहीं कर सकते हैं।

नए मॉडल ChatGPT और उनके समकक्षों के आधार पर लार्ज लैंग्वेज मॉडल का इस्तेमाल करते हैं, लेकिन इसमें रीजनिंग मॉडल भी जोड़े गए हैं, जिसे तकनीक विशेषज्ञ रिइन्फोर्स्ड लर्निंग कहते हैं। यह भी तर्क दिया गया है कि कृत्रिम सामान्य बुद्धिमत्ता के पवित्र लक्ष्य, जो जैविक बुद्धिमत्ता का मशीनी प्रतिरूप है, के लिए रीजनिंग मॉडल ही एकमात्र रास्ता है, भले ही लक्ष्य उतना करीब न हो, जितना कि आल्टमैन और उनके एआई समूह हमें विश्वास दिलाना चाहते हैं।

हम जिन नई प्रगति के बारे में बात कर रहे हैं, वे रीजनिंग मॉडल में हैं, और डीपसीक अमेरिकी डिजिटल दिग्गजों की तुलना में आगे या बराबर मॉडल बनाने में सक्षम है। डीपसीक टूल्स पर एक खबर में कहा गया है क्या चीन ने अमेरिका के एआई को पीछे छोड़ दिया है?

जो चीज तकनीकी दुनिया को चौंका चुकी है, वह यह नहीं है कि चीन ने अमेरिकी तकनीकी दिग्गजों के AI विकास को मात दी है, बल्कि यह है कि एक कंपनी जिसकी कीमत केवल 8 बिलियन डॉलर है, और जिसका कोई बड़ा तकनीकी उपलब्धि नहीं था, उसने एक छोटे हिस्से की लागत में यह कारनामा किया है: उन्होंने केवल दो महीने और 6 मिलियन डॉलर से कम खर्च करके Nvidia के H800 चिप्स का इस्तेमाल करते हुए, जो चीन को हार्डवेयर निर्यात पर अमेरिकी प्रतिबंधों के अनुरूप थे, एक AI मॉडल तैयार किया जो OpenAI के मॉडल के बराबर है। जो लोग किसी भी चीनी दावे पर संदेह करते हैं, उनके लिए बता दें कि डीपसीक ने न केवल मॉडल को ओपन-सोर्स किया है, बल्कि अपनी टीम द्वारा किए गए कार्यों का विस्तृत दस्तावेज भी प्रकाशित किया है।

तो, डीपसीक के पीछे कौन सी कंपनी है और वे कौन हैं? डीपसीक के पीछे के लोग वित्तीय दुनिया में "क्वांट्स" कहे जाने वाले लोगों का एक समूह हैं। क्वांट्स गणित, मॉडलिंग और प्रोग्रामिंग के लोग हैं जो वित्तीय दुनिया में काम करते हैं। उन्हें 2008 में वॉल स्ट्रीट को तबाह करने के लिए जिम्मेदार ठहराया जाता है, जो वैश्विक बाजारों के लिए सबप्राइम आपदा थी। हालांकि 2008 के बाजार मंदी के बाद क्वांट आंशिक रूप से बदनाम हो गए थे, लेकिन वित्त की दुनिया उनके बिना नहीं चल सकती। चीन में, उन पर ज्यादा कड़ा नियंत्रण है।

डीपसीक तैयार करने वाले क्वांट लिआंग वेनफ़ेंग हैं, जिन्होंने 2012 में अपने फंड के 12 बिलियन डॉलर की कीमत का लगभग एक तिहाई खोने के बाद, अपने कुछ पैसे और क्वांट के साथ AI में निवेश करने का फैसला किया।

ऐसा नहीं है कि डीपसीक को AI की समस्या को हल करने के लिए कोई नई जानकारी मिली। समस्या पर सिर्फ पैसा और कंप्यूटिंग शक्ति झोंकने के बजाय, उन्होंने दो नए मॉडल बनाने और जारी करने के लिए कुछ चालाकी भरा इंजीनियरिंग करने का फैसला किया। इन मॉडलों का विश्लेषण जेफरी इमानुएल (और अन्य भी) द्वारा किया गया है, जो इस क्षेत्र से परिचित एक प्रसिद्ध तकनीकी विशेषज्ञ हैं, जो लिखते हैं, "मूल रूप से OpenAI और Anthropic के सर्वश्रेष्ठ मॉडलों के बराबर विश्व-प्रतिस्पर्धी प्रदर्शन स्तर हैं (मेटा लामा3 मॉडल और मिस्ट्रल जैसे अन्य छोटे ओपन सोर्स मॉडल प्लेयर्स को पीछे छोड़ते हुए)। इन मॉडलों को डीपसीक-V3 (GPT-4o और क्लाउड 3.5 सॉनेट का जवाब) और डीपसीक-R1 (OpenAI के O1 मॉडल का जवाब) कहा जाता है।" कीमत? दूसरों ने जो खर्च किया है या खर्च किया होगा, उसका अधिकतम 5%, इमानुएल का अनुमान है कि डीपसीक अन्य अत्याधुनिक प्लेटफ़ॉर्म की तुलना में 45 से 50 गुना ज्यादा कुशल है।

न केवल इन मॉडलों को सार्वजनिक डोमेन में जारी किया गया है, बल्कि इन्हें MIT लाइसेंस (1980 के दशक के अंत में मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी द्वारा विकसित) के तहत मुफ्त और ओपन-सोर्स सॉफ्टवेयर के रूप में भी जारी किया गया है, जिसका कोड GitHub पर उपलब्ध है। उन्होंने दो विस्तृत तकनीकी रिपोर्ट भी जारी की हैं, जिसमें उन्होंने जो कुछ किया है, उसके प्रत्येक चरण की व्याख्या की है। इसलिए, कोड, सिद्धांत, और उन्होंने समस्याओं का विश्लेषण और समाधान कैसे किया, यह सब इस तरह से निर्धारित किया गया है कि लोग न केवल उनके द्वारा किए गए कार्यों को ट्रैक और इस्तेमाल कर सकते हैं, बल्कि यदि वे चाहें तो अपने कोड के साथ इसे फिर से प्रस्तुत कर सकते हैं।

डीपसीक मार्केट शॉक के साथ हम सभी के लिए तीन प्रमुख निहितार्थ हैं। एक यह है कि एनवीडिया, जो एआई बूम का प्रमुख लाभार्थी है, अपने स्टॉक मूल्य में बड़े सुधार के लिए तैयार है। यह पहले से ही दिखाई दे रहा है। दूसरा यह है कि अब कई और कंपनी एआई दौड़ में प्रवेश करने के लिए तैयार होंगे, यह जानते हुए कि प्रवेश करने की कीमत उतना ज्यादा नहीं है जितना कि दिग्गजों ने उन्हें बताया था, और दौड़ जरूरी नहीं कि सबसे बड़ी कंपनी से जीती जाए; जैसा कि जानवरों के विकास में हुआ था! आखिर में यह है कि प्रौद्योगिकी प्रतिबंध काम नहीं करते हैं। यह भारत के खिलाफ परमाणु और अंतरिक्ष क्षेत्रों में काम नहीं आया; न ही यह चीन के एआई विकास के खिलाफ काम आया है।

जैसा कि एक प्रसिद्ध दार्शनिक ने कहा: "कुछ दशक ऐसे होते हैं जब कुछ भी नहीं बदलता; और कुछ हफ्ते ऐसे होते हैं जब दशकों जितना बदलाव हो जाता है।" ऐसा लगता है कि यह उन क्षणों में से एक है।

मूल रूप से अंग्रेजी में प्रकाशित लेख को पढ़ने के लिए नीचे दिए गए लिंक पर क्लिक करें :

DeepSeek's Deep Shock to the AI World

अपने टेलीग्राम ऐप पर जनवादी नज़रिये से ताज़ा ख़बरें, समसामयिक मामलों की चर्चा और विश्लेषण, प्रतिरोध, आंदोलन और अन्य विश्लेषणात्मक वीडियो प्राप्त करें। न्यूज़क्लिक के टेलीग्राम चैनल की सदस्यता लें और हमारी वेबसाइट पर प्रकाशित हर न्यूज़ स्टोरी का रीयल-टाइम अपडेट प्राप्त करें।

टेलीग्राम पर न्यूज़क्लिक को सब्सक्राइब करें

Latest