मुख्य बातें:
- दो नए open weight AI models, gpt-oss-120b और gpt-oss-20b लॉन्च हुए।
- अब डेवलपर्स को कमज़ोर open modelsऔर महंगे क्लोज्ड सिस्टम के बीच समझौता नहीं करना पड़ेगा।
- ये मॉडल बेहतरीन रीज़निंग और परफॉरमेंस देते हैं और Apache 2.0 लाइसेंस के तहत सभी के लिए उपलब्ध हैं।
- सुरक्षा के लिए अभूतपूर्व ‘ईविल ट्विन’ स्ट्रेस-टेस्टिंग की गई।

AI की दुनिया में आज एक बड़ा धमाका हुआ है। लंबे समय से डेवलपर्स और कंपनियाँ एक मुश्किल चौराहे पर खड़ी थीं: या तो सीमित क्षमताओं वाले Open Source Model से काम चलाएँ या फिर OpenAI जैसे महंगे और बंद सिस्टम पर अपनी जेब ढीली करें। लेकिन अब यह समझौता खत्म होने वाला है।
Open AI ने gpt-oss-120b और gpt-oss-20b को पेश किया हैं ये दो क्रांतिकारी Open weight models हैं जो AI की दुनिया में सबके लिए समान अवसर लाने का वादा करता है
ये सिर्फ कुछ और AI मॉडल्स नहीं हैं। यह ओपन-सोर्स AI में एक नए युग की शुरुआत है, जहाँ अत्याधुनिक सोचने-समझने की क्षमता (रीज़निंग) बिना किसी भारी-भरकम खर्च या प्रतिबंधात्मक लाइसेंस के हर किसी की पहुँच में होगी। लचीले Apache 2.0 लाइसेंस के तहत जारी किए गए ये मॉडल आपके अपने सर्वर और हार्डवेयर पर चलने के लिए डिज़ाइन किए गए हैं, जो एक अकेले क्रिएटर से लेकर बड़ी-बड़ी कंपनियों तक, सभी को सशक्त बनाने के लिए तैयार हैं।
दो मॉडल्स, दो ताकतें: पावर और स्पीड का संगम
gpt-oss को दो अलग-अलग साइज़ में डिज़ाइन किया है, ताकि आप अपने काम के लिए बिल्कुल सही टूल चुन सकें।

1. हैवीवेट चैंपियन: gpt-oss-120b
यह मॉडल सोचने-समझने की क्षमता का एक पावरहाउस है। यह कोर बेंचमार्क पर OpenAI के o4-mini जैसे दिग्गज मॉडलों को सीधी टक्कर देता है, जिससे आपको जटिल कामों के लिए टॉप-टियर परफॉरमेंस मिलती है। लेकिन असली जादू यह है कि यह सारी ताकत एक अकेले 80 GB GPU पर आसानी से चलती है। जी हाँ, अब आपको बड़े-बड़े और महंगे सर्वर फार्म की कोई ज़रूरत नहीं है।
2. फुर्तीला पावरहाउस: gpt-oss-20b
यह मॉडल छोटा पैकेट, बड़ा धमाका है। यह OpenAI के o3-mini जैसे मॉडलों की शक्ति को एक बेहद कॉम्पैक्ट पैकेज में समेट लेता है। यह सिर्फ 16 GB मेमोरी वाले डिवाइस पर भी चल सकता है, जो इसे ऑन-डिवाइस एप्लिकेशन, आपके लैपटॉप पर लोकल डेवलपमेंट, या किसी भी ऐसे काम के लिए परफेक्ट बनाता है जहाँ स्पीड और एफिशिएंसी सबसे ज़रूरी है।
दोनों ही मॉडल उन कामों में माहिर हैं जो आज सबसे ज़्यादा मायने रखते हैं गहरी रीज़निंग, टूल का इस्तेमाल (जैसे फंक्शन कॉलिंग और वेब सर्च), और Tau-Bench जैसे चुनौतीपूर्ण बेंचमार्क पर अविश्वसनीय प्रदर्शन।
सिर्फ बातें नहीं, काम भी: एक्शन के लिए तैयार AI
ये मॉडल सिर्फ टेक्स्ट जेनरेट करने के लिए नहीं बने हैं; ये आधुनिक AI एजेंट्स के दिमाग की तरह काम करने के लिए डिज़ाइन किए गए हैं।
- शानदार इंस्ट्रक्शन-फॉलोइंग: कमांड को सटीकता से समझते हैं और पूरा करते हैं।
- शक्तिशाली टूल-यूज़: अपने AI को वेब ब्राउज़ करने, Python कोड चलाने और दूसरे सॉफ्टवेयर से इंटरैक्ट करने की ताकत दें।
- एडजस्टेबल रीज़निंग: जटिल समस्याओं के लिए “high” मोड का इस्तेमाल करें या बिजली की तेज़ी से जवाब पाने के लिए “low” मोड पर स्विच करें।
- पूरी तरह कस्टमाइज़ेबल: ये मॉडल एक कोरे कैनवास की तरह हैं, जो पूरी चेन-ऑफ़-थॉट (CoT) विजिबिलिटी और स्ट्रक्चर्ड आउटपुट को सपोर्ट करते हैं ताकि आप इन्हें अपने वर्कफ़्लो में ढाल सकें।
सुरक्षा सबसे पहले: जब बड़ी ताकत के साथ आती है बड़ी ज़िम्मेदारी
इन मॉडलों को स्ट्रेस-टेस्ट करने के लिए इसका एक ‘बुरा’ वर्जन बनाया—एक ऐसा gpt-oss-120b जिसे जानबूझकर गलत कामों के लिए फाइन-ट्यून किया गया था। इसका मकसद यह देखना था कि कोई हैकर इसका क्या दुरुपयोग कर सकता है। नतीजा? हमारे एडवांस्ड ट्रेनिंग स्टैक के साथ भी, गलत तरीके से ट्यून किया गया मॉडल खतरनाक स्तर तक नहीं पहुँच सका, जिसकी पुष्टि बाहरी विशेषज्ञों ने भी की है। यह ओपन मॉडल सुरक्षा के लिए एक नया मानक स्थापित करता है।
पर्दे के पीछे का जादू: टेक्नोलॉजी
gpt-oss मॉडल सबसे उन्नत तकनीकों पर बने हैं। ये ट्रांसफ़ॉर्मर मॉडल हैं जो मिक्सचर-ऑफ़-एक्सपर्ट्स (MoE) आर्किटेक्चर का उपयोग करते हैं।
सरल शब्दों में, यह हर काम के लिए पूरे मॉडल को एक्टिवेट करने के बजाय, समझदारी से सिर्फ़ ज़रूरी ‘विशेषज्ञ’ हिस्सों को चुनता है। इससे कंप्यूटिंग लागत बहुत कम हो जाती है।
मॉडल | लेयर्स | कुल पैरामीटर्स | एक्टिव पैरामीटर्स | कॉन्टेक्स्ट लेंथ |
gpt-oss-120b | 36 | 117B | 5.1B | 128k |
gpt-oss-20b | 24 | 21B | 3.6B | 128k |
आज ही आज़माएँ: शुरुआत कैसे करें
कुछ नया बनाने के लिए तैयार हैं? gpt-oss-120b और gpt-oss-20b के मॉडल वेट्स Hugging Face पर मुफ़्त में उपलब्ध हैं।
Open AI ने उद्योग के सर्वश्रेष्ठ लोगों के साथ भागीदारी की है ताकि ये मॉडल हर जगह आसानी से उपलब्ध हों। आप इन्हें आज ही इन प्लेटफॉर्म्स पर चला सकते हैं:
- प्लेटफ़ॉर्म: Azure, Hugging Face, Databricks, Snowflake, Vercel, Cloudflare
- लाइब्रेरी: vLLM, Ollama, llama.cpp, LM Studio
- हार्डवेयर: NVIDIA, AMD, Cerebras, और Groq