AI इम्पैक्ट समिट और सर्वम AI का योगदान
नई दिल्ली में आयोजित AI इम्पैक्ट समिट में, बेंगलुरु स्थित स्टार्टअप सर्वम AI ने 35 अरब और 105 अरब पैरामीटर पर प्रशिक्षित दो लार्ज लैंग्वेज मॉडल (LLM) प्रस्तुत किए। ये मॉडल अन्य मॉडलों की तुलना में कम बिजली और कंप्यूटिंग ऊर्जा खपत करते हुए भारतीय भाषाओं में बेहतर प्रदर्शन करने के लिए डिज़ाइन किए गए हैं।
भारतीय भाषा में LLM करने वालों के लिए चुनौतियाँ
- डेटा उपलब्धता:
- इंटरनेट डेटा में भारतीय भाषाओं का प्रतिनिधित्व कम है, जिससे LLM (अंतर्राष्ट्रीय स्तर पर स्नातकोत्तर शिक्षा) के छात्रों को प्रभावी ढंग से प्रशिक्षित करने में चुनौतियां उत्पन्न होती हैं।
- पूंजी और संसाधनों की कमी:
- LLM प्रशिक्षण के लिए पर्याप्त वित्तीय और कम्प्यूटेशनल संसाधनों की आवश्यकता होती है, जो भारत में सीमित हैं।
सरकारी सहायता और पहल
- इंडियाAI मिशन ने LLM प्रशिक्षण को सब्सिडी दी है और घरेलू AI विकास को समर्थन देने के लिए 36,000 से अधिक GPU चालू किए हैं।
- सरकार ने सर्वम को लगभग 100 करोड़ रुपये की अनुमानित सब्सिडी के साथ 4,096 GPU उपलब्ध कराए।
- इलेक्ट्रॉनिक्स और सूचना प्रौद्योगिकी मंत्रालय भारतीय AI इकोसिस्टम को बढ़ावा देने के लिए घरेलू एलएलएम पाठ्यक्रमों को प्रोत्साहित करता है।
महत्वपूर्ण उपलब्धियाँ और नवाचार
- विशेषज्ञों के मिश्रण (MoE) वास्तुकला:
- यह आर्किटेक्चर केवल कुछ ही पैरामीटर को सक्रिय करने की अनुमति देता है, जिससे दक्षता बढ़ती है और गणना संबंधी आवश्यकताएं कम होती हैं।
भविष्य की दिशाएं
सर्वम का लक्ष्य भविष्य के निवेशों के माध्यम से अपने मॉडल की गहराई और प्रदर्शन को बढ़ाना है। बड़े मॉडलों तक विस्तार करने से पहले, कंपनी का ध्यान भारतीय संदर्भ में सटीकता और दक्षता पर केंद्रित है।
भारत में एलएलएम से संबंधित अन्य घटनाक्रम
- IIT बॉम्बे द्वारा विकसित भारतजेन ने शिक्षा और स्वास्थ्य सेवा में अनुप्रयोगों के लिए एक बहुभाषी 17 बिलियन पैरामीटर मॉडल विकसित किया है।