स्व-पर्यवेक्षित शिक्षण - Self-Supervised Learning (SSL) का क्या अर्थ है?

स्व-पर्यवेक्षित शिक्षण (एसएसएल) मशीन लर्निंग के लिए एक दृष्टिकोण है जो मशीन लर्निंग एल्गोरिदम को अज्ञात इनपुट की भविष्यवाणी करने के लिए देखे गए इनपुट का उपयोग करने की अनुमति देता है।

स्व-पर्यवेक्षित शिक्षण के लिए एक महत्वपूर्ण लक्ष्य पूर्व-प्रशिक्षण गहन शिक्षण प्रणालियों को विकसित करके पर्यवेक्षित शिक्षण मॉडल में प्रोग्रामेटिक रूप से अनुपयोगी शिक्षण मॉडल को बदलना है जो लापता जानकारी को भरना सीख सकते हैं।

बीईआरटी (ट्रांसफॉर्मर्स से द्विदिश एनकोडर प्रतिनिधित्व) और क्यू लर्निंग शायद एआई में स्व-पर्यवेक्षित सीखने के सबसे प्रसिद्ध अनुप्रयोगों में से दो हैं। पूर्व-प्रशिक्षण चरण के दौरान, प्रत्येक प्रणाली को पाठ का एक छोटा उदाहरण दिखाया जाता है जिसमें कुछ शब्द गायब हैं। फिर सिस्टम को प्रशिक्षित किया जाता है कि लापता शब्दों की सटीक भविष्यवाणी करने के लिए इनपुट डेटा से पर्यवेक्षी संकेतों को कैसे निकाला जाए।

एसएसएल और नेचुरल लैंग्वेज प्रोसेसिंग (एनएलपी) के विकास में महत्वपूर्ण भूमिका निभाई है। यह एआई लर्निंग एल्गोरिदम को प्रशिक्षित करने के लिए भारी मात्रा में डेटा की आवश्यकता को कम करने के लिए अध्ययन किए जा रहे कई तरीकों में से एक है।
एसोसिएशन फॉर द एडवांसमेंट ऑफ आर्टिफिशियल इंटेलिजेंस (AAAI) 2020 सम्मेलन के दौरान, फ्रांसीसी कंप्यूटर वैज्ञानिक, यान लेकन ने कहा कि स्व-पर्यवेक्षित शिक्षण वह है जो AI और गहन शिक्षण प्रणालियों को अगले स्तर पर ले जाएगा।

क्योंकि स्व-पर्यवेक्षित शिक्षण डेटा पैटर्न और आगामी घटनाओं की भविष्यवाणी करने के लिए पहले से सीखी गई जानकारी का उपयोग करता है, प्रभावी रूप से स्मार्ट हो रहा है, यह मानवीय क्षमताओं तक सीमित नहीं है। इसकी स्वतंत्रता इसे अत्यधिक मापनीय होने की अनुमति देती है, उन्नत निर्णय लेने की क्षमताओं के साथ-साथ पैटर्न भविष्यवाणी और मान्यता कौशल में तेजी से बढ़ रही है।

सीखने की प्रक्रिया के दौरान मानवीय सहायता की कमी के कारण, इस दृष्टिकोण के लिए उच्च कम्प्यूटेशनल शक्ति के साथ शक्तिशाली और जटिल मशीन लर्निंग एल्गोरिदम की आवश्यकता होती है। उन्हें विभिन्न प्रकार के डेटा की भारी मात्रा को संभालने में सक्षम होना चाहिए और उन्हें लचीले और प्रभावी ढंग से सूचीबद्ध और वर्गीकृत करने में सक्षम होना चाहिए।

सभी प्रशिक्षण मदों का उचित एन्कोडिंग एक सफल स्व-पर्यवेक्षित शिक्षण दृष्टिकोण की कुंजी है। प्रत्येक अध्ययन वस्तु जितनी अधिक विस्तृत और डेटा-समृद्ध होती है, उतनी ही अधिक जानकारी एआई प्रणाली उनसे सफलतापूर्वक निकाल सकती है। नतीजतन, सिस्टम के पास प्रशिक्षण के दौरान और बाद में अन्य मदों के संबंध में वस्तुओं और इनपुट को सही ढंग से वर्गीकृत करने का एक बेहतर मौका होगा।

सामान्य तौर पर, स्व-पर्यवेक्षित शिक्षण का उपयोग करके डिज़ाइन किए गए एआई सिस्टम का उपयोग उस डेटा में किसी समस्या को सीधे हल करने के लिए नहीं किया जाता है जिसे इसे पहली बार प्रस्तुत किया गया था। इस दृष्टिकोण के साथ, सिस्टम डेटा बिंदुओं के समूह बनाता है जो समानता या साझा पैटर्न का एक सेट दिखाते हैं, जबकि अन्य समूहों से जितना संभव हो उतना अलग होता है। नतीजतन, एआई सिस्टम इस बात की जानकारी प्रदान करेगा कि उसने विश्लेषण की गई वस्तुओं का प्रतिनिधित्व कैसे किया। इसका पता लगाया गया प्रतिनिधित्व, या सरल तंत्रिका नेटवर्क, भविष्य में इसी तरह के ऑब्जेक्ट-ओरिएंटेड कार्यों को हल करने में काम आएगा।

जबकि बेदाग नहीं, स्व-पर्यवेक्षित मशीन लर्निंग एआई सिस्टम और डीप लर्निंग के विकास के लिए कई दरवाजे खोल सकती है। स्व-पर्यवेक्षण सीखने के लिए अद्वितीय कुछ लाभों में शामिल हैं:

  •  मापनीयता - स्व-पर्यवेक्षित शिक्षा के बिना, मजबूत भविष्यवाणी और वर्गीकरण मॉडल बनाना अक्षम और समय लेने वाला होगा। वैकल्पिक रूप से, एआई सिस्टम जो स्व-पर्यवेक्षित सीखने पर भरोसा करते हैं, जटिल कार्यों के सेट को तब तक स्वचालित कर सकते हैं जब तक उनके पास पर्याप्त कम्प्यूटेशनल शक्ति, ज्ञान और समय हो।
  • कुशल समस्या समाधान - लेबल किए गए डेटा के साथ मानव मस्तिष्क की पूर्वकल्पित धारणाओं पर भरोसा करने की आवश्यकता नहीं है, एआई सिस्टम छवियों में अंतराल को भरने से लेकर सांख्यिकीय भविष्यवाणियों और वस्तु वर्गीकरण तक किसी समस्या को हल करने का सबसे अच्छा मार्ग ढूंढ सकते हैं।
  • कंप्यूटर विजन में सुधार - स्व-पर्यवेक्षित शिक्षा एआई सिस्टम को उसी तरह प्रशिक्षित करती है जैसे मानव मस्तिष्क अपने आसपास के वातावरण को पहचानने के लिए कैसे बढ़ता है। यह सुनिश्चित करता है कि सिस्टम जो देख रहा है और पहले से ही लेबल किए गए प्रशिक्षण आइटम के बीच समानता की तलाश में फंस गया है या कम्प्यूटेशनल शक्ति बर्बाद नहीं करता है।
  • मानव बुद्धि का पुनर्निर्माण - इसी तरह कंप्यूटर दृष्टि में सुधार करने के लिए, एआई सिस्टम जो स्व-पर्यवेक्षित सीखने पर भरोसा करते हैं, न केवल बुद्धि के निकट-मानव स्तर तक बढ़ने की क्षमता रखते हैं बल्कि तंत्रिका वैज्ञानिकों को यह समझने में भी मदद कर सकते हैं कि मानव मस्तिष्क कैसे काम करता है।


इसके सभी लाभों के साथ, स्व-पर्यवेक्षित मशीन सीखने के दृष्टिकोण की सीमाएं हैं जो इसे व्यापक प्रसार से रोकती हैं। एक के लिए, इसके लिए बड़ी कम्प्यूटेशनल शक्ति की आवश्यकता होती है जो कि छोटी परियोजनाओं और शौकिया डेवलपर्स के लिए मुश्किल होती है। इसके अतिरिक्त, स्व-पर्यवेक्षित शिक्षण, डिफ़ॉल्ट रूप से, अत्यधिक संवेदनशील होता है। इसे प्रशिक्षित करने के लिए उपयोग की जाने वाली वस्तुओं में छोटी त्रुटियां या उन्हें कैसे एन्कोड किया गया था, वे अत्यधिक गलत परिणाम दे सकते हैं जिन्हें ठीक करना या व्यक्तिगत रूप से 'डीबग' करना लगभग असंभव है।

इसके अतिरिक्त, छवियों के साथ काम किया जा रहा है, विशेष रूप से सिमसीएलआर ढांचे का उपयोग करते हुए, और प्राकृतिक भाषा प्रसंस्करण (एनएलपी) के साथ प्रगति स्व-पर्यवेक्षित सीखने के क्षेत्र को उन तरीकों से प्रभावित कर रही है जो उद्योग में उन लोगों के लिए रोमांचक हैं, जिससे उपभोक्ताओं को बहुत लाभ होता है और अंतिम उपयोगकर्ता।

फिर भी, अपनी सभी सीमाओं और सापेक्ष शैशवावस्था के साथ, स्व-पर्यवेक्षित शिक्षा वह है जो कई कंप्यूटर वैज्ञानिक भविष्य के लिए आशा करते हैं।

Post a Comment

0 Comments