Deep Reinforcement Learning - गहन सुदृढीकरण सीखने का क्या अर्थ है?

डीप रीइन्फोर्समेंट लर्निंग (डीप आरएल) मशीन लर्निंग का एक दृष्टिकोण है जो रीइन्फोर्समेंट लर्निंग तकनीकों को डीप लर्निंग की रणनीतियों के साथ मिश्रित करता है।

इस प्रकार की शिक्षा के लिए कंप्यूटर को परिष्कृत शिक्षण मॉडल का उपयोग करने और एक अनुकूलित पथ या कार्रवाई निर्धारित करने के लिए बड़ी मात्रा में इनपुट को देखने की आवश्यकता होती है।

गहन सुदृढीकरण सीखने का वर्णन करने का एक तरीका यह है कि एक गहरा तंत्रिका नेटवर्क व्यक्तिगत अनुभवों के सुदृढीकरण के माध्यम से सीखता है।

मान लीजिए कि गहरा तंत्रिका नेटवर्क एक विज़ुअल गेम स्पेस को मैप करता है और गेम के भीतर क्या होता है यह देखने के लिए समय सातत्य के माध्यम से उस गेम स्पेस का विश्लेषण करता है। कंप्यूटर यह समझना शुरू कर देता है कि इनपुट के आधार पर परिणाम क्या हैं, और बदले में वह "अधिक स्मार्ट तरीके से काम कर सकता है।" यह अन्य समान तकनीकी प्रयासों जैसे डीप क्यू नेटवर्क से संबंधित है।

सामान्य तौर पर, मशीन लर्निंग विशेषज्ञ मशीनों को लगातार स्मार्ट बनाने या इंसानों की तरह सोचना सीखने के तरीके के रूप में इस प्रकार के मॉडल पर जोर दे रहे हैं, हालांकि व्यावहारिक बाधाएं और सीमाएं लागू होती हैं।

Post a Comment

0 Comments