Hadoop पारिस्थितिकी तंत्र - Hadoop Ecosystem का क्या अर्थ है?

Hadoop पारिस्थितिकी तंत्र Apache Hadoop सॉफ़्टवेयर लाइब्रेरी के विभिन्न घटकों के साथ-साथ Apache Software Foundation द्वारा इस प्रकार की सॉफ़्टवेयर परियोजनाओं के लिए प्रदान किए गए सामान और उपकरणों और उनके एक साथ काम करने के तरीकों को संदर्भित करता है।

हडूप एक जावा-आधारित ढांचा है जो डेटा के बड़े सेट को संभालने और विश्लेषण करने के लिए बेहद लोकप्रिय है।

कोर हडूप पैकेज और इसके सामान दोनों ही ज्यादातर अपाचे द्वारा लाइसेंस प्राप्त ओपन-सोर्स प्रोजेक्ट हैं। Hadoop पारिस्थितिकी तंत्र के विचार में कोर Hadoop सेट के विभिन्न भागों का उपयोग शामिल है जैसे कि MapReduce, डेटा की विशाल मात्रा को संभालने के लिए एक रूपरेखा, और Hadoop वितरित फ़ाइल सिस्टम (HDFS), एक परिष्कृत फ़ाइल-हैंडलिंग सिस्टम। एक Hadoop संसाधन प्रबंधक YARN भी है।

हडूप के इन मुख्य तत्वों के अलावा, अपाचे ने डेवलपर्स के लिए अन्य प्रकार के सहायक उपकरण या पूरक उपकरण भी वितरित किए हैं। इनमें अपाचे हाइव, एक डेटा विश्लेषण उपकरण शामिल है; अपाचे स्पार्क, बड़े डेटा को संसाधित करने के लिए एक सामान्य इंजन; अपाचे पिग, एक डेटा प्रवाह भाषा; HBase, एक डेटाबेस टूल; और अंबरल भी, जिसे हडूप पारिस्थितिकी तंत्र प्रबंधक के रूप में माना जा सकता है, क्योंकि यह इन विभिन्न अपाचे संसाधनों के एक साथ उपयोग को प्रशासित करने में मदद करता है। Hadoop डेटा संग्रह के लिए वास्तविक मानक बनने और कई संगठनों में सर्वव्यापी बनने के साथ, प्रबंधक और विकास के नेता Hadoop पारिस्थितिकी तंत्र के बारे में सब कुछ सीख रहे हैं और एक सामान्य Hadoop सेटअप में किस प्रकार की चीजें शामिल हैं।

Post a Comment

0 Comments